Uso de Ferramentas Livres para Recuperação de Conteúdos Textuais em Ambientes Big Data

  • Brunno Attorre Universidade Presbiteriana Mackenzie
  • Leandro Silva Universidade Presbiteriana Mackenzie

Resumo


Com o aumento do volume de dados na Web, a tarefa de construir um mecanismo de busca com alta precisão se torna cada vez mais difícil. Como uma alternativa para melhorar esses resultados, o desenvolvimento de uma ferramenta de recomendação baseada no conteúdo dos documentos a serem buscados pode se tornar bastante útil. Nesse contexto, objetivo desse trabalho é analisar como algoritmos de indexação, Machine Learning e análise textual podem melhorar os resultados de busca e, através do conteúdo buscado em cada documento, construir uma aplicação de busca e recomendação usando as tecnologias Open Source disponíveis no mercado.

Palavras-chave: Aprendizado de máquina, big data, ferramenta de indexação

Referências

B. Marlin. Collaborative filtering: A machine learning perspective. 2004.

C.-T. Nguyen. Bridging semantic gaps in information retrieval: Context-based approaches. ACM VLDB, 10, 2010.

I. Antonellis, E. Gallopoulos, I. Antonellis, and E. Gallopoulos. Exploring term document matrices from matrix models in text mining, 2006.

J. D. Rennie, L. Shih, J. Teevan, D. R. Karger, et al. Tackling the poor assumptions of naive bayes text classifiers. In ICML, volume 3, pages 616–623. Washington DC), 2003.

M. Pennacchiotti and A.-M. Popescu. A machine learning approach to twitter user classification, 2011.

O. N. P. Cardoso. Recupera¸c˜ao de informa¸c˜ao. INFOCOMP Journal of Computer Science, 2(1):33–38, 2004.

R. Berman and Z. Katona. The role of search engine optimization in search marketing. Marketing Science, 32(4):644–651, 2013.

R. Van Meteren and M. Van Someren. Using content-based filtering for recommendation. In Proceedings of the Machine Learning in the New Information Age: MLnet/ECML2000 Workshop, pages 47–56, 2000.

R. Zhao and W. I. Grosky. Narrowing the semantic gap-improved text-based web document retrieval using visual features. Multimedia, IEEE Transactions on, 4(2):189–200, 2002.

S. Brin and L. Page. The anatomy of a large-scale hypertextual web search engine. In Seventh International World-Wide Web Conference (WWW 1998), 1998.

S. Buettcher, C. L. A. Clarke, and G. V. Cormack. Information Retrieval: Implementing and Evaluating Search Engines. The MIT Press, 2010.
Publicado
26/05/2015
Como Citar

Selecione um Formato
ATTORRE, Brunno; SILVA, Leandro. Uso de Ferramentas Livres para Recuperação de Conteúdos Textuais em Ambientes Big Data. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 11. , 2015, Goiânia. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2015 . p. 487-492. DOI: https://doi.org/10.5753/sbsi.2015.5852.