Uma ferramenta para rastreamento semântico de eventos a partir de documentos da Web

Autores

Palavras-chave:

Rastreamento Semântico, Word Embeedings, Máquinas de Busca

Resumo

Explorar os grandes acervos criados por veículos de mídia com as ferramentas de busca tradicionais é algo impraticável para usuários exigentes. Assim, propomos uma ferramenta de exploração temporal que visa facilitar a realização de consultas em acervos de notícias. Concentramos nossos esforços em duas frentes (i) permitir que usuários façam consultas com adição de informações de documentos representados por word embbedings e (ii) desenvolver uma estratégia para resgate de informação temporal para gerar timelines apresentadas por uma interface adequada. Avaliamos nossa solução em um acervo de um jornal brasileiro e demonstramos que a mesma consegue traçar diferentes timelines, cobrindo diferentes subtópicos de um mesmo tema.

Downloads

Não há dados estatísticos.

Referências

Alonso, O., Gertz, M., and Baeza-Yates, R. (2009). Clustering and exploring search results using timeline constructions. In Proceedings of ACM CIKM.

Azad, H. K. and Deepak, A. (2019). Query expansion techniques for information retrieval: A survey. Information Processing and Management, 56(5):1698–1735.

Kanhabua, N. and Anand, A. (2016). Temporal information retrieval. In Proceedings of ACM SIGIR.

Kuzi, S., Shtok, A., and Kurland, O. (2016). Query expansion using word embeddings. In Proceedings of ACM CIKM.

Le, Q. and Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of ICML.

Li, J. and Cardie, C. (2014). Timeline generation: Tracking individuals on twitter. In Proceedings of ACM WWW.

Matthews, M., Tolchinsky, P., Blanco, R., Atserias, J., Mika, P., and Zaragoza, H. (2010). Searching through time in the new york times. In Proceedings of ACM HCIR.

Mikolov, T., Chen, K., Corrado, G., and Dean, J. (2013a). Efficient estimation of word representations in vector space. In Proceedings of ICLR.

Mikolov, T., Sutskever, I., Chen, K., Corrado, G., and Dean, J. (2013b). Distributed representations of words and phrases and their compositionality. In Proceedings of ICNIPS.

Rocchio, J. J. (1971). Relevance feedback in information retrieval. In Proceedings of The Smart retrieval system - experiments in automatic document processing.

Roy, D., Paul, D., Mitra, M., and Garain, U. (2016). Using word embeddings for automatic query expansion. ArXiv, abs/1606.07608.

Singh, J., Nejdl, W., and Anand, A. (2016). History by diversity: Helping historians search news archives. In Proceedings of ACM CHIIR.

Sparck Jones, K., Walker, S., and Robertson, S. (2000). A probabilistic model of information retrieval: development and comparative experiments: Part 1. Information Processing & Management, 36(6):779–808.

Downloads

Publicado

2021-06-03

Como Citar

Santos, W., & Rocha, L. (2021). Uma ferramenta para rastreamento semântico de eventos a partir de documentos da Web. Revista Eletrônica De Iniciação Científica Em Computação, 19(2). Recuperado de https://sol.sbc.org.br/journals/index.php/reic/article/view/2085

Edição

Seção

Edição Especial: CTIC/CSBC