Agrupamento Hierárquico e Multivisão de Eventos por meio de Grafos de Consistência

  • Paulo H. L. de Paula UFMS
  • Westerley S. Reis UFMS
  • Solange O. Rezende USP
  • Ricardo M. Marcacini UFMS

Resumo


A análise de eventos tem recebido atenção recentemente devido à popularização de plataformas web para publicação de conteúdo, especialmente portais de notícias, redes sociais, blogs e fóruns. Essas plataformas armazenam eventos por meio de textos a respeito de diversos setores da sociedade e podem ser vistas como uma representação digital (mundo virtual) dos eventos que ocorrem em nosso mundo real. Assim, agrupamento de eventos é uma tarefa importante para organizar e mapear os eventos desse mundo virtual para nosso mundo físico, o que permite a realização de diversos estudos sociais, políticos e econômicos. Nesse trabalho é apresentada uma abordagem para agrupamento hierárquico e multivisão de eventos extraídos de textos. As diferentes informações sobre os eventos, como informação textual, informação temporal e informação geográfica são consideradas diferentes visões durante a tarefa de agrupamento. Enquanto as abordagens existentes exigem que o usuário defina parâmetros sobre como utilizar informação temporal e geográfica no agrupamento de eventos, a abordagem proposta permite aprender automaticamente restrições de tempo e local. Para tal, foi proposta uma estrutura denominada grafo de consistência que representa o consenso de agrupamentos entre as diferentes visões. Uma avaliação experimental com oito conjuntos de eventos de benchmark revelou que a abordagem proposta é superior à abordagem tradicionalmente utilizada na área, apresentando ainda o diferencial de permitir a visualização das relações entre eventos por meio do grafo de consistência.
Palavras-chave: análise de eventos, agrupamento multivisão, grafo de consistência

Referências

Aggarwal, C. C. Machine learning for text. Springer, 2018.

Allan, J. Topic detection and tracking: event-based information organization. Vol. 12. Springer, 2012.

Conrad, J. G. and Bender, M. Semi-supervised events clustering in news retrieval. In Recent Trends in News Information Retrieval Workshop. pp. 21–26, 2016.

Deza, M. M. Distances and similarities in data analysis. In Encyclopedia of Distances. Springer, pp. 323–339, 2014.

Florence, R., Nogueira, B., and Marcacini, R. Constrained hierarchical clustering for news events. In Proceedings of the 21st International Database Engineering & Applications Symposium. ACM, pp. 49–56, 2017.

Hogenboom, F., Frasincar, F., Kaymak, U., de Jong, F., and Caron, E. A survey of event extraction methods from text for decision support systems. Decision Support Systems vol. 85, pp. 12–22, 2016.

Horie, S., Kiritoshi, K., and Ma, Q. Abstract-concrete relationship analysis of news events based on a 5W representation model. In Int. Conference on Database and Expert Systems Applications. Springer, pp. 102–117, 2016.

Hou, L. and Li. Newsminer: multifaceted news analysis for event search. KBS Journal vol. 76, pp. 17–29, 2015.

Radinsky, K., Davidovich, S., and Markovitch, S. Learning causality for news events prediction. In Proceedings of the 21st International Conference on World Wide Web. ACM, pp. 909–918, 2012.

Radinsky, K. and Horvitz, E. Mining the web to predict future events. In Proceedings of the 6th ACM International Conference on Web Search and Data Mining. ACM, pp. 255–264, 2013.

Yang, Y., Pierce, T., and Carbonell, J. A study of retrospective and on-line event detection. In Proceedings of the 21st Annual International ACM SIGIR Conference. ACM, pp. 28–36, 1998.

Zhao, J., Xie, X., Xu, X., and Sun, S. Multi-view learning overview: Recent progress and new challenges. Information Fusion vol. 38, pp. 43–54, 2017.
Publicado
22/10/2018
PAULA, Paulo H. L. de; REIS, Westerley S.; REZENDE, Solange O.; MARCACINI, Ricardo M.. Agrupamento Hierárquico e Multivisão de Eventos por meio de Grafos de Consistência. In: SYMPOSIUM ON KNOWLEDGE DISCOVERY, MINING AND LEARNING (KDMILE), 6. , 2018, São Paulo/SP. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . p. 153-160. ISSN 2763-8944. DOI: https://doi.org/10.5753/kdmile.2018.27397.