Método não supervisionado para monitoramento de assuntos de governo nos países de língua portuguesa

  • Fabio Ferman Universidade Federal do Rio de Janeiro
  • Luan Garrido Universidade Federal do Rio de Janeiro
  • Tiago Silva Universidade Federal do Rio de Janeiro
  • Sergio Assis Rodrigues Universidade Federal do Rio de Janeiro
  • Jano Souza Universidade Federal do Rio de Janeiro

Resumo


Os governantes ao redor do mundo necessitam monitorar diversos aspectos de seu território e do planeta Terra com intuito de prevenir e solucionar problemas. Esse monitoramento, na maioria dos casos, se dá através da análise de dados estatísticos, os quais podem ser difíceis e custosos de se adquirir. Através da análise de notícias, pode-se criar uma alternativa simples e barata para se conseguir os dados necessários. Para isso, é necessário a realização de duas tarefas de mineração: (1) reconhecimento das entidades de interesse e (2) geolocalização dos assuntos encontrados. Neste trabalho é focado o segundo problema, com enfoque especial para os países que tem o português como uma de suas línguas oficiais.

Palavras-chave: Monitoramento, Governo, Língua Portuguesa, Método Não Supervisionado

Referências

Andogah, G., Bouma, G. and Nerbonne, J. (2012). Every Document has a Geographical Scope. In Data & Knowledge Engineering, vol. 81–82, pages 1–20.

Chasin, R., Woodward, D., Witmer, J. and Kalita, J. (2013). Extracting and Displaying Temporal and Geospatial Entities from Articles on Historical Events. In The Computer Journal, vol. 57, issue 3, pages 403-426.

Hosokawa, Y. (2012). Improving Vertical Geo/Geo Disambiguation by Increasing Geographical Feature Weights of Places. In Proceedings of the 2012 ACM Research in Applied Computation Symposium RACS ’12, New York, NY, USA: ACM, pages 92–99.

Leidner, J. L. (2006). An Evaluation Dataset for the Toponym Resolution Task. In Computers, Environment and Urban Systems, vol. 30, issue 4, pages 400–417.

Lieberman, M. D. and Samet, H. (2012) Adaptive Context Features for Toponym Resolution in Streaming News. In Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval, ACM, pages 731–740.

Machado, I. M. R., Alencar, R. O. de, Campos Jr., R. de O. and Davis Jr., C. A. (2011). An Ontological Gazetteer and Its Application for Place Name Disambiguation in Text. In Journal of the Brazilian Computer Society, vol. 17, issue 4, pages. 267–279.

Magagna, F., Hess, B. and Sutanto, J. (2012). Building Location-Aware Web with SALT and Webnear.Me. In Procedia Computer Science ANT 2012 and MobiWIS 2012, vol. 10, pages 601–608.

Qin, T., Xiao, R., Fang, L., Xie, X. and Zhang, L. (2010). An Efficient Location Extraction Algorithm by Leveraging Web Contextual Information. In Proceedings of the 18th SIGSPATIAL International Conference on Advances in Geographic Information Systems, ACM, pages 53–60.

Rauch, E., Bukatin, M. and Baker, K. (2003). A Confidence-Based Framework for Disambiguating Geographic Terms. In Proceedings of the HLT-NAACL 2003 Workshop on Analysis of Geographic References, vol. 1, pages 50–54.

Smith, D. A. and Crane, G. (2001). Disambiguating Geographic Names in a Historical Digital Library. In Research and Advanced Technology for Digital Libraries, Springer, vol. 2163, pages. 127–136.

Tjong Kim Sang, E. F. and De Meulder, F. (2003). Introduction to the CoNLL-2003 Shared Task: Language-Independent Named Entity Recognition. In Proceedings of the Seventh Conference on Natural Language Learning at HLT-NAACL 2003, vol. 4, pages 142–147.

UNITED STATES. Central Intelligence Agency [CIA]. (c2014). "The World Factbook", https://www.cia.gov/library/publications/the-world-factbook/fields/2098.html.
Publicado
01/08/2015
FERMAN, Fabio; GARRIDO, Luan; SILVA, Tiago; RODRIGUES, Sergio Assis; SOUZA, Jano. Método não supervisionado para monitoramento de assuntos de governo nos países de língua portuguesa. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING (BRASNAM), 4. , 2015, Recife. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2015 . p.  . ISSN 2595-6094. DOI: https://doi.org/10.5753/brasnam.2015.6787.