AvaliaGeo: Sistema para Validação de Topônimos em Notícias
Resumo
Soluções para problemas de extração de informação geográfica de textos e documentos precisam, muitas vezes, de bases de dados rotuladas para realização de experimentos ou para validação de algoritmos. Entretanto, muitas dessas bases não são gratuitas ou não são deixadas disponíveis. Este trabalho tem por objetivo facilitar a geração de bases de dados rotuladas geograficamente, com o uso de contribuições voluntárias para a desambiguação dos topônimos presentes nas notícias. Para validar as contribuições é proposto o uso do coeficiente Alfa de Cronbach, considerando cada notícia um questionário e cada candidato à topônimo um item desse questionário. Experimentos preliminares alcançaram 70% de confiabilidade na desambiguação dos topônimos para geração de bases de dados.
Referências
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. psychometrika, 16(3):297–334.
Freitas, A. L. P. and Rodrigues, S. G. (2005). A avaliação da confiabilidade de questionários: uma análise utilizando o coeficiente alfa de cronbach. In Anais... XVII SIMPEP,.
Gritta, M., Pilehvar, M. T., Limsopatham, N., and Collier, N. (2018). What’s missing in geographical parsing? Language Resources and Evaluation, 52(2):603–623.
Larsen, N. (2010). Market segmentation a framework for determining the right target customers. Bachelor’s thesis, Aarhus School of Business, Aarhus BSS, Denmark.
Matthiensen, A. (2010). Uso do coeciente alfa de cronbach em avaliações por questionários. Embrapa Roraima-Documentos (INFOTECA-E).
Monteiro, B. R., Jr., C. A. D., and Fonseca, F. T. (2016). A survey on the geographic scope of textual documents. Computers & Geosciences, 96:23–34.
Streiner, D. L. (2003). Starting at the beginning: an introduction to coefficient alpha and internal consistency. Journal of personality assessment, 80(1):99–103.