Uso de Grafos de Termos para Análise do Conteúdo de Documentos Técnicos

Luiz Cláudio S. Silva; Renelson R. Sampaio

Luiz Cláudio S. Silva SENAI Cimatec
Renelson R. Sampaio SENAI Cimatec

Resumo

Métodos de visualização de documentos isolados geralmente são bem simples, baseados somente na frequência de termos, ou dependem de bases de informações sintáticas e semânticas para serem mais significativos. Este trabalho propõe um método intermediário, baseado em algoritmos de resumo automático de texto, e tenta agregar mais informação sem necessitar de dados externos. São consideradas a frequência de repetição de pares determos importantes e a distância entre eles a cada encontro.

Palavras-chave: Análise de Conteúdo, Redes de Termos, Documentos Técnicos

Referências

Grobelnik, M., Mladenic, D. (2004). Tutorial on Text Mining em PASCAL Network of Excellence Workshop on Text Classification

Luhn, H. P. (1958). The automatic creation of literature abstracts. IBM Journal of Research Development, 2(2):159–165.

NLTK - Natural Language Toolkit, Disponível em: [link], Acesso em: 14 abril 2012.

Python Programming Language – Official Website, Disponível em: [link], Acesso em: 14 abril 2012.

SBRT, Disponível em: [link], Acesso em: 14 abril 2012.

Weiss, S. M., N. Indurkhya, T. Zhang, & F. J. Damerau. (2005). From textual information to numerical vectors. In Text Mining: Predictive Methods for Analysing Unstructured Information, pp. 15–44. Springer Verlag

Zelle, J. M. (2010). Simple Graphics Library, Disponível em: [link]