Uso de Grafos de Termos para Análise do Conteúdo de Documentos Técnicos
Resumo
Métodos de visualização de documentos isolados geralmente são bem simples, baseados somente na frequência de termos, ou dependem de bases de informações sintáticas e semânticas para serem mais significativos. Este trabalho propõe um método intermediário, baseado em algoritmos de resumo automático de texto, e tenta agregar mais informação sem necessitar de dados externos. São consideradas a frequência de repetição de pares determos importantes e a distância entre eles a cada encontro.
Referências
Luhn, H. P. (1958). The automatic creation of literature abstracts. IBM Journal of Research Development, 2(2):159–165.
NLTK - Natural Language Toolkit, Disponível em: [link], Acesso em: 14 abril 2012.
Python Programming Language – Official Website, Disponível em: [link], Acesso em: 14 abril 2012.
SBRT, Disponível em: [link], Acesso em: 14 abril 2012.
Weiss, S. M., N. Indurkhya, T. Zhang, & F. J. Damerau. (2005). From textual information to numerical vectors. In Text Mining: Predictive Methods for Analysing Unstructured Information, pp. 15–44. Springer Verlag
Zelle, J. M. (2010). Simple Graphics Library, Disponível em: [link]