Influência de Técnicas Não-supervisionadas de Redução de Dimensionalidade para Organização Flexível de Documentos
Resumo
A organização flexível de documentos consiste em agregar tratamento de imprecisão e incerteza, características da natureza da linguagem natural e, por conseguinte, dos textos. Nessa tarefa, o agrupamento fuzzy tem sido um poderoso aliado. Porém, a performance do agrupamento geralmente é afetada negativamente pela representação dos documentos em vetores esparsos e de alta dimensionalidade, além da presença de termos ruidosos. Com base nisso, o presente estudo busca investigar o impacto, na performance do agrupamento fuzzy, da redução de dimensionalidade utilizando técnicas não-supervisionadas. Os resultados mostram que boas estruturas fuzzy são obtidas com muito poucos atributos que conseguem identificar os aspectos semânticos latentes nos textos.