Utilizando Features Linguísticas Genéricas para Classificação de Triplas Relacionais em Português

George C. G. Barbosa; Daniela Barreiro Claro

Utilizando Features Linguísticas Genéricas para Classificação de Triplas Relacionais em Português

George C. G. Barbosa UFBA
Daniela Barreiro Claro UFBA

Resumo

A quantidade de textos gerados diariamente na web torna cada vez mais difícil a análise e extração de informações desses dados. Retirar informação útil de forma automática de textos é uma tarefa difícil, dada a complexidade e infinidade de formas com que as pessoas podem se expressar utilizando a linguagem natural. A tarefa de Extração de Informação Aberta tem o papel de automatizar o processamento de repositórios tais como a Web. Esta abordagem pode ser classificada em duas etapas: (i) extração e (ii) classificação. A proposta desse trabalho é, na etapa de classificação, utilizar um conjunto de features genéricas que não contém termos presentes em um idioma específico. Experimentos foram realizados em Português do Brasil nos quais as features genéricas obtiveram uma acurácia média de 70% contra 55% das features propostas em [Fader et al. 2011].

Publicado

02/10/2017

Como Citar

Selecione um Formato

BARBOSA, George C. G.; CLARO, Daniela Barreiro. Utilizando Features Linguísticas Genéricas para Classificação de Triplas Relacionais em Português. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 1. , 2017, Uberlândia/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2017 . p. 132-141.