Extração de dados de fontes textuais: uma abordagem para enriquecimento de dados abertos interligados
Resumo
Na Web de Dados, itens de dados são interconectados e associados a anotações descritivas na forma de vocabulários, tirando vantagem de uma representação em triplas. Neste contexto, documentos e outras fontes textuais podem ser anotados para serem incorporados a este universo como recursos ou servindo também de base para extração de novas triplas. O objetivo deste artigo é apresentar uma abordagem para extração de dados e geração de triplas a partir de textos com estilos específicos visando o enriquecimento de dados abertos interligados, através de sua associação e ligação a bases existentes. A abordagem foi aplicada e avaliada no contexto de um portal com informações sobre o consumo de agrotóxicos no Brasil.