Extração de dados de fontes textuais: uma abordagem para enriquecimento de dados abertos interligados

  • Karen Torres Teixeira
  • Maria Luiza Machado Campos
  • João C. P. da Silva

Resumo


Na Web de Dados, itens de dados são interconectados e associados a anotações descritivas na forma de vocabulários, tirando vantagem de uma representação em triplas. Neste contexto, documentos e outras fontes textuais podem ser anotados para serem incorporados a este universo como recursos ou servindo também de base para extração de novas triplas. O objetivo deste artigo é apresentar uma abordagem para extração de dados e geração de triplas a partir de textos com estilos específicos visando o enriquecimento de dados abertos interligados, através de sua associação e ligação a bases existentes. A abordagem foi aplicada e avaliada no contexto de um portal com informações sobre o consumo de agrotóxicos no Brasil.

Publicado
26/07/2018
TEIXEIRA, Karen Torres; CAMPOS, Maria Luiza Machado; DA SILVA, João C. P.. Extração de dados de fontes textuais: uma abordagem para enriquecimento de dados abertos interligados. In: SEMINÁRIO INTEGRADO DE SOFTWARE E HARDWARE (SEMISH), 45. , 2018, Natal. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . ISSN 2595-6205. DOI: https://doi.org/10.5753/semish.2018.3435.