A Criação de um Corpus de Sentenças Através de Gramáticas Livres de Contexto

  • Tiago Martins da Cunha UNILAB
  • Paulo Bruno Lopes da Silva UFC

Resumo


Este trabalho apresenta uma nova visão para com a coleta de dados linguística. Neste trabalho, propomos alterar a direção na qual a análise lingüística é realizada. Este reconhecimento lato sensu sobre o armazenamento de informação linguística foca em reduzir a quantidade de espaço de armazenamento e aumentar a produtividade em análise de corpus para domínios linguísticos específicos. Por isso, propomos a criação de gramáticas específicas para gerar possíveis sentenças para compor um corpus. Nós apresentamos a metodologia que usamos para compor nosso corpo de sentenças e as ferramentas necessárias no processo. Usando a criação de gramáticas para geração de sentenças, produzimos mais de 10 mil sentenças válidas por dia. Este tipo de metodologia se mostrou muito confiável e extremamente produtivo em relação a domínios específicos.

Publicado
04/11/2015
Como Citar

Selecione um Formato
CUNHA, Tiago Martins da; SILVA, Paulo Bruno Lopes da. A Criação de um Corpus de Sentenças Através de Gramáticas Livres de Contexto. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 1. , 2015, Natal/RN. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2015 . p. 241-248.