AER-MinT - Apoio ao processo de Extração de Relações baseado em Mineração de dados Textuais
Resumo
O crescimento de dados não estruturados na Web propicia alguns serviços. Um deles é a obtenção de conhecimento que o processo de extração de informações é capaz de oferecer. Para tal, abordagens de enriquecimento de datasets começaram a utilizar dados não estruturados, adotando algoritmos de machine learning a fim de aumentar a sua efetividade. Entretanto, há carência de instrumentos de apoio e há baixa oferta de datasets. Assim, este artigo propõe AER-MinT, uma abordagem capaz de aplicar um modelo de treinamento a partir de um corpus de textos, utilizando o BERT e uma Rede Neural Convolucional, com objetivo de apoiar a extração de relações em sentenças de textos. Como resultado, é possível a exploração através de um grafo RDF.
Palavras-chave:
Inteligência Artificial, Grafo RDF, Processamento de Linguagem Natural, Extração de Relações
Referências
Avelino, J., Cordeiro, K., and Cavalcanti, M. C. (2020). An RDF Based Approach for Integrating Data at Different Levels of Abstraction. WebMedia’20, page 81-88.
Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the NAACL, pages 4171-4186. Association for Computational Linguistics.
Géron, A. (2019). Mãos à Obra: Aprendizado de Máquina com Scikit-Learn TensorFlow.
Guarino, N. (1995). The Ontological Level, pages 443-456. Holder-Pivhler-Tempsky.
Miwa, M. and Bansal, M. (2016). End-to-end relation extraction using LSTMs on sequences and tree structures. In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics, pages 1105-1116.
Sherif, M. A., Ngomo, A.-C. N., et al. (2015). Automating rdf dataset transformation and enrichment. In The Semantic Web. Latest Advances and New Domains, pages 371-387.
Silveira, R. and Cavalcanti, M. (2020). Método para rotular ligações semânticas na web de dados. In Anais do XXXV Simpósio Brasileiro de Bancos de Dados, pages 49-60.
Silveira, R. and Cavalcanti, M. (2021). Método para Rotular Ligações Semânticas na Web de Dados. Mestrado em Sistemas e Computação, IME.
Teixeira, K. T., Campos, M. L. M., et al. (2018). Extração de dados de fontes textuais: Uma abordagem para enriquecimento de dados abertos interligados. In SEMISH. SBC.
Vaswani, A., Shazeer, N., Parmar, N., et al. (2017). Attention is All you Need. In Advances in Neural Information Processing Systems, pages 5998-6008.
Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the NAACL, pages 4171-4186. Association for Computational Linguistics.
Géron, A. (2019). Mãos à Obra: Aprendizado de Máquina com Scikit-Learn TensorFlow.
Guarino, N. (1995). The Ontological Level, pages 443-456. Holder-Pivhler-Tempsky.
Miwa, M. and Bansal, M. (2016). End-to-end relation extraction using LSTMs on sequences and tree structures. In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics, pages 1105-1116.
Sherif, M. A., Ngomo, A.-C. N., et al. (2015). Automating rdf dataset transformation and enrichment. In The Semantic Web. Latest Advances and New Domains, pages 371-387.
Silveira, R. and Cavalcanti, M. (2020). Método para rotular ligações semânticas na web de dados. In Anais do XXXV Simpósio Brasileiro de Bancos de Dados, pages 49-60.
Silveira, R. and Cavalcanti, M. (2021). Método para Rotular Ligações Semânticas na Web de Dados. Mestrado em Sistemas e Computação, IME.
Teixeira, K. T., Campos, M. L. M., et al. (2018). Extração de dados de fontes textuais: Uma abordagem para enriquecimento de dados abertos interligados. In SEMISH. SBC.
Vaswani, A., Shazeer, N., Parmar, N., et al. (2017). Attention is All you Need. In Advances in Neural Information Processing Systems, pages 5998-6008.
Publicado
19/09/2022
Como Citar
AVELINO, Jones O.; CORDEIRO, Kelli F.; C. CAVALCANTI, Maria.
AER-MinT - Apoio ao processo de Extração de Relações baseado em Mineração de dados Textuais. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 37. , 2022, Búzios.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2022
.
p. 409-414.
ISSN 2763-8979.
DOI: https://doi.org/10.5753/sbbd.2022.226201.