Part-of-Speech Tagging para um FAQ sobre Serviços de Telecomunicação

  • Rafael Lucien Bahr Arias UEL
  • Cinthyan Renata Sachs C. de Barbosa UEL
  • Alan Salvany Felinto UEL

Resumo


Este artigo descreve o desenvolvimento de um POS tagger para uma página de perguntas frequentes (FAQ) sobre serviços de telecomunicações. Esse consiste de uma série de ajustes nas regras de contexto ou palavras adjacentes nas frases de texto para uma classificação gramatical precisa de uma aplicação particular. Categorias lexicais e atributos associados são sumarizados com a apresentação de estatísticas relevantes do dicionário de português do sistema, cujo processamento léxico foi auxiliado pela biblioteca Flex de código aberto. Este analisador léxico morfológico representa a parte inicial de um sistema completo de chatbot, que pode potencialmente substituir a página de FAQ e auxiliar os visitantes de uma forma mais amigável e interativa. Isso é possível por meio da evolução das tecnologias de Processamento de Linguagem Natural (PLN), o que pode reduzir custos operacionais de várias áreas, incluindo o Serviço de Atendimento ao Consumidor (SAC) e vendas.

Referências

Agência Nacional de Telecomunicações (2018). http://www.anatel.gov.br/consumidor/ perguntas-frequentes?view=faq

Aluísio, S. e Almeida, G. (2006). O que é e como se constrói um corpus? Lições aprendidas na compilação de vários corpora para pesquisa linguística. Calidoscópio 4(3), pages 156–178.

Amorim, M. T. C. F., Cury, D. e Menezes, C. (2012). Um Helpdesk Inteligente baseado em Ontologias. In: Anais do 23o Simpósio Brasileiro de Informática na Educação. Rio de Janeiro: CBIE.

Barbosa, C. R. S. C. de. (2004) Técnicas de Parsing para Gramática Livre de Contexto Lexicalizada da Língua Portuguesa. São José dos Campos: CPG da Engenharia Eletrônica e Computação do Instituto Tecnológico de Aeronáutica. Tese de Doutorado. 171p.

Brill, E. (1992). A Simple rule-based Part of Speech Tagger. In: Proceedings of the Third Conference on Applied Natural Language Processing, pages 152–155. Association for Computational Linguistics, Trento.

Camara Junior, A. T. (2016). Processamento de Linguagem Natural para Indexação Automática Semântico-ontológica. Revista Ibero-Americana de Ciência da Informação. 9(2). p.569. jul/dez.

Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K. and Kuksa, P. (2011). Natural Language Processing (almost) from Scratch. Journal of Machine Learning Research. 12, pages 2493–2537.

Cutting, D., Kupiec, J., Pedersen, J. and Sibun, P. (1992). A practical part-of-speech tagger. In: Proceedings of the Third Conference on Applied Natural Language Processing, pages 133–140. Association for Computational Linguistics, Trento.

Fonseca, E. and Aluísio, S. (2016). Improving POS Tagging across Portuguese Variants with Word Embeddings. In: Proceedings of the International Conference on Computational Processing of the Portuguese Language, pages 227-232. Springer, Cham.

Ghosh, S., Ghosh, S. and Das, D. (2016). Part-of-speech Tagging of Code-Mixed Social Media Text. In: Proceedings of the Second Workshop on Computational Approaches to Code Switching, pages 90–97. Association for Computational Linguistics, Austin.

Guthrie, L., Pustejovsky, J., Wilks, Y. and Slator, M. (1996). The Role of Lexicons in Natural Language Processing. Communications of the ACM. 39(1), pages 63–72.

Khurana, P., Agarwal, P., Shroff, G., Vig, L. and Srinivasan, A. (2017). Hybrid BiLSTM-Siamese network for FAQ Assistance. In: Proceedings of the ACM on Conference on Information and Knowledge Management, pages 537–545. ACM, Singapore.

Leonhardt, M. D. (2005). Doroty: um Chatterbot para Treinamento de Profissionais Atuantes no Gerenciamento de Redes de Computadores. Porto Alegre: CGCC da Universidade Federal do Rio Grande do Sul. Dissertação de Mestrado. 110p.

Oliveira, C. e Freitas, M. (2006). Classes de Palavras e Etiquetagem na Lingüística Computacional. Calidoscópio 4(3), pages 179–188.

Scarton, C., Duran, M. and Aluísio, S. (2014). Using cross-linguistic knowledge to build VerbNet-style lexicons: results for a (Brazilian) Portuguese VerbNet. In: Proceedings of the International Conference on Computational Processing of the Portuguese Language, pages 149-160. Springer, Cham.

Strube de Lima, V. L. (1996). Processamento da Linguagem Natural - premissas e desafios. In: 4o Anais da Escola Regional de Informática -SBC/Regional Sul, pages 110-124. SBC, Canoas/Londrina.

The Fast Lexical Analyzer (2018). https://www.gnu.org/software/flex/

Thiele, P. F. O. (2015) Desambiguação de anotações morfossintáticas feitas por MTMDD. Porto Alegre: PPGCC da Pontificia Universidade Catolica do Rio Grande do Sul. Dissertação de Mestrado. 58p.
Publicado
09/07/2019
Como Citar

Selecione um Formato
ARIAS, Rafael Lucien Bahr; DE BARBOSA, Cinthyan Renata Sachs C.; FELINTO, Alan Salvany. Part-of-Speech Tagging para um FAQ sobre Serviços de Telecomunicação. In: SEMINÁRIO INTEGRADO DE SOFTWARE E HARDWARE (SEMISH), 46. , 2019, Belém. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 22-32. ISSN 2595-6205. DOI: https://doi.org/10.5753/semish.2019.6564.