Uma Alternativa Colaborativa para Expansão de Dicionários Morfológicos de Tradutores Automáticos Baseados em Regras

  • Vinícius Silva Nogueira CEFET-MG
  • Aléssio Miranda Júnior CEFET-MG

Resumo


Neste trabalho, apresentamos a proposta de um ambiente web colaborativo, chamado Apertium WDM, para ampliação de dicionários morfológicos utilizados em tradutores automáticos baseados em regras, mais especificamente para o tradutor Apertium. O ambiente disponibiliza uma interface homem-máquina que permite com que usuários não especialistas em computação e com conhecimentos básicos sobre uma língua possam contribuir com a expansão do vocabulário de um dicionário morfológico. Tal interface faz uso de um conjunto de funcionalidades para manipulação destes dicionários, que são fornecidas por uma API, e todas as contribuições são armazenadas em repositórios Git. Com esse ambiente, espera-se reduzir o conhecimento necessário como pré-requisito para uma pessoa se tornar apta a contribuir com a expansão de um dicionário morfológico e, com isso, aumentar o número de contribuidores em potencial do Apertium.

Palavras-chave: Tradução automática, Apertium, Dicionário morfológico, Desenvolvimento Colaborativo.

Referências

J. Hirschberg and C. D. Manning, “Advances in natural language processing,” Science, vol. 349, no. 6245, pp. 261– 266, 2015.

C. Armentano Oller, A. M. Corbí Bellot, M. L. Forcada, M. Ginestí Rosell, M. A. Montava Belda, S. Ortiz Rojas, J. A. Pérez-Ortiz, G. Ramírez Sánchez, and F. Sánchez- Martínez, “Apertium, una plataforma de código abierto para el desarrollo de sistemas de traducción automática,” 2007.

A. Miranda, “Wiklats – um ambiente de interface e interação para manipulaçã e formalização de conhecimento,” Curitiba, p. 80, 2009.

G. Ramiréz-Sánchez, F. Sánchez-Martínez, S. Ortiz-Rojas, J. A. Pérez-Ortiz, and M. L. Forcada, “Opentrad apertium open-source machine translation system: an opportunity for business and research,” 2006.

F. Tyers, F. Sánchez-Martínez, S. Ortiz-Rojas, and M. L. Forcadaac, “Free/open-source resources in the apertium platform for machine translation research and development,” The Prague Bulletin of Mathematical Linguistics, vol. 93, 01 2010.

F. M. Tyers, H. A. i Font, G. Fronteddu, and A. Martín-Mord, “Rule-based machine translation for the italian–sardinian language pair,” 2017.

R. Johnson, T. A. Pirinen, T. P. F. Tyers, T. Trosterud, and K. Unhammer, “North sámi to finnish rule-based machine translation system,” 2017.

F. Klubiˇcka, G. Ramírez-Sánchez, and N. Ljubešić, “Collaborative development of a rule-based machine translator between croatian and serbian,” in Proceedings of the 19th Annual Conference of the European Association for Machine Translation, 2016, pp. 361–367.

H. de Medeiros Caseli, “Tradução automática: estratégias e limitações,” 12 2017.

D. M. Eberhard, G. F. Simons, and C. D. Fennig. (2019) Ethnologue: Languages of the world. [Online]. Available: https://www.ethnologue.com

M. L. Forcada, M. Ginestí-Rosell, J. Nordfalk, J. O’Regan, S. Ortiz-Rojas, J. A. Pérez-Ortiz, F. Sánchez-Martínez, G. Ramírez-Sánchez, and F. M. Tyers, “Apertium: a free/open-source platform for rule-based machine translation,” Machine Translation, vol. 25, no. 2, pp. 127–144, Jun 2011. [Online]. Available: https://doi.org/10.1007/s10590- 011-9090-0

D. Bahdanau, K. Cho, and Y. Bengio, “Neural machine translation by jointly learning to align and translate,” 2015.

Y. Wu, M. Schuster, Z. Chen, Q. V. Le, and M. Norouzi, “Google’s neural machine translation system: Bridging the gap between human and machine translation,” 2016.

M. L. Forcada, B. I. Bonev, J. A. P. Ortiz, G. R. Sánchez, F. S. Martínez, C. Armentano-Oller, M. A. Montava, and F. M. Tyers, “Documentation of the open-source shallow-transfer machine translation platform apertium,” 2010.

S. Chacon and B. Straub, Pro Git, 2nd ed. Berkely, CA, USA: Apress, 2014.
Publicado
27/11/2019
NOGUEIRA, Vinícius Silva; MIRANDA JÚNIOR, Aléssio. Uma Alternativa Colaborativa para Expansão de Dicionários Morfológicos de Tradutores Automáticos Baseados em Regras. In: CONGRESSO LATINO-AMERICANO DE SOFTWARE LIVRE E TECNOLOGIAS ABERTAS (LATINOWARE), 16. , 2019, Foz do Iguaçu. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 93-102. DOI: https://doi.org/10.5753/latinoware.2019.10338.