Uma Alternativa Colaborativa para Expansão de Dicionários Morfológicos de Tradutores Automáticos Baseados em Regras
Resumo
Neste trabalho, apresentamos a proposta de um ambiente web colaborativo, chamado Apertium WDM, para ampliação de dicionários morfológicos utilizados em tradutores automáticos baseados em regras, mais especificamente para o tradutor Apertium. O ambiente disponibiliza uma interface homem-máquina que permite com que usuários não especialistas em computação e com conhecimentos básicos sobre uma língua possam contribuir com a expansão do vocabulário de um dicionário morfológico. Tal interface faz uso de um conjunto de funcionalidades para manipulação destes dicionários, que são fornecidas por uma API, e todas as contribuições são armazenadas em repositórios Git. Com esse ambiente, espera-se reduzir o conhecimento necessário como pré-requisito para uma pessoa se tornar apta a contribuir com a expansão de um dicionário morfológico e, com isso, aumentar o número de contribuidores em potencial do Apertium.
Referências
C. Armentano Oller, A. M. Corbí Bellot, M. L. Forcada, M. Ginestí Rosell, M. A. Montava Belda, S. Ortiz Rojas, J. A. Pérez-Ortiz, G. Ramírez Sánchez, and F. Sánchez- Martínez, “Apertium, una plataforma de código abierto para el desarrollo de sistemas de traducción automática,” 2007.
A. Miranda, “Wiklats – um ambiente de interface e interação para manipulaçã e formalização de conhecimento,” Curitiba, p. 80, 2009.
G. Ramiréz-Sánchez, F. Sánchez-Martínez, S. Ortiz-Rojas, J. A. Pérez-Ortiz, and M. L. Forcada, “Opentrad apertium open-source machine translation system: an opportunity for business and research,” 2006.
F. Tyers, F. Sánchez-Martínez, S. Ortiz-Rojas, and M. L. Forcadaac, “Free/open-source resources in the apertium platform for machine translation research and development,” The Prague Bulletin of Mathematical Linguistics, vol. 93, 01 2010.
F. M. Tyers, H. A. i Font, G. Fronteddu, and A. Martín-Mord, “Rule-based machine translation for the italian–sardinian language pair,” 2017.
R. Johnson, T. A. Pirinen, T. P. F. Tyers, T. Trosterud, and K. Unhammer, “North sámi to finnish rule-based machine translation system,” 2017.
F. Klubiˇcka, G. Ramírez-Sánchez, and N. Ljubešić, “Collaborative development of a rule-based machine translator between croatian and serbian,” in Proceedings of the 19th Annual Conference of the European Association for Machine Translation, 2016, pp. 361–367.
H. de Medeiros Caseli, “Tradução automática: estratégias e limitações,” 12 2017.
D. M. Eberhard, G. F. Simons, and C. D. Fennig. (2019) Ethnologue: Languages of the world. [Online]. Available: https://www.ethnologue.com
M. L. Forcada, M. Ginestí-Rosell, J. Nordfalk, J. O’Regan, S. Ortiz-Rojas, J. A. Pérez-Ortiz, F. Sánchez-Martínez, G. Ramírez-Sánchez, and F. M. Tyers, “Apertium: a free/open-source platform for rule-based machine translation,” Machine Translation, vol. 25, no. 2, pp. 127–144, Jun 2011. [Online]. Available: https://doi.org/10.1007/s10590- 011-9090-0
D. Bahdanau, K. Cho, and Y. Bengio, “Neural machine translation by jointly learning to align and translate,” 2015.
Y. Wu, M. Schuster, Z. Chen, Q. V. Le, and M. Norouzi, “Google’s neural machine translation system: Bridging the gap between human and machine translation,” 2016.
M. L. Forcada, B. I. Bonev, J. A. P. Ortiz, G. R. Sánchez, F. S. Martínez, C. Armentano-Oller, M. A. Montava, and F. M. Tyers, “Documentation of the open-source shallow-transfer machine translation platform apertium,” 2010.
S. Chacon and B. Straub, Pro Git, 2nd ed. Berkely, CA, USA: Apress, 2014.