Automation: Uma Ferramenta para a Evolução de um Tradutor Automático Português-Libras com Corpus Colaborativo
Resumo
Pessoas surdas comunicam-se naturalmente usando línguas viso-espaciais, denominadas Línguas de Sinais (LS). Apesar das línguas de sinais serem reconhecidas em muitos países como uma segunda língua oficial, nem sempre os conteúdos são gerados de forma acessível para esta comunidade. Com objetivo de minimizar esses impactos, pesquisas envolvendo tradução automática utilizando Aprendizagem Profunda ganham cada vez mais espaço na literatura. Porém, uma das principais barreiras para uso dessa estratégia é a necessidade de um corpus bilíngue, o que nem sempre é uma tarefa fácil de encontrar ou produzir. Nesse contexto, este trabalho apresenta uma ferramenta de automação de treinamentos para um tradutor automático Português-Libras. A solução comunica-se com um sistema colaborativo de traduções de sentenças Português-Libras, o WikiLibras, e alimenta o corpus de um tradutor automático para Libras, o VLibras, com objetivo de realizar treinamentos com um conjunto de dados cada vez mais robusto a cada iteração.
Palavras-chave:
Tradução Automática, Corpus, Libras, Automação
Referências
Araujo, T. (2012). Uma solução para geração automática de trilhas em Língua Brasileira de Sinais em conteúdos multimídia. PhD thesis
Bisong, E. (2019). Google Colaboratory, pages 59–64. Apress, Berkeley, CA.
Krishna, S., Jindal, A. R., R, M., K, R., and Jayagopi, D. (2020). Virtual indian sign language interpreter. In Proceedings of the 2020 4th International Conference on Vision, Image and Signal Processing, ICVISP 2020, New York, NY, USA. Association for Computing Machinery.
Lima, M. A. C. B. (2015). Tradução automática com adequação sintático-semântica para LIBRAS. PhD thesis.
Liu, D., Ma, N., Yang, F., and Yang, X. (2019). A survey of low resource neural machine translation. In 2019 4th International Conference on Mechanical, Control and Computer Engineering (ICMCCE), pages 39–393.
Ott, M., Edunov, S., Baevski, A., Fan, A., Gross, S., Ng, N., Grangier, D., and Auli, M. (2019). fairseq: A fast, extensible toolkit for sequence modeling. In Proceedings of NAACL-HLT 2019: Demonstrations.
Papineni, K., Roukos, S., Ward, T., and Zhu, W.-J. (2002). Bleu: a method for automatic evaluation of machine translation. In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, pages 311–318, Philadelphia, Pennsylva- nia, USA. Association for Computational Linguistics
Rosa Zucolotto, M.P., Ruiz, L.R., and Pinheiro, N.F. (2019).Reflexões sobre linguagem, sociedade e surdez. Revista Uniabeu, 12(30):134–147.
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., and Polosukhin, I. (2017). Attention is all you need.
Veríssimo, V., Silva, C., Hanael, V., Moraes, C., Costa, R., Maritan, T., Aschoff, M., and Gaudêncio, T. (2019). A study on the use of sequence-to-sequence neural networks for automatic translation of brazilian portuguese to libras. In Proceedings of the 25th Brazillian Symposium on Multimedia and the Web, WebMedia ’19, page 101–108, New York, NY, USA. Association for Computing Machinery
Vichyaloetsiri, T., Wuttidittachotti, P., and (2017). Web service framework to translate text into sign language. In 2017 International Conference on Computer, Information and Telecommunication Systems (CITS), pages 180–184.
Wu, F., Fan, A., Baevski, A., Dauphin, Y. N., and Auli, M. (2019). Pay less attention with lightweight and dynamic convolutions. CoRR, abs/1901.10430.
Bisong, E. (2019). Google Colaboratory, pages 59–64. Apress, Berkeley, CA.
Krishna, S., Jindal, A. R., R, M., K, R., and Jayagopi, D. (2020). Virtual indian sign language interpreter. In Proceedings of the 2020 4th International Conference on Vision, Image and Signal Processing, ICVISP 2020, New York, NY, USA. Association for Computing Machinery.
Lima, M. A. C. B. (2015). Tradução automática com adequação sintático-semântica para LIBRAS. PhD thesis.
Liu, D., Ma, N., Yang, F., and Yang, X. (2019). A survey of low resource neural machine translation. In 2019 4th International Conference on Mechanical, Control and Computer Engineering (ICMCCE), pages 39–393.
Ott, M., Edunov, S., Baevski, A., Fan, A., Gross, S., Ng, N., Grangier, D., and Auli, M. (2019). fairseq: A fast, extensible toolkit for sequence modeling. In Proceedings of NAACL-HLT 2019: Demonstrations.
Papineni, K., Roukos, S., Ward, T., and Zhu, W.-J. (2002). Bleu: a method for automatic evaluation of machine translation. In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, pages 311–318, Philadelphia, Pennsylva- nia, USA. Association for Computational Linguistics
Rosa Zucolotto, M.P., Ruiz, L.R., and Pinheiro, N.F. (2019).Reflexões sobre linguagem, sociedade e surdez. Revista Uniabeu, 12(30):134–147.
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., and Polosukhin, I. (2017). Attention is all you need.
Veríssimo, V., Silva, C., Hanael, V., Moraes, C., Costa, R., Maritan, T., Aschoff, M., and Gaudêncio, T. (2019). A study on the use of sequence-to-sequence neural networks for automatic translation of brazilian portuguese to libras. In Proceedings of the 25th Brazillian Symposium on Multimedia and the Web, WebMedia ’19, page 101–108, New York, NY, USA. Association for Computing Machinery
Vichyaloetsiri, T., Wuttidittachotti, P., and (2017). Web service framework to translate text into sign language. In 2017 International Conference on Computer, Information and Telecommunication Systems (CITS), pages 180–184.
Wu, F., Fan, A., Baevski, A., Dauphin, Y. N., and Auli, M. (2019). Pay less attention with lightweight and dynamic convolutions. CoRR, abs/1901.10430.
Publicado
18/07/2021
Como Citar
SILVA, Marcos Henrique Alves da; ARAÚJO, Tiago Maritan Ugulino de; COSTA, Rostand Edson Oliveira; MOREIRA, Samuel de Moura; ALVES, Lucas Moreira e Silva.
Automation: Uma Ferramenta para a Evolução de um Tradutor Automático Português-Libras com Corpus Colaborativo. In: SEMINÁRIO INTEGRADO DE SOFTWARE E HARDWARE (SEMISH), 48. , 2021, Evento Online.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2021
.
p. 155-165.
ISSN 2595-6205.
DOI: https://doi.org/10.5753/semish.2021.15818.