Implementação de API para Reconhecimento e Sintetização de Voz em um Aplicativo Móvel

  • Lucas Debatin Centro Universitário de Brusque - UNIFEBE
  • Aluizio Filho Centro Universitário de Brusque - UNIFEBE
  • Jonathan Nau Centro Universitário de Brusque - UNIFEBE
  • Pedro Zanchett Centro Universitário de Brusque - UNIFEBE
  • Wagner Correia Centro Universitário de Brusque - UNIFEBE

Resumo


O uso de interfaces inteligentes, recursos de usabilidade e tecnologias de voz estão possibilitando que as aplicações se tornem cada vez mais ricas, em especial para auxiliar usuários inexperientes ou com necessidades especiais. Com isso muitas empresas desenvolvedoras de softwares estão buscando maneiras de implementar as tecnologias de voz em seus produtos, e uma das formas mais utilizadas é através do uso de Application Programming Interface (API’s). As tecnologias de voz são divididas em duas categorias: reconhecimento de voz, que é utilizado em comandos por voz (converte a voz em texto), e sintetizador de voz, que é utilizado para melhorar a acessibilidade nos dispositivos (converte o texto em fala). Essas tecnologias fazem uso do Processamento de Linguagem Natural, subárea da Inteligência Artificial, para processar e manipular a linguagem humana em diversos níveis. Este artigo apresenta um levantamento das principais API’s de reconhecimento e sintetização da voz, descrevendo as suas características e funcionalidades. Além disso, um estudo de caso mostra qual API foi escolhida dentre as que foram pesquisadas, e como a mesma foi implementada no aplicativo Alerta Brusque.

Palavras-chave: Experiência de Usuário, Usabilidade, Reconhecimento de Voz, Sintetização de Voz

Referências

Barreto, J. M. 1997. Introdução as Redes Neurais Artificiais. V Escola Regional de Informática da SBC Regional Sul (Santa Maria, Florianópolis, Maringá, 5-10 de maio de 1997), 41-71.

Braga, A. P.; Carvalho, A.; Ludermir, T. 2000. Redes Neurais Artificiais: Teoria e Aplicações. Editora LTC, Rio de Janeiro, 262p.

Caloba, G. M; Caloba, L. P; Saliby, E. 2002. Cooperação entre redes neurais artificiais e técnicas "clássicas" para previsão de demanda de uma série de vendas de cerveja na Austrália. Pesquisa Operacional, Rio de Janeiro, v. 22, n. 3 (julho 2002), 345-358. Disponível em: . Acesso em: 15 Set. 2016.

Cybenko, G. 1989. Approximations by superpositions of sigmoidal functions. Mathematics of Control Signals and Systems, v. 2 (1989), 303-314.

Dimopoulos, Y.; Bourret, P.; Lek, S. 1995. Use of some sensitivity criteria for choosing networks with good generalization ability. Neural Processing Letters, v. 2, i. 6, (December 1995), 1-4. DOI: 10.1007/BF02309007

Dimopoulos, I.; Chronopoulos, J.; Chronopoulou-Sereli, A.; Lek, S. 1999. Neural network models to study relationships between lead concentration in grasses and permanent urban descriptors in Athens city (Greece). Ecological Modelling, v. 120 (August 1999), 157-165.

Frank, A; Assuncion, A. 2011. UCI Machine Learning Repository. University of California, School of Information and Computer Science, Irvine, CA. Disponível em: . Acessado em: 10/10/2016.

Garson, G. D. 1991. Interpreting neural network connection weights. Artificial Intelligence Expert, v. 6, i. 4 (April 1991), 46-51, Miller Freeman, Inc. San Francisco, CA, USA.

Grevey, M; Dimopoulos, I; Lek, S. 2003. Review and comparison of methods to study the contribution of variables in artificial neural network models. Ecological Modelling, v. 160, i. 3 (15 fevereiro 2003), 249-264.

Haykin, S. 1998. Neural Networks: A Comprehensive Foundation. 2nd ed. Prentice Hall, NJ, USA, 842p. ISBN: 0132733501

Hassoun, M. H. 1995. Fundamentals of Artificial Neural Networks. 1st ed. MIT Press, 511p.

Hristev, R. 2011. ANN Toolbox for Scilab. Disponível em: http://www.scilab.org/contrib/index_contrib.php?page=displ ayContribution&fileID=166. Acessado em: 20/10/2016.

Kovacs, K. L. 2002. Redes Neurais Artificiais - Fundamentos e Aplicações. 4a ed. Livraria da Física, São Paulo, 174p.

McCulloch, W. S.; Pitts, W. 1943. A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biophysics, v. 5, i. 4 (December 1943), 115- 133. DOI: 10.1007/BF02478259

Minsk, M.; Papert, S. 1969. Perceptrons: an introduction to computational geometry. MIT Press, Massachusetts, 308p. ISBN: 9780262631112

Rosenblatt, F. 1958. The perceptron: A probabilistic model for information storage and organization in the brain. Psychological Review, v. 65, i. 6 (November 1958), 386- 408.

Valença, M. J. S.; Ludermir, T. B. 2007. Explicando a relação entre as variáveis de uma rede neural: Iluminando a “Caixa Preta”. XVII Simpósio Brasileiro de Recursos Hídricos, São Paulo (25-29 novembro, 2007).

Valiant, L. G. 1984. A theory of the learnable. Magazine Communications of the ACM, v. 27, n. 11 (November 1984), 1134-1142.

Veelenturf, L. P. J. 1995. Analysis and Applications of Artificial Neural Networks. NJ, USA: Prentience-Hall, 1995. 259p.

Widrow, B.; Hoff, M.E. 1960. Adaptative switching circuits. Institute of Radio Engineers, Western Electronic Show and Convention Record, v. 4 (1960), 96-104.

Yao, J.; Teng, N.; Poh, H.;Tan, C. 1998. Forecasting and analysis of marketing data using neural networks. Journal of Information Science and Engineering, v. 14, n. 4, 843-862.
Publicado
17/05/2017
DEBATIN, Lucas; FILHO, Aluizio; NAU, Jonathan; ZANCHETT, Pedro; CORREIA, Wagner. Implementação de API para Reconhecimento e Sintetização de Voz em um Aplicativo Móvel. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 13. , 2017, Lavras. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2017 . p. 151-157. DOI: https://doi.org/10.5753/sbsi.2017.6037.