Extração de Termos de Manuais Técnicos de Produtos Tecnológicos: uma Aplicação em Sistemas de Adaptação Textual

  • Fernando A. M. Muniz USP
  • Willian M. Watanabe USP
  • Carolina E. Scarton USP
  • Sandra M. Aluisio USP

Resumo


Em tarefas que exigem o uso de documentação técnica, a qualidade da documentação é um ponto crítico, pois caso ela seja imprecisa, incompleta ou muito complexa, o custo da tarefa ou até mesmo o risco de acidentes aumenta. Este trabalho estudou como as relações procedimentais entre ações gera e habilita, propostas por Goldman, são realizadas em manuais em português, para a criação de um método de extração automática de termos dedicado ao gênero procedimental, especificamente, manuais técnicos. Também propôs uma adaptação de um sistema de autoria de textos simplificados para atender este gênero textual. Esta adaptação usa a lista de candidatos a termos extraídos para: (a) auxiliar na identificação de palavras que não devem ser simplificadas pelo método de simplificação léxica, e (b) elaborar tais termos, facilitando o entendimento dos textos.

Referências

Aluisio, S. M. and Gasperin, C. (2010). Fostering Digital Inclusion and Accessibility: The PorSimples project for Simplification of Portuguese Texts. In the Proceedings of the NAACL HLT 2010 Young Investigators Workshop on Computational Approaches to Languages of the Americas, June, 2010, Los Angeles, California, Association for Computational Linguistics, p. 46-53.

Aluísio, S. M.; Specia, L.; Gasperin, C.; Scarton, C. E. (2010). Readability Assessment for Text Simplification. In: NAACL 5th Workshop on Innovative Use of NLP for Building Educational Applications (BEA-2010), 2010, Los Angeles.

Proceedings of the NAACL HLT 2010 Fifth Workshop on Innovative Use of NLP for Building Educational Applications. New York : ACL, 2010. v. 1. p. 1-9.

Aouladomar, F. (2005). Towards Answering Procedural Questions, Workshop KRAQ05, IJCAI 05, Edinburgh, p. 21-30. Disponível em: [link]

Bick, E. (2000). The Parsing System “Palavras”. Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Tese (Doutorado) – Arhus University, 2000.

Burstein, J., Shore, J., Sabatini, J., Lee, Y.W., Ventura, M. (2007). The automated text adaptation tool. In NAACL '07: Proceedings of Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics: Demonstrations on XX, p. 3-4.

Burstein, J. (2009). Opportunities for Natural Language Processing Research in Education. In the Proceedings of CICLing, p. 6-27.

Delin, J.; Hartley, A.; Paris, C., Scott, D.; Vander Linden, K. (1994). Expressing Procedural Relationships in Multilingual Instructions, Proceedings of the Seventh International Workshop on Natural Language Generation, p. 61-70.

Devlin, S. and Unthank, G. (2006). Helping aphasic people process online information. Proceedings of ASSETS, 2006, p. 225-226.

van der Eijk, P. (1997). Controlled languages in technical documentation, Proceedings of the Computational Linguistics in the Netherlands, 1997.

Elhadad, N. (2006). Comprehending technical texts: predicting and defining unfamiliar terms. AMIA Annu Symp Proc. 2006:239-43.

Fontan, L.; Saint-Dizier, P. (2008). Analyzing the explanation structure of procedural texts: dealing with Advices and Warnings. In: International Symposium on Text Semantics (STEP 2008), Venise, Johan Bos (Ed.), Association for Computational Linguistics (ACL) p. 115-127.

Frantzy, K. T.; Ananiadou, S. (1997). Automatic Term Recognition using Contextual Cues. Manchester Metropolitan University. Third Delos Workshop Cross-Language Information Retrieval Zurich, 5-7 March 1997. Disponível em: [link]

Gasperin, C. Maziero, E. and Aluísio, S.M. (2010). Challenging Choices for Text Simplification, In: Proceedings of PROPOR 2010, p. 40-50, António Branco, Aldebaro

Klautau, Renata Vieira, Vera Lúcia Strube de Lima (Eds.): Computational Processing of the Portuguese Language, Springer 2010, v. 6001. p. 40-50.

Goldman, A. (1970). A Theory of Human Action, Prentice-Hall, 230 pp.

INAF (2009). Instituto P. Montenegro e Ação Educativa. INAF Brasil - Indicador de Alfabetismo Funcional - 2009. Disponível em: [link]

Lopes, L.; Vieira, R.; Finatto, M. J.; Martins, D. (2010). Extracting compound terms from domain corpora. Journal of the Brazilian Computer Society (Impresso), p. 1-13, 2010.

Moura, A. B. N. (2008). Tipologia Textual e Ativação de Terminologia: um Estudo em Manuais Técnicos de Produtos Tecnológicos. Tese de Doutorado em Letras - Universidade Federal do Rio Grande do Sul, p. 287.

Paris, C.; Scott, D. (1994). Stylistic variation in multilingual instructions. In Proceedings of the Seventh International Workshop on Natural Language Generation, Kennebunkport, MN, 21--24 June 1994, pages 45--52.

Paris, C.; Vander Linden, K., Fischer, M.; Hartley, A.; Pemberton, L.; Power, R.; Scott, D. (1995). A support tool for writing multilingual instructions. In Proceedings of the 14th International Joint Conference on Artificial Intelligence, p. 1398--1404, Montreal, Canada, 1995.

Ratnaparkhi, A. (1996). A maximum entropy model for part-of-speech tagging. In Brill, E. & Church, K., editors, Proceedings of the Conference on Empirical Methods in Natural Language Processing, p. 133–142. Nova Jérsei, EUA.

Ribeiro Jr., L. C. (2008). OntoLP : Construção Semi-Automática de Ontologias a partir de Textos da Língua Portuguesa. Dissertação (Mestrado) - Programa de Pós-Graduação em Computação Aplicada, Universidade do Vale do Rio dos Sinos, 2008.

Siddharthan, A. (2003): Syntactic Simplification and Text Cohesion. PhD thesis, University of Cambridge (2003).

Specia, L.; Aluísio, S. M.; Pardo, T. A. S. (2008). Manual de Simplificação Sintática para o Português. Série de Relatórios do Núcleo Interinstitucional de Lingüística Computacional (NILC-TR-08-06), 27 p., Junho 2008, São Carlos-SP. Disponível em: [link].

Teline, M. F. (2004). Avaliação de métodos para extração automática de terminologia de textos em português. ICMC-USP, São Carlos, 2004. Dissertação de Mestrado.

Urano, K. (2000): Lexical Simplification and Elaboration: Sentence comprehension and incidental vocabulary acquisition. Unpublished master's thesis, University of Hawai'i at Manoa, Honolulu (2000). Disponível em: [link]

Watanabe, W.M., Candido Jr, A., Amancio, M.A., Oliveira, M., Pardo, T.A.S., Fortes, R.P.M., Aluísio, S.M. (2010). Adapting web content for low-literacy readers by using lexical elaboration and named entities labeling. In the Proceedings of the W4A-7th International Cross-Disciplinary Conference on Web Accessibility 2010, (2010). Nova York: ACM Press, v. 1, 1--9 (2010)

Young, D.N. (1999). Linguistic simplification of SL reading material: Effective Instructional Practice? The Modern Language Journal, 83(3), 350--366 (1999)

Rahimi, M. Y. (2011). Use of Syntactic Elaboration Techniques to Enhance Comprehensibility of EST Texts. English Language Teaching, Vol. 4, No. 1, 11-17.
Publicado
19/07/2011
MUNIZ, Fernando A. M.; WATANABE, Willian M.; SCARTON, Carolina E.; ALUISIO, Sandra M.. Extração de Termos de Manuais Técnicos de Produtos Tecnológicos: uma Aplicação em Sistemas de Adaptação Textual. In: SEMINÁRIO INTEGRADO DE SOFTWARE E HARDWARE (SEMISH), 38. , 2011, Natal/RN. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2011 . p. 1293-1306. ISSN 2595-6205.