Avaliação de técnicas de aprendizado de máquina para classificação de seções de laudos de biópsia renal auxiliada pela terminologia DeCS

  • Flávia P. Nicolas UNIFESP
  • K. J. Abraham USP
  • Amanda R. Reis UNIFESP
  • Ivan T. Pisa UNIFESP
  • Evandro E. S. Ruiz USP

Resumo


A grande demanda por conhecimentos novos e a crescente disponibilidade de documentos digitalizados fazem do processamento de linguagem natural um recurso indispensável ao tratamento da informação. Este artigo descreve a utilização e avaliação de cinco técnicas de aprendizado de máquina na classificação de seções de laudos de biópsia renal escritos em texto livre, bem como o pré-processamento dos documentos e o reconhecimento de termos médicos usando a terminologia DeCS.

Referências

Uzuner Ö, South BR, Shen S, DuVall SL., 2010 i2b2/VA challenge on concepts, assertions, and relations in clinical text., J Am Med Inform Assoc. 2011 Sep-Oct;18(5):552-6.

Frunza O. e Inkpen D., Extraction of Disease-Treatment Semantic Relations from Biomedical Sentences, Proceedings of the 2010 Workshop on Biomedical Natural Language Processing, ACL 2010, pages 91–98,

Uppsala, Sweden, 15 July 2010 Caffé Maria Izabela, Perez Pedro Santoro, Baranauskas José Augusto. Avaliação do Algoritmo de Stacking em Dados Biomédicos. In: XI Workshop de Informática Médica, Anais do XXXI Congresso da Sociedade Brasileira de Computação, Natal, RN, 19-22 de julho de 2011.

Bodenreider, O. The Unified Medical Language System (UMLS): integrating biomedical terminology. Nucleic Acids Research, 32(suppl.1):D267–D270, January 2004.

Rink B, Harabagiu S, Roberts K., Automatic extraction of relations between medical concepts in clinical texts, J Am Med Inform Assoc. 2011 Sep-Oct;18(5):594-600.

Jiang M, Chen Y, Liu M, Rosenbloom ST, Mani S, Denny JC, Xu H., A study of machine-learning-based approaches to extract clinical entities and their assertions from discharge summaries, J Am Med Inform Assoc. 2011 Sep-Oct;18(5):601-6.

Patrick JD, Nguyen DH, Wang Y, Li M., A knowledge discovery and reuse pipeline for information extraction in clinical notes, J Am Med Inform Assoc. 2011 Sep-Oct;18(5):574-9.

Patel CO, Cimino JJ, Using semantic and structural properties of the Unified Medical Language System to discover potential terminological relationships, J Am Med Inform Assoc. 2009 May-Jun;16(3):346-53.

Porter MF. An algorithm for suffix stripping. Program: electronic library & information systems. 2006;40(3):211-218. DOI: 10.1108/00330330610681286.

Weiss SM, Indurkhya N, Predictive Data Mining: A Practical Guide, MK, San Francisco, CA, 1998.

Witten I. H, Frank E. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. San Francisco, 1999
Publicado
16/07/2012
NICOLAS, Flávia P.; ABRAHAM, K. J.; REIS, Amanda R.; PISA, Ivan T.; RUIZ, Evandro E. S.. Avaliação de técnicas de aprendizado de máquina para classificação de seções de laudos de biópsia renal auxiliada pela terminologia DeCS. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 12. , 2012, Curitiba/PR. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2012 . p. 208-211. ISSN 2763-8952.