Meta aprendizado aplicado ao câncer de mama
Resumo
Dentre as técnicas para auxiliar no processo de detecção de doenças, podemos citar a Classificação, que consiste em rotular uma instância baseada nas categorias já conhecidas do problema investigado. Nesta proposta, consideramos a detecção do câncer de mama como um problema de Classificação. Usamos Sistemas de Múltiplos Classificadores, para gerar diversos classificadores, funcionando como especialistas computacionais análoga a consulta com diversos especialistas da área da saúde. A partir da opinião dos especialistas foi criada uma metabase do problema, que, ao ser tratada como um novo problema de classificação, permitiu avaliar padrões nas opiniões que afetam o acerto na rotulação. A proposta tem aumentado o acerto de outras técnicas da literatura considerando a média em ≈ 15 pontos percentuais.Referências
Aggarwal, C. C. (2015). Data Mining: The Textbook. Springer Publishing Company, Incorporated.
Bashbaghi., S., Granger., E., Sabourin., R., and Bilodeau., G. (2017). Dynamic selection of exemplar-svms for watch-list screening through domain adaptation. In Proceedings of the 6th International Conference on Pattern Recognition Applications and Methods - Volume 1: ICPRAM,, pages 738-745. INSTICC, SciTePress. https://doi.org/10.5220/0006256507380745.
Brazdil, P., Giraud-Carrier, C., Soares, C., and Vilalta, R. (2009). Metalearning - Applications to Data Mining. Springer.
Breiman, L. (1996). Bagging predictors. Machine Learning, 24(2):123-140. https://tinyurl.com/ycr4yagn.
Brun, A. L., Britto, A. S., Oliveira, L. S., Enembreck, F., and Sabourin, R. (2018). A framework for dynamic classifier selection oriented by the classification problem difficulty. Pattern Recognition, 76:175 - 190. https://doi.org/10.1016/j.patcog.2017.10.038.
Cruz, R., Sabourin, R., and Cavalcanti, G. (2018). Dynamic classifier selection: Recent advances and perspectives. Information Fusion, 41. https://doi.org/10.1016/j.inffus.2017.09.010.
da Silva Borges, Z., Wehrmeister, F. C., Gomes, A. P., and Gonçalves, H. (2016). Exame clínico das mamas e mamografia: desigualdades nas regiões sul e nordeste do brasil. Revista Brasileira de Epidemiologia [online], 19:1-13. https://doi.org/10.1590/1980-5497201600010001.
Dua, D. and Graff, C. (2019). UCI machine learning repository. http://archive.ics.uci.edu/ml.
Ferrari, D. G. (2014). Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem. PhD thesis, Engenharia Elétrica, São Paulo, Brasil. http://tede.mackenzie.br/jspui/handle/tede/1523.
Freund, Y. and Shapire, R. E. (1999). Large margin classification using the perceptron algorithm. Machine Learning, 37:277-296.
Fusco, R., Sansone, M., Filice, S., Carone, G., Amato, D. M., Sansone, C., and Petrillo, A. (2016). Pattern recognition approaches for breast cancer dce-mri classification: A systematic review. Journal of Medical and Biological Engineering, 36:449-459. https://doi.org/10.1007/s40846-016-0163-7.
IARC, I. A. f. R. o. C. (2020). Cancer today. https://gco.iarc.fr/today/home.
Liu, X., Wang, X., and Matwin, S. (2018). Interpretable deep convolutional neural networks via meta-learning. In 2018 International Joint Conference on Neural Networks (IJCNN), pages 1-9. https://doi.org/10.1109/IJCNN.2018.8489172.
Mattos, J. S. C., Caleffi, M., and Vieira, R. A. C. (2013). Rastreamento mamográfico no brasil: Resultados preliminares. Revista Brasileira de Mastologia, 23(1):22-27. https://tinyurl.com/y6w9c7cf.
Ministério da Saúde (2022). Prevenção do câncer feminino: Pesquisa do ministério da saúde revela aumento de exames de mamografia nos últimos 13 anos. Technical report. Murphy, K. P. (2012). Machine Learning: A Probabilistic Perspective. The MIT Press, Massachusetts, MA, USA.
Nagi, S. and Bhattacharyya, D. K. (2013). Classification of microarray cancer data using ensemble approach. Network Modeling Analysis in Health Informatics and Bioinformatics, 2:159-173. https://doi.org/10.1007/s13721-013-0034-x.
Prudêncio, R. B. C. and Ludermir, T. B. (2007). Aprendizagem ativa para seleção de exemplos em meta-aprendizado. In VI Encontro Nacional de Inteligência Artificial (ENIA), pages 1032-1041. https://www.cin.ufpe.br/rbcp/papers/ENIA07a.pdf.
Rosenblatt, F. F. (1958). The perceptron: a probabilistic model for information storage and organization in the brain. Psychological review, 65(6):386-408. https://tinyurl.com/y2dz6oph.
Silva, R. A. (2018). Uso da centralidade de redes complexas na combinação e na seleção de classificadores. PhD thesis, Pontifícia Universidade Católica do Paraná, Programa de Pós-graduação em Informática, Curitiba, Brasil. https://tinyurl.com/y94p6bcq.
Silva, R. A., Britto Jr, A. d. S., Enembreck, F., Sabourin, R., and de Oliveira, L. E. S. (2020). CSBF: A static ensemble fusion method based on the centrality score of complex networks. Computational Intelligence, 36(2):522-556. https://doi.org/10.1111/coin.12249.
Souza, B. F. (2010). Meta-aprendizagem aplicada à classificação de dados de expressão gênica. PhD thesis, Ciências da Computação e Matemática Computacional, São Carlos, Brasil. https://tinyurl.com/y8e2wa4q.
Tabár, L., Dean, P. B., Chen, T. H.-H., Yen, A. M.-F., Chen, S. L.-S., Fann, J. C.-Y., Chiu, S. Y.-H., Ku, M. M.-S., Wu, W. Y.-Y., Hsu, C.-Y., Chen, Y.-C., Beckmann, K., Smith, R. A., and Duffy, S. W. (2019). The incidence of fatal breast cancer measures the increased effectiveness of therapy in women participating in mammography screening. Cancer, 125(4):515-523.
Whalen, S. and Pandey, G. (2013). A comparative analysis of ensemble classifiers: Case studies in genomics. The IEEE 13th International Conference on Data Mining (ICDM). https://doi.org/10.1109/ICDM.2013.21.
Bashbaghi., S., Granger., E., Sabourin., R., and Bilodeau., G. (2017). Dynamic selection of exemplar-svms for watch-list screening through domain adaptation. In Proceedings of the 6th International Conference on Pattern Recognition Applications and Methods - Volume 1: ICPRAM,, pages 738-745. INSTICC, SciTePress. https://doi.org/10.5220/0006256507380745.
Brazdil, P., Giraud-Carrier, C., Soares, C., and Vilalta, R. (2009). Metalearning - Applications to Data Mining. Springer.
Breiman, L. (1996). Bagging predictors. Machine Learning, 24(2):123-140. https://tinyurl.com/ycr4yagn.
Brun, A. L., Britto, A. S., Oliveira, L. S., Enembreck, F., and Sabourin, R. (2018). A framework for dynamic classifier selection oriented by the classification problem difficulty. Pattern Recognition, 76:175 - 190. https://doi.org/10.1016/j.patcog.2017.10.038.
Cruz, R., Sabourin, R., and Cavalcanti, G. (2018). Dynamic classifier selection: Recent advances and perspectives. Information Fusion, 41. https://doi.org/10.1016/j.inffus.2017.09.010.
da Silva Borges, Z., Wehrmeister, F. C., Gomes, A. P., and Gonçalves, H. (2016). Exame clínico das mamas e mamografia: desigualdades nas regiões sul e nordeste do brasil. Revista Brasileira de Epidemiologia [online], 19:1-13. https://doi.org/10.1590/1980-5497201600010001.
Dua, D. and Graff, C. (2019). UCI machine learning repository. http://archive.ics.uci.edu/ml.
Ferrari, D. G. (2014). Seleção de algoritmos para a tarefa de agrupamento de dados: uma abordagem via meta-aprendizagem. PhD thesis, Engenharia Elétrica, São Paulo, Brasil. http://tede.mackenzie.br/jspui/handle/tede/1523.
Freund, Y. and Shapire, R. E. (1999). Large margin classification using the perceptron algorithm. Machine Learning, 37:277-296.
Fusco, R., Sansone, M., Filice, S., Carone, G., Amato, D. M., Sansone, C., and Petrillo, A. (2016). Pattern recognition approaches for breast cancer dce-mri classification: A systematic review. Journal of Medical and Biological Engineering, 36:449-459. https://doi.org/10.1007/s40846-016-0163-7.
IARC, I. A. f. R. o. C. (2020). Cancer today. https://gco.iarc.fr/today/home.
Liu, X., Wang, X., and Matwin, S. (2018). Interpretable deep convolutional neural networks via meta-learning. In 2018 International Joint Conference on Neural Networks (IJCNN), pages 1-9. https://doi.org/10.1109/IJCNN.2018.8489172.
Mattos, J. S. C., Caleffi, M., and Vieira, R. A. C. (2013). Rastreamento mamográfico no brasil: Resultados preliminares. Revista Brasileira de Mastologia, 23(1):22-27. https://tinyurl.com/y6w9c7cf.
Ministério da Saúde (2022). Prevenção do câncer feminino: Pesquisa do ministério da saúde revela aumento de exames de mamografia nos últimos 13 anos. Technical report. Murphy, K. P. (2012). Machine Learning: A Probabilistic Perspective. The MIT Press, Massachusetts, MA, USA.
Nagi, S. and Bhattacharyya, D. K. (2013). Classification of microarray cancer data using ensemble approach. Network Modeling Analysis in Health Informatics and Bioinformatics, 2:159-173. https://doi.org/10.1007/s13721-013-0034-x.
Prudêncio, R. B. C. and Ludermir, T. B. (2007). Aprendizagem ativa para seleção de exemplos em meta-aprendizado. In VI Encontro Nacional de Inteligência Artificial (ENIA), pages 1032-1041. https://www.cin.ufpe.br/rbcp/papers/ENIA07a.pdf.
Rosenblatt, F. F. (1958). The perceptron: a probabilistic model for information storage and organization in the brain. Psychological review, 65(6):386-408. https://tinyurl.com/y2dz6oph.
Silva, R. A. (2018). Uso da centralidade de redes complexas na combinação e na seleção de classificadores. PhD thesis, Pontifícia Universidade Católica do Paraná, Programa de Pós-graduação em Informática, Curitiba, Brasil. https://tinyurl.com/y94p6bcq.
Silva, R. A., Britto Jr, A. d. S., Enembreck, F., Sabourin, R., and de Oliveira, L. E. S. (2020). CSBF: A static ensemble fusion method based on the centrality score of complex networks. Computational Intelligence, 36(2):522-556. https://doi.org/10.1111/coin.12249.
Souza, B. F. (2010). Meta-aprendizagem aplicada à classificação de dados de expressão gênica. PhD thesis, Ciências da Computação e Matemática Computacional, São Carlos, Brasil. https://tinyurl.com/y8e2wa4q.
Tabár, L., Dean, P. B., Chen, T. H.-H., Yen, A. M.-F., Chen, S. L.-S., Fann, J. C.-Y., Chiu, S. Y.-H., Ku, M. M.-S., Wu, W. Y.-Y., Hsu, C.-Y., Chen, Y.-C., Beckmann, K., Smith, R. A., and Duffy, S. W. (2019). The incidence of fatal breast cancer measures the increased effectiveness of therapy in women participating in mammography screening. Cancer, 125(4):515-523.
Whalen, S. and Pandey, G. (2013). A comparative analysis of ensemble classifiers: Case studies in genomics. The IEEE 13th International Conference on Data Mining (ICDM). https://doi.org/10.1109/ICDM.2013.21.
Publicado
11/04/2023
Como Citar
TONIDANDEL, Pedro Henrique; SILVA, Ronan Assumpção; BRUN, André Luiz.
Meta aprendizado aplicado ao câncer de mama. In: ESCOLA REGIONAL DE BANCO DE DADOS (ERBD), 18. , 2023, Palmas/PR.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2023
.
p. 90-99.
ISSN 2595-413X.
DOI: https://doi.org/10.5753/erbd.2023.229501.