A Construção de um Corpus para Detecção de Ironia e Sarcasmo em Português
Resumo
O português é uma língua com poucos recursos, onde poucos trabalhos desenvolvem e disponibilizam corpora para tarefas específicas de Processamento de Língua Natural, como detecção de sarcasmo e ironia, análise de sentimento e outras. Neste trabalho, nós desenvolvemos um corpus de sarcasmo e ironia para o Português. No futuro, pretendemos desenvolver uma ferramenta que reconheça sarcasmo e ironia e utilizar o corpus apresentado neste artigo.
Referências
Angrimani, D. (1994). Espreme que sai sangue: um estudo do sensacionalismo na imprensa, volume 47. Summus Editorial.
Cho, J. and Garcia-Molina, H. (1999). The evolution of the web and implications for an incremental crawler. Technical report, Stanford.
Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K., and Kuksa, P. (2011). Natural language processing (almost) from scratch. Journal of machine learning research, 12(ARTICLE):2493–2537.
Freitas, L. A., Vanin, A., Hogetop, D., Bochernitsan, M., and Vieira, R. (2014). Pathways for irony detection in tweets. In 29th Symposium on Applied Computing, pages 628– 633.
Ghanem, B., Karoui, J., Benamara, F., Moriceau, V., and Rosso, P. (2019). Idat at fire2019: Overview of the track on irony detection in arabic tweets. In Proceedings of the 11th Forum for Information Retrieval Evaluation, pages 10–13.
Lee, C. J. and Katz, A. N. (1998). The differential role of ridicule in sarcasm and irony. Metaphor and symbol, 13(1):1–15.
Misra, R. and Arora, P. (2019). Sarcasm detection using hybrid neural network. arXiv preprint arXiv:1908.07414.
Ortega-Bueno, R., Rangel, F., Hernández Farıas, D., Rosso, P., Montes-y Gómez, M., and Medina Pagola, J. E. (2019). Overview of the task on irony detection in spanish variants. In Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2019), co-located with 34th Conference of the Spanish Society for Natural Language Processing (SEPLN 2019). CEUR-WS. org.
Pang, B. and Lee, L. (2008). Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, 2:1–135.
Sardinha, T. B. (2000). Lingüı́stica de corpus: histórico e problemática. Delta: documentação de estudos em lingüı́stica teórica e aplicada, 16(2):323–367.
Silva, F. R. A. and Bonfante, A. G. (2018). Detecção de ironia e sarcasmo em lı́ngua tuguesa: uma abordagem utilizando deep learning. Monografia (Bacharel em Ciência da Computação), UFMG (Universidade Federal do Mato Grosso), Brasil.
Van Hee, C., Lefever, E., and Hoste, V. (2018). Semeval-2018 task 3: Irony detection in english tweets. In Proceedings of The 12th International Workshop on Semantic Evaluation, pages 39–50.
Amir, S., Wallace, B. C., Lyu, H., and Silva, P. C. M. J. (2016). Modelling context with user embeddings for sarcasm detection in social media. arXiv preprint arXiv:1607.00976.
Angrimani, D. (1994). Espreme que sai sangue: um estudo do sensacionalismo na imprensa, volume 47. Summus Editorial.
Cho, J. and Garcia-Molina, H. (1999). The evolution of the web and implications for an incremental crawler. Technical report, Stanford.
Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K., and Kuksa, P. (2011). Natural language processing (almost) from scratch. Journal of machine learning research, 12(ARTICLE):2493–2537.
Freitas, L. A., Vanin, A., Hogetop, D., Bochernitsan, M., and Vieira, R. (2014). Pathways for irony detection in tweets. In 29th Symposium on Applied Computing, pages 628– 633.
Ghanem, B., Karoui, J., Benamara, F., Moriceau, V., and Rosso, P. (2019). Idat at fire2019: Overview of the track on irony detection in arabic tweets. In Proceedings of the 11th Forum for Information Retrieval Evaluation, pages 10–13.
Lee, C. J. and Katz, A. N. (1998). The differential role of ridicule in sarcasm and irony. Metaphor and symbol, 13(1):1–15.
Misra, R. and Arora, P. (2019). Sarcasm detection using hybrid neural network. arXiv preprint arXiv:1908.07414.
Ortega-Bueno, R., Rangel, F., Hernández Farıas, D., Rosso, P., Montes-y Gómez, M., and Medina Pagola, J. E. (2019). Overview of the task on irony detection in spanish variants. In Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2019), co-located with 34th Conference of the Spanish Society for Natural Language Processing (SEPLN 2019). CEUR-WS. org.
Pang, B. and Lee, L. (2008). Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, 2:1–135.
Sardinha, T. B. (2000). Lingüı́stica de corpus: histórico e problemática. Delta: documentação de estudos em lingüı́stica teórica e aplicada, 16(2):323–367.
Silva, F. R. A. and Bonfante, A. G. (2018). Detecção de ironia e sarcasmo em lı́ngua tuguesa: uma abordagem utilizando deep learning. Monografia (Bacharel em Ciência da Computação), UFMG (Universidade Federal do Mato Grosso), Brasil.
Van Hee, C., Lefever, E., and Hoste, V. (2018). Semeval-2018 task 3: Irony detection in english tweets. In Proceedings of The 12th International Workshop on Semantic Evaluation, pages 39–50.