Análise comparativa da classificação de comentários sobre pessoas trans no YouTube usando grandes modelos de linguagem

Vitor Lucio Giorgio Cardoso de Carvalho; Silas Lima Filho

doi:10.5753/brasnam.2026.23730

Vitor Lucio Giorgio Cardoso de Carvalho UFRJ https://orcid.org/0009-0006-1943-859X
Silas Lima Filho UFRJ https://orcid.org/0000-0002-5611-7297

DOI: https://doi.org/10.5753/brasnam.2026.23730

Resumo

Este artigo compara quatro abordagens para a classificação de comentários do YouTube direcionados a pessoas trans: um classificador tradicional, uma LLM em zero-shot, uma LLM em few-shot e uma LLM com Geração Aumentada por Recuperação (RAG). Com base em comentários anotados manualmente, o estudo analisa desempenho global, comportamento por classe e padrões recorrentes de erro. Os resultados mostram que a estratégia few-shot apresentou o melhor equilíbrio entre as classes, enquanto o RAG trouxe ganhos limitados no cenário avaliado.

Referências

Brasil. Secretaria de Comunicação Social (2024). População do brasil chega a 212,6 milhões de habitantes, aponta ibge. 29 ago. 2024. Atualizado em 30 ago. 2024. Disponível em: [link]. Acesso em: 29 mar. 2026.

Chakravarthi, B. R. (2024). Detection of homophobia and transphobia in youtube comments. International Journal of Data Science and Analytics, 18:49–68. Disponível em: [link]. Acesso em: 16 maio 2026.

Comunica Que Muda (2016). Dossiê intolerâncias: visíveis e invisíveis no mundo digital. São Paulo: Nova/sb. Disponível em: [link]. Acesso em: 29 mar. 2026.

Murakami, L. (2020). Detecção automática de discurso de ódio online: a transfobia no twitter. In Encontro Virtual da ABCiber. Disponível em: [link]. Acesso em: 29 mar. 2026.

Narcisa, T. and Bonets, V. (2025). Brasil é o país que mais mata pessoas trans e travestis, aponta dossiê. CNN Brasil, Belém, 27 jan. 2025. Atualizado em 11 abr. 2025. Disponível em: [link]. Acesso em: 29 mar. 2026.

Olivert-Iserte, M., Serras, F., Civit, M., and Gonzàlez-Agirre, A. (2025). Pld at homo-lat 2025: Enhancing dialectal sentiment analysis through contextual retrieval and translation. In Proceedings of HOMO-LAT 2025, volume 4098 of CEUR Workshop Proceedings. Disponível em: [link]. Acesso em: 16 maio 2026.

Ortiz-Ospina, E. (2019). A ascensão das mídias sociais. Our World in Data. Disponível em: [link]. Acesso em: 29 mar. 2026.

Prasannan, P., Kumaresan, P. K., Rajiakodi, S., Subalalitha, C. N., and Chakravarthi, B. R. (2025). Counter-speech generation for homophobic and transphobic social media content in malayalam. Social Network Analysis and Mining, 15:87. Disponível em: [link]. Acesso em: 16 maio 2026.

Tornisiello, V. R. (2024). Explorando llms abertos para classificação de discurso de ódio em jogos online. 60 p. Monografia (MBA em Inteligência Artificial e Big Data). Disponível em: [link]. Acesso em: 29 mar. 2026.

Análise comparativa da classificação de comentários sobre pessoas trans no YouTube usando grandes modelos de linguagem

Resumo

Referências

Artigos mais lidos do(s) mesmo(s) autor(es)