Descrição Automática de Imagens por Ia: Uma Leitura Ética e Representativa
Resumo
Introdução: A descrição automática de imagens por sistemas de inteligência artificial é essencial para a acessibilidade de pessoas com deficiência visual, mas pode reproduzir vieses e comprometer a representatividade. Objetivo: Analisar implicações éticas na geração de descrições, considerando apagamento identitário, viés racial, estereótipos de gênero e invisibilização da deficiência, usando ChatGPT e Gemini. Metodologia: Estudo qualitativo e exploratório com sete imagens contendo marcadores identitários, descritas pelos dois modelos e analisadas por conteúdo temático. Resultados: Algumas descrições, embora coerentes, apresentaram omissões, linguagem genérica e estereótipos, apontando a necessidade de diretrizes para descrições mais representativas e inclusivas.
Palavras-chave:
Descrição de imagem, Inteligência Artificial, Audiodecrição, Tecnologias assistivas
Referências
Adewumi, T., Alkhaled, L., Gurung, N., van Boven, G., e Pagliai, I. (2024). Fairness and bias in multimodal ai: A survey. [link]. Acesso em: 19 ago. 2025.
AlDahoul, N., Ibrahim, H., Park, M., Rahwan, T., e Zaki, Y. (2024). Inclusive content reduces racial and gender biases, yet non-inclusive content dominates popular culture. [link]. Acesso em: 19 ago. 2025.
Almeida, N. M. e Mazzoni, A. F. (2020). Design centrado na pessoa com deficiência: práticas inclusivas na criação de tecnologias assistivas. Revista Brasileira de Design da Informação (InfoDesign), 17(2):145–159.
Amazon (2023). Amazon rekognition. [link]. Acesso em: 19 ago. 2025.
Associação Brasileira de Normas Técnicas (2020). Nbr 9050:2020 – acessibilidade a edificações, mobiliário, espaços e equipamentos urbanos. [link]. Acesso em: 19 ago. 2025.
Baranauskas, M. C. C., Souza, C. S. d., e Pereira, R. (2024). I grandihc-br — grandes desafios de pesquisa em interação humano-computador no brasil. Technical report, Sociedade Brasileira de Computação, Porto Alegre. Comissão Especial de IHC da SBC. ISBN: 978-85-7669-287-4.
Bardin, L. (2016). Análise de conteúdo. Edições 70, Lisboa.
Bender, E. M., Gebru, T., McMillan-Major, A., e Shmitchell, S. (2021). On the dangers of stochastic parrots: Can language models be too big?.In Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, FAccT ’21, page 610–623, New York, NY, USA. Association for Computing Machinery.
Benjamin, R. (2019). Race after Technology: Abolitionist Tools for the New Jim Code. Polity Press, Oxford, England.
Birhane, A., Kenny, E., e Ziad, H. (2021). Multimodal ai and the challenge of identity representation. AI and Ethics, 1(4):431–437. Acesso em: 19 ago. 2025.
Birhane, A. e van Dijk, J. (2020). Robot rights? let’s talk about human welfare instead. In Proceedings of the AAAI/ACM Conference on AI, Ethics, and Society, pages 207–213, New York, NY, USA. Association for Computing Machinery.
Cerejeira, T. L. T. e Alves, J. F. (2022). Narração na audiodescrição por pessoas com deficiência visual: expandindo o campo profissional. Revista Educação e Cultura Contemporânea, 19(59):114–129. Acesso em: 19 ago. 2025.
Chen, M., Cao, Y., Zhang, Y., e Lu, C. (2024). Quantifying and mitigating unimodal biases in multimodal large language models: A causal perspective. [link]. Acesso em: 19 ago. 2025.
Coeckelbergh, M. (2020). Ética na Inteligência Artificial. Ubu Editora, São Paulo. D’Ignazio, C. e Klein, L. F. (2020). Data Feminism. The MIT Press.
Duarte, E. F., Palomino, P. T., Falcão, T. P., Porto, G. L., Portela, C., Ribeiro, D., Nascimento, A., Aguiar, Y. C., Souza, M., Gasparotto, A. M. S., e Toda, A. M. (2024). Grandihc-br 2025-2035 - gc6: Implications of artificial intelligence in hci: A discussion on paradigms, ethics, and diversity, equity and inclusion. In Anais do XXIII Simpósio Brasileiro sobre Fatores Humanos em Sistemas Computacionais, pages 1027–1045, Porto Alegre, RS, Brasil. SBC.
Eubanks, V. (2018). Automating Inequality: How High-Tech Tools Profile, Police, and Punish the Poor. St. Martin’s Press, New York.
Floridi, L., Cowls, J., Beltrametti, M., Chatila, R., Chazerand, P., Dignum, V., Lütge, C., Madelin, R., Pagallo, U., Rossi, F., Schafer, B., Valcke, P., e Vayena, E. (2018). Ai4people—an ethical framework for a good ai society: Opportunities, risks, principles, and recommendations. Minds and Machines, 28(4):689–707.
Google AI (2023). Gemini: A multimodal ai system. [link]. Acesso em: 12 maio 2025.
Google AI (2024). Audio description generator. [link]. Acesso em: 01 maio 2025.
IBM (2023). Ibm watson visual recognition. [link]. Acesso em: 07 ago. 2025.
Júnior, J. C. G., Campos, A. G. D., Araujo, F. D. S., Lindstron, J. A., Correa, L. A. S., Peres, M. A. D. S., e Neves, H. G. (2024). Avaliação crítica dos vieses algorítmicos em ferramentas de inteligência artificial utilizadas na educação inclusiva. Revista Ciências Humanas, 28(132):45–59. Acesso em: 10 maio 2025.
Korada, L., Sikha, V., e Siramgari, D. (2024). Ai & accessibility: A conceptual framework for inclusive technology. Zenodo, 12. Acesso em: 19 ago. 2025.
Lima, F. J., Guedes, L. C., e Guedes, M. C. (2010). Áudio-descrição: orientações para uma prática sem barreiras atitudinais. Revista Brasileira de Tradução Visual - RBTV, 2. Acesso em: 19 ago. 2025.
Mianes, F. L. S. e Baierle, M. (2012). De espectador a protagonista: a pessoa com deficiência visual como consultora em audiodescrição. Revista Brasileira de Tradução Visual, 12(12). 54-68.
Microsoft Corporation (2022). Serviços de integração do chatgpt no microsoft azure openai service. [link]. Acesso em: 07 ago. 2025.
Neves, J. (2022). Translation and accessibility... the translation of everyday things. In Zanettin, F. e Rundle, C., editors, Routledge Handbook of Translation and Methodology, pages 441–456. Routledge/Taylor and Francis, London and New York.
Noble, S. U. (2018). Algorithms of Oppression: How Search Engines Reinforce Racism. New York University Press, New York.
OpenAI (2025). Chatgpt (versão de maio. 2025). [link]. Acesso em: 14 maio 2025.
Pexels (2024). Sobre o pexels. [link]. Acesso em: 29 mar. 2025.
Pixabay (2024). Termos de serviço. [link]. Acesso em: 29 mar. 2025.
Prabhu, V. U. e Birhane, A. (2020). Large image datasets: A pyrrhic win for computer vision? [link]. Acesso em: 19 ago. 2025.
Santos, S. e Cavalcante, T. (2020). Acessibilidade e audiodescrição: Um olhar para a aprendizagem dos estudantes com deficiÊncia visual. Educação: Teoria e Prática, 30:1–19.
Silva, J. e Rocha, J. (2025). Acessibilidade de usuários com deficiência visual: análise da audiodescrição em periódicos. Biblios Journal of Librarianship and Information Science, 1:1–21. Acesso em: 19 ago. 2025.
UNESCO (2021). Recommendation on the ethics of artificial intelligence. Technical report, UNESCO, Paris. Aprovada em nov. 2021. Acesso em: 19 ago. 2025.
Venkit, P. N., Srinath, M., e Wilson, S. (2023). Automated ableism: An exploration of explicit disability biases in sentiment and toxicity analysis models. [link]. Acesso em: 19 ago. 2025.
W3C (2018). Accessibility requirements for people with low vision. [link]. Acesso em: 29 mar. 2025.
West, S. M., Whittaker, M., e Crawford, K. (2019). Discriminating systems: Gender, race and power in ai. Technical report, AI Now Institute, New York. Acesso em: 19 ago. 2025.
AlDahoul, N., Ibrahim, H., Park, M., Rahwan, T., e Zaki, Y. (2024). Inclusive content reduces racial and gender biases, yet non-inclusive content dominates popular culture. [link]. Acesso em: 19 ago. 2025.
Almeida, N. M. e Mazzoni, A. F. (2020). Design centrado na pessoa com deficiência: práticas inclusivas na criação de tecnologias assistivas. Revista Brasileira de Design da Informação (InfoDesign), 17(2):145–159.
Amazon (2023). Amazon rekognition. [link]. Acesso em: 19 ago. 2025.
Associação Brasileira de Normas Técnicas (2020). Nbr 9050:2020 – acessibilidade a edificações, mobiliário, espaços e equipamentos urbanos. [link]. Acesso em: 19 ago. 2025.
Baranauskas, M. C. C., Souza, C. S. d., e Pereira, R. (2024). I grandihc-br — grandes desafios de pesquisa em interação humano-computador no brasil. Technical report, Sociedade Brasileira de Computação, Porto Alegre. Comissão Especial de IHC da SBC. ISBN: 978-85-7669-287-4.
Bardin, L. (2016). Análise de conteúdo. Edições 70, Lisboa.
Bender, E. M., Gebru, T., McMillan-Major, A., e Shmitchell, S. (2021). On the dangers of stochastic parrots: Can language models be too big?.In Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, FAccT ’21, page 610–623, New York, NY, USA. Association for Computing Machinery.
Benjamin, R. (2019). Race after Technology: Abolitionist Tools for the New Jim Code. Polity Press, Oxford, England.
Birhane, A., Kenny, E., e Ziad, H. (2021). Multimodal ai and the challenge of identity representation. AI and Ethics, 1(4):431–437. Acesso em: 19 ago. 2025.
Birhane, A. e van Dijk, J. (2020). Robot rights? let’s talk about human welfare instead. In Proceedings of the AAAI/ACM Conference on AI, Ethics, and Society, pages 207–213, New York, NY, USA. Association for Computing Machinery.
Cerejeira, T. L. T. e Alves, J. F. (2022). Narração na audiodescrição por pessoas com deficiência visual: expandindo o campo profissional. Revista Educação e Cultura Contemporânea, 19(59):114–129. Acesso em: 19 ago. 2025.
Chen, M., Cao, Y., Zhang, Y., e Lu, C. (2024). Quantifying and mitigating unimodal biases in multimodal large language models: A causal perspective. [link]. Acesso em: 19 ago. 2025.
Coeckelbergh, M. (2020). Ética na Inteligência Artificial. Ubu Editora, São Paulo. D’Ignazio, C. e Klein, L. F. (2020). Data Feminism. The MIT Press.
Duarte, E. F., Palomino, P. T., Falcão, T. P., Porto, G. L., Portela, C., Ribeiro, D., Nascimento, A., Aguiar, Y. C., Souza, M., Gasparotto, A. M. S., e Toda, A. M. (2024). Grandihc-br 2025-2035 - gc6: Implications of artificial intelligence in hci: A discussion on paradigms, ethics, and diversity, equity and inclusion. In Anais do XXIII Simpósio Brasileiro sobre Fatores Humanos em Sistemas Computacionais, pages 1027–1045, Porto Alegre, RS, Brasil. SBC.
Eubanks, V. (2018). Automating Inequality: How High-Tech Tools Profile, Police, and Punish the Poor. St. Martin’s Press, New York.
Floridi, L., Cowls, J., Beltrametti, M., Chatila, R., Chazerand, P., Dignum, V., Lütge, C., Madelin, R., Pagallo, U., Rossi, F., Schafer, B., Valcke, P., e Vayena, E. (2018). Ai4people—an ethical framework for a good ai society: Opportunities, risks, principles, and recommendations. Minds and Machines, 28(4):689–707.
Google AI (2023). Gemini: A multimodal ai system. [link]. Acesso em: 12 maio 2025.
Google AI (2024). Audio description generator. [link]. Acesso em: 01 maio 2025.
IBM (2023). Ibm watson visual recognition. [link]. Acesso em: 07 ago. 2025.
Júnior, J. C. G., Campos, A. G. D., Araujo, F. D. S., Lindstron, J. A., Correa, L. A. S., Peres, M. A. D. S., e Neves, H. G. (2024). Avaliação crítica dos vieses algorítmicos em ferramentas de inteligência artificial utilizadas na educação inclusiva. Revista Ciências Humanas, 28(132):45–59. Acesso em: 10 maio 2025.
Korada, L., Sikha, V., e Siramgari, D. (2024). Ai & accessibility: A conceptual framework for inclusive technology. Zenodo, 12. Acesso em: 19 ago. 2025.
Lima, F. J., Guedes, L. C., e Guedes, M. C. (2010). Áudio-descrição: orientações para uma prática sem barreiras atitudinais. Revista Brasileira de Tradução Visual - RBTV, 2. Acesso em: 19 ago. 2025.
Mianes, F. L. S. e Baierle, M. (2012). De espectador a protagonista: a pessoa com deficiência visual como consultora em audiodescrição. Revista Brasileira de Tradução Visual, 12(12). 54-68.
Microsoft Corporation (2022). Serviços de integração do chatgpt no microsoft azure openai service. [link]. Acesso em: 07 ago. 2025.
Neves, J. (2022). Translation and accessibility... the translation of everyday things. In Zanettin, F. e Rundle, C., editors, Routledge Handbook of Translation and Methodology, pages 441–456. Routledge/Taylor and Francis, London and New York.
Noble, S. U. (2018). Algorithms of Oppression: How Search Engines Reinforce Racism. New York University Press, New York.
OpenAI (2025). Chatgpt (versão de maio. 2025). [link]. Acesso em: 14 maio 2025.
Pexels (2024). Sobre o pexels. [link]. Acesso em: 29 mar. 2025.
Pixabay (2024). Termos de serviço. [link]. Acesso em: 29 mar. 2025.
Prabhu, V. U. e Birhane, A. (2020). Large image datasets: A pyrrhic win for computer vision? [link]. Acesso em: 19 ago. 2025.
Santos, S. e Cavalcante, T. (2020). Acessibilidade e audiodescrição: Um olhar para a aprendizagem dos estudantes com deficiÊncia visual. Educação: Teoria e Prática, 30:1–19.
Silva, J. e Rocha, J. (2025). Acessibilidade de usuários com deficiência visual: análise da audiodescrição em periódicos. Biblios Journal of Librarianship and Information Science, 1:1–21. Acesso em: 19 ago. 2025.
UNESCO (2021). Recommendation on the ethics of artificial intelligence. Technical report, UNESCO, Paris. Aprovada em nov. 2021. Acesso em: 19 ago. 2025.
Venkit, P. N., Srinath, M., e Wilson, S. (2023). Automated ableism: An exploration of explicit disability biases in sentiment and toxicity analysis models. [link]. Acesso em: 19 ago. 2025.
W3C (2018). Accessibility requirements for people with low vision. [link]. Acesso em: 29 mar. 2025.
West, S. M., Whittaker, M., e Crawford, K. (2019). Discriminating systems: Gender, race and power in ai. Technical report, AI Now Institute, New York. Acesso em: 19 ago. 2025.
Publicado
08/09/2025
Como Citar
ROSSETTI, Julia M.; BORGES, Luciana C. L. F.; DE SOUZA, Patricia C..
Descrição Automática de Imagens por Ia: Uma Leitura Ética e Representativa. In: SIMPÓSIO BRASILEIRO SOBRE FATORES HUMANOS EM SISTEMAS COMPUTACIONAIS (IHC), 24. , 2025, Belo Horizonte/MG.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 1608-1628.
DOI: https://doi.org/10.5753/ihc.2025.10934.
