Avaliação Empírica do Impacto da IA Generativa na Eficiência de Depuração de Algoritmos
Resumo
Este artigo investiga o impacto da Inteligência Artificial Generativa (IAG) na eficiência de depuração de programadores iniciantes e intermediários. Por meio de um experimento controlado com 20 participantes, comparou-se um grupo utilizando um assistente de IAG (Gemini) contra um grupo de controle (manual). As métricas incluíram tempo de implementação, tempo de depuração, complexidade ciclomática (medido por meio do Radon), taxa de sucesso e percepção subjetiva de dificuldade (via questionário pós-tarefa). Os resultados indicam que, embora a IAG reduza o tempo inicial de codificação em cerca de 67%, ela aumenta significativamente o tempo relativo gasto na depuração e a complexidade estrutural do código. Os achados sugerem um fenômeno de distanciamento cognitivo, entendido neste estudo como a redução do vínculo do programador com a lógica da solução quando a construção inicial do código é delegada à IAG, o que dificulta a compreensão e a correção de erros lógicos.
Referências
Carrie Anne Philbin. (2023). Exploring the Potential of Artificial Intelligence Program Generators in Computer Programming Education for Students. ACM Inroads 14, 3 (September 2023), 30–38. DOI: 10.1145/3610406.
Comanici, Gheorghe et al. (2025) Gemini 2.5: Pushing the frontier with advanced reasoning, multimodality, long context, and next generation agentic capabilities. arXiv preprint arXiv:2507.06261
Cotroneo, D., Improta, C. and Liguori, P. (2025) “Human-Written vs. AI-Generated Code: A Large-Scale Study of Defects, Vulnerabilities, and Complexity”, arXiv preprint, arXiv:2508.21634.
Hashmi, N. et al. (2024) “Generative AI's impact on programming students: frustration and confidence across learning styles”, Issues in Information Systems, 25(3), pp. 371385.
Kazemitabaar, M. et al. (2023) "Studying the effect of AI Code Generators on Supporting Novice Learners in Introductory Programming", In: CHI Conference on Human Factors in Computing Systems, Hamburg. ACM, pp. 1–23.
Licorish, S. A. et al. (2025) “Comparing Human and LLM Generated Code: The Jury is Still Out!”, arXiv preprint, arXiv:2501.16857.
McCabe, T. J. (1976). A complexity measure. IEEE Transactions on software Engineering, (4), 308-320.
Nguyen, N. and Nadi, S. (2022) “An Empirical Evaluation of GitHub Copilot’s Code Suggestions”, In: 19th International Conference on Mining Software Repositories (MSR), Pittsburgh. ACM, pp. 1–5.
Silva Junior, S. M. et al. (2023) “ChatGPT no auxílio da aprendizagem de programação: Um estudo de caso”, In: Anais do XXXIV Simpósio Brasileiro de Informática na Educação (SBIE), Passo Fundo. pp. 1375-1384.
Vaithilingam, P., Zhang, T. and Glassman, E. L. (2022) “Expectation vs. Experience: Evaluating the Usability of Code Generation Tools Powered by Large Language Models”, In: CHI Conference on Human Factors in Computing Systems, New Orleans. ACM, Article 332.
Velho, M. A. B. (2025) “Investigando o Impacto da Inteligência Artificial Generativa no Aprendizado em Programação”, Monografia de Conclusão de Curso. Universidade Federal do Rio Grande do Sul, Porto Alegre.
Yetiştiren, B., Özsoy, I., Ayerdem, M. and Tüzün, E. (2023) “Evaluating the Code Quality of AI-Assisted Code Generation Tools: An Empirical Study on GitHub Copilot, Amazon CodeWhisperer, and ChatGPT”, arXiv preprint, arXiv:2304.10778.
