Detecção Automática de Clímax em Produções de Textos Narrativos


A correção automática de redações é um problema que vem sendo bastante explorado nos últimos anos. Um dos aspectos mais desafiadores nessa tarefa é avaliação do nível de domínio do aluno quanto aos mais variados tipos de estruturas textuais. A estrutura narrativa é um caso especialmente complexo devido ao seu caráter extremamente subjetivo. Trabalhos anteriores na área de correção textual, não abordaram o problema de automatizar a avaliação do nível de competência do aluno na escrita de narrativas. Este trabalho investiga o uso de algoritmos de aprendizagem de máquina para a detecção de clímax em redações em Português como um passo inicial na resolução do problema de correção automática de textos narrativos. Três algoritmos de classificação tradicionais, o support vector machine, floresta aleatória e descida de gradiente estocástica, foram aplicados em um conjunto de dados anotado traduzido para o Português. Os algoritmos foram avaliados em termos de precisão, revocação e pontuação F1, sendo a floresta aleatória o algoritmo de melhor desempenho. Além disso, foi realizado uma análise dos atributos envolvidos, e os experimentos mostraram que os melhores resultados são obtidos ao combinar-se atributos tanto do Coh-Metrix quanto do LIWC.
Palavras-chave: Aprendizado de Máquina, PLN, Classificação Textual


BATISTA, Hyan H. N.; BARBOSA, Gabriel A.; MIRANDA, Péricles; SANTOS, Jário; ISOTANI, Seiji; CORDEIRO, Thiago; BITTENCOURT, Ig Ibert; FERREIRA MELLO, Rafael. Detecção Automática de Clímax em Produções de Textos Narrativos. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 33. , 2022, Manaus. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 932-943. DOI: