Análise de Padrões e Associações em Crimes Relacionados à Violência Contra Mulheres Utilizando Word2Vec para Processamento em Linguagem Natural
Resumo
O modelo Word2Vec usa palavras de textos para criar representações vetoriais contínuas denominadas word embeddings, considerando o contexto e gerando vetores semelhantes para palavras que compartilham contextos em comum. Com aplicações variadas, como tradução e análise de sentimentos, o Word2Vec foi aplicado para analisar boletins de crimes contra mulheres. O objetivo era identificar associações entre palavras revelando detalhes sobre tipos de violência, agressores e padrões de vitimização. Usando amostras como ameaça, assédio sexual, stalking, calúnia e difamação, o modelo treinado aprendeu que a palavra mulher aparece frequentemente com as palavras violência, marido e merece em um determinado contexto, permitindo uma compreensão das circunstâncias em que essas palavras são usadas.
Referências
DECRETO Nº 1.973, DE 1º DE AGOSTO DE 1996. Promulga a Convenção Interamericana para Prevenir, Punir e Erradicar a Violência contra a Mulher, concluída em Belém do Pará, em 9 de junho de 1994.
Engel, Cíntia Liara. A Violência Contra a Mulher. IPEA, 2022.
Ferreira, S. M. et al. (2020). Violência contra a mulher na perspectiva do ciclo vital: um estudo com mulheres em situação de violência doméstica. Estudos de Psicologia (Campinas), 37, e190107.
Mikolov, T., Yih, W.-T., and Zweig, G. 2013c. Linguistic regularities in continuous space word representations. NAACL HLT 2013.
MIKOLOV, T. et al. Efficient estimation of word representations in vector space. In: ICLR, 2013a. Disponível em: [link].
Zhang, Aston; C. Lipton, Zachary; LI, Mu; J. Smola, Alexander. Dive into Deep Learning. 1ª Edição. ed. atual. [S. l.: s. n.], 2019. E-book.