Coleta, composição e etapas de pré-processamento de corpus: procedimentos para a anotação multimodal da FrameNet Brasil

Resumo


Este trabalho apresenta a preparação de um corpus voltado para a anotação multimodal na FrameNet Brasil. A anotação, desenvolvida a partir da teoria da Semântica de Frames, permite a integração de diferentes modos comunicativos, construindo uma base de tecnologia linguística aplicável a múltiplas áreas. As etapas de coleta, composição e pré-processamento do corpus são os primeiros passos para o desenvolvimento das pesquisas de anotação multimodal.

Palavras-chave: Anotação multimodal, FrameNet Brasil, Semântica de Frames, Audiodescrição, Corpora, Pré-processamento

Referências

Aluísio, S. M. e Almeida, G. M. de B. (2021). “O que é e como se constrói um corpus? Lições aprendidas na compilação de vários corpora para pesquisa linguística”, Calidoscópio, 4(3), p. 156–178. Disponível em: [link]. Acesso em: 1 de jul. 2023.

Belcavello, F., Viridiano, M., Matos, E. E. d. S., e Torrent, T. T. (2022). Charon: a FrameNet Annotation Tool for Multimodal Corpora. In Proceedings of the 16th Linguistic Annotation Workshop, páginas 91–96, Marseille, France, June. European Language Resources Association (ELRA). Disponível em: [link]. Acesso em: 28 de jun. 2023.

Charon [FNBr]. Disponível em: https://charon.frame.net.br/ Acesso em: 21 de jun. 2023.

Fillmore, C. J. Semântica de Frames. In Cadernos de Tradução. Porto Alegre, nº 25, jul-dez, 2009.

Pety; As Aventuras de. Direção: Anahí Borges. Produção:Anahí Borges. YouTube. 16 de jun. 2021. 14 min. Disponível em: https://www.youtube.com/watch?v=h0TbaPIDkFI. Acesso em: 21 de jun. 2023.

Torrent T. T., Matos E.E. dos S., Belcavello F., Viridiano M., Gamonal M.A., Costa A.D. da, e Marim M.C. (2022). Representing Context in FrameNet: A Multidimensional, Multimodal Approach. Front. Psychol.

Webtool [FNBr]. Disponível em: https://webtool.framenetbr.ufjf.br/. Acesso em: 21 de jun. 2023.

Xiao, Richard. Empirical and Statistical Approaches. In: Handbook of Natural Language Processing. Nova York, 2ª Edição, 2010, p. 161.
Publicado
25/09/2023
SILVA, Anna Beatriz C.; RABELO, Iasmin; OLIVEIRA, Igor M.; SOUZA, Mariana; GAMONAL, Maucha; ROZA, Raquel. Coleta, composição e etapas de pré-processamento de corpus: procedimentos para a anotação multimodal da FrameNet Brasil. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 14. , 2023, Belo Horizonte/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 362-366. DOI: https://doi.org/10.5753/stil.2023.234126.