Criação e Anotação do corpus de resumos científicos de Ciências Sociais Aplicadas
Resumo
Com o crescente interesse e necessidade na criação de ferramentas (semi)automáticas que auxiliem o processo de letramento em gêneros textuais acadêmicos, apresentamos neste trabalho o corpus de resumos científicos em ciências sociais aplicadas. Nosso objetivo foi estudar, a nível sentencial, a estrutura retórica dos resumos das áreas de Administração Pública, Contabilidade e Economia, com base na tipologia proposta na literatura, por meio da ferramenta de anotação de corpus WebAnno. Tivemos como resultado, (i) a organização de um conjunto de 200 textos, (ii) o estudo preliminar da estrutura retórica das referidas áreas e (iii) a produção de um manual de anotação com diretrizes específicas sobre a identificação da estrutura retórica dos resumos científicos.Referências
Antiqueira, L., Feltrim, V. D., & Nunes, M. D. G. V. (2003). Projeto e implementação do sistema SciPo. São Carlos, Brasil. Série de Relatórios Técnicos do Instituto de Ciências Matemáticas e de Computação (nº 223).
Bakhtin, M., & Volochinov, V. N. (2006). Marxismo e filosofia da linguagem (Vol. 7). São Paulo: Hucitec.
Castilho, R.E., Mujdricza-Maydt, E., Yimam, S. M., Hartmann, S., Gurevych, I., Frank, A., Biemann, C. (2016). A web-based tool for the integrated annotation of semantic and syntactic structures. Em Proceedings of the workshop on language technology resources and tools for digital humanities (LT4DH) (pp. 76-84).
Feltrim, V. D., Pelizzoni, J. M., Teufel, S., Nunes, M. D. G. V., & Aluísio, S. M. (2004). Applying argumentative zoning in an automatic critiquer of academic writing. Em Brazilian Symposium on Artificial Intelligence (pp. 214-223). Springer, Berlin, Heidelberg.
Feltrim, V.D. (2004). Uma abordagem baseada em corpus e em sistemas de crítica para a construção de ambientes web de auxílio à escrita acadêmica em português. Universidade de São Paulo, São Carlos, Brasil. Tese de Doutorado.
Hovy, E., & Lavid, J. (2010). Towards a ‘science’of corpus annotation: a new methodological challenge for corpus linguistics. International journal of translation, 22(1), 13-36.
Iriguti, A. H., & Feltrim, V. D. (2019). Avaliando atributos para a classificação de estrutura retórica em resumos científicos. Linguamática, 11(1), pp.41-53.
Marcuschi, L. A. (2002). Gêneros textuais: definição e funcionalidade. Gêneros textuais e ensino, 2, pp.19-36.
Pustejovsky, J., & Stubbs, A. (2012). Natural Language Annotation for Machine Learning: A guide to corpus-building for applications. O'Reilly Media.
Sardinha, T. B. (2004). Linguística de corpus. Barueri/SP: Manole Ltda.
Stenetorp, P., Pyysalo, S., Topic, G., Ohta, T., Ananiadou, S., & Tsujii, J. I. (2012). BRAT: a web-based tool for NLP-assisted text annotation. Em Proceedings of the Demonstrations at the 13th Conference of the European Chapter of the Association for Computational Linguistics (pp. 102-107).
Teufel, S. & Marc, M. (2002). Summarizing scientific articles: experiments with relevance and rhetorical status. Computational Linguistics 28(4). 409–445.
Vieira, F. E., & Faraco, C. A. (2019). Escrever na universidade: fundamentos. São Paulo: Parábola.
Bakhtin, M., & Volochinov, V. N. (2006). Marxismo e filosofia da linguagem (Vol. 7). São Paulo: Hucitec.
Castilho, R.E., Mujdricza-Maydt, E., Yimam, S. M., Hartmann, S., Gurevych, I., Frank, A., Biemann, C. (2016). A web-based tool for the integrated annotation of semantic and syntactic structures. Em Proceedings of the workshop on language technology resources and tools for digital humanities (LT4DH) (pp. 76-84).
Feltrim, V. D., Pelizzoni, J. M., Teufel, S., Nunes, M. D. G. V., & Aluísio, S. M. (2004). Applying argumentative zoning in an automatic critiquer of academic writing. Em Brazilian Symposium on Artificial Intelligence (pp. 214-223). Springer, Berlin, Heidelberg.
Feltrim, V.D. (2004). Uma abordagem baseada em corpus e em sistemas de crítica para a construção de ambientes web de auxílio à escrita acadêmica em português. Universidade de São Paulo, São Carlos, Brasil. Tese de Doutorado.
Hovy, E., & Lavid, J. (2010). Towards a ‘science’of corpus annotation: a new methodological challenge for corpus linguistics. International journal of translation, 22(1), 13-36.
Iriguti, A. H., & Feltrim, V. D. (2019). Avaliando atributos para a classificação de estrutura retórica em resumos científicos. Linguamática, 11(1), pp.41-53.
Marcuschi, L. A. (2002). Gêneros textuais: definição e funcionalidade. Gêneros textuais e ensino, 2, pp.19-36.
Pustejovsky, J., & Stubbs, A. (2012). Natural Language Annotation for Machine Learning: A guide to corpus-building for applications. O'Reilly Media.
Sardinha, T. B. (2004). Linguística de corpus. Barueri/SP: Manole Ltda.
Stenetorp, P., Pyysalo, S., Topic, G., Ohta, T., Ananiadou, S., & Tsujii, J. I. (2012). BRAT: a web-based tool for NLP-assisted text annotation. Em Proceedings of the Demonstrations at the 13th Conference of the European Chapter of the Association for Computational Linguistics (pp. 102-107).
Teufel, S. & Marc, M. (2002). Summarizing scientific articles: experiments with relevance and rhetorical status. Computational Linguistics 28(4). 409–445.
Vieira, F. E., & Faraco, C. A. (2019). Escrever na universidade: fundamentos. São Paulo: Parábola.
Publicado
29/11/2021
Como Citar
TANIWAKI, Sabrina de Fátima Barbosa; SOUZA, Jackson Wilke da Cruz.
Criação e Anotação do corpus de resumos científicos de Ciências Sociais Aplicadas. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 13. , 2021, Evento Online.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2021
.
p. 437-441.
DOI: https://doi.org/10.5753/stil.2021.17825.