Criação e Anotação do corpus de resumos científicos de Ciências Sociais Aplicadas
Abstract
With the growing interest and need in the creation of (semi)automatic tools that help the literacy process in academic textual genres, we present in this work the corpus of scientific abstracts in applied social sciences. Our objective was to study, at the sentential level, the rhetorical structure of the abstracts in the areas of Public Administration, Accounting and Economics, based on the typology proposed in the literature, using the WebAnno corpus annotation tool. As a result, (i) the organization of a set of 200 texts, (ii) the preliminary study of the rhetorical structure of those areas and (iii) the production of an annotation manual with specific guidelines on the identification of the rhetorical structure of the abstracts scientific.References
Antiqueira, L., Feltrim, V. D., & Nunes, M. D. G. V. (2003). Projeto e implementação do sistema SciPo. São Carlos, Brasil. Série de Relatórios Técnicos do Instituto de Ciências Matemáticas e de Computação (nº 223).
Bakhtin, M., & Volochinov, V. N. (2006). Marxismo e filosofia da linguagem (Vol. 7). São Paulo: Hucitec.
Castilho, R.E., Mujdricza-Maydt, E., Yimam, S. M., Hartmann, S., Gurevych, I., Frank, A., Biemann, C. (2016). A web-based tool for the integrated annotation of semantic and syntactic structures. Em Proceedings of the workshop on language technology resources and tools for digital humanities (LT4DH) (pp. 76-84).
Feltrim, V. D., Pelizzoni, J. M., Teufel, S., Nunes, M. D. G. V., & Aluísio, S. M. (2004). Applying argumentative zoning in an automatic critiquer of academic writing. Em Brazilian Symposium on Artificial Intelligence (pp. 214-223). Springer, Berlin, Heidelberg.
Feltrim, V.D. (2004). Uma abordagem baseada em corpus e em sistemas de crítica para a construção de ambientes web de auxílio à escrita acadêmica em português. Universidade de São Paulo, São Carlos, Brasil. Tese de Doutorado.
Hovy, E., & Lavid, J. (2010). Towards a ‘science’of corpus annotation: a new methodological challenge for corpus linguistics. International journal of translation, 22(1), 13-36.
Iriguti, A. H., & Feltrim, V. D. (2019). Avaliando atributos para a classificação de estrutura retórica em resumos científicos. Linguamática, 11(1), pp.41-53.
Marcuschi, L. A. (2002). Gêneros textuais: definição e funcionalidade. Gêneros textuais e ensino, 2, pp.19-36.
Pustejovsky, J., & Stubbs, A. (2012). Natural Language Annotation for Machine Learning: A guide to corpus-building for applications. O'Reilly Media.
Sardinha, T. B. (2004). Linguística de corpus. Barueri/SP: Manole Ltda.
Stenetorp, P., Pyysalo, S., Topic, G., Ohta, T., Ananiadou, S., & Tsujii, J. I. (2012). BRAT: a web-based tool for NLP-assisted text annotation. Em Proceedings of the Demonstrations at the 13th Conference of the European Chapter of the Association for Computational Linguistics (pp. 102-107).
Teufel, S. & Marc, M. (2002). Summarizing scientific articles: experiments with relevance and rhetorical status. Computational Linguistics 28(4). 409–445.
Vieira, F. E., & Faraco, C. A. (2019). Escrever na universidade: fundamentos. São Paulo: Parábola.
Bakhtin, M., & Volochinov, V. N. (2006). Marxismo e filosofia da linguagem (Vol. 7). São Paulo: Hucitec.
Castilho, R.E., Mujdricza-Maydt, E., Yimam, S. M., Hartmann, S., Gurevych, I., Frank, A., Biemann, C. (2016). A web-based tool for the integrated annotation of semantic and syntactic structures. Em Proceedings of the workshop on language technology resources and tools for digital humanities (LT4DH) (pp. 76-84).
Feltrim, V. D., Pelizzoni, J. M., Teufel, S., Nunes, M. D. G. V., & Aluísio, S. M. (2004). Applying argumentative zoning in an automatic critiquer of academic writing. Em Brazilian Symposium on Artificial Intelligence (pp. 214-223). Springer, Berlin, Heidelberg.
Feltrim, V.D. (2004). Uma abordagem baseada em corpus e em sistemas de crítica para a construção de ambientes web de auxílio à escrita acadêmica em português. Universidade de São Paulo, São Carlos, Brasil. Tese de Doutorado.
Hovy, E., & Lavid, J. (2010). Towards a ‘science’of corpus annotation: a new methodological challenge for corpus linguistics. International journal of translation, 22(1), 13-36.
Iriguti, A. H., & Feltrim, V. D. (2019). Avaliando atributos para a classificação de estrutura retórica em resumos científicos. Linguamática, 11(1), pp.41-53.
Marcuschi, L. A. (2002). Gêneros textuais: definição e funcionalidade. Gêneros textuais e ensino, 2, pp.19-36.
Pustejovsky, J., & Stubbs, A. (2012). Natural Language Annotation for Machine Learning: A guide to corpus-building for applications. O'Reilly Media.
Sardinha, T. B. (2004). Linguística de corpus. Barueri/SP: Manole Ltda.
Stenetorp, P., Pyysalo, S., Topic, G., Ohta, T., Ananiadou, S., & Tsujii, J. I. (2012). BRAT: a web-based tool for NLP-assisted text annotation. Em Proceedings of the Demonstrations at the 13th Conference of the European Chapter of the Association for Computational Linguistics (pp. 102-107).
Teufel, S. & Marc, M. (2002). Summarizing scientific articles: experiments with relevance and rhetorical status. Computational Linguistics 28(4). 409–445.
Vieira, F. E., & Faraco, C. A. (2019). Escrever na universidade: fundamentos. São Paulo: Parábola.
Published
2021-11-29
How to Cite
TANIWAKI, Sabrina de Fátima Barbosa; SOUZA, Jackson Wilke da Cruz.
Criação e Anotação do corpus de resumos científicos de Ciências Sociais Aplicadas. In: BRAZILIAN SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE TECHNOLOGY (STIL), 13. , 2021, Evento Online.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2021
.
p. 437-441.
DOI: https://doi.org/10.5753/stil.2021.17825.
