Estratégias de modelização de dicionários latim-português como Linked Open Data
Resumo
Este artigo apresenta o processo de incorporação dos dados de três dicionários bilíngues latim-português à LiLa Knowledge Base, uma base de recursos linguísticos interoperáveis voltados para o latim. O foco recai sobre como a informação extraída dos dicionários é representada através domodelo OntoLex-Lemon e descreve as estratégias utilizadas para preservar o texto original, dado seu interesse histórico. O processo de interligação das entradas ao LiLa Lemma Bank é descrito em detalhes. O resultado é a primeira coleção de recursos lexicais latim-português dotada de interoperabilidade com os (meta)dados dos demais recursos linguísticos conectados à LiLa Knowledge Base.
Referências
Berners-Lee, T. (2006). Linked data. [link].
Cardoso, J. (1570). Dictionarium latino lusitanicum & vice versa lusitanico latinu[m]. João de Barreira, Coimbra.
Cimiano, P., McCrae, J. P., and Buitelaar, P. (2016). Lexicon model for ontologies: Final community group report. Technical report, Ontology-Lexicon Community Group under the World Wide Web Consortium (W3C), Cambridge, MA.
Fonseca, P. J. (1798). Parvum lexicum latinum lusitana interpretatione adjecta. Typographia Regia, Lisboa.
Hanks, P. (2022). Lexicography. In Mitkov, R., editor, The Oxford Handbook of Computational Linguistics. Oxford University Press, Oxford.
Hartmann, R. R. K. (2001). Structural and typological perspectives, pages 57–79. Routledge, London/New York, 2nd. edition.
Ide, N. and Pustejovsky, J. (2010). What does interoperability mean, anyway. In Proceedings of the Second International Conference on Global Interoperability for Language Resources (ICGL 2010), Hong Kong.
Mambrini, F., Litta, E., Passarotti, M., and Ruffolo, P. (2021). Linking the Lewis & Short dictionary to the LiLa Knowledge Base of interoperable linguistic resources for Latin. In Fersini, E., Passarotti, M., and Patti, V., editors, Proceedings of the Eighth Italian Conference on Computational Linguistics, AIxIA Series, Aachen, Germany. CEUR Workshop Proceedings.
Mambrini, F. and Passarotti, M. C. (2023). The lila lemma bank: A knowledge base of latin canonical forms. Journal of Open Humanities Data, 9(1).
Merrilees, B. (1996). The shape of themedieval dictionary entry.Digital Studies/le Champ Numérique, 4.
Passarotti, M., Mambrini, F., Franzini, G., Cecchini, F. M., Litta, E., Moretti, G., Ruffolo, P., and Sprugnoli, R. (2020). Interlinking through lemmas. the lexical collection of the LiLa Knowledge Base of linguistic resources for Latin. Studi e Saggi Linguistici (SSL), 58(1):177–212.
Steurs, F., Schoonheim, T., Heylen, K., and Vandeghinste, V. (2020). The future of academic lexicography—a white paper.
Tarp, S. (2019). La ventana al futuro: despidiéndose de los diccionarios para abrazar la lexicografía. RILEX. Revista sobre investigaciones léxicas, 2(2):5–36.
Tiberius, C., Krek, S., Depuydt, K., Gantar, P., Kallas, J., Kosem, I., and Rundell, M. (2021). Towards the ELEXIS data model: defining a common vocabulary for lexicographic resources. In Kosem, I. and Cukr, M., editors, Electronic lexicography in the 21st century: Post-editing lexicography, Brno, Czech Republic. Lexical Computing CZ.
Velez, A. (1744). Index totius artis. In Emmanuelis Alvari S. J. De Institutione Grammatica Libri Tres, pages 366–661. Typographia Academiae, Eborae.
Verdelho, T. S. and Silvestre, J. P. M. (2002). Corpus lexicográfico do português.
Welker, H. A. (2004). Dicionários: uma pequena introdução à lexicografia. Thesaurus Editora, Brasília.
