MoreData: Enriquecimento Semântico para Grandes Volumes de Dados Geolocalizados

  • Germano B. dos Santos Universidade Federal de Viçosa (UFV)
  • Leonardo J. A. S. Figueiredo Universidade Federal de Minas Gerais (UFMG)
  • Fabrício A. Silva Universidade Federal de Viçosa (UFV) http://orcid.org/0000-0002-0713-0583
  • Antonio A. F. Loureiro Universidade Federal de Minas Gerais (UFMG)

Resumo


O volume da coleta e disponibilização de dados geolocalizados aumentou significativamente nos últimos anos. Este tipo de dado pode ser utilizado para enriquecer bases em diferentes contextos para extrair novas informações e potencializar resultados de diversas pesquisas. Contudo, o dado geolocalizado bruto na maioria dos casos não possui relevância semântica e a tarefa de enriquecimento com este tipo de dado pode ser bastante dispendiosa. Nesse contexto, ferramentas que facilitam tal tarefa, como o MoreData, são fundamentais para diminuir o tempo gasto e permitir que os recursos sejam melhor alocados em outras etapas, como a criação de modelos. Entretanto, em sua primeira versão o MoreData não foi preparado para receber grandes volumes de dados de maneira eficiente. Assim, o trabalho atual apresenta uma atualização do MoreData para enriquecer bases com milhões de dados. Com essa atualização foi possível tornar o MoreData cerca de 2.500 vezes mais rápido e utilizá-lo para grandes volumes de dados.
Palavras-chave: Dados geolocalizados

Referências

Domingues, A., Silva, F., Santos, L., Souza, R., Coimbra, G., and Loureiro, A. A. F. (2020). Dados geoespaciais: Conceitos e técnicas para coleta, armazenamento, tratamento e visualização. Sociedade Brasileira de Computação.

Figueiredo, L. J. A. S., dos Santos, G. B., Souza, R. P. P. M., Silva, F. A., and Silva, T. R. M. B. (2021). Moredata: A geospatial data enrichment framework. In Proceedings of the 29th International Conference on Advances in Geographic Information Systems, SIGSPATIAL ’21, page 419–422. Association for Computing Machinery, New York, NY, USA.

Figueiredo, L., Santos, G., Souza, R., Silva, F., Silva, T., and Loureiro, A. (2022). Score: um serviço de classificação de usuários móveis com base em seus aplicativos e suas cidades. In Anais do XIV Simpósio Brasileiro de Computação Ubíqua e Pervasiva, pages 21–30, Porto Alegre, RS, Brasil. SBC.

Gubert, F. and Silva, T. (2022). Google places enricher: A tool that makes it easy to get and enrich google places api data. In Anais Estendidos do XXVIII Simpósio Brasileiro de Sistemas Multimídia e Web, pages 91–94, Porto Alegre, RS, Brasil. SBC.

Jordahl, K., Van den Bossche, J., Wasserman, J., McBride, J., Gerard, J., Fleischmann, M., Tratner, J., Perry, M., Farmer, C., Hjelle, G. A., et al. (2019). geopandas/geopandas: v0.6.0. Zenodo.

Rettore, P. H. L., Santos, B. P., Rigolin F. Lopes, R., Maia, G., Villas, L. A., and Loureiro, A. A. F. (2020). Road data enrichment framework based on heterogeneous data fusion for its. IEEE Transactions on Intelligent Transportation Systems, 21(4):1751–1766.

Souza, R. P., Figueiredo, L. J., Silva, M. P., Silva, F. A., Silva, T. R., and Loureiro, A. A. (2022). Investigating the impact of demographic and device information in the recommendation of mobile applications. Journal of Internet Services and Applications, 12(1):21–32.

Van Den Bossche, J., Fleischmann, M., Statham, T., Daniel Jahn (Dahn), Augspurger, T., Signell, J., Gadomski, P., Bell, R., Lumnitz, S., Zaidi, A. A., Bunt, F., Rose, I., Truong, I., Bourbeau, J., Baker, J., Morris, M., Hagen, R., Richard Scott OZ, and Bernardpazio (2023). geopandas/dask-geopandas: v0.3.1.
Publicado
25/09/2023
Como Citar

Selecione um Formato
DOS SANTOS, Germano B.; FIGUEIREDO, Leonardo J. A. S.; SILVA, Fabrício A.; LOUREIRO, Antonio A. F.. MoreData: Enriquecimento Semântico para Grandes Volumes de Dados Geolocalizados. In: DEMONSTRAÇÕES E APLICAÇÕES - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 38. , 2023, Belo Horizonte/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 126-131. DOI: https://doi.org/10.5753/sbbd_estendido.2023.233369.