Urban Perception Extraction from Texts Shared on Social Media: Framework and Applications

Resumo


Esta tese apresenta um framework automático e genérico para a extração de percepções urbanas a partir de dados de Redes Sociais Baseadas em Localização (LBSN). O framework é estruturado em cinco camadas principais: Coleta de Dados, Pré-processamento e Embeddings, Treinamento de Modelos, Extração de Conhecimento e Aplicações. Utilizando técnicas de deep learning, incluindo métodos avançados de incorporação de sentenças, o framework captura tanto nuances lexicais quanto semânticas nos dados textuais, permitindo a extração eficiente das percepções dos usuários sobre o ambiente urbano. Essa abordagem elimina a necessidade de pesquisas de campo intensivas e extração manual de dados, viabilizando análises escaláveis em tempo real. Validamos o framework aplicando-o a áreas urbanas selecionadas em Chicago, Nova York e Londres, demonstrando sua eficácia na revelação de insights valiosos sobre percepções urbanas. Além disso, uma avaliação comparativa utilizando um conjunto de dados público, derivado das percepções de voluntários em um experimento controlado, revelou um alto nível de concordância entre os dois conjuntos de resultados. Como prova de conceito, introduzimos o Real-Estate Urban Perceptions (REAL-UP), uma ferramenta inovadora projetada para aprimorar o mercado imobiliário. O REAL-UP oferece mapas interativos em 2D que integram dados imobiliários tradicionais (por exemplo, preços de aluguel e tipos de propriedade) com informações enriquecidas sobre emoções e sentimentos dos bairros, além de breves resenhas narrativas geradas por um Modelo de Linguagem de Grande Escala (LLM) com base em mensagens de LBSN.

Palavras-chave: Incorporações de frases, Processamento de linguagem natural, Redes sociais baseadas em localização, Mercado imobiliário

Referências

Aiello, L. M., Schifanella, R., Quercia, D., and Aletta, F. (2016). Chatty maps: constructing sound maps of urban areas from social media data. Open Science, 3(3):150690.

Almeida, V. G., Silva, T. R., and Silva, F. A. (2022). Se for, vá na paz: Construindo rotas seguras para veículos coletivos urbanos. In Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC), pages 140–153. SBC.

Dubey, A., Naik, N., Parikh, D., Raskar, R., and Hidalgo, C. A. (2016). Deep learning the city: Quantifying urban perception at a global scale. In Proc. of ECCV, pages 196–212. Springer.

Krohling, B., Comarela, G., and Mota, V. F. (2024). Uma arquitetura baseada em redes neurais recorrentes para prediçao de trajetórias veiculares em ambientes urbanos. In Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC), pages 379–392. SBC.

Ladeira, L. Z., Santos, F., Cléopas, L., Buteneers, P., and Villas, L. (2022). Neo-nda: Neo natural language data augmentation. In Proc. of ICSC, pages 99–102. IEEE.

Quercia, D., Schifanella, R., Aiello, L. M., Kate, M., et al. (2015). Smelly maps: The digital life of urban smellscapes. In Proc. of ICWSM, pages 327–336, Oxford, UK. AAAI Press.

Rodrigues, D. O., Santos, F. A., Rocha Filho, G. P., Akabane, A. T., Cabral, R., Immich, R., Junior, W. L., Cunha, F. D., Guidoni, D. L., Silva, T. H., et al. (2019). Computação urbana da teoria à prática: Fundamentos, aplicações e desafios. JAI-SBC.

Santos, F. A., Akabane, A. T., Yokoyama, R. S., Loureiro, A. A., and Villas, L. A. (2016). A roadside unit-based localization scheme to improve positioning for vehicular networks. In Proc of VTC-Fall, pages 1–5. IEEE.

Santos, F. A., Kobellarz, J. K., de Souza, F. R., Villas, L. A., and Silva, T. H. (2022). Processamento de linguagem natural em textos de mídias sociais: Fundamentos, ferramentas e aplicações. Sociedade Brasileira de Computação.

Santos, F. A., Rodrigues, D. O., Silva, T. H., Loureiro, A. A., Pazzi, R. W., and Villas, L. A. (2018a). Context-aware vehicle route recommendation platform: Exploring open and crowdsourced data. In Proc. of ICC, pages 1–7. IEEE.

Santos, F. A., Rodrigues, D. O., Silva, T. H., Loureiro, A. A., and Villas, L. A. (2017a). Rotas veiculares cientes de contexto: Arcabouço e aná lise usando dados oficiais e sensoriados por usuários sobre crimes. In Proc. of WGRS. SBC.

Santos, F. A., Silva, T. H., Braun, T., Loureiro, A. A., and Villas, L. A. (2017b). Towards a sustainable people-centric sensing. In Prof. of ICC, pages 1–6. IEEE.

Santos, F. A., Silva, T. H., Loureiro, A. A., Boukerche, A., and Villas, L. A. (2018b). Identificação da reputação de áreas urbanas externas com dados de mídias sociais. In Proc. of SBRC, pages 810–823. SBC.

Santos, F. A., Silva, T. H., Loureiro, A. A., and Villas, L. A. (2020). Automatic extraction of urban outdoor perception from geolocated free texts. Social Network Analysis and Mining, 10:1–23.

Santos, F. A., Silva, T. H., Loureiro, A. A. F., and Villas, L. A. (2018c). Uncovering the perception of urban outdoor areas expressed in social media. In 2018 IEEE/WIC/ACM International Conference on Web Intelligence (WI), pages 120–127. IEEE.

Santos, F. A., Silva, T. H., and Villas, L. A. (2024). Real-up: Urban perceptions from lbsns helping moving real-estate market to the next level. In Companion Proceedings of the ACM on Web Conference 2024, pages 1071–1074.
Publicado
19/05/2025
SANTOS, Frances Albert; SILVA, Thiago Henrique; VILLAS, Leandro Aparecido. Urban Perception Extraction from Texts Shared on Social Media: Framework and Applications. In: CONCURSO DE TESES E DISSERTAÇÕES - SIMPÓSIO BRASILEIRO DE REDES DE COMPUTADORES E SISTEMAS DISTRIBUÍDOS (SBRC), 43. , 2025, Natal/RN. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 182-191. ISSN 2177-9384. DOI: https://doi.org/10.5753/sbrc_estendido.2025.6880.