Pré-processamento e Análise de Dados de Táxis

  • Cristiano Martins Monteiro CEFET-MG
  • Fábio Rocha da Silva CEFET-MG
  • Cristina Duarte Murta CEFET-MG

Resumo


O estudo de grandes quantidades de dados é um desafio atual e devemos estar preparados para tratá-las e analisá-las. Nesta tarefa, o pré-processamento é essencial para verificar os dados, identificar inconsistências, possíveis erros e incompletude. Neste trabalho, foram analisadas duas bases de dados com mais de trinta milhões de registros da movimentação de táxis nas cidades de San Francisco e Roma. Propomos um algoritmo para o tratamento das velocidades anômalas identificadas na etapa de pré-processamento destas bases. Apresentamos a análise das bases de dados antes e após a aplicação do algoritmo, mostrando sua relevância e pertinência. Os resultados evidenciam características específicas do serviço de táxi nas duas metrópoles.

Referências

Alvarenga, D., da Cunha, F. D., Viana, A. C., Mini, R. A., and Loureiro, A. A. (2016). Classificando comportamentos sociais em redes veiculares. In XXXIV Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC). SBC.

Bracciale, L., Bonola, M., Loreti, P., Bianchi, G., Amici, R., and Rabuffi, A. (2014). CRAWDAD dataset roma/taxi (v. 2014-07-17). Downloaded from [link].

Ganti, R., Srivatsa, M., Ranganathan, A., and Han, J. (2013). Inferring Human Mobility Patterns from Taxicab Location Traces. In Proceedings of the 2013 ACM international joint conference on Pervasive and ubiquitous computing, pages 459–468. ACM.

Gibbons, J. D. and Chakraborti, S. (2003). Nonparametric Statistical Inference. Marcel Dekker, New York.

Jones, K., Liu, L., and Alizadeh-Shabdiz, F. (2007). Improving Wireless Positioning with Look-Ahead Map-Matching. In Fourth Annual International Conference on Mobile and Ubiquitous Systems: Networking & Services (MobiQuitous), pages 1–8. IEEE.

Júnior, A. M. S., Sousa, M. L., Xavier, F. Z., Xavier, W. Z., Almeida, J. M., Ziviani, A., Rangel, F., Avila, C., and Marques-Neto, H. T. (2016). Caracterização do Serviço de Táxi a partir de Corridas Solicitadas por um Aplicativo de Smartphone. In XXXIV Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC). SBC.

Kozievitch, N. P., Gadda, T. M. C., Fonseca, K. V. O., Rosa, M. O., Gomes-Jr, L. C., and Akbar, M. (2016). Exploratory Analysis of Public Transportation Data in Curitiba. In 43o. Seminário Integrado de Software e Hardware (SEMISH). SBC.

Monteiro, C. M. (2016). Padrões de Mobilidade Urbana em Serviços de Táxi. Mestrado em Modelagem Matemática e Computacional, Centro Federal de Educação Tecnológica de Minas Gerais – CEFET-MG, Belo Horizonte.

Monteiro, C. M., Silva, F. R., and Murta, C. D. (2016). Análise de Padrões Espaciais e Temporais da Mobilidade de Táxis em San Francisco e Roma. In 43o. Seminário Integrado de Software e Hardware (SEMISH). SBC.

Oliveira, A., Souza, M., de A. Pereira, M., Reis, F. A. L., Almeida, P. E. M., Silva, E. J., and Crepalde, D. S. (2015). Optimization of Taxi Cabs Assignment in Geographical Location-based Systems. In XVI Brazilian Symposium on GeoInformatics, pages 92–104. SBC.

Piorkowski, M., Sarafijanovic-Djukic, N., and Grossglauser, M. (2009). CRAWDAD dataset epfl/mobility (v. 2009-02-24). Downloaded from [link].

Rossi, L., Walker, J., and Musolesi, M. (2015). Spatio-temporal techniques for user identification by means of GPS mobility data. EPJ Data Science, 4(1):1–16.

Valero, B., Luis, J., Julián, A., Belén, A., Villén, G., and Natalia (2014). GNSS. GPS: Fundamentos y Aplicaciones en Geomática. Editorial de la Universidad Politécnica de Valencia, Valencia.
Publicado
02/07/2017
MONTEIRO, Cristiano Martins; DA SILVA, Fábio Rocha; MURTA, Cristina Duarte. Pré-processamento e Análise de Dados de Táxis. In: SEMINÁRIO INTEGRADO DE SOFTWARE E HARDWARE (SEMISH), 44. , 2017, São Paulo. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2017 . p. 2610-2621. ISSN 2595-6205. DOI: https://doi.org/10.5753/semish.2017.3368.