Monitoramento Ambiental de Cidades Urbanas: Detectando Outliers via Análise Fatorial Exploratória
Resumo
Nos últimos anos, as cidades inteligentes têm emergido como um vasto repositório de dados. Assim, surge a necessidade de detectar importantes eventos que estão fora do padrão de normalidade, os chamados outliers. Neste artigo, propomos uma nova abordagem de detecção de outliers para dados de monitoramento de ambientes urbanos inteligentes baseada na Análise Fatorial Exploratória (AFE), através dos seguintes procedimentos: primeiro, aplicamos AFE gerando uma estrutura fatorial-base; na sequência, a distância de Mahalanobis é calculada sobre os fatores extraídos para a detecção de outliers. Dados reais das cidades espanholas de Elda e Rois validaram nossa proposta e a AFE revelou os fatores mais influentes nos padrões de outliers detectados.
Referências
Basilevsky, A. T. (2009). Statistical factor analysis and related methods. John Wiley and Sons.
Bi, Y., Lin, C., Zhou, H., Yang, P., Shen, X., and Zhao, H. (2017). Time-constrained big data transfer for sdn-enabled smart city. IEEE Communications Magazine, 55:44–50.
Camacho, J., Villegas, A. P., Teodoro, P. G., and Fernandez, G. M. (2016). Pca-based multivariate statistical network monitoring for anomaly detection. Computers and Security, 59:118–137.
Filipponi, L., Vitaletti, A., Landi, G., Memeo, V., Laura, G., and Pucci, P. (2010). Smart city: An event driven architecture for monitoring public spaces with heterogeneous sensors. In Sensor Technologies and Applications, SENSORCOMM, pages 281–286. Fourth International Conference.
Hotelling, H. (1947). Multivariate quality control. In: Techniques of statistical analysis. NewYork: McGraw-Hill.
Jin, J., Gubbi, J., Marusic, S., and Palaniswami, M. (2014). An information framework for creating a smart city through internet of things. IEEE Internet of Things Journal, 1:112–121.
Kaiser, H. F. (1966). The application of electronic computers to factor analysis. Educational and Psychological Measurement, 20:141–151.
McKercher, G. R., Salmond, J. A., and Vanos, J. K. (2017). Characteristics and applications of small, portable gaseous air pollution monitors. Environmental Pollution, 223:102–110.
Qiu, T., Liu, J., Si, W., Han, M., Ning, H., and Atiquzzaman, M. (2017). A data-driven robustness algorithm for the internet of things in smart cities. IEEE Communications Magazine, 55:18–23.
Souza, T. I. A., Magalhães, D. M. V., and Gomes, D. G. (2017). Aplicando estatística multivariada para detecção e diagnóstico de anomalias em dados urbanos. Anais do I Workshop de Computação Urbana (CoUrb), 1:72–85.
Sundberg, R. and Feldmann, U. (2016). Exploratory factor analysis—parameter estimation and scores prediction with high-dimensional data. Journal of Multivariate Analysis, 148:49–59.
Tracy, N. D., Young, J. C., and Mason, R. L. (1972). Multivariate control charts for individual observations. Expert Systems With Applications, 24:88–95.
Zanella, A., Bui, N., Castellani, A., Vangelista, L., and Zorzi, M. (2014). Internet of things for smart cities. IEEE Internet of Things Journal, 1:22–32.
