Explorando Poda de Transformada na Compressão de Imagens em 360º
Resumo
Mídias omnidirecionais armazenam as informações de toda a cena e estão se tornando populares hoje em dia. Tais imagens têm alta resolução para atender aos requisitos de qualidade de novas aplicações, como navegação imersiva para realidade virtual. Este artigo propõe um método de compressão do tipo JPEG para imagens omnidirecionais representadas no formato equirretangular (ERP). Nosso método propõe usar poda de transformada para explorar a amostragem não-uniforme de imagens ERP, adaptando-se às latitudes dos blocos de imagem. Os resultados experimentais mostram que nossa abordagem pode reduzir os custos aritméticos aditivos e multiplicativos em 25,58% e 29,96%, respectivamente, em comparação ao JPEG, ao mesmo tempo em que alcança uma melhora na compressão de 3,85% a uma perda de qualidade de imagem 4,1%.
Referências
M. Karkoub, O. Bouhali, and A. Sheharyar, "Gas pipeline inspection using autonomous robots with omni-directional cameras," IEEE Sensors Journal, vol. 21, no. 14, pp. 15 544-15 553, 2021.
S. G. Izard, J. A. Juanes, F. J. García Peñalvo, J. M. G. Estella, M. J. S. Ledesma, and P. Ruisoto, "Virtual reality as an educational and training tool for medicine," J. Med. Syst., vol. 42, no. 3, p. 50, 2018.
R. G. d. A. Azevedo, N. Birkbeck, F. De Simone, I. Janatra, B. Adsumilli, and P. Frossard, "Visual distortions in 360° videos," IEEE Transactions on Circuits and Systems for Video Technology, vol. 30, no. 8, pp. 2524-2537, 2020.
S. Schwarz and M. M. Hannuksela, "Perceptual quality assessment of HEVC main profile depth map compression for six degrees of freedom virtual reality video," in IEEE International Conference on Image Processing (ICIP), no. 17 2, 2017, pp. 181-185.
J. Cruz-Mota, I. Bogdanova, B. Paquier, M. Bierlaire, and J. P. Thiran, "Scale invariant feature transform on the sphere: Theory and applications," International Journal of Computer Vision, vol. 98, no. 2, pp. 217-241, 2012.
F. De Simone, P. Frossard, P. Wilkins, N. Birkbeck, and A. Kokaram, "Geometry-driven quantization for omnidirectional image coding," in Picture Coding Symposium (PCS), 2016, pp. 1-5.
Y.-C. Su and K. Grauman, "Learning spherical convolution for fast features from 360° imagery," in International Conference on Neural Information Processing Systems. Red Hook, NY, USA: Curran Associates Inc., 2017, p. 529-539.
G. K. Wallace, "The JPEG still picture compression standard," IEEE Transactions on Consumer Electronics, vol. 38, no. 1, pp. xviii-xxxiv, 1992.
S.-H. Lee, S.-T. Kim, E. Yip, B.-D. Choi, J. Song, and S.-J. Ko, "Omnidirectional video coding using latitude adaptive down-sampling and pixel rearrangement," Electronics Letters, vol. 53, no. 10, pp. 655-657, 2017.
S. Jaballah, A. Bhavsar, and M.-C. Larabi, "Perceptual Versus Latitude-Based 360-Deg Video Coding Optimization," in IEEE International Conference on Image Processing (ICIP), oct 2020, pp. 3423-3427.
X. Xiu, Y. He, and Y. Ye, "An adaptive quantization method for 360-degree video coding," in Applications of Digital Image Processing XLI, vol. 10752. SPIE, 2018, pp. 317 - 325.
K. R. Rao and P. Yip, Discrete Cosine Transform: Algorithms, Advantages, Applications. Academic Press, 1990.
C. Tablada, T. L. T. da Silveira, R. Cintra, and F. Bayer, "DCT approximations based on Chen's factorization," Signal Processing: Image Communication, vol. 58, pp. 14-23, 2017.
R. J. Cintra, F. M. Bayer, V. A. Coutinho, S. Kulasekera, A. Madanayake, and A. Leite, "Energy-efficient 8-point DCT approximations: Theory and hardware architectures," Circuits Systems Signal Process., vol. 35, no. 11, pp. 4009-4029, 2016.
X.-D. Zhang, Matrix Analysis and Applications. Cambridge University Press, 2017.
Y. Sun, A. Lu, and L. Yu, "Weighted-to-Spherically-Uniform Quality Evaluation for Omnidirectional Video," IEEE Signal Processing Letters, vol. 24, no. 9, pp. 1-1, 2017.
J. Zheng, J. Zhang, J. Li, R. Tang, S. Gao, and Z. Zhou, "Structured3D: A large photo-realistic dataset for structured 3D modeling," in European Conference on Computer Vision, 2020, pp. 519-535.
T. L. T. da Silveira, R. S. Oliveira, F. M. Bayer, R. J. Cintra, and A. Madanayake, "Multiplierless 16-point DCT approximation for low-complexity image and video coding," Signal, Image and Video Processing, vol. 11, no. 2, pp. 227-233, 2017.