K. Carvalho, H. Batista, I. Oliveira, and A. Brandão. " A 3D Q-Learning Algorithm for Offline UAV Path Planning with Priority Shifting Rewards", in Anais do XIV Simpósio Brasileiro de Robótica e XIX Simpósio Latino Americano de Robótica, São Bernardo do Campo/SP, 2022, pp. 169-174.