Learning Push Recovery Strategies for Bipedal Walking

  • Dicksiano C. Melo ITA
  • Marcos R. O. A. Maximo ITA
  • Adilson Marques da Cunha ITA


O artigo contribui com a implementação de um controlador Push Recovery que melhora o desempenho do motor de caminhada usado por um agente simulado humanóide do ambiente RoboCup Soccer 3D Simulation. A política de movimentos aprendida foi capaz de superar as baselines com significância estatística. Finalmente, propomos duas abordagens para remover vieses indesejados em nossas políticas finais.

Palavras-chave: Robot simulation and visualization tools, Robot planning, communication, adaptation and learning, Robot soccer


