Skip to content
E

estig

Projects with this topic

  • ste projeto avalia cinco algoritmos de aprendizado por reforço (A2C, DDPG, PPO, SAC, TD3) no ambiente CustomPusherEnv, que simula um pusher movendo uma peça até um ponto de referência. Usando Stable-Baselines3, o estudo analisa taxa de sucesso, recompensa, consumo energético, eficiência e uso de memória. O repositório contém scripts para treinamento, avaliação, geração de gráficos e dados em JSON/PDF.

    Updated
    Updated