algoritmo de aprendizaje de refuerzo ha logrado varias plataformas, como basado en OpenAI líneas de base tensorflow de, rllib, basado PyTorch DRL Pytorch de, rlpyt. El último marco recomendación RL de una implementación rápida de peso ligero, introducido por los estudiantes universitarios de la Universidad de Tsinghua, en comparación con la plataforma RL anterior, hay cerca de varias ventajas:
实现简洁,轻巧:1500行代码搞定
模块化:多种不同API可供调用,轮子多就是好
调用方便,速度快,3秒钟实现一个PG算法
RL comparación marco algoritmo:
Aprendizaje por refuerzo marco - Tianshou dirección de proyecto github
Lograr ejemplos de algoritmos DQN de código utilizado Tianshou detalles:
primero instalar Tianshou:
pip3 install tianshou