[Recomendado] RL super útil rápido refuerzo marco de aprendizaje - Tianshou 1500 líneas de código para lograr DQN / PG / A2C

algoritmo de aprendizaje de refuerzo ha logrado varias plataformas, como basado en OpenAI líneas de base tensorflow de, rllib, basado PyTorch DRL Pytorch de, rlpyt. El último marco recomendación RL de una implementación rápida de peso ligero, introducido por los estudiantes universitarios de la Universidad de Tsinghua, en comparación con la plataforma RL anterior, hay cerca de varias ventajas:

实现简洁,轻巧:1500行代码搞定
模块化:多种不同API可供调用,轮子多就是好
调用方便,速度快,3秒钟实现一个PG算法

RL comparación marco algoritmo:

Aquí Insertar imagen Descripción

Aprendizaje por refuerzo marco - Tianshou dirección de proyecto github
Aquí Insertar imagen Descripción

Lograr ejemplos de algoritmos DQN de código utilizado Tianshou detalles:
primero instalar Tianshou:

pip3 install tianshou

Supongo que te gusta

Origin blog.csdn.net/weixin_37479258/article/details/105235548
Recomendado
Clasificación