proyecto final para reforzar la profundidad del aprendizaje - basado DQN juego de carreras

introducción

  Esta sección describe un DQN proceso contra realización, que es sustancialmente el mismo que el DQN convencional, excepto que toda la capa de conexión en dos ramas, a saber, el valor de rama y ventajas rama, y ​​las dos ramas se unen para calcular el Q definitiva función. Además, el análisis se basa en cómo ganar el partido contra el Racing DQN un agente de formación.

la implementación del código

1. Embalaje Función Medio Ambiente

import warnings
warnings.filterwarnings('ignore')
import numpy as np
import tensorflow as tf
import gym
from gym.spaces import 

Supongo que te gusta

Origin blog.csdn.net/weixin_43283397/article/details/105163137
Recomendado
Clasificación