交通の流れに流れに自由強化学習を作成する方法については、このチュートリアルの話。シングルレーンの環状道路の整備。
- パート
すべてのシミュレーションは、2つの部分から構成:ネットワークと環境(ネットワーク環境)
ネットワーク:シミュレーションに使用される交通網の機能について説明します。これは、ネットワーク内のその他のノードとレーンとの接合部を構成する縁部、並びに車両の特性、交通信号灯、流入の位置及び特性を含みます。
位置および属性、車両の特性、交通信号灯、等を含むレーンと交差構成
環境:一方、リセット、初期化、および事前のシミュレーション、および強化学習アルゴリズムとネットワークの間のプライマリインターフェイスとして機能します。また、カスタム環境は、ネットワークの動的特徴を変更するために使用されてもよいです。
初期化は、学習アルゴリズムと道路網との強化のインターフェースとして、事前のシミュレーションをリセットします。カスタム環境は、道路網の動特性を変更することができます(?)