チュートリアル01:相撲シミュレーションを実行します

交通の流れに流れに自由強化学習を作成する方法については、このチュートリアルの話。シングルレーンの環状道路の整備。

  1. パート

すべてのシミュレーションは、2つの部分から構成:ネットワークと環境(ネットワーク環境)

ネットワーク:シミュレーションに使用される交通網の機能について説明します。これは、ネットワーク内のその他のノードとレーンとの接合部を構成する縁部、並びに車両の特性、交通信号灯、流入の位置及び特性を含みます。

位置および属性、車両の特性、交通信号灯、等を含むレーンと交差構成

環境:一方、リセット、初期化、および事前のシミュレーション、および強化学習アルゴリズムとネットワークの間のプライマリインターフェイスとして機能します。また、カスタム環境は、ネットワークの動的特徴を変更するために使用されてもよいです。

初期化は、学習アルゴリズムと道路網との強化のインターフェースとして、事前のシミュレーションをリセットします。カスタム環境は、道路網の動特性を変更することができます(?)

 

おすすめ

転載: www.cnblogs.com/QMark/p/11761627.html