ロボットツアーガイド例
MDPグリッドの世界
従来の計画に関する問題
この問題(とのみ、この問題)のためのアクションは4 MDP Gridworldに説明と異なる方法で、確率的ですと仮定します。
代わりに、アクションの北、おそらく東または西に行く、アクションは北の可能性(対角の正方形にIE)北東または北西に移動します。
同様に、他の方向については、アクション西はおそらく(対角線にすなわち)、西、北西や南西に移動します例えば。
確率的アクションは4 MDPグリッドの世界のようです。
アクション北朝鮮は、10%の確率で10%の確率または西に80%の確率でそれ以外の場合は、東と北に移動します。同様に、他の方向について。
MDPとコスト
バリューイテレーション
バリュー反復とポリシー
CDM結論
POMDP
記号を読み取るために最初に南に行きます
Readings on Planning under Uncertainty
AIMA: Chapter 17
Further Study
Charles Isbell and Michael Littmann’s ML course:
Peter Norvig and Sebastian Thrun’s AI course: