9.2【人工智能与深度学习】世界模型和生成对抗网络

【人工智能与深度学习】世界模型和生成对抗网络

自主控制世界模型

自监督学习的一个重要用处是用来学习世界模型。当人们做事情时,我们有着一个内在模型来模拟世界是怎么运作的,譬如当我们9个月大的时候,我们能够通过观察外界来培养物理概念的直觉思维,在某种意义上来说这和自监督学习非常相似。正如自监督模型学习隐变量的过程一样,我们通过学习如何预测将会发生的事情来学习抽象概念。进一步来说,我们的内在模型让我们能对外界有所反应。比如说,当我们学到了物理直觉和怎样控制手后,我们可以用这些学会的东西来预测和进行“抓住一支正在往下掉的笔”这一行为。

什么是“世界模型”?

自动化智能系统是由四个主要模组组成的(图1)。第一个模组是用来观察和计算世界表征的感知模组。这通过观察而计算出来的世界表征其实并不完整,这是因为

  • 1)主体并不能观察到整个宇宙;
  • 2)观察到的也并不一定准确。

有一点要注意的是,在前馈模型中感知模组只存在于第一个时间步中。第二个模组是基于观察到的表征来计算有可能的下一步的演员模组(也叫策略模组)。第三个

猜你喜欢

转载自blog.csdn.net/m0_61531676/article/details/128993611