信息基础

1.强化学习

  • 定义:
    决策过程依赖于环境给出的反馈
    Agent Enviroment State Action Reward 希望Reward最大
  • 脉冲神经网络 Spiking NN
    脉冲函数不可微分,无法使用梯度下降,不可使用无监督学习。
    正确使用SNN,需要开发一种高效的监督学习
    再硬件上模拟SNN需要模拟微分方程,消耗大量算力

2.最新进展

  • GAN生成图片
  • 翻译,和人相似
  • 自动送货
  • 唇语识别
  • 视觉推理:理解图像内目标物体间的关系
  • 犯罪预测(少数派报告)
  • 生成三维渲染画面
  • AI music
  • One Model For All

3.展望

  • 有限区域,受限功能的自动驾驶成为现实
  • 现有的深度学习算法没有太多突破
  • 弱人工智能简单发展
  • 各种行业人工智能大规模落地
  • NLP开始融合基于规则的处理,但仍无巨大进展
  • AI进入瓶颈期,但在落地和积蓄力量

猜你喜欢

转载自blog.csdn.net/qq_37481260/article/details/85230655