1.强化学习
- 定义:
决策过程依赖于环境给出的反馈
Agent Enviroment State Action Reward 希望Reward最大 - 脉冲神经网络 Spiking NN
脉冲函数不可微分,无法使用梯度下降,不可使用无监督学习。
正确使用SNN,需要开发一种高效的监督学习
再硬件上模拟SNN需要模拟微分方程,消耗大量算力
2.最新进展
- GAN生成图片
- 翻译,和人相似
- 自动送货
- 唇语识别
- 视觉推理:理解图像内目标物体间的关系
- 犯罪预测(少数派报告)
- 生成三维渲染画面
- AI music
- One Model For All
3.展望
- 有限区域,受限功能的自动驾驶成为现实
- 现有的深度学习算法没有太多突破
- 弱人工智能简单发展
- 各种行业人工智能大规模落地
- NLP开始融合基于规则的处理,但仍无巨大进展
- AI进入瓶颈期,但在落地和积蓄力量