百度飞桨世界冠军带你从零实践强化学习第一天


大家好,这里是三岁,百度飞桨强化学习,零基础小白三岁又双叒来了,带大家从入门到准备放弃到苦苦支撑!!!

课程源于百度AI品台,飞桨学院,世界冠军带你从零实践强化学习课程(点击查看

强化学习

理论:智能体在环境中学习,通过环境执行动作,通过反馈奖励来指导更好的动作(白话:就是机器在学习往有利的方向前进(人类赋予了某个特征一定的意义,实际上机器学习的就是010101……))在这里插入图片描述
强化学习对于机器的奖励是延迟的只有一系列动作完成以后才可以得到奖励(反馈)

举例:
1.智能推荐(他好像知道我要干什么,他好像在窥视我!)
2.股票预期(我不会炒股,咦他给我推荐的好像不错!)
3.交通信号灯时长(为什么一个红灯各各都是红灯?)

其实没有什么偷窥,只不过是机器比你更了解你自己,
机器比你更懂股票,只不过是机器比你先到一步,
他预判了你的预判!!!

不不不算法处理好我叫人工智能,处理不好嘛!
大家好!我是人工智障!!!

试错中吸取经验

深度学习中特别是强化学习,不畏枯燥,一遍一遍的尝试,那么广大的秃头小能手们还等什么,不断试错,吸取经验啦!

agent学习方案

1. 基于价值
2. 基于策略

算法库及框架库

在这里插入图片描述

强化学习最初印象

在这里插入图片描述

作业问题及个人解决方案(仅供参考)

使用方法

好多大佬都是新手对ai studio 的 netbook 不是很了解,可以看看链接(点击查看)(链接没有登录无法查看)
在这里插入图片描述
这个文档很详细,如果要简易的话可以继续看三岁的!

fork一个文档,直接点击启动环境,选择普通版(CPU)或高级版(GPU),高阶版(GPU)需要算力卡(每天启动赠送12小时,参加比赛,完成指定课程等有赠送!)

在这里插入图片描述
2.

在这里插入图片描述
在这里插入图片描述
画面有点毛骨悚然!其他的和今天的作业一起看

第一天作业

问题1 第二个环境下载过慢

emmm ,蜗牛速度下载怎么办?
修改地址:
大佬已经提供了方案,我这里不要脸拿过来使使!
把原来的地址修改

!git clone --depth=1 https://gitee.com/PaddlePaddle/PARL.git  # 下载PARL代码库
!ls PARL # 查看代码库根目录

把地址改了就好了

连接超时时间慢

这个和地址有关系,与服务器的连接超时,中断,时间慢。

在这里插入图片描述
国内推荐(感谢整合资源的给位大佬!)

镜像源地址:

清华:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http://mirrors.aliyun.com/pypi/simple/

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

华中理工大学:http://pypi.hustunique.com/

山东理工大学:http://pypi.sdutlinux.org/

豆瓣:http://pypi.douban.com/simple/

报错 fc() got an unexpected keyword keyword argument ‘is_test’

在这里插入图片描述
这个问题看似是没有使用GPU,实际上不是
应该是上面PaddlePaddle/PARL.git没有下载好导致的!!!
重新下载即可

这里更新一下
1.可能是因为PaddlePaddle/PARL.git没有下载好导致。解决方案查看下面那个大点
2.可能是第一个环境没有配置好,加上国内的源再安装可以进行测试

第三个作业报错但是第二个作业如图所示

在这里插入图片描述
方法一:
修改代码如下

!rm -rf PARL # 删除文件PARL
!git clone --depth=1 https://gitee.com/paddlepaddle/PARL.git #换源后安装
!ls ./PARL # 查看文件

方法二:
直接删除或重命名(适用于小编这种小白)
在这里插入图片描述

提交作业不会

1.选择文件,点击生成新版本
在这里插入图片描述
2.选择文件进行生成版本
在这里插入图片描述
3.提交作业,选择属于自己的版本(自己要提交的版本)
记得此处应该刷新!!!
在这里插入图片描述
4. 点击提交即可!!!

生成新版本失败

注意注意注意!!!!
经过小编尝试
不要 把PARL文件添加保存!!!
不要 把PARL文件添加保存!!!
不要 把PARL文件添加保存!!!
因为这样子有概率会失败!!!
有概率!!!
小编刚刚就打脸成功了(哭唧唧)

强调! 此次课程建议使用普通版(CPU)!!!

强调! 此次课程建议使用普通版(CPU)!!!

强调! 此次课程建议使用普通版(CPU)!!!

这里是三岁,认真制作,如果有问题欢迎私聊!如果喜欢就来个收藏、点赞、关注、留言,更好的作品,还在路上!!!(永远在路上!!!)

猜你喜欢

转载自blog.csdn.net/weixin_45623093/article/details/106799387