李宏毅深度学习人类语言处理dhlp2020 hw1-hw5作业下载、环境配置及训练笔记
由国立台湾大学李宏毅老师主讲的纯中文版,2020年深度学习与人类语言处理课程开课了,该课程主要讲解深度学习技术在人类语言处理,比如语音识别、自然语言处理相关的知识课程非常新且难度很高,内容都是最新的深度学习技术。
由于作业提供的源码有些并不完整,数据集下载需要能科学上网,还要有google drive账号。环境配置也是个问题,每个作业的环境配置都不大一样。
首先是下载从官网作业的ppt提供的链接下载数据集和源码,由于有些数据集非常大,从几百mb到10g
大家都知道超过1g的文件从google云下载经常会自动断开,所以下载数据集和源码就花了10多天。总共15g。
然后就是环境配置的问题,训练语音识别和bert都需要配置高的机器,最近发现一个免费云gpu,链接地址
手机注册后,关注公众号,在公众号关联注册的账号,登录网站可以领取免费云卷100元,有v100到2080ti的配置好的机器选用,用完后再换个手机注册又能继续使用。
然后建个实例,选每小时3元的2080ti pytorch1.2 Python3.6 cuda10 按量付费 ,创建后把数据集和源码上传就可以运行了。我一般喜欢在jupyter运行,所以作业改成在一个ipynb上执行,类似李宏毅机器学习的那些colab。
可以直接在手机上的谷歌浏览器运行下面就是各个作业安装环境和训练测试的截图