五节课从零起步(无需数学和Python基础)编码实现AI人工智能框架电子书

感谢各位网友一直以来对我们的信任和支持!现赠送各位家林老师发布的AI自研人工智能框架的最新电子书! 

下载地址:  

五节课从零起步(无需数学和Python基础)编码实现AI人工智能框架电子书V1.pdf 点击打开链接
https://pan.baidu.com/s/1W9ptXE0JBHgoZDtit5YCXw#list/path=%2F


导论:为什么人工智能是必然的未来

       非常高兴在美国硅谷通过网络和大家分享人工智能的内容,本课分享三个方面的内容:1、为什么一定需要AI?  2、AI为何如此强大? 3、学习AI的唯一正道是什么?国内的很多朋友在学习AI的时候遇见各种麻烦和数学的问题:例如,项目案例的问题,想理解TensorFlow或流行的人工智能框架内幕运行原理的问题,总是不得法门。在这章节中我们将逐步进行解析。前三章节的目标:将带领大家手动开发出自己的深度学习框架!不需要数学基础,不需要Python语言基础,一行一行的写代码,一行一行的测试,自己写深度学习框架、进行TensorFlow的深度学习,以及学习在业界突然崛起的、最流行的深度学习框架PyTorch,PyTorch来自Facebook,在科研界,PyTorch的流行度及被认可度已经远远超过了TensorFlow,虽然在工业界或商业界,主要使用的还是TensorFlow。我们自己写的深度学习框架的内核机制原理和TensorFlow、PyTorch是一致的。

1)     我们先谈第一个问题:为什么一定需要AI?

最伟大的科学家、物理学家之一的斯蒂芬·威廉·霍金(Stephen William Hawking),被认为是人类历史上继爱因斯坦之后最伟大的科学家,他在2014年曾发表一句名言:The development of fullartificial intelligence could spell the end of the human race。(人工智能的发展可能会终结人类),或者说人工智能是人类最后要做的一件事情。

2015年,霍金、特斯拉公司CEO埃隆·马斯克(Elon Musk)和苹果联合创始人史蒂夫·沃兹尼亚克(Steve Wozniak)与其他上百位专业人士共同签署了一封公开信,号召禁止人工智能武器。

2016年3月,人工智能业界发生了一件震惊世界的事件,阿尔法狗击败了我们这个星球上最出色的围棋选手,最特殊的地方在于阿尔法狗下围棋的时候使用了一种设计人员没有想到的围棋策略,这是人类人工智能里程碑式的进步和胜利,也是人类智慧里程碑式的进步和胜利。

2017年3月,霍金在接受英国《泰晤士报》采访时再次发出警告,“强大的AI是整个人类体验的最美好的或者是最坏的事情。人工智能进一步发展可能会通过核战争或生物战争摧毁人类”。

2017年7月,国务院正式发布《新一代人工智能发展规划》,明确把人工智能发展作为国家战略。作为二十一世纪的三大尖端技术之一(基因工程、纳米工程、人工智能),人工智能是高、精、尖的技术。国务院人工智能三步走的规划:第一步,到2020年人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点,人工智能技术应用成为改善民生的新途径,有力支撑进入创新型国家行列和实现全面建成小康社会的奋斗目标。第二步,到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济转型的主要动力,智能社会建设取得积极进展。第三步,到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。

2018年4月,业界发生轰动媒体的新闻,超过50名的人工智能专家和科学家共同抵制韩国科学技术院的一项研究计划,这项计划使用AI研究人工智能武器,在现场抵制的包括人工智能领域的一些大神,人工智能领域做出突出贡献的核心科学家如图1-1所示,其中2000年度及2010年度的科学家中很多人参与了抵制运动。

2018年4月,谷歌3000多名员工联名上书谷歌管理人员,抵制谷歌和美国政府的合作,合作的核心是通过谷歌领先的人工智能技术和军事科技进行合作,研发军事方面的人工智能武器。为什么人工智能武器这么可怕?核心是深度学习加上增强学习。 

       从技术的角度,为什么一定要使用AI人工智能?图1-2是显示人类进步的曲线图,反映了从公元2005年以前的进步曲线,即从人类诞生开始到2005年的进步曲线,X轴是时间,Y轴是人类的进步,人类进步曲线非常平缓。

如图1-3所示,在2005年前后,人类进步曲线突然垂直上升,从人类诞生到2005年有个很长的时间跨度,对比整个2005年以前的历史和现在2005年以后人类进步曲线垂直上升的比较,反映出2005年到2010年、2010年到2020年,2020年到2030年,2030年到2050年演进的方式。你处在人类文明空前大爆发的阶段,人工智能5年的时间相当于过去五千年人类进步的时光。 

如图1-4所示,从数据的角度观察数据的核裂变式增长,2005年以前人类历史上总共拥有的数据(书籍、音频、视频等)是130EB,2010年从130EB上升到1200EB,增长了约10倍;到了2015年,从1200EB增长到 7900EB,增长了约7倍;预计到2020年,将到达40900EB,从2015年到2020年增长了5倍。而2020年与从人类诞生到2005年以前的数据比较,增长了约300倍以上。      

如图1-5所示,面对数据的核裂变式增长,我们怎么办?数据收集、存储、管理都有成本,FaceBook、谷歌、Amazon等公司将用户数据收集起来,是否就为了做大数据?一开始的时候他们可能为了做大数据,但数据足够大的时候,为了提升单位数据的价值,必须求助人工智能。这里谈一下大数据,机器学习是大数据的核心之一,大数据也包括SQL、流处理、图计算等,但在真正人工智能的深度学习和增强学习面前,以前了解的机器学习和图计算只是开胃菜。

如图1-6所示,面对数据海量式的、核裂变式增长,数据科学家们使用Hive、数据库、或者使用Python、R语言进行处理,从2020年来看,数据科学家们能处理的数据大约是数据总量的10%,如果想依赖数据科学家来处理爆炸式增长的数据是远远不够的。 

在数据科学家们使用传统的方法(Hive、数据库)解决问题的基础上,图1-7中所示的机器上的方法是使用Hadoop、Spark进行处理,从大数据的视角,Spark是大数据处理的计算引擎;但从人工智能的视角,使用大数据进行的处理依旧不能满足数据爆发式的增长,这里大约处理15%-20%的数据。

       如图1-8所示,使用机器学习(包括Spark机器学习本身,处理15%-20%的数据)的基础上,进行人工智能处理。AI的处理能力由低到高分别为:机器学习、深度学习、增强学习。这里除了机器学习,还有一个向上的箭头,可以认为下面的三分之一为机器学习算法本身(线性回归、逻辑回归、K-means等),中间的三分之一是深度学习,上面的三分之一是增强学习。此时得出一个结论:人工智能的核心杀伤力是以深度学习为基础的增强学习。真正的人工智能就是深度学习、增强学习。要想体验、驾驭人工智能时代,核心是增强学习方向。

但现在人工智能业界运用最普遍的是机器学习,原因在于:第一点,因为很多企业的数据规模没那么大,也没那么迫切的需求提取数据的价值,第二点,没有足够的人才进行人工智能处理。

       FaceBook、谷歌、Amazon业界最领先的人工智能公司,他们的所有产品都在全面的深度学习化,一开始是机器学习和大数据公司,在全面的转向深度学习。在2020年以前,人工智能学习的核心是深度学习,深度学习是目前商业界最有价值和潜力的,深度学习应用于自动驾驶和演示人工智能武器等,在2020年以后可以增强学习为核心。

       增强学习的核心是实时的与环境进行交互,交互的能力可从环境交互中不断提升自己的能力,但其致命性的弱点是增强学习的数据不够多,因为是实时的交互。而深度学习最擅长的就是海量的数据处理,增强学习和深度学习的联合体,将使增强学习爆发出终极的潜力,也使深度学习的价值最大化。因此,2020年前要以深度学习为核心。

2)     人工智能为什么这么强大?

就像《狮子王》中谈到的:thepast can hurt. you can either run from it or learn from it(过去的经历可能会造成伤害,你可以不管这些东西,或者从中学到一些东西)。过去以前的编程和人工智能的编程有什么区别?机器学习、深度学习、增强学习以前的编程是不关心机器的经验的,以前的编程是根据你的经验和代码,无法根据现有的数据或发生的事件改变你的程序,流程各方面已经确定,无法从已有的数据或个体的数据进行学习,第一行代码,第二行代码,第三行代码......;而人工智能的核心,能从每次发生的事件中进行学习,并不断改进优化,然后用不断优化应对现在和未来的变化。科研界认为PyTorch比谷歌的TensorFlow好很多,因为PyTorch有个动态图的核心特性,可以随时修改图;TensorFlow是业界最核心主流的人工智能框架,TensorFlow是静态的,静态图根据已有的数据学习完成以后就不能再修改,而PyTorch学习完成以后可以动态改变,PyTorch是业界最先进的人工智能框架。

人工智能从每次的经历进行学习,用于下一次的行为改进。深度学习基于海量的数据完成这个过程,增强学习是实时的与环境进行交互,来完成这个过程。机器学习、深度学习、增强学习的算法如果不是从这个角度考虑的,那一定是错的。

如图1-9所示,TensorFlow网站(http://playground.tensorflow.org/)是TensorFlow公司提供给人工智能学习者从可视化图的角度看人工智能的神经网络到底是怎么运行的示意图。 

Data是数据,从数据里面提取特征(FEATURES),类似大脑的加工处理过程,对特征进行加工处理,如果想成为人工智能发展史上大神级别的人物,必须熟练操作微积分、线性代数、概率论、数理统计的数学知识,但是TensorFlow、PyTorch人工智能框架已经将一些深奥的内容实现了,通过Python、c、c++等编程实现,不需要具体对每一步进行数学推导,我们只需知道每一步的数据是怎么流动的,数据的处理过程,具体怎么做的,直接拿过来就可以使用。图中右边是输出,将数据进行逻辑分类,分成两种颜色的点,例如:哪些是垃圾邮件,哪些是垃圾短信,哪些是垃圾电话。点左上角的运行按钮,结果在output中进行显示,图上方的曲线是种子曲线,种子越小,精确度越高。运行一段时间以后,曲线不变动了。

再次运行,可以看到开始的精确度(Testloss)大于50%,例如预测是否是垃圾邮件,一个是对的,一个是错的,这个太糟糕了,我们的要求是1万分钟最多只有1个出错,谷歌就做到了。点击运行以后,立即查看损失曲线,及数据流动的过程,原先的Test loss是50%,现在Testloss可能变成了0.6%,训练的时候Trainingloss可能是0.2%。这是一个非常不错的结果,意味着1千封的垃圾邮件识别中可能有几封是错的,大部分预测是正确的。

       运行的时候中间有一些隐藏的网络层,其中有个Activation特别重要,国内将其翻译为激活函数,人工智能为什么能够学习?是由于动力的驱动,人工智能深度学习领域称之为激活函数,激活函数是深度学习的精髓,怎么提供动力也是人工智能科学家几十年来研究的内容。这里的激活函数包括:ReLU、Tanh、Sigmoid、Linear,这是人工智能深度学习本身最大的难点,人工智能框架的核心就在这里。为什么从这一步学到下一步,从下一步又学到下一步,为什么能改进下一次的行动,就是由于激活函数的作用,激活函数也会配合损失函数,核心就是Activation激活函数导致的。 

3)     学习AI的唯一正道是什么?

学习AI的唯一正道就是实际的商业案例学习,通过机器学习案例、深度学习案例、增

强学习案例学习人工智能。不需要数学基础,不需要Python语言基础,只有在真实场景中的学习才是最有效的学习。其中AutoEncoders、Boltzmann_machines是深度学习推荐系统中两个最核心的算法,这里不是指普通机器学习的推荐系统,而是指深度学习的推荐系统,深度学习的推荐系统肯定比普通机器学习的推荐系统更强大。推荐包括两个类型:第一个类型,用户会不会喜欢这个商品;第二个类型,对于商品,用户会打几星级评价,例如,对于一个产品,用户是给一星级评价、二星级评价,还是五星级评价。假设推一个电影,推荐系统能计算出电影的流行度等内容,这个对于投资人很重要。Self_Organizing_Maps算法可统计全国上班的统计图、消费的统计图、打车的统计图、流量的统计图等。其他包括Mountaincar算法等。

      为什么说不需要数学基础,不需要Python语言基础,直接就可以学习人工智能深度学习、增强学习的内容?原因很简单,例如牛顿、莱布尼茨等科学家是在解决实际问题的过程中,自然而然的得出一个数学公式,如果我们回到基于数据的真实场景,清晰看见数据每一步的处理,每一步的流动,就能自然而然的得到牛顿、莱布尼茨、笛卡尔等科学家得出的公式或算法,在人工智能中的学习过程中,重新“发明”了一门数学。

Python不需要学,Python是一门面向对象的函数式编程的语言,是一门编程者体验的语言,通过一两个案例达到熟练操作的地步,30个人工智能的案例通过Python编写,可达到Python开发高手的级别。

猜你喜欢

转载自blog.csdn.net/duan_zhihua/article/details/80116045