深入理解生成型AI原理系列:初识生成型AI

如果将人工智能按照用途进行简单分类的话,笔者认为人工智能可以划分为决策型AI以及生成型AI两类。所谓决策型AI就是通过学习训练数据的中的条件概率分布情况来进行判断决策,比如人脸识别就是典型的决策型AI,终端设备根据摄像头获取到的人脸图像来进行特征信息匹配,和后台系统中的人脸特征库进行对比来判断当前人脸信息是否在系统人脸特征库中或者是否有权限执行操作。而生成型AI通过对大量数据的联合概率进行学习,对已有的数据和知识进行归纳总结,同时结合深度学习技术,自动生成新的内容,而新生成的内容可以是文字、图片甚至是视频等多模态内容。本系列文章主要阐述生成型AI的相关内容,解密其背后的技术原理以及未来的发展方向。

深度学习

上文中说到的深度学习其实是机器学习的重要组成部分,而机器学习又是人工智能领域重要的落地实现手段。因此要想理解深度学习,我们的先看下什么是机器学习,它存在哪些不足才催生出来深度学习。关于机器学习有这样的定义。

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

怎么理解这句话呢?举个栗子大家瞬间就明白了,假如你开发了一个和别人下中国象棋的程序。那么E就表示下象棋的经验,T表示下象棋这件事情,而P就是下象棋可以取胜的概率。所以如果你编写的程序可以通过不断下象棋获得足够多的下象棋的经验,而通过经验的累积又能够提高下象棋获胜的概率,那么我们就可以认为你编写的下象棋的程序具备机器学习的能力。那么这种根据经验来实现程序学习能力优化到底是通过什么工程技术来实现的呢?人工神经网络就是通过工程技术手段来落地模拟人脑神经系统的结构和功能从而实现机器学习。

image.png

人工神经网络

仿生学一直是人类追求进步的工具,比如人类希望像鸟一样飞行于是发明了飞机,人类希望像鱼一样潜入水底于是发明了潜水艇,人类希望机器能够像人一样进行思考推理,于是开始研究自身大脑运行机理。人们发现自身大脑是由数百亿个神经元组成,这些神经元本身结构并不复杂,而这些神经元互相协作才能完成信息的接收处理以及输出,从而构成人的感知,记忆,分析,思考等高阶行为能力。而且随着人年龄的增长,学习能力也是在不断增强。因此如果可以设计出类似人类神经网络能力具备学习能力的系统,那么机器也会像人一样学习进步。

实际上早在1943年,数学家皮茨(Pitts)和麦卡洛克(McCulloch)发表了论文《A Logical Calculus of Ideas Immanent in Nervous Activity》(《神经活动中思想内在性的逻辑演算》)建立了第一个神经网络模型M-P模型,能够进行逻辑运算,为神经网络的发展奠定了基础。直到2006年,人工智能通过⽆监督的学习⽅法逐层训练算法,再使⽤有监督的反向传播算法进⾏调优,这种无监督学习和有监督学习相结合的方法在人工智能领域掀起了深度学习的研究浪潮。听起来就很不明觉厉,简单理解的话就是多层神经网络模型。

大模型

以前我们需要对大量标注过的数据进行训练,这样训练出来的模型都是专门应对某一领域的专才,就像AlphaGo一开始他只会下围棋,你让它下中国象棋它就不会了,如果需要它具备下中国象棋的技能就需要重新训练一套模型来支持。这就好比我们早期的烟囱式的技术架构,都是针对某一项特定的业务场景来进行系统平台的建设。但是随着大数据技术的发展、GPU强大算力支撑以及模型不断迭代优化带来了深度学习技术长足发展,特别是大模型出现之后可以以海量无标注的数据中进行自我学习来进行预训练 ,从而获得具备通用知识能力的大模型,而后再結合特定领域知识以及训练任务进行模型微调训练,让大模型成为某个领域的专家模型。比如结合医疗领域知识,那么就可以通过微调任务得到医疗领域模型,如果结合法律领域知识,那么就可以获取到法律领域模型,而不需要再重新训练一套模型。其实大模型的训练过程和我们人类学习的过程是一样的,我们小的时候语数外政治历史地理物理化学生物啥都学,但是到了大学开始分专业,到了研究生就在特定的专业领城进行深耕,最终成为一个专业人才。看吧这个过程是不是和大模型的训练过程有异曲同工之妙。

image.png

总结

本文主要对生成型AI进行了初步阐述,同时针对生成型AI最核心的两个技术点分别进行了初步说明,后面的专栏文章中将继续以深度学习以及大模型核心技术点作为切入点来深入分析生成型AI背后的技术原理。希望通过系列文章的说明,让大家对于类似ChatGPT这样的生成型AI有一个更加深刻的理解。

扫描二维码关注公众号,回复: 15270312 查看本文章

猜你喜欢

转载自juejin.im/post/7243383094773235770
今日推荐