详细解读ChatGPT


前言


ChatGPT是什么?我调用了api_key对它提问,大家可以先来看一下它自己是如何介绍自己的。
在这里插入图片描述

一、ChatGPT的本质

chatgpt是基于语言模型的自然语言处理系统,语言模型是由数学公式构建的模型。
chatgpt只做了两件事:
1、理解自然语言,明白人类的意图。
2、产生自然语言的文本,满足人的要求。

二、语言模型的发展阶段

1、20世纪70年代,贾里尼克博士(数学、通信)研究语音识别方向,首次提出了语言模型的概念。语音识别技术利用了通信中的编码、解码等算法,后来又加入了上下文信息。20世纪90年代,彼得∙布朗利用语言模型实现了英语和法语之间的自动翻译。
2、20世纪90年代后,语言模型中加入了语法信息和语义信息,可以在不增加数据量的情况下大大提高语言模型的能力,但是计算量变得非常大,所以后来的研究人员致力于提高计算机算力及算法效率。
3、2010年前后,Google开发了深度学习的工具Google大脑:一方面,能更有效地利用计算资源,这使得语言模型能够越做越大;另一方面,也让模型计算出的概率越来越准确。语言模型的发展由此进入第三阶段。今天,计算机通过句子的语法结构,可以理解常见的名词、动词和形容词,于是,它就能理解这句话的含义。

三、语言模型的能力边界

语言模型能做的事情可以分为三类:
1、信息形式转换:这是将信息从一种形式转换为另一种形式,无论是语音识别还是机器翻译,都属于这一类。
2、根据要求产生文本:目前像回答问题、回复邮件、书写简单的段落,都属于这一类。向chatgpt提要求,让它反复修改可以提升文本质量。
3、信息精简:为论文撰写摘要、按要求进行数据分析等。

四、ChatGPT如何回答问题?

人类是如何回答问题的呢?人类遇到问题时,有三种途径能够回答。
1、知道答案直接回答;
2、根据现有知识推出答案;
3、通过实验和探索研究得出答案。
chatgpt如何回答问题呢?
1、简单问题:利用语言模型回答问题,不是一个问题对一个答案这样简单的匹配,而是对于问题给出多个答案,而且最近的内容赋予较高的权重,然后根据答案的概率排序,返回一个最可能的答案。
2、复杂问题:chatgpt回答问题、写作都基于它对语言数据库中的信息进行抽取和整合,或者说归纳总结。你输入给它什么训练数据,它就给你写出什么样的文章。

五、ChatGPT的缺陷

1、chatgpt的训练数据不足(数据未更新)导致的输出错误,写作具有明显的AI特征。
2、优质数据,优质输出。垃圾数据,垃圾输出。
3、chatgpt训练过程需要进行大量的数据标注,数据标注人员的意识形态和错误会在一定程度上影响模型的客观性。

六、ChatGPT需要的资源

1、数据:chatgpt的训练数据主要来自于互联网上的大规模文本语料库,其中包括维基百科、新闻文章、社交媒体、网络论坛等。此外,还有一些特定领域的数据集,如医疗、法律等。总之,训练数据集规模庞大,来源广泛,尽可能的涵盖了不同领域和场景的语言表达。
2、算力:训练 GPT-3 模型时,OpenAI 使用了数千块 V100 GPU 和数百块 TPU,并且每个 GPU 或 TPU 都有 16GB 或者更多的显存。而且训练过程需要多次迭代和优化,因此需要大量的计算和存储资源,以及高速的数据传输资源。
3、算法:
①分词算法:将一段文本分割成单词粒度,比如基于空格分词或者基于模式匹配分词。
②词向量算法:将每个单词转换成低维稠密向量,在计算机中无法直接操作单词,将其转换为向量能够更好的让计算机了解表意。
③序列编码算法: 例如,LSTM和GRU等循环神经网络(RNN),能够理解先前输入的内容对后续内容有什么影响。
④解码器算法:这是生成自然语言文本的过程,类似与对数据进行自动生成,例如,Transformer等。

七、人工智能的边界在哪里?

ChatGPT的边界是人工智能的边界,而人工智能的边界是数学的边界,数学是有边界的。
1、在1931年,25岁的数学家哥德尔证明了,数学体系不可能既完备又一致。
2、上个世纪60年代末,22岁的马季亚谢维奇得出:对于某一类数学问题(不定方程整数解的问题),没有一个方法,通过有限步就能判断它有没有解。
3、图灵发明了一种叫作图灵机的装置,它能够在有限时间内,判断哪一类问题能够在有限的步骤内计算出来。
在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/a_13572035650/article/details/130461501