基于 AI大模型训练自己的小模型 - 代码天地

基于 AI大模型训练自己的小模型

业界资讯 2023-04-17 11:00:53 阅读次数: 0

先来看几个名词，有些小伙伴会比较懵，弄懂了基础概念，一些衍生的新名词理解起来就相对容易很多。ML，DL，NLP，这三个词不新鲜，已经应用很多年。

ML - Machine Learning,机器学习。AI 的一个分支,关注使用数据让计算机系统学习的方法。
DL - Deep Learning,深度学习。ML 的一个分支,使用神经网络和大量数据进行学习的方法，目前最成功的 ML 方法。
NLP -Natural Language Processing，是自然语言处理的缩写,是人工智能和语言学领域的一个重要方向，目前很多产品的交互都是基于自然语言的输入，都需要NLP技术作为入口与后端复杂的服务交互。

再看几个新名词，算是近几年里新生的，也都是在ML、DL领域长期深耕之后长出的果实。

LLM - Large Language Model,大规模语言模型的统称，它也是在DL深度学习技术之下的产出物。
GPT - Generative Pre-trained Transformer，GPT是一个基于DL的预训练语言模型，后面携带的数字标记为版本，比如GPT-1，GPT-2，GPT-3，GPT-3.5，最新对外版本是GPT-4。可以看作是LLM下的具体技术架构实现。
ChatGPT，是由OpenAI公司开发的一个基于GPT架构的产品，同类似的产品还是Google公司的Bard，Anthropic公司的Claude，Baidu公司的文心一言

知道自己在哪

一家公司承担做整个技术链条上的所有模块是相当困难的，各自专注自己领域，再对外提供服务，再组合起来形成新（创新性的）技术，比如iPhone里的很多技术并不是自己原创的，而是再次组合之后，整体形成的创新。我们来按链条的方式拆解一下AI领域：

上游，提供底层基础服务，芯片、算力、数据等，比如NVIDIA等
中游，搞大小模型算法的，比如各家的大模型、不同特定领域的算法
下游，做面向用户的应用开发，各种基于模型之上的搭建的应用，常见的套壳程序，基于 ChatGPT 的 New Bing等

猜你喜欢

转载自blog.csdn.net/hero272285642/article/details/130050934

基于 AI大模型训练自己的小模型

课程报名 | 基于模型训练平台快速打造 AI 能力

基于模型训练平台快速打造 AI 能力

如何基于模型训练平台快速打造AI能力

基于SuperMap iDesktopX的交互式AI模型训练与推理

AI数字人：基于VITS模型的中文语音生成训练

基于AI Studio和PaddleDetection的目标检测模型训练

基于ai studio训练paddle-paddle模型

基于paddlex图像分类模型训练（二）：训练自己的分类模型、熟悉官方demo

Tabby - 基于AI大模型的编程助手

【AI人工智能大模型】如何基于大模型打造企业的智能底座?

多家企业发布基于大模型的AI产品，大模型应用落地哪家强?

民谣女神唱流行，基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)

【AI大模型】训练Al大模型

AI毕业设计生成器（基于AI大模型技术开发）

基于densnet添加预训练模型的pytorch训练模型

【深度学习】基于caffe的表情识别（四）：在Intel AI DevCloud上训练模型

基于NB-IoT的智慧路灯监控系统（云端部署及AI模型训练）

0基础学AI-基于BiLSTM+CRF的NER模型（训练，加载调用，实体获取）

YoloV7:基于自己训练的模型如何导出正确的ONNX

【图像分类】基于pytorch训练自己的分类模型、并使用flask部署

基于语法树和概率的AI模型

基于spark on yarn with gpu的AI模型推理

基于spark on yarn with gpu的AI模型推理

基于NvidiaGPU的AI模型结构优化

基于tensorboard的模型训练可视化

基于fastreid训练行人属性模型

基于Pytorch+Bert的预训练模型

基于pytorch实现简单的分类模型训练

基于云端gpu训练nanodet网络模型

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)