大模型可信与可控 - 代码天地

大模型可信与可控

业界资讯 2023-08-12 18:25:47 阅读次数: 0

世界人工智能大会（WAIC）今天在上海开幕，得到了全球创业者、学者和政府的关注。与此同时，OpenAI 今天也宣布组建新的团队，以开发引导和控制 “超级智能”。大模型安全一直是绿洲关注的重要方向之一，也就此领域在全球范围内访谈了很多学者。我们结合前沿学术论文观点和众多访谈，梳理了上下两篇围绕安全主题的文章，这是第一篇，希望帮助大家理解如何使大模型生成的内容更可信并且可控。Enjoy

Part I：两大流派

关于增强 LLM 的可信与可控性，目前学术界有两大流派：

1. 端到端会话模型（E2E Conversational Model）：基于对模型自身的提升

2. 基于管道的会话模型（Pipline-based System）：基于对用户输入以及输出的控制

I. 端到端会话模型

通过优化端到端对话模型，是学术界关于提高安全性最关注的方向。这个方向的发展在很大程度上依赖于受控文本生成技术的发展，其中可控性可以被视为对话响应生成中的一个重要属性。这个方向的提升一般从预处理、训练、推理三个主要阶段着手。

1. 数据预处理

LLM 模型的响应内容主要依赖于其训练语料库，因此预处理阶段去除不安全数据、将安全数据添加到训练语料库中，可以直接有效地对对话系统的最终行为产生重大影响。OpenAI 的 GPT 系列模型在训练中使用了大量的文本数据

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/132149764

大模型可信与可控

电力行业首个自主可控的大模型发布

AI大模型报告：2023大模型可信赖研究报告

阿里大模型VideoComposer火了！时间、空间可控的视频生成走进现实

GPT 大模型的应用路线图：可控性是最强路标 | The Roadmap of Generative AI

活动报名 | 图可信学习与图大模型研究进展

清华大学携手蚂蚁集团，攻坚可信AI、安全通用大模型等关键技术

字节李航等发表最新《可信赖的大型语言模型》综述，提出七大维度

天眼查联合华为云发布全球首个商查大模型：“天眼妹”可信商业助理

九章云极DataCanvas公司入选可信开源大模型产业推进方阵首批成员

分类模型的可信度评估

微前沿 | 第1期：强可控视频生成；定制化样本检索器；用脑电重建视觉感知；大模型鲁棒性评测

HyperAI超神经 x 中国信通院 | 可信开源大模型案例集汇编（第一期）即将发布！...

瑞数信息加入UOS主动安全防护计划(UAPP)，构筑可信可控的数字安全屏障

开源了！UniControl：可控视觉生成的统一扩散模型

ACM MM 2023 | CLE Diffusion：可控光照增强扩散模型

关于手机的三大谣传千万不可信

秒云加入OpenCloudOS操作系统开源社区，携手打造更智能、更可控、更可信的云原生环境

大模型、AI大模型、GPT模型

LLMs：大型语言模型进化树结构图之模型(BERT-style/GPT-style)、数据(预训练数据/微调数据/测试数据)、NLP任务(五大任务+效率+可信度+基准指令调优+对齐)、三大类模型的使用

VisorGPT: 如何基于 GPT 和 AIGC 模型定制一个可控的生成模型

内外部大附件收发如何做到可管可控？

【笔记】大模型，大资料

【大模型】—GLM大模型介绍

【AI大模型】训练Al大模型

【大模型】—AI大模型总体概述

大模型时代-大模型开发入门

港大和微软提出Uni-ControlNet：可控制扩散模型再添一员！

ICCV 2023 Oral | HumanSD：更可控更高效的人体图像生成模型

从专用模型到大模型

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)