人工智能之AAAI2023 | 百度+中科院提出USM：一种信息抽取的大一统方法 - 代码天地

人工智能之AAAI2023 | 百度+中科院提出USM：一种信息抽取的大一统方法

业界资讯 2023-04-07 12:11:15 阅读次数: 0

一句话总结

信息抽取任务具有多样的抽取目标和异构的结构，而传统的模型需要针对特定的任务进行任务设计和标签标注，这样非常的耗时耗力。本文提出一种USM方法，将各种信息抽取任务通过一种统一的模型方法完成。

论文: Universal Information Extraction as Unified Semantic Matching
链接: https://arxiv.org/pdf/2301.03282.pdf
单位: 百度、中科院

USM

信息抽取（IE）的挑战在于标签模式的多样性和结构的异构性。

传统方法需要针对特定任务的模型设计，并且严重依赖昂贵的监督，因此很难推广到新模式。

在本文中，我们将 IE 分解为两种基本能力，「结构化」(Structuring)和「概念化」(Conceptualizing)，它们由不同的任务和模式共享。

基于这种范式，我们建议使用「统一语义匹配 (Unified Semantic Matching, USM)」框架对各种 IE 任务进行通用建模，该框架引入了三个统一的标记链接操作来建模结构化和概念化的能力。

这样，USM 可以联合编码模式和输入文本，并行地统一提取子结构，并按需可控地解码目标结构。

本文的贡献为：

算法细节

实验分析

对 4 个 IE 任务的实证评估表明，所提出的方法在监督实验下实现了最先进的性能，并在零/少镜头传输设置中表现出强大的泛化能力。

USM在不同数据集上的结果

零样本迁移实验

少样本实验

总结

在本文中，我们提出了一个统一的语义匹配框架——USM，它对提取模式和输入文本进行联合编码，并行地统一提取子结构，并按需可控地解码目标结构。

实验结果表明，USM 在监督实验下实现了最先进的性能，并在零/少场景设置下表现出强大的泛化能力，验证了 USM 是一种新颖、可传输、可控和高效的框架。

对于未来的工作，我们希望将 USM 扩展到 NLU 任务，例如文本分类，并研究 IE 的更多间接监督信号，例如文本蕴含。

猜你喜欢

转载自blog.csdn.net/weixin_44292902/article/details/129295748

人工智能之AAAI2023 | 百度+中科院提出USM：一种信息抽取的大一统方法

【2023 CSIG垂直领域大模型】大模型时代，如何完成IDP智能文档处理领域的OCR大一统？

人工智能之搜索方法

跟我学代码架构设计模式之--命令式编程、流式编程、异步、同步、阻塞非阻塞概念理论大一统

回顾2023百度云智大会：人工智能的未来之路

人工智能-一种现代的方法全文总览

人工智能数学之信息论

人工智能之不确定推理方法

人工智能之深度学习的学习方法

中科大2023春季【高级人工智能】试题回顾

信通院发布《人工智能伦理治理研究报告（2023年）》

2023年度盘点：AIGC、AGI、GhatGPT、人工智能大模型必读书单

2023年度AI盘点 AIGC|AGI|ChatGPT|人工智能大模型

2023年度佳作：AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战

跟着彭亮一起学人工智能之深度学习--零基础学人工智能

Roma - Facebook工具链大一统

前端「大一统」时代已来？

大一统视角理解扩散模型

大一统视角理解扩散模型（三）

简述人工智能（一）

人工智能-实验一

有一种技术叫人工智能，有一种崛起叫人工智能，Ready？

获中科院战略投资，开启人工智能大应用时代

中科院院士谭铁牛：人工智能发展需要理性务实

2021年最新中科院人工智能领域顶级期刊及顶级会议

新加坡国立大学提出NExT-GPT：「大一统」通用多模态大模型

一种能人类大脑信息解读成声音信息的人工智能

第二届人工智能与智能信息处理技术国际学术会议（AIIIP 2023）

百度研究院：2020年10大人工智能科技趋势

人工智能一种现代的方法 --第2章智能Agent

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)