AI学习与进阶实践
智慧教育
AI创业与投资
AI行业新趋势
计算机视觉技术与实践
大数据与AI中台
语音语义技术实践与应用
为商业搭建语言桥梁
阿里巴巴 达摩院 语言实验室 司罗
自然语言处理
自然语言智能研究实现人与计算机之间用语言进行有效通信,融合语言学、心理学、计算机科学、数学、统计学于一体的科学,涉及到自然语言和形式化语言的分析、抽取、理解、转换和产生等多个课题。
自然语言处理是实现完整人工智能的必要技术。
- 自然语言智能趋势
深度语言模型
突破式发展,引领重要自然语言技术取得进展- 共有云NLP技术服务从通用功能走向
定制化服务
- 自然语言技术逐步与
行业/场景
紧密结合,产生更大价值
翻译技术平台
- 阿里机器翻译技术
NLP自学习平台
- 背景:NLP需求多而杂,场景化、行业化有高度的定制依赖,很多数据有高度的隐私,而且缺少平台化的解决方案。
- 定位:面向零算法基础用户的定制化标注、训练、预测的一体化服务平台。
- 优势:易用(流程简单)、快捷(训练一个简单模型仅需半个小时)、专业(众多数据抽象模型)、成本低(私有化部署)
- NLP自学习平台-示例
语言模型
- 语言模型:描述自然语言的表示,顺序,结构,意义,生成的过程,以及如何使用与语言相关的应用
- 语言学习法:使用语言学文法(如上下文相关文法)来描述正规的语言表示形式和意义–新语言,新语法,新意义在不断的变化和涌现,纯规则的方式局限性大。
- 数据驱动方法–统计学/深度学习。通过大量的语料和一些相关应用任务,学习语言的表示和结构–利用海量的语料信息自学习,适用于广阔场景和应用
- 预训练语言模型-StructBERT
- 预训练语言模型-融合结构化信息
- 预训练语言模型-排序、机器阅读理解
- 自然语言智能数据知识、技术、场景迭代
- 电商翻译业务场景
- 钉钉翻译服务
- 地址信息管理系统
- 事件分析
- 泛通信
- 智能司法
- 智能合同
- 智慧医疗
总结
- 构建阿里巴巴自然语言技术体系,支撑阿里经济体语言技术和应用
- 赋能合作者,发展普惠的自然语言技术
- 创新自然语言技术,探索未来智能