2020科大讯飞iFLYTEK A.I.开发者大赛

科大讯飞专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成，作为中国最大的智能语音技术提供商，在智能语音技术领域有着长期的研究积累，并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。

“iFLYTEK A.I. 开发者大赛”由科大讯飞发起的顶尖人工智能竞赛平台，汇聚产学研各界力量，面向全球开发者发起数据算法及创新应用类挑战，推动人工智能前沿科学研究和创新成果转化，培育人工智能产业人才，助力人工智能生态建设。

赛项获胜团队可直接获得大赛奖金，并有机会获得讯飞投资部的资本对接和投资青睐，成为具有投资倾向的种子团队。

2020届iFLYTEK AI开发者大赛于6月22日开幕，设置AI算法挑战赛和AI创新应用赛两类赛事，每类赛事下设多项赛题。聚集优质数据资源，覆盖主流业务场景。

开发者大赛赛题简介如下表所示：

2020 iFLYTEK A.I.开发者大赛赛题介绍
赛题计划	具体赛题	来源	赛题介绍
注意事项	大赛参赛选手招募从2020/06/22正式开始，其中，算法赛初赛作品提交截止日期为2020/8/22日；应用赛初赛作品提交截止日期根据不同赛题稍作区分，详见赛题时间节点描述；复赛时间暂定于2020/08/22-2020/09/22期间，之后为决赛阶段，至2020/10/24结束；另外，辩论赛参赛队伍不在此次招募计划中。
算法赛	视频广告场景识别	AI营销业务群	一、赛事背景视频广告是广告营销中的一种重要的广告形式，当前的视频广告以贴片广告(前贴、后贴)为主，贴片广告和视频的内容无关，营销场景化较弱。本次任务由讯飞AI研究院和讯飞AI营销云联合发起，旨在依托强大的AI算法，从视频内容中识别广告场景，优化用户的广告体验，为品牌提供实时高效的个性化场景营销解决方案。讯飞AI研究院主要致力于人工智能技术、智能语音及语言核心技术、人机交互核心技术的研究开发工作，在多项智能语音及语言核心技术上拥有国际领先的科研成果。讯飞AI营销云基于深耕多年的人工智能和大数据技术，赋予营销智慧创新的大脑，以健全的产品矩阵和全方位的服务，用AI+大数据实现企业营销效能的全面提升，打造数字营销新生态。二、赛题视频广告场景识别三、赛事任务视频结构化俗称视频“打标签”，即通过智能分析算法，在原始视频中提取出关键信息，包括商品商标、视频场景、特定人行为的识别判断等等，本次大赛提供了讯飞AI营销云海量的视频图像数据作为训练样本，参赛选手需根据提供的样本构建相应模型，深层次地理解视频内容并给出相应的结构化信息。
	语种识别挑战赛	研究院	一、赛事背景随着经济全球化发展和“一带一路”国家倡议的提出，跨境的国际合作和交流日益频繁，越来越多的中国企业正走向世界参与世界经济发展和管理，对多语种语音技术提出大量多样化的需求。“多语种语种分类挑战赛”旨在加强语种识别研究的交流、促进语种识别技术的发展。自2018年第一届方言挑战赛活动以来，多种实用、高效的语种识别技术在竞赛中得到打磨。本届竞赛将从真实场景和实际应用出发，新增了更具挑战性、更加务实的任务，期待业内同仁们能在这些任务上相互切磋、共同进步。二、赛事任务多语种语种分类挑战赛旨在增强多语种语言识别技术，本次挑战赛设置了更具挑战性的任务，相比其他竞赛，本次竞赛所提供的训练数据更少、语言种类更多、混淆度更高，总体为更贴近真实使用场景的竞赛任务，具体包含： • 初赛：短语音语种识别，该任务所要识别的有效语音时长仅为3秒左右。 • 复赛：高混淆度语种识别，该任务除了需要保障初赛集合的识别准确率之外，还需要识别较为相似的三种语言（埃及阿拉伯语、沙特阿拉伯语、阿联酋阿拉伯语）。
	X光安检图像识别挑战赛	研究院&苏研院	一、赛事背景讯飞看见X光智能安检信息化解决方案是针对安检场景推出的智能化、信息化解决方案，旨在将传统的安检业务场景，通过人工智能、大数据等先进技术手段进行赋能，辅助一线安检检查工作，为安检管理方提供量化数据与大数据预警等更多技术管理工具。 X光安检机是目前我国使用最广泛的安检技术手段，广泛应用于城市轨交、铁路、机场、重点场馆、物流寄递等场景。使用人工智能技术，辅助一线安检员进行X光安检判图，可以有效降低因为人员疲劳或注意力不集中带来的漏报等问题。但在实际场景中，因物品的多样性、成像角度、遮挡等问题，为算法的开发带来了一定的挑战。二、赛事任务本次大赛以讯飞看见智慧安检提供的X光安检图像数据作为训练样本，参赛选手需基于提供的样本构建模型，对X光安检图像中的违禁品进行检测和分类。
	自然场景文字检测	研究院	一、赛事背景讯飞翻译机是人们出国旅游、学习、商务洽谈的好帮手。除了具有出色的语音翻译功能，讯飞翻译机还拥有强大的拍照翻译能力，能帮助使用者轻松看懂路牌、菜单、说明书、产品包装、商品标签、书刊杂志、景点介绍等。精确地检测图片中的文字是拍照翻译的前提，同时也是一个难点问题，这是因为自然场景中的文字往往有着复杂的背景、多样的形状、颜色、大小、风格等特征。因此，如何提升文字检测效果以保证最终翻译结果的准确性，是一项十分具有挑战性的任务。二、赛事任务本次大赛提供的数据为讯飞翻译机采集的真实数据，语种包含中文和英文。其中训练集5000张，验证集1000张，测试集1000张。参赛者需基于提供的数据构建模型，标注出图像中文字所在的位置。
	多语种文本挖掘挑战赛	资源部	一、赛事背景智能语音语言技术旨在让机器“掌握”人类独有的语音和语言能力，包含语音识别、机器翻译等方向，是支撑万物互联时代人机交互升级、实现人类语言互通以及提高国家全球信息情报获取和态势感知能力的关键技术手段，是当前人工智能领域发展最为迅速、影响最为深远的技术之一。“多语种文本挖掘挑战赛”旨在加强语种间翻译研究的交流、促进多语种机器翻译技术的发展。本届竞赛将从机器翻译的文本挖掘技术出发，期待参赛选手们能在这些任务上相互切磋、共同进步。二、赛事任务多语种文本挖掘挑战赛旨在增强多语种语料清洗和挖掘技术，本次挑战赛设置了更具挑战性的任务，相比其他竞赛，本次竞赛所提供的训练数据更广，噪音数据也更多，具体为： 1. 我们提供从开源语料库爬取的包含多个语种单语网页的原始语料库； 2. 参赛者需从原始语料库中进行中文和日语（初赛）以及中文和意大利语（复赛）的文本对齐，并提交每对语种10万句对齐后的双语平行句对，提交的语料需按语料质量从高往低排序； 3. 参赛者将双语句对及句对在网页中的对应位置提交官方，我们根据网页位置提取原始语料，通过机器翻译模型进行统一处理，并使用Bleu分评测工具对处理结果来进行评分，以Bleu分评价参赛者筛选出来的数据质量，Bleu分越高，数据质量越好； 4. 我们在比赛结束后，提供比赛评分使用的翻译模型接口和Bleu分工具，方便参赛者验证结果。
	脑PET图像分析和疾病预测挑战赛	安徽大学计算机学院	一、赛事背景脑PET(Positron Emission Tomography )全称为脑部正电子发射计算机断层显像，是反映脑部病变的基因、分子、代谢及功能状态的显像。它是利用正电子核素标记葡萄糖等人体代谢物作为显像剂，通过病灶对显像剂的摄取来反映其代谢变化，从而为临床提供疾病的生物代谢信息，为脑癫痫病、脑肿瘤、帕金森病、阿尔茨海默综合症等提供了有效的检测手段。可利用脑PET图像检测出早期阿尔茨海默综合症病灶，并提前介入治疗，从而延缓发病，对后续患者康复治疗有着积极的意义。因此本赛题以阿尔茨海默综合症为例对脑PET图像进行分析与疾病预测。二、赛事任务为研究基于脑PET图像的疾病预测，本次大赛提供了脑PET数据集训练样本，记录了老年人受试志愿者的脑PET影像资料，其中50%是被确诊为轻度认知障碍（MCI）的脑影像数据，25%是阿尔茨海默综合症（AD）患者的脑影像数据，25%健康人（CN）的脑影像数据。被试按医学诊断分为三类： C N：健康 MCI：轻度认知障碍 A D：阿尔茨海默综合症参赛者需根据提供的样本构建模型，对阿尔茨海默综合症进行分析和预测。
	婴儿啼哭声识别挑战赛	中国科学技术大学	一、赛事背景对婴儿来说，啼哭声是一种通讯的方式，一个非常有限的，但类似成年人进行交流的方式。它也是一种生物报警器，向外界传达着婴儿生理和心理的需求。基于啼哭声声波携带的信息，婴儿的身体状况才能被确定，疾病才能被检测出来。因此，有效辨识啼哭声，成功地将婴儿啼哭声“翻译”成“成人语言”，让我们能够读懂啼哭声的含义，有重大的实际意义。本届竞赛将从真实场景和实际应用出发，新增了更具挑战性、更加务实的任务，期待参赛选手们能在这些任务上相互切磋、共同进步。二、赛事任务婴儿啼哭声识别挑战赛旨在判别婴儿啼哭声所传递的信息，本次挑战赛设置了更具挑战性的任务，相比其他竞赛，本次竞赛所提供的训练数据更少，总体为低资源的竞赛任务，具体包含： • 初赛：训练数据集每类啼哭声只包含两条音频数据，简单噪声环境下识别。 • 复赛：复杂噪声环境下婴儿啼哭声识别，判断容易引起混淆的啼哭声，分析各类啼哭声的明显特征及简单直接的判别方式。
	温室温度预测挑战赛	中国农业大学	一、赛事背景随着计算机技术的发展，我国逐渐实现了从传统农业到现代农业的转变，正逐步迈向智慧农业。温室是现代农业技术应用的典型场景，其内部环境具有可操作性，能人为形成适宜植物生长的小型封闭生态系统，提升农产品的产量和质量，因此被广泛应用于农业生产中。在温室的各项环境因子中，作物对温度最为敏感。温度的高低影响植株细胞的酶活性，从而影响作物的生长速度、产量和质量，因此温度对作物生长发育影响极大。为了保证农产品的产量和质量，应保证作物正常生长，需对温室温度进行精确的调控。二、赛事任务温室温度调控需要对温室温度进行精准的预测，本次大赛提供了中国农业大学涿州实验站温室内外的传感器数据作为训练样本。参赛选手需基于提供的样本构建模型，对温室内的温度进行预测。
	农技知识数据处理挑战赛	中国农业大学	一、赛事背景农业生产中，由于过程的主体是生物，存在多样性和变异性、个体与群体差异性，农业大数据中存在许多的专业名词，如农作物、病虫害、土壤修复、施肥方案、生理胁迫、种苗、疑难杂症、缺素、天气条件、地理信息等，尤其是非结构化的数据快速增长，如何挖掘数据价值、提高数据分析应用能力、减少数据冗余和数据垃圾，是农业大数据面临的重要问题。二、赛事任务数据处理的首要任务是标记命名实体，本次大赛提供了农技专家对农技问题的回答数据（也称为农技知识数据）作为训练样本，参赛选手需基于提供的样本构建模型，对农技知识数据进行标记切词。
	多模态情感分析与识别挑战赛	西北工业大学	一、赛事背景人工智能是通过计算机程序来模拟呈现人类智能的技术。当智能可以被模拟，人类的情绪与情感是否也可以模拟？如果与我们交互的机器，不再是冷冰冰的“机器”，而是能够感知我们的情绪，能够对应不同的情绪触发不同的人机交互模式，模拟人类的表情、声音、与我们共情，那时的人工智能才是真正实现了“有温度的”智能产品的梦想。然而，如何让机器能够有效感知我们的情绪状态呢？基于此，向广大人工智能开发者发起情感分析与识别的挑战，从听觉、视觉、脑电、心电等维度解开人类情感状态的密码。二、赛事任务情感识别挑战赛旨在增强机器的情绪识别能力。本次挑战赛由西北工业大学智能声学与临境通信研究中心提供自然环境下和消声室环境下的多模态情感识别数据库，其中包括在不同情绪唤起条件下的语音、面部视频、心电（ECG）、脑电（EEG）等数据。参赛者将利用信号分析、机器学习、模式识别、数据挖掘等方法，找出情感分析与判定的关键多模态要素，探索自动情感识别方法、情感识别与判定可信度评估方法等。本次挑战赛设置了更具挑战性的任务，相比其他竞赛，本次竞赛所提供的训练数据更少，数据类型更多，总体为低资源的竞赛任务。挑战赛数据库包括29名受试者在平和、开心、愤怒、伤心四种情绪干扰下的语音、面部表情、脑电、心电四种的生、心理和行为数据，所有数据都分别在“自然环境”和“低噪声理想环境”两种实验环境下采集完成，每种类型数据时长约2小时。“自然环境”数据中包含有自然环境干扰，包括噪声、回响、及电磁干扰。而“低噪声理想环境”数据采集于西北工业大学消声暗室环境，大幅降低噪声、回响、及电磁干扰。参赛人员可选择下列题目参与挑战： 1. 通过脑电数据（EEG）进行情绪识别； 2. 通过心电数据（ECG）进行情绪识别； 3. 结合语音与视频的多模态学习，进行情绪识别。为增加挑战难度，测试集数据中的受试者完全独立于训练集数据中的受试者。提示：设计过程可考虑人与人之间的“个体差异性”以优化算法设计。
	事件抽取挑战赛-云孚科技	能力星云	一、赛事背景事件抽取将非结构化文本中的事件信息展现展现为结构化形式，在舆情监测、文本摘要、自动问答、事理图谱自动构建等领域有着重要应用。在真实新闻中，由于文本中可能存在句式复杂，主被动转换，多事件主客体共享等难点，因此事件抽取是一项极具挑战的抽取任务。二、赛事任务本赛事任务旨在从通用新闻文本中抽取事件触发词、事件论元以及事件属性。在传统的事件定义中，事件由事件触发词( Trigger) 和描述事件结构的元素 (Argument) 构成。事件触发词标识着事件的发生。事件论元为事件主体(Subject)、客体(Object)、时间(Time)、地点(Location)等，是表达事件重要信息的载体。事件属性包括事件极性（Polarity）、时态(Tense)，是衡量事件是否真实发生的重要依据。通过极性，事件分为肯定、否定、可能事件。通过时态，事件分为过去发生的事件、现在正在发生的事件、将要发生的事件以及其他无法确定时态的事件。本赛事任务一为初赛任务，任务二为复赛任务，在任务一的基础上增加了事件属性识别。为了模拟真实场景，数据中包含了非实际发生的事件。
应用赛	数字城市赛道	深圳青创会	一、赛题背景新一轮科技革命将围绕5G、AI、IoT等技术展开，智能一切、万物互联的时代即将到来。数字城市作为传统城市的升级形态，以数字化、智能化的能力改变着城市发展，是城市迈向智能化的必经之路。二、赛事任务基于讯飞开放平台开放的人工智能技术，使用智能语音、人脸识别、文字识别等多项AI能力，围绕数字地图（城市地图信息化智能化）、数字政府（政府管理与决策的信息化智能化）、数字企业（企业管理的信息化智能化）、数字生活（市民公共生活服务的信息化智能化）进行AI产品的开发（软硬件不限）。
	无人系统机器人挑战赛	研究院&苏研院	一、赛题背景在新冠病毒疫情的影响下，由机器人构建的无人作业系统价值凸显。通过减少人与人之间的接触可以有效防止疫情扩散。酒店配送、无人清洁、无人消毒等场景的机器人应用得到了广泛推广。移动机器人与机械臂是机器人最为常见的两种形态，涉及到的主要核心技术有机器人自主导航和机械臂运动规划等，在实际应用场景中复杂多变的环境给机器人的落地应用带来很多阻碍，如何让机器人安全且高效地完成作业内容成为各机器人企业和科研院校的研究重点。二、赛事任务本次大赛以科大讯飞（苏州）科技有限公司提供的机器人平台作为竞赛平台，要求参赛选手在100分钟内，根据赛前提供的任务书和有关资料完成竞赛任务。 1.平台安装及预调试部署（50分钟以内）； 2.在完全无人干预的情况下完成比赛任务（30分钟以内），任务分为多个阶段并由多个子任务组成，首先移动机器人自主导航至任务发布站通过图像识别获取任务信息，本次比赛以垃圾分类为主题，获取的任务信息即需要运送的垃圾种类；然后移动机器人移动至垃圾分类站，与机械臂配合将与任务要求的垃圾种类相匹配的垃圾卡片检测出来并放置移动机器人指定位置，最后移动机器人载放指定运送的垃圾自主导航回到出发点；
	语音技能开发	iFLYOS	一、赛题背景 AI+应用的探索赋予未来无限可能，人工智能重新定义了人机交互。讯飞开放平台开放语音听写、语音合成、语音评测、机器翻译，人脸识别，声纹识别等十余项人工智能核心技术，促进人工智能应用场景的落地。二、赛事任务选手基于讯飞开放平台开放的人工智能技术，开发一款产品（软件或硬件），作品形式不限。
	海外赛题	NTCU-Income 新加披	一、项目背景如今，智能医疗已成为一项越来越重要和有前景的工程，尤其是为了防止大规模疾病的发生，因此，智能医疗的概念逐渐浮出水面。智慧医疗利用物联网、大数据、云计算、人工智能等新一代信息技术，全面改造传统医疗体系，让医疗更高效、更便捷、更个性化。旨在介绍智能医疗的概念。二、项目任务如何使用人工智能作为一个部分来建立和/或授权预测性(国家或集群)医疗保健系统?也就是说，如果你有任何由患者健康记录组成的Infosys(任何给定的医院或国家健康记录档案)，你如何使用人工智能来分析健康数据，并预测任何人可能遇到的潜在未来症状，然后推荐治疗或药物。
	AR空间计算创新应用挑战赛	视辰科技-Easy AR	一、赛题背景稀疏空间地图Sparse Spatial Map：提供了扫描物理空间的同时生成点云地图并进行实时定位的能力，开发者可以快速基于现实空间创建应用，如AR说明书以及AR导航导览等。在点云地图上部署的虚拟内容，同时也会被持久化放置在现实空间中，实现虚拟世界和物理世界的连接。此外，多人AR功能也能在此基础上实现。二、赛事任务选手基于 EasyAR Sense（SDK）的稀疏空间地图Sparse Spatial Map的功能，开发一款行业细分场景的应用。
	基于无人机设备的技能开发	大疆创新	一、赛题背景近年来，大疆行业无人机被应用于超过20个领域，上百个应用场景，例如警用安防，电网巡检，矿业勘探，建筑测绘，精准农业，影视航拍，视频直播等。随着大疆不断提升并开放无人机的软硬件能力，在全球有超过十万开发者和合作伙伴使用大疆SDK为客户提供了丰富多彩的应用，例如无人机租赁的DroneBase, 测绘领域的龙头DroneDeploy, 土方工程测量的奇志科技, 风机自动巡检的扩博智能，智能自动飞行系统的复亚智能。随着行业需求的爆发式增长和无人机能力进一步提升，很多新的场景亟需开拓。这些年来，我们一直致力于让更多的人靠无人机简化他们的工作，提升效率和人身安全。二、赛事任务基于大疆开放的软硬件SDK，完成一个行业细分场景的应用。无人机的开放能力如下：赛题内容需紧贴特定行业具体应用场景，开发的内容可以包括但不限于如下几个类别： 1）假如你有硬件开发能力，可以考虑基于PSDK开发一款可搭载在无人机上的负载（一般为某类传感器或摄像头），并通过MSDK开发app获取传感器数据进行后处理和分析。 2）假如你是软件背景，可以考虑开发app和web应用，管理无人机业务和数据。 3）假如你对无人机的操控感兴趣，可以考虑使用Onboard SDK来完成无人机边缘计算，并实时通过无人机获取的信息改变对无人机的操控。 4）假如你是某个行业的专家，目前面临的困难不是无人机的信息采集和应用，而是某些比如缺陷识别算法。你可以可以不用基于大疆sdk，而是单独完成这个算法。当然，你也可以组合上面各个模块，完成一个综合的完整解决方案。所需要的条件并不复杂，一台无人机和电脑，就可以开发出丰富多彩的应用。您可以在developer.dji.com上找到所有需要的文档、案例，在论坛可以跟全球的大牛们交流技术。哪怕手边没有无人机，如果能提出一个好的点子也是不错的，我们对于进入决赛的队伍会提供开发调试设备和团队里的无人机专家资源，帮大家一起实现想法。
	企业大数据应用赛道	合合科技	一、赛题背景随着国家持续加速推进信用社会建设，大数据在其中起到关键作用。但是信用信息在企业的信用交易中尚未广泛使用，应用领域和应用方式都有很大的潜力可以挖掘。二、赛事任务以企业大数据为基础完成一个系统和方案，支持传统企业信用交易、供应链风险控制、企业营销等各种与企业经营相关的方向，参赛作品若需使用企业数据，优先建议使用启信宝的一类数据（https://doc.qixin.com）。
	通用开发赛道	开放平台	一、赛题背景 AI+应用的探索赋予未来无限可能，人工智能重新定义了人机交互。讯飞开放平台开放语音听写、语音合成、语音评测、机器翻译，人脸识别，声纹识别等十余项人工智能核心技术，促进人工智能应用场景的落地。二、赛事任务选手基于讯飞开放平台开放的人工智能技术，开发一款产品（软件或硬件），作品形式不限。
	智慧金融赛道	精诚科技
公益赛道	软件赛道	中国聋协、中国辅具	一、赛题背景社会的需求与科技的进步，带来了人工智能、语音技术等方面的发展，也给智能辅具注入新的活力。可以预计，层出不穷的社会问题以及人们对生活质量要求的提高，将是智能辅具发展的又一个机遇。因此，本届赛题将以智能辅具为方向，旨在汇聚创新资源，引领产业发展，促进产业创新，不断丰富产品和服务供给，让所有人都可以平等地享受现代文明。二、赛题任务本道赛题为公益辅具软件类赛道。以讯飞A.I.能力为支撑，让所有特殊人群可通过语音方式在不同场景下实现生活帮助、学习社交、娱乐休闲等功能。参赛作品须至少需要或使用一项讯飞开放平台的技术，使用语音相关A.I.能力优先调用讯飞开放平台技术接口。优先考虑具有社会属性、公益属性的参赛团体或个人。
公益赛道	硬件赛道	中国聋协、中国辅具	一、赛题背景社会的需求与科技的进步，带来了人工智能、语音技术等方面的发展，也给智能辅具注入新的活力。可以预计，层出不穷的社会问题以及人们对生活质量要求的提高，将是智能辅具发展的又一个机遇。因此，本届赛题将以智能辅具为方向，旨在汇聚创新资源，引领产业发展，促进产业创新，不断丰富产品和服务供给，让所有人都可以平等地享受现代文明。二、赛题任务本道赛题为公益辅具硬件类赛道。以讯飞A.I.能力为支撑，让所有特殊人群可通过语音方式在不同场景下实现生活帮助、学习社交、娱乐休闲等功能。参赛作品须至少需要或使用一项讯飞开放平台的技术，使用语音相关A.I.能力优先调用讯飞开放平台技术接口。优先考虑具有社会属性、公益属性的参赛团体或个人。
辩论赛		讯飞开放平台	A.I.辩世界是科大讯飞公司面向广大开发者及人工智能爱好者举办的A.I.类主题辩论比赛，赛制包括初赛、复赛、四强赛、总决赛四个阶段。根据队伍年龄段分为不同赛道，从不同年龄段的视角讨论A.I.热点话题。作为当下主流科技的发展趋势，人工智能越来越受到各界的广泛关注，关于A.I.的话题也越来越多。通过辩论赛的形式讨论A.I.热门话题，更深层次的了解A.I.，关爱开发者，聆听开发者的心声。

大赛官网：http://challenge.xfyun.cn/

关注公众号，发送关键字：2020科大讯飞开发者大赛，获取科大讯飞2020 iFLYTEK A.I.开发者大赛文档。

2020科大讯飞iFLYTEK A.I.开发者大赛

猜你喜欢