知识图谱工程师:为人工智能“塑造大脑”

  获取数据、清洗数据、挖掘数据、存储数据、更新数据并最后应用数据,是知识图谱工程师张凯每天的工作内容,用他自己的话说,他是在给人工智能“塑造大脑”。

  2017年硕士毕业后,张凯通过校招进入深圳狗尾草智能科技有限公司人工智能研究院,成为狗尾草知识图谱团队中的一员。“2017年以前,公司的人工智能研发岗位统称为语义工程师,在我入职的那一年,随着团队规模的扩大,以及战略研发投入的加大,公司对人工智能岗位开始细分,设立了知识图谱工程师、自然语言处理工程师、深度学习工程师等岗位。”

  近几年,人工智能研究形成了一个场,汇集了属于人工智能工程师们的信仰、梦想与狂热。2017年,人工智能一词首次被写入政府工作报告。作为人工智能的一个分支,知识图谱也成为近两年火热起来的新赛道。

  “深度学习在处理感知、识别和判断等方面表现突出,能帮助构建聪明的AI,但在模拟人的思考过程、处理常识知识和推理,以及理解人的语言方面仍然举步维艰。这是催生知识图谱技术及与其相对应的工程师的重要原因之一。”张凯在接受经济观察报记者采访时说。

  “人工智能技术在行业应用里落地时,往往需要结合每个行业已有的领域知识。负责开发知识图谱技术系统的工程师便随着人工智能行业应用增多应运而生。“达观数据创始人陈运文告诉经济观察报记者。

  技术迭代中的新工程师们

  “我刚读研的时候是在海量数据研究所,快毕业的时候才成立了数据科学与工程学院。”张凯介绍说,他的母校华东师范属于最早开设人工智能相关专业的高校之一。

  从事人工智能相关职业的人或许都注意到,2017年前后,全国各大高校开始设立与人工智能相关的大类专业,培养专业人才。2017年7月,中国政府网发布国务院通知公布了《新一代人工智能发展规划》,规划文件指出,我国经济发展进入新常态,深化供给侧结构性改革任务非常艰巨,必须加快人工智能深度应用,培育壮大人工智能产业,为我国经济发展注入新动能。

  2018年6月,在杭州举行的新闻发布会上,教育部公布了各大高校开设人工智能专业的阶段性成果:截至2017年12月,全国共有71所高校围绕人工智能领域设置86个二级学科或交叉学科。

  同年,教育部发布了《高等学校人工智能创新行动计划》,意在弥补人工智能技术发展和应用落地过程中的人才短缺问题,加强人才培养。《计划》强调,要加强人工智能领域专业建设,形成“人工智能+X”复合专业培养新模式。计划的重点任务之一是要完善人工智能领域人才培养体系,并且推动高校人工智能领域科技成果转化与示范应用。

  在人工智能行业中,知识图谱工程师属于新兴职业,这一点从陈运文的描述中便可得知:“早先出去谈客户,客户都问有哪些AI技术可以用,而现在客户会直接说:需要一套管理XX的知识图谱系统。”

  2015年,达观数据设立知识图谱工程师岗位,负责开发面向垂直行业应用的知识图谱,并结合达观的文本智能处理系统,将AI技术应用于金融、制造、电信、政府等行业。

  在狗尾草智能科技的张凯工程师看来,知识图谱工程师们拥有与软件开发工程师们相同的标签:高学历、高薪、男性、加班、压力。

  差别在于对知识面、专业知识的要求不同。“知识图谱不是单一技术,而是一个庞大的技术栈,涉及包括数据库、自然语言处理(NLP)、机器学习(ML)、前端应用等多个领域知识,因而知识图谱工程师不仅要对知识图谱技术中的某一项专精,还要有整体的架构能力。许多知识图谱工程师是从传统领域转型而来,并与多个其他领域交叉协同。”张凯说。

  虽说从事的是自己感兴趣的职业,但OKR指标与技术迭代周期快速的特点仍让张凯感觉到压力。为缓解压力,每天固定两小时的充电是必备的,从读研期间,他养成的每天读文献与了解行业新动态的习惯一直保留。“我们这个职业,自我学习非常重要,要及时更新知识库。”

  “整个IT行业的变化非常快,技术迭代之快让人有时反应不过来。”张凯对经济观察报记者说,要适应快速的技术迭代,就要不断的深度学习,不断提升自己,适应转型。

  让机器具备认知能力

  知识图谱是什么?可能你说不出知识图谱的具体定义,但其实你每天都在使用它,当你在使用百度搜索时,搜索结果右侧的联想,就来自知识图谱技术的应用。知识图谱是将互联网所有的知识积累起来,将“信息”搜集上升成为了“知识”积累,归根结底,知识图谱的意义在于在盘根错节的数据海洋中进行梳理和串联,让以前模糊的世界变得更加清晰。

  知识图谱的概念最先由谷歌于2012年正式提出,主要用来支撑下一代搜索和在线广告业务。2013年以后,知识图谱开始在学术界和业界普及,并在搜索、智能问答、情报分析、金融等领域应用中发挥重要作用。

  多位致力于人工智能行业研究的领军人物曾一直认为:知识图谱对于人工智能的价值,就在于让机器具备了认知能力。

  “知识图谱工程师们的工作可以比喻成为人工智能‘塑造大脑’。”张凯说,由于缺乏诸如知识图谱此类常识知识库,各类工具理解大数据的手段有限,限制了基于大数据的精准分析,大大降低了大数据的潜在价值。尽管越来越多的行业或者企业积累了规模可观的数据,但这些数据并未能创造价值。知识图谱工程师们则通过数据操作,塑造了一个人工智能的大脑,为机器处理各种通用型任务提供了可能。

  狗尾草旗下有一款AI虚拟生命产品“琥珀·虚颜”,与传统聊天机器人不同的是,她能够与人类进行语音和视觉的交流,拥有自己的生活状态和小情绪,具备情感交互能力。而这款虚拟生命产品的大脑就是由张凯和他所在的知识图谱团队塑造的。

  根据中国电子学会统计,2018年全年,全球人工智能核心产业市场规模超过555.7亿美元,相较于2017年同比增长50.2%。目前中国人工智能行业的企业总数达到670家,占全球的11.2%。

  “知识图谱是未来人工智能实现从感知到认知跨越的重要基石之一。随着数据红利的消失,以大数据和深度学习为基础的感知智能会遭遇天花板。而认知智能很有可能借助大规模知识图谱技术取得进一步突破。”深圳狗尾草智能科技有限公司技术总监、人工智能研究院院长邵浩说。

  大连妇科医院哪家好 http://www.dlgcyy.cn/

猜你喜欢

转载自blog.csdn.net/fxj2019/article/details/88072288