AI市场上最稀缺的人才是什么?


首先,我觉得懂人工智能,我是说的是真正懂人工智能的人才,是非常稀缺的。


那么什么叫真正懂呢?


就是了解人工智能物理意义的人,而不仅仅是懂算法。

 

什么才是真正懂人工智能——庖丁解牛:


举个我自身的例子。我在清华大学念书时,就用过神经网络,我会用,但我不懂,不懂它的底层意义到底是什么,不懂这个东西为什么能够训练出来,不理解计算机到底是怎么思考的。


这是一个非常重要的思维门槛。

 

对于深度学习来说,由于这里面是一个黑箱,你可以不知道机器在某一点到底在思考什么,但机器思考的那套整体逻辑和大概每一层单元在干什么,你要很清楚。

 

目前,能理解到这个层次的人非常少。

 

打个比方,有个词叫庖丁解牛。你首先得在眼睛里,大脑里有这头牛的全貌,然后你还必须很会使用这个刀。而不是说你拿着这把刀,你就可以迅速地把这头牛解剖了。


你只有既理解牛、又理解刀的使用方法,你才能达到庖丁解牛的境界。


同样,人工智能也是这么一个工具。

 

给你一大堆图片,让你训练出一个模型,你用tensorflow跑出来了,但明天让你训练语音,后天训练物流杂乱的数据化信息,你就蒙圈了。


再比如,有个模型是要用CNN加上全连接的,你的模型是用对抗网络更好一点,那么你的模型就可以不使用神经网络,而应该使用Randomforest,有了模型你应该使用这个,你为什么要使用这个,你是通过大量的算法、经验做出来的。

 

对我来说,最大的帮助是,一个编程的感性认识。我在大学研究生的时候,我做了大量的编程,天天在debug,debug特别锻炼人对于机器底层运转的思考,一套10万行的程序出错了,你怎么能够迅速给他debug出来,这个你要去理解计算机到底容易在什么地方出错。

 

人工智能更复杂,人工智能在调试的过程中,没有debug的提示器,因为它全是数据和数据之间,它是一个数值计算,不能收敛的过程,就是你算着算着错了,你也不知道什么地方出错了,你只能看到这个数据发散了,这是一个特别要命的问题,因为你的程序一点都没有写错,只是你的数据结构、网络结构弄错了,这个要求程序员对这个算法的物理模型、场景模型极其明确物理意义的过程,这是非常复杂的,很难描述这个事情。

 


最稀缺人才——人工智能架构师:


我有一个特点,我所有学到的东西,我都能从零开始推,就是老师讲的所有东西我都可以从零开始推。这个东西叫元认知。


元认知越底层的人,他在理解一件事情的时候所占用脑子里的内存越少。比如说让我去描绘一个整个的商业案件,有人是背书,从头到尾背下来,我看一遍以后,我可能一个单位我就记住了,然后就忘了,下次让我描述这个事,我把这个单元提出来就可以描述。

 

人工智能也是,它是一套工具,一个真正好的工程师,他手里所有的人工智能都是算法,比如现已知的,人工智能大类的算法可能有七八类,像支持向量机,神经网络、randomforest,adaboost等一大堆,他在看到一个模型后,能迅速判断哪个模型更适合。

 

比如说为什么语义识别是用循环网络和LSTM来做识别?因为语义是一个线性的信息流,这个线性信息流里面要记住前面很远的信息,同时要忘掉很大一部分信息,再记住当前的信息,所以,用LSTM能非常完美的解决这个问题,但LSTM在图像识别上就不Work了、在量化金融中的优势也不明显。

 

这里,很多人会认为股票和语义都是一个时间序列函数,或者是前后序列函数。为什么LSTM训练这个很好用,训练股票就不行了呢?


这个,就需要回到元认知。因为他们的数据结构完全不一样,你得理解什么模型处理什么实体结构。


再比如,CNN适合处理大量数据、超大量的数据,且数据和数据之间有明确相关条件,所以,CNN适合处理图像,因为图像的像素之间具有相关性。


而同样的一个情况,语义又不适合了。比如“我写程序”这四个字,每个字之间一对一的相关性并不是那么强,但他有一个整体相关性,他跟图像识别是不一样的。简单理解的话,语义是一维函数,图像是二维函数。


所以,这些都是很细节的东西。你只有在使用了大量的程序之后,跑着跑着,才能感知到,哦,原来这个应该用什么算法跑,那个不能用什么算法跑。因为人工智能属于黑暗森林,你只能慢慢去摸索,摸索哪个是最适合的。你不可能第一天就调试出来,搞清楚哪种场景,到底该用什么程序,这个程序应该有多少层的网络、结构、单元,每一层单元有什么样的参数,应该跟什么程序进行配合,是否需要两个程序进行嫁接,是否需要高级的比如对抗型的、或者辅助型、或者嫁接型等。你需要不断地锤炼和思考,才能出来这样的感觉,都是一点一点悟出来的。

 

所以,回到最开始的问题,我觉得如果用一个特定的职位来定义,这个最稀缺的人才是人工智能架构师

 

他能抽象出你最应该使用什么样的工具。在他之下,其他人就可以在一个更细的层面上,去琢磨这个工具具体应该怎么来用。

 


不过,人工智能架构师又分三个层次。

 

人工智能架构师的三个层次:

 

第一层:物理模型架构。


有的时候大家在训练一件事情的相关性上,可能会把两个事情分开放。其实应该把两个事件放在一起,把相关性作为训练对象来进行训练,这样训练可能会更好。


或者把一个隐藏的物理意义作为训练对象,把相关性和两个事情都放在一起,然后再进行训练。


但很多人就想不到这点,就拿两个事情直接去训练相关性,这是错误的。

物理模型架构,这是最里的一层,需要深刻理解物理意义,当知道各种各样的函数该怎么去用的时候,火候就差不多了。

 

第二层:当我们确定怎么训练拓扑模型之后,拓扑模型框架出来的时候,基于拓扑框架我选用什么样的网络模块,具体需要训练成什么效果,然后再具体去训练。

 

第三层:等这些模块全选好了,每一层用多少个单元、多少个参数,你有没有这个能力。第一层的神经元你可以选择100个,第二层的你选10个,第三个选择多少个,然后用卷积你又选择多少个,核有多大,3×3的、5×5的、10×10的,你到处去试,试一年可能才试出结果来。

 

好的工程师第一刀就可以给你切到差不多的点上,你这个模型基本10层网络,每一层大概10个神经元,卷积核的层数大概3层,全链接层7层就够了,他会一上来就给你做这个东西。

 

目前,这三种架构人才都很稀缺。

 

要培养一个这样的人才,很难很难,必须跨界,尤其物理模型架构层面,必须跨界。你必须要能理解这个东西在物理层面上的意义,你必须经历过不一样思维模式的业务,有开阔的眼界,比如从事过社会、社科、商业等多种类型的工作,然后再反过来去看这件事情,就容易了。

 

为什么说一定要跨界呢?因为跨界会对你补充另外一个部分的素养,跨界就是补足你的数据,这叫“一个向量空间的完备性”,你跨界是用来干这个的。

 

我见过的特别优秀的能扛起人工智能架构师这类角色的人很少。我很欣赏第四范式的戴文渊,他就可以把银行所需要的算法场景变成一定的函数需求,他属于在工程师里情商比较高,相对比较跨界的稀缺人才。

 

要成为一个这样的人才,我觉得至少要十年时间。

 

这类人才,一定是有强感知能力的,他有感知整个社会存在的能力,而不是把眼睛全放在眼前的技术上。

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------


猜你喜欢

转载自blog.csdn.net/kanglinwu2272/article/details/79341683