AI市场上最稀缺的人才是什么？

首先，我觉得懂人工智能，我是说的是真正懂人工智能的人才，是非常稀缺的。

那么什么叫真正懂呢？

就是了解人工智能物理意义的人，而不仅仅是懂算法。

什么才是真正懂人工智能——庖丁解牛：

举个我自身的例子。我在清华大学念书时，就用过神经网络，我会用，但我不懂，不懂它的底层意义到底是什么，不懂这个东西为什么能够训练出来，不理解计算机到底是怎么思考的。

这是一个非常重要的思维门槛。

对于深度学习来说，由于这里面是一个黑箱，你可以不知道机器在某一点到底在思考什么，但机器思考的那套整体逻辑和大概每一层单元在干什么，你要很清楚。

目前，能理解到这个层次的人非常少。

打个比方，有个词叫庖丁解牛。你首先得在眼睛里，大脑里有这头牛的全貌，然后你还必须很会使用这个刀。而不是说你拿着这把刀，你就可以迅速地把这头牛解剖了。

你只有既理解牛、又理解刀的使用方法，你才能达到庖丁解牛的境界。

同样，人工智能也是这么一个工具。

给你一大堆图片，让你训练出一个模型，你用tensorflow跑出来了，但明天让你训练语音，后天训练物流杂乱的数据化信息，你就蒙圈了。

再比如，有个模型是要用CNN加上全连接的，你的模型是用对抗网络更好一点，那么你的模型就可以不使用神经网络，而应该使用Randomforest，有了模型你应该使用这个，你为什么要使用这个，你是通过大量的算法、经验做出来的。

对我来说，最大的帮助是，一个编程的感性认识。我在大学研究生的时候，我做了大量的编程，天天在debug，debug特别锻炼人对于机器底层运转的思考，一套10万行的程序出错了，你怎么能够迅速给他debug出来，这个你要去理解计算机到底容易在什么地方出错。

人工智能更复杂，人工智能在调试的过程中，没有debug的提示器，因为它全是数据和数据之间，它是一个数值计算，不能收敛的过程，就是你算着算着错了，你也不知道什么地方出错了，你只能看到这个数据发散了，这是一个特别要命的问题，因为你的程序一点都没有写错，只是你的数据结构、网络结构弄错了，这个要求程序员对这个算法的物理模型、场景模型极其明确物理意义的过程，这是非常复杂的，很难描述这个事情。

最稀缺人才——人工智能架构师：

我有一个特点，我所有学到的东西，我都能从零开始推，就是老师讲的所有东西我都可以从零开始推。这个东西叫元认知。

元认知越底层的人，他在理解一件事情的时候所占用脑子里的内存越少。比如说让我去描绘一个整个的商业案件，有人是背书，从头到尾背下来，我看一遍以后，我可能一个单位我就记住了，然后就忘了，下次让我描述这个事，我把这个单元提出来就可以描述。

人工智能也是，它是一套工具，一个真正好的工程师，他手里所有的人工智能都是算法，比如现已知的，人工智能大类的算法可能有七八类，像支持向量机，神经网络、randomforest，adaboost等一大堆，他在看到一个模型后，能迅速判断哪个模型更适合。

比如说为什么语义识别是用循环网络和LSTM来做识别？因为语义是一个线性的信息流，这个线性信息流里面要记住前面很远的信息，同时要忘掉很大一部分信息，再记住当前的信息，所以，用LSTM能非常完美的解决这个问题，但LSTM在图像识别上就不Work了、在量化金融中的优势也不明显。

这里，很多人会认为股票和语义都是一个时间序列函数，或者是前后序列函数。为什么LSTM训练这个很好用，训练股票就不行了呢？

这个，就需要回到元认知。因为他们的数据结构完全不一样，你得理解什么模型处理什么实体结构。

再比如，CNN适合处理大量数据、超大量的数据，且数据和数据之间有明确相关条件，所以，CNN适合处理图像，因为图像的像素之间具有相关性。

而同样的一个情况，语义又不适合了。比如“我写程序”这四个字，每个字之间一对一的相关性并不是那么强，但他有一个整体相关性，他跟图像识别是不一样的。简单理解的话，语义是一维函数，图像是二维函数。

所以，这些都是很细节的东西。你只有在使用了大量的程序之后，跑着跑着，才能感知到，哦，原来这个应该用什么算法跑，那个不能用什么算法跑。因为人工智能属于黑暗森林，你只能慢慢去摸索，摸索哪个是最适合的。你不可能第一天就调试出来，搞清楚哪种场景，到底该用什么程序，这个程序应该有多少层的网络、结构、单元，每一层单元有什么样的参数，应该跟什么程序进行配合，是否需要两个程序进行嫁接，是否需要高级的比如对抗型的、或者辅助型、或者嫁接型等。你需要不断地锤炼和思考，才能出来这样的感觉，都是一点一点悟出来的。

所以，回到最开始的问题，我觉得如果用一个特定的职位来定义，这个最稀缺的人才是人工智能架构师。

他能抽象出你最应该使用什么样的工具。在他之下，其他人就可以在一个更细的层面上，去琢磨这个工具具体应该怎么来用。

不过，人工智能架构师又分三个层次。

人工智能架构师的三个层次：

第一层：物理模型架构。

有的时候大家在训练一件事情的相关性上，可能会把两个事情分开放。其实应该把两个事件放在一起，把相关性作为训练对象来进行训练，这样训练可能会更好。

或者把一个隐藏的物理意义作为训练对象，把相关性和两个事情都放在一起，然后再进行训练。

但很多人就想不到这点，就拿两个事情直接去训练相关性，这是错误的。

物理模型架构，这是最里的一层，需要深刻理解物理意义，当知道各种各样的函数该怎么去用的时候，火候就差不多了。

第二层：当我们确定怎么训练拓扑模型之后，拓扑模型框架出来的时候，基于拓扑框架我选用什么样的网络模块，具体需要训练成什么效果，然后再具体去训练。

第三层：等这些模块全选好了，每一层用多少个单元、多少个参数，你有没有这个能力。第一层的神经元你可以选择100个，第二层的你选10个，第三个选择多少个，然后用卷积你又选择多少个，核有多大，3×3的、5×5的、10×10的，你到处去试，试一年可能才试出结果来。

好的工程师第一刀就可以给你切到差不多的点上，你这个模型基本10层网络，每一层大概10个神经元，卷积核的层数大概3层，全链接层7层就够了，他会一上来就给你做这个东西。

目前，这三种架构人才都很稀缺。

要培养一个这样的人才，很难很难，必须跨界，尤其物理模型架构层面，必须跨界。你必须要能理解这个东西在物理层面上的意义，你必须经历过不一样思维模式的业务，有开阔的眼界，比如从事过社会、社科、商业等多种类型的工作，然后再反过来去看这件事情，就容易了。

为什么说一定要跨界呢？因为跨界会对你补充另外一个部分的素养，跨界就是补足你的数据，这叫“一个向量空间的完备性”，你跨界是用来干这个的。

我见过的特别优秀的能扛起人工智能架构师这类角色的人很少。我很欣赏第四范式的戴文渊，他就可以把银行所需要的算法场景变成一定的函数需求，他属于在工程师里情商比较高，相对比较跨界的稀缺人才。

要成为一个这样的人才，我觉得至少要十年时间。

这类人才，一定是有强感知能力的，他有感知整个社会存在的能力，而不是把眼睛全放在眼前的技术上。

AI市场上最稀缺的人才是什么？

猜你喜欢