停止雇用数据科学家?

全文共2899字,预计学习时长9分钟

来源:Pexels

目前,人事部经理和主管发布的内容与他们的雇用人员情况之间存在巨大的不协调。

最常见的情况就是:在急需大量分析家和工程师(或开发人员,或大家认同便可)时,我们在雇用许多数据科学家。

大多数情况下数据科学家最为合适,但是遇事我们还得具体问题具体分析。

当前世界充斥着丰富的数据而洞察力却很弱。我们需要更多富有洞察力且热情饱满的人们,减少不基于实际科学的地面分析。很多情况下,具备坚实业务知识的分析家比初次接触业务的数据家的见解更为丰富。

对于许多真正“数据科学家”的角色,统计学家最为合适。但对于大多数错误标识的数据科学家角色,分析家或工程师更加适合。

1.需要分析师时不要雇用数据分析家。

2.需要工程师时不要雇用数据科学家。

听起来简单!一起来深入学习吧。

需要分析师时不要雇用数据科学家。

我不是很确定一个数据团队中分析师与科学家的正确比例。我认为这完全取决于需要解决的问题。我所知道的是,雇用5位数据科学家来创建关于企业基线度量的报告是一种误导性追求。

很多合适的统计学家都夜以继日地做着出色的工作。而在数据行业中,我们竟然真的从未听说过这些人。许多真正优秀的数据科学家实际上只是有新头衔的统计学家。一些数据科学家涉猎多个领域,包括统计、工程、数学和编程领域,却无一所长。

2020年,每个人都能称自己为数据科学家,这已经不是什么秘密了。想象一下,你是一位统计学家,每天都在做着出色而诚实的工作(科学?)。根据Indeed、Glassdoor等的统计,统计学家的年薪会在7万至11万美元之间。然后,看看更优秀的人,一位数据科学家每年能赚9万至16.5万美元。心里知道“数据科学家”几乎没有你已掌握的统计数据。也许他们可以编写更多的Python或R,这可能是几个月后都学不会的程序。也许他们可以执行SELECT * FROM Table; 并获取一些数据,但这并不是很复杂。

因此,访问了几家公司网站,几个求职公告栏,给一些朋友和同事发送电子邮件。突然在另一家公司找到了一份全新的工作,现在获得了令人自豪的“数据科学家”头衔。

恭喜!突然之间,凭借闪耀的研究生学位和著名的研究背景进入公司,上一家公司九万五千美金的薪水变成了新公司的13万美金。哇!薪水上升了不少呀。然后老板会与你见面,分配工作计划。每天辛苦地工作,很快就意识到自己的日常工作已经从高度熟练的统计学家工作量转移到了结构化查询语言的工作。突然需要花费90%的时间来创建报告,提交演示文稿和构建业务分析工具仪表板以共享每日用户指标。当意识到自己正在从事入门级数据分析师的工作时,会哭笑不得。拥有10年的研究生学历和另外5年的博士后经历,却每天编写一些结构化查询语言并维护旧的东西。

来源:Pexels

这并不是说不喜欢分析师的工作。实际上,分析师是企业的基础,没有他们,数据世界将无法运转。如果全世界的分析师突然停止工作,领导就会失去理智。许多领域会沦为只有电子表格的地狱。你只知道自己是统计学家,宁愿在漫长的研究周期或一次性咨询服务中发挥关键作用,也不愿以分析师的身份每天或每周发挥小小的作用。这两种选择没有好坏之分;只是心态不同而已。

然而再一次,数据科学公司要求拥有另一名高技能工人,并给他们分配分析师的工作,获得与中级经理相当的薪资。这不是唯一的例子,许多不同背景的人都可以经历此事。

不仅这位统计学家发现自己处于既赢既输的局面(赢是因为她赚了很多钱,输是因为她讨厌自己的工作),企业也发现自己陷入了进退两难的局面。该公司花了13万美元雇佣分析师,而原本可以用75,000至10万美元来请一位高技能分析师担任此角色。他们的工作质量也在降低,因为统计人员对此恰好不感兴趣。统计学家显然胜任这项工作,但研究表明,当他们对工作心不在焉时,资历优秀的工作人员反而表现不佳。

在当今世界,分析师很多时候只是一个谦虚的人,没有给自己贴上数据科学家的标签。而许多“数据科学家”都是自信满满的分析师,担当更有声望的角色。很遗憾,他们的老板并不能将两者区分开,那么为什么不改变他们的头衔并要求每年多付4万美元呢?

需要工程师时不要雇用数据科学家。

我在数据团队听到一个又一个事例,反映出这第二个现实。许多数据团队着重创建那些最优化艺术模型状态的应用程序,从而发布新的使用实例。一起来想象使用BERT创建文本分类的数据团队。想象这是快速部署为网络应用的核心特征。

对我来说,让一群数据科学家都聚集在一个房间来创建这种应用程序的团队建设是极为有趣的。显然,你需要一个工程师团队——也许是一些前端和后端开发人员,也许是一两个机器学习工程师,他们过去曾使用过这些模型。您需要做的最后一件事情是,一群数据科学家四处奔波,试图告诉您模型是如何运行的,或者在他们等待运行模型验证的机会时伏案休息。

房间里只有1位数据科学家可能不会有什么坏处。然而,可能不会时刻都需要具备中级R知识的人。需要的是具有非常出色的统计能力的人,他们可以完成真正伟大的科学研究,并在他们提供可行的解决方案时保持团队诚信。将代码编写留给工程师。仪表板无法进行大规模推理。

数据科学家不是在这里建立你可扩展的应用程序,建立你的前端,数据管道,或者真正的任何任务是建立可转移的软件的基础。一个好的数据科学家可以插手的地方是确保你在执行好的科学研究,确保应用程序具有交付真实世界结果所需的能力,等等。他们不在那里编写性能良好的代码。它们在某些情况下是必不可少的,在其他情况下是一种阻碍。良好的管理是授权工作和建立良好团队的关键。

来源:Pexels

在当今世界,许多开发人员和工程师发现,将自己标记为数据科学家很容易。他们获得了CS的本科文凭,甚至有CS的硕士学位。他们的统计学背景可以是一眼掠过的维基百科文章,或者是工程统计课程。但是,他们并不需要真正理解它,因为他们的老板只是想要一个可以使用现有技术和预先建立的Stats库运行的应用程序。因此,他们担任了“数据科学家”的角色,并要求额外的薪资。他们是了不起的工程师,因此他们将创建真正出色的软件。

问题在于,工程师(标榜为数据科学家)的老板现在认为他们需要再雇用3名以上数据科学家才能提供更多相同的最终产品。不久,他们外出并雇用了一些非常优秀的统计人员,三个月后他们意识到自己正努力以统计学家的背景从事工程师的工作。过了没多久,他们就失去了兴趣,这对他们来说是有赢有输(赢是因为他们赚取了高额薪资,而输是因为他们讨厌工作)。

凡事都是两面的。

留言 点赞 关注

我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

发布了802 篇原创文章 · 获赞 2687 · 访问量 43万+

猜你喜欢

转载自blog.csdn.net/duxinshuxiaobian/article/details/104456879