翻译:数据科学简历中的7个必备条件

管理Riskified的数据科学部门需要大量招聘-我们已经增加了一倍以上我ñ不到一年的时间,和半。作为几个职位的招聘经理,我还阅读了很多简历。招聘人员可在7.4秒内通过简历进行筛选,并且在招聘了几年之后,我的平均时间相当快,但还不是那么极端。在此博客中,我将引导您完成个人启发式搜索(“作弊”),以帮助我筛选简历。虽然我不能保证其他人使用相同的启发式方法,并且每个角色在重要性上的不同角色也会有所不同,但是注意这些要点可以帮助您克服CV筛选阶段。此外,其中一些启发式方法可能看起来不公平,或者可能会忽略合格的候选人。我同意不投资简历的有才华的机器学习从业者可能会被此屏幕拒绝,但这是考虑时间的最佳折衷方案。请记住,一个备受追捧的职位可能会吸引一百或更多的简历。如果您想要一个高效的过程,则简历屏幕必须快速。
以下是用于快速筛选数据科学简历的7种启发式方法:

1.之前作为数据科学家的经验

我将快速浏览您的简历,以查看您以前的职位,并查看标记为“数据科学家”的职位。还有其他一些相邻的术语(取决于我要聘用的职位),例如“机器学习工程师”,“研究科学家”或“算法工程师”。我不将“ Data Analyst”包含在此类别中,因为日常工作通常与Data Scientist的工作不同,并且Data Analyst头衔是一个极为宽泛的术语。
如果您在目前的工作中从事数据科学工作,并且还有其他创造性的工作描述,那么将自己的头衔更改为数据科学家可能是您的最大利益。对于实际上是数据科学家的数据分析师来说,这可能是非常正确的。请记住,即使CV包含您所从事的项目的描述(并且包括机器学习),但Data Scientist以外的标题也会增加不必要的歧义。
此外,如果您曾在该领域接受过数据科学训练营或全职硕士课程,则这可能会被视为您数据科学经验的开始(除非您之前曾担任过类似的角色,否则将在以后阶段提出问题) )。

2.以业务为导向的成就

理想情况下,我想阅读您的工作(技术方面)以及业务成果。缺乏能够以业务术语进行交流的精通技术的数据科学家。如果您可以共享您的工作所影响的业务KPI,那在我的书中会大为赞赏。例如,表明您的模型在AUC方面的改进是可以的,但是解决因模型改进而带来的转换率提高意味着您“得到了”-最终,业务影响才是真正重要的。比较以下以相同的重点(技术性还是商业性)描述相同工作的替代方案:
一个。银行贷款违约率模型-将模型的精确召回AUC从0.94改进到0.96。
b。银行贷款违约率模型-在保持恒定违约率的同时,将业务部门的年收入提高了3%(每年50万美元)。

3.教育

您的正规教育是什么,在哪个领域。它是知名机构吗?对于较新的应届毕业生,我还将研究他们的GPA以及他们是否获得过任何卓越奖或荣誉,例如进入Rector或Dean的榜单。由于数据科学是一个广阔的领域,没有任何标准化的测试或必需的知识,因此人们可以采用各种方法进入该领域。在上一个博客中,我描述了进入该领域的3条主要途径,并根据您的教育程度和时间安排,确定您可能选择了哪一条。因此,时间安排有助于理解您的故事-您如何以及何时过渡到数据科学。如果您没有任何数据科学方面的正规教育,那很好,但是您需要展示该领域的工作记录和/或相似领域的高级学位。

4.布局/视觉吸引力

我看过一些漂亮的简历(为个人灵感而保存了其中的一些),但我还收到了缺少任何格式的文本文件(.txt)。从事简历工作可能会很痛苦,如果您选择数据科学作为自己的工作,那么很有可能您不喜欢在业余时间创建美学设计。无需过度投入,您确实想要寻找一个不错的模板,该模板使您能够在有限的空间内获得所有信息。明智地使用空间-拆分页面并突出显示不属于按时间顺序进行的工作/教育的特定部分很有用。这可以包括您熟悉的技术堆栈,自我项目列表,到github或博客的链接以及其他。一些简单的图标也可以帮助强调节标题。
许多候选人在他们熟悉的每种语言/工具旁边使用1-5个星号或条形图。就个人而言,出于以下几个原因,我不是这种方法的忠实支持者:

  • 这是非常主观的-您的“ 5星”是否与其他人的“ 2星”相同?
  • 他们将语言与工具混合在一起,在最坏的情况下,他们将其与软技能结合在一起-说您在“领导力”课程中的“ 4.5星”没有帮助。作为坚强的成长心态的信奉者,声称要最大限度地发挥技能(尤其是难以量化和难以掌握软技能)感到非常自负。

我还通过采取主观措施并将其转换为饼图(30%python,10%团队合作者等),进一步看到了这种方法的滥用。尽管这可能被认为是一种脱颖而出的创新方法,但它表明在不同图表的概念背后缺乏基本的了解。

这是我在视觉上吸引人的简历的两个示例,细节因匿名而模糊不清。

信用Eva Mishor
在这里插入图片描述
视觉化的数据科学家简历,细节模糊。请注意,两个示例中使用的垂直拆分是用来区分经验,技能,成就和出版物的。在这两种情况下,简短的摘要段落都有助于描述他们的背景和愿望。经所有者许可后使用。

在这里插入图片描述

5.机器学习的多样性

我寻找两种类型的品种:

  1. 算法类型-结构化/经典ML与深度学习。一些候选人仅与深度学习合作,包括可能更适合基于树的模型的结构化数据。虽然成为DL专家本身没有任何问题,但限制工具集可能会限制您的解决方案。正如马斯洛所说:“如果您仅有的工具是锤子,那么您往往会把所有问题都看作钉子。” 在Riskified中,我们处理结构化,领域驱动,功能工程化的数据,最好用各种形式的增强树来处理。有人的整个简历都指向DL,这是一个问题。
  2. ML领域-这通常与需要大量专业知识的两个领域相关-计算机视觉和NLP。这些领域的专家需求旺盛,在许多情况下,他们的整个职业都将专注于这些领域。虽然这对于要寻找某人从事该领域的工作至关重要,但通常不适合某人担任更一般的数据科学职位。因此,如果您的大部分经验是在NLP上,并且您正在申请域外的职位,请尝试强调职位/项目,因为您正在处理结构化数据以证明多样性。

6.技术栈

通常可以将其分解为语言,特定的程序包(scikit学习,pandas,dplyr等),云及其服务(AWS,Azure,GCP)或其他工具。一些候选人将其与他们熟悉的算法或体系结构(RNN,XGBoost,K-NN)混合在一起。就个人而言,我更喜欢围绕技术和工具展开的工作。当提到特定算法时,我想知道候选人的理论ML知识是否仅限于那些特定算法。

在这里,我正在寻找技术堆栈的相关性-它们是否来自最近几年(这是应聘者亲身实践并学习新技能的积极信号),堆栈的广度(它们是否仅限于特定领域?工具,或者他们熟悉很多东西)以及与我们的堆栈相适应(我们需要教多少)。

7.项目

您有可以在GitHub上共享的东西吗?任何Kaggle竞赛或附带项目都可能会非常有帮助,使您可以查看简洁的代码,预处理的类型,功能工程,EDA,算法的选择以及现实项目中需要解决的无数其他问题。将链接添加到您的GitHub和Kaggle帐户,以供访问员深入研究您的代码。如果您没有太多经验,很有可能会询问您有关这些项目中的一个或多个的信息。在我进行的一些采访中,候选人对这个项目不太记得,我们也无法就他们所做的选择及其背后的原因展开对话。确保重新完成所做的工作或将其排除在简历之外。同样,请确保您展示了自己的最佳作品,并且已经投入了足够的时间和精力。最好有2–3个高质量项目,而不是8–10个中等(或更低)质量的项目。

概括

如果您正在寻找新的数据科学职位,请花一些时间并仔细阅读本文中的要点。如果您无法勾选所有这些标记,那就很好,但是越多越好。希望这些技巧将帮助您从人群中脱颖而出,并以鲜艳的色彩通过CV屏幕。

#pic_center =450x

参考

https://towardsdatascience.com/7-must-haves-in-your-data-science-cv-9316841aeb78

猜你喜欢

转载自blog.csdn.net/zgpeace/article/details/115409858