分辨合格数据科学家的五道面试题

Five Interview Questions to Predict a Good Data Scientist

原文地址:https://medium.com/predict/five-interview-questions-to-predict-a-good-data-scientist-40d310cdcd68

在我们这个行业,经常会提到数据科学家严重短缺这个问题。这种问题会造成如机器学习,人工智能和深度学习等行业上升的趋势被抑制。就由于这种不足,我们看到有很多人会感觉到这个行业会有很多高薪的就业机会,并从其他职业进行转变。在这种环境的冲击下,雇主的问题是显而易见的:你并不能找到合适职位的最佳人选。

该怎么办?许多公司制作的招聘广告看起来似乎是在吓跑应聘者。并不是所有人都能胜任数据科学“独角兽”的角色,并有计算机科学和应用统计学博士学位,以及多年的专项领域经验。当然,会有很多没有必须知识和经验的勇敢的人来申请这些工作,你需要有效地过滤掉这些骗子。

下面的简短列表是我想出来的,以供 HR 招聘数据科学职位(注意:不是数据工程师)时来帮助淘汰那些夸大能力的人。

  • 正态分布对数据科学有何意义?
    这个问题旨在表明对数据科学最基本要素之一的理解。如果涉及中心极限定理的讨论,那就非常好,但也许这个要求太高了。也许得到高斯分布函数的数学公式是个不错的结果,但除了提到“钟型曲线”之外,听到类似的东西会更好:它的均值,中位数和模式均相同,或者只用两个参数可以指定整个分布——均值和方差,或者描述它对线性回归的重要性(数据科学的精髓)。

  • 告诉我你对数据科学的热情,你是否:参加当地的聚会,参与像kaggle这样的数据竞赛,使用开源数据集,在会议上发言,写书或文章等等?
    这个问题的关键在于确定应聘者是否认为数据科学是他们真正的使命。他们是否对数据有所思考和幻想?他们看到问题后能否立即寻找涉及数据模式的解决方案?他们的图书室里有哪些书?一个与数学相关的问题中,数据科学家在思考这个问题时,数学基础在其中发挥了多大的作用?了解算法背后的数学原理的数据科学家通常会表现得更好。

  • 请描述一下你上次在数据科学项目中遇到的问题,以及是如何克服的?
    并非所有数据科学项目都在顺利进行,因为可能会出现许多潜在的问题。这个问题探讨了他们真实经历的深度以及他们如何设法处理不可避免的问题。知识和经验不足的人很容易暴露出来。

  • 回想一下你曾经过去做过的数据科学项目,如果要求你更改一个数据源,从而使用不同的预测器,你将如何更改解决方案?
    这个问题涉及应聘者之前扮演的角色,以及他们如何适应不断变化的需求,例如引入新的数据集。很多时候,较低级别的数据科学家只是对于数据集,简单地给出几个预测器,而没有为它们的适用性提供任何输入。另一方面,更高级的贡献者将参与数据集选择、特种工程和统计分析。你可能会想要一个更全面的候选者。

  • 研究表明,过去二十年来有23亿人受到洪水影响。描述一下你如何着手预测未来100-500年即将发生的洪水这个项目。这个预测可用于在正确的位置建造水坝,以最大限度地减少损失
    这类问题,或者更符合特定行业的问题,需要考虑“数据科学过程”,包括问题制定,数据采集,数据整理,探索性数据分析,特征工程,数据建模(构建,拟合和验证模型),并使用结果进行数据叙述,应聘者需要非常熟悉数据科学家的工作流程。

如果你正在寻找一位优秀的数据科学家而不是哪些只是声称拥有该头衔的人,那么上述问题对于快速区分两者是非常有效的。这些问题的好处在于,你可以根据你的行业甚至公司微调可接受的答案。

猜你喜欢

转载自blog.csdn.net/yeahDeDiQiZhang/article/details/83542364