数据科学家访谈录笔记——在成为数据科学家之际

在成为数据科学家之际

为什么需要沟通能力和讲故事的能力

  • 你需要把从数据中分析得到的东西告诉别人,让更多并没有参与到这个研究过程的人也知道结论是什么。创造一个有信服力并且精彩的故事,同时要保证故事尊重数据事实,这可不是一件容易的事情。
  • 用简练的语言解释一些东西之所以困难,是因为他需要同理心。你需要理解那些非常复杂以及学术性的东西,但同时你需要对一些完全没有技术背景的人讲述这一切。你必须要清楚他们是怎么想的,这样你才能用他们能够理解的语言来讲述这一切。
  • 同时,你必须考虑到,你的听众只有很短的一段时间能集中精力,他们很快会变的不耐烦,并且他们绝不会花大量时间去学习这些只是或者技术。
  • 所以你必须想办法用你的语言,或者可视化的工具方法,来让你的听众理解你所做的东西,这样才不枉你花费大量的时间去建立复杂的模型。
  • 在自身了解清楚各种复杂技术的情况下,用精炼准确的笔把一切写下来,然后与其他人进行沟通,分享数据分析背后的知识和兴趣。你需要努力将旷日持久的学习经验和复杂工作,以人们可以理解的方式娓娓道来。

对最好的数据科学工作机会的理解

  • 最好的数据科学工作机会,就是那种你有足够的自由度去收集数据的工作机会。而你收集来的数据经常是你一直在努力创造的一个产品的“副产品”。
  • 如果你所在的公司拥有一个可以产出数据的产品,并且作为数据科学家的你有能力去修改产品的参数,从而让它产出其他的一些数据,那么这绝对是最完美的地方了。
  • 你的合作对象(无论是你的COO、CTO、还是CEO)对于招聘数据科学家这件事情有足够清楚的认识。至少他们是那种你可以合作,一同分析讨论你应该如何努力做事情的人。

如何确认公司是否将时间投资在正确的方向上

  • 第一个问题:对于目前正在做的事情,能不能将其清楚的定义出来?一个很好的办法是,把这个问题用简单的语言描述出来,写在一张白纸上,让所有人都能明白我们想要做什么?
  • 第二个问题:何时能够顺利完成这个项目?应该用什么成败指标来判读某个问题的解决方案是否成功?例如,如果你的项目的算法根本不能返回一个可与量化的指标,你至少应该写清楚这个项目的量化指标不能是一个简单的数字。
  • 第三个问题:假设我们最终可以完美的解决这个问题,我们应该首先从什么地方入手?问这个问题的目的是确保每一个项目都时刻与公司的业务和产品相关,而不是仅仅因为对某些东西好奇就投入大量的人力物力。所以针对项目,在入手的第一步,就要有一个长期的规划,确保我们可以通过这一阶段的工作,更深入的了解数据。
  • 对于所涉及的每一个数据项目,你需要不断问自己一下几个问题:我正在做什么事?我如何估计工期还有多长?这项工作会带来什么样的影响?如果你不断问自己上述的这些问题,你就会知道自己有没有把时间合理的投资在正确的方向上。

如何通过询问自己来理解项目

  • 例如,有个项目:“土耳其用户与美国用户在日常的行为上有差异吗?“
  • 项目的远期目标应该是着力于了解是否地缘差异会影响用户们的生活习惯,以及如果确实有影响的话,具体差异什么。你应该时刻注意在短期目标和远期目标中取舍平衡,进而根据你的数据建立一个完整的、针对这个问题的知识库。
  • 最后一个问题,假设一切都进展顺利,而且全球很多人都接纳了我们的分析结论,这回对人们的行为产生什么影响?这个问题是非常重要的,因为我们总是确保团队成员着力解决具有最大影响力的任务。
  • 问自己针对这个问题,我们能做的最邪恶的事情是什么?从这样的角度出发,你可以获得很多非常具有创造力的答案,而实际上这其中的大部分想法都并不邪恶。

公司招数据科学家的角度

  • 在招聘的时候,公司最应该做的事情是寻找哪些能快速学习的人、有非常多创意的人、能够灵活变通的人,以及能够与公司的软件工程开发部门通力协作的人,因为他们最终会一起合作。
  • 他们需要有能力和运维数据库的人成为好朋友,因为只有这样他们才能从数据库中获得所需的数据。
  • 同时他们也要能和产品部以及市场部的同时沟通聊天,一起探讨问题商量产品策略。

毕业生对公司如何选择

  • 走出学校、出入职场的那几年学到的东西,将会对你的职业生涯产生巨大的影响,并且实现你的第一次知识积累,所以最好去那些你能学习到最多东西的地方。
  • 最好去那种”我在未来一年可以从那个公司学到很多东西,并且我觉得在那里工作很快乐,我愿意待更久“的公司
  • 在加入公司一年以后,可以从新评估一下自己。我还能继续学到东西吗?我依然喜欢我所从事的事情吗?如果你对于这些问题的答案都是否定的,那么你就可以考虑去寻找下一个可以学到东西的公司了。
  • 选择一个自己喜欢的工作地点相比于工资待遇应该更重要一点,否则你每天生活都不会开心。
  • 最重要的一点是,要选择一个对自己有挑战性的工作,并且要和能教会你很多东西的人在一起。

如何从头开始成为顶尖的数据科学家

  • 不要害怕因为初入领域而犯下一些愚蠢的错误,进而招致人们的笑话,实际上人们往往比比想象中要友好的多。
  • 如果你对数据科学有兴趣,就尝试着去做它!现在网络上有很多高质量的数据集,也有很多开源的API,你可以充分发挥自己的创造力去做任何事。
  • 尝试去做一个最符合你的优势技能的项目。总体上,数据科学家的工作可以分为3个版块:统计、代码以及讲故事/可视化。这3个版块中你最擅长的方面是哪个,就尽量选择最需要的这方面技能的项目。
  • 下一步,做一个着重点在你最不擅长的版块上的项目。这回帮助你尽快的成长,学到新的东西,并且搞清楚自己下一步学习方向,然后顺水推舟地学下去就好。

猜你喜欢

转载自blog.csdn.net/jasonzhoujx/article/details/81676522