数据科学家访谈录——数据科学中软件工程的重要性

数据科学中软件工程的重要性

如果回到大学,会做什么
  • 我希望当时的我可以花更多的时间去做实实在在的事情,建立网站或者完成一些项目。如果你总是习惯在白板上写画示意图,你就会越来越害怕编程。我觉得反复琢磨研究一个原型产品会对你的编程能力有很大的提高。
  • 同时我也希望自己当时可以写更多的程序,因为当我一开始移居到硅谷的时候, 拙劣的编程技术实在是我前进道路上一大绊脚石。
如何认识出色的数据科学家
  • 我觉得牢固的编程基本功,再加上系统的思维能力是最为重要的。要求你做出一个实实在在稳定的产品系统可能确实会限制你天马行空的想法,但是在造成的影响力上,他绝对更有价值。
  • 例如在Quid的时候,有些工程师可以自己建立系统并且用很理论化的思维去思考问题。在我眼里,这种兼具出色的理论能力和事实落地能力的人,毫无疑问就是最为出色的数据科学家。
运用类比解决问题
  • 加入你正在研究时间序列数据,这是一种数据量很大也并更不容易研究的数据,因为往往你需要很大的内存去存储它,而这就成了这类数据的研究瓶颈。
  • 鉴于我学习过数学和信号理论,我就可以用一种低通路的过滤器去过滤这一批数据,针对任何一个时间段的数据,仅仅留下那些少量异常值作为研究对象。在这里你可以看到“数模转化”这个概念对于研究社交数据也会有重要的影响。
  • 我觉得对于从非常严谨的学科背景出身的人来说,发现不同领域之间可以类比的特征是他们最擅长做的事情。
建议
  • 最为有用的事情时不断的学习,为了求知而学习,并且真正的对学习感兴趣。

猜你喜欢

转载自blog.csdn.net/jasonzhoujx/article/details/81809586