交流

今天交流所得,记下来防止忘了,后面慢慢吸收。
数据分析总的重要性:业务>数据>算法
……只有充分理解了业务,才能制定出强有力的特征,也可以指导数据的清洗,更能选择不同的机器学习算法。
从个人的发展角度来说:
…….最重要的是个人面对问题的解决思路体系,这个是自己最大的秘密武器(这方面可以看看麦肯锡的《问题分析方法与解决技巧》,以及得到上的每天听本书也不错。但是还是要注意鉴别,以及不要完全照搬,吸收对应自己的)。外层的硬实力是:shell,Python,Hadoop以及对应的系列,如spark等,以及算法,这是基本的工作技能,需要不断的学习。软实力就是沟通能力,数据分析和挖掘需要充分的理解业务,所以不可避免的需要和不同部门的同事交流。此外,沟通技巧还可以促进同事之间的情感交流。
公司里面的数据挖掘和学校的数据挖掘区别:
……一般学校的数据量都比较少,可以无脑的堆一些统计特征,然后在自己的单机上运行(包括一般的数据竞赛初期也是),运用树模型得到特征重要性,删除无用特征,对重要特征进行再次挖掘开发。但是在公司里面数据是不缺的,数据不仅在量上比较多,在维度上也是特别大,不可能像前面那样做(即使是分布式平台也无法做到),只能根据自己对业务的理解,手动的选择一些自己认为重要的特征,进行相应的处理和验证,不断重复。还有就是公司的数据很多时候是没有标签的,需要按照自己的理解对其打上标签,才能带入模型训练。
平时的目标规划:
……人都是有生活的,所以不要给自己设定每天都学习的目标,一是完成不了,二又容易导致挫败感。此外,近期的目标不要设太多,1到两个刚刚好。还有就是严格制定每天的目标,然后将本来的完成日期延迟一点,这样更能完成呢,不会因为这两天有事就突然跟不上,导致最后直接放弃。

猜你喜欢

转载自blog.csdn.net/qq_15220357/article/details/81139406