数据预处理--总述

  围绕着要喂给神经网络的数据:收集数据、清洗数据、操作数据、给数据加标签、分析数据、做数据可视化等等。

数据预处理阶段

  基于对业务的理解,这种相对比较少一点,更多的还是基于数据本身。你可以用一些数据挖掘中常用的数据清理的方法,过滤异常值,过滤缺失严重的特征等等。

  有时候做预处理,最终还是需要一些反馈。比如从数据上看,可能需要扔掉某些东西。我们需要去试一试,扔掉这些东西之后,在最终的比赛中,提交的预测结果会不会变好。或者采用以结果导向的反馈,这样迭代去往下走。

  另外,每个比赛其实都有一些自己独特的数据,即使是同样领域的问题,数据的分布也可能差别很大。这时候之前的经验可能就不适用当前的问题,我们必须接受这样一个事实,需要针对数据重新去建立问题的解决方案。其实这还是一个偏实践的问题,实践推动着你往前走。
  你要真想玩,那你就得坚持,不断地去看论坛上的帖子,想想人家是怎么做的,再去改进自己的方案,那样总会迎来收获。

猜你喜欢

转载自blog.csdn.net/wydbyxr/article/details/84749835