《Machine Learning Yearning》第13章

第二部分开始啦。主题是基本错误分析

13 Build your first system quickly, then iterate

 你打算做一个新的反垃圾邮件的系统,你的团队有下面几个想法:

  • 收集大量的垃圾邮件做训练数据。例如,设置“蜜罐(honeypot)”:故意给已知的垃圾邮件发送者发送假邮件地址,那么你就可以自动收集他们发送给这些地址的垃圾邮件了。
  • 开发能理解邮件内容的功能。
  • 开发能理解邮件信封/标题特征的功能,以显示信息所经过的互联网服务器。
  • 其他

 即使我研究过大量的反垃圾邮件项目,我还是很难选择其中一个方向。如果你不是这个应用领域的专家,那就更难了。

 所以不要一开始就尝试去设计创建一个完美的系统。反之,可以在几天之内快速创建并训练一个基本系统 1 。即使这个基本系统离你能建立的最好的系统还有一段距离,但是测试这个基本系统的功能也是很有价值的:你会很快找到线索,向你展示值得投入时间的最有前景的方向。接下来几张将会向你展示如何阅读这些线索。
这里写图片描述

1 这个建议适合于想要创建AI应用程序的读者,而不是那些想发表学术论文的读者。我稍后会回到做研究这个主题。

猜你喜欢

转载自blog.csdn.net/lisa_ren_123/article/details/81092047