Coursera-吴恩达-机器学习-第六周-测验-Machine Learning System Design

说实话,这一次的测验对我还是有一点难度的,为了刷到100分,刷了7次(哭)。

无奈,第2道和第4道题总是出错,后来终于找到错误的地方,错误原因是思维定式,没有动脑和审题正确。

这两道题细节会在下面做出讲解。

第二题分析:题意问,使用大量的数据,在哪两种情况时会有好的表现?

B选项,算法中有很多feature,需要大量的数据进行训练,故正确。

C选项,feature中有能预测正确的充足的信息。故正确。

C选项可以理解为,我们可以有很多feature,但是我们需要的是有用的feature(包含了充足的信息,以致于我们能够预测正确)。

第四题分析:题意是对垃圾邮件进行分类,有99%不是垃圾邮件(y=0),1%是垃圾邮件(y=1)。

画出 skewed data 的 error metrics,问题就明朗了。

 

猜你喜欢

转载自blog.csdn.net/qq1376725255/article/details/82951547
今日推荐