第三十三章
为何与人类表现水平进行对比:
许多机器学习系统的设计目的是想要自动化一些人类可以处理得很好的事情,可举的例子有图像识别、语音识别以及垃圾邮件分类等等。此外,有许多理由表明在处理人类擅长的任务时,构建机器一个学习系统会更加简单:
1.易于从人为标签中获取数据
2.基于人类直觉进行误差分析
3.使用人类表现水平来估计最优错误率,并设置可达到的“期望错误率”。
面临的难题:
1.很难获取标签数据
2.人类的直觉难以依靠
3.最优错误率和合理的期望错误率难以确定
第三十四章:
如何定义人类表现水平?
如果你的系统目前的误差为 40%,那么不论是让初级医生(10% 误差)还是有经验的医生(5% 误差误)来给你的数据贴上标签,那都没有关系。是如果你的系统误差已经是 10%,那么将人类表现水平定义为 2% 将为你提供更好的途径来改进你的系统。
第三十五章:
超越人类表现水平
假设你的系统在处理识别含有噪音的音频任务时表现已经优于人类,然而在转录语速很快的语音时人类仍然占有优势。因此在机器已经超越人类水平的问题上,进展通常比较慢,而当机器仍在试图赶上人类水平时,进展速度反而更快。