机器学习笔记（参考吴恩达机器学习视频笔记）10_机器学习系统的设计 - 代码天地

机器学习笔记（参考吴恩达机器学习视频笔记）10_机器学习系统的设计

其他 2018-11-12 08:51:02 阅读次数: 0

版权声明：博客内容都是对一些知识的整理，可能有些部分存在借鉴，如果存在侵权，请联系我删掉。 https://blog.csdn.net/cunxinlitian/article/details/82791314

10 机器学习系统的设计

10.1 构建学习算法的方法

以一个垃圾邮件分类器算法为例。先要做的决定是如何选择并表达特征向量x, 可以选择一个由 100 个最常出现在垃圾邮件中的词所构成的列表，根据这些词是否有在邮件中出现，来获得我们的特征向量（出现为 1，不出现为 0），尺寸为 100×1。构建一个学习算法的推荐方法为：

1）从一个简单的能快速实现的算法开始，实现该算法并用交叉验证集数据测试这个算法。

2）绘制学习曲线，决定是增加更多数据，或者添加更多特征，还是其他选择。

3）进行误差分析：人工检查交叉验证集中我们算法中产生预测误差的实例，看看这些实例是否有某种系统化的趋势。

10.2 类偏斜的误差度量

类偏斜情况表现为训练集中有非常多的同一种类的实例，只有很少或没有其他类的实例。这时，误差的大小是不能视为评判算法效果的依据的。查准率（ Precision）和查全率（ Recall）我们将算法预测的结果分成四种情况：

1）正确肯定（ True Positive,TP）：预测为真，实际为真。

2）正确否定（ True Negative,TN）：预测为假，实际为假。

3）错误肯定（ False Positive,FP）：预测为真，实际为假。

4）错误否定（ False Negative,FN）：预测为假，实际为真。

查准率（P）=TP/(TP+FP)。表示所有预测为真的样本中，实际上为此真的百分比，越高越好；查全率（R）=TP/(TP+FN)。表示所有实际上为此真的样本中，成功预测为真的百分比，越高越好。

10.3 权衡查准率和查全率

假设算法输出的结果在 0-1 之间，使用阀值 0.5 来预测真和假。如果希望只在非常确信的情况下预测为真，即希望更高的查准率，可以使用比0.5更大的阀值，如 0.7，0.9。但是会增加未能成功预测为假的情况，反之，亦然。

想要权衡查准率和查全率，选择计算F1 值（ F1 Score），其计算公式为：

选择使得最高的阀值。

猜你喜欢

转载自blog.csdn.net/cunxinlitian/article/details/82791314

机器学习笔记（参考吴恩达机器学习视频笔记）10_机器学习系统的设计

机器学习笔记（参考吴恩达机器学习视频笔记）15_推荐系统

吴恩达机器学习笔记——机器学习系统设计

机器学习笔记（参考吴恩达机器学习视频笔记）01——初识机器学习

吴恩达学习笔记——十一、机器学习系统的设计

机器学习笔记（参考吴恩达机器学习视频笔记）05_逻辑回归

机器学习笔记（参考吴恩达机器学习视频笔记）16_决策树

机器学习笔记（参考吴恩达机器学习视频笔记）17_贝叶斯分类器

机器学习笔记（参考吴恩达机器学习视频笔记）14_异常检测

机器学习笔记（参考吴恩达机器学习视频笔记）13_降维

机器学习笔记（参考吴恩达机器学习视频笔记）12_聚类

机器学习笔记（参考吴恩达机器学习视频笔记）11_支持向量机

机器学习笔记（参考吴恩达机器学习视频笔记）06_正则化

吴恩达机器学习笔记（五） —— 应用机器学习的建议和机器学习系统设计

机器学习笔记（参考吴恩达机器学习视频笔记）09_应用机器学习的建议

吴恩达机器学习______学习笔记记录#十一、机器学习系统的设计

机器学习笔记（参考吴恩达机器学习视频笔记）08_神经网络的学习

吴恩达机器学习课程笔记+代码实现(15)10.机器学习系统的设计(Machine Learning System Design)

吴恩达机器学习笔记 —— 12 机器学习系统设计

吴恩达机器学习笔记（一）

吴恩达机器学习笔记（八）

吴恩达机器学习笔记（三）

吴恩达机器学习笔记（二）

吴恩达机器学习笔记（十四）

吴恩达机器学习笔记（十三）

吴恩达机器学习笔记（九）

吴恩达机器学习笔记（七）

吴恩达机器学习笔记（六）

吴恩达机器学习笔记（五）

吴恩达机器学习笔记（四）

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)