吴恩达机器学习笔记week9 - 代码天地

吴恩达机器学习笔记week9

其他 2018-09-11 10:42:17 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/asasasaababab/article/details/82291488

本周主要讲异常检测和协同过滤算法。

异常检测

Motivation

异常检测主要的motivation是我们可能有很多正常的样本，异常样本很少，然而异常样本才是业务中感兴趣的正样本，这个时候我们无法使用分类。一方面是因为正样本太少了，另一方面，其实我们也不知道异常样本到底都有那些类，在这种情况下，我们就会使用异常检测这种方式进行。

主要思路

主要思路就是负样本有一个分布，一般假设成高斯的，然后估计出高斯的均值和方差，然后新样本就直接在这个分布下计算概率密度或者概率，如果足够小，就判别为异常。

流程

这里写图片描述

数据集划分

这里写图片描述

异常检测和监督学习的对比

这里写图片描述

一些其他事项

非高斯可以尝试取个对数，或者是开根号啥的
这里写图片描述
另外很可能找到的feature上显示异常和正常值的feature的概率在一个量级，那么这个时候解决的办法是复合一下其中的一些feature，比方说x1/x2，或者再去挑选能够表征异常的的feature。
另外一个是协方差不为0的高维高斯，参数估计方法如下：
这里写图片描述

推荐系统

推荐系统这里使用的是协同过滤的方法。
简要来说就是使用线性回归对用户对目标产品的评分进行回归估计。
以一个例子来说明：
这里写图片描述

这里写图片描述

在我们直到Movie的特征的情况下，比方说是爱情元素还是动作元素，在这种情况下，相当于特征我们是知道的，那么可以直接对参数 $\theta$ 进行估计。
这里写图片描述
只要使用梯度下降法就可以了：

协同滤波

但是问题是，我们其实很难直接给出一个电影究竟浪漫元素分值是多少，在这种情况下，x的值也是不知道的：
这里写图片描述
在这种情况下，我们有两种方法解，一种是随机初始化 $x$ 和 $\theta$ ，然后分别迭代优化，另外一种就是用一个cost function，一起优化 $x$ 和 $\theta$ ，也就是协同滤波的含义。

算法如下：

在这种情况下，其实就显出来，需要随机初始化 $x$ 和 $\theta$ 了，否则无法symmetric break。这个和神经网络是一个道理。
另外有一个实现上的问题，mean normalization：
这里写图片描述

猜你喜欢

转载自blog.csdn.net/asasasaababab/article/details/82291488

吴恩达机器学习笔记week9

Coursera吴恩达机器学习week9的ex8编程作业代码

吴恩达机器学习笔记（week2）

吴恩达机器学习课笔记week 4

吴恩达机器学习课笔记week 3

吴恩达机器学习笔记week 8

吴恩达机器学习课笔记week 6

吴恩达机器学习笔记week11

吴恩达机器学习笔记week10

吴恩达深度学习笔记9-Course3-Week2【机器学习策略（ML Strategy）2】

吴恩达机器学习总结（9）

Coursera机器学习基石笔记week9

机器学习---吴恩达---Week9_1（异常检测）

吴恩达深度学习笔记 course3 week2 机器学习策略(2)

[吴恩达机器学习课程笔记] week three 无监督学习

[吴恩达机器学习课程笔记] week four强化学习

吴恩达机器学习笔记（七）

吴恩达机器学习笔记（六）

吴恩达机器学习笔记（五）

吴恩达机器学习笔记（四）

吴恩达机器学习笔记（一）

吴恩达机器学习笔记（十三）

吴恩达机器学习笔记（十二）

吴恩达机器学习笔记（十一）

吴恩达机器学习笔记（十）

吴恩达机器学习笔记（八）

吴恩达机器学习笔记（十四）

吴恩达机器学习笔记（三）

吴恩达机器学习笔记（二）

吴恩达机器学习笔记（九）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)