机器学习笔记(一)初识机器学习

机器学习:目前没有统一的定义

现有定义:
1.samuel(1950): 在没有明确设置的情况下,使计算机具有学习能力。
2.TOM(更新的定义):计算机程序从经验E(Experience)中学习,解决某一任务T(Task),进行某一性能度量P(Performance),通过P测定在T上的表现因经验E而提高

举个例子, 让邮件系统智能的过滤垃圾信息:

T:标定这个邮件是垃圾邮件或者不是(Classfying emails as spam or not a spam)

E: 查看邮件是标定垃圾或不是(Watching you label emails as spam or not spam\)

P: 正确归类的邮件的比例(The number(or fraction) of email correctly classified as spam or not)


机器学习分为:

1. 有监督学习

监督学习是指 我们给算法一个数据集,其中包含了正确答案。也就是说我们给它一个房价数据集,在这个数据集中的每个样本,我们都给出正确的价格即这个房子实际卖价,算法的目的就是给出更多的正确答案.

如房价:给定某地房子大小和房价的数据,根据这些数据,给定一个房子尺寸大小,预测该尺寸对应的房价。

  

回归问题(regression):结果是线性的(我们设法预测出一个连续值的结果)
 

分类问题(classification):结果是离散的(我们设法预测出一个离散值的结果)

接下来,两道题:

1. 你又很多同一件货物的库存,你想预测你能卖出多少件

2. 你想设计一个软件, 来检查每一个客户的账户,判定这个账户是否被侵入或者安全

结果是, 问题1 是回归问题

             问题2 是分类问题

2. 无监督学习

相对于监督学习(给定输入,输出,作为参考),无监督学习不知道输入/输出是什么,只能将数据进行聚类。

聚类和分类的区别:
分类:已知数据的类型,即在没有输入的时候,就知道输出的结果(如:肿瘤良性还是恶性)。
聚类:不知道数据的类型,只给数据一些特征,机器根据特征,将数据分开。


 

猜你喜欢

转载自blog.csdn.net/weixin_38399962/article/details/82592471
今日推荐