斯坦福大学公开课-吴恩达-机器学习-第一节 引言

引言


1.1欢迎


1.1.1应用

  • 数据挖掘
  • 医疗应用
  • 计算生物学
  • 手写识别
  • 自然语言处理
  • 计算机视觉


1.2机器学习是什么?


1.2.1定义

  • Arthur Samuel:在进行特定编程的情况下,给予计算机学习能力的领域
  • Tom Mitchell:一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升
    • 例1:经验E*就是程序上万次的自我练习的经验,而任务T就是下棋,性能度量值P**呢,就是它在与一些新的对手比赛时,赢得比赛的概率

1.2.2学习算法

  • 无监督学习:编程人员将教计算机如何去完成任务
  • 监督学习:计算机自己进行学习,完成任务
  • 其他:
    • 强化学习
    • 推荐系统


1.3监督学习


1.3.1定义

  • 基本思想是,数据集中的每个样本都有相应的“正确答案”,算法依据这些样本做出预测。

1.3.2使用

  • 每当想要根据给定输入,预测某个结果时,并且还有输入-输出对的示例时,都应该使用监督学习

1.3.3类别

  • 回归:其目标预测一个连续值,推测一系列连续值属性
    • 例1:根据教育水平、年龄和居住地来预测一个人的年收入,预测的结果是一个金额数值
    • 例2:根据房子面积预测房价
  • 分类:预测分类标签,这些标签来自预定义的可选列表,推出一组离散的结果
    • 例1:邮件系统,对垃圾邮件的识别
    • 例2:根据肿瘤的属性来对肿瘤进行分类,判断良性或者恶性

1.3.4几个小概念

  • 泛化:如果一个模型能够对没见过的数据做出准确预测,我们就说它能够从训练集泛化到测试集,我们的目的是要构建一个泛化精度尽量高的模型
  • 过拟合:过分关注训练集的细节,得到了一个在训练集上表现很好,但不能泛化到新数据上的模型,那么就存在过拟合现象
  • 欠拟合:模型过于简单,可能无法抓住数据的全部内容以及数据中的变化。甚至可能模型在训练集上的表现也很差

1.3.5小测验


1.4无监督学习


1.4.1定义

  • 没有提前告知算法一些信息,数据中没有任何的标签或者是相同的标签或者就是没标签,在数据集中找到某种结构,找到数据之间的关系
  • 它是学习策略,交给算法大量的数据,并让算法为我们从数据中找出某种结构

1.4.2例子

  • 新闻中的新闻分组,组成有关联的新闻
  • DNA微观数据的分析,把个体聚类到不同的类或者不同类型的组
  • 计算机集群协同工作,分组成更高效的组
  • 社交网络的分析,自动给出朋友的分组
  • 天文数据的分析
  • 鸡尾酒问题,分离出声音

猜你喜欢

转载自www.cnblogs.com/fangzhiyou/p/12544723.html