不用公式学机器学习---《统计学习方法》学习笔记-第1章

第1章概要

1.统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行分析与预测的一门学科,统计学习包括监督学习、非监督学习、半监督学习和强化学习。

2.统计学习方法三要素——模型、策略、算法。

3.本书主要讨论监督学习,监督学习可以概括如下:从给定有限的训练数据出发,假设数据是独立同分布的,而且假设模型属于某个假设空间,应用某一评价准则,从假设空间中选取 一个最优的模型,使它对已给训练数据及未知测试数据在给定评价标准意义下最准确的预测。

4.统计学习中,进行模型选择或者提高学习的泛化能力是一个重要问题。如果只考虑减少训练误差,就可能产生过拟合现象。模型选择的方法有正则化与交叉验证。学习方法活化能力的分析是统计学习理论研究的重要课题。

5.分类问题、标注问题和回归问题都是监督学习的重要问题。本书中介绍的统计学习方法包括感知机、K邻近法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场。这些方法是主要的分类 、标注以及回归方法。它们又可以归类为生成方法与判别方法。

习题:

1.1  说明伯努利模型的极大似然估计以及贝叶斯估计中的统计学习方法三要素。

伯努利模型是定义在取值为0与1的随机变量上的概率分布。假设观测到伯努利模型n次独立的数据生成结果,其中k次的结果为1,这时可以用极大似然估计或贝叶斯估计来估计结果为1的概率。

解题思路:

  此题是考察学习者对于统计学习方法三要素的认识与理解。

  教材原文:第2页,“统计学习方法包括模型的假设空间、模型选择的准则以及模型学习的算法 ,称其为统计学习方法的三要素,简称为模型(model)、策略(strategy)和算法(algorithm)” 

  那么我们可以知道,三要素其实是指假设模型、选择模型、求解模型的过程。模型(model)是在假设模型、策略(strategy)是在选择最优模型、算法(algorithm)指代的是求解最优模型,算法其实可以简单地理解为是一个解方程的过程。这里需要说明一下,假设模型时其实是假设了一类模型或者说是一组模型;选择模型是选择了其中一个作为最优;求解模型是求解只解最优模型。

  那么在此题中,伯努利模型分别用了何种模型、何种策略、何种算法呢?即伯努利模型中 假设了什么模型(模型)、如何选择模型(策略)和如何求解模型(算法)?

 

参考博客:

https://blog.csdn.net/bumingqiu/article/details/73761602

猜你喜欢

转载自www.cnblogs.com/shunvjingjing/p/9239078.html