机器学习西瓜书学习笔记1.3假设空间

科学推理的两大基本手段
归纳( i n d u c t i o n induction induction:特殊到一般的泛化过程(从具体的事实中归接触一般性规律)
演绎( d e d u c t i o n deduction deduction:一般到特殊的特化过程(从基础原理推理演绎)

归纳学习:
广义:从样例中学习
狭义:从训练数据中学得概念( c o n c e p t concept concept),“概念学习”,“概念形成”

布尔概念学习:最基本的概念学习 是/不是 0/1

编号 色泽 根蒂 敲声 好瓜
1 青绿 蜷缩 浊响
2 乌黑 蜷缩 浊响
3 青绿 硬挺 清脆
4 乌黑 稍蜷 沉闷

学习目标:好瓜
决定因素:色泽,根蒂 ,敲声
布尔表达式:好瓜 ↔ \leftrightarrow (色泽=?)^ (根蒂=?) ^ (敲声=?) 这里?表示尚未确定的值。

‘记住’训练样本,机械学习,死记硬背式学习,对没见过的瓜怎么办?
把学习过程看作一个在所有假设( h y p o t h e s i s hypothesis hypothesis)组成的空间中尽心搜索的过程,
搜索目标:找到与训练集‘匹配’的假设。假设的表示一旦确定,假设空间及其规模大小也就确定了
例:假设空间由形如“(色泽=?)^ (根蒂=?) ^(敲声=?)”的可能取值所形成的假设组成,例如色泽由 青绿 乌黑 敲声 三种可能取值;还要考虑到也许色泽无论取什么值都合适,用通配符 ‘ ∗ ’ ‘*’ 表示,例如 好 瓜 ↔ ( 色 泽 = ∗ ) ∧ ( 根 蒂 = 蜷 缩 ) ∧ ( 敲 声 = 混 响 ) 好瓜\leftrightarrow(色泽=*)\wedge(根蒂=蜷缩)\wedge(敲声=混响) (=)=(=),即,好瓜满足后面条件,色泽什么都可以。

此外考虑极端情况,不存在好瓜, ∅ 表 示 \emptyset表示

若色泽 根蒂 敲声 分别有3,3,3,种可能取值,则面临的假设空间大小为 4 × 4 × 4 × 4 + 1 = 65 4\times4\times4\times4+1=65 4×4×4×4+1=65(这里我也不是很清楚,理解是4是3加了一个通配选项,最后加一是当全部都为通配选项的情况)西瓜的假设空间
可以通过许多策略对假设空间进行搜索
自顶而下、从一般到特殊
自下而上、从特殊到一般
搜索的过程中可以不断删除与正例不一致的假设,和与反例一致的假设。最终会获得与训练集一致的假设,就i学得的结果。

现实问题面临更大的假设空间,但学习过程是基于有限样本训练集进行的,因此可能与多个假设与训练集一致,即存在着一个与训练集一致的‘假设集合’ 称之为版本空间,例如在西瓜问题中,与表对应训练集对应版本空间如下;西瓜问题的版本空间

猜你喜欢

转载自blog.csdn.net/ohhardtoname/article/details/92399912