VC维的一个理解

从深度学习书中记录:统计学习理论提供了量化模型容量的不同方法。在这些方法中,最有名的是Vapnik-Chervonenkis维度,简称VC维。

个人理解:这句话表明VC维用来衡量模型的容量,或者说是power,即模型的拟合能力;

以VC 维度量二元分类器的容量,VC维定义为该分类器能够分类的训练样本的最大数目。假设存在m个不同的x点的训练集,分类器可以任意地标记该m个不同的x点,VC维被定义为m的最大可能值。

个人理解:VC维是该分类器最多能拟合的样本数量;这里有个基本要求就是当样本数量为m时,这m个样本可以是任意值;

举例说明:一个二元线性分类的VC维是多少呢?
对于三个样本点的情况:

对于这三个点可以实现任意分类;



结论:二维线性分类器的VC维是3,超过3个以上的样本点,该分类器就会出现无能为力的时候,无法进行正确的分类;




个人理解:大概明白VC维的功能就OK了, 没必要去刨根问底


猜你喜欢

转载自blog.csdn.net/ningyanggege/article/details/80980273
今日推荐