周志华版机器学习第一章习题答案

原文参考链接:https://blog.csdn.net/icefire_tyh/article/details/52065224
习题
1.1
数据集有3个属性,每个属性3种取值(其中一种属性为‘*’),由于本题只有编号1和4,所以默认含有关键字“青绿”、“蜷缩”、“浊响”的为好瓜,含有 “乌黑”、 “稍蜷”、 “沉闷”的为坏瓜,本题可以分为三种情况:
一、有一个元素确定的情况
青绿+ * + *
*+蜷缩+ *
*+ * +浊响
二、有两个元素确定的情况
青绿+蜷缩 + *
*+蜷缩+ 浊响
青绿+ * +浊响
三、有三个元素确定的情况
青绿+蜷缩 +浊响
一共七个版本
不明白的可以参考图1.2

1.2
https://blog.csdn.net/weixin_44813954/article/details/104714186
1.3
通常认为两个数据的属性越相近,则更倾向于将他们分为同一类。若相同属性出现了两种不同的分类,则认为它属于与他最临近几个数据的属性。也可以考虑同时去掉所有具有相同属性而不同分类的数据,留下的数据就是没误差的数据,但是可能会丢失部分信息。
1.4
还是考虑二分类问题,NFL首先要保证真是目标函数f均匀分布,对于有X个样本的二分类问题,显然f共有2X2X种情况。其中一半是与假设一致的,也就 P(f(x)=h(x))=0.5P(f(x)=h(x))=0.5。
此时, ∑fl(h(x),f(x))=0.5∗2X∗(l(h(x)=f(x))+l(h(x)≠f(x)))∑fl(h(x),f(x))=0.5∗2X∗(l(h(x)=f(x))+l(h(x)≠f(x)))
l(h(x)=f(x))+l(h(x)≠f(x))l(h(x)=f(x))+l(h(x)≠f(x))应该是个常数,隐含的条件就该是(一个比较合理的充分条件) l(0,0)=l(1,1),l(1,0)=l(0,1)l(0,0)=l(1,1),l(1,0)=l(0,1)。如果不满足, NFL 应该就不成立了(或者不那么容易证明)。
1.5
1、比如和直男讨论口红哪只好看,淘宝就会给我推送小金条、小辣椒
2、比如最近学深度学习算法,加了不少学习群、刷视频就会刷到防脱洗发水
3、搜狗输入法的习惯用词
4、这个开放性题目就不多解释了哈。

猜你喜欢

转载自blog.csdn.net/weixin_43518584/article/details/105565489