万物皆可特征化?---学习心得篇---2018/6/10

   我们手上有一系列的实例,假设每个实例是由一个或以上的特征组成。为什么说实例a和实例b是不同的呢?因为组成实例a与实例b的特征不同。如果组成实例a与实例b的特征完全相同,那么我们说其实只有一个实例,a或b,并没有两个实例。再言之,实例只是特征的组合,并没有增加额外的信息。不同的特征组合,就构成不同的实例。


    —— 世界上没有两片相同的叶子。
     假如我们对“叶子”这个实例进行特征提取,我们可以提取出X=(颜色,大小,形状,位置,生长周期,……),如果要两片叶子完全相同,则需要组成它们的特征完全相同。如果有其中一个特征不同,则它们必然是不同的叶子。就"位置"这个特征来说,不存在两片叶子位于同一个位置 。一个位置只能有一片叶子。也就是说,现存的每片叶子必然是不同的,抛开其他特征不说,光叶子的“位置”特征就具有唯一性,因此从这个角度可以论证“世界上没有两片相同的叶子”。(该 论述纯属娱乐)
    那我们是不是能将世界上所有的事物都特征化呢?黑客帝国2-重装上阵里面,先知对尼奥说,矩阵里面所有的事物都有一个它所属的类别的程序主宰。比如树木,比如地上的鸟儿,比如风……。万物莫非真有自己的特征向量,然后修改下某个特征的值,最后出现不同的个体(实例)?

     机器学习里面,众多算法都是在做对实例进行分类的工作。其实分类,也可以从特征角度去看。 每个类别,其实也是一个特征。比如说,将人按性别分为男人,女人,性别也可以看成人的一个特征。 那我们在训练数据集中,对实例进行分类,实质上是在做什么?其实是研究n个特征与第n+1个特征之间是否存在联系。如果它们之间无任何联系,那么机器学习就不会有成效,不会比随机的扔硬币效果来得更好。但是,我们相信,实例的n个特征与第n+1个特征是存在某种联系的。而只要我们把这种联系找到,那我们就可以通过 某实例的 n个特征 来预测或判断它的 第n+1个特征

猜你喜欢

转载自blog.csdn.net/yeziand01/article/details/80641863