万物皆可特征化？---学习心得篇---2018/6/10

我们手上有一系列的实例，假设每个实例是由一个或以上的特征组成。为什么说实例a和实例b是不同的呢？因为组成实例a与实例b的特征不同。如果组成实例a与实例b的特征完全相同，那么我们说其实只有一个实例，a或b，并没有两个实例。再言之，实例只是特征的组合，并没有增加额外的信息。不同的特征组合，就构成不同的实例。

—— 世界上没有两片相同的叶子。

假如我们对“叶子”这个实例进行特征提取，我们可以提取出X=(颜色，大小，形状，位置，生长周期，……)，如果要两片叶子完全相同，则需要组成它们的特征完全相同。如果有其中一个特征不同，则它们必然是不同的叶子。就"位置"这个特征来说，不存在两片叶子位于同一个位置。一个位置只能有一片叶子。也就是说，现存的每片叶子必然是不同的，抛开其他特征不说，光叶子的“位置”特征就具有唯一性，因此从这个角度可以论证“世界上没有两片相同的叶子”。(该论述纯属娱乐)

那我们是不是能将世界上所有的事物都特征化呢？黑客帝国2-重装上阵里面，先知对尼奥说，矩阵里面所有的事物都有一个它所属的类别的程序主宰。比如树木，比如地上的鸟儿，比如风……。万物莫非真有自己的特征向量，然后修改下某个特征的值，最后出现不同的个体（实例）？

机器学习里面，众多算法都是在做对实例进行分类的工作。其实分类，也可以从特征角度去看。每个类别，其实也是一个特征。比如说，将人按性别分为男人，女人，性别也可以看成人的一个特征。那我们在训练数据集中，对实例进行分类，实质上是在做什么？其实是研究n个特征与第n+1个特征之间是否存在联系。如果它们之间无任何联系，那么机器学习就不会有成效，不会比随机的扔硬币效果来得更好。但是，我们相信，实例的n个特征与第n+1个特征是存在某种联系的。而只要我们把这种联系找到，那我们就可以通过某实例的 n个特征 来预测或判断它的 第n+1个特征 。

万物皆可特征化？---学习心得篇---2018/6/10

猜你喜欢