说交叉熵之前先介绍相对熵,相对熵又称为KL散度(Kullback-Leibler Divergence),用来衡量两个分布之间的距离,记为
这里 是 的熵。
假设有两个分布p和q,它们在给定样本集上的交叉熵定义为:
从这里可以看出,交叉熵和相对熵相差了 ,而当 已知的时候, 是个常数,所以交叉熵和相对熵在这里是等价的,反映了分布 和 之间的相似程度。
说交叉熵之前先介绍相对熵,相对熵又称为KL散度(Kullback-Leibler Divergence),用来衡量两个分布之间的距离,记为
这里 是 的熵。
假设有两个分布p和q,它们在给定样本集上的交叉熵定义为:
从这里可以看出,交叉熵和相对熵相差了 ,而当 已知的时候, 是个常数,所以交叉熵和相对熵在这里是等价的,反映了分布 和 之间的相似程度。