Zipf,Power-laws,Pareto分布

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ZCF1002797280/article/details/51495225

对于在对数坐标系中出现一条直线而言,三种分布都是可能的:ZipfPower-lawsPareto。这三种分布都是用于描述同一种现象:大量事件是稀少的,而一些小事件确是很普遍的。
例如:成绩非常优异的学生是少数,但是成绩中等的学生却很多。

(1)Zipf分布

描述事件出现平率 y 与其由下优先级 r(Rank) 之间的关系,按照Zipf模型,事件出现的平率与其优先级 r 成反比:

yr(b)

其中 b 近似为1

(2)Pareto分布

用于描述大于 x 的事件的数量,按照Pareto模型,事大于 x 的事件数量与 x 成反比例:

P{X>x}x(k)

以职员收入为例,千万富翁是少数,而中等收入的人却很多。

(3)Power-laws分布

parto规律不同,Power-laws分布不仅描述等于 x 的事件数量。按照Power-lays模型,

P{X=x}x((k+1))

即:对于指数为 k Pareto分布,也是指数为 (K+1) Power-laws分布。

参考


【完】

猜你喜欢

转载自blog.csdn.net/ZCF1002797280/article/details/51495225
今日推荐