gephi中的统计算法学习

gephi是一个数据可视化处理软件,其中有很多对数据分析的统计算法,对于很多数据分析算法都有实现,那么就来看看其中的一些统计方法:
1.   degree  (平均度)
计算每个节点的度,并统计相同度的节点数量
平均度:  有向图: 所有点的度数总和/节点数*2    无向图: 所有点的度数总和/节点数
在图上能够,看出每个度所占的百分比,能够看到每种度用不同颜色标示
通过这个可以看出哪些节点的度高,反应出连接他的点就多,就越关键
 
2.  weightedDegree  平均加权度
加权入度   加权出度   加权度
有向图: 取得每个点的边,如果该边的源为该节点,那么该边的权重为加权出度,反之亦然。计算出每个点的加权出度,入度和度
其实平均度是平均加权度的一个特例,平均度的每条边的权重为1
加权度为加权出度和入度的总和
计算同样入度出度的节点个数
无向图: 取得每个点的边,将边的权重求和,即为该点的加权度
平均加权度: 有向图:加权度总和/2*节点数    无向图: 加权度总和/节点数
 
3.  GraphDistance  网络直径
后续补充
 
4.  graphdensity  图密度
无向图:   边数*2 / (节点数*节点数-节点数)
有向图:   边数 / (节点数*节点数-节点数)
大概理解:  (节点数*节点数-节点数) 这个计算出最多的连接边数(不包含连自己)  ,  用实际边数除以最大可能边数,即为密度, 结果越大表示图中节点连接越紧密
 
5. hits( Hyperlink-Induced Topic Search) 分析经典的基于超链接分析的主题搜索  点击次数
计算2个值
authority:  每个节点入度的比值。 简单的,就是总的节点的入度和,除以该节点入度和,提现节点重要性,或者页面的重要性,被链接的多,说明入度多,就跟重要
计算每个引入(指向该节点)该节点(有入度的节点)的节点的hub(初始为1)总和,用该值除以所有点的authority值
hub:  
计算每个引入(指向该节点)该节点(有出度的节点)的节点的 authority (初始为1)总和,用该值除以所有点的 hub 值
6.  modularity  模块化
一种聚类算法,后续补充。。。

猜你喜欢

转载自twtbgn.iteye.com/blog/1973627