社交网络分析1——网络分析入门

社交网络分析1——网络分析入门

A Primer on Network Analysis

前言

本文为翻译学习数学家Andrew Beveridge创建的网站Network of Thrones上的文章,该网站以“权力的游戏”和其原著《冰与火之歌》文本为基础,对人物进行网络分析。一张图展示他的强大:
在这里插入图片描述
(图片来源于Network of Thrones官网)

内容

我们将把网络科学的一些工具应用到每个人最喜欢的复杂系统上: the kingdoms of Westeros and Essos。我们对人物网络进行了探索性分析,主要关注两个问题:

  • 哪些人物属于一类,在网络中形成社区?
  • 哪些角色在网络中扮演重要角色?

1.社区(Communities)

“社区”的定义很难理解。从直观上讲,社区是网络的一个子集,它形成了一个独立的、连贯的子网络。人们用于社区检测的一个常见指标是,社区内应该有很多边缘,而社区之间的边缘应该更少。这个想法是由一个称为模块化的量捕获的,我在这里不会明确定义。对于一个网络,我们使用标准技术将网络划分为多个社区,从而实现最佳的模块化(或者尽可能接近)。这个过程的一个很好的特点是得到社区的数量,而不是预先挑选出最佳数量的社区。
一旦我们将一个网络划分成社区,我们就根据它们的社区给节点着色,并选择一个能体现社区结构的网络布局。例如,这里有一个包含三个社区的网络:
在这里插入图片描述
(图片来源于Network of Thrones官网)

2.中心性(Centralities)

并非所有节点的创建都是相等的。有些节点在网络中扮演着一个巨大的角色,要么通过拥有许多连接,要么通过战略定位帮助连接网络的远程部分。事实上,节点的重要性和影响力有很多种方式。在我们的分析中,我们将重点放在五个不同的中心性度量上,每个度量捕获不同的动态。这些中心性指标已被广泛应用于社会学、经济学、计算机科学等各个领域。没有一个绝对正确的中心性参数。与其他数据科学技术一样,必须根据我们在基础领域的专家知识来解释这些量。
例如,考虑以下网络。哪些节点很重要?哪个节点最重要?
在这里插入图片描述(图片来源于Network of Thrones官网)
很明显,绿色和红色节点是最重要的。这种重要性更多地反映了连接计数(灰色节点几乎有相同数量的邻居)。红色和绿色节点对于网络的连接至关重要。但是哪个更重要:绿色还是红色?这真的要看情况了,这是什么样的网络?如果这是一个交易网络,那么绿色有很大的力量,因为蓝色顶点只能与绿色交易。但如果这是一个政治网络,那么红色可能更强大,因为红色可以促进一个紧密结合的群体的共识。
我们实际要用到的以人物为节点的网络。当这两个节点(node)以某种形式有交互时,两个节点之间由边(edge )连接。这些边由交互总数加权形成。频繁互动的角色将被一个高质量的边连接起来。熟人之间会有一个低权重的边。完全陌生的人不会被任何边连接。
下面是我们将使用的五种不同的中心性参数:

(1)中心度(Degree Centrality)

一个节点的中心度是连接到它的节点数目,也就是与该节点至少有一次交互的节点的数量。

(2)加权中心度(Weighted Degree Centrality)

加权中心度是与节点关联的边的权重之和,是节点的交互总数。

(3)特征中心度(Eigenvector Centrality)

这是带有反馈回路的加权中心度。与“重要”的人建立联系也会让你变得更重要。在这个尺度上,你因为认识一个重要的人而得到充分的赞扬,即使你不太了解他们。理论上这可以衡量你的网络有多强大,不管你是否在充分利用你的网络。

(4)PageRank 中心度(PageRank Centrality)

这是另一个带有反馈循环的加权中心度。这一次,你只得到你的“公平份额”的相邻节点的重要性。也就是说,你的相邻节点的重要性在他们的邻居之间被分割开来,这和你与邻居的互动次数成正比。从直观上讲,pagerank可以捕捉到您利用网络联系人的效率。在我们的小说中,pagerank中心度很好地捕捉到了叙述的节奏。事实上,当两个重要角色相互作用时,情节就会发生很大的发展。

(5)中间中心度(Betweenness Centrality)

中间中心度标识了在网络中起战略作用的节点,这意味着信息通常会通过该节点传播。这种中间位置给了那个人权力和影响力。中间中心度是经过给定节点的短路径数的原始计数。例如,如果一个节点位于两个大型社区之间的瓶颈上,那么它将具有很高的中间性。

简单说法

  • Degree Centrality: Do you have many connections?
  • Weighted Degree Centrality: Do you have many interactions?
  • Eigenvector Centrality: Do you have many connections to important people?
  • PageRank Centrality: Do you have many interactions with important people?
  • Betweenness Centrality: Do you help to connect different parts of the network?
    翻译水平有限,可直接看原文。

猜你喜欢

转载自blog.csdn.net/id_iot/article/details/86762718