Global spectral clustering in dynamic networks

http://www.jmlr.org/papers/volume7/bach06b/bach06b.pdf

cholesky 分解 :https://blog.csdn.net/lanchunhui/article/details/50890391

不能准确估计网络结构的时候,社区检测是一个很难的事情.动态网路虽然更难分类但是增加了时间周期这个信息.我们提出一个全局社团检测想法,即持久社团特征向量平滑方法,结合并加强对每一个阶段的网络的信息的使用.我们的想法来源于一种进化的谱聚类和度修正想法,提供基于数据的调参方法,在仿真中,发现这种方法表现的比设计来降低噪声比率的对比算法要好.最近得到了猕猴大脑基因标的的数据,数据有很广的时间范围-从产前到产后后一大段时间.兴趣点在基因社团在时间空间上是怎么发展的.然而当数据被分成空间同质和短暂的时间间隔,样本数据是非常小的,使得推断十分具有挑战性,使用pisces方法对快要生育的成年猕猴脑前额中部角质层分析,发现有很稠密的社团存在,合并,如果随着时间间隔划分,这些社团变得没有组织性并且不活跃.阐明了动态网络社团发现能够促进脑科学的发展

网络或图是用来表示在一个复杂系统内部的关联的.在同一个簇中节点之间的边很多,在不同簇中节点之间的边很少,这种簇或者社区可能由于不同部分具有不同的功能性,例如,基因辅助调节一个细胞周期.

统计学理论大多数关注于静态网络,从时间上快照或者发展过程中某一时间点获得.在现实中,网络大体都是动态的,由大量的好处去形象化和模拟网络的演变过程,例如Twitter上的社交网络,在物理上的动态填充网络,对大脑发育的基因表达网络,社区检测在所有这些领域阐述它们的网络中节点的关系结构以及随时间的变化情况是很重要的,然而统计学推断在静态网络中已经建立体系,怎样结合动态网络的信息很少有人研究,最近的工作想要注重在拓展动态网络的社群划分中心化以及动态数据聚类.

我们的想法,通过特征向量平滑方法对已经存在的社团,实施度修正谱聚类方法.在整个时间周期里用平滑项去促进相似性,不停迭代直到遇到了一个复杂的节点.特别的,全局谱聚类方法结合了当前网络的过去和未来领头特征向量的结果.这个结合被塑造成最优化问题,当这个社区数量被知道的情况下可以使用适当的平滑方法对这个最优化问题进行全局求解.我们发现选择适当的平滑方法和模型的阶数是很重要的,同样平衡正则化让数据说话也是很重要的.

动态的网络起源于基因共表达网络,揭示了基因在空间和时间基础上发展的社团结构,对细胞内部很大范围内工作机制提供了观察样本,尽管都知道大脑内基因表达随着发育阶段的有多种不同的显著变化.想要了解大脑的失控的原因像是孤独症患者的谱聚类无序化或是精神分裂患者的谱聚类无序化是一个很大的科学挑战,因为牵扯到大量的基因.在特定时间空间下对精神发育有障碍相关的危险基因的聚类能够帮助我们解释这些神经被扰乱形成的本质原因.

最近获得了针对这个问题丰富的数据,抄用大量的猕猴样本评估生育前和生育后大脑情况,一旦数据按照解剖领域和发展的小时间段来划分,数据会变得非常的小,从基因与基因的邻接矩阵中去看共表达是一件很困难的事情,pisces方法在这种情况下能够显著地提高社团检测的能力.

我们阐明了动态网络检测的方法的能力,通过研究在中前额角质层随着年龄增长的基因交流,这项分析揭示了尽管很多社团在发育阶段受限,但是其余的社团仍然持续存在,揭示了改变节点的存在和社团结构长期存在性,例如社团交流丰富了神经项目引导,使其在生育前的聚类更加紧密,在生育前某阶段达到最大值,这个过程充满了激动人心的神经网络发育,我们能提供使得内些导致孤独证谱无序的基因得到必要的交流,

significance

统计学理论大多关注静态网络像是快照.在现实生活中,网络基本都是动态的, 形象化和模拟网络间的交流有巨大的好处,我们通过特征向量平滑的方法去检测随时间不断变化的社区结构,把它应用到最近的数据集去看基因表达在猕猴大脑发育阶段是怎么被衡量的,分析显示了变化点的存在和大脑内确实有持续的社区结构,在统计学中这些思想没有被好好地建立起来因为数据样本过小且只针对某一时间间隔和固定的区域.

                           

图片一:虚拟网络的时间区域和类动力学性能,用适应性随机指引在真实性和对社区标签的估计来刻画,网络在动态DCBM上生成,有三个重要的参数:pin,pout决定了类内和类外边的概率(密度),r决定了在类间连续网络的变化情况.对A来说K=2,n=100 pin =
(0.2, 0.25), pout = 0.1, and for B, K = 10, n = 500, pin = (0.2, 0.35), pout = 0.1.展示了模拟的100个结点的数据.                             

Methods

对静态网络使用的谱思想:谱聚类是一种流行的静态网络社区检测方法,很多不同版本的变更在19-22的文献中被讨论过了,原形思想是ref.6,给定一个nxn的邻接矩阵A和一个固定的社团数量K,思想是计算度正规化矩阵L

这个思想之后通过L的k个最大的特征值对应的特征向量来代表整体,通过k均值聚类返回类别,选择k的方法在参考文献23-26里面

动态网络特征向量平滑化:

A1.....AT代表了时间序列的对称邻接矩阵,对应的时间间隔t=1...T让Lt代表At的度正则化矩阵,由一式那样,让k是一个固定的值,让Vt代表矩阵,行由Lt的k个比较大特征值对应的特征向量组成,让Ut=Vt*Vt'代表Vt行空间的投影矩阵

在静态谱聚类,可以提供k均值方法进行v1...vt的分类,共享时间上的信号强度,一个简化的pisces组合能够解决下面的最优化问题,能够返回一个矩阵序列

然后用k均值聚类方法把每隔平滑矩阵.....的特征向量分开

等式2的最优化问题是非凸的,我们能掌握的最好的知识,不能确保这种情况下全局最优解的存在,我们采用下面的迭代方式

花了两周的时间做出来一个ppt ,不知道咋分享,有需要的留邮箱吧,有源代码和ppt。

猜你喜欢

转载自blog.csdn.net/qq_24059779/article/details/83751580