度分布

来自testwiki
跳转到导航 跳转到搜索
File:Enwiki-degree-distribution.png
英文维基条目网络的度分布。将每个条目看成顶点,超链接看成边,则对应的出度/入度的分布如图所示。

度分布图论网络理论中的概念。一个图(或网络)由一些顶点(节点)和连接它们的边(连结)构成。每个顶点(节点)连出的所有边(连结)的数量就是这个顶点(节点)的。度分布指的是对一个图(网络)中顶点(节点)度数的总体描述。对于随机图,度分布指的是图中顶点度数的概率分布

定义

度分布是图论和(复杂)网络理论中都存在的概念。首先介绍图的概念。一个图G=G(V,E)是一个由两个集合VE构成的二元组。集合V一般由有限个元素构成:V={v1,v2,,vn},其中的元素vi,i=1,2,,n被称为图的顶点。集合E是由n2个元素构成的集合:E={ei,j|i=1,2,,n,j=1,2,,n}E中的每个元素都是一个非负整数。无向图中,E的一个元素ei,j=k,表示V中的两个顶点ij连有k条边,并且规定ei,j=ej,i。有向图中,E的一个元素ei,j=k,表示V中的顶点ik条连向顶点j的边。如果一个图G中所有的ei,j都不超过1,并且i=1,2,,n,ei,i=0,那么称图G是简单图。

网络理论的数学框架建立在图论上。网络理论中的网络其实就是图论中的图,但在网络理论中称之为网络,图的顶点在网络理论中称为节点,边被称为连结。以下仍旧以图论中的术语定义度分布。

一个无向图G=G(V,E)中某个顶点vi0的度,是指所有与它相连的边的数目。

d(vi0)=i=i0ei,j

有向图中,根据连出边的数目和连入边的数目,分为出度dout和入度din

dout(vi0)=i=i0ei,j
din(vi0)=j=i0ei,j

因此,一个无向图G=G(V,E)中,d可以看成将每个顶点映射到一个非负整数的函数

d:vid(vi)i=1,2,,n.

而度分布则是对每个非负整数m,考察度数是m的顶点在所有顶点中占的比例:

m,P:mP(m)=Card{vi|d(vi)=m}n,[1]

因此满足:

mP(m)=1.

从顶点中等概率地随机抽取一个顶点,那么这个顶点度数为k的概率就是P(k)

随机图顶点的度分布

随机图是指由随机过程产生的图,即是将给定的顶点之间随机地连上边。一个随机图G=G(V,E)中,每两个顶点之间的边的数量ei,j随机变量。因此任一顶点vi0的度d(vi0)=i=i0ei,j也是随机变量。这个变量的概率分布也称为随机图中的顶点的度分布:

Pi(k)=(d(vi)=k).

这个定义与一般的图的度分布是不一样的[2]

在经典的随机图模型中,所有顶点的位置都是一致的,没有特殊的顶点。因此每个顶点的度分布Pi(k)都是相同的:i,Pi(k)=P(k)。所以,随机抽取一个顶点,它的度数是k的概率就是P(k)P(k)越高,表示可能有更多的顶点度数是k。当顶点数目很大每个顶点的度分布都是相对独立的时候,顶点的度分布Pi(k)近似等于图中度数是k的顶点的比例[1]

例子

File:GolombGraph.svg
由十个顶点构成的图

以下给出一些度分布的例子。右图是由十个顶点构成的无向图。其中度数是4的顶点有3个,度数是3的顶点有6个,度数是6的顶点有1个,所以度分布是:

P(m)={0.3,m=40.6,m=30.1,m=60,m3,4,6

对于n阶完全图,所有的顶点的度数都是n1,所以度分布是:

P(m)={1,m=n10,mn1
File:DegreeDistributions.PNG
图3.随机网络的度(a)集中在某个特定值dc附近,而无尺度网络的度分布(b)则遵守幂律分布

如果图G是任意两顶点之间以概率0<p<1连边的随机图,那么每个顶点都有相同的度分布。

P(m)=(n1m)pm(1p)n1m.[2]

这个分布是泊松分布。我们可以构造每个顶点的度数都是这样的概率分布的随机图模型。这样当顶点数很大的时候,度数是k的顶点的个数占的比例大致是P(k)。这个分布的特点是当k很小或很大的时候,P(k)都近似于0,P(k)的值在一个特定的值处达到高峰,然后回落。也就是说,大多数的顶点的度数在这个特定值左右。然而在真实的复杂网络中,人们观察到,度分布并不像这种随机图模型显示的,聚集在某个特定值周围,而是随着k增大而以多项式速度递减,也就是遵从所谓的幂律分布:

P(k)1kγ

也就是说P(k) 的概率反比于k 的某个幂次,其中γ是某个正实数。这种网络特性被称为无尺度特性[3][4]

参考文献

引用

Template:Reflist

期刊文章
书籍

参见