自信息

来自testwiki
跳转到导航 跳转到搜索

Template:Unreferenced Template:NoteTA信息论中,自信息Template:Lang-en),由克勞德·夏農提出。自信息指的是当我们接收到一个消息时所获得的信息量。具体来说,对于一个事件,其自信息的大小与该事件发生的概率有关, 它是与概率空间中的單一事件或离散随机变量的值相关的資訊量的量度。它用信息的單位表示,例如 bitnat或是hart,使用哪个单位取决于在计算中使用的对数的底。自信息的期望值就是信息论中的,它反映了随机变量采样时的平均不确定程度。

定義

由定义,当信息被拥有它的实体传递给接收它的实体时,仅当接收实体不知道信息的先验知识时信息才得到传递。如果接收实体事先知道了消息的内容,这条消息所传递的信息量就是0。只有当接收实体对消息的先验知识少于100%时,消息才真正传递信息。

因此,一個隨機產生的事件ωn所包含的資訊本體數量,只與事件發生的機率相關。事件發生的機率越低,在事件真的發生時,接收到的資訊中,包含的資訊本體越大。

ωn的自信息量 I(ωn)=f(P(ωn))

如果 P(ωn)=1,那么 I(ωn)=0。如果 P(ωn)<1,那么 I(ωn)>0

此外,根据定义,自信息的量度是非负的而且是可加的。如果事件 C是两个独立事件 AB交集,那么宣告 C发生的信息量就等于分别宣告事件 A和事件 B的信息量的

I(C)=I(AB)=I(A)+I(B)

因为 AB是独立事件,所以 C的概率为

P(C)=P(AB)=P(A)P(B)

应用函数 f()会得到

I(C)=I(A)+I(B)f(P(C))=f(P(A))+f(P(B))=f(P(A)P(B))

所以函数 f()有性质

f(xy)=f(x)+f(y)

而对数函数正好有这个性质,不同的底的对数函数之间的区别只差一个常数

f(x)=Klog(x)

由于事件的概率总是在0和1之间,而信息量必须是非负的,所以 K<0

考虑到这些性质,假設事件ωn發生的機率是 P(ωn),資訊本體 I(ωn) 的定義就是:

I(ωn)=log(P(ωn))=log(1P(ωn))

事件 ωn的概率越小, 它发生后的自信息量越大。

此定义符合上述条件。在上面的定义中,没有指定的对数的基底:如果以 2 为底,单位是bit。当使用以 e 为底的对数时,单位将是 nat。对于基底为 10 的对数,单位是 hart。

信息量的大小不同于信息作用的大小,这不是同一概念。信息量只表明不确定性的减少程度,至于对接收者来说,所获得的信息可能事关重大,也可能无足轻重,这是信息作用的大小。

和熵的联系

熵是离散随机变量的自信息的期望值。但有时候熵也会被称作是随机变量的自信息,可能是因为熵满足 H(X)=I(X;X),而 I(X;X)X与它自己的互信息