信息瓶颈

来自testwiki
跳转到导航 跳转到搜索

信息瓶颈Template:Lang-en)是信息论中的一种方法,由Template:Le、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克于1999年提出。[1]对于一随机变量X,假设已知其与观察变量Y之间的联合概率分布p(X,Y)。此时,当需要概括(聚类X时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。[2]

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为T,我们试图用T代替X来预测Y。此时,可使用以下算法得到最优的T

minp(t|x)I(X;T)βI(T;Y),

其中I(X;T)I(T;Y)分别为XT之间、以及TY之间的互信息,可由p(X,Y)计算得到。β则表示拉格朗日乘数

参考文献

Template:Reflist