折叠 编辑本段 内容简介
两个事件X和Y的互信息定义为:
H(X),H(Y),I(X,Y)等关系图
I(X,Y) = H(X) + H(Y) - H(X,Y)
其中 H(X,Y) 是联合熵(Joint Ent来自ropy),其定义为:
H(X,Y) = - ∑ p(x,y)logp(x,y)
其中p(x,y)是概率360百科。
折叠 编辑本段 含义
品保折叠 信息的含义
折叠 互信息的含义
信息论中的互信息
一般而言,信道中总是存在着噪声和干扰,信源发出消息x,通过型生贵同查复乐资财微信道后信宿只可能收到由于干扰作用引起的某种变形的y。信宿收到y后推测信源发出x的概率,这一过程可由后验概率p(x/y)来描述。相应地,信源发出x的概率p(x团土类冷矿容)称为先验概率。我们定义x的后验概率与先验概率比值的对数为y对x的互信息量,也称交互信息量(简称互信息)。
其他
互信息衡量的是某个词和类别之间的统计独立关系,某个词t和某个类别Ci传统的互信息定义如下:
互信息是计算语映安里爱法验企言学模型分析的常用方法,它度量两个对象之间的相互性。在过滤问题中用于度量特征对于主题的区分度。互信息的定义与交叉衣占熵近似。互信息本来是信息论中的一个概念,用于表示属鱼信息之间的关系, 是两个随机变量统计相关性的测度,使用互信息理论进行特征抽取是基于如下假设:在某个特定类别出现频率高,但在其他类别出现频家率比较低的词条与该类的互信息比较大。通常用互信息作为特征词和类别之问的测度,如果特征词属于该类的话,它们的互信息量最大。由于该方法不需要对特征词和类别之间关系的性质作任何假设,因此非常适合于文本分类的特征和类别的配准工作。