互信息

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

互信息(Mutual Information)

什麼是互信息

　　一般而言，通道中總是存在著雜訊和干擾，信源發出消息x，通過通道後信宿只可能收到由於干擾作用引起的某種變形的y。信宿收到y後推測信源發出x的概率，這一過程可由後驗概率p(x|y)來描述。相應地，信源發出x的概率p(x)稱為先驗概率。我們定義x的後驗概率與先驗概率比值的對數為y對x的互信息量，也稱交互信息量（簡稱互信息）。

　　互信息是指資訊理論里一種有用的信息度量，它是指兩個事件集合之間的相關性。兩個事件X和Y的互信息定義為： $I(X;Y) = \sum_{y \in Y} \sum_{x \in X}p(x,y) \log{ \left(\frac{p(x,y)}{p(x)\,p(y)}\right) }, \,\!$ 又可以表示成：

　　 $I (X; Y) = H (X) - H (X | Y)$

　　　　　　= $H (Y) - H (Y | X)$

　　　　　　= $H (X) + H (Y) - H (X, Y)$

　　　　　　= $H (X, Y) - H (X | Y) - H (Y | X)$

　　　　　　 $\ge 0$

　　其中H(X,Y)是聯合熵（Joint Entropy），其定義為： $H(X,Y) = -\sum p(x,y) \log p(x,y)$

　　H(X|Y)是條件熵（conditional entropy），定義重屬於熵的定義。

[編輯]

互信息的相關內容

　　互信息是計算語言學模型分析的常用方法，它度量兩個對象之間的相互性。在過濾問題中用於度量特征對於主題的區分度。互信息的定義與交叉熵近似。互信息本來是資訊理論中的一個概念,用於表示信息之間的關係, 是兩個隨機變數統計相關性的測度，使用互信息理論進行特征抽取是基於如下假設:在某個特定類別出現頻率高,但在其他類別出現頻率比較低的詞條與該類的互信息比較大。通常用互信息作為特征詞和類別之間的測度，如果特征詞屬於該類的話，它們的互信息量最大。由於該方法不需要對特征詞和類別之間關係的性質作任何假設，因此非常適合於文本分類的特征和類別的配準工作。

取自"https://wiki.mbalib.com/zh-tw/%E4%BA%92%E4%BF%A1%E6%81%AF"

打开MBA智库App, 阅读完整内容打开App

如果您認為本條目還有待完善，需要補充新內容或修改錯誤內容，請編輯條目或投訴舉報。

本条目由以下用户参与贡献

Tracy.

頁面分類: 應用數學 | 電腦

評論(共0條)

提示:評論內容為網友針對條目"互信息"展開的討論，與本站觀點立場無關。

發表評論請文明上網，理性發言並遵守有關規定。

支付成功

查看

工具▼

互信息

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是互信息

互信息的相關內容

温馨提示

本条目相关课程

本条目由以下用户参与贡献

評論(共0條)

導航

添加收藏

编辑收藏夹

意见反馈

支付成功

查看

工具▼

互信息

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是互信息

互信息的相關內容

温馨提示

本條目相關文檔

本条目相关课程

本条目由以下用户参与贡献

評論(共0條)

導航

添加收藏

编辑收藏夹

意见反馈