貝葉斯網路
出自 MBA智库百科(https://wiki.mbalib.com/)
貝葉斯網路(Bayesian Networks)
目錄 |
貝葉斯網路也稱為信度網、因果網,是指基於概率分析、圖論的一種不確定性知識的表達和推理的模型。主要用於表示變數之間的依賴關係,併為任何全聯合概率分佈提供一種簡明的規範。貝葉斯網表達了各個節點間的條件獨立關係,可以直觀地從貝葉斯網中得出屬性間的條件獨立以及依賴關係;另外可以認為貝葉斯網以另一種形式表示出了事件的聯合概率分佈,根據貝葉斯網的網路結構以及條件概率表(CPT)可以快速得到每個基本事件(所有屬性值的一個組合)的概率。
1.可以非常直觀地顯示事件(節點)間的因果關係。經典統計學里,預測模型通常基於數據驅動的方法,例如常用的回歸演算法通常採用大量的歷史數據去建立獨立和非獨立變數的數學模型。這種方法無法融合專家的經驗知識,也無法揭示變數之間的因果關係,而實際中很多情況下無法獲得足夠的數據去建立模型,貝葉斯網路很好地剋服這些缺陷,在數據不足的情況下,可以依靠專家知識建模。
2.可以進行雙向推理,既可以從原因推理結果也可以從結果推理原因。當證據被提供到任何一個變數,貝葉斯網路能夠更新模型中所有其他變數的概率。因此,當輸入一個證據到結果變數的時候,貝葉斯網路模型將進行反向概率繁殖,推理出原因變數的概率。這樣的反向推理能力是其他經典概率推理方法不能做到的。
3.可以利用新的證據推翻先前的推理。
4.可以在數據不完整的情況下進行推理,亦即無需為所有的輸入變數提供證據就可以進行推理,而經典的統計預測模型通常要求完整的輸入數據。
5.可以結合多種不同類型的數據,例如主觀經驗數據或者客觀數據。
6.貝葉斯網路模型中所有的節點都可見。不像神經網路、經典回歸模型等,只有輸入輸出節點可見,中間節點變數是隱藏的。
1.確定隨機變數間的拓撲關係,形成DAG
這一步通常需要領域專家完成,而想要建立一個好的拓撲結構,通常需要不斷迭代和改進才可以。
2.訓練貝葉斯網路
這一步也就是要完成條件概率表的構造,如果每個隨機變數的值都是可以直接觀察的,像我們上面的例子,那麼這一步的訓練是直觀的,方法類似於朴素貝葉斯分類。但是通常貝葉斯網路的中存在隱藏變數節點,那麼訓練方法就是比較複雜,例如使用梯度下降法。由於這些內容過於晦澀以及牽扯到較深入的數學知識,在此不再贅述,有興趣的朋友可以查閱相關文獻。