貝葉斯概率
出自 MBA智库百科(https://wiki.mbalib.com/)
貝葉斯概率(Bayesian Probability)
目錄 |
貝葉斯概率是由貝葉斯理論所提供的一種對概率的解釋,它採用將概率定義為某人對一個命題信任的程度的概念。貝葉斯理論同時也建議貝葉斯定理可以用作根據新的信息導出或者更新現有的置信度的規則。
貝葉斯理論和貝葉斯概率以托馬斯·貝葉斯(1702-1761)命名,他證明瞭現在稱為貝葉斯定理的一個特例。術語貝葉斯卻是在1950年左右開始使用,很難說貝葉斯本人是否會支持這個以他命名的概率非常廣義的解釋。皮埃爾-西蒙·拉普拉斯證明瞭貝葉斯定理的一個更普遍的版本,並將之用於解決天體力學、醫學統計中的問題,在有些情況下,甚至用於法理學。但是皮埃爾-西蒙·拉普拉斯並不認為該定理對於概率論很重要。他還是堅持使用了概率的經典解釋。
Frank P. Ramsey在《數學基礎》(1931年)中首次建議將主觀置信度作為概率的一種解釋。Ramsey視這種解釋為概率的頻率解釋的一個補充,而頻率解釋在當時更為廣泛接受。統計學家Bruno de Finetti於1937年採納了Ramsey的觀點,將之作為概率的頻率解釋的一種可能的代替。L. J. Savage在《統計學基礎》(1954年)中拓展了這個思想。
有人試圖將“置信度”的直觀概念進行形式化的定義和應用。最普通的應用是基於打賭:置信度反映在行為主體願意在命題上下註的意願上。
當信任有程度的時候,概率計算的定理測量信任的理性程度,就像一階邏輯的定理測量信任的理性程度一樣。很多人將置信度視為經典的真值(真或假)的一種擴展。
Harold Jeffreys, Richard T. Cox, Edwin Jaynes和I. J. Good研探了貝葉斯理論。其他著名貝葉斯理論的支持者包括John Maynard Keynes和B.O. Koopman。
術語:主觀概率, 個人概率, 認知概率和邏輯概率描述了通常成為貝葉斯學派的思想中的一些。這些概念互相重疊,但有不同的側重。這裡提到的一些人物不會自稱是貝葉斯學派的。
貝葉斯概率應該測量某一個體對於一個不確定命題的置信程度,因此在這個意義下是主觀的。有些自稱貝葉斯學派的人並不接受這種主觀性。客觀主義學派的主要代表是Edwin Thompson Jaynes和Harold Jeffreys。也許現在還在世的主要客觀貝葉斯學派人物是杜克大學的James Berger。Jose Bernardo和其他一些人接受一定程度的主觀性,但相信在很多實際情況中有使用"先驗參照(reference priors)"的需要。
邏輯(或者說,客觀認知)概率的推崇者,例如Harold Jeffreys, 魯道夫·卡爾納普(Rudolf Carnap), Richard Threlkeld Cox和Edwin Jaynes, 希望將能夠在兩個有相同關於某個不確定命題的真實性相關的信息的人計算出同樣的概率的技術規律化。這種概率不和個人相關,而只和認知情況相關,因此位於主觀和客觀之間。但是,他們推薦的方法有爭議。批評者對這個聲稱發起挑戰,在關於相關事實的信息缺乏的時候,更偏好某一個置信度是有現實依據的。另一個問題是迄今為止的技術對於處理實際問題還是不夠的。
貝葉斯概率和頻率概率相對,它從確定的分佈中觀測到的頻率或者在樣本空間中的比例來導出概率。
採用頻率概率的統計和概率的理論由R.A. Fisher, Egon Pearson和Jerzy Neyman在20世紀上半葉發展起來。A. N. Kolmogorov也採用頻率概率來通過勒貝格積分為測度論中的概率奠定數學基礎(《概率論基礎》(1933年))。Savage, Koopman, Abraham Wald和其他一些學者自1950年以來發展了貝葉斯概率。
貝葉斯學派和頻率學派在概率解釋上的分歧在統計學實踐上有重要的結果。例如,在用同樣的數據比較兩個假設的時候,假設測試理論基於概率的頻率解釋,它允許基於錯誤推出數據更支持另外那個模型/假設的概率來否定或接受一個模型/假設(零假設)。出現這種錯誤的概率稱為一類誤差,它要求考慮從同樣的數據源導出的假想的數據集合要比實際觀測到的數據更為極端。這個方法允許論斷'或者兩個假設不同或者觀測到的數據是誤導性的集合'。相對應的是,貝葉斯方法基於實際觀測到的數據,因此能夠對於任何數量的假設直接賦予後驗概率。對於代表每個假設的模型的參數必須賦予概率的要求是這種直接方法的代價。
自1950年代以來,貝葉斯理論和貝葉斯概率通過考克斯定理, Jaynes的最大熵原理以及荷蘭書論證得到了廣泛的應用。在很多應用中,貝葉斯方法更為普適,也似乎較頻率概率能得出更好的結果。貝葉斯因數也和奧卡姆剃刀一起使用。數學應用請參看貝葉斯推論和貝葉斯定理。
有些人將貝葉斯推論視為科學方法的一種應用,因為通過貝葉斯推論來更新概率要求從對於不同假設的初始信任度出發,採集新的信息(例如通過做試驗),然後根據新的信息調整原有的信念。調整原有的信念可以意味著(更加接近)接受或者推翻初始的假設。
貝葉斯技術最近被應用於垃圾郵件的過濾上。貝葉斯垃圾郵件過濾器採用電子郵件的一個參考集合來定義什麼最初被認為是垃圾郵件。定義了參考之後,過濾器使用參考中的特點來將新的郵件判定為垃圾郵件或有效郵件。新電子郵件作為新的信息出現,並且如果用戶在垃圾郵件和有效郵件的判定中發現錯誤,這個新的信息會更新初始參考集合中的信息,以期將來的判定可以更為精確。參看貝葉斯推論和貝葉斯過濾。
對於貝葉斯概率解釋曾有過的一個批評是一個單獨的概率賦值不能給出信念的真實性——也即,它有多少科學實證。考慮如下的這些情況:
- 你有一個裝了白球和黑球的盒子,但是不知道它們的數量
- 你有一個盒子,你從中取了n個球,一半黑,一半白
- 你有一個盒子,你知道有同樣數量的黑球和白球
下一個取出的球是黑球的貝葉斯概率對於所有三種情況都是0.5。Keynes稱這為“證據的權重”問題。一個反映這些證據支持的區別的方法是對於這些概率本身賦予概率(所謂的“元概率”)如下:
- 1. 你有裝了白球和黑球的盒子,但是不知道數量情況
- 令θ = p代表下一球為黑的概率為p這一命題,一個貝葉斯概率論者會賦予一個Β先驗分佈:
- 假設取出的球用二項式分佈建模,則後驗分佈P(θ | m,n),在取出m個黑球和n個白球之後依然是一個Β分佈,其參數αB = 1 + m, αW = 1 + n。Β分佈的參數的一個直觀的解釋是兩個事件的設想記數。
- 2. 你有一個盒子,你已經從中取了N個球,黑白各半
- 3. 你有一個盒子,並且你知道黑球和白球的數量相等
- 這個情況下,貝葉斯概率論者會定義先驗概率為。
其它貝葉斯概率論者辯解說概率不一定要是精確的數字。
因為頻率解釋中沒有元概率的容身之地,頻率論者必須用其它方式表達證據支持。Cedric Smith和Arthur Dempster分別發展了上下極限。Glenn Shafer進一步發展了Dempster的理論,現在它被稱為Dempster-Shafer理論。
案例一:貝葉斯方法在房地產風險決策中的應用研究[1]
一、貝葉斯(Bayes)方法的基本特點
自從20世紀50~60年代貝葉斯學派形成後,關於貝葉斯分析的研究久盛不衰。20世紀80年代後,貝葉斯網路就成功地應用於專家系統,成為表示不確定性專家知識和推理的一種重要的方法。
貝葉斯決策屬於風險型決策,決策者雖不能控制客觀因素的變化,但卻可掌握其變化的可能狀況及各狀況的分佈概率,並利用期望值即未來可能出現的平均狀況作為決策準則。由於決策者對客觀因素變化狀況的描述不確定,所以在決策時會給決策者帶來風險。
但是完全確定的情況在現實中幾乎不存在,貝葉斯決策不是使決策問題完全無風險,而是通過其他途徑增加信息量使決策中的風險減小。由此可以看出,貝葉斯決策是一種比較實際可行的方法。
利用貝葉斯(Bayes)所提出的概率理論,我們可以考察決策的敏感性。貝葉斯(Bayes)提出了先驗概率和後驗概率的概念:可以根據新的信息對先驗概率加以修改從而得出後驗概率。因此,貝葉斯理論被用於將新信息結合到分析當中。
根據貝葉斯(Bayes)方法,在已知道:
1)狀態先驗概率
2)類條件概率密度
利用貝葉斯公式:
得到狀態的後驗概率P(x | wi)。
用貝葉斯(Bayes)概率理論與決策樹方法結合起來,我們及時根據市場信息可以建立一個解決風險型房地產投資決策的模型方法。
二、貝葉斯(Bayes)方法的應用分析
例如,某房地產公司打算聘請一個咨詢公司來調查市場情況。這項調查的花費為5000元。該公司是否應選擇這一方式呢?這樣做將導致改變公司對市場情況預測的先驗概率。
該公司查閱了咨詢公司的歷史業績記錄。其結果如下表1所示。該表顯示當市場實際增長時,70%的該咨詢公司的報告預見到了這一增長,同時20%的報告預見的是市場將保持穩定,而10%的報告則預測的是市場將衰退。表1中的其它數據的含義與此類似。
初始預測表
咨詢公司的預測 | ||||
---|---|---|---|---|
實際市場結果 | 先驗概率 | 增長 | 穩定 | 衰退 |
增長 | 0.6 | 0.7 | 0.2 | 0.1 |
穩定 | 0.3 | 0.2 | 0.6 | 0.2 |
衰退 | 0.1 | 0.1 | 0.2 | 0.7 |
葉斯(Bayes)定理就是利用這些信息來修正有關的先驗概率。假設有r個互斥事件形,其先驗概率為P(Wi)。進一步假設有事件凡,在事件W_i發生的前提下事件凡發生的概率為P(FK / Wi)。那麼如果我們知道FK已發生,事件形發生的概率即為:
。
如果有i個互斥事件,僅當其中一個事件發生後,事件,F才能發生,則在事件F已知時,事件Wj發生的概率為:
。
其中:P(Wi)=事件Wi的先驗概率;P(FK / Wj) = Wj發生,事件Fk的條件概率;P(Wj / Fk) = Fk發生,事件Wj的後驗概率。
在我們的例子中,各結果的先驗概率為:
W1——增長→P(W1) = 0.6。
W2——穩定→P(W2) = 0.3。
W3——增長→P(W3) = 0.1。
如果Fr,是指一個調查,該調查表明市場實際增長,從表1中我們可以知道當預測報告預計市場將增長時,其結果為:0.7的可能增長,0.2的可能不變,0.的可能衰退。
因此:
P(Fr / W1) = 0.7
P(Fr / W2) = 0.2
P(Fr / W3) = 0.7
利用貝葉斯(Bayes)公式,在預測報告預計市場增長條件下,市場實際出現增長的概率為:
市場報告改變了各結果的概率,貝葉斯(Bayes)概率如表2所示:
修正後的預測表
咨詢公司的預測 | |||
---|---|---|---|
實際市場結果 | 增長 | 穩定 | 衰退 |
增長 | 0.85 | 0.38 | 0.32 |
穩定 | 0.12 | 0.56 | 0.32 |
衰退 | 0.02 | 0.06 | 0.37 |
這樣就可畫出一個新的決策樹。對其的求解是從期望收益來推算最初的目標。底層的方案枝是原來的決策樹。但是只有在獲得預計市場增長、不變或衰退的報告的概率已知後,才可對其求解。
獲得一個預計市場增長的報告的概率就是在各種市場情況下得出市場增長預測報告的概率乘以各種市場情況出現的概率。因此獲得一個預測市場增長的報告的概率為:P=(0.7)(0.6)+(0.2)(0.3)+(0.1)(0.1)=0.49。
相類似,獲得一個預測市場不變的報告的概率為0.32,而獲得一個預測市場衰退的報告的概率為0.19。現在將這些值代人到決策樹中,咨詢公司報告的預期收益是:。
Ep = (0.49)(219.6) + (0.32)(168.0) + (0.19)(141.1) = 1881
因為獲得該報告需花費5000元,故凈收益為13817元,這少於沒有報告時的收益,因此該公司無法從咨詢報告中獲得益處。這一點如圖1中利用貝葉斯(Bayes)分析所制定的決策樹所示。
(Bayes)分析所制定的決策樹所示
三、貝葉斯(Bayes}決策規則的選擇
應用貝葉斯(Bayes)分析方法,決策者可根據具體情況和決策意願選擇不同的決策規則,例如選擇:
(1)基於最小錯誤率的貝葉斯決策規則。在決策問題中,人們往往希望儘量減小錯誤,從這樣的要求出發,利用貝葉斯公式,就能得出使錯誤為最小的分類規則,稱之為基於最小錯誤率的貝葉斯決策。
(2)基於最小風險的貝葉斯決策規則。在基於最小錯誤率的貝葉斯分類決策中,使錯誤率P(e)達到最小是重要的。但實際上有時需要考慮一個比錯誤率更為重要的廣泛的概念一風險。風險和損失是緊密聯繫的。最小風險貝葉斯決策正是考慮各種錯誤造成損失不同而提出的一種決策規則。在此決策中利用了決策論的觀點進行考慮。在已知先驗概率P(wi)及類條件概率密度可的條件下,在考慮錯判所造成的損失時,由於引人“損失”的概念,而必須考慮所採取的決策是否使損失最小。
(3)最小最大的貝葉斯決策規則。從最小錯誤率和最小風險貝葉斯決策中可以看出其決策都是與先驗概率P(Wi)有關的。如果給定的x其P(wi)不變,按照貝葉斯決策規則,可以使錯誤率和風險最小。但是如果P(wi)是可變的,或事先對先驗概率毫不知道的情況下,若再按某個固定的P(wi)條件下的決策進行就往往得不到最小錯誤率或最小風險。而最小最大決策就是考慮在P(wi)變化的情況下,如何使最大可能的風險為最小,也就是在最差的條件下爭取到最好的結果。
貝葉斯決策屬於風險型決策,決策者雖不能控制客觀因素的變化,但卻可掌握其變化的可能狀況及各狀況的分佈概率,將貝葉斯概率分析與決策樹方法相結合,並利用期望值作為決策準則的依據。這為貝葉斯方法在房地產投資風險決策的應用提出了一種可行方法。在此基礎上可根據需要選擇相關決策規則實現風險決策目標。
- ↑ 馮為民,朱俊,李嘉榮.貝葉斯方法在房地產風險決策中的應用研究[J].重慶建築大學學報,2006,28(2)
分享一下好吧