貝葉斯推理
出自 MBA智库百科(https://wiki.mbalib.com/)
貝葉斯推理(Bayesian reasoning; Bayesian inference)
目錄 |
什麼是貝葉斯推理[1]
貝葉斯推理是由英國牧師貝葉斯發現的一種歸納推理方法,後來的許多研究者對貝葉斯方法在觀點、方法和理論上不斷的進行完善,最終形成了一種有影響的統計學派,打破了經典統計學一統天下的局面。貝葉斯推理是在經典的統計歸納推理——估計和假設檢驗的基礎上發展起來的一種新的推理方法。與經典的統計歸納推理方法相比,貝葉斯推理在得出結論時不僅要根據當前所觀察到的樣本信息,而且還要根據推理者過去有關的經驗和知識。
作為一種推理方法,貝葉斯推理是從概率論中的貝葉斯定理擴充而來。貝葉斯定理斷定:已知一個事件集Bi(i=1,2,...k)中每一Bi的概率P(Bi),又知在Bi已發生的條件下事件A的條件概率P(A/Bi),就可得出在給定A已發生的條件下任何Bi的條件概率(逆概率)P(Bi/A)。即P(Bi/A)=P(Bi)P(A/Bi)/(P(B1)P(A/B1)+P(B2)P(A/B2)+...+P(Bn)P(A/Bn))
貝葉斯定理有很廣的應用範圍,但作為研究貝葉斯推理的起點,我們必須擴充這個定理的意義。不考慮事件集Bi,而考慮構成實際情況的一個合適模型的假說集Hi(i=l,2,...k),其中一個而且僅僅一個假說必定是真的。事件A則被重新解釋為由實際情況得到的觀察結果E:樣本數據。在觀察之前,對所有的i=l,2,...k,已知P(Hi),它們是不同假說的先驗概率,構成次要的信息來源。又知P(E/Hi)即在Hi真時E被觀察到的概率,它們是樣本數據的似然值,也叫E相對於Hi的後驗概率。經過這樣的解釋,貝葉斯定理由僅適用給事件測定概率變成也能給假說測定概率(可信度)的工具。
貝葉斯推理的案例
【例1】參加常規x光透視檢查的40歲婦女中,患乳腺癌的概率是1%。如果一個婦女患了乳腺癌,她的胸透片呈陽性的概率是80%。如果一個婦女她沒有患乳腺癌,她的胸透片呈陽性的概率是9.6%。現有一個該年齡段的婦女她的胸透片呈陽性,那麼她實際患乳腺癌的概率有多少?如果把患乳腺癌和不患乳腺癌作為兩個互斥事件H和一H,他們的概率分別為P(H)和P(一H);把胸透片呈陽性作為在H和一H中都能觀察到某一共同特征D,它在兩個事件中出現的概率分別為P(D/H)和P(D/-H);那麼,當D出現時,根據以上概率信息就可以計算出事件H發生的概率P(H/D)。一般將P(H)和P(一H)稱為基礎概率(base rate),將P(D/H)稱為擊中率(hit rate),將P(D/-H)稱為誤報率(false-alarm rate),將P(H/D)稱為後驗概率,其計算方法為:
P(H/D)=P(H)P(D/H)/[(P(H)P(D/H)+P(-H)P(D/-H)]
這就是貝葉斯公式,利用貝葉斯公式進行推斷的過程則稱之為貝葉斯推理。根據公式,P(H/D)=(1%×80%)/(1% ×80%+99% ×10%)=0.078。也就是說,陽性的檢查結果表明該婦女有7.8%的可能性患病。但是Eddy用該問題讓內科醫生判斷,結果95%的答案介於70%~80%,遠高於7.8%。儘管貝葉斯公式只是一些簡單的乘法、加法以及除法過程的結合,一個並沒有學過該公式的人也有可能在推斷中不自覺的應用這種方法,但是在包括上述乳腺癌問題在內的許多研究均發現,人們常常會犯類似的推理錯誤,稱之為基礎概率忽略(base-rate neglect)現象.Kahneman等(1982)提出啟發—偏差理論(heuristics and biases approach)來解釋這一現象,並由此引發了關於貝葉斯推理問題的大量研究和爭論國內外關於貝葉斯推理問題的研究方法主要是實驗法,將不同類型貝葉斯問題呈現給被試並要求他們解答,採用一定的指標對被試的解題過程和結果進行評價,據此來考察貝葉斯推理的認知過程和影響因素。本文以貝葉斯推理的影響因素為線索回顧了以往的研究,並對其中的一些問題進行了初步的分析和探討。[2]
【例2】某地區居民的肝癌發病率為O.0004,現用甲胎蛋白法進行普查。醫學研究表明,化驗結果是存有錯誤的。已知患有肝癌的人其化驗結果99%呈陽性(有病),而沒患肝癌的人其化驗結果99.9%呈陰性(無病)。試問:在化驗結果呈陽性的人中可能有多少人患有肝癌?
如果我們用A表示樣本的觀察證據“化驗結果呈陽性”,用H表示假說命題“被檢查者患有肝癌”,那麼由上面可知:
P(H)(即某地區居民的肝癌發病率)=O.0004
P(‘H)(即某地區居民沒患肝癌的比率)=1-0.0004=0.9996
P(E/H)(即患有肝癌者其化驗結果呈陽性的比率)=O.99
P(E/‘H)(即沒患肝癌者其化驗結果呈陽性的比率)=1-0.999=0.001
現在需要我們推斷的是P(H/E),即在化驗結果呈陽性的條件下,假說“被檢查者患有肝癌”的比率。顯然,根據重新解釋過的貝葉斯定理,我們可以很容易地得出P(H/E)的值。
P(H/E)=O.0004x0.99/((0.0004x0.99)+(0.9996x0.001))=O.284
這表明,在化驗結果呈陽性的人中,真患肝癌的人不到30%。這個結果可能會使人吃驚,但仔細分析一下就可以理解了。因為肝癌發病率很低,在10000個人中約有4人患肝癌,而9996個人不患肝癌。對10000個人用甲胎蛋白法進行檢查,按其錯檢的概率可知,9996個不患肝癌者中約有9996X0.001≌9.994個呈陽性,另外4個真患肝癌者的檢查報告中約有4x0.99≌3.96個呈陽性。僅從13.954(9.994+3.96)個呈陽性者中看,真患肝癌的3.96個人約占28.4%。
從上例可以看出,貝葉斯推理實際是藉助於新的信息修正先驗概率的推理方法。顯然,這樣的方法如果運用得當,可以使我們在依據概率作出決斷時,不必一次收集一個長期過程的大量資料,而可以根據事物發展的情況,不斷利用新的信息來修正前面的概率,作出正確決策。下麵的例子很好地說明瞭這一點。[1]
【例3】有甲、乙、丙三家工廠生產同一種零件,市場占有率分別為10% 、25%和65%。已知甲、乙、丙三家工廠生產零件的不合格率分別是30% 、20%和10%。現從市場上某批零件中隨機抽取一件,經檢驗該零件不合格,則這個零件由甲廠、乙廠、丙廠生產的可能性各是多少?
在沒有抽取零件之前,我們知道,來自甲廠的產品其可能性是10% ,來自乙廠的可能性是25% ,來自丙廠的可能性是65%,這些就是先驗概率。相比來說,丙廠生產產品的概率最高。現在我們在市場上隨機抽出的是不合格品,這是一個新的信息,可以利用這個信息修正先驗概率。如果我們用E表示“抽出的零件是不合格品”,用H1、H2和H3分別表示假說命題“這個零件是由甲廠生產的”、“這個零件是由乙廠生產的”、“這個零件是由丙廠生產的”,那麼由上面可知:
P(H1)=O.1 P(H2)=O.25 P(H3)=0.65
P(E/H1)=O.3 P(E/H2)=O.2 P(E/H3)=O.1
根據貝葉斯推理我們可以很容易地得出P(H /E)、P(H )和P(H/E)。其中
P(H1/E)=O.1×O.3/((0.1xO.3)+(O.25x0.2)+(O.65x0.1))=0.207
P(H2/E)=O.25x0.2/((0.1×O.3)+(O.25x0.2)+(O.65x0.1))=O.345
P(H3/E)=O.65x0.1/((0.1×O.3)+(O.25x0.2)+(O.65x0.1))=O.448
顯然,根據上面的結果,我們判斷該零件是丙廠生產的可能性已從65%下降到44.8%,而該零件是乙廠生產的可能性已從25%上升到34.5% ,是甲廠生產的可能性也已從1O%上升到2O.7%。
在上面的例子中,如果隨機抽取一件產品還不能提供充足的信息,可以再隨機抽取一件產品以獲取更多的信息。現在我們假定連續抽取兩件產品都是不合格品,那麼這批產品來自各廠的可能性又是多少呢?為了說明這個問題,首先要分別計算甲廠、乙廠、丙廠產品連續抽取兩個都是不合格品的概率各是多少。這裡假設產品是無限的,則有
P(E/H1)=O.3xO.3=0.09
P(E/H2)-0.2xO.2=0.04
P(E/H3)=O.1xO.1=0.O1
然後仍然根據貝葉斯推理依次地得出P(H1/E)、P(H2/E)和P(H3/E)。其中
P(H1/E)_0.1 xO.09/((0.1xO.09)+(O.25 xO.04)+(O.65 XO.O1))=O.353
P(H2/E)=O.25x0.04/((0.1xO.09)+(O.25xO.04)+(O.65XO.O1))=O.392
P(H3/E)=O.65x0.01/((0.1×O.O9)+(O.25xO.04)+(O.65XO.O1))=O.255
根據上面的結果,我們可看到,如果連續兩次抽取的都是不合格品,則這批產品來自甲、乙、丙三廠的可能性為35.3%、39.2%和25.5%。這種情況下,這批產品來自乙廠的可能性變為最大。
我們還可以再進一步,假定從一批產品中隨機抽取三件產品,抽樣結果是:不合格、不合格、合格。此時甲廠、乙廠、丙廠產品抽取結果為不合格、不合格、合格的概率分別為(此時A表示“抽出的零件是不合格、不合格、合格”)
P(E/H1)=O.3xO.3x(1-O.3)=O.063
P(E/H2)=O.2xO.2x(1-0.2)=O.032
P(E/H3)=O.1xO.1x(1-0.1)_0.009
根據貝葉斯推理依次地可得出這批產品來自甲、乙、丙三廠的可能性分別為
P(H1/E)=O.1xO.063/((0.1xO.063)+(O.25xO.032)+(0.65x0.O09))=0.313
P(H2/E)-0.25xO.032/((0.1xO.063)+(O.25xO.032)+(0.65x0.OO9))=0.397
P(H3/E)=O.65xO.O09/((0.1xO.063)+(O.25xO.032)+(0.65x0.009))=0.290
顯然,根據新的抽樣信息,我們修正了先驗概率,使來自甲、乙、丙三廠的概率分別修正為31.3% 39.7%和29.O%。
我們再來看一個用貝葉斯推理分析伊索寓言“孩子與狼”的例子。
伊索寓言“孩子與狼”講的是一個小孩每天到山上放羊,山裡有狼出沒。第一天,他在山上喊:“狼來了!狼來了!”,山下的村民聞聲便去打狼,可到山上發現狼沒有來。第二天仍是如此。第三天狼真的來了,可無論小孩怎麼喊叫,也沒有人來救他,因為前二次他說了謊,人們不再相信他了。現在用貝葉斯推理來分析此寓言中村民對這個小孩的可信程度是如何下降的。
我們用E表示“小孩說謊 用H表示“小孩可信”。不妨設村民過去對這個小孩的印象為P(H)=0.8,則P('H)=0.2
我們現在用貝葉斯推理來推斷P(H/E),也即這個小孩說了一次謊後,村民對他可信程度的改變。
在貝葉斯推斷中我們要用到概率P(E/H)和P(E/'H),前者為可信的孩子說謊的可能性,後者為不可信的孩子說謊的可能性。在此不妨設P(E/H)=0.1,P(E/'H)=0.5
第一次村民上山打狼,發現狼沒有來,即小孩說了謊。村民根據這個信息,對這個小孩的可信程度改變為P(H/E)=0.8x0.1/((0.8x0.1)+(O.2x0.5))=0.444這表明村民上了一次當後,對這個小孩的可信程度由原來的O.8下降到了O.444。
在此基礎上,我們再一次用貝葉斯推理來推斷P(H/E),也即這個小孩第二次說謊後,村民對他的可信程度改變為P(H/E)=0.444x0.1/((0.444x0.1)+(O.556x0.5))=0.138這表明村民們經過兩次上當,對這個小孩的可信程度已經從O.8下降到了0.138,如此低的可信度,村民聽到第三次呼叫時怎麼再會上山打狼呢?[1]
【例4】通過觀察知道,牽牛花是在黎明4時左右開放,野薔薇是在黎明5時左右開放, 龍葵花是在清晨6時左右開放,芍藥花是在清晨7時左右開放。它們開放的時間雖然不同,但都有確定的開放時間,由此可見所有的花都有確定的開花時間。
顯然,這是一個簡單枚舉歸納推理,相對於觀察前提,結論“所有的花都有確定的開花時間”可靠嗎?結論為真的可信程度有多大?是否可以用量來刻劃?這些問題用貝葉斯推理的方法是可以解決的。
我們用E1、E2、E3、E4分別表示牽牛花有確定的開放時間、野薔薇有確定的開放時間、龍葵花有確定的開放時間、芍藥花有確定的開放時間,它們的合取用字母E來表示。結論“所有的花都有確定的開花時間”用H表示。這樣,我們現在需要確定的就是P(H/E)。
根據貝葉斯推理的形式,我們有
(1)P(H/E)=P(H)xP(E/H)/P(H)xP(E/H)+P('H)xP(E/'H)由於枚舉歸納的前提可從結論中必然推出,即P(E/H)=1。因此,由(1)可得:
(2)P(H/E)=P(H)/P(H)+P('H)xP(E/'H)根據邏輯否定規則,由(2)可得出:
(3)P(H/E)=P(H)/(H)+(1-P(H))xP(E/'H)
在(3)中,P(E/'H)表示,假定歸納結論H不真,E(即E1、E2、E3、E4等)為肯定事例的概率。
現在上面的問題可以解決了。相對於背景知識,已知歸納結論H 的先驗概率P(H)=0.5,在H不真時“牽牛花有確定的開放時間”、“野薔薇有確定的開放時間” 等肯定事例出現的先驗概率P(E /‘H)=0.8。把以上數據代入(3)得:
P(H/E)=0.5/0.5+(1-0.5)x0.84
= 0.5/0.70
= 0.71
這說明,相對於觀察證據E1、E2、E3、E4而言,歸納結論H(所有的花都有確定的開花時間)的可信程度為百分之七十一。[1]
貝葉斯推理的影響因素[2]
- 1.問題內容
貝葉斯推理問題總是通過某種具體事例來進行表述的。Kahneman和Amos Tversky認為,被試在概率推理中使用了代表性啟髮式(representativeness heuristics),他們進行推斷所依據的是問題內容中特征對事件的代表性程度而不是貝葉斯規則刪。按照他們的理論,在前述的乳腺癌問題中,由於陽性的檢查結果很大程度上代表了有病的信息,所以被試在判斷中忽略了問題的基礎概率,而主要根據擊中率信息進行推理。Gavanski等同所提出的自然抽樣空間(natural sample spaces)理論認為,被試的判斷錯誤不在於忽略了基礎概率,而是把後驗概率P(H/D)表徵為了擊中率P(D/H),因為從事件H (患有乳腺癌)中抽取特征D (檢查呈陽性)的取樣方式更為自然。或者說,事件是原因,特征是結果,從原因到結果的取樣方向才更符合人類的思維習慣。事件與特征之間的因果關係或代表性程度都是由問題的內容所決定,因此可以認為這兩種理論都是從問題內容角度來解釋貝葉斯推理中的認知錯覺的。後來的一些研究者雖然也使用了不同內容的貝葉斯問題,但主要是考察它們的平均效應,很少考慮到問題內容對貝葉斯推理的影響。
Girotto和Gonzalez(2001)在他們的研究中使用了疾病問題、入學問題等貝葉斯推理任務,他們發現被試在這兩類問題上的推理成績並沒有表現出顯著差異,即貝葉斯推理問題不存在內容效應(efect of content)。但有研究者認為,人們對入學考試和醫學檢查的結果都比較信賴,因此,以考試結果預測錄取率和以檢查結果預測患病率一樣具有權威性,仍然可以用代表性啟發法進行推斷。研究者自行編製了“作家問題”,將貝葉斯問題中的事件與特征換成了作家和影迷。影迷與作家之問並不像陽性與疾病之間那樣存在著關聯,因此不能用代表性啟發法進行推斷。他們將作家問題與疾病問題進行對比研究,發現在同樣的基礎概率、擊中率和誤報率條件下,人們對作家問題的概率估計值顯著低於疾病問題,並由此得出結論:貝葉斯推理中存在著內容效應。
近年來,隨著社會認知研究的興起,越來越多的研究開始關註“熱”認知的過程。張向陽等(2006)設計不同內容的問題研究了情緒、動機等因素對貝葉斯推理的影響。他們採用2(事件性質:積極事件/消極事件) ×2(事件與主體的關係:與主體有關/與主體無關)的混合設計進行實驗,其中事件性質為被試內因素,事件與主體關係為被試間因素。研究發現被試對於消極事件的概率估計值顯著低於積極事件,對與己有關的消極事件的概率估計值顯著低於與己無關的消極事件 。
由此可見,問題內容會導致被試在認知、情緒和動機等方面產生一定的傾向性,從而在不同程度上影響貝葉斯推理的結果。這與主觀概率的支持理論是一致的,該理論認為:人類在不確定條件下的概率判斷不符合外延性原則(extensionality principle)而是表現出描述依賴性,即對同一外延事件的不同描述所做出的主觀概率不同。
- 2.信息格式
信息格式(information format)指的是貝葉斯推理問題中概率數據的形式,包括數據的類型及其相互關係。早期研究中採用的數據大都是百分數形式,Gigerenzer和Hoffrage(1995)指出,從進化論角度來說,人類祖先在其進化環境中所遇到的信息形式是自然頻數(natural irequencies)格式而不是近代才出現的概率和百分數形式,被試在某些問題中犯推理錯誤並不說明人類不能按照貝葉斯規則進行推理,而是由於問題的信息格式與人類的認知演算法規則不一致造成的。他們用自然頻數的信息格式,對乳腺癌問題中的概率信息進行如下表述:每1000名婦女中有10名患有乳腺癌(對應於1%的基礎概率)。在患有乳腺癌的10名婦女中,有8名婦女胸透片呈陽性(對應於80%的擊中率)。未患乳腺癌的990婦女中,有95名胸透片呈陽性(對應於9.6%的誤報率)。研究發現:在自然頻率形式條件下,46%的判斷符合貝葉斯定理,而概率條件下只有16%的判斷符合貝葉斯定理。因此他們認為,採用自然頻數的信息格式可以幫助人們在無需刻意指導的情況下按照貝葉斯規則進行推斷 。Cosmides和Tooby(1996)同意Gigerenzer和Hoffrage的生態與進化觀點,並通過進一步的研究支持了他們的理論{“1。Sedlmeier等(2001)也認為自然頻數格式更符合人類的信息表徵方式,他們採用相應的“頻數樹”(Frequency Tree)方法對人們的貝葉斯推理能力進行訓練,並認為該方法可以使人們更快的學會使用貝葉斯推理規則,其效果優於“概率樹”(Probability Tree)訓練法 。
Lewis和Keren(1999)認為,自然頻數格式下的乳腺癌問題改變了兩個因素:一是,數據形式由概率變為頻數;二是,信息取樣方式由條件式(conditiona1)變為結合式(joint)。他們提出了條件式頻數的信息表徵方式:每1000名婦女中有10名患有乳腺癌(對應於1%的基礎概率)。在患有乳腺癌的婦女中,每1000人中有800名婦女胸透片呈陽性(對應於80%的擊中率)。未患乳腺癌的婦女中,每1000人有96人胸透片呈陽性(對應於9.6%的誤報率)。研究發現,被試在該條件下的正確率為4%,顯著低於結合式頻率(即自然頻率)條件下的30%。因此他們認為被試成績的提高不是因為數據形式由概率變為了頻數,而是信息由條件式變為了結合式。Mellers和McGraw (1999)則認為,頻數和結合式都可以改進貝葉斯推理,哪種條件占優勢取決於事件的性質。頻數格式比概率格式更有利於人們對稀有事件的理解,此類問題中,頻數格式更容易提高被試的成績;結合式有助於人們建立適宜的心理模型(mental models),一般性事件中,他的優勢會更加明顯 。
Fiedler等(2000)也對Gigerenzer和Hoffrage的研究提出質疑,他們認為自然頻數格式一方面將數據形式由概率變為頻數,另一方面也將參照尺度(reference scale)由不一致變為了一致。自然頻數格式中,所有信息都是來自同一個1000人的樣本,有著一致的參照尺度,數據之間可以進行直接的比較和計算,因此推理顯得容易。他們通過實驗研究發現,無論哪一種數據形式,只要參照尺度一致,被試進行推理的成績都比較好。由此同樣證明瞭頻數並不是成績提高的關鍵。
Girotto和Gonzalez(2001)認為是提問形式和信息結構共同影響了推理成績。自然頻數的表述中,不僅是將概率數據變成了頻率數據,而且還將提問形式由一步變成了兩步(...人中有...人),將信息結構由未分割數據變為了分割數據(partitioned data)。所謂分割結構數據就是將1000分割為了10和990兩部分,又從10中分割出8,從990中分割出95。他們通過實驗考察了提問形式、信息結構以及數據類型等因素,結果發現,無論在概率還是頻數格式下,兩步提問的貝葉斯推理的成績優於單步提問的成績,具有分割的信息結構的問題成績優於不具有分割信 結構的問題。
以上關於貝葉斯推理的信息格式的研究和爭議最初是源於Gigerenzer和Hofrage提出的自然頻數理論。但後來的研究者似乎誤解了他們的原意,主要是在“頻數”上作爭論,而忽視了“自然”的意義。Gigerenzer和Hofrage強調,他們所說的頻數並非任意形式下的頻數,而是通過自然取樣獲得的自然頻數。因為自然頻數攜帶了有關基礎比率的信息,所以簡化了貝葉斯計算。很顯然,他們所說的“自然頻數”就是Lewis和Kere所說的“結合式頻數”、Fiedler等所說的“一致性參照尺度下的頻數” 以及Girotto和Gonzalez所說的“分割結構的頻數”。這些研究者都同意,該方式下推理會變得簡單。但頻數是否能起到作用呢?Gigerenzer和Hofrage不同意其他研究者的觀點,他們通過考察“結合式頻數”和“結合式概率”兩種條件,發現前者的成績明顯好於後者。但Fiedler等(2000)的研究表明,這兩種條件下,被試成績的差異是不顯著的 ,這可能與兩種研究使用了不同的表述方式有關。總的來說,信息格式中所包括的數據類型和結構都會對貝葉斯推理的成績產生影響,其中後者的作用更為明顯。
- 3.信息呈現方式
大多數有關貝葉斯推理的研究中,概率信息都是以整理好的百分數或自然數的形式直接呈現給被試的,但也有的研究中採用另一種信息呈現方式, 得到了一些不同的結果。Fiedler等(2000)將乳腺癌問題中的患病信息和診斷信息分別在卡片的正反兩面先後呈現給被試,讓他們根據其中一種信息搜索另一種信息。例如,先在電腦上呈現患病信息,被試點擊後反饋診斷信息。研究發現,被試根據診斷信息搜索患病信息時,判斷的準確性更高,且與相反條件下差異顯著 。李曉明等(2004)模擬人們平時獲得信息的情景對貝葉斯推理問題進行了研究,他們將患病信息和診斷信息以樣例的方式逐個呈現給被試,例如,其中一個樣例為“體檢者1號,化驗結果:陰性;診斷結果:沒有甲病”,依此類推。測試階段為“體檢者11號,化驗結果:陽性;診斷結果:請你判斷該人實際患有甲病的概率有多大?” 研究發現被試在該條件下的成績優於概率信息集中呈現條件下的成績,但是比頻率集中呈現條件下的成績差。一般將這種讓被試在實驗中通過經歷事件過程主動收集信息的研究範式叫做經驗範式,而將直接在實驗中向被試提供概率信息的方式稱為文本範式。不同的信息呈現方式會影響信息的獲取與加工方式,從而影響推理的過程與結果。
- 4.個體因素
除了問題本身的內容、信息格式和呈現方式等因素之外,推理者的知識、經驗以及思維方式等因素也會影響貝葉斯推理問題的解決。張向陽等(2006)認為,醫務人員之所以對人患病的概率作出高估,可能正是他們的醫學經驗在起作用。另一方面,如果被試具備相關的概率知識,則可能會促進貝葉斯推理問題的解決。研究者以被試的知識背景為自變數,用專家(有概率知識的數學系大學生)和新手(無概率知識的其他系大學生)進行對比實驗。研究表明:在貝葉斯推理中,專家的概率知識背景有助於他們運用貝葉斯規則進行推理,概率估計準確性明顯好於新手。這一結論與史滋福等(2006)的研究結果有所不同,他們以數學系和中文系的大學生為被試進行實驗,發現兩者之問概率估計的準確性沒有顯著差異。研究者認為,文理科被試之間並不存在所謂的思維類型不同而導致複雜概率推理成績差異的現象。傅小蘭等(2005)在考察不同信息表徵方式對貝葉斯推理的影響時發現,中外被試在某些條件下的表現不同甚至相反。在Girott0和GonZalez的研究中,被試解決兩步問題的成績總是優於解決一步問題的成績。而傅小蘭等的研究卻表明:對於中國被試而言,兩步問題形式並不能改進他們解決貝葉斯推理問題的成績,甚至在某些情況下還會幹擾他們做出正確的回答。研究者認為,這可能在一定程度上反映了東西方人的不同思維風格和特點:對西方人而言,分析性的思維操作有助於他們順利解決貝葉斯推理問題,而中國被試面對貝葉斯推理問題時則更傾向於整體性解決,因此,他們解決兩步問題與解決一步問題的成績之間沒有出現顯著差別,甚至解決一步問題的表現可能還會更好一些。另外,問題提問信息格式對中國被試解決貝葉斯推理問題也有影響,與概率格式相比,頻數格式可以顯著改善兩步問題的貝葉斯推理成績。這也與Girotto和Gonzalez的研究結果也不一致。後者的研究結果表明,問題提問的信息格式不影響被試解決貝葉斯推理問題的成績。研究者認為,這可能也是由於東西方人思維方式的差異造成的。
乳腺癌的那個例1,計算結果有誤