斯金納操作學習理論
出自 MBA智库百科(https://wiki.mbalib.com/)
斯金納操作學習理論、操作學習理論
目錄 |
斯金納操作學習理論是指斯金納提出的“學習”即反應概率的變化;“理論”是對所觀察到的事實的解釋;“學習理論”所要做的,是指出引起反應概率變化的條件的理論。
斯金納(Burrhus Frederic Skinner,1904~1990),美國心理學家。他是行為主義學派中最有影響的心理學家之一,其學習理論對教育實踐起了非常巨大的作用。斯金納把行為作為基本的研究對象。研究行為,並不是因為它有助於解決心理學的問題,而是由於行為本身就是人類生活的一個基本方面。行為是由於其本身的原因而值得研究。
斯金納從他專業生涯一開始,就用他自己的程式來研究行為,用他自己設計的儀器來觀察行為,用他自己的方法來分析行為,並用他自己的觀點來解釋行為。
斯金納認為,“學習”即反應概率的變化;“理論”是對所觀察到的事實的解釋;“學習理論”所要做的,是指出引起反應概率變化的條件。所以,研究行為的目的,是要形成一種分析各種環境刺激的功能的方法,以決定和預測有機體的行為。
為此,斯金納設計了一種特殊的儀器,我們稱之為斯金納箱。這是一個陰暗的隔音箱,箱子里有一個開關(如果被試是白鼠,開關就是一根小杠桿或一塊木板;如果被試是鴿子,開關就是一個鍵盤)。開關連接著箱子外面的一個記錄系統,用線條方式準確地記錄動物按或啄開關的次數與時間。箱子外面有一個食物釋放系統,動物一旦按或啄了開關,就有一粒食物落進箱子里,當然也可以不釋放食物,這可以由實驗者決定。斯金納早期都用白鼠做試驗,後來大多以鴿子為被試。另外,實驗者還可以控制燈光、聲音、電擊、溫度與濕度等。
在斯金納箱中,實驗的動物可以主動地作用於環境,稱為“自由操作的行為”。所謂“自由”,即動物的行為不像在迷津里那樣受到限制;所謂“操作”,是因為動物的反應是主動作用於(或操作)環境。
在斯金納看來,行為的實驗分析關註的是環境事件(刺激)與有機體行動(反應)之間的關係,即要考察實驗操作是如何引起行為變化的。斯金納認為,可以用三種基本的實驗操作來控制環境:呈現刺激、安排結果、信號刺激。
呈現刺激是一種最簡單的實驗操作,效果是引起特定的反應。例如,給白鼠電擊是呈現刺激,白鼠跳躍屬於引起特定的反應。反應結果不僅可以是獲得刺激(例如給予事物),也可能是消除刺激(例如停止電擊)。有機體的反應一旦具有某種結果,有些反應就會增加,有些反應就會減少,這取決於每一種反應的具體結果。
在這類實驗中,一種刺激作為預示另一種刺激的信號,或預示反應是否會得到特定結果的信號。例如,我們只在鈴響時對白鼠舔尾巴的動作給予點擊,這樣,白鼠就會在鈴響時不舔尾巴,而在沒有鈴響時照樣舔尾巴。在斯金納箱實驗中,白鼠被鎖在箱內,它偶然按壓杠桿後,食物進入了食物槽中。之後,白鼠會重覆這個動作,以獲得食物。在實驗中,食物是作為強化物存在的,強化了按壓杠桿的動作。[1]
斯金納的實驗分析為分析學習過程提供了有效的基礎,同時,也使他得出了與經典行為主義不同的觀點。
斯金納操作學習理論的強化[2]
斯金納認為,巴甫洛夫的經典條件反射學說只是解釋了人類與動物的數量很少的行為。具體來說,只能解釋這樣一種習得行為:用某種刺激可引發某種反應,這種刺激一反應的聯結是該刺激與另一種刺激多次配對的結果。但是,人類與動物的大多數行為並不是由明顯的刺激引起的,所以,刺激並不是在任何情況下都是對學習做出精確解釋的核心。
斯金納把由刺激引發的反應稱為“應答性反應”;把有機體發出的反應稱為“操作性反應”。前者往往是一種不隨意的被動行為;後者大多數是隨意的或有目的的主動行為。經典條件作用只能用來解釋基於應答性行為的學習,斯金納把這類學習稱為“S(刺激)類條件作用”。操作性或工具性條件作用的模式,則可用來解釋基於操作性行為的學習,他稱為“R(強化)類條件作用”。
斯金納認為,人類從事的絕大多數有意義的行為都是操作性的。例如,步行上學、讀書寫字、回答問題等,都是操作性行為的例子。也許有人會說,事實上存在著許多引發這些反應的刺激。對此,斯金納並不否認,他認為,即便存在引出這些反應的刺激,它們在學習中並不占主要地位。
操作條件作用的模式認為,如果一種反應一一不管有沒有引起這種反應的刺激——之後伴隨一種強化物,那麼,在類似環境里發生這種反應的概率就增加。而且,強化物與實施強化的環境一起,都是一種刺激,我們可以以此來控制反應。這樣,任何作為強化的結果而習得的行為,都可以被看做是操作條件作用的例子。人們由此把斯金納的理論稱為強化理論。在斯金納看來,重要的刺激是跟隨反應之後的刺激(強化物),而不是反應之前的刺激。若用公式來表示,那就是:S-R-S。
與這兩類行為相對應,斯金納把條件反射也分為兩類:一是應答性條件反射,與巴甫洛夫的經典性條件反射相對應,強調刺激對引起的所期望的反應的重要性;二是反應性條件反射,即操作性條件反射,強調反應。
斯金納認為,操作學習與反射學習是不同的,反射學習是S-R聯結的過程,而操作學習則是(S)-R-S的過程,重要的是跟隨反應之後的刺激。人類的學習可以看做是操作,要改變行為,只需對你所期待的行為出現時給予獎勵,即立即強化,再出現,就再強化,這樣,你所希望的這種行為再發生的概率就上升了,這就是行為學習的原則。顯然這與巴甫洛夫的理論不同。經典性條件反射中,行為的後果對行為的學習不起作用,因為刺激帶來了所希望的反應,刺激本身是強化。
操作性條件反射儘管與桑代克的理論很接近,但他們對學習的解釋是不同的。桑代克認為獎勵能加強存在於刺激和反應之問的聯繫,而斯金納則認為,反應加強的不是S-R聯結,而是相同行為再發生的頻率。
強化理論是斯金納學習理論的核心和基礎,他對強化問題做了全面的研究。他區分了兩種類型的強化:正強化和負強化。當在環境中增加某種刺激,有機體反應概率增加,這種刺激就是正強化物;當某種刺激在有機體環境中消失時,反應概率增加,這種刺激便是負強化物。負強化物即厭惡刺激,是有機體力圖避開的那種刺激。
斯金納還區分了強化的兩個來源:一級強化物和二級強化物。一級強化物包括所有在沒有任何學習發生的情況下也起強化作用的刺激,如食物和水等滿足生理基本需要的東西。二級強化物包括那些在開始時不起強化作用,但後來作為與一級強化物或其他強化物配對的結果而起強化作用的刺激,如斯金納箱里的燈光。斯金納認為,對於人類來說,二級強化物包括對大量行為起強化作用的許多刺激,諸如特權、社會地位、權利、財富、名聲等,這些大多是由社會文化所決定的,它們構成了決定人類行為的極有力的二級強化物。
此外,斯金納在強化安排方面做了大量的研究,從某種意義上說,這是他對心理學的最大貢獻。斯金納認為,在行為實驗分析中,最容易控制的、最有效的變數是給予強化的方式。在一種仔細控制的實驗情景中,實驗者可以精確地決定使用什麼類型的強化,以及怎樣給予、何時給予強化。也就是說,實驗者完全可以控制強化程式。斯金納與費斯特合著的《強化的安排》一書中,研究了二十多種強化安排的結果。