斯金納的強化理論
出自 MBA智库百科(https://wiki.mbalib.com/)
斯金納的強化理論(Skinner's reinforcement theory)
目錄 |
強化理論是美國的心理學家和行為科學家斯金納、赫西、布蘭查德等人提出的一種理論。斯金納(Burrhus Frederic Skinner)生於1904年,他於1931年獲得哈佛大學的心理學博士學位,並於1943年回到哈佛大學任教,直到1975年退休。1968年曾獲得美國全國科學獎章,是第二個獲得這種獎章的心理學家。他在心理學的學術觀點上屬於極端的行為主義者,其目標在於預測和控制人的行為而不去推測人的內部心理過程和狀態。他提出了一種“操作條件反射”理論,認為人或動物為了達到某種目的,會採取一定的行為作用於環境。當這種行為的後果對他有利時,這種行為就會在以後重覆出現;不利時,這種行為就減弱或消失。人們可以用這種正強化或負強化的辦法來影響行為的後果,從而修正其行為,這就是強化理論,也叫做行為修正理論。
斯金納所倡導的強化理論是以學習的強化原則為基礎的關於理解和修正人的行為的一種學說。所謂強化,從其最基本的形式來講,指的是對一種行為的肯定或否定的後果(報酬或懲罰),它至少在一定程度上會決定這種行為在今後是否會重覆發生。根據強化的性質和目的可把強化分為正強化和負強化。在管理上,正強化就是獎勵那些組織上需要的行為,從而加強這種行為;負強化是指為了使某種行為不斷重覆,減少或消除施於其身的某種不愉快的刺激。負強化的方法包括批評、處分、降級等,有時不給予獎勵或少給獎勵也是一種負強化。正強化的方法包括獎金、對成績的認可、表揚、改善工作條件和人際關係、提升、安排擔任挑戰性的工作、給予學習和成長的機會等。
開始,斯金納也只將強化理論用於訓練動物,如訓練軍犬和馬戲團的動物。以後,斯金納又將強化理論進一步發展,並用於人的學習上,發明瞭斯金納的程式教學法和教學機。他強調在學習中應遵循小步子和及時反饋的原則,將大問題分成許多小問題,循序漸進;他還將編好的教學程式放在機器里對人進行教學,收到了很好的效果。
斯金納的強化理論和弗隆的期望理論都強調行為同其後果之間關係的重要性,但弗隆的期望理論較多地涉及主觀判斷等內部心理過程,而強化理論只討論刺激和行為的關係。
在管理學的研究領域中,斯金納的強化理論獨樹一幟。作為美國最傑出的心理學家之一,斯金納在把科學方法引入心理學上具有里程碑式的地位。
他根據自己的實驗,創造性地發展了巴甫洛夫的條件反射學說和華生的行為主義學說,提出了以操作性條件反射為基礎的強化理論。對於管理學來說,強化理論是對激勵機制進行科學分析的理論平臺。尤為重要的是,斯金納通過大量實驗,對強化的作用機理、強化物的分類與組合、強化的過程分析以及強化的操作技術性設計等,形成了系統的學說。其中的正強化優先觀點,在現實管理中得到廣泛應用。他發明的“斯金納箱”,至今仍是進行心理學研究的標誌性工具。斯金納志在改造社會,他關於用強化理論塑造新型人類社會的設想,不僅在學界,而且在民眾中產生了巨大的反響,其社會影響遠遠超出了學術範圍。
斯金納近乎極端的科學化追求,試圖用科學改造人文的思想方法,使他的理論成為學界爭議的焦點。而正是這種爭議,為包括管理學在內的社會科學發展提供了必要的張力,也為斯金納奠定了大師級的聲望。
激勵在管理中的作用人人皆知,但是如何使激勵有效,卻使許多富有經驗的經理也撓頭。從經濟學的邏輯看,激勵能否有效至少取決於以下前提:
第一,激勵所提供的東西是激勵接受者所需要的東西,並且能引起激勵接受者的獲得欲望;
第二,激勵所提供的東西必須具有稀缺性和排他性,也就是說要使接受者獲得某種獨享;
第三,激勵效用是曲線而不是直線,收益和付出的關係有增有減,相關度有大有小有正有負,要合理運用,既不能“過”,也不能“不及”。
在這些前提下,管理學家們提出過很多激勵理論和模型,其中斯金納提出的“強化理論”至今仍然具有重大的理論和實踐意義。
強化作用離不開“強化物”。所謂“強化物”(reinforcer)指的是當行為人做出某種行為後帶來的後果或者反應對行為人有利時,該結果被稱為“強化物”。“強化物”不一定是實物,也可以是氛圍、表情、他人的行為等等。由於“強化物”的適時出現,增加了個體以後在相同情形下重覆這種行為的概率,這表示“強化物”對於個體的反應起了強化作用。此種強化作用,即稱之為“強化”。
一般來說,強化有兩種:正強化和負強化。通過某種強化物,能使管理者期望的行為發生概率增大,行為者受到這種強化物的激勵,其期望行為的積極性會得到提高,這就是正強化。反過來,通過移除某種強化物,使管理者不期望的行為發生概率降低,行為者因為強化物的缺失,其不期望行為的積極性會消退甚至喪失,這就是負強化。
正強化
正強化:又稱積極強化。當人們採取某種行為時能從他人那裡得到某種令其感到愉快的結果,這種結果反過來又稱為推進人們趨向或重覆此種行為的力量。例如教師通過設置頒發獎狀來激勵那些表現優異的學生。
對正強化物的效用可以從兩個層面來理解。一個層面是某一行為如果會帶來行為者的愉快和滿足,如給予食物、金錢、贊譽和關愛等,行為者就會傾向於重覆該行為;另一個層面是某一行為如果能減少和消除行為者的不快和厭惡,如減少雜訊、嚴寒、酷熱、電擊和責罵等,行為者也會傾向於重覆該行為。
負強化
負強化:又稱消極強化。是指通過中止不愉快條件來增強反應頻率。例如罪犯在立功之後對其進行減刑,這樣罪犯的立功行為就會受到負強化。
與此類似,對負強化物的效用照樣可以從兩個層面來理解。懲罰性強化物和消退性強化物。懲罰性強化物是指會給行為者帶來不快的東西,能使行為者的行為傾向減弱;消退性強化物是指減少或取消令行為者愉快的東西,也能使行為者傾向於終止或避免重覆該行為。 對正強化物與負強化物的區分,不能想當然,而要以其效果確定。
比如,限制一個孩子獲得某種玩具的欲望,其效果很可能是極大地激發了這個孩子獲得這種玩具的行為。現實中某些東西,越禁止反而越流行,實際上這種禁止就起著正強化作用。而不恰當地對某種行為進行言過其實的贊揚,很有可能引起反感而削弱這種行為,贊揚起的是負強化作用。有時候官方樹立的先進模範反而收不到正面效果,就是這種機制。一個部下過於明顯地逢迎上司,有可能會引起這個上司的反感。這些,都是值得激勵研究註意的。
更有意思的是,有些錶面上截然相反的強化物,其強化作用卻高度一致。如果對賭博進行強化分析,就不難發現,不論是輸是贏,都會起到強烈的正強化作用。贏了,會刺激賭徒繼續;輸了,還會刺激賭徒繼續。所以,單靠賭博本身的輸贏,很難消退賭博行為。公司經營中,有些人偏愛投機方式,其中一個重要因素,就是因為投機方式不論後果是成功還是失敗,都會產生類似賭博的正強化效應。
從強化物效用的大小和重要程度來講,還可以進一步將強化物劃分為初級強化物和條件強化物。初級強化物對有機體來說,往往是無條件的,它能滿足人和動物的基本生理需要,如食物、水、安全、溫暖、性等。條件強化物需要通過初級強化物才能產生作用。任何一個中性刺激物,如果與初級強化物反覆聯合,它就能使自身獲得強化物性質。它是初級強化物的附屬品。例如金錢,對小孩它不是強化物,但當小孩知道錢能換糖時,它就能對兒童的行為產生強化效果。在這個例子中,糖果就是初級強化物,而金錢則是條件強化物,金錢的強化作用是由於與糖果的結合才獲得的。作為管理者應該註意,初級強化物是最基本的,然而條件強化物是最常用的。二者的匹配和結合方式值得進行深入探討。
利用強化的手段改造行為通常三種類型:正強化、負強化、自然消退。
自然消退:又稱衰減。它是指對原先可接受的某種行為強化的撤銷。由於在一定時間內不予以強化此行為將自動下降並逐漸消退。例如:上課做鬼臉的同學老師對其進行忽視使該同學感到無趣而自行收斂。
在此需要對負強化和懲罰進行區分:懲罰是能夠減弱行為或降低反應頻率的手段包括正懲罰和負懲罰。正懲罰:是指行為之後給予一個厭惡刺激(例如學生犯錯老師給予他處分);負懲罰是指行為之後撤銷一個積極刺激(例如小孩犯錯父母因此不讓他和同伴出去玩)。懲罰就是企圖呈現消極強化物或者撤銷積極強化物去刺激某個反應是一種治標的方法對於被懲罰者和懲罰者都是不利的,它並不能讓被懲罰者知道自己該做什麼。
正強化:給予一個愉快刺激,從而增強其行為出現的概率。
舉例:
(1)如果學生認真完成作業,就獎勵學生去游樂場玩,學生認真完成作業的行為增加。
(2)如果能夠按時到校,就獎勵一個玩具,學生按時到校的行為增加。
(3)某學生為了吸引老師和同學們的註意,上課總喜歡做小動作,一次學生上課扔小紙條,被老師批評後,扔小紙條的行為變本加厲。(被老師批評對於該生來說是一種愉快的刺激)
(4)“強寶寶”喜歡“馬蓉蓉”,“馬蓉蓉”為了讓“強寶寶”努力學習,就說:“你如果好好學習,我就嫁給你”,“強寶寶”努力學習的行為增加。
負強化:擺脫一個厭惡刺激,從而增強其行為出現的概率。
舉例:
(1)如果學生認真完成作業,就不讓打掃衛生,學生認真完成作業的行為增加。
(2)如果學生積極回答問題,就不讓罰站,學生積極回答問題的行為增加。
(3)戴罪立功:對於接受懲罰的人來說,如果多做一些立功的行為,那麼就會減少處罰,因此立功的行為增加。
(4)坦白從寬:對於犯罪的人來說,如果能夠坦白自己的罪行,那麼就可以減少處罰,因此坦白的行為增加。
正懲罰:給予一個厭惡刺激,從而降低其行為出現的概率。
舉例:
(1)如果學生遲到,就罰打掃衛生,學生遲到的行為減少。
(2)抗拒從嚴:對於接受懲罰的人來說,如果抗拒不服的行為太多,那麼就會增加處罰,為了減少處罰,因此抗拒的行為會減少。
負懲罰:撤銷一個愉快刺激,從而降低其行為出現的概率。
舉例:
(1)如果學生經常撒謊,就不讓他看電視,那麼撒謊的行為就會減少。
(2)如果學生上課說話,就沒收手機,上課說話的行為減少。
有機體做出以前曾被強化過的反應,如果在這一反應之後不再有強化物相伴,那麼,此類反應在將來發生的概率便降低,這稱為消退。消退是減少不良行為,消除壞習慣的有效方法。
舉例:對於很多上課搗亂的學生 ,他們這些行為更多是為了引起同伴和老師的註意,要想減少該行為,老師最好的方法就是不予理睬。
還有一種特殊情況,強化物與行為之間的關係是非理性的,斯金納把這種強化行為稱為“迷信”(superstition),也稱為“非相倚強化”。
在斯金納的實驗中,假如把給白鼠喂食的方式改為不是按壓杠桿引發,而是每隔15秒固定送食一次,那麼,白鼠在首次喂食之前的偶然動作就會形成“迷信”。如果白鼠正在作揖,它就會在此後不斷作揖以求得食物;如果白鼠正在嗅通氣孔,它則會不斷嗅通氣孔以求得食物。
人類這種情況也十分多見,比如,天旱引發的祈雨行為,某個運動員對某種動作、某種服飾與獲勝之間的看法以及由此而採取的行為等等,都屬於迷信。迷信只有在多次無效的情形下,才會逐漸產生操作性消退。但是,只要有偶然性存在,迷信就不能徹底根除。
要使正負強化能達到各自預期的效果,對強化物的恰當選擇是很重要的。一般而言,在使用強化理論之前,首先要弄清是要對行為進行正強化還是進行負強化,然後針對行為者的特點選擇恰當的強化物。在選擇時,並不是強化物的數量越多越好。
斯金納認為,由於強化物的數量與對行為的強化效果不一定成正比例,真正的強化物也可能被誤用,因此,合理安排強化措施,比單一追求強化物數量更為重要。這裡實際上涉及到了強化物的合理配置問題。為此,斯金納設計了“強化表”,對強化物合理安排做出了有益嘗試。對於現實中的管理者來說,更為重要的不是照搬斯金納的強化表,而是參照和借鑒斯金納的思路,根據自己所處的實際情況,尤其是考慮各種特定的環境因素,對強化物的選擇、搭配和使用作出符合理性的科學安排。
此外,強化物效用的大小還與其接受者有關。一種強化能否起到應有的作用,取決於強化物運用是否恰當,而強化物運用是否恰當,又取決於強化物的作用對象接受與否。因此,在選擇強化物時必須考慮到行為者的自身特征。比如,提升職務一般能夠起到正強化作用,但是,在霍桑實驗中曾經發現,某個女工拒絕了上級提升其職務的安排。理由很簡單,在這個女工看來,提升職務有可能會破壞她同工友們之間良好的人際關係。對於這個女工而言,工友之間的人際關係,遠遠要比職務提拔更重要。所以,在多數人身上能起到強化作用的提拔方式,對於這個女工卻不是合適的強化物。當然,這個女工對強化物的認知,並不是心血來潮的怪癖,而是環境因素的綜合作用在她身上的反應。所以,管理中採用強化措施時,要以對員工狀況的科學分析為前提。
一般而言,強化物的選擇至少要考慮到三個方面的因素:
第一,是管理者所能提供的強化物;
第二,該強化物是管理對象所能接受的;
第三,該強化物能夠起到應有的強化效果。
從這三個方面來考慮強化物的選擇,或許能找到很多有效的強化物。但人類需求的複雜性和多樣性,往往需要更大範圍的強化物來進行激勵。現實中的強化物,會受到資源稀缺性的限制以及使用成本的限制。
在這種情況下,可以通過強化物的恰當組合來擴大選擇範圍。對於管理者來說,弄清這種組合十分重要,因為在最常見的強化物中,金錢總是有限的,即便是有權印發鈔票的政府,濫發鈔票也會貶值;提拔總是有數的,人人都提拔為經理,名片上的經理就會變成事實上的業務員;一種物品一旦不再稀缺,強化作用就會迅速消失,哪怕是不花成本的微笑,用多了笑臉也會失去激勵效應。
強化物的組合有兩種方式:一是把本來就有強化作用的不同事物結合使用,只要恰當配置,可以產生出具有很大效力的強化物;二是把原本沒有強化作用的事物按照行為關係結合使用,使它產生強化作用,這就是條件性強化物。條件性強化物的具體做法是,把一個中性刺激物與一個強化刺激物反覆匹配聯合,那麼該中性刺激物就具備了強化的性質和作用。
條件性強化物本來不具有強化作用。
例如,在斯金納的實驗中,真正的強化物是食物。但是,如果每次實驗都是先打開燈再給鴿子喂食,最後,中性的燈光就會成為條件性強化物。此時,燈光的作用和食物一樣,均能使操作條件化。斯金納指出,中性刺激物要獲得這種強化性質,須遵守這樣三條規則:一是中性刺激物與初級強化物的聯繫次數越多,它就越具有強化作用;二是中性刺激物與初級強化物出現的時間不應間隔太長;三是初級強化物如果不再出現,中性刺激物的強化力會迅速消失(類強化物不在此例)。
如果某種條件性強化物與不止一種初級強化物相匹配,那麼該條件性強化物便能通過這些初級強化物而具備多方面的強化作用,從而成為一個“類強化物”,也可稱為概括性強化物。就是說,當一個中性物與兩個以上的初級強化物形成聯繫時,它就會發生類化。最典型的例子莫過於金錢,由於它與衣、食、住、行等初級強化物密切聯繫和匹配,因而具備了廣泛的強化作用。斯金納進一步指出,類強化物因為具有聯繫的廣泛性,即使沒有賴以為基礎的初級強化物伴隨出現,由於它總能同另外的初級強化物發生這樣那樣的聯繫,所以,它的強化效果依然存在。
在這種條件性強化物的組合中,需要註意的是,與中性刺激物相組合的初級強化物必須具有很大的強化力量。如果初級強化物本身沒有足夠的強化力量,就無法調動行為者的積極性,失去吸引力,與它組合的中性刺激物當然無效。所以,初級強化物存在著強化力的臨界點。在這個臨界點之上,它能使與其組合的中性刺激物獲得強化性質;在這個臨界點之下,即使它本身還有一定強化作用,但與其組合的中性刺激物不能獲得強化性質。
在實驗中,斯金納發現強化與行為之間存在著一定的關係。如果強化的時間和比率不同,強化作用的效果也會大不相同。所謂強化程式,就是指反應受到強化的預先安排形式。對此,斯金納提出了一個著名的強化類型表。
根據這個強化類型表,一切強化可分為兩大類:
一是連續性強化,即每次行為都受到強化;
二是間歇性強化,即只是部分行為受到強化。
間歇性強化又可按照時間和比率的不同分為以下四種:
①固定間時強化,強化是定期的,如計時工資;
②變動間時強化,強化是不定期的,如隨時進行的獎勵;
③固定比率強化,強化按一定比率進行,如營業提成;
④變動比率強化,強化按隨機比率進行,如彩票得獎、賭博輸贏等。
a.獎勵的形式不同:
固定間隔強化:基於固定時間進行獎勵(每周或每月付薪水)
固定比率強化:獎勵與特定數量的行為聯繫起來(計件工資制)
可變間隔強化:不定時間給給予獎勵(沒有事先聲明的檢查或評價以及每月隨
機給獎勵)
可變比率強化:行為出現若幹數量才給予獎勵(銷售)
b.對績效的影響:
固定間隔強化:導致平均水平的和不規則的績效
固定比率強化:迅速導致非常高而且穩定的績效
可變間隔強化:導致較高和穩定的績效
可變比率強化:導致非常高的績效
c.對行為的影響:
固定間隔強化:行為迅速消退
固定比率強化:行為較快消除
可變間隔強化:行為慢慢消除
可變比率強化:行為消除非常慢
連續性強化和間歇性強化的效用,從行為的消退角度來看不盡相同。斯金納的實驗表明,間歇性強化停止後產生的反應消退,遠遠低於數量相同的連續性強化停止後產生的反應消退。例如,如果只是偶然對兒童的良好行為給予強化,在停止強化後,這種良好行為保持的時間,要比每一次良好行為都給予強化保持的時間長得多。斯金納認為,當手頭的強化物很有限時,這一差別具有實際意義。對於管理者來說,弄清間歇性強化與連續性強化在反應消退上的差別,進而弄清不同的間歇性強化在反應消退中的精確數據,對於設計激勵方案有著重要作用。
間歇性強化的各自特點和不同效果如下:
(1)固定間時強化:固定間時強化每隔一個固定時段進行一次,其效果受強化的大小、數量和及時性的影響。強化越大,數量越多,則反應概率越大。如果反應和強化物出現的時間之間有相當大的間隔,則反應概率較低。這種強化因間隔的固定性,有一定規律可循。因此,在強化物出現後,由於行為者知道短期內不能再得到強化,所以在每次強化之後的區間反應概率較低。當行為者覺得再次強化快要到來時,反應概率又會增加。例如,在計時工資制中,工資定時發放,在這段固定時間中,工人的反應並不會得到強化,工作的水平可能會下降。對於這一問題,可以通過厭惡性的條件強化物(如扣除薪金)來作為工資的補充。
(2)變動間時強化:變動間時強化可以用來調節行為的發生概率,它能夠消除強化物出現後的反應概率降低現象。由於這種強化程式沒有一定的時間規律,隨機性較大,行為者往往難以琢磨後續強化物出現的時間。因此,在它的作用下,能使行為者保持一個相對穩定的行為水平。
(3)固定比率強化:斯金納認為,固定比率強化能產生很高的反應概率。因為在這種程式的刺激下,行為者的反應速率達到固定比率就會得到強化,行為的結果又促使反應速率進一步提高。如果沒有其他因素干擾,這種程式能使激勵作用達到最大值。值得註意的是,斯金納強調,採用這種程式的關鍵在於“比率不是太高”。因為他的研究表明,某一特定的行為人和某一特定的強化指標之間,比率是有限的。超過這一比率,行為就不能保持,而且會出現快速消退。這種情況被斯金納稱為“行為缺失”。之所以會發生行為缺失,是因為行為人的能力和精力是有限的。如果固定比率過高,超出了行為人之所能,那麼就會產生兩種情況:一是行為人在初始時就無法達到規定的比率;二是在初始時雖然達到了比率,但後來無法持續達到。一旦出現這種情況,肯定發生行為消退。在現實中,某些本來行之有效的業務提成或類似制度,由於後來不斷“加碼”而導致失效,就屬於這種情況。
(4)可變比率強化:可變比率強化是通過對受到強化的反應與未受到強化的反應之間比率的不確定性運用來進行激勵的。這樣,行為人對強化的力度(即自己的收益)不可預測。可變比率和固定比率的差別,同變動間時和固定間時的差別在邏輯上是一致的。所以,在理論上,它可以消除固定比率強化後所出現的反應消退現象。這種程式的比率幅度在變,但其平均值不變。所以,行為人的行為有可能得到高強化,也有可能得到低強化,或者很長時間得不到任何強化,而強化的平均值不變。行為人會根據這種隨機性來調整自己,保持一種穩定的行為速率。
斯金納主張綜合使用各種不同的強化程式。可以把比率強化和間時強化、固定強化和可變強化結合使用或者交替使用,從而對行為人的行為進行更好的調節。
人類的行為,多數是經過強化而形成的操作性行為。也就是說,行為是可塑的。斯金納把行為的可塑性作為他研究的依據,行為既然有可塑性,也就是說可以促使某種行為發生,或者抵制某種行為出現,這種願望的實現恰恰是通過強化作用來實現的。與以往的理論不同處在於,斯金納強調,強化作用不是取決於強化物的有無或大小,而是取決於強化物和行為的聯繫。相倚性聯繫的建立是強化不斷延續的結果。
當一種行為發生後帶來了強化物,最初的強化刺激就形成了。只要這種行為和強化多次重覆,就能形成分辨性刺激,行為主體會自行區分相倚性聯繫。例如,微笑意味著贊許,而皺眉意味著異議,這種判斷就是來自於經驗歸納的分辨性刺激。一旦行為主體認知到了相倚性聯繫,那麼這種行為的可操作性就已經建立了。隨後,可以通過控制強化的強度和頻率來調節行為。假如這種行為是強化實施者所期望的行為,那麼通過運用恰當的強化物,這種行為就會得到強化,從而導致這種行為出現的概率增大;反之,假如這種行為不是強化實施者所期望的行為,那麼通過不同的強化物,這種行為會受到負強化,從而導致這種行為發生的概率降低,甚至為零。
依據這個原理,斯金納認為人的行為是可以塑造的,而其塑造手段是通過強化來進行的。強化的效果,要受強化物種類的選擇、強化方式的選擇、強化程式的安排等因素影響。要使行為發生的概率增加,可以通過正強化物,使行為者得到這種行為的相應收益,使自己需求得以滿足;反之,要使行為發生的概率減少,則可通過相應的負強化物來實現。
(1)經過強化的行為趨向於重覆發生。所謂強化因素就是會使某種行為在將來重覆發生的可能性增加的任何一種“後果”。例如,當某種行為的後果是受人稱贊時,就增加了這種行為重覆發生的可能性。
(2)要依照強化對象的不同採用不同的強化措施。人們的年齡、性別、職業、學歷、經歷不同,需要就不同,強化方式也應不一樣。如有的人更重視物質獎勵,有的人更重視精神獎勵,就應區分情況,採用不同的強化措施。
(3)小步子前進,分階段設立目標,並對目標予以明確規定和表述。對於人的激勵,首先要設立一個明確的、鼓舞人心而又切實可行的目標,只有目標明確而具體時,才能進行衡量和採取適當的強化措施。同時,還要將目標進行分解,分成許多小目標,完成每個小目標都及時給予強化,這樣不僅有利於目標的實現,而且通過不斷的激勵可以增強信心。如果目標一次定得太高,會使人感到不易達到或者說能夠達到的希望很小,這就很難充分調動人們為達到目標而做出努力的積極性。
(4)及時反饋。所謂及時反饋就是通過某種形式和途徑,及時將工作結果告訴行動者。要取得最好的激勵效果,就應該在行為發生以後儘快採取適當的強化方法。一個人在實施了某種行為以後,即使是領導者表示“已註意到這種行為”這樣簡單的反饋,也能起到正強化的作用。
如果領導者對這種行為不予註意,這種行為重覆發生的可能性就會減小以至消失。所以,必須利用及時反饋作為一種強化手段。強化理論並不是對職工進行操縱,而是使職工有一個最好的機會在各種明確規定的備擇方案中進行選擇。因而,強化理論已被廣泛地應用在激勵和人的行為的改造上。
(5)正強化比負強化更有效。所以,在強化手段的運用上,應以正強化為主;同時,必要時也要對壞的行為給以懲罰,做到獎懲結合。
強化理論只討論外部因素或環境刺激對行為的影響,忽略人的內在因素和主觀能動性對環境的反作用,具有機械論的色彩。但是,許多行為科學家認為,強化理論有助於對人們行為的理解和引導。因為,一種行為必然會有後果,而這些後果在一定程度上會決定這種行為在將來是否重覆發生。那麼,與其對這種行為和後果的關係採取一種碰運氣的態度,就不如加以分析和控制,使大家都知道應該有什麼後果最好。這並不是對職工進行操縱,而是使職工有一個最好的機會在各種明確規定的備擇方案中進行選擇。因而,強化理論已被廣泛地應用在激勵和人的行為的改造上。
對強化理論的應用,要考慮強化的模式,並採用一整套的強化體制。
強化模式主要由“前因”、“行為”和“後果”三個部分組成。
“前因”是指在行為產生之前確定一個具有刺激作用的客觀目標,並指明哪些行為將得到強化,如企業規定車間安全生產中每月的安全操作無事故定額。
“行為”是指為了達到目標的工作行為。
“後果”是指當行為達到了目標時,則給予肯定和獎勵;當行為未達到目標時,則不給予肯定和獎勵,甚至給予否定或懲罰,以求控制職工的安全行為。
1、強化包括正強化、負強化和自然消退三種類型:
第一種:正強化,又稱積極強化。當人們採取某種行為時,能從他人那裡得到某種令其感到愉快的結果,這種結果反過來又成為推進人們趨向或重覆此種行為的力量。例如,企業用某種具有吸引力的結果(如獎金、休假、晉級、認可、表揚等),以表示對職工努力進行安全生產的行為的肯定,從而增強職工進一步遵守安全規程進行安全生產的行為。
第二種:負強化,又稱消極強化。它是指通過某種不符合要求的行為所引起的不愉快的後果,對該行為予以否定。若職工能按所要求的方式行動,就可減少或消除令人不愉快的處境,從而也增大了職工符合要求的行為重覆出現的可能性。例如,企業安全管理人員告知工人不遵守安全規程,就要受到批評,甚至得不到安全獎勵,於是工人為了避免此種不期望的結果,而認真按操作規程進行安全作業。
懲罰是負強化的一種典型方式,即在消極行為發生後,以某種帶有強制性、威懾性的手段(如批評、行政處分、經濟處罰等)給人帶來不愉快的結果,或者取消現有的令人愉快和滿意的條件,以表示對某種不符合要求的行為的否定。
第三種:自然消退,又稱衰減。它是指對原先可接受的某種行為強化的撤消。由於在一定時間內不予強化,此行為將自然下降並逐漸消退。例如,企業曾對職工加班加點完成生產定額給予獎酬,後經研究認為這樣不利於職工的身體健康和企業的長遠利益,因此不再發給獎酬,從而使加班加點的職工逐漸減少。
正強化是用於加強所期望的個人行為;負強化和自然消退的目的是為了減少和消除不期望發生的行為。這三種類型的強化相互聯繫、相互補充,構成了強化的體系,併成為一種制約或影響人的行為的特殊環境因素。
強化的主要功能,就是按照人的心理過程和行為的規律,對人的行為予以導向,並加以規範、修正、限制和改造。它對人的行為的影響,是通過行為的後果反饋給行為主體這種間接方式來實現的。人們可根據反饋的信息,主動適應環境刺激,不斷地調整自己的行為。
2、 積極強化律
有幾種因素,具有能影響積極強化權變措施強度效果的潛力。可以籠統地把這此因素當作“定律”,因為它們有助於解釋最佳強化的條件。
(1)權變強化律。按照權變強化律,為了使某項強化措施取得最大效果,該強化措施必須只有在所想要的目標行為完成之後才採用。這是強化措施必需取決於職工行為的另一種說法。因此,按照此律,如果所想要的行為未完成而採用了某個強化措施,該強化措施就沒有效果。要想確定是否遵循了此規律,只要問這個問題:該強化措施只是在目標行為發生時才採取的嗎?
(2)及時強化律。及時強化律說明,目標行為發生後,強化措施採取得越及時,則該強化措施對這一行為今後發生次數的影響便越大。一般說來,強化措施的採取應當盡實際可能與目標、行為的完成相一致。
3、強化規模律。強化措施的數量或規模也會有影響。強化規模律是說,在某一目標行為發生之後,所採取的強化措施,其數量越大,則該強化措施對反應率的影響也越大。不過強化措施的數量或規模是相對的。重要的是應確定,強化的數量是否值得。對某一個人來說是大的強化措施,對另一個人則可能小了。
4、強化疏化律。最後一條是強化疏化律,它說的是,使一個人對某一強化措施越疏化,越難於得到,越稀罕,這種強化措施對該項目標行為在未來的出現越具有影響。
在企業安全管理中,應用強化理論來指導安全工作,對保障安全生產的正常進行可起到積極作用。在實際應用中,關鍵在於如何使強化機制協調運轉並產生整體效應,為此,應註意以下五個方面:
第一,應以正強化方式為主。在企業中設置鼓舞人心的安全生產目標,是一種正強化方法,但要註意將企業的整體目標和職工個人目標、最終目標和階段目標等相結合,並對在完成個人目標或階段目標中做出明顯績效或貢獻者,給予及時的物質和精神獎勵(強化物),以求充分發揮強化作用。
第二,採用負強化(尤其是懲罰)手段要慎重。負強化應用得當會促進安全生產,應用不當則會帶來一些消極影響,可能使人由於不愉快的感受而出現悲觀、恐懼等心理反應,甚至發生對抗性消極行為。因此,在運用負強化時,應尊重事實,講究方式方法,處罰依據準確公正,這樣可儘量消除其副作用。將負強化與正強化結合應用一般能取得更好的效果。
第三,註意強化的時效性。採用強化的時間對於強化的效果有較大的影響。一般而論,強化應及時,及時強化可提高安全行為的強化反應程度,但須註意及時強化並不意味著隨時都要進行強化。不定期的非預料的間斷性強化,往往可取得更好的效果。
第四,因人制宜,採用不同的強化方式。由於人的個性特征及其需要層次不盡相同,不同的強化機制和強化物所產生的效應會因人而異。因此,在運用強化手段時,應採用有效的。強化方式,並隨對象和環境的變化而相應調整。
第五,利用信息反饋增強強化的效果。信息反饋是強化人的行為的一種重要手段,尤其是在應用安全目標進行強化時,定期反饋可使職工瞭解自己參加安全生產活動的績效及其結果,既可使職工得到鼓勵,增強信心,又有利於及時發現問題,分析原因,修正所為。
1)組織行為修正:指將強化理論系統應用於對組織成員的行為塑造,培養組織需要的行為,減少或消除組織不需要的行為
2)它包含5個步驟:
a.辨別關鍵行為:明確哪些行為應該得到強化
b.衡量關鍵行為:確定目標基線水平,進行基線測量,為關鍵行為提供客觀頻率數據
c.行為起因分析:確定關鍵行為的起因後果,即ABC行為管理法
d.選擇修正策略:側重正強化,消退,儘可能不用負強化,懲罰
e.評價績效是否已經得到提高,包括:反應,學習,行為改變,績效產生 狀態型激勵
強化理論對管理實踐有重要的指導作用:
1)獎勵與懲罰相結合。即對正確的行為,對有成績的個人或群體給予適當的獎勵;同時,對於不良行為,對於一切不利於組織工作的行為則要給予處罰。大量實踐證明,獎懲結合的方法優於只獎不罰或只罰不獎的方法。
2)以獎為主,以罰為輔。強調獎勵與懲罰並用,並不等於獎勵與懲罰並重,而是應以獎為主,以罰為輔,因為過多運用懲罰的方法,會帶來許多消極的作用,在運用時必須慎重。
3)及時而正確強化。所謂及時強化是指讓人們儘快知道其行為結果的好壞或進展情況,並儘量的予以相應的獎勵,而正確強化就是要“賞罰分明”,即當出現良好行為時就給予適當的獎勵,而出現不良行為時就給予適當的懲罰。及時強化能給人們以鼓勵,使其增強信心並迅速的激發工作熱情,但這種積極性的效果是以正確強化為前提的:相反,亂賞亂罰決不會產生激勵效果。
4)獎人所需,形式多樣。要使獎勵成為真正強化因素,就必須因人制宜地進行獎勵。每個人都有自己的特點和個性,其需要也各不相同,因而他們對具體獎勵的反應也會大不一樣。所以獎勵應儘量不搞一刀切,應該獎人之所需,形式多樣化,只有這樣才能起到獎勵的效果。
強化在教學中的運用[1]
強化在教學中的運用要使強化發揮對學生行為的積極促進作用,需重視以下問題:
1.影響強化效果的因素。
①學生的積極性和主動性———強化的前提條件和基礎。
只有當學生主動地去認識強化時,才能領會教師的要求和期待,進而改進行為方式,使強化所提供的信息發生作用效果。也就是說,一切外部強化都要通過學生自身的內部活動才能被接受,“外因通過內因起作用”。缺少學生積极參与的強化將失去價值。
②教師的威信———有效強化的重要條件。
威信是教師使學生感到尊敬而信服的精神感召力量。威信使學生感到教師親切,能信賴,並自覺服從於教師。所謂“親其師,信其道”,由親和信而發自內心主動地接受教師“傳道授業解惑”;由親和信,產生情感共鳴,同憂樂,共好惡。
③強化物的性質———有效強化的必要條件。
強化物是進行強化所採用的各種方式手段的總稱。一般而言,肯定性的強化物(表揚的話、親切的笑容、滿意的表情、獎品、豎起的大姆指,作業本的一朵小紅花等)有利於學生積極地接受和內化教師的要求;而否定性的強化物(批評的尖刻的字詞、失望的神情、冷笑、嘲弄等)讓學生緊張,產生心理壓力(焦慮、煩燥、不安、憂郁、甚至攻擊性行為)。雖然否定性強化物也有助於學生減少或改變某種行為。但其負面影響比肯定性強化物更為嚴重,故強化中以使用肯定性強化物為主,否定性強化物為輔。
2.有效強化的基本原則。
強化的原則指教學中對學生行為進行強化時所必須遵循的基本要求。
(1)一致性原則,指教師對學生強化的內容、性質、標準要堅持一致,強化所提供的各種反饋信息要前後一致,避免相互矛盾。如某教師對學生的行為作出肯定性評價,而另一教師卻對學生的這一行為作出否定性評價;或是某教師今天表揚了學生的這一行為,明天又批評這一行為。如此這般,讓學生無所適從,不知所措。因此,強化要堅持一致性原則。教師首先得消除沒有目的性的隨心所欲的評價行為,剋服不良情緒對強化的干擾。
其次,教師要保證標準和方向上的統一。教師不能嘴上說好,行為、表情表現卻是根本瞧不起;或嘴上說不好,而心理上贊賞不已並流露於言談舉止中。這種不一致,造成學生迷惑、混亂。最後,加強教師之間的溝通聯繫,確定共同的強化標準,形成教育的“合力”。
(2)客觀性原則,指強化要客觀公正,科學合理,不能主觀臆斷,以致使強化不符合實際情況。只有客觀科學地強化,才能切實反映學生的行為,使他們心悅誠服,調動起學習的積極性,違反此原則就會扭曲強化的意義。強調客觀性原則:
第一,要提高教師的評價水平,以達到強化的準確與恰當。
第二,避免主觀因素的干擾,特別是成見效應。教師不能以自已的主觀意願和偏見來評價學生。
第三,以發展的觀點來指導強化。學生是發展中的人。強化的某一種形式也不是放之四海皆準的。強化要有針對性,著眼於學生的動態發展。好的學生也會有不佳的行為表現,而差的學生也有好的行為表現。只要比過去有了進步,都應予以肯定;比過去有了退步,都應予以否定。
第四,熱愛學生,熱愛教育工作。崇高的責任心和義務感能使教師關心、尊重、信任學生,重視學生主觀能動性的發揮,把學生作為教育過程和強化過程中的主體,積極發揮強化的積極影響,減少負面影響、強化是促使學生行為進步的手段,並非整人的工具。
(3)及時性原則,指教師在學生行為反應後及時給予信息反饋,以提高學生對強化的認識和理解。大量的科學實驗和實踐經驗證明,教師提供反饋愈及時、具體、明確,則對行為的強化效果愈佳。及時的強化利於學生行為與強化之間建立直接聯繫,避免無關因素的干擾。如果某行為與強化之間間隔過長,介入一些不相關的行為和刺激,則使強化的指向不明,對行為的影響作用混淆紊亂。這要求評價要及時、明確。教師工作要細緻、全面、及時發現問題,提出明確的要求做到查缺補漏,適時恰當。
(4)效能性原則,指教學中教師要充分發揮強化對行為積極有效的影響。儘量減少對學生髮展的負面影響。不論肯定性的或否定性的評價對學生都有利有弊。過多的肯定性評價可增強學生的信心和相應行為,但滋生傲慢、自滿的心理,過多的否定性評價,能減弱或改變某些行為,產生消極的心理。
強化理論的評價[2]
強化理論有助於對人們行為的理解和引導。因為,一種行為必然會有後果,而這些後果在一定程度上會決定這種行為是否重覆發生。管理人員的職責就在於通過正負強化手段去控制和影響職工的自願行為。為此,管理人員為使某種行為重覆出現,就應採取正強化的辦法反覆加以控制。如果要消除某些不利行為,就採取負強化的辦法使之削弱。這種控制和改造職工的行為,並不是對職工進行操縱,相反,它使職工有一個最好的機會在各種明確規定的備擇方案中進行選擇。
但是,強化理論所說的控制,主要是指從外部加給人的環境因素。至於這種外部因素如何通過人的認識和心理而起作用,強化理論則沒有著重地加以說明。
本条目由以下用户参与贡献
蔓草寒烟,Vulture,funwmy,Zfj3000,Angle Roh,Cabbage,Lweij,鲈鱼,Yixi,精英学生会,Tracy,LuyinT,M id 42323cf54f4c073be2380a13d6020ef4.評論(共13條)
對負強化的解釋有誤。
整理了一下,MBA智庫是可以自由編輯的,若有未完善之處,期待您的參與。
Reinforcement : A consequence that increase the likelihood of a behaviour being repeated; Punishment: A consequence that decrease the likelihood of a behaviour being repeated;
Positive reinforcement: reinforcement involves the presentation of something good/pleasant; Negative reinforcement: reinforcement involves the the removal of something bad/unpleasant.
Positive punishment: punishment involves the presentation of something bad/unpleasant; Negative punishment: punishment involves the removal of something good/pleasant
So the positive reinforcement is differ as the positive punishment.
負強化是指消除令人不愉快或煩惱的因素或環境的反應。在負強化下,個人會增加行為的強度。 但懲罰是為了降低行為的強度,並不是負強化的一種。
通俗了來說,負強化是一種解脫,比方以前你每天下班後要打掃衛生,老闆說你本月業績提高,就可以不打掃了,這是負強化。 懲罰是指你本來不需要打掃,業績下降了,讓你去打掃。
I think this translation quite doubtful, I guess we'd better read the original one.
對負強化的解釋有誤。