全球专业中文经管百科,由121,994位网友共同编写而成,共计436,047个条目

斯金纳的强化理论

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

(重定向自行为强化理论)

斯金纳的强化理论(Skinner's reinforcement theory)

目录

斯金纳的强化理论的主要内容

  强化理论是美国的心理学家和行为科学家斯金纳赫西布兰查德等人提出的一种理论。斯金纳(Burrhus Frederic Skinner)生于1904年,他于1931年获得哈佛大学心理学博士学位,并于1943年回到哈佛大学任教,直到1975年退休。1968年曾获得美国全国科学奖章,是第二个获得这种奖章的心理学家。他在心理学的学术观点上属于极端的行为主义者,其目标在于预测和控制人的行为而不去推测人的内部心理过程和状态。他提出了一种“操作条件反射”理论,认为人或动物为了达到某种目的,会采取一定的行为作用于环境。当这种行为的后果对他有利时,这种行为就会在以后重复出现;不利时,这种行为就减弱或消失。人们可以用这种正强化负强化的办法来影响行为的后果,从而修正其行为,这就是强化理论,也叫做行为修正理论。

  斯金纳所倡导的强化理论是以学习的强化原则为基础的关于理解和修正人的行为的一种学说。所谓强化,从其最基本的形式来讲,指的是对一种行为的肯定或否定的后果(报酬或惩罚),它至少在一定程度上会决定这种行为在今后是否会重复发生。根据强化的性质和目的可把强化分为正强化负强化。在管理上,正强化就是奖励那些组织上需要的行为,从而加强这种行为;负强化是指为了使某种行为不断重复,减少或消除施于其身的某种不愉快的刺激。负强化的方法包括批评、处分、降级等,有时不给予奖励或少给奖励也是一种负强化。正强化的方法包括奖金、对成绩的认可、表扬、改善工作条件人际关系、提升、安排担任挑战性的工作、给予学习和成长的机会等。

  开始,斯金纳也只将强化理论用于训练动物,如训练军犬和马戏团的动物。以后,斯金纳又将强化理论进一步发展,并用于人的学习上,发明了斯金纳的程序教学法和教学机。他强调在学习中应遵循小步子和及时反馈的原则,将大问题分成许多小问题,循序渐进;他还将编好的教学程序放在机器里对人进行教学,收到了很好的效果。

  斯金纳的强化理论和弗隆期望理论都强调行为同其后果之间关系的重要性,但弗隆期望理论较多地涉及主观判断等内部心理过程,而强化理论只讨论刺激和行为的关系。

激励强化理论的前提

  在管理学的研究领域中,斯金纳的强化理论独树一帜。作为美国最杰出的心理学家之一,斯金纳在把科学方法引入心理学上具有里程碑式的地位。

  他根据自己的实验,创造性地发展了巴甫洛夫的条件反射学说和华生的行为主义学说,提出了以操作性条件反射为基础的强化理论。对于管理学来说,强化理论是对激励机制进行科学分析的理论平台。尤为重要的是,斯金纳通过大量实验,对强化的作用机理、强化物的分类与组合、强化的过程分析以及强化的操作技术性设计等,形成了系统的学说。其中的正强化优先观点,在现实管理中得到广泛应用。他发明的“斯金纳箱”,至今仍是进行心理学研究的标志性工具。斯金纳志在改造社会,他关于用强化理论塑造新型人类社会的设想,不仅在学界,而且在民众中产生了巨大的反响,其社会影响远远超出了学术范围。

  斯金纳近乎极端的科学化追求,试图用科学改造人文的思想方法,使他的理论成为学界争议的焦点。而正是这种争议,为包括管理学在内的社会科学发展提供了必要的张力,也为斯金纳奠定了大师级的声望。

  激励管理中的作用人人皆知,但是如何使激励有效,却使许多富有经验的经理也挠头。从经济学的逻辑看,激励能否有效至少取决于以下前提:

  第一,激励所提供的东西是激励接受者所需要的东西,并且能引起激励接受者的获得欲望;

  第二,激励所提供的东西必须具有稀缺性排他性,也就是说要使接受者获得某种独享;

  第三,激励效用是曲线而不是直线,收益和付出的关系有增有减,相关度有大有小有正有负,要合理运用,既不能“过”,也不能“不及”。

  在这些前提下,管理学家们提出过很多激励理论和模型,其中斯金纳提出的“强化理论”至今仍然具有重大的理论和实践意义。

激励强化理论的分类

  强化作用离不开“强化物”。所谓“强化物”(reinforcer)指的是当行为人做出某种行为后带来的后果或者反应对行为人有利时,该结果被称为“强化物”。“强化物”不一定是实物,也可以是氛围、表情、他人的行为等等。由于“强化物”的适时出现,增加了个体以后在相同情形下重复这种行为的概率,这表示“强化物”对于个体的反应起了强化作用。此种强化作用,即称之为“强化”。

  一般来说,强化有两种:正强化负强化。通过某种强化物,能使管理者期望的行为发生概率增大,行为者受到这种强化物的激励,其期望行为的积极性会得到提高,这就是正强化。反过来,通过移除某种强化物,使管理者不期望的行为发生概率降低,行为者因为强化物的缺失,其不期望行为的积极性会消退甚至丧失,这就是负强化。

  正强化

  正强化:又称积极强化。当人们采取某种行为时能从他人那里得到某种令其感到愉快的结果,这种结果反过来又称为推进人们趋向或重复此种行为的力量。例如教师通过设置颁发奖状来激励那些表现优异的学生。

  对正强化物的效用可以从两个层面来理解。一个层面是某一行为如果会带来行为者的愉快和满足,如给予食物、金钱、赞誉和关爱等,行为者就会倾向于重复该行为;另一个层面是某一行为如果能减少和消除行为者的不快和厌恶,如减少噪声、严寒、酷热、电击和责骂等,行为者也会倾向于重复该行为。

  负强化

  负强化:又称消极强化。是指通过中止不愉快条件来增强反应频率。例如罪犯在立功之后对其进行减刑,这样罪犯的立功行为就会受到负强化。

  与此类似,对负强化物的效用照样可以从两个层面来理解。惩罚性强化物和消退性强化物。惩罚性强化物是指会给行为者带来不快的东西,能使行为者的行为倾向减弱;消退性强化物是指减少或取消令行为者愉快的东西,也能使行为者倾向于终止或避免重复该行为。  对正强化物与负强化物的区分,不能想当然,而要以其效果确定。

  比如,限制一个孩子获得某种玩具的欲望,其效果很可能是极大地激发了这个孩子获得这种玩具的行为。现实中某些东西,越禁止反而越流行,实际上这种禁止就起着正强化作用。而不恰当地对某种行为进行言过其实的赞扬,很有可能引起反感而削弱这种行为,赞扬起的是负强化作用。有时候官方树立的先进模范反而收不到正面效果,就是这种机制。一个部下过于明显地逢迎上司,有可能会引起这个上司的反感。这些,都是值得激励研究注意的。

  更有意思的是,有些表面上截然相反的强化物,其强化作用却高度一致。如果对赌博进行强化分析,就不难发现,不论是输是赢,都会起到强烈的正强化作用。赢了,会刺激赌徒继续;输了,还会刺激赌徒继续。所以,单靠赌博本身的输赢,很难消退赌博行为。公司经营中,有些人偏爱投机方式,其中一个重要因素,就是因为投机方式不论后果是成功还是失败,都会产生类似赌博的正强化效应。

  从强化物效用的大小和重要程度来讲,还可以进一步将强化物划分为初级强化物和条件强化物。初级强化物对有机体来说,往往是无条件的,它能满足人和动物的基本生理需要,如食物、水、安全、温暖、性等。条件强化物需要通过初级强化物才能产生作用。任何一个中性刺激物,如果与初级强化物反复联合,它就能使自身获得强化物性质。它是初级强化物的附属品。例如金钱,对小孩它不是强化物,但当小孩知道钱能换糖时,它就能对儿童的行为产生强化效果。在这个例子中,糖果就是初级强化物,而金钱则是条件强化物,金钱的强化作用是由于与糖果的结合才获得的。作为管理者应该注意,初级强化物是最基本的,然而条件强化物是最常用的。二者的匹配和结合方式值得进行深入探讨。

  利用强化的手段改造行为通常三种类型:正强化、负强化、自然消退。

  自然消退:又称衰减。它是指对原先可接受的某种行为强化的撤销。由于在一定时间内不予以强化此行为将自动下降并逐渐消退。例如:上课做鬼脸的同学老师对其进行忽视使该同学感到无趣而自行收敛。

  在此需要对负强化和惩罚进行区分:惩罚是能够减弱行为或降低反应频率的手段包括正惩罚和负惩罚。正惩罚:是指行为之后给予一个厌恶刺激(例如学生犯错老师给予他处分);负惩罚是指行为之后撤销一个积极刺激(例如小孩犯错父母因此不让他和同伴出去玩)。惩罚就是企图呈现消极强化物或者撤销积极强化物去刺激某个反应是一种治标的方法对于被惩罚者和惩罚者都是不利的,它并不能让被惩罚者知道自己该做什么。

正强化

  正强化:给予一个愉快刺激,从而增强其行为出现的概率。

  举例:

  (1)如果学生认真完成作业,就奖励学生去游乐场玩,学生认真完成作业的行为增加。

  (2)如果能够按时到校,就奖励一个玩具,学生按时到校的行为增加。

  (3)某学生为了吸引老师和同学们的注意,上课总喜欢做小动作,一次学生上课扔小纸条,被老师批评后,扔小纸条的行为变本加厉。(被老师批评对于该生来说是一种愉快的刺激)

  (4)“强宝宝”喜欢“马蓉蓉”,“马蓉蓉”为了让“强宝宝”努力学习,就说:“你如果好好学习,我就嫁给你”,“强宝宝”努力学习的行为增加。

负强化

  负强化:摆脱一个厌恶刺激,从而增强其行为出现的概率。

  举例:

  (1)如果学生认真完成作业,就不让打扫卫生,学生认真完成作业的行为增加。

  (2)如果学生积极回答问题,就不让罚站,学生积极回答问题的行为增加。

  (3)戴罪立功:对于接受惩罚的人来说,如果多做一些立功的行为,那么就会减少处罚,因此立功的行为增加。

  (4)坦白从宽:对于犯罪的人来说,如果能够坦白自己的罪行,那么就可以减少处罚,因此坦白的行为增加。

正惩罚

  正惩罚:给予一个厌恶刺激,从而降低其行为出现的概率。

  举例:

  (1)如果学生迟到,就罚打扫卫生,学生迟到的行为减少。

  (2)抗拒从严:对于接受惩罚的人来说,如果抗拒不服的行为太多,那么就会增加处罚,为了减少处罚,因此抗拒的行为会减少。

负惩罚

  负惩罚:撤销一个愉快刺激,从而降低其行为出现的概率。

  举例:

  (1)如果学生经常撒谎,就不让他看电视,那么撒谎的行为就会减少。

  (2)如果学生上课说话,就没收手机,上课说话的行为减少。

消退

  有机体做出以前曾被强化过的反应,如果在这一反应之后不再有强化物相伴,那么,此类反应在将来发生的概率便降低,这称为消退。消退是减少不良行为,消除坏习惯的有效方法。

  举例:对于很多上课捣乱的学生 ,他们这些行为更多是为了引起同伴和老师的注意,要想减少该行为,老师最好的方法就是不予理睬。

激励强化理论与行为的关系

  还有一种特殊情况,强化物与行为之间的关系是非理性的,斯金纳把这种强化行为称为“迷信”(superstition),也称为“非相倚强化”。

  在斯金纳的实验中,假如把给白鼠喂食的方式改为不是按压杠杆引发,而是每隔15秒固定送食一次,那么,白鼠在首次喂食之前的偶然动作就会形成“迷信”。如果白鼠正在作揖,它就会在此后不断作揖以求得食物;如果白鼠正在嗅通气孔,它则会不断嗅通气孔以求得食物。

  人类这种情况也十分多见,比如,天旱引发的祈雨行为,某个运动员对某种动作、某种服饰与获胜之间的看法以及由此而采取的行为等等,都属于迷信。迷信只有在多次无效的情形下,才会逐渐产生操作性消退。但是,只要有偶然性存在,迷信就不能彻底根除。

  要使正负强化能达到各自预期的效果,对强化物的恰当选择是很重要的。一般而言,在使用强化理论之前,首先要弄清是要对行为进行正强化还是进行负强化,然后针对行为者的特点选择恰当的强化物。在选择时,并不是强化物的数量越多越好。

  斯金纳认为,由于强化物的数量与对行为的强化效果不一定成正比例,真正的强化物也可能被误用,因此,合理安排强化措施,比单一追求强化物数量更为重要。这里实际上涉及到了强化物的合理配置问题。为此,斯金纳设计了“强化表”,对强化物合理安排做出了有益尝试。对于现实中的管理者来说,更为重要的不是照搬斯金纳的强化表,而是参照和借鉴斯金纳的思路,根据自己所处的实际情况,尤其是考虑各种特定的环境因素,对强化物的选择、搭配和使用作出符合理性的科学安排。

  此外,强化物效用的大小还与其接受者有关。一种强化能否起到应有的作用,取决于强化物运用是否恰当,而强化物运用是否恰当,又取决于强化物的作用对象接受与否。因此,在选择强化物时必须考虑到行为者的自身特征。比如,提升职务一般能够起到正强化作用,但是,在霍桑实验中曾经发现,某个女工拒绝了上级提升其职务的安排。理由很简单,在这个女工看来,提升职务有可能会破坏她同工友们之间良好的人际关系。对于这个女工而言,工友之间的人际关系,远远要比职务提拔更重要。所以,在多数人身上能起到强化作用的提拔方式,对于这个女工却不是合适的强化物。当然,这个女工对强化物的认知,并不是心血来潮的怪癖,而是环境因素的综合作用在她身上的反应。所以,管理中采用强化措施时,要以对员工状况的科学分析为前提。

激励强化理论的组合运用

  一般而言,强化物的选择至少要考虑到三个方面的因素:

  第一,是管理者所能提供的强化物;

  第二,该强化物是管理对象所能接受的;

  第三,该强化物能够起到应有的强化效果。

  从这三个方面来考虑强化物的选择,或许能找到很多有效的强化物。但人类需求的复杂性和多样性,往往需要更大范围的强化物来进行激励。现实中的强化物,会受到资源稀缺性的限制以及使用成本的限制。

  在这种情况下,可以通过强化物的恰当组合来扩大选择范围。对于管理者来说,弄清这种组合十分重要,因为在最常见的强化物中,金钱总是有限的,即便是有权印发钞票的政府,滥发钞票也会贬值;提拔总是有数的,人人都提拔为经理,名片上的经理就会变成事实上的业务员;一种物品一旦不再稀缺,强化作用就会迅速消失,哪怕是不花成本的微笑,用多了笑脸也会失去激励效应。

  强化物的组合有两种方式:一是把本来就有强化作用的不同事物结合使用,只要恰当配置,可以产生出具有很大效力的强化物;二是把原本没有强化作用的事物按照行为关系结合使用,使它产生强化作用,这就是条件性强化物。条件性强化物的具体做法是,把一个中性刺激物与一个强化刺激物反复匹配联合,那么该中性刺激物就具备了强化的性质和作用。

  条件性强化物本来不具有强化作用。

  例如,在斯金纳的实验中,真正的强化物是食物。但是,如果每次实验都是先打开灯再给鸽子喂食,最后,中性的灯光就会成为条件性强化物。此时,灯光的作用和食物一样,均能使操作条件化。斯金纳指出,中性刺激物要获得这种强化性质,须遵守这样三条规则:一是中性刺激物与初级强化物的联系次数越多,它就越具有强化作用;二是中性刺激物与初级强化物出现的时间不应间隔太长;三是初级强化物如果不再出现,中性刺激物的强化力会迅速消失(类强化物不在此例)。

  如果某种条件性强化物与不止一种初级强化物相匹配,那么该条件性强化物便能通过这些初级强化物而具备多方面的强化作用,从而成为一个“类强化物”,也可称为概括性强化物。就是说,当一个中性物与两个以上的初级强化物形成联系时,它就会发生类化。最典型的例子莫过于金钱,由于它与衣、食、住、行等初级强化物密切联系和匹配,因而具备了广泛的强化作用。斯金纳进一步指出,类强化物因为具有联系的广泛性,即使没有赖以为基础的初级强化物伴随出现,由于它总能同另外的初级强化物发生这样那样的联系,所以,它的强化效果依然存在。

  在这种条件性强化物的组合中,需要注意的是,与中性刺激物相组合的初级强化物必须具有很大的强化力量。如果初级强化物本身没有足够的强化力量,就无法调动行为者的积极性,失去吸引力,与它组合的中性刺激物当然无效。所以,初级强化物存在着强化力的临界点。在这个临界点之上,它能使与其组合的中性刺激物获得强化性质;在这个临界点之下,即使它本身还有一定强化作用,但与其组合的中性刺激物不能获得强化性质。

激励强化理论的强化程式

  在实验中,斯金纳发现强化与行为之间存在着一定的关系。如果强化的时间和比率不同,强化作用的效果也会大不相同。所谓强化程式,就是指反应受到强化的预先安排形式。对此,斯金纳提出了一个著名的强化类型表。

  根据这个强化类型表,一切强化可分为两大类:

  一是连续性强化,即每次行为都受到强化;

  二是间歇性强化,即只是部分行为受到强化。

  间歇性强化又可按照时间和比率的不同分为以下四种:

  ①固定间时强化,强化是定期的,如计时工资

  ②变动间时强化,强化是不定期的,如随时进行的奖励;

  ③固定比率强化,强化按一定比率进行,如营业提成;

  ④变动比率强化,强化按随机比率进行,如彩票得奖、赌博输赢等。

  a.奖励的形式不同:

  固定间隔强化:基于固定时间进行奖励(每周或每月付薪水)

  固定比率强化:奖励与特定数量的行为联系起来(计件工资制)

  可变间隔强化:不定时间给给予奖励(没有事先声明的检查或评价以及每月随

  机给奖励)

  可变比率强化:行为出现若干数量才给予奖励(销售)

  b.对绩效的影响:

  固定间隔强化:导致平均水平的和不规则的绩效

  固定比率强化:迅速导致非常高而且稳定的绩效

  可变间隔强化:导致较高和稳定的绩效

  可变比率强化:导致非常高的绩效

  c.对行为的影响:

  固定间隔强化:行为迅速消退

  固定比率强化:行为较快消除

  可变间隔强化:行为慢慢消除

  可变比率强化:行为消除非常慢

  连续性强化和间歇性强化的效用,从行为的消退角度来看不尽相同。斯金纳的实验表明,间歇性强化停止后产生的反应消退,远远低于数量相同的连续性强化停止后产生的反应消退。例如,如果只是偶然对儿童的良好行为给予强化,在停止强化后,这种良好行为保持的时间,要比每一次良好行为都给予强化保持的时间长得多。斯金纳认为,当手头的强化物很有限时,这一差别具有实际意义。对于管理者来说,弄清间歇性强化与连续性强化在反应消退上的差别,进而弄清不同的间歇性强化在反应消退中的精确数据,对于设计激励方案有着重要作用。

  间歇性强化的各自特点和不同效果如下:

  (1)固定间时强化:固定间时强化每隔一个固定时段进行一次,其效果受强化的大小、数量和及时性的影响。强化越大,数量越多,则反应概率越大。如果反应和强化物出现的时间之间有相当大的间隔,则反应概率较低。这种强化因间隔的固定性,有一定规律可循。因此,在强化物出现后,由于行为者知道短期内不能再得到强化,所以在每次强化之后的区间反应概率较低。当行为者觉得再次强化快要到来时,反应概率又会增加。例如,在计时工资制中,工资定时发放,在这段固定时间中,工人的反应并不会得到强化,工作的水平可能会下降。对于这一问题,可以通过厌恶性的条件强化物(如扣除薪金)来作为工资的补充。

  (2)变动间时强化:变动间时强化可以用来调节行为的发生概率,它能够消除强化物出现后的反应概率降低现象。由于这种强化程式没有一定的时间规律,随机性较大,行为者往往难以琢磨后续强化物出现的时间。因此,在它的作用下,能使行为者保持一个相对稳定的行为水平。

  (3)固定比率强化:斯金纳认为,固定比率强化能产生很高的反应概率。因为在这种程式的刺激下,行为者的反应速率达到固定比率就会得到强化,行为的结果又促使反应速率进一步提高。如果没有其他因素干扰,这种程式能使激励作用达到最大值。值得注意的是,斯金纳强调,采用这种程式的关键在于“比率不是太高”。因为他的研究表明,某一特定的行为人和某一特定的强化指标之间,比率是有限的。超过这一比率,行为就不能保持,而且会出现快速消退。这种情况被斯金纳称为“行为缺失”。之所以会发生行为缺失,是因为行为人的能力和精力是有限的。如果固定比率过高,超出了行为人之所能,那么就会产生两种情况:一是行为人在初始时就无法达到规定的比率;二是在初始时虽然达到了比率,但后来无法持续达到。一旦出现这种情况,肯定发生行为消退。在现实中,某些本来行之有效的业务提成或类似制度,由于后来不断“加码”而导致失效,就属于这种情况。

  (4)可变比率强化:可变比率强化是通过对受到强化的反应与未受到强化的反应之间比率的不确定性运用来进行激励的。这样,行为人对强化的力度(即自己的收益)不可预测。可变比率和固定比率的差别,同变动间时和固定间时的差别在逻辑上是一致的。所以,在理论上,它可以消除固定比率强化后所出现的反应消退现象。这种程式的比率幅度在变,但其平均值不变。所以,行为人的行为有可能得到高强化,也有可能得到低强化,或者很长时间得不到任何强化,而强化的平均值不变。行为人会根据这种随机性来调整自己,保持一种稳定的行为速率。

  斯金纳主张综合使用各种不同的强化程式。可以把比率强化和间时强化、固定强化和可变强化结合使用或者交替使用,从而对行为人的行为进行更好的调节。

  人类的行为,多数是经过强化而形成的操作性行为。也就是说,行为是可塑的。斯金纳把行为的可塑性作为他研究的依据,行为既然有可塑性,也就是说可以促使某种行为发生,或者抵制某种行为出现,这种愿望的实现恰恰是通过强化作用来实现的。与以往的理论不同处在于,斯金纳强调,强化作用不是取决于强化物的有无或大小,而是取决于强化物和行为的联系。相倚性联系的建立是强化不断延续的结果。

激励强化理论的行为强化

  当一种行为发生后带来了强化物,最初的强化刺激就形成了。只要这种行为和强化多次重复,就能形成分辨性刺激,行为主体会自行区分相倚性联系。例如,微笑意味着赞许,而皱眉意味着异议,这种判断就是来自于经验归纳的分辨性刺激。一旦行为主体认知到了相倚性联系,那么这种行为的可操作性就已经建立了。随后,可以通过控制强化的强度和频率来调节行为。假如这种行为是强化实施者所期望的行为,那么通过运用恰当的强化物,这种行为就会得到强化,从而导致这种行为出现的概率增大;反之,假如这种行为不是强化实施者所期望的行为,那么通过不同的强化物,这种行为会受到负强化,从而导致这种行为发生的概率降低,甚至为零。

  依据这个原理,斯金纳认为人的行为是可以塑造的,而其塑造手段是通过强化来进行的。强化的效果,要受强化物种类的选择、强化方式的选择、强化程序的安排等因素影响。要使行为发生的概率增加,可以通过正强化物,使行为者得到这种行为的相应收益,使自己需求得以满足;反之,要使行为发生的概率减少,则可通过相应的负强化物来实现。

强化理论具体应用的行为原则

  (1)经过强化的行为趋向于重复发生。所谓强化因素就是会使某种行为在将来重复发生的可能性增加的任何一种“后果”。例如,当某种行为的后果是受人称赞时,就增加了这种行为重复发生的可能性。

  (2)要依照强化对象的不同采用不同的强化措施。人们的年龄、性别、职业、学历、经历不同,需要就不同,强化方式也应不一样。如有的人更重视物质奖励,有的人更重视精神奖励,就应区分情况,采用不同的强化措施。

  (3)小步子前进,分阶段设立目标,并对目标予以明确规定和表述。对于人的激励,首先要设立一个明确的、鼓舞人心而又切实可行的目标,只有目标明确而具体时,才能进行衡量和采取适当的强化措施。同时,还要将目标进行分解,分成许多小目标,完成每个小目标都及时给予强化,这样不仅有利于目标的实现,而且通过不断的激励可以增强信心。如果目标一次定得太高,会使人感到不易达到或者说能够达到的希望很小,这就很难充分调动人们为达到目标而做出努力的积极性。

  (4)及时反馈。所谓及时反馈就是通过某种形式和途径,及时将工作结果告诉行动者。要取得最好的激励效果,就应该在行为发生以后尽快采取适当的强化方法。一个人在实施了某种行为以后,即使是领导者表示“已注意到这种行为”这样简单的反馈,也能起到正强化的作用。

  如果领导者对这种行为不予注意,这种行为重复发生的可能性就会减小以至消失。所以,必须利用及时反馈作为一种强化手段。强化理论并不是对职工进行操纵,而是使职工有一个最好的机会在各种明确规定的备择方案中进行选择。因而,强化理论已被广泛地应用在激励和人的行为的改造上。

  (5)正强化比负强化更有效。所以,在强化手段的运用上,应以正强化为主;同时,必要时也要对坏的行为给以惩罚,做到奖惩结合。

  强化理论只讨论外部因素或环境刺激对行为的影响,忽略人的内在因素和主观能动性对环境的反作用,具有机械论的色彩。但是,许多行为科学家认为,强化理论有助于对人们行为的理解和引导。因为,一种行为必然会有后果,而这些后果在一定程度上会决定这种行为在将来是否重复发生。那么,与其对这种行为和后果的关系采取一种碰运气的态度,就不如加以分析和控制,使大家都知道应该有什么后果最好。这并不是对职工进行操纵,而是使职工有一个最好的机会在各种明确规定的备择方案中进行选择。因而,强化理论已被广泛地应用在激励和人的行为的改造上。

  对强化理论的应用,要考虑强化的模式,并采用一整套的强化体制。

  强化模式主要由“前因”、“行为”和“后果”三个部分组成。

  “前因”是指在行为产生之前确定一个具有刺激作用的客观目标,并指明哪些行为将得到强化,如企业规定车间安全生产中每月的安全操作无事故定额。

  “行为”是指为了达到目标的工作行为。

  “后果”是指当行为达到了目标时,则给予肯定和奖励;当行为未达到目标时,则不给予肯定和奖励,甚至给予否定或惩罚,以求控制职工的安全行为。

强化的类型

  1、强化包括正强化、负强化和自然消退三种类型:

  第一种:正强化,又称积极强化。当人们采取某种行为时,能从他人那里得到某种令其感到愉快的结果,这种结果反过来又成为推进人们趋向或重复此种行为的力量。例如,企业用某种具有吸引力的结果(如奖金、休假、晋级、认可、表扬等),以表示对职工努力进行安全生产的行为的肯定,从而增强职工进一步遵守安全规程进行安全生产的行为。

  第二种:负强化,又称消极强化。它是指通过某种不符合要求的行为所引起的不愉快的后果,对该行为予以否定。若职工能按所要求的方式行动,就可减少或消除令人不愉快的处境,从而也增大了职工符合要求的行为重复出现的可能性。例如,企业安全管理人员告知工人不遵守安全规程,就要受到批评,甚至得不到安全奖励,于是工人为了避免此种不期望的结果,而认真按操作规程进行安全作业。

  惩罚是负强化的一种典型方式,即在消极行为发生后,以某种带有强制性、威慑性的手段(如批评、行政处分、经济处罚等)给人带来不愉快的结果,或者取消现有的令人愉快和满意的条件,以表示对某种不符合要求的行为的否定。

  第三种:自然消退,又称衰减。它是指对原先可接受的某种行为强化的撤消。由于在一定时间内不予强化,此行为将自然下降并逐渐消退。例如,企业曾对职工加班加点完成生产定额给予奖酬,后经研究认为这样不利于职工的身体健康和企业的长远利益,因此不再发给奖酬,从而使加班加点的职工逐渐减少。

  正强化是用于加强所期望的个人行为;负强化和自然消退的目的是为了减少和消除不期望发生的行为。这三种类型的强化相互联系、相互补充,构成了强化的体系,并成为一种制约或影响人的行为的特殊环境因素。

  强化的主要功能,就是按照人的心理过程和行为的规律,对人的行为予以导向,并加以规范、修正、限制和改造。它对人的行为的影响,是通过行为的后果反馈给行为主体这种间接方式来实现的。人们可根据反馈的信息,主动适应环境刺激,不断地调整自己的行为。

  2、 积极强化律

  有几种因素,具有能影响积极强化权变措施强度效果的潜力。可以笼统地把这此因素当作“定律”,因为它们有助于解释最佳强化的条件。

  (1)权变强化律。按照权变强化律,为了使某项强化措施取得最大效果,该强化措施必须只有在所想要的目标行为完成之后才采用。这是强化措施必需取决于职工行为的另一种说法。因此,按照此律,如果所想要的行为未完成而采用了某个强化措施,该强化措施就没有效果。要想确定是否遵循了此规律,只要问这个问题:该强化措施只是在目标行为发生时才采取的吗?

  (2)及时强化律。及时强化律说明,目标行为发生后,强化措施采取得越及时,则该强化措施对这一行为今后发生次数的影响便越大。一般说来,强化措施的采取应当尽实际可能与目标、行为的完成相一致。

  3、强化规模律。强化措施的数量或规模也会有影响。强化规模律是说,在某一目标行为发生之后,所采取的强化措施,其数量越大,则该强化措施对反应率的影响也越大。不过强化措施的数量或规模是相对的。重要的是应确定,强化的数量是否值得。对某一个人来说是大的强化措施,对另一个人则可能小了。

  4、强化疏化律。最后一条是强化疏化律,它说的是,使一个人对某一强化措施越疏化,越难于得到,越稀罕,这种强化措施对该项目标行为在未来的出现越具有影响。

强化理论的应用

  在企业安全管理中,应用强化理论来指导安全工作,对保障安全生产的正常进行可起到积极作用。在实际应用中,关键在于如何使强化机制协调运转并产生整体效应,为此,应注意以下五个方面:

  第一,应以正强化方式为主。在企业中设置鼓舞人心的安全生产目标,是一种正强化方法,但要注意将企业的整体目标和职工个人目标、最终目标和阶段目标等相结合,并对在完成个人目标或阶段目标中做出明显绩效或贡献者,给予及时的物质和精神奖励(强化物),以求充分发挥强化作用。

  第二,采用负强化(尤其是惩罚)手段要慎重。负强化应用得当会促进安全生产,应用不当则会带来一些消极影响,可能使人由于不愉快的感受而出现悲观、恐惧等心理反应,甚至发生对抗性消极行为。因此,在运用负强化时,应尊重事实,讲究方式方法,处罚依据准确公正,这样可尽量消除其副作用。将负强化与正强化结合应用一般能取得更好的效果。

  第三,注意强化的时效性。采用强化的时间对于强化的效果有较大的影响。一般而论,强化应及时,及时强化可提高安全行为的强化反应程度,但须注意及时强化并不意味着随时都要进行强化。不定期的非预料的间断性强化,往往可取得更好的效果。

  第四,因人制宜,采用不同的强化方式。由于人的个性特征及其需要层次不尽相同,不同的强化机制和强化物所产生的效应会因人而异。因此,在运用强化手段时,应采用有效的。强化方式,并随对象和环境的变化而相应调整。

  第五,利用信息反馈增强强化的效果。信息反馈是强化人的行为的一种重要手段,尤其是在应用安全目标进行强化时,定期反馈可使职工了解自己参加安全生产活动的绩效及其结果,既可使职工得到鼓励,增强信心,又有利于及时发现问题,分析原因,修正所为。

组织行为修正

  1)组织行为修正:指将强化理论系统应用于对组织成员的行为塑造,培养组织需要的行为,减少或消除组织不需要的行为

  2)它包含5个步骤:

  a.辨别关键行为:明确哪些行为应该得到强化

  b.衡量关键行为:确定目标基线水平,进行基线测量,为关键行为提供客观频率数据

  c.行为起因分析:确定关键行为的起因后果,即ABC行为管理法

  d.选择修正策略:侧重正强化,消退,尽可能不用负强化,惩罚

  e.评价绩效是否已经得到提高,包括:反应,学习,行为改变,绩效产生 状态型激励

强化理论对管理实践的启示

  强化理论对管理实践有重要的指导作用:

  1)奖励与惩罚相结合。即对正确的行为,对有成绩的个人或群体给予适当的奖励;同时,对于不良行为,对于一切不利于组织工作的行为则要给予处罚。大量实践证明,奖惩结合的方法优于只奖不罚或只罚不奖的方法。

  2)以奖为主,以罚为辅。强调奖励与惩罚并用,并不等于奖励与惩罚并重,而是应以奖为主,以罚为辅,因为过多运用惩罚的方法,会带来许多消极的作用,在运用时必须慎重。

  3)及时而正确强化。所谓及时强化是指让人们尽快知道其行为结果的好坏或进展情况,并尽量的予以相应的奖励,而正确强化就是要“赏罚分明”,即当出现良好行为时就给予适当的奖励,而出现不良行为时就给予适当的惩罚。及时强化能给人们以鼓励,使其增强信心并迅速的激发工作热情,但这种积极性的效果是以正确强化为前提的:相反,乱赏乱罚决不会产生激励效果。

  4)奖人所需,形式多样。要使奖励成为真正强化因素,就必须因人制宜地进行奖励。每个人都有自己的特点和个性,其需要也各不相同,因而他们对具体奖励的反应也会大不一样。所以奖励应尽量不搞一刀切,应该奖人之所需,形式多样化,只有这样才能起到奖励的效果。

强化在教学中的运用[1]

  强化在教学中的运用要使强化发挥对学生行为的积极促进作用,需重视以下问题:

  1.影响强化效果的因素。

  ①学生的积极性和主动性———强化的前提条件和基础。

  只有当学生主动地去认识强化时,才能领会教师的要求和期待,进而改进行为方式,使强化所提供的信息发生作用效果。也就是说,一切外部强化都要通过学生自身的内部活动才能被接受,“外因通过内因起作用”。缺少学生积极参与的强化将失去价值。

  ②教师的威信———有效强化的重要条件。

  威信是教师使学生感到尊敬而信服的精神感召力量。威信使学生感到教师亲切,能信赖,并自觉服从于教师。所谓“亲其师,信其道”,由亲和信而发自内心主动地接受教师“传道授业解惑”;由亲和信,产生情感共鸣,同忧乐,共好恶。

  ③强化物的性质———有效强化的必要条件。

  强化物是进行强化所采用的各种方式手段的总称。一般而言,肯定性的强化物(表扬的话、亲切的笑容、满意的表情、奖品、竖起的大姆指,作业本的一朵小红花等)有利于学生积极地接受和内化教师的要求;而否定性的强化物(批评的尖刻的字词、失望的神情、冷笑、嘲弄等)让学生紧张,产生心理压力(焦虑、烦燥、不安、忧郁、甚至攻击性行为)。虽然否定性强化物也有助于学生减少或改变某种行为。但其负面影响比肯定性强化物更为严重,故强化中以使用肯定性强化物为主,否定性强化物为辅。

  2.有效强化的基本原则。

  强化的原则指教学中对学生行为进行强化时所必须遵循的基本要求。

  (1)一致性原则,指教师对学生强化的内容、性质、标准要坚持一致,强化所提供的各种反馈信息要前后一致,避免相互矛盾。如某教师对学生的行为作出肯定性评价,而另一教师却对学生的这一行为作出否定性评价;或是某教师今天表扬了学生的这一行为,明天又批评这一行为。如此这般,让学生无所适从,不知所措。因此,强化要坚持一致性原则。教师首先得消除没有目的性的随心所欲的评价行为,克服不良情绪对强化的干扰。

  其次,教师要保证标准和方向上的统一。教师不能嘴上说好,行为、表情表现却是根本瞧不起;或嘴上说不好,而心理上赞赏不已并流露于言谈举止中。这种不一致,造成学生迷惑、混乱。最后,加强教师之间的沟通联系,确定共同的强化标准,形成教育的“合力”。

  (2)客观性原则,指强化要客观公正,科学合理,不能主观臆断,以致使强化不符合实际情况。只有客观科学地强化,才能切实反映学生的行为,使他们心悦诚服,调动起学习的积极性,违反此原则就会扭曲强化的意义。强调客观性原则:

  第一,要提高教师的评价水平,以达到强化的准确与恰当。

  第二,避免主观因素的干扰,特别是成见效应。教师不能以自已的主观意愿和偏见来评价学生。

  第三,以发展的观点来指导强化。学生是发展中的人。强化的某一种形式也不是放之四海皆准的。强化要有针对性,着眼于学生的动态发展。好的学生也会有不佳的行为表现,而差的学生也有好的行为表现。只要比过去有了进步,都应予以肯定;比过去有了退步,都应予以否定。

  第四,热爱学生,热爱教育工作。崇高的责任心和义务感能使教师关心、尊重、信任学生,重视学生主观能动性的发挥,把学生作为教育过程和强化过程中的主体,积极发挥强化的积极影响,减少负面影响、强化是促使学生行为进步的手段,并非整人的工具。

  (3)及时性原则,指教师在学生行为反应后及时给予信息反馈,以提高学生对强化的认识和理解。大量的科学实验和实践经验证明,教师提供反馈愈及时、具体、明确,则对行为的强化效果愈佳。及时的强化利于学生行为与强化之间建立直接联系,避免无关因素的干扰。如果某行为与强化之间间隔过长,介入一些不相关的行为和刺激,则使强化的指向不明,对行为的影响作用混淆紊乱。这要求评价要及时、明确。教师工作要细致、全面、及时发现问题,提出明确的要求做到查缺补漏,适时恰当。

  (4)效能性原则,指教学中教师要充分发挥强化对行为积极有效的影响。尽量减少对学生发展的负面影响。不论肯定性的或否定性的评价对学生都有利有弊。过多的肯定性评价可增强学生的信心和相应行为,但滋生傲慢、自满的心理,过多的否定性评价,能减弱或改变某些行为,产生消极的心理。

强化理论的评价[2]

  强化理论有助于对人们行为的理解和引导。因为,一种行为必然会有后果,而这些后果在一定程度上会决定这种行为是否重复发生。管理人员的职责就在于通过正负强化手段去控制和影响职工的自愿行为。为此,管理人员为使某种行为重复出现,就应采取正强化的办法反复加以控制。如果要消除某些不利行为,就采取负强化的办法使之削弱。这种控制和改造职工的行为,并不是对职工进行操纵,相反,它使职工有一个最好的机会在各种明确规定的备择方案中进行选择。

  但是,强化理论所说的控制,主要是指从外部加给人的环境因素。至于这种外部因素如何通过人的认识和心理而起作用,强化理论则没有着重地加以说明。

参考文献

  1. 余江敏.斯金纳的强化理论及其在教学中的运用.曲靖师范学院学报.2001年第01期
  2. 张云龄.第八节 斯金纳的“强化理论”.《外国管理理论简编》
本条目对我有帮助286
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目投诉举报

评论(共13条)

提示:评论内容为网友针对条目"斯金纳的强化理论"展开的讨论,与本站观点立场无关。
221.10.12.* 在 2009年9月16日 21:03 发表

对负强化的解释有误。

回复评论
Angle Roh (Talk | 贡献) 在 2009年9月19日 17:48 发表

221.10.12.* 在 2009年9月16日 21:03 发表

对负强化的解释有误。

整理了一下,MBA智库是可以自由编辑的,若有未完善之处,期待您的参与。

回复评论
58.213.116.* 在 2010年1月21日 11:16 发表

心理学认为,负强化是指通过减少行为结果所带来的不了后果或惩罚,从而减少此种行为的发生而增加林总期望行为的发生。

回复评论
222.84.74.* 在 2011年4月1日 23:12 发表

把负强化和惩罚混淆了

回复评论
122.59.5.* 在 2011年5月3日 11:36 发表

Reinforcement : A consequence that increase the likelihood of a behaviour being repeated; Punishment: A consequence that decrease the likelihood of a behaviour being repeated;

Positive reinforcement: reinforcement involves the presentation of something good/pleasant; Negative reinforcement: reinforcement involves the the removal of something bad/unpleasant.

Positive punishment: punishment involves the presentation of something bad/unpleasant; Negative punishment: punishment involves the removal of something good/pleasant

回复评论
Weiji120 (Talk | 贡献) 在 2011年5月3日 17:27 发表

So the positive reinforcement is differ as the positive punishment.

回复评论
117.23.6.* 在 2011年9月14日 21:36 发表

负强化是指消除令人不愉快或烦恼的因素或环境的反应。在负强化下,个人会增加行为的强度。 但惩罚是为了降低行为的强度,并不是负强化的一种。

回复评论
203.188.235.* 在 2011年12月30日 19:33 发表

对 负强化和 惩罚不是同一种 负强化和正强化归在一类 惩罚和消极在另外一类

回复评论
121.18.213.* 在 2012年12月18日 13:30 发表

通俗了来说,负强化是一种解脱,比方以前你每天下班后要打扫卫生,老板说你本月业绩提高,就可以不打扫了,这是负强化。 惩罚是指你本来不需要打扫,业绩下降了,让你去打扫。

回复评论
218.14.228.* 在 2012年12月18日 23:01 发表

负强化不应该和惩罚混为一体吧。。。。。负强化应该是减弱强化的吧。。。。

回复评论
61.227.126.* 在 2015年1月30日 04:29 发表

負強化:移除期望的負面效果 懲罰:給予不期望的負面效果

回复评论
向东已 (Talk | 贡献) 在 2015年11月10日 10:51 发表

回复评论
144.32.240.* 在 2016年2月3日 05:30 发表

I think this translation quite doubtful, I guess we'd better read the original one.

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成

官方社群
下载APP

闽公网安备 35020302032707号