网站地图
强化理论

强化理论是过程型激励理论之一。由美国心理学家斯金纳首先提出。认为人的行为是对其所获刺激的函数。如果这种刺激对他有利,则这种行为就会重复出现;若对他不利,则这种行为就会减弱直至消失。因此管理者要采取各种强化方式,以使人们的行为符合组织的目标。根据强化的性质和目的,可以分为正强化和负强化两大类型。 [1]

强化理论是美国的心理学家和行为科学家斯金纳、赫西、布兰查德等人提出的一种理论,也称为行为修正理论或行为矫正理论。斯金纳于1931年获得哈佛大学的心理学博士学位,并于1943年回到哈佛大学任教,直到1975年退休。1968年曾获得美国全国科学奖章,是第二个获得这种奖章的心理学家。斯金纳认为人是没有尊严和自由的,人们作出某种行为,不做出某种行为,只取决于一个影响因素,那就是行为的后果。他提出了一种“操作条件反射”理论,认为人或动物为了达到某种目的,会采取一定的行为作用于环境。当这种行为的后果对他有利时,这种行为就会在以后重复出现;不利时,这种行为就减弱或消失。人们可以用这种正强化或负强化的办法来影响行为的后果,从而修正其行为。 [2]

最早提出强化概念的是俄国著名的生理学家巴甫洛夫,在巴甫洛夫经典条件反射中,强化指伴随于条件刺激物之后的无条件刺激的呈现,是一个行为前的、自然的、被动的、特定的过程。而在斯金纳的操作条件反射中,强化是一种人为操纵,是指伴随于行为之后以有助于该行为重复出现而进行的奖罚过程。 [2]

巴甫洛夫等的实验对象的行为是刺激引起的反应,称为“应答性反应( respondents) ”。而斯金纳的实验对象的行为是有机体自主发出( emitted) 的, 称为“操作性反应( operant) ”。经典条件作用只能用来解释基于应答性行为的学习,斯金纳把这类学习称为“S( 刺激) 类条件作用”。另一种学习模式,即操作性或工具性条件作用的模式,则可用来解释基于操作性行为的学习,他称为“R( 强化) 类条件作用”,并称为“S-R” 心理学理论。 [2]

这种理论观点主张对激励进行针对性的刺激,只看员工的行为和结果之间的关系,而不是突出激励的内容和过程。该理论认为人的行为是其所获刺激的函数。如果这种刺激对他有利,则这种行为就会重复出现,若对他无利,这种行为就会减弱直至消逝。 [2]

按照强化物的性质来分

斯金纳根据强化物的性质,把强化分为积极强化(positive reinforcement)和消极强化(negative rein-forcement)(阳性强化和阴性强化或正强化和负强化)。积极强化是指由于一刺激物在个体作出某种反应(行为)后出现从而增强了该行为(反应)发生的概率,该刺激物称为积极强化物。消极强化是指由于一刺激物在个体作出某种反应(行为)后而予以排除从而增强了该行为发生的概率,该刺激物称为消极强化物。 [2]

积极强化物同消极强化物在性质上的区别表现在:两者的区分不能仅从字面意义去理解,而应从该刺激物的出现是增强了行为(反应)发生的概率还是降低了行为(反应)发生的概率这一结果上去判断。如果该刺激物的出现增强了行为(反应)发生的概率或该刺激物撤消降低了行为(反应)发生的概率,则该刺激物为积极强化物,反之为消极强化物。 [2]

人类行为受强化影响的程度

斯金纳根据人类行为受强化影响的程度,把强化分为一级强化和二级强化。一级强化是指满足人和动物生存、繁衍等基本生理需要的强化。一级强化物如食物、水、安全、温暖、性等。二级强化是指任何一个中性刺激如果与一级强化物反复联合,它就能获得自身的强化性质。二级强化物如金钱、学历、关注、赞同等,这些二级强化物初时并不具有强化的作用,而是由于它们同诸如食物、性欲之类的一级强化物相匹配而具有了强化的作用。 [2]

根据行为和强化间间隔时间来分

斯金纳和同事们在研究什么条件下强化能发挥最佳作用时,根据行为发生与强化物出现间隔的时间,把强化分为连续式强化(也称即时强化)和间隔式强化(也称延缓强化)。 [2]

连续式强化是指对每一次或每一阶段的正确反应予以强化,就是说当个体作出一次或一段时间的正确反应后,强化物即时到来或撤去。 [2]

间隔式强化是指行为发生与强化物的出现或撤去之间有一定的时间间隔或按比率出现或撤去。间隔式强化分为时间式和比率式。时间式又分为定时距式强化和变时距式强化。比率式又分为定比率式强化和变比率式强化。定时距式强化就是每次过一定时间间隔之后给予强化。 [2]

内容

开始斯金纳也只将强化理论用于训练动物,如训练军犬和马戏团的动物。以后,斯金纳又将强化理论进一步发展,并用于人的学习上。他强调在学习中应遵循小步子和及时反馈的原则,将大问题分成许多小问题,循序渐进;他还将编好的教学程序放在机器里对人进行教学,发明了程序教学法和教学机,收到了很好的效果。 [2]

斯金纳认为行为之所以发生变化,是由于强化作用的结果,人的学习是否成立关键在于强化。当一个操作发生之后,紧接着呈现一个强化刺激时,那么,这个操作的强度(概率)就增加。这里所增加的不是刺激-反应的联结(因为操作不需要特定的激发性刺激),而是使反应发生的一般倾向性增强,即反应发生的概率增强了。他认为在学习中,练习虽然是重要的,但关键的变量却是强化。练习本身并不提高速率,它只是为进一步强化提供机会。不过,他对强化的解释与巴甫洛夫的解释不同。他认为凡能增强反应概率的刺激,这可叫做条件的、二级的、后继的或派生的强化物。这后继的强化物可以在它同反应重复联合而无原始的、一级的强化物时归于消失。他认为,后继强化物容易发生泛化,后继强化物同原始的强化物发生联合时,就可以引起种种不同的活动。例如金钱可以使各种行为起到强化的作用。在斯金纳看来,教育就是塑造行为,成功的教学和训练的关键就是分析强化的效果以及设计精密的操纵强化过程的技术。他说:"只要我们安排好一种被称为强化的特殊形式的后果,我们的技术就会容许我们几乎随意地塑造一个有机体的行为"。 [2]

B.F.斯金纳在《语言行为》一书中以对动物进行的操作性条件反射实验为基础,认为儿童获得言语主要靠后天学习,也与学习其它行为一样,是通过操作性条件反射来实现的。言语的操作性条件反射建筑在由环境引起的声音和声音连结的选择性强化的基础上。如婴儿在咿呀学语时,父母或其他人总是高兴地对着他们咿呀作答,就强化了他们的言语行为;当婴儿发出接近成人的语音时,成人又会对这些发音强化,使这些声音逐渐在儿童发声中占优势,于是婴儿就逐渐从没有含义的咿呀学语过渡到富有意义的言语。E.L.桑代克把这种学习称为“咿呀学语侥幸成功”。强化论者莫勒(O.H.Mowrer)认为,儿童是通过模仿-强化的模式来学习语言的。儿童模仿成人的发声常常与需要得到满足和愉快相联系,模仿就得到强化。强化理论还认为,儿童掌握语言结构是按照刺激-反应的公式产生的行为。儿童可通过一类言语反应的类化建立起某种语言结构与言语反应类别之间的联系。如一个孩子习得了"宝宝的鞋"、"宝宝的糖"、"宝宝的枪"这类反应后,他就理解了并能使用"宝宝的--"这种语言结构,以后能把新词填入已习得的这个语言结构中去。 [2]

强化物

凡是能增强反应概率的刺激和事件都叫强化物,反之,在反应之后紧跟一个讨厌的刺激,从而导致反应率下降,则是惩罚。强化又分为积极强化和消极强化,积极强化通过呈现刺激增强反应概率,消极强化通过中止不愉快条件来增强反应概率。 [2]

强化还可划分为一级强化和二级强化两类。一级强化满足人和动物的基本生理需要,如食物、水、安全、温暖、性等。二级强化是指任何一个中性刺激如果与一级强化反复联合,它就能获得自身的强化性质。包括社会强化(社会接纳、微笑)、信物(钱、级别、奖品等)和活动(自由地玩、听音乐、旅游等)。如金钱,对婴儿它不是强化物,但当小孩知道钱能换糖时,它就能对儿童的行为产生效果。再如分数,也是在受到教师的注意后才具有强化性质的。 [2]

在强化时,可以使用这样一个原则普雷马克原理(Premack Principle),即用高频的活动作为低频活动的强化物,或者说用学生喜爱的活动去强化学生参与不喜爱的活动。如“你吃完这些青菜,就可以去玩。”如果一个儿童喜爱做航空模型而不喜欢阅读,可以让学生完成一定的阅读之后去做模型,等等。 [2]

强化的程式

强化的程式是指反应在什么时候或多频繁地受到强化。每一种不同的程式都产生相应的反应模式。连续程式的强化在教新反应时最为有效。间隔式强化又称部分强化,它比起连续程式具有较高的反应率和较低的消退率。定时距式由于有一个时间差,随之以较低的反应率,但在时间间隔的未了反应率上升,出现一种扇贝效应(见图)。学生在期终考试前临时抱佛脚就证明了这一点。定比率式对稳定的反应率比较有益,而变比率式则对维持稳定和高反应率最为有效。 [2]

在实际教育中,不想要的行为常常不明智地受到了强化。一个教师可能正在作间隔式的强化,一次侥幸就会使学生永远记住这个行为,学生认识到如果他们一直恳求教师,教师就会最终答应他们的要求。 [2]

下面是一些强化程式原则:

1.教新任务时,进行即时强化,不要进行延缓强化。在行为主义学习理论中有一条重要的原理就是,后果紧跟行为比后果延缓要有效得多。即时反馈有两个作用:首先是使行为和后果之间的联系更为明确,其次它增加了反馈的信息价值。

2.在任务的早期阶段,强化每一个正确的反应,随着学习的发生,对比较正确的反应优先强化,逐渐地转到间隔式强化。

3.强化要保证做到朝正确方向促进或引导。不要坚持一开始就做到完美。不要强化不希望的行为。

内容

所谓强化是指增强某人前面的某种行为重复出现次数的一种权变措施。现代的S-R心理学家不仅用强化来解释操作学习的发生,而且也用强化来解释动机的引起。人类从事的众多有意义的行为都是操作性强化的结果,例如许多步行上学、读书写字、回答问题等等。斯金纳强化理论认为在操作条件作用的模式下, 如果一种反应之后伴随一种强化,那么在类似环境里发生这种反应的概率就增加。而且,强化与实施强化的环境一起,都是一种刺激, 人们可以以此来控制反应。因此,管理人员就可以通过强化的手段,营造一种有利于组织目标实现的环境和氛围,以使组织成员的行为符合组织的目标。 [2]

方式

根据强化的性质和目的可把强化分为正强化和负强化。在管理上,正强化就是奖励那些组织上需要的行为,从而加强这种行为;负强化就是惩罚那些与组织不兼容的行为,从而削弱这种行为。正强化的方法包括奖金、对成绩的认可、表扬、改善工作条件和人际关系、提升、安排担任挑战性的工作、给予学习和成长的机会等。负强化的方法包括批评、处分、降级等,有时不给予奖励或少给奖励也是一种负强化。 [2]

强化的具体方式有四种: [2]

1、正强化。就是奖励那些符合组织目标的行为,以便使这些行为得以进一步的加强、重复出现。

2、惩罚。当员工出现一些不符合组织目标的行为时,采取惩罚的办法,可以约束这些行为少发生或不再发生。惩罚是力图使所不希望的行为逐渐削弱,甚至完全消失。

3、负强化,负强化强调的是一种事前的规避。俗语“杀鸡儆猴”形象说明了两者的联系与区别。对出现了违规行为的“鸡”加以惩罚,意欲违规的“猴”会从中深刻地意识到组织规定的存在,从而加强对自己行为的约束。

4、忽视,就是对已出现的不符合要求的行为进行“冷处理”,达到“无为而治”的效果。

斯金纳的强化理论和弗隆的期望理论都强调行为同其后果之间关系的重要性,但弗隆的期望理论较多地涉及主观判断等内部心理过程,而强化理论只讨论刺激和行为的关系。强化的主要功能,就是按照人的心理过程和行为的规律,对人的行为予以导向,并加以规范、修正、限制和改造。它对人的行为的影响,是通过行为的后果反馈给行为主体这种间接方式来实现的。人们可根据反馈的信息,主动适应环境刺激,不断地调整自己的行为。 [2]

原则

1、要依照强化对象的不同采用不同的强化措施。人们的年龄、性别、职业、学历、经历不同,需要就不同,强化方式也应不一样。

2、小步子前进,分阶段设立目标,并对目标予以明确规定和表述。对于人的激励,首先要设立一个明确的、鼓舞人心而又切实可行的目标,只有目标明确而具体时,才能进行衡量和采取适当的强化措施。同时,还要将目标进行分解,分成许多小目标,完成每个小目标都及时给予强化,这样不仅有利于目标的实现,而且通过不断的激励可以增强信心。如果目标一次定得太高,会使人感到不易达到或者说能够达到的希望很小,这就很难充分调动人们为达到目标而做出努力的积极性。 [2]

3、及时反馈。所谓及时反馈就是通过某种形式和途径,及时将工作结果告诉行动者。要取得最好的激励效果,就应该在行为发生以后尽快采取适当的强化方法。一个人在实施了某种行为以后,即使是领导者表示“已注意到这种行为”这样简单的反馈,也能起到正强化的作用。如果领导者对这种行为不予注意,这种行为重复发生的可能性就会减小以至消失。所以,必须利用及时反馈作为一种强化手段。 [2]

4、消不固定时间和频率间隔的强化效果好。因为有机体在强化到来之前的反应率有所提高。在这样的强化程序下,个体不知道什么时候会出现强化,但总有一种强化即将出现的期待。长此以往自然会形成习惯。也就是说, 全部强化的结果,如果不继续强化,反应就消失了。反过来,部分强化的,即使后来不强化时,反应仍不会减弱。显然不强化竟会起积极作用。用拟人的话来表达,不强化会起着警戒作用,即遇到没有强化的条件时,强化会使人学习到,一时没有结果以后还是有结果的。所以不强化同样可以收到学习的效果。全部强化,没有失败的教训,遇到挫折便不会继续努力了,反而引到消极。 [2]

5、正强化比负强化更有效。负强化及惩罚可以引起一定副作用。斯金纳通过系统的实验观察得出了一条重要结论:惩罚就是企图呈现消极强化物或排除积极强化物去刺激某个反应,仅是一种治标的方法,它对被惩罚者和惩罚者都是不利的。他的实验证明,惩罚只能暂时降低反应率,而不能减少消退过程中反应的总次数。在他的实验中,当白鼠已牢固建立按杠杆得到食物的条件反射后,在它再按杠杆时给予电刺激,这时反应率会迅速下降。如果以后杠杆不带电了,按压率又会直线上升。所以,在强化手段的运用上,应以正强化为主;同时,必要时也要对坏的行为给以惩罚,做到奖惩结合。 [2]

应用

对强化理论的应用,要考虑强化的模式,并采用一整套的强化体制。强化模式主要由“前因”、“行为”和“后果”三个部分组成。“前因”是指在行为产生之前确定一个具有刺激作用的客观目标,并指明哪些行为将得到强化,如企业规定车间安全生产中每月的安全操作无事故定额。“行为”是指为了达到目标的工作行为。“后果”是指当行为达到了目标时,则给予肯定和奖励;当行为未达到目标时,则不给予肯定和奖励,甚至给予否定或惩罚,以求控制职工的安全行为。 [2]

强化理论有助于对人们行为的理解和引导。因为,一种行为必然会有后果,而这些后果在一定程度上会决定这种行为在将来是否重复发生。那么,与其对这种行为和后果的关系采取一种碰运气的态度,就不如加以分析和控制,使大家都知道应该有什么后果最好。这并不是对职工进行操纵,而是使职工有一个最好的机会在各种明确规定的备择方案中进行选择。因而,强化理论已被广泛地应用在激励和人的行为的改造上。在管理实践中,正强化和负强化的使用并不能简单化和绝对化。关于正强化和负强化的使用,从来自一个日本企业的以下调查中大家或许能得到一些启发: [2]

在企业安全管理中,应用强化理论来指导安全工作,对保障安全生产的正常进行可起到积极作用。在实际应用中,关键在于如何使强化机制协调运转并产生整体效应,为此,应注意以下五个方面:

1、应以正强化方式为主。在企业中设置鼓舞人心的安全生产目标,是一种正强化方法,但要注意将企业的整体目标和职工个人目标、最终目标和阶段目标等相结合,并对在完成个人目标或阶段目标中做出明显绩效或贡献者,给予及时的物质和精神奖励(强化物),以求充分发挥强化作用。

2.、采用负强化(尤其是惩罚)手段要慎重。负强化应用得当会促进安全生产,应用不当则会带来一些消极影响,可能使人由于不愉快的感受而出现悲观、恐惧等心理反应,甚至发生对抗性消极行为。因此,在运用负强化时,应尊重事实,讲究方式方法,处罚依据准确公正,这样可尽量消除其副作用。将负强化与正强化结合应用一般能取得更好的效果。

3、注意强化的时效性。采用强化的时间对于强化的效果有较大的影响。一般而论,强化应及时,及时强化可提高安全行为的强化反应程度,但须注意及时强化并不意味着随时都要进行强化。不定期的非预料的间断性强化,往往可取得更好的效果。

4、因人制宜,采用不同的强化方式。由于人的个性特征及其需要层次不尽相同,不同的强化机制和强化物所产生的效应会因人而异。因此,在运用强化手段时,应采用有效的。强化方式,并随对象和环境的变化而相应调整。

5、利用信息反馈增强强化的效果。信息反馈是强化人的行为的一种重要手段,尤其是在应用安全目标进行强化时,定期反馈可使职工了解自己参加安全生产活动的绩效及其结果,既可使职工得到鼓励,增强信心,又有利于及时发现问题,分析原因,修正所为。

1、为预知与控制人类行为提供了一个操作性的角度。

斯金纳之前的心理学理论皆关注于心理现象的内在方面,将心理现象看做一个“暗箱”,都认为心理现象是不可预知或难以预知的。而斯金纳的强化理论描述了行为的可操纵性,从而极大地提高了人们预测和控制有机体的能力。但强化理论试验本身屡次遭到当时与后人的置疑,即使其自己在最后也不得不承认:“新奇的成果,第一是由于类似的意外,并不是什么夸张的话,近来重温五年来的研究结果,发现许多是由于继电器和真空管的失误而碰到新的发现。” [2]

2、为社会及工作行为的培训、教育以及人类社会化因素的培养形成,提供了心理学理论上的依据。

3、强化理论有助于对人们行为的理解和引导。

因为,一种行为必然会有后果,而这些后果在一定程度上会决定这种行为在将来是否重复发生。那么,与其对这种行为和后果的关系采取一种碰运气的态度,就不如加以分析和控制,使大家都知道应该有什么后果最好。这并不是对职工进行操纵,而是使职工有一个最好的机会在各种明确规定的备择方案中进行选择。因而,强化理论能被广泛地应用在激励和人的行为的改造上。 [2]

强化理论只讨论外部因素或环境刺激对行为的影响,忽略人的内在因素和主观能动性对环境的反作用,否定“失败乃成功之母”的训诫,将磨难不是当做财富而是作为负担来看。而实践也表明:强化理论对某些简单的操作反应,如在驯化动物、知识学习、儿童行为教育、弱智及在特定的条件下的行为矫正中,可以得到相当的效果;当应用到常态的成年人行为干涉中,当人们思维中的对成败因素的主观思维判断、预期期望意识、本能欲望倾向等占了上风时,强化理论往往便无法适用了。 [2]

强化理论将凡有结果的行为,都归之于强化的作用,即使找不出直接的强化作用,也可以用间接的、二级的甚至更高级的、继发性的强化作用来解释,但即使如此其理论往往也难以尽然解释很多心理现象。特别是强化理论认为人们工作行为都是通过各种直接或间接奖惩措施而学习、训练与社会经验的结果,因而其也就难以解释以下问题: [2]

1、人们某些天生的行为能力,近乎本能的行为都是怎么来的。

2、人们为什么既会有一些对真理的坚持、自我实现、坚守信念、追求公正公平、对科学真理的探求研究等不计代价、百折不挠的行为,又会有一些赌博、吸毒、网瘾等等屡教不改的恶习。

3、有些人在某种状况下会有一些以抑止克服自我心理冲动为特征的、计较得失的、非习惯性的,甚至违背其日常性格行为特点的纯理智性的行为,而相反另有一些人会有一些不计利害得失的、具有性格色彩的非理智性行为的原因。在我们肯定了理智行为和非理智行为这两种相互矛盾状况不可能都是强化的结果前提下,那么到底理智性的行为和非理智性的行为那一个才是强化的结果呢。 [2]


相关文章推荐:
斯金纳 | 斯金纳 | 哈佛大学 | 操作条件反射 | 负强化 | 经典条件反射 | 经典条件作用 | 操作性行为 | 斯金纳 | 强化 | 巴甫洛夫 | 概率 | 强化物 | B.F.斯金纳 | 操作性条件反射 | 钱能 | 普雷马克原理 | 时间差 | 行为主义学习理论 | 信息价值 | 有意义的行为 | 组织目标 | 期望理论 | 个体 | 态度 | 反应程度 | 人类行为 | 内在因素 | 失败乃成功之母 | 行为教育 | 行为能力 |
相关词汇词典