強化理論

強化理論

強化理論是過程型激勵理論之一。由美國心理學家斯金納首先提出。認為人的行為是對其所獲刺激的函式。如果這種刺激對他有利,則這種行為就會重複出現;若對他不利,則這種行為就會減弱直至消失。因此管理者要採取各種強化方式,以使人們的行為符合組織的目標。根據強化的性質和目的,可以分為正強化和負強化兩大類型。

基本介紹

  • 中文名:強化理論
  • 外文名:Reinforcement theory
  • 提出者斯金納
  • 也叫:操作條件反射理論
產生,分類,套用,強化學習理論,強化管理理論,兩面性,積極性,缺陷性,

產生

強化理論是美國的心理學家和行為科學家斯金納、赫西、布蘭查德等人提出的一種理論,也稱為行為修正理論或行為矯正理論。斯金納於1931年獲得哈佛大學的心理學博士學位,並於1943年回到哈佛大學任教,直到1975年退休。1968年曾獲得美國全國科學獎章,是第二個獲得這種獎章的心理學家。斯金納認為人是沒有尊嚴和自由的,人們作出某種行為,不做出某種行為,只取決於一個影響因素,那就是行為的後果。他提出了一種“操作條件反射”理論,認為人或動物為了達到某種目的,會採取一定的行為作用於環境。當這種行為的後果對他有利時,這種行為就會在以後重複出現;不利時,這種行為就減弱或消失。人們可以用這種正強化或負強化的辦法來影響行為的後果,從而修正其行為。
最早提出強化概念的是俄國著名的生理學家巴甫洛夫,在巴甫洛夫經典條件反射中,強化指伴隨於條件刺激物之後的無條件刺激的呈現,是一個行為前的、自然的、被動的、特定的過程。而在斯金納的操作條件反射中,強化是一種人為操縱,是指伴隨於行為之後以有助於該行為重複出現而進行的獎罰過程。
巴甫洛夫等的實驗對象的行為是刺激引起的反應,稱為“應答性反應( respondents) ”。而斯金納的實驗對象的行為是有機體自主發出( emitted) 的, 稱為“操作性反應( operant) ”。經典條件作用只能用來解釋基於應答性行為的學習,斯金納把這類學習稱為“S( 刺激) 類條件作用”。另一種學習模式,即操作性或工具性條件作用的模式,則可用來解釋基於操作性行為的學習,他稱為“R( 強化) 類條件作用”,並稱為“S-R” 心理學理論。
這種理論觀點主張對激勵進行針對性的刺激,只看員工的行為和結果之間的關係,而不是突出激勵的內容和過程。該理論認為人的行為是其所獲刺激的函式。如果這種刺激對他有利,則這種行為就會重複出現,若對他無利,這種行為就會減弱直至消逝。

分類

斯金納箱斯金納箱
按照強化物的性質來分
斯金納根據強化物的性質,把強化分為積極強化(positive reinforcement)和消極強化(negative rein-forcement)(陽性強化和陰性強化或正強化和負強化)。積極強化是指由於一刺激物在個體作出某種反應(行為)後出現從而增強了該行為(反應)發生的機率,該刺激物稱為積極強化物。消極強化是指由於一刺激物在個體作出某種反應(行為)後而予以排除從而增強了該行為發生的機率,該刺激物稱為消極強化物。
積極強化物同消極強化物在性質上的區別表現在:兩者的區分不能僅從字面意義去理解,而應從該刺激物的出現是增強了行為(反應)發生的機率還是降低了行為(反應)發生的機率這一結果上去判斷。如果該刺激物的出現增強了行為(反應)發生的機率或該刺激物撤消降低了行為(反應)發生的機率,則該刺激物為積極強化物,反之為消極強化物。
人類行為受強化影響的程度
斯金納根據人類行為受強化影響的程度,把強化分為一級強化和二級強化。一級強化是指滿足人和動物生存、繁衍等基本生理需要的強化。一級強化物如食物、水、安全、溫暖、性等。二級強化是指任何一個中性刺激如果與一級強化物反覆聯合,它就能獲得自身的強化性質。二級強化物如金錢、學歷、關注、贊同等,這些二級強化物初時並不具有強化的作用,而是由於它們同諸如食物、性慾之類的一級強化物相匹配而具有了強化的作用。
根據行為和強化間間隔時間來分
斯金納和同事們在研究什麼條件下強化能發揮最佳作用時,根據行為發生與強化物出現間隔的時間,把強化分為連續式強化(也稱即時強化)和間隔式強化(也稱延緩強化)。
連續式強化是指對每一次或每一階段的正確反應予以強化,就是說當個體作出一次或一段時間的正確反應後,強化物即時到來或撤去。
間隔式強化是指行為發生與強化物的出現或撤去之間有一定的時間間隔或按比率出現或撤去。間隔式強化分為時間式和比率式。時間式又分為定時距式強化和變時距式強化。比率式又分為定比率式強化和變比率式強化。定時距式強化就是每次過一定時間間隔之後給予強化。

套用

強化學習理論

內容
開始斯金納也只將強化理論用於訓練動物,如訓練軍犬和馬戲團的動物。以後,斯金納又將強化理論進一步發展,並用於人的學習上。他強調在學習中應遵循小步子和及時反饋的原則,將大問題分成許多小問題,循序漸進;他還將編好的教學程式放在機器里對人進行教學,發明了程式教學法和教學機,收到了很好的效果。
斯金納認為行為之所以發生變化,是由於強化作用的結果,人的學習是否成立關鍵在於強化。當一個操作發生之後,緊接著呈現一個強化刺激時,那么,這個操作的強度(機率)就增加。這裡所增加的不是刺激-反應的聯結(因為操作不需要特定的激發性刺激),而是使反應發生的一般傾向性增強,即反應發生的機率增強了。他認為在學習中,練習雖然是重要的,但關鍵的變數卻是強化。練習本身並不提高速率,它只是為進一步強化提供機會。不過,他對強化的解釋與巴甫洛夫的解釋不同。他認為凡能增強反應機率的刺激,這可叫做條件的、二級的、後繼的或派生的強化物。這後繼的強化物可以在它同反應重複聯合而無原始的、一級的強化物時歸於消失。他認為,後繼強化物容易發生泛化,後繼強化物同原始的強化物發生聯合時,就可以引起種種不同的活動。例如金錢可以使各種行為起到強化的作用。在斯金納看來,教育就是塑造行為,成功的教學和訓練的關鍵就是分析強化的效果以及設計精密的操縱強化過程的技術。他說:"只要我們安排好一種被稱為強化的特殊形式的後果,我們的技術就會容許我們幾乎隨意地塑造一個有機體的行為"。
B.F.斯金納在《語言行為》一書中以對動物進行的操作性條件反射實驗為基礎,認為兒童獲得言語主要靠後天學習,也與學習其它行為一樣,是通過操作性條件反射來實現的。言語的操作性條件反射建築在由環境引起的聲音和聲音連結的選擇性強化的基礎上。如嬰兒在咿呀學語時,父母或其他人總是高興地對著他們咿呀作答,就強化了他們的言語行為;當嬰兒發出接近成人的語音時,成人又會對這些發音強化,使這些聲音逐漸在兒童發聲中占優勢,於是嬰兒就逐漸從沒有含義的咿呀學語過渡到富有意義的言語。E.L.桑代克把這種學習稱為“咿呀學語僥倖成功”。強化論者莫勒(O.H.Mowrer)認為,兒童是通過模仿-強化的模式來學習語言的。兒童模仿成人的發聲常常與需要得到滿足和愉快相聯繫,模仿就得到強化。強化理論還認為,兒童掌握語言結構是按照刺激-反應的公式產生的行為。兒童可通過一類言語反應的類化建立起某種語言結構與言語反應類別之間的聯繫。如一個孩子習得了"寶寶的鞋"、"寶寶的糖"、"寶寶的槍"這類反應後,他就理解了並能使用"寶寶的--"這種語言結構,以後能把新詞填入已習得的這個語言結構中去。
強化物
凡是能增強反應機率的刺激和事件都叫強化物,反之,在反應之後緊跟一個討厭的刺激,從而導致反應率下降,則是懲罰。強化又分為積極強化和消極強化,積極強化通過呈現刺激增強反應機率,消極強化通過中止不愉快條件來增強反應機率。
強化還可劃分為一級強化和二級強化兩類。一級強化滿足人和動物的基本生理需要,如食物、水、安全、溫暖、性等。二級強化是指任何一個中性刺激如果與一級強化反覆聯合,它就能獲得自身的強化性質。包括社會強化(社會接納、微笑)、信物(錢、級別、獎品等)和活動(自由地玩、聽音樂、旅遊等)。如金錢,對嬰兒它不是強化物,但當小孩知道錢能換糖時,它就能對兒童的行為產生效果。再如分數,也是在受到教師的注意後才具有強化性質的。
在強化時,可以使用這樣一個原則——普雷馬克原理(Premack Principle),即用高頻的活動作為低頻活動的強化物,或者說用學生喜愛的活動去強化學生參與不喜愛的活動。如“你吃完這些青菜,就可以去玩。”如果一個兒童喜愛做航空模型而不喜歡閱讀,可以讓學生完成一定的閱讀之後去做模型,等等。
強化安排強化安排
強化的程式
強化的程式是指反應在什麼時候或多頻繁地受到強化。每一種不同的程式都產生相應的反應模式。連續程式的強化在教新反應時最為有效。間隔式強化又稱部分強化,它比起連續程式具有較高的反應率和較低的消退率。定時距式由於有一個時間差,隨之以較低的反應率,但在時間間隔的未了反應率上升,出現一種扇貝效應(見圖)。學生在期終考試前臨時抱佛腳就證明了這一點。定比率式對穩定的反應率比較有益,而變比率式則對維持穩定和高反應率最為有效。
在實際教育中,不想要的行為常常不明智地受到了強化。一個教師可能正在作間隔式的強化,一次僥倖就會使學生永遠記住這個行為,學生認識到如果他們一直懇求教師,教師就會最終答應他們的要求。
扇貝效應扇貝效應
下面是一些強化程式原則:
1.教新任務時,進行即時強化,不要進行延緩強化。在行為主義學習理論中有一條重要的原理就是,後果緊跟行為比後果延緩要有效得多。即時反饋有兩個作用:首先是使行為和後果之間的聯繫更為明確,其次它增加了反饋的信息價值
2.在任務的早期階段,強化每一個正確的反應,隨著學習的發生,對比較正確的反應優先強化,逐漸地轉到間隔式強化。
3.強化要保證做到朝正確方向促進或引導。不要堅持一開始就做到完美。不要強化不希望的行為。

強化管理理論

內容
所謂強化是指增強某人前面的某種行為重複出現次數的一種權變措施。現代的S-R心理學家不僅用強化來解釋操作學習的發生,而且也用強化來解釋動機的引起。人類從事的眾多有意義的行為都是操作性強化的結果,例如許多步行上學、讀書寫字、回答問題等等。斯金納強化理論認為在操作條件作用的模式下, 如果一種反應之後伴隨一種強化,那么在類似環境裡發生這種反應的機率就增加。而且,強化與實施強化的環境一起,都是一種刺激, 人們可以以此來控制反應。因此,管理人員就可以通過強化的手段,營造一種有利於組織目標實現的環境和氛圍,以使組織成員的行為符合組織的目標。
方式
根據強化的性質和目的可把強化分為正強化和負強化。在管理上,正強化就是獎勵那些組織上需要的行為,從而加強這種行為;負強化就是懲罰那些與組織不兼容的行為,從而削弱這種行為。正強化的方法包括獎金、對成績的認可、表揚、改善工作條件和人際關係、提升、安排擔任挑戰性的工作、給予學習和成長的機會等。負強化的方法包括批評、處分、降級等,有時不給予獎勵或少給獎勵也是一種負強化。
強化的具體方式有四種:
1、正強化。就是獎勵那些符合組織目標的行為,以便使這些行為得以進一步的加強、重複出現。
2、懲罰。當員工出現一些不符合組織目標的行為時,採取懲罰的辦法,可以約束這些行為少發生或不再發生。懲罰是力圖使所不希望的行為逐漸削弱,甚至完全消失。
3、負強化,負強化強調的是一種事前的規避。俗語“殺雞儆猴”形象說明了兩者的聯繫與區別。對出現了違規行為的“雞”加以懲罰,意欲違規的“猴”會從中深刻地意識到組織規定的存在,從而加強對自己行為的約束。
4、忽視,就是對已出現的不符合要求的行為進行“冷處理”,達到“無為而治”的效果。
斯金納的強化理論和弗隆的期望理論都強調行為同其後果之間關係的重要性,但弗隆的期望理論較多地涉及主觀判斷等內部心理過程,而強化理論只討論刺激和行為的關係。強化的主要功能,就是按照人的心理過程和行為的規律,對人的行為予以導向,並加以規範、修正、限制和改造。它對人的行為的影響,是通過行為的後果反饋給行為主體這種間接方式來實現的。人們可根據反饋的信息,主動適應環境刺激,不斷地調整自己的行為。
原則
1、要依照強化對象的不同採用不同的強化措施。人們的年齡、性別、職業、學歷、經歷不同,需要就不同,強化方式也應不一樣。
2、小步子前進,分階段設立目標,並對目標予以明確規定和表述。對於人的激勵,首先要設立一個明確的、鼓舞人心而又切實可行的目標,只有目標明確而具體時,才能進行衡量和採取適當的強化措施。同時,還要將目標進行分解,分成許多小目標,完成每個小目標都及時給予強化,這樣不僅有利於目標的實現,而且通過不斷的激勵可以增強信心。如果目標一次定得太高,會使人感到不易達到或者說能夠達到的希望很小,這就很難充分調動人們為達到目標而做出努力的積極性。
3、及時反饋。所謂及時反饋就是通過某種形式和途徑,及時將工作結果告訴行動者。要取得最好的激勵效果,就應該在行為發生以後儘快採取適當的強化方法。一個人在實施了某種行為以後,即使是領導者表示“已注意到這種行為”這樣簡單的反饋,也能起到正強化的作用。如果領導者對這種行為不予注意,這種行為重複發生的可能性就會減小以至消失。所以,必須利用及時反饋作為一種強化手段。
4、消不固定時間和頻率間隔的強化效果好。因為有機體在強化到來之前的反應率有所提高。在這樣的強化程式下,個體不知道什麼時候會出現強化,但總有一種強化即將出現的期待。長此以往自然會形成習慣。也就是說, 全部強化的結果,如果不繼續強化,反應就消失了。反過來,部分強化的,即使後來不強化時,反應仍不會減弱。顯然不強化竟會起積極作用。用擬人的話來表達,不強化會起著警戒作用,即遇到沒有強化的條件時,強化會使人學習到,一時沒有結果以後還是有結果的。所以不強化同樣可以收到學習的效果。全部強化,沒有失敗的教訓,遇到挫折便不會繼續努力了,反而引到消極。
5、正強化比負強化更有效。負強化及懲罰可以引起一定副作用。斯金納通過系統的實驗觀察得出了一條重要結論:懲罰就是企圖呈現消極強化物或排除積極強化物去刺激某個反應,僅是一種治標的方法,它對被懲罰者和懲罰者都是不利的。他的實驗證明,懲罰只能暫時降低反應率,而不能減少消退過程中反應的總次數。在他的實驗中,當白鼠已牢固建立按槓桿得到食物的條件反射後,在它再按槓桿時給予電刺激,這時反應率會迅速下降。如果以後槓桿不帶電了,按壓率又會直線上升。所以,在強化手段的運用上,應以正強化為主;同時,必要時也要對壞的行為給以懲罰,做到獎懲結合。
套用
對強化理論的套用,要考慮強化的模式,並採用一整套的強化體制。強化模式主要由“前因”、“行為”和“後果”三個部分組成。“前因”是指在行為產生之前確定一個具有刺激作用的客觀目標,並指明哪些行為將得到強化,如企業規定車間安全生產中每月的安全操作無事故定額。“行為”是指為了達到目標的工作行為。“後果”是指當行為達到了目標時,則給予肯定和獎勵;當行為未達到目標時,則不給予肯定和獎勵,甚至給予否定或懲罰,以求控制職工的安全行為。
強化理論有助於對人們行為的理解和引導。因為,一種行為必然會有後果,而這些後果在一定程度上會決定這種行為在將來是否重複發生。那么,與其對這種行為和後果的關係採取一種碰運氣的態度,就不如加以分析和控制,使大家都知道應該有什麼後果最好。這並不是對職工進行操縱,而是使職工有一個最好的機會在各種明確規定的備擇方案中進行選擇。因而,強化理論已被廣泛地套用在激勵和人的行為的改造上。在管理實踐中,正強化和負強化的使用並不能簡單化和絕對化。關於正強化和負強化的使用,從來自一個日本企業的以下調查中大家或許能得到一些啟發:
在企業安全管理中,套用強化理論來指導安全工作,對保障安全生產的正常進行可起到積極作用。在實際套用中,關鍵在於如何使強化機制協調運轉並產生整體效應,為此,應注意以下五個方面:
強化效果圖強化效果圖
1、應以正強化方式為主。在企業中設定鼓舞人心的安全生產目標,是一種正強化方法,但要注意將企業的整體目標和職工個人目標、最終目標和階段目標等相結合,並對在完成個人目標或階段目標中做出明顯績效或貢獻者,給予及時的物質和精神獎勵(強化物),以求充分發揮強化作用。
2.、採用負強化(尤其是懲罰)手段要慎重。負強化套用得當會促進安全生產,套用不當則會帶來一些消極影響,可能使人由於不愉快的感受而出現悲觀、恐懼等心理反應,甚至發生對抗性消極行為。因此,在運用負強化時,應尊重事實,講究方式方法,處罰依據準確公正,這樣可儘量消除其副作用。將負強化與正強化結合套用一般能取得更好的效果。
3、注意強化的時效性。採用強化的時間對於強化的效果有較大的影響。一般而論,強化應及時,及時強化可提高安全行為的強化反應程度,但須注意及時強化並不意味著隨時都要進行強化。不定期的非預料的間斷性強化,往往可取得更好的效果。
4、因人制宜,採用不同的強化方式。由於人的個性特徵及其需要層次不盡相同,不同的強化機制和強化物所產生的效應會因人而異。因此,在運用強化手段時,應採用有效的。強化方式,並隨對象和環境的變化而相應調整。
5、利用信息反饋增強強化的效果。信息反饋是強化人的行為的一種重要手段,尤其是在套用安全目標進行強化時,定期反饋可使職工了解自己參加安全生產活動的績效及其結果,既可使職工得到鼓勵,增強信心,又有利於及時發現問題,分析原因,修正所為。

兩面性

積極性

1、為預知與控制人類行為提供了一個操作性的角度。
斯金納之前的心理學理論皆關注於心理現象的內在方面,將心理現象看做一個“暗箱”,都認為心理現象是不可預知或難以預知的。而斯金納的強化理論描述了行為的可操縱性,從而極大地提高了人們預測和控制有機體的能力。但強化理論試驗本身屢次遭到當時與後人的置疑,即使其自己在最後也不得不承認:“新奇的成果,第一是由於類似的意外,並不是什麼誇張的話,近來重溫五年來的研究結果,發現許多是由於繼電器和真空管的失誤而碰到新的發現。”
2、為社會及工作行為的培訓、教育以及人類社會化因素的培養形成,提供了心理學理論上的依據。
3、強化理論有助於對人們行為的理解和引導。
因為,一種行為必然會有後果,而這些後果在一定程度上會決定這種行為在將來是否重複發生。那么,與其對這種行為和後果的關係採取一種碰運氣的態度,就不如加以分析和控制,使大家都知道應該有什麼後果最好。這並不是對職工進行操縱,而是使職工有一個最好的機會在各種明確規定的備擇方案中進行選擇。因而,強化理論能被廣泛地套用在激勵和人的行為的改造上。

缺陷性

強化理論只討論外部因素或環境刺激對行為的影響,忽略人的內在因素和主觀能動性對環境的反作用,否定“失敗乃成功之母”的訓誡,將磨難不是當做財富而是作為負擔來看。而實踐也表明:強化理論對某些簡單的操作反應,如在馴化動物、知識學習、兒童行為教育、弱智及在特定的條件下的行為矯正中,可以得到相當的效果;當套用到常態的成年人行為干涉中,當人們思維中的對成敗因素的主觀思維判斷、預期期望意識、本能欲望傾向等占了上風時,強化理論往往便無法適用了。
強化理論將凡有結果的行為,都歸之於強化的作用,即使找不出直接的強化作用,也可以用間接的、二級的甚至更高級的、繼發性的強化作用來解釋,但即使如此其理論往往也難以盡然解釋很多心理現象。特別是強化理論認為人們工作行為都是通過各種直接或間接獎懲措施而學習、訓練與社會經驗的結果,因而其也就難以解釋以下問題:
1、人們某些天生的行為能力,近乎本能的行為都是怎么來的。
強化理論拷打信念強化理論拷打信念
2、人們為什麼既會有一些對真理的堅持、自我實現、堅守信念、追求公正公平、對科學真理的探求研究等不計代價、百折不撓的行為,又會有一些賭博、吸毒、網癮等等屢教不改的惡習。
3、有些人在某種狀況下會有一些以抑止克服自我心理衝動為特徵的、計較得失的、非習慣性的,甚至違背其日常性格行為特點的純理智性的行為,而相反另有一些人會有一些不計利害得失的、具有性格色彩的非理智性行為的原因。在我們肯定了理智行為和非理智行為這兩種相互矛盾狀況不可能都是強化的結果前提下,那么到底理智性的行為和非理智性的行為那一個才是強化的結果呢。

相關詞條

熱門詞條

聯絡我們