案例
桑代克注意到,為了保證
學習的發生,除了貓必須處於
飢餓狀態外,
食物是必需的。“凡是在一定的情境內引起滿意之感的動作,就會和那一情境發生聯繫,其結果是當這種情境再現時,這一動作就會比以前更易於再現。反之,凡是在一定的情境內引起不適之感的動作,就會與那一情境發生
分裂,其結果是當這種情境再現時,這一動作就會比以前更難於再現。”例如,要是貓逃出迷箱後得到的是
懲罰而不是
獎勵的話,那么貓就不會再試圖跑出迷箱了。這就是桑代克著名的效果律。用桑代克自己的話來說:“滿意或不舒適的程度越高,
刺激-反應聯結就越加強或越減弱”。
論著
在桑代克的早期論著中,效果律既包括正強化律,也包括負強化律。這種對稱性反映了歷來的傳統,即獎勵和懲罰都可以用來控制行為。但是,桑代克在1932年出版的《學習的基礎(FundamentalsofLearning)》一書中拋棄了懲罰律。這樣,效果律就不再是對稱的了,而是單向、正向一起作用的。桑代克說,是實驗的結果迫使他這樣做的。
在一項實驗中,主試緩慢地向被試念一連串
單詞(約100個),這些單詞都是被試所熟悉的東西,如
桌子、
椅子、窗戶等。主試告訴被試,每個單詞都有一個對應的號碼,這要被試來猜。主試念一個
單詞,被試猜一個
號碼。主試對被試講出的號碼大多不給予反饋,只是偶爾說“對的”(強化)或“不對”(懲罰)。在念完所有單詞後,立即進行保持測驗,以了解被試剛剛猜測的每個單詞對應號碼的保持率。這顯然是一項枯燥乏味而又容易出錯的學習任務。結果表明,沒有得到任何反饋的單詞號碼,保持率為10%;得到強化(即主試說“對的”)的保持率為20%;受到懲罰(即主試說“不對”)的保持率為15~16%左右。這說明,強化和懲罰都有可能提高保持率。也就是說,受懲罰的反應並沒有減弱,而是加強了。桑代克由此拋棄了懲罰律。
在這項
實驗中,桑代克還發現了“效果擴散(spreadofeffect)”的現象,即:獎勵不僅增加了受獎反應的重複率,而且還增加了鄰近反應的重複率。這種獎勵的效果呈一種梯度,即:離受獎反應越遠,受其影響越小。
桑代克由此認為,強化所具有的增強反應的力量——即聽到“對的”所產生的滿意效果——不僅影響受獎的刺激-反應聯結,而且呈梯度地影響鄰近的刺激-反應聯結。