reinforcement,英語單詞,主要用作名詞,作名詞時譯為“加固;增援;援軍;加強”。
基本介紹
- 外文名:reinforcement
- 詞性:名詞
- 英式發音:[ˌriːɪnˈfɔːsmənt]
- 美式發音:[ˌriːɪnˈfɔːrsmənt]
reinforcement,英語單詞,主要用作名詞,作名詞時譯為“加固;增援;援軍;加強”。
《Reinforcement Learning for Sequential Decision and Optimal Control》是2023年由Springer出版的強化學習英文書籍。本書面向工程領域的科研人員和工程師,按照原理剖析、主流算法、典型示例的架構,介紹用於複雜系統動態決策及最優控制的強化...
強化(reinforcement)是指影響行為鞏固或再次出現的關鍵因素是行為後得到的結果。心理學家從不同的角度出發把強化分為不同的類型,如正強化、負強化、連續強化、間隔強化、固定比例強化、變化比例強化等等。定義 後效是指隨著其原因已停歇...
強化學習(Reinforcement Learning, RL),又稱再勵學習、評價學習或增強學習,是機器學習的範式和方法論之一,用於描述和解決智慧型體(agent)在與環境的互動過程中通過學習策略以達成回報最大化或實現特定目標的問題。強化學習的常見模型是...
自我強化(self-reinforcement),是指個人依據強化原理安排自己的活動或生活,每達到一個目標即給予自己一點物質的或精神的酬報,直到最終目標完成。概念 自我強化是指班杜拉自我效能理論之一,個人依據強化原理安排自己的活動或生活,每達到一...
增強理論(reinforcement theory)認為行為的後果才是影響行為的主因。人們採取了某種行為或反應之後,若立即有可喜的結果出現,則此一結果就變成控制行為的增強物 有一種講法是:認為行為是其結果的函式,即某種行為的產生系受某種結果的...
強化原理(principle of reinforcement),布魯納提出的學習原理之一。學習過程中要恰當處理學習的反饋問題。學習的進程及效果在一定程度上取決於強化或對結果的獲悉。他認為, 從直觀角度講,學習不斷前進,因而最好將外部強化變為一個人在...
替代性強化(vicarious reinforcement):是由班杜拉提出的強化理論,替代性強化是指觀察者看到榜樣或他人受到強化,從而使自己也傾向於做出榜樣的行為。概念 替代性強化是班杜拉提出的社會學習的重要理論,是指觀察者看到榜樣或他人受到強化,...
增強學習(Reinforcement Learning)要解決的是這樣的問題:一個能感知環境的自治agent,怎樣通過學習選擇能達到其目標的最優動作。簡介 這個很具有普遍性的問題套用於學習控制移動機器人,在工廠中學習最優操作工序以及學習棋類對弈等。當...
在心理學中,正強化(positive reinforcement)的定義是,任何導致我們以後進行該行為的可能性增加的結果。就是獎勵那些符合組織目標的行為,以使這些行為得到進一步加強,從而有利於組織目標的實現。定義 行為會帶來一些結果,這些結果又會影響...
連續強化 連續強化(Continuous reinforcement),是組織行為學中強化程式的一種,指每一次理想行為出現時,都給予強化,可以快速學習新行為,但習得行為也會快速消失,例如表揚和恭維。間斷強化 Intermittent reinforcement。與連續強化相對的。
部分強化( partial reinforcement) 亦稱間斷強化(intermittent reinforcement),與“連續強化”相對,是強化程式的一種。指有機體做出的正確反應中只有部分得到強化的訓練。定義 部分強化(partial reinforcement) 亦稱間斷強化(intermittent ...
社會強化(social reinforcement)是指社會學習理論的基本概念。社會學習理論認為,個體能夠學會社會技能,掌握行為規範,依社會接受和認可的方式行為,都是社會強化的結果。有正負向之分。正強化包括他人的肯定、認可、讚賞、支持、獎勵等,負...
內隱強化(covert reinforcement)是指行為治療中內隱條件作用療法技術。主要採用在想像中給行為以某種強化的方式進行。分為積極和消極強化兩種情況,即在個體出現適應性行為之後想像令人愉快的情境,而在非適應性行為出現後想像令人厭惡的情境...
這種關係叫正強化(positivereinforcement)。……二是行為產生消極的結果……這種關係叫懲罰(punishment)。……三是行為導致已經呈現的刺激結束或移去,這種關係叫負強化或逃避(negativereinforcementorescape)。……最後行為可能防止消極事件...
纖維增強 纖維增強(fiber reinforcement)是1993年發布的力學名詞,出自《力學名詞》第一版。公布時間 1993年經全國科學技術名詞審定委員會審定發布。出處 《力學名詞》第一版。
1、強化(reinforcement)在建立新的行為時,“強化”是一般人常用的,尤其是用連續的“即時強化”(immediate reinforcement)、接著用“間隔強化”(interval reinforcement),對於行為的快速建立效果不錯。強化除了前面所舉的兩個之外,...
固定比例的強化 固定比例的強化(fixed-ratio reinforcement )是2016年公布的管理科學技術名詞。定義 只在一個固定數目的反應之後發生的強化過程。出處 《管理科學技術名詞》第一版。
強化價值(reinforcement value)是羅特人格社會學習理論術語。當幾種強化的出現機率相同時,個體偏向某種強化的程度。個體的這種偏好來自過去強化與當前強化相聯繫的經驗。由於過去強化與當前強化之間形成聯繫,便產生對未知強化的預期。斯金納...
一級強化 一級強化(primary reinforcement),亦稱“初級強化”、“非條件性強化”。與“二級強化”相對。通過給予一級強化物(非條件強化物)使某一刺激反應聯結增強的過程。
rustiness,英語單詞,主要用作名詞,作名詞時譯為“生鏽;聲音嘶啞”。短語搭配 rustiness s 硬皮度 steel rustiness 鋼筋鏽蝕 component rustiness 零件生鏽 prevent rustiness 防腐蝕 reinforcement rustiness 鋼筋鏽蝕 rustiness of ...
強化程式(schedules of reinforcement)是指按合乎要求的反應次數和各次強化之間的時距的適當組合而產生的各種強化安排。若每一合乎要求的反應都受到強化,則這種強化安排稱連續強化程式(簡稱連續強化)。若只有部分合乎要求的反應受到強化,...
強化程式表 (reinforcement schedule)當操作性條件反射建立之後,如果不給於反應相對應的刺激,該反應就會隨著時間的推移而消去。因此正是由於消去現象(extinction)的存在,必須給予適當的強化。為了增大或者維持某個反應的出現率,不斷的...
強化間隔程式 強化間隔程式(interval schedule of reinforcement)是2014年全國科學技術名詞審定委員會公布的心理學名詞。定義 根據時間間隔來確定如何給予強化的一種強化程式。包括可變間隔與固定間隔兩種。出處 《心理學名詞》第二版。