認知機器人學

認知機器人學

認知機器人學是通過給機器人提供一種處理架構而賦予機器人智慧型行為的學科。這一架構可以讓機器人學習和推論出應付複雜世界的相應舉措。我們可以把認識機器人學視為是具身認知科學和具身嵌入認知的一種工程分支。

基本介紹

  • 中文名:認知機器人學
  • 外文名:Cognitive robotics
  • 類別:機器人技術
  • 學科:控制科學與工程
  • 核心問題:符號象徵的感知、行為以及概念
  • 特點:高層認知能力機器人
基本概念,核心問題,學習技巧,電機學語(Motor Babble),模擬學習(Imitation),自主獲取知識(Knowledge acquisition),認知架構,學習問題,記憶系統,線上學習,

基本概念

認知機器人學是通過給機器人提供一種處理架構而賦予機器人智慧型行為的學科。這一架構可以讓機器人學習和推論出應付複雜世界的相應舉措。我們可以把認識機器人學視為是具身認知科學和具身嵌入認知的一種工程分支。
認知機器人這一概念的確切定義,國際上目前還有很大的爭議,說法不一,但總體概念是統一的,即認知機器人是一種具有類似人類的高層認知能力,並能適應複雜環境,完成複雜任務的新一代機器人。基於認知的思想,機器人能有效克服前述的多種缺點,智慧型水平進一步提高。

核心問題

雖然傳統的認知建模方法把符號編碼視為一種可以描繪物質世界的方法,但把物質世界翻譯成這些符號象徵的想法即使能站得住腳卻仍存在疑問。因此符號象徵的感知、行為以及概念是認知機器人學需要解決的核心問題。
認知機器人學認為動物的認知行為是機器人處理信息發展中的一個起始點,而這與很多先前的人工智慧技術截然不同。預想的機器人認知能力包括感知處理,注意力分配,預期,計畫,複雜的動作協調,推理其他機器人個體亦或是它們自己的心理狀態。機器認知使智慧型個體的行為在物理世界中(或虛擬世界中,在模擬認知機器人的狀態下)得以體現。最終機器人必定能在現實生活中存在。

學習技巧

電機學語(Motor Babble)

機器人初步的學習技術叫做“電機學語”。這會涉及一些相關的隨機複雜動作。而這些動作是機器人通過視覺或聽覺反饋產生的。這樣一來,機器人便開始形成一種感覺反饋模式以及相應的電機輸出模式。這些預期的感覺反饋之後又可通知電機管控信號。這被認為是類似於嬰兒學習如何找對象或學習發音。對於一個簡單的機器人系統,例如反向運動有可能用於轉換期望的反饋(期望的運動結果)到電機的輸出,可以跳過這一步。

模擬學習(Imitation)

一旦機器人能控制其馬達產生所期望的結果,那么就可以用到“模擬學習”這種方法。一個機器人監視另一個agent的行為,並且接下來這個機器人去嘗試模仿那個agent。在複雜的場景中將模擬信息轉化為所期望的馬達結果,這往往對於機器人是個挑戰。需要注意的是,模擬是認知行為的高層次形式,而且模仿行為不一定需要建立在一個體現動物認知的基本模型上。

自主獲取知識(Knowledge acquisition)

一個更為複雜的學習方法是“自主獲取知識”:讓機器人自主探索自身所處的環境。一系列具有代表性的假定目標和觀念就形成了。
一種更為直接的探索模式可以用“好奇”的算法來實現,例如“智慧型自適應好奇心”。這些算法通常涉及打破感官輸入有限數目的類別和對每一個分配預測系統。這個預測系統可以隨著時間的推移跟蹤預測的誤差。減少預測誤差可以視作為學習。然後機器人優先探索它掌握最快(或減少預測誤差)的種類。

認知架構

隨著機器人系統的日益複雜,其智慧型結構也向非單一化、複雜化、模組化發展。複雜的智慧型系統必須要有一個合理的架構作為平台,以此實現各功能模組的協調運行,從而實現複雜的高級的智慧型。因此,認知機器人必須要有一個合理的認知架構。
最典型和為人們熟知的認知架構就是Anderson等人提出的ACT-R架構和Laird等人提出的SOAR架構。這兩個架構比較類似,都是基於用符號系統來表示認知行為的,在機器人領域用得不多。K. Kawamura等人提出了基於多智慧型體的模組化的認知架構,主要模組為記憶系統和自我智慧型體模組,並通過感知智慧型體和行為智慧型體與環境互動。其中記憶系統分為短時記憶、長時記憶和工作記憶,主要負責知識和經驗的學習、存儲、積累;自我智慧型體中又嵌套了如中央執行智慧型體等模組,主要實現了高層的決策能力。此認知架構在認知機器人ISAC上得到了實現。他們提出的這個架構在學習和決策問題上較為完整和詳細。
認知機器人的整體架構如下:
認知機器人學

學習問題

無論是傳統機器人還是現在提出的認知機器人,學習一直是最重要的問題,也是目前機器人領域最關注的問題之一。一個智慧型系統必須是能學習的。傳統機器人通過學習修改系統參數,改善其性能;在認知機器人中,通過學習使其積累知識和經驗,並在此基礎上發育智慧型,在完成複雜任務時做出最優的決策。因此我們認為學習是認知機器人的首要解決的問題,是發育和決策的前提。

記憶系統

根據心理學和神經科學的研究,人腦的記憶結構可以分為短時記憶和長時記憶。其中短時記憶具備迅速識別、記憶或學習當前刺激的能力,而長時記憶則具備長時間記憶或存儲知識的能力。在短時記憶中記憶的內容量小和記憶的時間短,而長時記憶則能記憶大量內容,並且記憶很長時間,且己有研究表明此結構的合理性。那么,在機器人中套用這種記憶結構是合理的,這樣,可以在短時記憶中存放當前的輸入信息,即感測器信息,作為學習的輸入信息;在長時記憶中存放學習後得到的知識和經驗,也就是學習的輸出信息。

線上學習

認知機器人需要一個合理的記憶系統作為學習輸出,即知識和經驗的載體,同時,要在此載體上具備合理的學習方法,這樣才能較好解決學習問題。學習的基本原則之一是學習必須是增量的,即隨著學習時間的增長知識和經驗不斷增長。增量就是一種發育,即所學的知識經驗隨著時間不斷增長。另外,學習必須是在機器人與環境的互動中實時進行,離線和線上結合併以線上學習為主的。線上學習是一種買時的,能對當前學習狀態立即反饋的學習能力。增量和線上學習這兩點也符合人類學習的過程。

相關詞條

熱門詞條

聯絡我們