DishBrain

DishBrain

DishBrain,可姑且譯為“盤中之腦”或“培養皿大腦“,科學家製造的體外神經網路。它其實就是培養皿內盛有的80萬-100萬個活的腦細胞,這個規模接近於蟑螂的腦部。腦細胞下面排列著密密麻麻的微電極,負責刺激它們,教它們玩雅達利桌球遊戲《Pong》。它們學會遊戲規則比AI快得多,但等到它和AI都經過充分訓練,腦細胞們的遊戲成績還是遠遠不及AI。發表於2021年。

基本介紹

  • 中文名:盤中之腦
  • 外文名:DishBrain
  • 別名:培養皿大腦
中文命名,實驗內容,意義,

中文命名

“盤中之腦”的命名是考慮到一個思想實驗缸中之腦,所謂的“盤”就是培養皿。缸中之腦的內容是:如果把人腦取出體外放進缸里,用營養液維持它的生理活性,並且在腦部發出信號時,給它一如往常的信號反饋,打造一個虛擬現實,它能不能意識到自己處在虛擬現實中?或者說,若“缸中之腦”發出和收到的信號都和日常走路時一樣,它會不會相信自己真的在走路?

實驗內容

有的“盤中之腦”,是小鼠胚胎的腦部取出的細胞;另外一些“盤中之腦”,則是人類幹細胞誘導分化而成的腦細胞。當然,這是人們從外部視角描繪的景象,而那些腦細胞本身,大概不會知道自己活在培養皿里。
DishBrain
DishBrain
“盤中之腦”對這個世界的體驗,幾乎完全來自科學家給的神經刺激:腦細胞下面排列著密密麻麻的微電極,負責刺激它們。這些刺激並不隨機,而是根據雅達利桌球遊戲Pong生成的。桌球與球拍的相對位置,決定了“盤中之腦”的8個刺激位點中,哪一處要被刺激。
DishBrain
《Pong》的單人版本,由一個球、一把球拍以及三面牆組成
自此,這些迷你大腦的遊戲訓練就開始了。
腦細胞收到刺激後,也會發出信號來移動球拍,而負責讀取信號的依然是那些電極。科學家給“盤中之腦”劃定了兩片遊戲操作區,1區代表左,2區代表右,像操縱桿一樣。對比兩個區域的腦細胞發出的信號,1區更活躍便左移球拍,2區更活躍便右移球拍。
既然是訓練,就要有獎懲機制,幫玩家了解規則,並促使玩家朝著更多的獎勵進發。假如玩家是人類,那么接到球後,遊戲繼續就是獎勵,沒接到球時,遊戲結束就是懲罰。可如果玩家只是一群腦細胞,還不理解遊戲裡的邏輯關係,怎樣的獎懲才能對它們起效?
DishBrain
紅色閃電代表沒接到球的懲罰,綠色閃電代表接到球的獎勵
一種“自由能原理”(Free Energy Principle)認為,大腦喜歡事物往自己預測的方向發展,不喜歡意外或驚喜。所以,科學家設定的獎懲機制是,接到球時向迷你大腦發出可預測的信號反饋,作為獎勵;沒接到球時發出不可預測的隨機刺激,作為懲罰。
至於迷你大腦是不是真的“討厭”驚喜,會不會努力減少意外的發生,看訓練成果就知道了。
起初,每個迷你大腦都不容易接到球。但隨著訓練進行,“玩家”的遊戲技能在明顯提升,不論盤中是小鼠的腦細胞,還是人腦細胞,都能堅持更多回合了。雖然科學家也發現,人腦細胞比小鼠腦細胞表現好得多。
在研究團隊看來,這意味著連“盤中之腦”也會為外面的世界建立一個模型,用來預測將會發生什麼,它們不喜歡意料之外的事。這些迷你大腦並不是自己想打遊戲,只是要避免收到那些不可預測的隨機刺激,才被動接受了遊戲訓練。
看上去不情不願,訓練過程卻驚人地高效。“盤中之腦”只需經歷5分鐘訓練,遊玩10-15次,就學會了規則。相比之下,DeepMind有一款能打敗真實人類玩家的AI,花了90分鐘,遊玩大約5000次,才達到類似的程度。
DishBrain
不止桌球遊戲,DeepMindAI已攻破57款雅達利遊戲
當然,掌握規則不等於成為高手。等到“盤中之腦”和AI都經過充分訓練,腦細胞們的遊戲成績還是遠遠不及AI。
畢竟,腦細胞發出信號後,要靠電腦來分析這些腦電活動,再轉化成遊戲裡移動球拍的操作。像這樣由腦細胞與計算機組合而成的“賽博格”,在遊戲熟練程度上,可能還很難與純矽基的AI相匹敵。

意義

如果有一天,人們知道了為什麼腦細胞比AI學得快,也可能讓機器學習的速度突飛猛進。
科學家說,從前也有不少團隊研究培養皿里的神經元,把它們培養成類腦器官。不過這場桌球遊戲訓練,應該是第一次有迷你大腦學會了目標導向的任務。
這個新成果也表示,迷你大腦擁有感覺能力(sentience),知道自己的內在狀態和外部環境是如何互相影響的,還能從目前的狀態推斷出要採取什麼行動。要問迷你大腦為何有這樣的能力,培養皿里的每個腦細胞都不是孤立的個體,在培養過程中,它們之間已經建立起複雜的神經連線
DishBrain
DishBrain
雖然如今“盤中之腦”表現出的智慧型,遠不如人類智慧型或人工智慧那樣複雜,但仿佛還是讓我們看到了某種不可思議的未來。

熱門詞條

聯絡我們