人類視覺系統是這個世界上最為神奇的一個系統。1981年的諾貝爾醫學獎得主David H.Hubel 和Torsten Wiesel的研究表明:即人腦視覺機理,是指視覺系統的信息處理在可視皮層是分級的,大腦的工作過程是一個不斷疊代、不斷抽象的過程。視網膜在得到原始信息後,首先經由區域V1初步處理得到邊緣和方向特徵信息,其次經由區域V2的進一步抽象得到輪廓和形狀特徵信息,如此疊代地經由更多更高層的抽象最後得到更為精細的分類。
基本介紹
- 中文名:人腦視覺機理
- 外文名:Human brain visual mechanism
- 領域:深度學習
- 定義:信息處理在可視皮層是分級的
- 特點:不斷疊代、不斷抽象的過程
- 套用:深度學習網路模型
簡介,人類視覺系統,神經網路,
簡介
1981 年的諾貝爾醫學獎,頒發給了 David Hubel(出生於加拿大的美國神經生物學家) 和TorstenWiesel,以及 Roger Sperry。前兩位的主要貢獻,是“發現了視覺系統的信息處理”:可視皮層是分級的。1958 年,DavidHubel 和Torsten Wiesel 在 JohnHopkins University,研究瞳孔區域與大腦皮層神經元的對應關係。他們在貓的後腦頭骨上,開了一個3 毫米的小洞,向洞裡插入電極,測量神經元的活躍程度。然後,他們在小貓的眼前,展現各種形狀、各種亮度的物體。並且,在展現每一件物體時,還改變物體放置的位置和角度。他們期望通過這個辦法,讓小貓瞳孔感受不同類型、不同強弱的刺激。之所以做這個試驗,目的是去證明一個猜測。位於後腦皮層的不同視覺神經元,與瞳孔所受刺激之間,存在某種對應關係。一旦瞳孔受到某一種刺激,後腦皮層的某一部分神經元就會活躍。經歷了很多天反覆的枯燥的試驗,同時犧牲了若干只可憐的小貓,David Hubel 和Torsten Wiesel 發現了一種被稱為“方向選擇性細胞(Orientation Selective Cell)”的神經元細胞。當瞳孔發現了眼前的物體的邊緣,而且這個邊緣指向某個方向時,這種神經元細胞就會活躍。這個發現激發了人們對於神經系統的進一步思考。神經-中樞-大腦的工作過程,或許是一個不斷疊代、不斷抽象的過程。這裡的關鍵字有兩個,一個是抽象,一個是疊代。從原始信號,做低級抽象,逐漸向高級抽象疊代。人類的邏輯思維,經常使用高度抽象的概念。
例如,從原始信號攝入開始(瞳孔攝入像素 Pixels),接著做初步處理(大腦皮層某些細胞發現邊緣和方向),然後抽象(大腦判定,眼前的物體的形狀,是圓形的),然後進一步抽象(大腦進一步判定該物體是只氣球)。
這個生理學的發現,促成了計算機人工智慧,在四十年後的突破性發展。計算機專家仿照人類大腦由低層到高層逐層疊代、抽象的視覺信息處理機理,建立深度網路模型。深度網路每層代表可視皮層的區域,深度網路每層上的節點代表可視皮層區域上的神經元,信息由左向右傳播,其低層的輸出為高層的輸入,逐層疊代進行傳播。從學習算法的定義可知,模擬人腦視覺處理信息的機理的深度網路主要目的是通過對歷史數據的逐步學習,將歷史數據的經驗存儲在網路中,且經驗伴隨著學習次數的增多而不斷提高。從深度網路的結構可以看到高層神經元的輸入來自於低層神經元的輸出,同層神經元之間沒有互動。若輸入層為輸入數據的特徵表示,則可以理解為高層的特徵是低層特徵的組合,從低層到高層的特徵表示越來越抽象的人類視覺系統信息處理過程。
人類視覺系統
人類視覺系統是神經系統的一個組成部分,它使生物體具有了視知覺能力。它使用可見光信息構築機體對周圍世界的感知。視覺系統具有將外部世界的二維投射重構為三維世界的能力。需要注意的是,不同物種所能感知的可見光處於光譜中的不同位置。例如,有些物種可以看到紫外部分,而另一些則可以看到紅外部分。
人類視覺系統的信息處理機制是一個高度複雜的過程,科學家們從生物學、解剖學、神經生理學、心理物理學等方面做了大量的研究,這裡主要說明視覺關注、亮度及對比敏感度、視覺掩蓋、視覺內在推導機制這四個特性。
視覺關註:在紛繁複雜的外界場景中,人類視覺總能快速定位重要的目標區域並進行細緻的分析,而對其他區域僅僅進行粗略分析甚至忽視。這種主動選擇性的心理活動被稱為視覺關注機制(Visual Attention)。視覺關注可由兩種模式引起:其一是客觀內容驅動的自底向上(bottom-up)關注模型;另一種是主觀命令指導的自頂而下(top-down)關注模型。
自底向上關注主要跟圖像內容的顯著性相關。心理學研究發現,那些與周圍區域具有較大差異性的目標容易吸引觀察者的視覺關注。
自頂而下關注受意識支配、依賴於特定的命令,該機制可將視覺關注強行轉移到某一特定區域。
視覺關注機制體現了人類視覺系統主動選擇關注內容並加以集中處理的視覺特性,該特性能有效提升圖像內容篩選、目標檢索等圖像處理能力。
亮度及對比敏感度:實驗表明,人眼對光強度具有某種自適應的調節功能,即能通過調節感光靈敏度來適應範圍很廣的亮度,同時這也導致了對絕對亮度判斷能力較差。因此人眼對外界目標亮度的感知更多依賴於目標跟背景之間的亮度差。換言之,人類視覺系統對亮度的分辨能力是有限的,只能分辨具有一定亮度差的目標物體,而差異較小的亮度則會被認為是一致的。
人類視覺系統非常關注物體的邊緣,往往通過邊緣信息獲取目標物體的具體形狀、解讀目標物體等。由於視覺系統具有魯棒性,無法分辨一定程度以內的邊緣模糊,這種對邊緣模糊的分辨能力則稱為對比靈敏度。
視覺掩蓋:視覺信息間的相互作用或相互干擾將引起視覺掩蓋效應。
常見的掩蓋效應有:1)由於邊緣存在強烈的亮度變化,人眼對邊緣輪廓敏感,而對邊緣的量度誤差不敏感,即對比度掩蓋;2)圖像紋理區域存在較大的亮度以及方向變化,人眼對該區域信息的解析度下降,即紋理掩蓋;3)視頻序列相鄰幀間內容的劇烈變動(如目標運動或者場景變化),導致人眼解析度的劇烈下降,即時域的運動掩蓋及切換掩蓋。
視覺掩蓋效應使人眼無法察覺到一定閾值以下的失真,該閾值被稱為恰可識別失真 (Just Noticeable Distortion)。恰可識別失真閾值在實際圖像處理中具有重要的指導意義。該閾值可以幫助我們區分出哪些信號是視覺系統能察覺、感興基於人類視覺系統的圖像信息感知和圖像質量評價趣的,哪些信號是視覺系統無法察覺、可忽略的。篩選出能察覺的信息而忽略其餘不可察覺信息可以減少圖像處理的複雜度,且在一定條件下能改善圖像的顯示質量。
視覺內在推導機制:最新的人腦研究指出,人類視覺系統並非本本地去理解進入人眼的視覺信號,而是存在一套內在的推導機制 (Internal Generative Mechanism) 去解讀輸入的視覺信號。
簡單的說就是:對於待識別的輸入場景,人類視覺系統會根據大腦中的記憶信息,來推導、預測其視覺內容,同時那些無法理解的不確定信息將會被丟棄。
神經網路
神經網路可以指向兩種,一個是生物神經網路,一個是人工神經網路。生物神經網路:一般指生物的大腦神經元,細胞,觸點等組成的網路,用於產生生物的意識,幫助生物進行思考和行動。
人工神經網路(Artificial Neural Networks,簡寫為ANNs)也簡稱為神經網路(NNs)或稱作連線模型(Connection Model),它是一種模仿動物神經網路行為特徵,進行分散式並行信息處理的算法數學模型。這種網路依靠系統的複雜程度,通過調整內部大量節點之間相互連線的關係,從而達到處理信息的目的。或是一種套用類似於大腦神經突觸聯接的結構進行信息處理的數學模型。在工程與學術界也常直接簡稱為“神經網路”或類神經網路。
神經網路的研究內容相當廣泛,反映了多學科交叉技術領域的特點。主要的研究工作集中在以下幾個方面:
生物原型
從生理學、心理學、解剖學、腦科學、病理學等方面研究神經細胞、神經網路、神經系統的生物原型結構及其功能機理。
建立模型
根據生物原型的研究,建立神經元、神經網路的理論模型。其中包括概念模型、知識模型、物理化學模型、數學模型等。
算法
在理論模型研究的基礎上構作具體的神經網路模型,以實現計算機模擬或準備製作硬體,包括網路學習算法的研究。這方面的工作也稱為技術模型研究。
神經網路用到的算法就是向量乘法,並且廣泛採用符號函式及其各種逼近。並行、容錯、可以硬體實現以及自我學習特性,是神經網路的幾個基本優點,也是神經網路計算方法與傳統方法的區別所在。