計算動詞理論

計算動詞理論

計算動詞理論(Computational Verb Theory)是一個新興的基礎學科,本理論側重對語言學中動詞及副詞的研究成果進行系統的數學建模和自然科學化,量化語言學及人的認知,並最終對人的認知及意識現象進行自然科學化。

基本介紹

  • 中文名:計算動詞理論
  • 外文名:Computational Verb Theory
動詞理論,概念,原理,動詞集合,動詞數,動詞標準形,動詞相似度,動詞機率,因果關係,建立規則,PID控制器,元胞網路,動詞博弈,套用,提出背景,發展歷程,計算動詞理論的優越性,計算動詞理論的套用,計算機軟體產業,機器人產業,IT產業的勞動密集型轉化,服務業的個人化,計算動詞PID控制器,計算動詞元胞網路,計算動詞決策樹,在大數據挖掘中的套用,計算動詞理論在金融數據的套用,計算動詞理論在機器視覺及圖像處理的套用,

動詞理論

概念

計算動詞理論(Computational Verb Theory)是一個新興的基礎學科,本理論側重對語言學中動詞及副詞的研究成果進行系統的數學建模和自然科學化,量化語言學及人的認知,並最終對人的認知及意識現象進行自然科學化。
該理論的核心是計算動詞的概念。由於計算動詞可以退化成形容詞,因而,該理論給出包含了模糊數學為其特例。該理論回答了模糊數學的公理,即,模糊隸屬度函式是計算動詞坍塌的結果。

原理

計算動詞理論是自然語言可測量化的必然的技術發展方向的理論基礎。並在近年不論是在理論上還是套用上都得到了長足的進步。在動力學系統的基礎上給出了計算動詞的可測量化定義。當顯式地將計算動詞建模為動力學系統之後,可以進一步將修飾動詞的副詞用作用於動力學系統之上的各種數學運算元建模。為了將形容詞及動詞與名詞的關係歸結到一個統一的框架,計算動詞可以被看作是名詞的動作值。因此,名詞的屬性值與動作值分別對應於形容詞和動詞。這進一步暗示了形容詞與動詞之間的緊密聯繫。由人腦利用PDE求解器來處理語言中的屬性值和動作值的角度來重新詮釋了人腦中抽象思維的物理基礎;即多粒度的語言處理能力。計算動詞可以用PDE來表達,也可以用Banach空間中的常微分方程來表達。通過對become在抽象空間中的兩種模型的討論,計算動詞的豐富特徵得到了深刻地展現。副詞對動詞的修飾也可以由PDE的特解對定解條件的依賴性來建模。
計算動詞學科的第一部中文學術專著計算動詞學科的第一部中文學術專著
當計算動詞發生坍塌之後,其動力學特性的喪失使得動詞向形容詞轉變。從另一方面而言,當在形容詞中通過擴展原理加入動力學特性,形容詞便向動詞轉化。本章講述了動詞的不同坍塌方式及形容詞的各種擴展方法,並對形容詞之間的邏輯運算的擴展方法進行了討論。動詞坍塌和擴展原理是形容詞和動詞之間關係的可測量化的理論總結,它們為形容詞和動詞的語言學關係的研究提供了新的定量工具。

動詞集合

計算動詞集合可由一組觀測到的動詞特例構成,也可通過計算動詞坍塌來構成。計算動詞集的各種集運算可以由動詞坍塌的相應的集運算來定義,這樣可以借用傳統集合運算的結論來定義動詞集合的運算。所有具有相同定性特性的坍塌的計算動詞組成一類特殊的動詞集合,這類動詞集合中的每一個動詞的定性特徵與同一個動詞集中的其他元素的定性特徵是一致的。

動詞數

動詞數是一類特殊的動詞集合。討論了動詞數間最基礎的算術運算及動詞數坍塌成三角形及梯形模糊數的情況。由計算動詞理論的結果可知,典型的模糊數缺乏自然存在的動詞數原型,因而計算動詞理論的結果對典型的模糊數在理論上的合理性提出了質疑。通過對一個動詞數的坍塌的變換,可以得到不同的坍塌,而擴展這些坍塌能得到不同的動詞數。計算動詞理論給出了保持動力學定性特徵的動詞數間的計算關係。

動詞標準形

動詞標準形是最基本的動詞的表達方式,也是所有動詞的原型。基於動詞標準形可以構建出所有動詞。雖然動詞標準形可以選取不同的動詞基,計算動詞理論提出的動詞標準形選用了基本動詞become。在套用中,動詞標準形可以用聚類、擬合及多種模式分類的方法來從眾多的觀察序列中獲得。

動詞相似度

通過比較計算動詞之間的相似度可以得出許多現象間的關聯性,從而可由已知的知識庫中推理出未知的結論。計算動詞相似度是套用計算動詞解決實際問題的核心概念,因其重要地位,計算動詞理論給出了求取計算動詞相似度的不同方法。同時,計算動詞間的距離作為計算動詞相似度的一個對偶的概念,也在計算動詞理論中加以討論。然而,計算動詞的相似度的求取是複雜的,且不唯一。這是因為對於許多複雜的模式\相似"的定義本身缺乏一個統一的數學標準,對相似度的計算還將依賴於人類的專業判斷。正因為如此,計算動詞理論對動詞相似度計算的體系的建立是基於一個開放的框架之下提出諸多可行的方法供套用者選取和組合。

動詞機率

傳統的機率事件推廣到計算動詞事件,並提出了基於傳統事件的機率推導出動詞事件機率的方法。根據基礎動詞與由一個基礎動詞衍生出的其它動詞之間的關係,可以從基礎動詞事件的機率推導出許多衍生動詞事件的機率。利用這一機制,基於對一個基礎動詞事件的觀察可以得到一系列相關事件的機率,從而由已知的數據推導出許多沒有觀察數據的關聯事件的機率。
在計算動詞的含糊性和歧義性,並給出了這兩種不確定性的測量方法。計算動詞的含糊性是由相應的動力學系統的狀態的不確定性引起的,而計算動詞的歧義性則是由相應的動力學系統的參數的不確定性帶來的。測量計算動詞的不確定性可以直接由計算動詞坍塌的不確定性來進行,也可以依據計算動詞相似度來進行。另外,對於不確定性本身的動力學特性也可以通過計算動詞的不確定性來建模。從另外一個角度而言,不確定性的進化本身定義了一類特殊的計算動詞。

因果關係

計算動詞理論給出了計算動詞的互相關及相關的不同計算方法及其套用。計算動詞理論的結論可用於發現動態過程間的因果關係,因而可套用於對時間序列的數據挖掘和知識發現等領域。由計算動詞擴展原理引起的不確定性可以用計算動詞的互相關來消除。同時也可以消除計算動詞推理中的不確定性。同計算動詞相似度不同,計算動詞相關能同時表達\相似"和\相反"這兩種動詞間的關係。在許多情況下,動詞相似度是不可能無歧義地表達\相反"的情形。因而,動詞相關在許多套用中更有表達能力。
計算動詞理論討論了計算動詞邏輯中的基礎問題,包括在屬性空間中計算動詞邏輯的計算,動詞說謊者悖論以及動詞規則庫的形式化描述及其合併和分割。動詞邏輯為關於動態過程的知識的表達及處理提供了高效的手段,是動詞推理的基礎。動詞規則庫是利用自然語言來建模工業系統的最為有效的途徑,因而,將一組耦合的動詞規則分解為解耦的幾組規則可以簡化建模複雜程度,並達到對複雜系統分而治之的目的。
計算動詞理論討論了定性特徵不變的形容詞推理及動詞推理。在模糊推理中,形容詞的定性特徵一般會發生改變,這顯然不符合自然語言推理的實際情況。因而本章討論的定性特徵不變的形容詞推理較模糊推理而言更貼近自然語言推理。形容詞推理中的不確定性的消除一般能由坍塌前的計算動詞的 特徵中找到解決的方法。而在動詞推理中產生的不確定性則只能在比物理語言學更先進的後繼學科中找到解決方法。本章也從動詞關係的角度研究了計算動詞規則的推理。

建立規則

計算動詞理論基於動力學的分規則描述建立了分規則計算動詞系統。由於自然語言中動詞的離散性,因而對一個連續系統的描述往往依賴多個互相補充的規則來進行。同時,對於複雜工程問題,通常採用分而治之的模組化方法。這些情況下,對一個複雜非線性動力學系統的建模往往採用分規則的方法來進行。本章著重介紹了分規則線性動詞系統的構建、推理及其套用。動詞系統是計算動詞在自動控制領域套用的基礎。
計算動詞理論利用計算動詞系統提供的對動力學的分而治之的建模方法設計了穩定的計算動詞控制器,並以混沌控制為套用目標,設計了連續的及離散的動詞控制器。在設計這些動詞控制器之前,先利用動詞系統對控制對象進行分規則建模,然後再針對動詞系統模型中的每一條動詞規則進行控制輸入的設計,以達到整體模型的穩定控制。7

PID控制器

計算動詞理論設計了不同類型的計算動詞PID控制器,並同相應的模糊PID控制器進行了比較。作為一種新興的智慧型PID控制器,動詞PID控制器在整體性能上強於模糊PID控制器,並在設計上較後者大為簡化。通過對控制軌線,而不是對控制區域的分劃,動詞PID設計將控制問題的規則所需涵蓋的空間轉化為模糊控制所對應空間的一個流形之上,從而使得智慧型PID控制器的設計更能匹配自然語言表述的簡潔性。這從另一側面體現了計算動詞PID控制器將工程師的動態經驗融合在PID控制器的“智慧型”之中的有效性的理論基礎,即,將設計過程由高維轉化到低維。
計算動詞理論給出了計算動詞決策樹的兩種設計方法。作為對傳統決策樹的拓展,計算動詞決策樹具有在動態數據中發現動詞規則的能力,能夠廣泛地套用於對動態數據的挖掘之中。本章提供了若干實例來說明動詞決策樹的設計。將計算動詞嵌入決策樹之中後,計算動詞決策樹較傳統決策樹而言,增加了預測能力。當動詞決策樹被套用於挖掘歷史數據時,計算動詞對觀察值序列的良好的封裝性使得動詞決策樹能以簡明的結構來表達複雜的數據關係。已有的設計實例也驗證了動詞決策樹能從動態數據中發現傳統決策樹所不能發現的知識。

元胞網路

計算動詞理論將計算動詞規則和人工神經網路相結合構建出不同的動詞神經網路結構。同時,也可以利用動詞規則建模專家知識的簡便性來改造BP算法,以加速傳統BP算法的收斂速度及提高BP算法的穩定性。動詞神經網路將高級的動詞規則結合到低端的神經網路結構之中,使得神經網路訓練的結果更加透明可控。動詞神經網路結構是一種結構化的動詞推理模型,而對動詞神經網路的訓練本質上是對動詞規則的訓練。
計算動詞理論闡述了計算動詞Petri網和計算動詞有窮自動機的基本原理和實例。通過在Petri網中加入建模對象的動態特徵而形成的動詞Petri網能夠反映出令牌數量及延遲的動態變化情況,從而為Petri網提供針對建模對象動態變化的預測能力。在有窮自動機的狀態集合及字母表中加入計算動詞,可以將傳統的有窮自動機擴展成計算動詞有窮自動機。計算動詞有窮自動機已經成功套用於電子遊戲的設計。
計算動詞理論展現了一維及二維計算動詞元胞網路(CVCN)的研究中豐富的成果。分別總結了一維及二維CVCN輸出模式的分類及分布情況,並從理論上分析了多種典型模式的存在條件。作為實現趨邊計算的候選格線結構之一,CVCN有能力處理高級的語言量,比元胞自動機和細胞神經網路更接近人腦的濕件的計算特點。因而,CVCN更適合建模大規模的社會網路。

動詞博弈

計算動詞理論在傳統博弈論中增加反映動態特徵的計算動詞提出了計算動詞博弈論的基本框架。利用計算動詞推理,在計算動詞博弈中對早熟的情況8同樣可以依據支付矩陣給出正確的結論。本章給出了若干典型傳統博弈所對應的動詞博弈並作了細緻的研究。動詞博弈可以處理動力學系統之間的博弈,也可以處理博弈中的動力學。在增加了動力學系統的特性之後,動詞博弈大大地拓展了傳統博弈所能涵蓋的對象和對博弈過程的限定。
計算動詞理論利用計算動詞建模非理性行為的能力,結合股票市場中的各種投機行為的非理性特徵來挖掘和建模各種經濟行為模式。基於股市數據建模的例子,給出了認知經濟學的基本特徵,並將其套用到房地產價格博弈的建模及控制研究之中。認知經濟學將經濟現象放在認知媒介的相互關係的框架下來研究,並把人腦與人腦的關係,以及人腦與電腦之間的關係放在同一套體系之中。在經濟活動越來越虛擬化以及電腦越來越深入到經濟活動的時代,將人腦和電腦放在認知媒介的相互作用而形成的人類社會和機器社會共生體中研究將成為很有必要。這一點將會在PR進入人類生活之後變得更見明顯。

套用

計算動詞理論套用計算動詞於圖像處理之中。首先,根據空間動詞的概念任一幅圖像可被視為空間動詞的集合,則根據專家的經驗可設計出不同圖像處理任務的動詞規則來完成各種圖像處理任務。基於計算動詞的圖像處理算法能實現有效實時的圖像處理任務,適合於超大規模圖像搜尋引擎的設計要求。由於能在語言層次上來表達圖像的認知特徵,同傳統的圖像理解算法相比,計算動詞圖像理解具有更高的效率和更低的設計及維護成本。
計算動詞理論介紹了計算動詞理論在各領域的套用的情況。因為計算動詞建立的初衷是為工程師提供一個簡便有效的體系將自然語言表達的動態知識轉化為可供工程師使用的算法,因而,計算動詞的套用近年來蓬勃發展。計算動詞理論概述了這些套用中具有代表性的案例。套用領域包括:計算機遊戲,PID控制,圖像處理,電機控制,電網控制,導盲系統,回流焊,功率放大器設計,股市數據分析,決策樹,數據挖掘,故障診斷,機器人控制以及電力行銷預測等。

提出背景

目前的人工智慧和信息科學手段還不足以將以上的自然語言規則轉化為計算機擅長處理的測量量,因而無法將這些知識自動地轉化為電腦程式。其中的難點是這些規則中的動詞的可測量化問題在目前的工程技術體系尚無法解決,對人類語言中的動詞的“非理性”無從把握。這一方面影響了解決工程問題的速度,降低了工程經驗的利用效率,增加了開發成本;另一方面,從長遠而言,不利於人類知識體系中動態經驗的積累和再利用。利用計算動詞理論我們將從根本上解決這些問題。
計算動詞理論是由楊濤先生於1997年在美國一流學府伯克利加州大學創立的新興理論。這一理論在深刻思考與總結了人類在認識世界過程中思維及語言的發展規律之後,緊緊抓住了世界永恆發展這一基本規律,從事物的動態特徵描述,計算入手,更加完整,準確地描述對象發展變化的過程特徵。對對象未來的發展趨勢做出準確地預測,將人工智慧及認知科學帶入一個嶄新的天地。在這一理論框架下,傳統的基於靜態特徵的對象描述(比如:傳統的計算機科學對對象的描述)成為其所描述過程的一個點或一個特例,同樣使得靜態特徵的邏輯運算發展成為動態特徵的邏輯預算。為信息科學帶來了前所未有的發展機遇。
楊濤教授,2002起擔任美國楊氏科學研究院的首席科學家,是《國際計算認知》雜誌總編,計算動詞理論創始人。主要從事計算動詞理論、物理語言學、非線性電子電路、計算認知、視覺晶片結構及算法,以及視頻理解算法及體系結構等方向的研究。楊先生擁有一項美國專利,出版了11本專著,發表了超過100篇的學術論文。現為江蘇漢德天坤科技發展有限公司首席科學家。

發展歷程

從1997年到2000年是計算動詞理論的萌芽期。在這一時期主要致力於將非線性動力學中的對於動態系統的建模手段轉化到動詞的形式化建模中,對於計算動詞理論在語言學及認知科學中的意義尚無清晰認識。
2001年到2002年是計算動詞理論的幼年期,在這一時期電子學專家們認識到語言學中大量的觀察結果因缺乏適當的數學工具和測量體系而長期不能自然科學化。
因而, 從2003年到2004年計算動詞理論的研究進入了一個綜合成長期。一方面,在理論上,開始構造物理語言學,這是一個基於計算動詞理論的語言學的可測量化的初步嘗試,也是將語言學中許多的觀察與猜測進行定量化建模的一種理論體系。另一方面,由於認識到計算動詞理論的最終研究對象是人的認知現象,而長期以來,認知所涉及到的研究領域過於龐雜,各領域的專家之間缺乏交流的平台,《國際計算認知雜誌》創刊以提供這一交流的平台。最後,著手進行計算動詞理論工程化方面的前期研究,計算動詞理論只有解決其他理論不能很好解決的工程難題之後才能體現其優越性。
從2005年至今是計算動詞理論進入高速成長期的開端。在理論上宇知理論(The Theory of the Unicogse)得到進一步的發展,並給物理語言學及人的認知的可測量化提供了堅實的理論基礎。

計算動詞理論的優越性

1)開發周期短,從產品的功能設計到原型機的試驗往往比傳統方法縮短一半以上的時間。
2)集群優勢明顯,基於同一物理語言學平台上的產品便如同章回小說的各個章回,互相之間能形成連貫的主線和變化多樣的分支,因而能很自然地形成系列化產品。
3)可再生代碼率高,由於直接利用自然語言進行建模。其模型的通用性好,同一模型在不同的環境和工況下可重複使用率高。這一體系進行軟體包的開發,保證了各種不同功能的軟體之間代碼的可移植性始終由自然語言的可移植性加以保證。
4) 對團隊開發具有極強的繼承性和可拓展性。由於編程方式是基於物理語言學的平台,靜態知識可以方便地由計算名詞表述;同樣,動態知識是由計算動詞表述。工程師在研發過程中的動態知識能有效地用自然語言的形式表達,從而極大地增加了知識的可讀性及可維護可改良性。

計算動詞理論的套用

計算機軟體產業

軟體產業有一個夢想,即對獨立於硬體平台及作業系統條件下的程式的可再生利用。雖然這一產業集中了大量的物力資源和人類最聰明的大腦,多年以來,隨著軟體規模在硬體和套用的驅動下的指數成長,程式的可再生利用的效率卻越來越低。這是由於計算機程式語言對世界模型的過度簡化以及缺乏人類自然語言的柔性所造成的。要改變這種局面,計算機應該象人一樣用自然語言來編程。

機器人產業

在製造業普遍淪為勞動密集型產業的今天,製造業的出路在於機器人產業這樣擁有極高附加值的產業。然而,以目前的機器人的編程體系,距離能進入人類社會生活的機器人時代還有極為漫長的道路。現在的機器人只能被視作“機器”,似乎與“人”毫無關聯。要加快機器人產業的發展,除了機器人的身體機構的建造外,最為關鍵的是其“大腦”的真正的智慧型化。機器人大腦智慧型化的工作將大部分集中在擬人智慧型及機器視覺的進步。擬人智慧型的進步將極大程度地基於計算機的自然語言編程技術的成熟,並極大地促進自然語言編程的進步。這是因為在擁有了來自於機器人身體上的各種感知器之後,感知信號的理解將需要藉助於自然語言,並用以模擬出人的身體對外部世界的感覺。而對感覺的組織將在自然語言的平台上顯現出更深一層次的認知特徵,如情緒等。有了以計算動詞理論為基礎的自然語言編程平台,機器人的擬人智慧型將得到質的飛躍。同樣,計算動詞理論將提供一個全新的基於場景的自然語言表達的機器視覺編程方法來提高機器人的視覺系統的功能和效率。這一機器視覺平台將仿真人的視覺通路中的認知能力,在人工視網膜之後將二維的視頻信號轉化成為特徵空間中的語義描述。一旦場景被自然語言所描敘之後,機器視覺任務便轉化為計算動詞所描述的問題,因而可獲得與符號運算相同層次的高效率的求解。

IT產業的勞動密集型轉化

在計算機硬體速度對計算任務的要求遠遠大於人類全部高端智慧型所能提供的編程能力對計算任務的供給時,計算機剩餘的計算能力將被迫尋求新的計算任務。最終用戶編程將成為IT產業的主流,即:高端IT人才將只向計算機提供框架式的計算任務,而最終用戶將提供各種套用的計算任務。在這種情況下,主要的編程任務將由用戶來完成。

服務業的個人化

在資訊時代,人類社會通過個人計算機完成了計算能力的個人化,通過網路完成了通訊個人化。在計算能力及通訊個人化的支持下,新興的機器人產業必將帶來服務業的個人化,即:家用機器人將完成許多今天的服務業正在完成的任務,比如:護理,美容,餐飲及家政服務等。IT產業的勞動密集型化將大大降低服務業個人化的門檻。這是因為,終端用戶可以通過計算動詞理論提供的自然語言編程平台來實現對個人用機器人的最終編程。這將大大方便單個家用機器人對不同任務及不同家庭環境的編程。當前在國際市場中出現的吸塵器機器人及機器人玩具為我們展示了這一產業的發端。

計算動詞PID控制器

在比例-積分-微分控制器(PID控制器)因其簡單方便的實現而廣泛使用。傳統的PID控制器各項參數固定,難以適應複雜的工況。對於自整定PID控制器來說,增益的整定始終都是其設計的一個挑戰,為了克服這些局限性,人們成功設計出了模糊PID控制器和計算動詞PID控制器。增益自整定(計算)動詞PID控制器是一種新型的PID控制器,是計算動詞PID控制器家族的第一個成員。相對於模糊控制器來說,計算動詞PID控制器使用的規則中的動詞不再是靜態的BE,而是蘊含著動態信息的Become,是一種反映動態經驗的規則。這一改進使得動詞PID控制器的控制規則數大大減少,下面的兩張表顯示計算動詞將原本調節Kp的模糊規則從49項減少到了7項動詞規則。 當模糊PID控制器的控制無法達到更高的精度或者模糊控制系統的設計規則”爆炸“,計算動詞PID控制器是一個很好的選擇。
調節∆Kp的模糊規則庫
∆Kp
ec
NB
NM
NS
ZO
PS
PM
PB
e
NB
PB
PB
PM
PM
PS
ZO
ZO
NM
PB
PB
PM
PS
PS
ZO
NS
NS
PM
PM
PM
PS
ZO
NS
NS
ZO
PM
PM
PS
ZO
NS
NM
NM
PS
PS
PS
ZO
NS
NS
NM
NM
PM
PS
ZO
NS
NM
NM
NM
NB
PB
ZO
ZO
NM
NM
NM
NB
NB
調節Kp的計算動詞規則庫
規則
計算動詞規則
C1
IF e(k) become(zero, zero), THEN Kp become(small, big);
C2
IF e(k) become(big, medium), THEN Kp fast ◦ become(big, small);
C3
IF e(k) become(medium, small), THEN Kp become(big, small);
C4
IF e(k) become(small, zero), THEN Kp slowly ◦ become(big, small);
C5
IF e(k) become(zero, small), THEN Kp slowly ◦ become(small, big);
C6
IF e(k) become(small, medium), THEN Kp become(small, big);
C7
IF e(k) become(medium, big), THEN Kp fast ◦ become(small, big).
在文章中對傳統PID控制器、模糊PID控制器和計算動詞PID控制器進行了比較,在二階過程G1、一階過程G2和二階時滯過程G3中對三種控制器進行仿真比較,以下為G2的誤差曲線比較。仿真結果表明D型動詞PID控制器對G2的控制最佳,而模糊和傳統PID控制器的控制控制效果相似。
G2誤差曲線G2誤差曲線
G2誤差曲線放大圖G2誤差曲線放大圖

計算動詞元胞網路

計算動詞元胞網路(Computational Verb Cellular Networks),簡稱CVCN,是一種以計算動詞規則為局部規則的新型元胞網路。元胞神經網路(CNN)中元胞的動力學是用微分和差分方程設計的,局部規則是基於布爾邏輯或模糊邏輯,而CVCN中元胞的動力學是通過物理語言來描述的。它可以通過自然語言表達來建模人類社會中存在的合理與不合理的內在相互作用。元胞自動機通過布爾邏輯和模糊邏輯來構建局部規則,它的狀態是離散的,每個變數只有限多個狀態。CVCN通過計算動詞規則來構建局部規則,它的狀態空間可以是連續的。因為CVCN套用了計算動詞這樣一個可測量工具來建模,在實際套用中它更能體現人類語言邏輯的習性,所以用CVCN來建模人類社會中合理與不合理的表現是非常適合的。
廣義的CVCN指的是CVCN的最大類。廣義的CVCN有如下幾個特性:
廣義的計算動詞元胞網路廣義的計算動詞元胞網路
1、元胞的鄰居數量可以是空間可變的。(也就是說同一個元胞網路中,元胞A有9個鄰居,而元胞B可以有5個鄰居或者其它數量的鄰居)
2、元胞和它的鄰居之間相互影響的拓撲結構和模式可以是空間可變的。
3、元胞屬性的定義可以是空間可變的。(比如,某個CVCN可以由兩種元胞組成,一種元胞用來建模獵狗,一種元胞用來建模野兔。一個獵狗元胞的鄰居總體和一個野兔元胞的鄰居總體可以存在本質上的不同)
簡單的一維計算動詞元胞網路和簡單二維計算動詞元胞網路是CVCN的兩個子集。它們的元胞鄰居數量是空間不變的,元胞和其鄰居相互影響的拓撲結構也是空間不變的,它們屬性的定義也是空間不變的。
僅僅在這兩個子集中,已經發現了大量的模式。例如典型的二維模式:棋盤格、格線、雙色條紋、多色條紋、圖靈斑紋、旋轉波等。它們是CVCN經過離散化之後表現到二維像素圖片中觀察到的現象的一些歸類。
一臂旋轉波一臂旋轉波
二臂旋轉波二臂旋轉波
三臂旋轉波三臂旋轉波
雲
四臂旋轉波四臂旋轉波
三角波三角波
愛心旋轉波愛心旋轉波
箭靶波箭靶波
讀者可以閱讀的第二十一章了解更多關於計算動詞元胞網路的內容。

計算動詞決策樹

計算動詞決策樹是一種從包含計算動詞或者時間序列的數據集中概括和提取知識的有力工具。傳統決策樹只能對離散靜態的知識建模,無法對動態只是建模,在動態數據越來越多的情況下,傳統決策樹的弊端顯得尤為突出,而計算動詞決策樹的優勢就顯得越為重要。動詞決策樹不僅繼承了傳統決策樹的優點,同時把其套用推廣到含有動態數據屬性的數據,其節點不再是像傳統決策樹那樣的靜態屬性,而是動態的動詞節點。相比傳統決策樹,動詞決策樹不僅可以想傳統決策樹那樣過程可以是離散的,也可以是由離散組成的動態過程,而且動態過程比傳統決策樹更加細膩。
計算動詞理論
計算動詞理論
雖然各種類型的信息都可以看成某時刻的一個靜態點,但是信息的歷史記錄是以動態模式存在的。任何事件、事物和人物的歷史記錄都可以轉化為時間序列,從數據中概括出來的時間序列記錄使得我們能理解數據中的動態特性,動詞決策樹在這些動態數據當中表象相當完美。讀者可以閱讀的第十八章了解更多關於計算動詞決策樹的內容。詳細介紹可見參考。

在大數據挖掘中的套用

計算動詞理論在大數據中的套用十分廣泛,已經套用到了現今許多大數據的方向中,如經濟金融、圖像處理等。使用動詞化的方式,可以對數據進行有效的壓縮和聚類,削減組合爆炸的風險。而尤其重要的一點是在對數據之間的“相關性/因果性”的區分,對於傳統的方法可以比較有效的檢測相關,而對因果性的檢驗缺很乏力,而計算動詞結合了語言的特性,可以更為有效的檢測出數據間的因果關係。

計算動詞理論在金融數據的套用

計算動詞理論套用到金融數據處理當中是極其正確且有效的套用,計算動詞理論在處理時間序列數據有其獨特的天生的優勢,金融數據的趨勢變化與計算動詞趨勢的動態變化可以完全結合在一起。計算動詞決策樹和計算動詞貝葉斯網路都可以套用到股票價格變化趨勢的預測,與傳統股票價格預測方法不同。最常用的股票價格預測方法為神經網路方法預測股票價格,其計算量大,價格預測準確度較低,計算動詞理論在股票價格變化趨勢預測上可以表現的很優越。例如,對於股票數據處理,首先應對股票價格或者股票的其他數據動詞化,動詞化後的數據就成了股票價格變化的趨勢,而不再是股票具體價格的變化;其次,動詞化後的數據可與計算動詞的模板動詞求計算動詞相似度,隨後動詞化的數據可用模板動詞代替,這樣就大大減少了數據處理計算量,並且能夠得到令人滿意的效果。

計算動詞理論在機器視覺及圖像處理的套用

在圖像處理當中,有相當大的一部分需要使用機器學習算法,而計算動詞理論在傳統機器學習算法中已有套用,所以計算動詞理論套用到圖像處理是可行的。同樣的,在提取圖像特徵後,需對特徵數據動詞化,比如對圖像的直方圖動詞化,然後把動詞化後的數據套用於傳統算法或者是經過計算動詞理論改進的算法中,均可以得到明顯的效果。例如,在超解析度圖像中,計算動詞插值方法的效果在邊沿處理上超過了傳統的插值方法;在求取圖像紋理相似度時,傳統方法可以套用GLCM方法,Tamura方法,甚至是Gabor小波算法,這些算法都是比較流行的算法,但計算動詞相似度套用到紋理相似度時,效果和速度都可以大幅度提高;另外,在圖像增強方面,計算動詞理論套用到直方圖均衡算法中,可以使均衡後的圖像更加接近人眼的舒適度,並且可以減少噪音的放大等等。

相關詞條

熱門詞條

聯絡我們