定義
知識體協同計算是知識體之間通過一定的互動語言,共同協作完成任務的整個計算過程。在這個過程中,知識體要能理解以一定規範表達的任務規劃,能根據任務需要推進自主計算,並在一些合適的節點跟其他知識體進行互動,從而協同完成整個任務。
總體架構
知識體的任務規劃及協同框架如圖1所示,採用面向搜尋任務的多知識體混合式協同方法。協同中既有統一的控制又有局部的協同。圖1中,基於對用戶搜尋意圖的理解,多目標最佳化器從任務規劃空間求解最佳化的任務規劃,根據生成的任務規劃,由知識體組裝及部署器進行知識體的線上組裝,並按需部署到計算節點。知識體的任務規劃是“層層獲取知識”的模式,下層的知識體首先從知識源進行面向特徵的知識抽取,然後中間層知識體進行局部知識的融合與推理,最後匯集到上層知識體成為用戶需要的知識。多知識體的協同既有層層間的協同,即下層向上層匯聚知識,也有同層之間的協同,如對某一知識源的抽取進行分工合作。多知識體的協同也是一種動態的協同,在任務執行期間,根據系統的負載情況或者知識源的變化情況,知識體可以動態地加入或退出任務。
知識體互動語言
知識體是基於知識源的,具有自治性、可移動性、可配置性,能自主學習和演化的搜尋任務實體。知識體互動語言從數據、信息/知識、設備等方面來定義知識體的表示方法。對數據而言,知識體提供對數據的共享、訪問,其表示是對數據結構、語義的半結構化描述。知識體還將提供信息和高階知識作為服務,服務語言包含信息互動的類型及規範、訊息、參數、操作的協定,類似成熟的WSDL等語言。對設備而言,包括相關的訪問接口、參數、操作,並提供訪問控制和安全保證。此外,知識體還有註冊方式與表示,通過統一描述、發現和集成協定下的知識體。
協同任務規劃
多知識體協同任務規劃描述語言MKA-PDDL,對多知識體協同任務規划進行描述。該語言規範在標準的規劃領域定義語言PDDL的基礎上進行擴展。語言規範對領域(domain)、知識體(KnowledgeActor)、行動(Action)、問題(problem)、目標(goal)等一系列對象進行定義。例如問題的定義規範格式如下:
<problem>::=(define (problem <name>) (:domain <name>) [<require-def>] [<object declaration>] <init> <goal> [<constraint>] <metric-spec>* [<length-spec>]
|
多知識體協同任務規劃由多目標最佳化的任務規劃器生成,在知識體創建和組裝後,基於多知識體協同任務規劃生成多知識體的具體協同策略。
多目標的協同通過一個標量函式轉換為單目標的馬爾科夫決策過程。馬爾科夫決策過程包括知識體的集合,狀態的集合,知識體動作集合,狀態轉換函式和回報函式。標量函式把一個多目標的回報值映射到一個標量值,則可以把標量函式融合到馬爾科夫決策過程中將其轉換為單目標問題求解。把多目標馬爾科夫決策過程的分為三個階段,如圖2所示。在規劃和學習階段,利用算法獲取可能的方案集合,即覆蓋集,最佳化的解都將在這個集合中。在選擇階段,選擇合適的方案進行標量化,最終轉換為單目標問題並在執行階段執行。
多模態融合的知識體協同計算
搜尋引擎需要融合來自多知識體的譜系知識,傳統方法通常採用圖匹配的方法,將問題轉化為多個圖譜化知識表示之間的合併映射問題,但多源知識的不一致表示等問題使得融合效果較差。基於神經網路的融合方法則適用性更好,構建以一階謂詞邏輯作為約束的深度學習模型,利用知識作為最佳化目標的約束,將知識作為神經網路的先驗知識指導深度神經網路的學習。該方法同樣具備容錯能力,能夠處理多源異構知識的不一致性現象,但能夠處理的知識規模超過馬爾科夫邏輯網方法。
由於多模態譜系抽取通常使用多個智慧型體提取不同模態的譜系信息,而傳統的譜系表示策略僅針對單個數據模態進行建模,難以實現針對多模態譜系的融合表示。為此,本項目擬將多視角學習的思想與知識表示相結合,利用不同智慧型體抽取到的多模態譜系信息進行多視角建模,構造子空間表示模型,之後利用視角之間冗餘的一致性信息學習譜系知識在公共空間中的聯合表示。
公共空間是通過多個不同的視角學習得到的,每一個視角都表達了對某一數據模態的描述信息。為了全面地描述每個譜系實體,不同視角所固有的性質在公共空間中都得以保留。拉普拉斯矩陣能夠有效地實現數據表示與聚類,並能夠基於譜圖理論捕獲數據之間內在的相關性信息。因此,我們對公共空間與各視角空間的規範化拉普拉斯矩陣之間的差異性進行懲罰,從而保證不同視角空間的特徵能夠在公共空間中都儘可能得以保留,從而在最佳化過程中實現對多模態譜系的有效表示。該最佳化目標可與其他套用的目標函式實現協同最佳化,從而利用套用任務進一步增加特徵空間的學習效果。
多模態知識體的融合協同推理方法
針對不同模態知識體所承載的不同功能目標,研製知識體的構建框架。同時結合複雜任務的執行代價模型,充分考慮任務間的任務間協同性,研究執行方案的最佳化技術。
針對海量的用戶互動歷史數據,結合知識圖譜和過程描述語言對複雜查詢的語義和執行過程進行綜合,生成對用戶意圖深入理解的任務總控知識體。在傳統的模板技術的基礎上擴充搜尋任務之間關係描述機制,並在此基礎上研究複雜搜尋任務的匹配和分解技術。並利用知識圖譜作為語義處理的基礎,融合各知識體形成的搜尋結果。
結合面向複雜搜尋任務的知識體的描述要素,構建複雜任務的執行代價體系,利用啟發式方法生成候選的執行方案。針對運行時的中間結果和知識體的結果生成狀態,通過研究面向區域穩定的執行方案,並通過中間結果的臨時存儲機制實現執行方案的動態調整機制,儘早完成複雜搜尋任務的執行,形成用戶滿意的搜尋結果。