多通道交叉驗證的知識獲取是指對不同來源通道中獲取的知識進行交叉驗證,以獲得更準確和單通道無法獲取的知識。其中,知識獲取是指從泛在網路空間數據中獲取本體知識的過程,其被首先定義在專家系統中 [1] 。
基本介紹
- 中文名:多通道交叉驗證知識獲取
- 外文名:Multi-Channel Cross-Validation KnowledgeAcquisition
在複雜網路空間中,不同數據源對知識的描述存在不一致的情況。多通道交叉驗證的知識獲取技術依託知識的多通道表示技術,研究知識衝突的關聯和類別,研究面向多通道知識和時空屬性的交叉驗證方法和衝突消解技術,基於知識推理和約束鬆弛進行知識的有效融合,構建知識一致的高質量知識譜系。
在交叉驗證部分,當前方法將多通道學習的思想與知識表示相結合,利用從不同數據源所抽取到的知識進行多視角建模,構造子空間表示模型,之後利用通道之間冗餘的一致性信息學習項目事件在公共空間中的聯合表示,從而利用該聯合表示與各子空間表示的相性關係實現交叉驗證。
“公共空間”是通過多個不同的數據源通道學習得到的,每一個通道都表達了對某一數據模態的描述信息。為了全面地描述每個譜系知識,不同通道所固有的性質在公共空間中都得以保留。拉普拉斯矩陣能夠有效地實現數據表示與聚類,並能夠基於譜圖理論捕獲數據之間內在的相關性信息。因此,當前方法可以對公共空間與各通道空間的規範化拉普拉斯矩陣之間的差異性進行懲罰,從而保證不同通道空間的特徵能夠在公共空間中都儘可能得以保留。為了實現對知識譜系在公共空間的表示,及其在各通道子空間的表示,當前方法擬分別在各個子空間及公共空間中利用轉移表示方法進行知識譜系的向量化表示學習,從而得到融合多通道信息的知識譜系表示。
通過對比公共空間與各通道子空間上各知識表示之間的向量相似度,可計算該模態知識與其他模態知識之間的差異性信息,若差異性較小則表明該知識條目為可靠信息。