基於原型理論與語義重構的含糊概念表示研究

基於原型理論與語義重構的含糊概念表示研究

《基於原型理論與語義重構的含糊概念表示研究》是依託浙江大學,由湯永川擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於原型理論與語義重構的含糊概念表示研究
  • 依託單位:浙江大學
  • 項目負責人:湯永川
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

本項目針對傳統含糊概念表示在高維數據語義分析方面的瓶頸問題,試圖建立一種具有近鄰保持與語義重構特性的含糊概念表示模型- - 隱語義細胞簇。隱語義細胞以概念的原型作為其細胞核,其激活機制的原理可概括為:如果細胞核同外界刺激鄰近程度高,則其激活程度高;並且簇內的隱語義細胞能根據激活程度線性重構外界刺激。 主要研究內容涉及:(1) 隱語義細胞簇的激活計算模型研究。包括基於線性規劃與二次規劃的激活計算模型研究,以及激活計算模型魯棒性分析研究。(2) 隱語義細胞簇形成機制及最佳化方法研究。包括無監督與有監督的最佳化方法研究。(3) 同構隱語義細胞簇及對偶隱語義細胞簇研究。包括保語義重構關係的數據同構變換及其線性化模型。(4) 基於隱語義細胞簇的推理系統研究。包括隱語義細胞鄰對的學習以及語義細胞邊界密度函式的估計方法。隱語義細胞簇在高維數據語義分析,特別在含糊概念學習、分類、數據降維與聚類等方面有重要套用。

結題摘要

含糊概念表示作為人工智慧的基礎科學問題,在大數據時代再次受到大量研究人員的關注。經典的含糊概念表示方法如模糊集理論以漸進的隸屬函式來刻畫概念的含糊性,新興的量子機率模型將含糊概念看成是希爾伯特空間上的量子態,這些方法都能很好的刻畫概念的含糊性,部分體現了從數據到概念的抽象加工過程。但人腦概念認知還有一些其他的重要特性,如從概念到實例的具象推理過程。本項目綜合考慮概念認知的兩個重要特性,從數據到概念和從概念到實例,系統研究基於原型理論與語義重構的含糊概念表示方法,提出並建立了獨具特色的模糊語義細胞模型,提出了基於模糊語義細胞模型的從數據到概念的抽象方法以及從概念到實例的模糊語義重構方法。一些重要的研究結果包括: (1)語義細胞認知結構與計算模型的研究。我們區分了兩種語義細胞,一種是模糊語義細胞模型,一種是普通語義細胞模型。它們都由一個三元組來表示,分別對應概念的原型、距離測度、以及概念邊界的確定或不確定分布。 (2)語義細胞模型數字特徵的研究。語義細胞作為概念表示的一種最小單元,具有概念原型、期望粒度、模糊熵等重要數字特徵。這是傳統的模糊集理論難於刻畫的概念巨觀特徵。 (3)基於單個語義細胞模型的概念學習方法研究。我們提出概念歸納的基本原則,包括最大覆蓋度原則,最小期望粒度原則,最大模糊熵原則。並基於這些原則的綜合套用提出了模糊語義細胞模型歸納學習方法。 (4)基於語義重構的概念邊界分布學習方法研究。引入近鄰保持關係,將隸屬函式與原型巧妙的結合在一起,採用線性組合的思想來表示實例。由此發展出了新型的模糊語義細胞學習方法。 這些研究成果為進一步研究複雜概念的抽象機制奠定了基礎,為實現大數據到大知識的發現和套用提供了理論指導和方法論。特別的,模糊語義細胞模型還適合稀疏數據的概念學習以及概念更新、合併和生成。這些特性將為模糊語義細胞模型的廣泛套用鋪平道路。

相關詞條

熱門詞條

聯絡我們