面向關係資料庫知識發現的機率邏輯貝葉斯網路研究

面向關係資料庫知識發現的機率邏輯貝葉斯網路研究

《面向關係資料庫知識發現的機率邏輯貝葉斯網路研究》是依託吉林大學,由王利民擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向關係資料庫知識發現的機率邏輯貝葉斯網路研究
  • 項目類別:面上項目
  • 項目負責人:王利民
  • 依託單位:吉林大學
項目摘要,結題摘要,

項目摘要

關係資料庫知識發現是目前國內外研究的熱點,它對於工業與醫療診斷、軟體智慧型化、金融風險分析等需要關係數據挖掘的套用領域有著重要的實際意義。貝葉斯網路被視為關係模型和機率關係相結合的主要研究方向,但基於數值的觀點無法進行條件推理。本項目以關係數據規範化理論為基礎,結合條件事件代數建立數據-因果依賴描述框架,根據機率推理規則進行依賴關係約簡併進而簡化機率推理過程,通過對資訊理論的擴展性研究揭示數據依賴所蘊含的信息流動方式,從而構造可以完備描述依賴關係的機率邏輯貝葉斯網路空間數據模型。同時分別從數據依賴和互信息角度分析條件獨立性和d-分隔之間的聯繫,基於乘積空間條件事件代數將依賴關係概念性描述映射成貝葉斯網路的局部擴展結構,解決機率邏輯貝葉斯網路的實現問題。本項目融合基於數值和代數的觀點構建貝葉斯網路,既是為了滿足社會各行業對關係資料庫知識發現的迫切需求,也可為貝葉斯網路研究提供新思路和理論依據。

結題摘要

關係資料庫知識發現是目前國內外研究的熱點,它對於工業與醫療診斷、軟體智慧型化、金融風險分析等需要關係數據挖掘的套用領域有著重要的實際意義。貝葉斯網路被視為關係模型和機率關係相結合的主要研究方向,但基於數值的觀點無法進行條件推理。本項目以關係數據規範化理論為基礎,建立機率-邏輯依賴描述框架。研究內容主要涉及根據機率推理規則進行依賴關係約簡併進而簡化機率推理過程、通過對資訊理論的擴展性研究揭示數據依賴所蘊含的信息流動方式、從數據依賴和互信息角度分析各要素之間的因果聯繫、將因果依賴關係概念性描述映射成貝葉斯網路的局部擴展結構,從而構造可以完備描述依賴關係的機率邏輯貝葉斯網路空間數據模型,解決貝葉斯網路的正逆向推理問題。提出並證明了函式依賴的機率表達等價形式;提出對應於Armstrong公理系統的完備性機率函式依賴規則,以及在函式依賴約束下確定冗餘變數應遵循的基本原則;建立不同情況下函式依賴所對應的條件獨立性機率表達形式;通過建立全機率的鏈規則分解和圖模式的對應關係,推導出條件機率和互信息的映射關係,提出貝葉斯分類模型構建的2個基本要素:變數有序性和父子變數間的強相關性;對於貝葉斯分類模型的連續屬性機率密度問題,在高斯網路理論的基礎上,給出了聯合高斯密度的分解與組合定理,以及條件高斯密度計算定理,為屬性聯合密度的分解計算提供理論依據和實現方法;通過Copula進行高斯函式與高斯核函式的整合,來實現它們之間的優勢互補。給出了基於高斯Copula的屬性聯合密度分解計算和條件密度估計的方法,有效降低高斯Copula密度函式的運算複雜性並提高可靠性。本項目的研究成果不僅提高了貝葉斯網路分類器的性能和實用性,拓寬了其套用領域和套用範圍,項目成果具有重要的理論意義和實踐價值。

熱門詞條

聯絡我們