《基於圖結構的文獻挖掘算法研究》是依託清華大學,由黃民烈擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於圖結構的文獻挖掘算法研究
- 依託單位:清華大學
- 項目負責人:黃民烈
- 項目類別:青年科學基金項目
- 研究期限:2009-01-01 至 2011-12-31
- 批准號:60803075
- 支持經費:21(萬元)
- 申請代碼:F0211
- 負責人職稱:副教授
《基於圖結構的文獻挖掘算法研究》是依託清華大學,由黃民烈擔任項目負責人的青年科學基金項目。
《基於圖結構的文獻挖掘算法研究》是依託清華大學,由黃民烈擔任項目負責人的青年科學基金項目。項目摘要傳統的文本表示方法是建立在詞袋(Bag-Of-Words)表示方法上的,即認為文檔是一個關於詞或短語的離散集合。經典的信息...
第1章是緒論,介紹了數據挖掘的概念、產生背景以及套用價值;第2章給出了知識發現的過程分析和套用體系結構設計,並對數據挖掘套用系統的主要功能部件和關鍵步驟進行了剖析;第3章全面闡述了關聯規則挖掘的原理和算法,並對一些新的焦點問題(如多維、數量、約束關聯規則挖掘)的成果儘可能地加以介紹;第4章給出分類的...
1.1 空間數據挖掘的由來 1.2 空間數據挖掘國內外研究進展 1.3 空間數據挖掘的難點 1.4 本書的內容和組織結構 參考文獻 第2章 空間數據挖掘基礎 2.1 基本概念 2.2 空間數據挖掘視角 2.3 從空間數據到空間知識 2.4 空間粒度和空間尺度 2.5 空間數據挖掘可發現的知識類型 2.6 空間知識的表達 2.7 空間...
因此,可以將數據集結構信息以某種 形式引入基於約束的聚類方法中,以超越有限的約束 條件來得到更好的聚類效果。有幾種不同的自適應距離度量被使用,例如用期望值最大化(EM)方法訓練 得到的串編輯距離(String-Edit Distance)和由最短距離算法修訂過的歐幾里得距離。文獻[4]提出一種對現有約束進行擴展的方法,即基於密...
Trung和Xin Yao將文化算法與疊代局部搜尋(Iterated Local Search,ILS)結合,提出了一種新的基於種群的構架CA—ILS,用於解決單目標無約束數值最佳化問題。該算法能夠有效地檢測問題的結構模式,自適應地改變全局搜尋補償和方向,從而能很快地找到下一個更優解。套用 1.在不同的種群內可按不同的速度進行進化求解的複雜...
1.8.1數據挖掘與CRM 1.8.2數據挖掘與社會網路 1.8.3數據挖掘套用的成功案例分析 1.9本章小結和文獻注釋 習題1 第2章知識發現過程與套用結構 2.1知識發現的基本過程 2.1.1數據抽取與集成技術要點 2.1.2數據清洗與預處理技術要點 2.1.3數據的選擇與整理技術要點 2.1.4數據挖掘技術要點 2.1.5模式...
《生物醫學文本大數據中的疾病關係並行挖掘模型研究》是依託長沙理工大學,由楊黎擔任項目負責人的青年科學基金項目。項目摘要 本項目旨在通過深入分析生物醫學文本中非結構化數據的特點,研究面向疾病關係並行數據挖掘中模型訓練、模型推斷、實體標註以及語義挖掘等關鍵理論問題,設計並實現基於MapReduce的文本分類、分析和處理...
7.5.3 rock:分類屬性的層次聚類算法 271 7.5.4 chameleon:利用動態建模的層次聚類算法 272 7.6 基於密度的方法 273 7.6.1 dbscan:一種基於高密度連通區域的基於密度的聚類方法 273 7.6.2 optics:通過點排序識別聚類結構 275 7.6.3 denclue:基於密度分布函式的聚類 276 7.7 基於格線的方法 278 7....
1.3國內人文社會科學研究成果評價的主要觀點 參考文獻 第2章跨界知識模型和估計過程 2.1跨學科研究進展 2.2跨界知識模型的含義 2.3人文社會科學跨界知識模型的估計過程 2.4跨界知識模型的框架和數據 參考文獻 第3章社會網路分析 3.1社會網路的概念與發展 3.2社會網路的基本特徵 3.3網路抽樣 3.4社群挖掘算法 ...
這些融入輔助信息的推薦系統含有多種類型的圖結構,如用戶和項目的互動二部圖,用戶之間的社交網路,項目和其屬性之間的知識圖譜等。作為新興的機器學習技術,圖表示學習可以有效處理圖結構,一方面可以有效提升推薦質量,另一方面可以為推薦結果提供可追溯性和可解釋性。基於此,本書主要研究基於圖表示學習的深度推薦系統...
17.5.2 基於頻繁子結構的方法94 17.6 圖分類 96 17.6.1 基於距離的方法96 17.6.2 基於頻繁子結構的方法97 17.6.3 核心SVM98 17.7 小結98 17.8 文獻注釋99 17.9 練習題99 第18章 挖掘Web數據101 18.1 引言101 18.2 Web爬取和資源發現102 18.2.1 基本爬蟲算法102 18.2.2 偏好...
3.8 文獻注釋70 3.9 練習題71 第4章 關聯模式挖掘73 4.1 引言73 4.2 頻繁模式挖掘模型74 4.3 關聯規則的生成框架76 4.4 頻繁項集挖掘算法77 4.4.1 暴力算法78 4.4.2 Apriori算法78 4.4.3 枚舉樹算法81 4.4.4 遞歸的基於後綴的模式生長方法89 4.5 替代模型:有趣模式96 4.5.1...
當下,由於強大的數據挖掘軟體平台很容易獲得,草率地使用數據挖掘方法和技術將導致挖掘的結果混淆難解。這種失誤往往源自盲目使用“黑盒子”方法進行數據挖掘,而最好的避免途徑就是使用“自盒子”方法,理解隱藏在軟體背後的算法和統計模型結構。作者簡介 作者:(美國)拉羅斯(Daniel T.Larose) 譯者:劉燕權 胡賽全 ...
特定拓撲結構可以理解為是對交通網路按照一定規則分解後得到的一些具有良好數學和拓撲特性的子網路,是交通分配子問題定義的載體,也是算法進行流量操作的最小拓撲結構。本課題的研究內容圍繞特定拓撲結構展開:首先,我們對文獻中的現有算法所採用的特定拓撲結構的拓撲特性,分解方法,子問題定義方法,子問題求解方法和算法...
3.4 Python主要降維算法 第4章 分類與預測 4.1 回歸分析 4.2 聚類分析 4.3 判別分析 4.4 關聯規則算法 4.5 推薦系統算法 4.6 Python算法的實現 第5章 圖形數據處理 5.1 圖形數據結構 5.2 數字圖像處理 5.3 圖像模式識別 5.4 大圖形的社區結構識別 5.5 基於圖的拓撲結構相似度的地質文獻與信息...
本書旨在講述這些任務以及它們的核心挖掘算法;儘可能涵蓋每個話題的廣泛內容,給出足夠多的細節,以便讀者無須藉助額外的閱讀,即可獲得相對完整的關於算法和技術的知識。其中結構化數據的抽取、信息整合、觀點挖掘和Web使用挖掘等4章是本書的特色,這些內容在已有書籍中沒有提及,但它們在Web數據挖掘中卻占有非常重要的...
8.2 Web數據挖掘 8.2.1 Web內容挖掘 8.2.2 Web使用挖掘 8.2.3 Web結構挖掘 8.3 案例五——跨語言智慧型學術搜尋系統 8.3.1 混合語種文本分詞 8.3.2 基於機器翻譯的跨語言信息檢索 8.3.3 不同語種文本的搜尋結果聚類 8.3.4 基於聚類的個性化信息檢索 8.3.5 基於聚類的查詢擴展 8.3.6 ...
1.1.2數據挖掘的定義與解釋1 1.2數據倉庫系統的相關技術3 1.2.1數據倉庫系統相關技術之間的關係3 1.2.2數據倉庫系統模式7 1.3數據倉庫系統中多維數據組織的形式化定義與描述9 1.4數據挖掘方法與研究體系16 1.4.1數據挖掘系統的發展與結構16 1.4.2數據挖掘的相關技術與工具17 1.4.3數據挖掘套用及發展...
因此,基於網頁內容的分析算法也從原來的較為單純的文本檢索方法,發展為涵蓋網頁數據抽取、機器學習、數據挖掘、語義理解等多種方法的綜合套用。本節根據網頁數據形式的不同,將基於網頁內容的分析算法,歸納以下三類:第一種針對以文本和超連結為主的無結構或結構很簡單的網頁;第二種針對從結構化的數據源(如RDBMS...
本書主要介紹數據倉庫和數據挖掘技術的基本原理和套用方法。全書共分為12章,主要內容包括數據倉庫的概念和體系結構、數據倉庫的數據存儲和處理、數據倉庫系統的設計與開發、關聯規則、數據分類、數據聚類、貝葉斯網路、粗糙集、神經網路、遺傳算法、統計分析、文本和Web挖掘。圖書目錄 第1章數據倉庫的概念與體系結構 1.1...
第8章 空間數據挖掘 8.1 引言 8.2 空間數據概述 8.2.1 空間查詢 8.2.2 空間數據結構 8.2.3 主題地圖 8.2.4 圖像資料庫 8.3 空間數據挖掘原語 8.4 一般化和特殊化 8.4.1 漸進求精 8.4.2 一般化 8.4.3 最近鄰 8.4.4 STING 8.5 空間規則 8.5.1 空間關聯規則 8.6 空間分類算法 8....
1.3 譜聚類算法的研究現狀及發展 1.4 集成學習的研究現狀及發展 1.4.1 集成學習系統的組成 1.4.2 多樣性個體的構造 1.4.3 合併策略 1.4.4 選擇性集成 1.5 圖像分割簡介 1.5.1 圖像像素特徵提取 1.5.2 基於聚類分析的圖像分割 1.6 本書的主要工作和結構安排 本章 參考文獻 第2章 譜聚類與...
2.2.4 單層與多層網路結構 27 2.2.5 網路學習方式 32 2.2.6 經典學習規則 34 2.3 LMS和SDA方法 35 2.3.1 平均平方誤差函式 36 2.3.2 LMS和SDA算法 39 2.4 後向傳播算法 43 2.4.1 概況 43 2.4.2 多層網路BP算法 44 參考文獻 50 第3章 基於支持向量的挖掘理論 52 3.1 支持向量與分類...
在遠程通訊部門:基於DM的分析協助組織策略變更以適應外部世界的變化,確定市場變化模式以指導銷售計畫。在網路容量利用方面,DM能提供對客戶組類服務使用的結構和模式的了解,從而指導容量計畫人員對網路設施作出最佳投資決策。化學/製藥行業:從各種文獻資料總自動抽取有關化學反應的信息,發現新的有用化學成分。在遙感...
關鍵鏈(Critical Chain)是由高德拉特(Eli Goldratt)博士提出的一種基於約束理論(Theory of Constraints)的項目管理方法。關鍵鏈項目管理 關鍵鏈項目管理基於從約束理論導出的方法和算法。 CCPM的概念於1997年在Eliyahu M. Goldratt的書“關鍵鏈”中引入。 CCPM的套用被認為比1910年至1950年代開發的傳統方法(即CPM,...
並將粒計算方法引入數據挖掘和機器發現.依據人們在解決問題時能從不同的粒度世界去分析和觀察同一問題,並且很容易地從一個粒度世界轉到另一個粒度世界,張鈸和張鈴在1990年針對複雜問題求解,建立了一種複雜問題求解的商結構形式化體系,給出了一套解決信息融合、啟發式搜尋、路徑規劃和推理等問題的理論和算法.1997...
針對現有圖像修複方法中待填充塊在全局搜尋與之最匹配塊的計算複雜度高、結構連貫性和紋理清晰性不佳的缺點,文獻[36]提出了基於塊結構稀疏度的自適應圖像修復算法。針對圖像結構信息缺損較大的圖像,提出利用結構約束和樣本稀疏表示實現圖像修復,該方法既能較好的修復圖像邊緣結構,又能保持結構的整體平滑性。壓縮感知...
但是這些指標對網路的拓撲結構依賴性很強. 而Kitsak 等從新的視角提出利用K-核分解來研究網路中的關鍵節點, 該方法認為關鍵節點的重要性與其所處網路的位置有關, 將外層的節點層層剝去, 處於內層的節點即為網路中的關鍵節點. 另外, 在搜尋引擎領域, 排序問題的研究已經廣為人知, 如著名的Google網頁排名算法Page...
與統計方法相比,數據挖掘可用於對一個站點上的各種特徵進行深度研究,包括站點的交通測度以及各個國家的IP位址的分配。數據挖掘在文獻和引文資料庫中所套用的方法之一聚類分析技術,在網路環境下也同樣適用。⑷運用解釋和模擬網路結構和增長理論工具進行模擬研究 這種方法就是通過構建網路結構的模型來研究網路,諸如網路的...
後來的研究者開始開發一些能夠在網際網路上使用,便於不同系統交換數據的工具。比如eFlora的互動式檢索表(Brach & Song,2006)。這些工具很多都採用了 TDWG推薦的結構化描述性數據(Structured Descriptive Data, SDD)標準,並且能夠和早期的DELTA數據兼容。物種鑑定的本質是人們對物種實體資料的準確認知。除了將檢索表...