《基於核矩陣學習的半結構化文本挖掘研究》是依託北京大學,由楊建武擔任負責人的專項基金項目。
基本介紹
- 中文名:基於核矩陣學習的半結構化文本挖掘研究
- 項目負責人:楊建武
- 項目類別:專項基金項目
- 依託單位:北京大學
- 負責人職稱:教授級高級工程師
- 申請代碼:F0211
- 研究期限:2007-01-01 至 2007-12-31
- 批准號:60642001
- 支持經費:7(萬元)
項目摘要
隨著XML標準被普遍採用,以XML為代表的半結構化文檔數量迅速增長。半結構化文本作為一種新的數據形式,是文本內容信息與結構信息的綜合體。半結構化文本挖掘區別於傳統文本挖掘的關鍵在於結構信息的獲取與利用。結構連結向量模型(SLVM)是我們提出的一種綜合考慮結構信息與內容信息的半結構化文檔模型。該模型通過核矩陣描述文檔結構信息,並利用核矩陣將文檔結構信息與內容信息聯繫起來。本項目以SLVM模型為基礎,