《基於仿生模式識別理論的網站分類導航技術研究》是依託哈爾濱工業大學,由徐志明擔任項目負責人的面上項目。
基本介紹
- 中文名:基於仿生模式識別理論的網站分類導航技術研究
- 依託單位:哈爾濱工業大學
- 項目類別:面上項目
- 項目負責人:徐志明
- 負責人職稱:教授
- 批准號:60773070
- 申請代碼:F0211
- 研究期限:2008-01-01 至 2010-12-31
- 支持經費:26(萬元)
項目摘要
本申請研究一種套用仿生模式識別理論,在剖析網站的主題結構、提煉網站的主題概念基礎上,實現網站按主題類別劃分、按權威性排序的技術。網站分類導航技術的研究,在分類信息網站建設、專業化信息服務和領域知識庫獲取等方面具有非常廣闊的套用前景。本申請採用關鍵資源生成的網站主題向量作為站點描述模型。在最為關鍵的網站分類算法中,引入了仿生模式識別的思想,它的基於認識而非劃分的分類知識學習策略,更接近於人的學習過程,具有分類準確度高,學習性能好的特點。在獲取網站關鍵資源的策略上,採用啟發式信息結合相對熵的策略對網站拓撲結構進行剪枝,以提取網站的主題結構,並對其鏈出的網頁運用頁面結構與內容分析技術,消除文本噪聲,以提高網站分類精度。本申請的相關研究成果,不但可以為網路信息分類導航系統提供解決策略和支撐技術,而且也將為仿生模式識別理論研究提供重要參考。