《Web網頁時效性評價及其在網頁排序中套用的研究》是依託山東大學,由陳竹敏擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:Web網頁時效性評價及其在網頁排序中套用的研究
- 項目類別:青年科學基金項目
- 項目負責人:陳竹敏
- 依託單位:山東大學
中文摘要,結題摘要,
中文摘要
Web已成為人們獲取信息的主要來源,搜尋引擎是獲取這些信息的重要途徑,但Web上的數據過去與現在、有效與無效並存,這造成檢索結果中包含大量過時、失效信息。如何甄別信息的時效性並保證檢索結果的有效性成為一個日益重要的研究問題。本項目針對Web網頁的特點及信息檢索的需要,系統研究Web網頁時效性評價及其在網頁排序套用中的基礎理論和關鍵技術,主要包括:探討網頁時效性的機理特徵,研究時效性度量特徵的感知、推斷與量化的方法,以及基於多特徵的時效性評價方法;研究基於時間的查詢理解和分類算法,查詢與網頁的時間相關度計算方法,時效性敏感的網頁重要度計算方法;最後融合以上各項研究成果實現新型的網頁排序算法。本項目的最終目標是減少搜尋引擎檢索結果中的大量過時、失效信息,提高人們獲取信息的效率和質量,同時為網頁時效性在實時檢索、Web信息可信性判別等其它領域的套用研究提供新的思路、理論方法和技術支撐。
結題摘要
搜尋引擎是當前人們獲取信息的主要來源,研究Web信息與用戶查詢的時效性,並結合兩者返回有效的、高質量的檢索結果是搜尋引擎設計的關鍵問題之一。本項目根據擬定的研究計畫,研究了Web信息的時效性判別、用戶查詢的時效性意圖識別及分類,並融合兩者提出了新型的綜合語義和時效性意圖的檢索結果多樣化方法。具體的研究成果如下:首先,系統研究網頁的時效性判別,提出了網頁時效性特徵時間的自動提取及評價方法。其次,研究了時間敏感的查詢理解,提出了一種基於時效性意圖的用戶查詢分類法,給出了基於機器學習的時間敏感的查詢分類算法。最後,研究了時效性敏感的網頁排序算法,提出了綜合語義和時效性的新型檢索結果多維度多樣化排序算法。項目開展期間完成標註基金資助的論文23篇(含錄用待發表4篇),其中SCI檢索5篇,EI檢索18篇,ISTP檢索3篇,新申請專利1項。