《通用Web結構化信息檢索引擎的關鍵技術研究》是依託中國人民大學,由王秋月擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:通用Web結構化信息檢索引擎的關鍵技術研究
- 項目類別:青年科學基金項目
- 項目負責人:王秋月
- 依託單位:中國人民大學
《通用Web結構化信息檢索引擎的關鍵技術研究》是依託中國人民大學,由王秋月擔任項目負責人的青年科學基金項目。
智慧型技術 網路機器人(Robot)又被稱作Spider、Worm或Random,核心目的是為獲取Internet上的信息。一般定義為“一個在網路上檢索檔案且自動跟蹤該檔案的超文本結構並循環檢索被參照的所有檔案的軟體”。機器人利用主頁中的超文本連結遍歷WWW,...
查詢結果的抽取與整合是Deep Web數據集成中的重要環節,存在著許多困難和挑戰。本項目擬探討其中最為核心的三個關鍵技術:研究查詢結果頁面抽取技術,充分利用頁面的結構特徵和內容特徵,實現結構化數據的自動抽取;研究查詢結果數據語義標註...
隨著搜尋引擎技術的發展和不斷完善,越來越多的人開始對搜尋引擎原理和技術進行研究,越來越多的人喜歡上了搜尋引擎 本書從教學的角度出發,全面地闡述了搜尋引擎的技術和信息檢索技術,包括:搜尋引擎的基本原理與技術、搜尋引擎的數據結...
Web頁面分析有以下步驟:判斷網頁類型,衡量其重要程度,豐富程度,對超連結進行分析,分詞,把重複網頁去掉。經過搜尋引擎分析處理後,web網頁已經不再是原始的網頁頁面,而是濃縮成能反映頁面主題內容的、以詞為單位的文檔。數據索引中結構...
二、利用連結的結構 三、收集用戶反饋信息 四、計算最終的權重 第四節 信息檢索技術評估 一、信息檢索技術評估指標 二、TREC和CWIRF信息檢索評估 三、搜尋引擎技術評估 第五節 小結 下篇 Web信息資源的組織與套用服務 第十章 大規模...
第一章 Web信息搜尋與排序概論 1.1 搜尋引擎概述 1.1.1 搜尋引擎的基本結構 1.1.2 傳統搜尋引擎的基本類型 1.1.3 現代智慧型搜尋引擎的類型 1.2 搜尋引擎主要支撐技術 1.2.1 分詞技術 1.2.2 網路爬蟲技術 1.2....
本課題研究基於關鍵字的大規模連結數據搜尋問題:研究多粒度連結數據摘要模型和索引方法;研究關鍵詞查詢理解方法;研究高效地將關鍵字查詢轉換為結構化查詢(用查詢圖表示)的方法;研究查詢圖相關性評價問題。最終幫助用戶在大規模、異構、...
研究內容包括:通用網頁結構化信息抽取、複雜問題搜尋、基於知識庫的自然語言理解、人物的知識自動抽取和個人知識庫的建立等。旨在研究各種產生知識的方法,擴大知識庫的數量和質量,豐富知識庫內容,增加知識庫的精確性和準確匹配與搜尋知識庫...
本書以“數據—知識—服務”為主線,以數據處理、分析和服務的代表性方法與技術為重點。數據處理篇介紹結構化、非結構化和半結構化數據的存儲、查詢和最佳化方法;數據分析篇介紹數據挖掘、知識發現和數據倉庫的經典算法;數據服務篇介紹Web...
(3)全球資訊網數據形式的豐富和網路技術的不斷發展,圖片、資料庫、音頻、視頻多媒體等不同數據大量出現,通用搜尋引擎往往對這些信息含量密集且具有一定結構的數據無能為力,不能很好地發現和獲取。(4)通用搜尋引擎大多提供基於關鍵字的...