《大規模分散式內容檢索技術》是2011年科學出版社出版的圖書,本書作者是陳漢華。內容簡介大規模分散式內容檢索是近年來分散式系統方向的一個熱點研究領域。陳漢華,金海的這本《大規模分散式內容檢索技術》全面地闡述了各種體系結構...
主要技術 具體來說,其涉及數位化技術、超大規模資料庫技術、網路技術、多媒體信息處理技術、信息壓縮與傳送技術、分散式處理技術、安全保密技術、可靠性技術、數據倉庫與在線上分析處理技術、信息抽取技術、數據挖掘技術、基於內容的檢索技術、...
《海量RDF圖數據的分散式存儲與查詢算法研究》是依託西安電子科技大學,由李賀擔任項目負責人的青年科學基金項目。中文摘要 隨著語義網技術的不斷發展與推廣,以網際網路上的各種數據資源構成的RDF圖數據集合正以指數形式飛速增長。由於RDF數據...
研究成果將套用於一個已有的語義Web搜尋引擎,改進存儲與檢索效率,驗證方法的可行性和有效性。課題開展對推動語義Web、數據管理和分散式技術的發展具有重要意義。結題摘要 語義Web作為數據之網不斷匯集並組織Web信息,相關套用因此面臨著對...
隨著各領域面向時空數據的套用不斷深入,大量的時空數據持續產生與積累,如何高效檢索大規模時空數據成為用戶熱切需求的技術能力。本項目針對上述問題,提出採用對等計算架構建立分散式檢索機制,由此分散搜尋負載,提高檢索效率,結合直方圖、代價...
主要內容包括分散式檔案系統、相似性搜尋、搜尋引擎技術、頻繁項集挖掘、聚類算法、廣告管理及推薦系統。其中相關章節有對應的習題,以鞏固所講解的內容。讀者更可以從網上獲取相關拓展材料。 《大數據:網際網路大規模數據挖掘與分散式處理》...
《網路信息檢索》針對網路信息檢索的廣泛套用,書中對搜尋引擎、中文和跨語言信息檢索、多媒體檢索、並行和分散式信息檢索、信息分類和聚類、信息提取與自動問答等重要套用的關鍵技術也進行了深入的探討。《網路信息檢索》層次分明,深入淺出...
《大規模機器學習:並行和分散式技術》是2013年國防工業出版社出版的圖書。內容簡介 《大規模機器學習:並行和分散式技術》內容涉及一些機器學習算法的並行化,使得大規模分散式機器學習算法成為可能,內容分為大規模機器學習的框架、監督和非...
內容簡介 本書系統介紹了網際網路搜尋引擎的工作原理、實現技術及系統構建方案。全書分三篇共13章。上篇介紹搜尋引擎的基本原理和技術,講述一個小型簡單搜尋引擎實現的具體細節;中篇詳細討論了大規模分散式搜尋引擎系統的設計要點及其關鍵技術...
《搜尋引擎:原理、技術與系統(第2版)》系統介紹了網際網路搜尋引擎的工作原理、實現技術及系統構建方案。全書分三篇共13章。上篇介紹搜尋引擎的基本原理和技術,講述一個小型簡單搜尋引擎實現的具體細節;中篇詳細討論了大規模分散式搜尋...
1999年~2008年起源於雅虎搜尋技術(YST、Vespa)的單機版搜尋引擎,支持淘寶、B2B等子公司搜尋業務。2009年~2011年完成自研搜尋引擎HA3(Havenask)研發,開啟自研大規模分散式高性能搜尋引擎時代。2013年Havenask支持阿里巴巴集團幾乎所有搜尋...