內容簡介
本書是“信息檢索”課程的優秀教材,書中對信息檢索的概念、原理和算法進行了詳細介紹,內容主要包括檢索模型與算法、檢索實用策略、跨語言信息檢索、查詢處理、融合結構化數據和文本、並行信息檢索以及分散式信息檢索等,並給出了闡述算法的大量實例。
作譯者
David A.Grossman 喬治亞梅森大學博士,現在伊利諾伊理工大學計算機系任教。曾在美國政府部門高級技術服務中心和研究發展辦公室擔任項目經理。主要研究領域包括信息檢索、結構化和非結構化數據集成以及數據挖掘。
Ophir Frieder 喬治敦大學教授、計算機科學系主任。曾任伊利諾伊理工大學計算機系首席教授、學院數據檢索實驗室主任。ACM會員,IEEE和美國藝術與科學研究院高級會員。他在數據檢索系統、通信系統、高性能系統結構等方面均有深入的研究。
譯者序
搜尋引擎越來越受到普通大眾、技術、產業與資本的熱力追捧,CNNIC發布的《第25次中國網際網路發展狀況統計報告》顯示,搜尋引擎在網路套用使用率中排名第三,達到了73.3%。2009年中國搜尋引擎的市場規模達到69.5億元,在經濟危機的背景下,搜尋引擎行銷獲得大品牌廣告主的認可。
作為網路搜尋與挖掘十餘年的研發者,我在研發與教學工作中發現,目前搜尋引擎技術方面的資料往往有兩種不足:一種是過於學術化,關注於一個很窄的話題,讀起來生澀難懂,缺乏一定學術背景的讀者很難真正理解;另外一種是原理性的介紹,往往比較淺顯,缺乏一定的深度,讀者讀起來總覺得意猶未盡。而本書是難得的一本佳作。一方面,它全面綜合了信息檢索領域的各類研究,融合了最新的研究成果;另一方面,它採用通俗易懂的行文方式,在關鍵點上採用了詳盡的案例來解釋抽象的過程,讀者並不需要具備專業的數學背景就很容易掌握信息檢索技術的精髓所在。
本書主要作為本科生或研究生信息檢索課程的教材,也特別適合信息檢索領域從事套用開發的研發人員使用。在國外,它已經被多所高校作為研究生與本科生的教材,廣受好評。
我非常有幸應人民郵電出版社圖靈公司之邀翻譯這本信息檢索領域的傑作。對我們來說,這是一次學習過程,也是多年研究工作的總結提煉過程。翻譯從來就不是一件輕鬆的事,加之正趕上工作調動,在時間和精力上受到一定影響。但我們依然克服了各種困難,每周固定開會研討,字斟句酌,抱著嚴謹的學術態度,儘可能忠實表達作者的原意,同時兼顧語言之美。在“苦行僧”式的翻譯學習過程中,我們往往也會從作者敏捷的思維和精巧的話語中領略到一種無窮的智慧。
在此,我要感謝原作者Grossman與Frieder的卓越工作,感謝我的研究生忍受我的各種嚴格要求,感謝人民郵電出版社圖靈公司給予我們這次學習的機會。同時,我要感謝北京理工大學計算機學院院長黃河燕教授在此工作過程中給我的支持,也要感謝中科院計算所網路重點實驗室主任程學旗研究員對我在信息檢索領域的指導。最後,我特別感謝我的妻子,感謝她在這段艱難的時光的默默支持。
本書翻譯分工如下:由我負責翻譯本書的第1章、第7章與第9章,我的研究生李恆訓同學負責翻譯第2章,劉治華同學負責翻譯第3章,李恆訓同學、秦鵬同學和周鵬同學負責翻譯第4章和第5章,張京陽同學負責翻譯第6章,蔣駢同學負責翻譯第8章。另外,我對全書進行了多次全面的審校。
限於水平有限,錯誤在所難免,懇請讀者批評指正。