WEB信息融合粒化與聚合技術研究

WEB信息融合粒化與聚合技術研究

《WEB信息融合粒化與聚合技術研究》是依託中南大學,由張祖平擔任項目負責人的面上項目。

基本介紹

  • 中文名:WEB信息融合粒化與聚合技術研究
  • 項目類別:面上項目
  • 項目負責人:張祖平
  • 依託單位:中南大學
項目摘要,結題摘要,

項目摘要

項目旨在通過對信息進行適度粒化與多維聚合,實現對有效信息的同一、可信與顯現,以突破各類強大的WEB搜尋引擎海量搜尋結果淹沒、真假難辨、提取困難等難題。 項目針對信息的海量性與計算的複雜性,擬引進b位minwise相似性度量算法、基於GPU並行計算模式及MapReduce雲計算與服務框架,結合Web信息粒化與表示模型、信息源的特徵度量與可信計算模型,從信源的角度對信息進行有效的去重、清洗及可信標記等靜化處理;針對淺層與深度融合的需求特徵,研究多維度、多粒度的粒層映射關係模型與多層融合方法,解決搜尋結果的統一性與相容性問題,提供對象級、主題級及詞級等多級融合技術。 項目將以科技工作者信息為對象開展研究,以驗證研究的有效性和實用性。

結題摘要

人類社會已經開始邁入”人-機-物”融合的一體化智慧型時代,其中Web信息資源廣泛存在,看似取之不盡、用之不竭,其獲取與充分利用已成為社會發展的良好契機迫切需求與動力,但Web信息資源由於其海量性及相互關係的複雜性使其取之與用之普遍存在很高的技術門檻,如何充分利用Web信息資源已成為信息領域的重大挑戰。 項目主要研究Web信息的度量與融合技術,旨在通過不同維度的信息粒化方法縮小信息搜尋返回的結果集,從而提高信息搜尋的效率與速度,最終提高Web信息獲取的準確率和有效性;另一方面,通過對不同來源的、各個分散的Web信息進行聚合處理,用以大大減少搜尋的結果集的數量,進而降解低搜尋的複雜性。 項目組經過四年的研究,在Web信息的度量與融合方法及技術、信息的粒化及分類聚類的計算方面取得了一定的研究進展,基本上按照項目的研究進展規劃,實現了項目申請時提出的研究目標。 針對信息粒化與信源質量在度量中存在的問題,我們研究了形式概念分析(Formal Concept Analysis)的核心數據結構—形式概念格,利用概念格有效地對外部世界進行層次化、結構化的粒化分析,用以解決信息粒化的基礎理論問題。我們通過證明概念格更新過程中的相關命題,提出了三個概念格更新的高效算法。理論和實驗分析都證明,這兩個算法在數據海量時與現有的典型算法相比有著很明顯的優勢,研究成果發表了在3篇Expert Systems with Applications與Knowledge-Based Systems期刊論文上。 項目組還研究了基於熵的信息度量模型與方法回響了用於建立多層次多粒度的Web信息提取模型;引進了b位minwise相似性度量算法的擴展與基於Hadoop的大數據平台與GPU並行計算相結合的計算模式,有效提高了計算性能,面向自動文摘的技術及面向科技工作者的實體識別與基於主題的文檔聚類及相似性比對、面向模板的信息提取與報告的生成回響了面向不同層級的信息融合與基於實證的研究手段。發表論文23篇,其中SCI論文8篇,EI論文11篇,其它論文4篇(含會議論文),申請發明專利10項,獲授權6項。培養博士研究生6人,其中留學博士3人,培養碩士研究生28人,其中留學碩士4人。

相關詞條

熱門詞條

聯絡我們