《基於信息融合的企業競爭情報元搜尋技術研究》是李培撰寫的一篇論文。
基本介紹
- 中文名:基於信息融合的企業競爭情報元搜尋技術研究
- 關鍵字:企業管理 競爭情報 情報檢索 搜尋引擎
- 論文作者:李培
- 導師:王知津
- 學科專業:企業管理
- 學位授予時間:2008
- 學位級別:博士論文
- 館藏號:F270.7
- 學位授予單位:南開大學
- 館藏目錄:2009\F270.7\16
中文摘要
信息的競爭是現代企業競爭的一個重要方面,企業競爭情報已經成為企業的寶貴資源,蒐集、分析競爭情報並為企業服務,己經成為每個企業必不可少的一項重要工作。在這項工作中,競爭情報蒐集是整個工作的基礎,決定企業情報工作的整體水平質量。本文以網路環境下企業競爭情報蒐集技術為研究範疇,以Web元搜尋引擎技術為具體研究對象,將信息融合與信息檢索技術結合起來,具體研究套用於表層網路和深層網路中的元搜尋引擎的一些關鍵技術。本文的研究工作主要包括以下幾部分。 第一、根據企業競爭戰略理論的發展脈絡,總結了企業競爭情報理論的發展規律,指出競爭情報信息過程的基礎和核心是蒐集。在以網路為主體的現代信息環境中,網上競爭情報由表層網路拓展到深層網路,深層網路中的企業競爭情報無論在質量還是在數量上都要高於表層網路,對企業具有更重要的作用。針對網路競爭情報蒐集的主要手段——搜尋引擎技術,本文分析了獨立搜尋引擎目前存在的一些局限,進而指明了元搜尋引擎技術在網路競爭情報蒐集中的優勢。 第二、研究了信息融合在信息檢索中的套用模式。按檢索實施的不同信息環境,將融合模式分為單數據集融合、多數據集融合和Web融合。指出在單數據集融合中,對多個不同證據源的融合將帶來檢索性能的改進。對於多數據集,本文指出其融合的目的是通過數據集選擇和結果集合的合併,使其整體性能達到或超過單數據集檢索性能。對於Web環境,本文分析了融合技術在其中套用的優勢,具體比較了幾種代表性元搜尋引擎的融合方法。作為現有研究綜述的結論,本文指出,融合方法的精髓就是將各種檢索方法的優勢以互補的方式結合起來,從而帶來整體檢索性能的提高。 第三、基於數據集選擇和文檔選擇在元搜尋引擎中的重要作用,本文對典型的數據集選擇方法和文檔選擇方法進行了比較分析,並進一步研究了有影響的三種數據集選擇方法。在分析搜尋引擎相關性和獨特性特徵的基礎上,本文提出了基於相關性與獨特性融合的資源選擇方法。本文借鑑具有較好效果的線性融合方法,提出了基於λ參數的線性融合算法,並對λ參數給出了具體的估值方法。 第四、對於元搜尋引擎技術中的另一個重要組成部分——檢索結果排序融合,本文分析了排序融合方法的特點,具體研究了兩類方法中的倒數方法、Borda記數法、民主融合方法、Condorcet方法和馬爾科夫鏈方法。針對元搜尋引擎中成員引擎返回結果列表不相交的情況,本文指出了現有排序融合方法的局限性,提出了基於相關度係數的排序融合方法。在與現有方法的計算效率進行對比的基礎上,分析了新方法的特點。 第五、本文分析了關鍵字檢索和加權檢索在搜尋引擎中的優勢,具體研究了兩種性能較好的多關鍵字內容位置加權方法:組合加權方法和分級加權方法,指出了兩種方法都存在忽視詞序的問題。本研究進而論述了詞序對多關鍵字檢索的影響,提出了融合詞序特徵的多關鍵字加權方案,並研究了基於D-S融合的多關鍵字檢索結果集成方法。 本文的創新性研究主要體現在三個方面。 第一、提出了基於相關性與獨特性融合的資源選擇方法。在元搜尋引擎數據集選擇和文檔選擇研究中,揭示了搜尋引擎獨特性特徵對於提高多引擎結果融合效果的作用,給出了通過各搜尋引擎檢索結果差異度來度量成員引擎獨特性的方法。提出了基於相關性與獨特性融合的成員引擎加權算法,並為該融合算法中的關鍵參數λ給出了基於相關性和獨特性指標實際表現差異的估值方法。通過檢索實驗對比,基於相關性與獨特性融合的資源選擇方法比經典的gGIOSS、CORI和CVV方法在檢索性能上有一定程度的提高,證明本文提出的資源選擇方法是一種性能更好的新方法。同時還驗證了本文提出的λ參數估值方法相比於常用的主觀設定方法更具有客觀性和嚴謹性。 第二、提出了基於相關度係數的排序融合方法。針對現有排序融合方法在成員引擎返回結果列表不相交時存在局限性的問題,本文提出了基於相關度係數的排序融合算法。與其它基於位置的排序融合方法相比,該方法以各結果列表的相關度係數對輸出文檔進行加權,充分考慮了不同成員引擎檢索性能上的差異,因此融合的結果更具科學性和客觀性。與基於比較的排序融合方法相比,該方法處理時間短,執行效率高,更具實用性。 第三、提出了融合詞序特徵的多關鍵字綜合加權方法。這種方法不僅考慮了各關鍵字在文檔中出現的位置和頻次,還關注了多關鍵字之間的順序和鄰接關係。通過實際檢索實驗比較,該方法的檢索性能要好於組合加權方法和分級加權方法。這一方法在檢索性能上的提高,進一步驗證了本文所提出的在多關鍵字加權方案中融入詞序特徵這一研究思路的正確性。 本文的研究工作對企業信息化建設、信息檢索與信息融合等多個領域,從理論上發展和豐富了已有的研究內容,在實踐上完善和補充了可套用操作的工具手段。