潛在語義標引

隨著套用領域的不斷拓展, LSI已在信息過濾、信息分類/聚類、交叉語言檢索、信息理解、判斷和預測、特徵抽取(降維)、文本可視化等眾多領域中得到了廣泛的套用。

M. W. Berry 和S. T. Dumais 在20世紀80年代末提出了一種新的信息檢索模型:潛在語義標引(Latent Semantic Indexing,LSI),它可以看作經典向量空間模型(VSM)的一種改進。
LSI是一種建立在統計之上的學習方法:它試圖發現對象之間的關聯模式及其隱藏的對象間的結構關係。
LSI方法最初套用於文本信息檢索領域,它可以有效地解決了同義詞和多義詞的問題,通過識別文本中的同義詞, LSI將信息檢索精度提高了10%--30%。

相關詞條

熱門詞條

聯絡我們