潛在語義分析

潛在語義分析(Latent Semantic Analysis)或者潛在語義索引(Latent Semantic Index),是1988年S.T. Dumais等人提出的一種新的信息檢索代數模型,是用於知識獲取和展示的計算理論和方法,它使用統計計算的方法對大量的文本集進行分析,從而提取出詞與詞之間潛在的語義結構,並用這種潛在的語義結構來表示詞和文本,達到消除詞之間的相關性和簡化文本向量實現降維的目的。

潛在語義分析的基本觀點是:把高維的向量空間模型(VSM)表示中的文檔映射到低維的潛在語義空間中。這個映射是通過對項/文檔矩陣的奇異值分解(SVD)來實現的。

LSA 的套用:信息濾波、文檔索引、視頻檢索、文本分類與聚類、圖像檢索、信息抽取等。

基本介紹

  • 中文名:潛在語義分析
  • 外文名:Latent Semantic Analysis
  • 別名:潛在語義索引
  • 提出者:S.T. Dumais等人
關鍵字相關性-潛在語義索引,潛在語義索引中的提示,

關鍵字相關性-潛在語義索引

百度蜘蛛算法一直在模仿用戶的習慣,這也是為什麼網站建設時要更注重用戶體驗才能更好的最佳化網站。而蜘蛛算法雖然一直在模仿,可算法與人同樣存在著很不一樣的地方,因為人可以直接理解某個關鍵字的意義、文章的意思。如人看到“果汁”這兩個字就知道指的是有果味的好喝的液體飲料,而蜘蛛算法卻不能從感性的去理解果汁是什麼。
但是蜘蛛算法確實可以掌握詞與詞之間的關係,因而我們便可從關鍵字相關性看潛在語義索引。不知道有沒朋友了解過潛在語義索引。潛在語義索引也曾有不少人去研究過,而這研究的就是蜘蛛怎么通過海量詞庫中找出辭彙間的關係,也就是說當兩個詞或一組詞大量出現在相同文檔之中,這些詞間就會被認為是語義相關。
部落格與blog兩個詞在我們撰寫文章可能會被經常混合使用,那么這兩個詞就在大量文檔和網頁上同時出現,那么對於蜘蛛而言,它就會認為這兩個詞是即為語義相關,當然,實際上也確實是同義詞,只不過語言不一罷了。  而這潛在語義索引,並不依賴或者說限制在語言之上,也正如此,蜘蛛把部落格與blog這兩個詞緊緊地聯繫在一起,於是乎,惠州SEO部落格並未對“seo blog”任何最佳化,且密度為零的情況下,卻神奇的出現了排名。不過對於這個潛在語義索引其實並未得到搜尋引擎的承認,當然為進行否認,因此這也僅能說是惠州SEO葉劍輝的個人猜測。

潛在語義索引中的提示

在我們撰寫文章之時,其實並不需要死盯著目標關鍵字,不妨多包涵與目標關鍵字語義相關、相近的辭彙,以支持目標關鍵字,如此或許會起到意想不到的效果喔,同樣的也能讓最佳化更趨向自然,而避免過度最佳化某個關鍵字而導致被降權K站
就如“SEO”這詞,若是想要加強相關性,其實並非僅僅更多的重複“SEO”就可以了,還需要通過出現“搜尋引擎最佳化”等語義相關的辭彙。由於語義分析的緣故,讓蜘蛛認為如此更為相關,因此在我們撰寫文章時,就需要更多的將與目標關鍵字語義相關的辭彙邏輯的、通順的進行融入。

相關詞條

熱門詞條

聯絡我們