頁面相似度是指網頁的內容的相似程度,當兩個頁面相似度的在80%以上時,很有可能被搜尋引擎尤其是Google判斷為抄襲頁面或複製頁面,從而不被收錄,甚至降權、刪除。 搜尋引擎技術可以發現網際網路上重複或者相似的內容。搜尋引擎不光會把你網站的內容同其他站點的內容進行比較,還會把你網站的內容和你站點內的其他頁面進行比較,以發現是否有重複或者類似的內容。
基本介紹
- 中文名:頁面相似度
- 載體:網頁
- 相似度:在80%以上
- 搜尋引擎:Google
建議,解決辦法,降低的方法,
建議
我們不知道搜尋引擎對相似頁面進行懲罰的標準是多少,而且每個搜尋引擎對相似度懲罰的標準也是不一樣的,所以,我們應該儘可能的保持網站較低的頁面相似度。
解決辦法
一個網站的操作者要控制網站頁面相似度低於80%,當相似度太高時,可以進行調整,讓網頁不被搜尋引擎認為是複製的頁面,達到頁面容易收錄的效果。
禁止頁面的方法:
1、用Nofollow標籤禁止,這種方法很實用,但是有點麻煩。
2、用Robots.txt禁止無用連結,但是這有個缺點,就是這些頁面雖然不被搜尋引擎索引,但是權重還會從其他網頁上傳遞進來,但是不會傳遞出去。於是就形成了一個權重黑洞,只進不出,不過這種方法被很多站長們利用
3、Meta Noindex和 Follow。搜尋引擎不會收錄這些頁面,但是會爬取這些頁面上的連結,還是會降低蜘蛛的爬去效率。
3、Meta Noindex和 Follow。搜尋引擎不會收錄這些頁面,但是會爬取這些頁面上的連結,還是會降低蜘蛛的爬去效率。
4、利用canonical標籤:利用cannonical標籤可以告訴搜尋引擎重複頁面中,哪個才是規範的網頁,避免搜尋結果中出現多個內容相同或相似的頁面。
降低的方法
一、增加原創內容
原創的東西是絕對獨特的,增加網站原創內容可以有效降低網頁相似度,搜尋引擎也喜歡這樣的網站。
二、放入圖片或者flash
可以將相似的頁面內容放進這些裡面,哪怕是相似的,你也不用擔心。
三、使用Iframe
搜尋引擎蜘蛛在抓取頁面內容時會跳過Iframe,把相似的嵌套進一個頁面就行了。
四、將一樣的部分放進JS裡面
因為JS不會被搜尋引擎認為是很有用的代碼,所以你可以將相似的頁面放進JS裡面,對於百度來說,JS都是不可見的。
五、網站內頁避免雷同
很多朋友喜歡把網站內頁都做成一個排版布局,這樣網站內頁之間的相似度就很高,我們可以適當調整一下內頁版塊的位置,以及不同內頁的標題和關鍵字,這樣有利於搜尋引擎抓取更多的頁面。
六、增加文章頁面的“上一篇”、“下一篇”、“相關文章推薦”等
在更新的文章中,每篇文章的“上一篇”、“下一篇”、“相關文章推薦”、評論等信息理論上應當是不同的,增加這些信息,也可以適度減少頁面的相似度,增加頁面收錄的機率。