為了營造良好的搜尋內容生態,保護搜尋用戶的瀏覽體驗,百度發布了颶風算法,旨在嚴厲打擊惡劣採集行為和站群問題,將覆蓋百度搜尋下的PC站點、H5站點、智慧型小程式等內容。對於算法覆蓋的站點/智慧型小程式,將會根據違規問題的惡劣程度,酌情限制搜尋結果的展現。對於第一次違規的站點,改好後接觸限制展現的周期為一個月;對於第二次違規的站點,百度將不予釋放。
基本介紹
- 中文名:颶風算法
- 目的:嚴厲打擊惡劣採集行為和站群問題
- 日期:2019年8月8日
- 作用:營造良好的搜尋內容生態
簡介,歷史版本,颶風算法3.0,颶風算法2.0,颶風算法1.0,算法打壓問題及應對建議,類型一:跨領域採集,類型二:站群問題,類型三:採集痕跡明顯,類型四:內容拼接,類型五:站點存在大量採集內容,
簡介
颶風算法是百度搜尋為打壓站點惡劣採集行為,給優質原創內容提供更多展示機會,促進搜尋生態良性發展而推出的一種搜尋引擎算法。
歷史版本
颶風算法3.0
2019年8月8日,百度搜尋將颶風算法升級到颶風算法3.0,主要打擊百度搜尋下的PC站點、H5站點、智慧型小程式存在的跨領域採集及批量構造站群獲取搜尋流量的行為。颶風算法3.0旨在維護健康的移動生態,保障用戶體驗,保證優質站點/智慧型小程式能夠獲得合理的流量分發。
颶風算法2.0
2018年9月13日,百度對颶風算法進行升級,發布颶風算法2.0,主要打擊採集痕跡明顯、內容拼接、站點存在大量採集內容、跨領域採集等五類採集行為。颶風算法2.0旨在保障搜尋用戶的瀏覽體驗,保護搜尋生態的健康發展、對於違規網站,百度搜尋會依據問題的惡劣程度有相應的限制搜尋展現的處理。
對於第一次違規的站點,改好後解除限制展現的周期為1個月;
對於第二次違規的站點,百度搜尋將不予釋放。
颶風算法1.0
2017年7月4日,百度搜尋資源平台發布公告推出颶風算法,旨在嚴厲打擊以惡劣採集為內容主要來源的網站,同時百度搜尋將從索引庫中徹底清除惡劣採集連結,給優質原創內容提供更多展示機會,促進搜尋生態良性發展。
颶風算法會例行產出懲罰數據,同時會根據情況隨時調整疊代,體現了百度搜尋對惡劣採集的零容忍。優質原創站點如發現站點索引量大幅減少且流量大幅下滑現象,可在百度搜尋資源平台的反饋中心進行反饋
算法打壓問題及應對建議
颶風算法主要包含以下五類惡劣採集行為:
類型一:跨領域採集
詳細說明:跨領域主要分為兩類
- 第一類:主站或主頁的內容/標題/關鍵字/摘要等信息顯示該站有明確的領域或行業,但發布內容與該領域不相關,或相關性較低。
示例:美食類智慧型小程式發布足球相關內容
- 第二類:站點/智慧型小程式沒有明確的領域或行業,內容涉及多個領域或行業,領域模糊、領域專注度低。
示例:智慧型小程式內容涉及多個領域
建議:鼓勵站點生產領域內的文章和內容,通過領域專注度獲得更多的搜尋流量。不要嘗試採集跨領域的內容來獲得短期收益,這樣會造成領域專注度的降低,從而影響站點在搜尋中的表現。
類型二:站群問題
詳細說明:指批量構造多個站點/智慧型小程式,獲取搜尋流量的行為。站群中的站點/智慧型小程式大多質量低、資源稀缺性低、內容相似度高、甚至復用相同模板,難以滿足搜尋用戶的需求。
示例:多個智慧型小程式復用同一模板,內容質量低、相似度高
類型三:採集痕跡明顯
詳細說明:站點存在大量從其他站點或公眾號採集、搬運而來的內容,信息未經整合,排版混亂,部分功能缺失或文章可讀性差,有明顯採集痕跡,用戶閱讀感受很差。
示例:採集文章內容中存在超連結不可點、功能缺失問題,採集痕跡明顯
建議:對於網站發布的內容,需注意文章的排版和布局,不應出現與文章主旨不相關的信息或不可用的功能,干擾用戶的瀏覽。
類型四:內容拼接
詳細說明:採集多篇不同文章進行拼接,整體內容未形成完整邏輯,存在閱讀不通順、文章不連貫等問題,無法滿足用戶需求。
示例:前後內容無關,邏輯不連貫
建議:嚴厲反對利用採集編輯器等工具,隨意生產拼接採集內容的行為,請網站多多生產對用戶有價值的原創內容。
類型五:站點存在大量採集內容
詳細說明:網站內容下多數內容均為採集,網站自身無內容生產力或內容生產能力較差,網站內容質量較低。
建議:鼓勵站點生產原創內容,如若轉載需標明出處。(如:新聞、政策類等標明出處的轉載內容,不會被認為是採集內容)