如果一個網(wǎng)站的文章都來源于采集,那么內(nèi)容質(zhì)量會參差不齊,特別是跨領域采集,影響了整個搜索生態(tài)。長此以往,會導致互聯(lián)網(wǎng)資源整體質(zhì)量大幅下降,因此百度搜索針對惡劣采集內(nèi)容的來源網(wǎng)站,推出了颶風算法。
一、颶風算法是什么
為了營造良好的搜索內(nèi)容生態(tài),保護搜索用戶的瀏覽體驗,百度發(fā)布了颶風算法,旨在嚴厲打擊惡劣采集行為和站群問題,將覆蓋百度搜索下的PC站點、H5站點、智能小程序等內(nèi)容。對于算法覆蓋的站點/智能小程序,將會根據(jù)違規(guī)問題的惡劣程度,酌情限制搜索結果的展現(xiàn)。對于第一次違規(guī)的站點,改好后接觸限制展現(xiàn)的周期為一個月;對于第二次違規(guī)的站點,百度將不予釋放搜索展現(xiàn)。
二、颶風算法的版本
1) 颶風算法1.0
2017年7月4日,百度推出颶風算法,旨在嚴厲打擊以惡劣采集為內(nèi)容主要來源的網(wǎng)站,同時百度搜索將從索引庫中徹底清除惡劣采集鏈接,給優(yōu)質(zhì)原創(chuàng)內(nèi)容提供更多展示機會,促進搜索生態(tài)良性發(fā)展。
2) 颶風算法2.0
2018年9月13日,百度對颶風算法進行升級,發(fā)布颶風算法2.0,主要打擊采集痕跡明顯、內(nèi)容拼接、站點存在大量采集內(nèi)容、跨領域采集等五類采集行為。颶風算法2.0旨在保障搜索用戶的瀏覽體驗,保護搜索生態(tài)的健康發(fā)展、對于違規(guī)網(wǎng)站,百度搜索會依據(jù)問題的惡劣程度有相應的限制搜索展現(xiàn)的處理。
3) 颶風算法3.0
2019年8月8日,百度搜索將颶風算法升級到颶風算法3.0,主要打擊百度搜索下的PC站點、H5站點、智能小程序存在的跨領域采集及批量構造站群獲取搜索流量的行為。颶風算法3.0旨在維護健康的移動生態(tài),保障用戶體驗,保證優(yōu)質(zhì)站點/智能小程序能夠獲得合理的流量分發(fā)。
二、颶風算法主要針對的問題
1、跨領域采集
第一類:主站或主頁的內(nèi)容/標題/關鍵詞/摘要等信息顯示該站有明確的領域或行業(yè),但發(fā)布內(nèi)容與該領域不相關,或相關性較低,比如美食類智能小程序發(fā)布足球相關內(nèi)容。
第二類:站點/小程序沒有明確的領域或行業(yè),內(nèi)容涉及多個領域或行業(yè),領域模糊、領域?qū)W⒍鹊汀?/p>
2、站群問題
指批量構造多個站點/小程序,獲取搜索流量的行為。站群的內(nèi)容大多質(zhì)量低、資源稀缺性低、內(nèi)容相似度高、甚至復用相同模板,難以滿足搜索用戶的需求。
3、采集痕跡明顯
網(wǎng)站存在大量從其他站點或公眾號采集、搬運而來的內(nèi)容,信息未經(jīng)整合,排版混亂,部分功能缺失或文章可讀性差,有明顯采集痕跡,用戶閱讀感受很差。比如文章內(nèi)容中存在超鏈接不可點、功能缺失問題。
4、內(nèi)容拼接
采集多篇不同文章進行拼接,內(nèi)容未形成完整邏輯,存在閱讀不通順、文章不連貫等問題,無法滿足用戶需求。
5、站點存在大量采集內(nèi)容
網(wǎng)站內(nèi)容下多數(shù)內(nèi)容均為采集,網(wǎng)站自身無內(nèi)容生產(chǎn)力或內(nèi)容生產(chǎn)能力較差,網(wǎng)站內(nèi)容質(zhì)量較低。
三、如何應對百度颶風算法
1、采集的內(nèi)容不能原搬照舊,需要自己再進行整合歸納,排版好、文章要有增益,比如采集的原文章沒有配圖,但采集過來后加上了配圖;原來沒有視頻,如果用戶有視頻的需求,那就添加一個視頻,這就是增益。
2、文章邏輯性要強,不能斷章取義、到處截取、隨意拼接,這樣的文章顯然是不合格的,所以采集過來的文章要進行重新組合,要有一定的邏輯性,關鍵能解決用戶需求,不影響用戶的閱讀體驗。
3、網(wǎng)站不能一直進行內(nèi)容采集,要采集和原創(chuàng)、偽原創(chuàng)相結合,否則搜索引擎會判定你沒有內(nèi)容生產(chǎn)能力。
4、網(wǎng)站內(nèi)容要與網(wǎng)站的定位和網(wǎng)站的主題密切相關,不能驢頭不對馬嘴,做服裝的網(wǎng)站里出現(xiàn)數(shù)碼電子的內(nèi)容,這明顯是等著搜索引擎的懲罰。
簡單總結:百度一直在鼓勵站點生產(chǎn)領域內(nèi)的文章和內(nèi)容,通過領域?qū)W⒍全@得更多的搜索流量。所以不要嘗試大量采集內(nèi)容來獲得短期收益,對于網(wǎng)站發(fā)布的內(nèi)容,要注意文章的排版和布局,不應出現(xiàn)與文章主旨不相關的信息或不可用的功能,干擾用戶的瀏覽。如果有轉(zhuǎn)載文章需標明出處,比如新聞、政策類等標明出處的轉(zhuǎn)載內(nèi)容,不會被認為是采集內(nèi)容。