從10月底至今,很多站長(zhǎng)遇到了站點(diǎn)收錄變慢、收錄量變少甚至是完全不收錄的問(wèn)題。百度站長(zhǎng)平臺(tái)官方反饋,得到的回復(fù)幾乎都是一樣的結(jié)果,讓人感到十分“無(wú)力“。
大家應(yīng)該對(duì)百度官方這條回復(fù)已經(jīng)爛熟于心了:
“您好,反饋?lái)?yè)面已被抓取成功,預(yù)計(jì)需要一周的時(shí)間收錄,請(qǐng)耐心等待,感謝您對(duì)百度的關(guān)注和支持!”
對(duì)于收錄這件事情,也一直很關(guān)注,同時(shí)也有不少站長(zhǎng)希望我們能聊一聊百度不收錄的話題。
坦白的說(shuō),關(guān)于目前百度收錄問(wèn)題,在咨詢(xún)官方人員后,也沒(méi)有得到明確的回復(fù),并不能給予站長(zhǎng)朋友們實(shí)踐性的解決方案。不過(guò)我們還是對(duì)目前的收錄問(wèn)題,做了一些簡(jiǎn)單的數(shù)據(jù)分析和觀察,借此跟大家一起分享。
本次整理的數(shù)據(jù)來(lái)源需要強(qiáng)調(diào)和明確的是:
網(wǎng)站收錄量數(shù)據(jù)(最近60天)是基于百度site命令查詢(xún)得到,獲取的收錄數(shù)據(jù)與真實(shí)數(shù)據(jù)存在一定的誤差(百度官方提示只做參考)。
使用site命令同時(shí)添加了inurl命令過(guò)濾了部分?jǐn)?shù)據(jù),盡可能保障獲取的收錄數(shù)據(jù)值是查詢(xún)?nèi)掌诋?dāng)日產(chǎn)生的新頁(yè)面,而不是舊頁(yè)面的快照頁(yè)面數(shù)據(jù)。
查詢(xún)的相關(guān)站點(diǎn)數(shù)據(jù)主要針對(duì)原先收錄表現(xiàn)比較好的子域名或者目錄,并不一定是整站收錄數(shù)據(jù)。
由于是使用site命令查詢(xún)站點(diǎn)的歷史數(shù)據(jù),因此查詢(xún)到的站點(diǎn)對(duì)應(yīng)日期收錄數(shù)據(jù),并非頁(yè)面產(chǎn)生日期的當(dāng)天收錄數(shù)據(jù)。
查詢(xún)站點(diǎn)并沒(méi)有涵蓋門(mén)戶(hù)站點(diǎn)、紙媒報(bào)媒旗下站點(diǎn),主要是考慮此類(lèi)大站點(diǎn)和百度往往有深度合作,加上權(quán)威性更強(qiáng)、數(shù)據(jù)量更新大,更不容易受到影響,即使受百度調(diào)整影響,也能及時(shí)恢復(fù),因此沒(méi)有納入。
我們基于以上數(shù)據(jù)查詢(xún)的方法和查詢(xún)時(shí)間,獲取了站點(diǎn)收錄數(shù)據(jù),僅供趨勢(shì)分析參考、管中窺豹,并不能代表相關(guān)站點(diǎn)的百度實(shí)際收錄情況。
下文以的子站點(diǎn)運(yùn)營(yíng)領(lǐng)域?yàn)槔覀兒Y選了一些知名的科技資訊媒體、素材資源類(lèi)站點(diǎn)做數(shù)據(jù)觀察。
一、科技資訊類(lèi)站點(diǎn)收錄觀察
根據(jù)所選的一些知名科技媒體(cnbeta、IT之家、Donews、Techweb、快科技、36氪、威鋒網(wǎng)、鞭牛士等)數(shù)據(jù)可以看出,這些站點(diǎn)的歷史收錄量波動(dòng)幅度都比較大。
如上圖所示,多數(shù)站點(diǎn)的最近15天的歷史收錄量并沒(méi)有特別多,相對(duì)站點(diǎn)的日更新量來(lái)說(shuō),都整體偏低。
當(dāng)然,也有些媒體站點(diǎn)收錄量并沒(méi)收太大的影響,雖然有所下降,但整體來(lái)說(shuō)影響不大。以cnBeta為例(下圖),最近30天日均歷史收錄量基本穩(wěn)定在150到200之間。(注:周末更新量較低,其收錄量相應(yīng)減少,但也穩(wěn)定在60到100之間)。
我們繼續(xù)觀察這些站點(diǎn)最近60天日均歷史的收錄情況,明顯看出大部分的站點(diǎn)收錄情況有一些共同的特征:
1、從10月25日到11月22日期間,多家站點(diǎn)的當(dāng)日歷史收錄量降到一個(gè)很低的水平,每天僅收錄幾條。雖然存在百度SITE命令在查詢(xún)舊數(shù)據(jù)可能不精準(zhǔn)的情況,但是不可否認(rèn)的是,多數(shù)站長(zhǎng)明確感知到這期間收錄存在明顯的減少。
11月期間,子站點(diǎn)產(chǎn)生的新頁(yè)面收錄量也是大幅度減少。即使目前通過(guò)SITE命令查詢(xún)歷史結(jié)果也顯示這期間產(chǎn)生的頁(yè)面依然沒(méi)有被收錄。
2、從11月23日開(kāi)始,大部分站點(diǎn)的日均歷史收錄量都明顯增加,但仍未恢復(fù)到正常狀態(tài)。這期間,許多站長(zhǎng)感受最深的一點(diǎn)就是,收錄量有限,收錄時(shí)間比以往要慢,有明顯滯后的情況存在,往往有1至2周的收錄延遲。
3、從12月21日開(kāi)始,一些科技資訊類(lèi)站點(diǎn)的日均歷史收錄量明顯的上漲,漲幅較大。
我們以驅(qū)動(dòng)中國(guó)最近60天的日均歷史收錄情況為例,該站點(diǎn)從11月22日至12月17日期間,收錄情況得到了改善,開(kāi)始出現(xiàn)增長(zhǎng),從原先數(shù)十條收錄量上升至30條左右。而到了12月23日,收錄量70多條,漲了近一倍。
同樣的,可以看到TechWeb、donews等站點(diǎn)收錄量也是從12月21日開(kāi)始攀升,23日則達(dá)到最近幾天的峰值。其中Donews從原先的幾十條上漲到300多條,TechWeb也是從十多條增長(zhǎng)至近200條。
不過(guò),也有一些站點(diǎn)的收錄情況依舊沒(méi)有改善,始終保持在較低的水平。
二、設(shè)計(jì)資源站點(diǎn)收錄觀察
我們也觀察了多家設(shè)計(jì)素材資源類(lèi)站點(diǎn)(千網(wǎng)、我圖網(wǎng)、紅動(dòng)中國(guó)、昵圖網(wǎng)、懶人圖庫(kù)等),同樣發(fā)現(xiàn)大部分最近60天日均歷史收錄情況與科技資訊類(lèi)站點(diǎn)有很大的相似性。
1、10月25日到11月22日期間,日均歷史收錄量都大幅度減少。
2、從12月21日開(kāi)始,一些資源類(lèi)站點(diǎn)的歷史收錄量明顯的上漲,漲幅較大。漲幅情況從下圖就可以看出來(lái),這里就不再作仔細(xì)分析了。
三、觀察總結(jié)
11月份期間的歷史收錄數(shù)據(jù)反饋出,很多中小網(wǎng)站的收錄數(shù)據(jù)出現(xiàn)明顯異常、減少或者不收錄,原創(chuàng)度以及更新度比較高的站點(diǎn)也未能避免。
11月份至今,許多原本收錄很好的網(wǎng)站,網(wǎng)站的收錄時(shí)間也出現(xiàn)了明顯的滯后情況,新產(chǎn)生的頁(yè)面,往往需要1-2周才會(huì)被收錄。
11月底開(kāi)始,大部分站點(diǎn)的歷史收錄量開(kāi)始增加,期間百度可能存在調(diào)整。
12月21號(hào)之后,許多站點(diǎn)的收錄量開(kāi)始暴漲,接近正常水平,很有可能是百度的新一輪調(diào)整改善了收錄情況。
這里做個(gè)補(bǔ)充:收錄異常期間,通過(guò)對(duì)部分網(wǎng)站的蜘蛛分析發(fā)現(xiàn),百度蜘蛛對(duì)最新頁(yè)面的爬取大幅度減少,但是歷史頁(yè)面爬取頻率并沒(méi)有出現(xiàn)明顯的下降。
雖然此前百度就明確表示,將在年末嚴(yán)加打擊快排站點(diǎn)、聚合頁(yè)、垃圾內(nèi)容,不過(guò)我們的觀察并不能直接得出近期的收錄異常與此有直接的相關(guān)性。
好消息是,從目前的收錄查詢(xún)數(shù)據(jù)來(lái)看,百度肯定也在積極的調(diào)整和改善。
2021年將至,隨著新一波的改善,有人已經(jīng)站在了山頂,有人還在山底徘徊,只能抱團(tuán)取暖,2020年末的冬天,我們不曾“孤獨(dú)”!
投票模塊插入