搜素引擎抓取網站頁面主要靠的是蜘蛛程序也就是我們常說的爬蟲。正是因為有了這個程序,我們的網站才能被搜索引擎收錄和查到。做seo,就是把網站設置的對蜘蛛程序更友好。
那么,網站對搜索引擎蜘蛛不友好的10點因素有哪些呢?
1、動態(tài)url
動態(tài)url就是數(shù)據庫驅動的網站所生成的帶有符號、隨機的url。相比靜態(tài)url,動態(tài)url不利于搜索引擎蜘蛛的爬行及抓取。這也就是網站seo優(yōu)化時需要靜態(tài)化或者偽靜態(tài)化url的原因,因為筆者只用過wp,之前也只提到過wp網站seo優(yōu)化如何偽靜態(tài)化url。
2、死鏈
通俗的講,死鏈就是無法打開的鏈接。搜索引擎蜘蛛如果在網站內爬行,卻屢屢遭受無法打開頁面的煎熬。顯然,如此一來該網站對于搜索引擎蜘蛛來說正在逐漸的失去信任。
3、各種跳轉
這個指的是通過不同的技術或指令,自動將一個網頁跳轉到另一個網頁。目前搜索引擎比較支持的是301跳轉,但是這往往被黑帽seo所利用,從而導致搜索引擎蜘蛛對其比較敏感。
4、flash動畫
很多網站都會在頁面上添加flash動畫,但是搜索引擎蜘蛛說到底只是一個程序,它不能像人一樣觀看flash動畫的內容。雖然搜索引擎一直在這方面努力,但是以目前的搜索引擎蜘蛛技術還不能完全有效的抓取flash的內容。
另外,如果在網站上出現(xiàn)了flash動畫,搜索引擎都建議添加相應的文字描述,以便搜索引擎蜘蛛較直觀的了解flash動畫內容。
5、js代碼
搜索引擎蜘蛛對抓取js代碼也是比較困難的,大量的js代碼會嚴重影響搜索引擎蜘蛛抓取的速度。所以,網站seo優(yōu)化時要盡量避免,或者少用js代碼。
6、框架結構
使用框結構設計網頁流行于互聯(lián)網誕生初期,但是由于不便于搜索引擎蜘蛛的抓取而被拋棄。在做網站seo優(yōu)化時,應當完全摒棄框架結構,甚至不需要了解它。
7、必須登錄瀏覽網站。很多網站有部分甚至全部內容需要注冊登陸后才能瀏覽,大部分社會化媒體(如sns網站、微博等)即是如此。但是搜索引擎蜘蛛不會填寫用戶名密碼,更不會注冊。
8、sessionid
sessionid是為了跟蹤每一位訪問用戶,生成唯一的sessionid,并加在url中。而這種僅僅sessionid不同的url的實際頁面內容是相同的,從而會導致搜索引擎蜘蛛的重復收錄。
9、強制使用cookies
搜索引擎蜘蛛實際是禁用cookies的,如果不啟用cookies就無法正常顯示內容的話,搜索引擎蜘蛛就無法看見網頁的內容。
10、不穩(wěn)定的服務器
如果網站因為服務器的問題經常性的無法正常訪問,久而久之,搜索引擎蜘蛛爬到你的域名上卻時常“碰壁”,搜索引擎蜘蛛自然而然的就會認為這個網站不靠譜。如此一來,網站也將失去搜索引擎蜘蛛的信任。