robots.txt文件,是每一個搜索引擎蜘蛛到你的網站之后要尋找和訪問的第一個文件,robots.txt是你對搜索引擎制定的一個如 何索引你的網站的規則。通過該文件,搜索引擎就可以知道在你的網站中哪些文件是可以被索引的,哪些文件是被拒絕索引的。我們就可以很方便地控制搜索引擎索引網站內容了。 在很多網站中,站長們都忽略了使用robots.txt文件。
因為很多站長都認為,自己的網站沒有什么秘密可言,而且自己也不太會使用robots.txt的語法,因此一旦寫錯了會帶來更多的麻煩,還不如不用。 其實這樣的做法是不對的。如果蜘蛛在某個網站上訪問了一個不存在的URL,那么就會記錄下一條404信息(網頁不存在),而robots.txt作為蜘蛛訪問網站的第一個文件,一旦搜索引擎找不到這個文件,也會在它的索引服務器上記錄下一條404信息。如果這樣的404信息過多,那么搜索引擎蜘蛛就會認為該網站價值較低,從而降低對該網站的“印象分”,這就是我們經常會聽到的“降低權重”。
“權重”是一個影響網站在搜索引擎排名中非常重要的因素,如果網站的權重高,那么搜索引擎蜘蛛也會頻繁地訪問該網站,而且網站排名也好。如果權重低,那么搜索引擎蜘蛛對于網站的訪問次數也相應的要少,同時網站排名較差。而網站的權重是由很多條件所積累的,404信息就是很重要的一條,因此不得不重視。 雖然在百度的幫助文件中,有這樣的一句話“請注意,僅當您的網站包含不希望被搜索引擎收錄的內容時,才需要使用robots.txt文件。如果您希望搜索引擎收錄網站上的所有內容,請 勿建立robots.txt文件”。
實際上百度只是擔心由于網站管理員不懂得robots.txt語法,導致搜索引擎蜘蛛無法正常抓取網站,才這樣寫的。建立robots.txt文件還是必需的,哪怕這個robots.txt文件是一個空白的文本文檔都可以。因為我們的網站畢竟不是僅僅會被百度收錄,同時也會被其他搜索引擎收錄,上傳一個空白的robots.txt文件,至少不會導致一條404信息的產生。
本文來源:裕順網絡www.ahyushun.com如有轉載請注明出處