日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線(xiàn)咨詢(xún)客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

今天我們?nèi)耘f利用scrapy框架實(shí)現(xiàn)自動(dòng)翻頁(yè)爬取數(shù)據(jù),爬取詩(shī)詞胖排行榜(
https://www.shicimingju.com/paiming)中的標(biāo)題。

1.新建文件夾

scrapy starproject 文件名(wallpaper)

scrapy翻頁(yè)爬取--scrapy爬蟲(chóng)案例

2.新建爬蟲(chóng)文件

scrapy genspider 文件名(landscape)www.xxx.com

scrapy翻頁(yè)爬取--scrapy爬蟲(chóng)案例

3.發(fā)送請(qǐng)求并解析數(shù)據(jù)

上兩節(jié)課有詳細(xì)的講解,所以這部分不再贅述。

scrapy翻頁(yè)爬取--scrapy爬蟲(chóng)案例

4.建立翻頁(yè)鏈接

上面我們放的鏈接為第一頁(yè)的地址,根據(jù)翻頁(yè)網(wǎng)頁(yè)的地址我們可以發(fā)現(xiàn),“p”對(duì)應(yīng)的值為變量,因此我們拼接網(wǎng)址:

scrapy翻頁(yè)爬取--scrapy爬蟲(chóng)案例

scrapy翻頁(yè)爬取--scrapy爬蟲(chóng)案例

5.對(duì)翻頁(yè)鏈接發(fā)送請(qǐng)求

基本格式為:yield scrapy.Request(url地址,callback=self.parse),當(dāng)遇到第二頁(yè)的時(shí)候,會(huì)根據(jù)上面的拼接地址填入,并解析數(shù)據(jù)

scrapy翻頁(yè)爬取--scrapy爬蟲(chóng)案例

6.總結(jié)

要實(shí)現(xiàn)翻頁(yè)自動(dòng)發(fā)送請(qǐng)求,需要先建立好第一頁(yè)的請(qǐng)求并解析,然后寫(xiě)入翻頁(yè)的網(wǎng)址之后,通過(guò)調(diào)用yield關(guān)鍵字實(shí)現(xiàn)翻頁(yè)自動(dòng)發(fā)送請(qǐng)求

分享到:
標(biāo)簽:scrapy
用戶(hù)無(wú)頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過(guò)答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫(kù),初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定