日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

很多時候我們需要使用Selenium庫來執行Python爬蟲或自動測試,但是我們經常會在登錄時因為驗證代碼而卡住,特別頭疼。尤其是現在的圖形認證代碼和移動滑塊驗證碼,連最簡單的文本數字驗證代碼也被加了干擾線。比如以下的圖形驗證碼。

 

私信小編01 領取學習教程

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

還有我們基本都看過的 12306 的圖形驗證碼。

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

還有這種滑塊驗證碼

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

如果直接進行登錄的話這些驗證碼破解起來的話都會比較的麻煩,費時費力,所以我們想想有沒有辦法繞過這個登錄過程。其實是有的,下面我們就來講講如何繞過這個登錄

繞過登錄基本有兩種方法:

  • 第一種方法是登錄后查看網站的 cookie,請求 url 的時候把 cookie 帶上
  • 第二種方法是啟動瀏覽器帶上瀏覽器的全部信息,包括添加的書簽和訪問網頁的 cookie 信息。

第一種 cookie 方法我們要分析別人網站的 cookie 值,找出相應的值然后添加進去,對于我們不熟的網站,他們可能也會做加密或者動態處理,所以有些網站也不是那么好操作。如果是自己公司的網站需要測試,我們可以詢問對應的開發那個 cookie 值是區分獨立用的值,拿出來放在請求里面就行。

添加cookie繞過登錄

 

比如我們登錄百度賬號比較費勁,每次都需要登錄也比較繁瑣,我們 F12 打開頁面調試工具,登錄后找到 www.baidu.com 文件,在 cookie 中,我們發現很多值,其中圖中圈起來的就是我們要找的值。

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

我們在訪問 baidu 鏈接的時候加上這個 cookie 值,這樣就是直接登錄后的百度賬號了。

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

運行之后會發現selenium剛打開瀏覽器時未登錄

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

但是刷新之后頁面就變成登錄了

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

可見我們成功的繞開了輸入賬號密碼閻驗證碼登錄這個過程。

帶上瀏覽器的信息啟動

 

這個方法其實就是我們實現在瀏覽器中對該網站進行登錄,對應的緩存和 cookie 會保存到瀏覽器默認的路徑下,當我們使用selenium打開瀏覽器時,把瀏覽器的所有信息資料都添加進去,打開網站之后我們之前登錄保存的cookie就會啟用,直接就是已登錄狀態。

我們先查看個人資料路徑,以 chrome 為例,我們在地址欄輸入 chrome://version/

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

圖中的個人資料路徑就是我們需要的,我們去掉后面的 Default,然后在路徑前加上–user-data-dir=就能拼接出我們要的路徑了。

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

接下來,我們啟動瀏覽器的時候采用帶選項時的啟動,這種方式啟動瀏覽器需要注意,運行代碼前需要關閉所有的正在運行 chrome 程序,不然會報錯。

怎樣用Python爬蟲繞過登錄?技巧在這里

 

 

selenium 自動化啟動瀏覽器后我們會發現之前保存的書簽完整在瀏覽器上方,baidu 賬號也是登錄的狀態。

怎樣用Python爬蟲繞過登錄?技巧在這里

 

分享到:
標簽:Python
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定