欧美日本中国一区二区视频在线观看,久久久中文字幕日本无吗,亚洲美女成人片

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > IT業界 >正文

Python 爬蟲如何獲取 JS 生成的 URL 和網頁內容？

發布時間：2023-07-03 16:46:05 作者：網友整理

雖然這是一個很久以前的問題。但是看到好多答案的辦法有點太重了，這里分享一個效率更優、資源占用更低的方法。

首先請一定記住，瀏覽器環境對內存和CPU的消耗都非常嚴重，模擬瀏覽器環境的爬蟲代碼要盡可能避免。請記住，對于一些前端渲染的網頁，雖然在html源碼中看不到我們需要的數據，但是更大的可能是它會通過另一個請求拿到純數據（很大可能以JSON格式存在），我們不但不需要模擬瀏覽器，反而可以省去解析HTML的消耗。

然后，我們以北郵人論壇為目標！打開北郵人論壇的首頁，發現它的首頁HTML源碼中確實沒有頁面所顯示文章的內容，那么，很可能這是通過JS異步加載到頁面的。通過瀏覽器開發工具（Chrome瀏覽器在OS X下通過command+option+i或Win/linux下通過F12）分析在加載首頁的時候請求，容易發現，如下截圖中的請求：