【課程內(nèi)容】
第一部分 創(chuàng)建爬蟲
第1章 初見網(wǎng)絡(luò)爬蟲
第2章 復(fù)雜HTML解析
第3 章 開始采集
第4 章 使用API
第5 章 存儲數(shù)據(jù)
第6 章 讀取文檔
第二部分 高級數(shù)據(jù)采集
第7 章 數(shù)據(jù)清洗
第8 章 自然語言處理
第9 章 穿越網(wǎng)頁表單與登錄窗口進(jìn)行采集
第10 章 采集JavaScript
第11 章 圖像識別與文字處理
第12 章 避開采集陷阱
第13 章 用爬蟲測試網(wǎng)站
第14 章 遠(yuǎn)程采集