做網(wǎng)站的人一般都很關(guān)注網(wǎng)站的收錄量,而收錄量就需要蜘蛛去爬取,而爬取則需要去提交。
而百度提供了api提交的方法。
用Python/ target=_blank class=infotextkey>Python進(jìn)行提交的話,我選擇的是post提交。
POST /urls?site=“自己網(wǎng)站的token” # 這里是site后面那一段帶網(wǎng)站的,[color=#f95d5d][font=tahoma, PingFangSC, "]site[/font][/color][color=#666666][font=tahoma, PingFangSC, "]=[/font][/color][color=#666666][font=tahoma, PingFangSC, "]https://zjzdmc.top[/font][/color][color=#666666][font=tahoma, PingFangSC, "]&[/font][/color][color=#f95d5d][font=tahoma, PingFangSC, "]token[/font][/color][color=#666666][font=tahoma, PingFangSC, "]=xxxxxxxx,并非是整個(gè)[/font][/color][color=#666666][font=tahoma, PingFangSC, "]接口調(diào)用地址。[/font][/color]
User-Agent: curl/7.12.1
Host: data.zz.baidu.com
Content-Type: text/plain
Content-Length: 83
這個(gè)第一行的token請(qǐng)換成自己的。
私信小編01即可獲取大量Python學(xué)習(xí)資源
http://www.example.com/1.html
http://www.example.com/2.html
這個(gè)是提交示例,也就是說(shuō)一個(gè)一行。
{
"remain":99998,
"success":2,
"not_same_site":[],
"not_valid":[]
}
這個(gè)是返回信息,那么如何去寫就一目了然了。
Python源碼:
import requests
import re
import time
headers = {
'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36,',
'Host': 'data.zz.baidu.com',
'Content-Length':'83'
}
print("*"*30)
print('links.txt示例:nhttps://xxxxx.htmlnhttps://xxxxx.htmlnhttps://xxxxx.htmlnhttps://xxxxx.html')
print("*"*30)
print('api示例:nhttp://data.zz.baidu.com/urls?site=xxxxxxxxxxx')
push_num = 1
while push_num < 9999:
if push_num == 1:
answer = input("請(qǐng)問(wèn)你是否已經(jīng)將鏈接填入links.txt,api填入api.txt中呢,如果是則回答1n")
if answer == '1':
try:
with open('links.txt', 'r') as links:
links = links.read()
except FileNotFoundError:
print("links.txt文件不存在")
try:
with open('api.txt', 'r') as api:
api = api.read()
except FileNotFoundError:
print("links.txt文件不存在")
def thinklink(links, api):
if links == '':
print("links.txt文件為空")
else:
if api == '':
print('api.txt為空')
else:
try:
html_result = requests.post(api, headers=headers, timeout=5, data=links).text
return html_result
except:
return print("失敗")
push_result = thinklink(links, api)
print('提交完成:'+push_result)
surplus_push_num = re.findall('"remain":(.*),"', push_result)
surplus_push_num = surplus_push_num.pop()
print('剩余' + surplus_push_num + '次提交機(jī)會(huì)')
else:
print("請(qǐng)將內(nèi)容填充!5秒鐘后自動(dòng)關(guān)閉")
time.sleep(5)
break
print('*'*30)
new_answer = input("是否還需要提交,如果是的話請(qǐng)先去更改一下相應(yīng)文件,如果是請(qǐng)輸入1,如果否請(qǐng)輸入0n")
if new_answer == '0':
print("提交結(jié)束,5秒鐘后自動(dòng)關(guān)閉")
time.sleep(5)
break
push_num += 1
print("現(xiàn)在開始第"+str(push_num)+'次提交')
需要在python文件新建兩個(gè)txt文件,分別放token和鏈接。
然后其他人就可以直接雙擊打開python文件進(jìn)行提交了。如果有什么疑問(wèn)可以直接問(wèn)。