日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù)，提交前請(qǐng)做好本站友鏈：【網(wǎng)站目錄：http://www.ylptlb.cn 】，免友鏈快審服務(wù)（50元/站），

網(wǎng)站：51998
待審：31
小程序：12
文章：1030137
會(huì)員：747

首頁(yè) > 新聞資訊 > IT業(yè)界 >正文

Shell腳本將普通文件轉(zhuǎn)成xml格式文件需求場(chǎng)景：普通文件：xml格式文件：腳本信息：執(zhí)行：腳本講解：

發(fā)布時(shí)間：2023-07-03 15:33:36 作者：網(wǎng)友整理

需求場(chǎng)景：

公司某個(gè)站點(diǎn)刪除大量稿件，但是這些稿件已經(jīng)被百度收錄，這樣用戶(hù)訪(fǎng)問(wèn)將會(huì)出現(xiàn)404，用戶(hù)體驗(yàn)不太好，所以需要將刪除的稿件生成為xml格式文件，并且每個(gè)文件為5000條數(shù)據(jù)，然后提交至百度進(jìn)行收錄刪除。

普通文件：

https://www.abc.com/html/ys/13003183/20191115/123456.html

https://www.abc.com/html/ys/13003183/20191115/123765.html

https://www.abc.com/html/ys/13003183/20191115/567567.html

https://www.abc.com/html/ys/13003183/20191115/456456.html

https://www.abc.com/html/ys/13003183/20191115/374456.html

https://www.abc.com/html/ys/13003183/20191115/37456645.html

xml格式文件：

<url> <loc> https://www.abc.com/html/ys/13003183/20191115/37404973.html </loc> </url>

<url> <loc> https://www.abc.com/html/jb/13003184/20191115/37404988.html </loc> </url>

<url> <loc> https://www.abc.com/html/jb/13003184/20191115/37404968.html </loc> </url>

<url> <loc> https://www.abc.com/ylaq/13003182/20191115/37404860.html </loc> </url>

<url> <loc> https://www.abc.com/ylaq/13003182/20191115/37404861.html </loc> </url>

</urlset>

腳本信息：

cat xml.sh
#!/bin/bash
#
sed -i 's/^/<url> <loc> /g' $1
sed -i 's/$/ </loc> </url>/g' $1
name=`echo $1 | awk -F"." '{print $1}'`
echo $name
split -l 5000 $1 ${name}_xml
for filename in `find ./ -name "${name}_xml*"`
do
 sed -i '1 i\<urlset>' $filename
 echo "</urlset>" >> $filename
 mv $filename ${filename}.xml
done