日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

首先一些Python/ target=_blank class=infotextkey>Python字符串處理的簡易常用的用法。

 

整理的一些在使用Python中常用網頁字符串處理方法

 

1.去掉重復空格

s = "hello   hello   hello"
s = ' '.join(s.split())

2.去掉所有回車(或其他字符或字符串)

s = "hellonhellonhello hellon"
print(s)
s = s.replace("n","")
print(s)

3.查找字符串首次出現的位置(沒有返回-1)

s = "hellonhellonhello hellon"
print(s.find('n'))
print(s.find('la'))

4.查找字符串從后往前找首次出現的位置(沒有返回-1)

s = "hellonhellonhello hellon"
print(s.rfind('n'))
print(s.rfind('la'))

5.將字符串轉化成列表list

s = "hellonhellonhello hellon"
print(list(s))

6.查找所有匹配的子串


import re

s = "hellonhellonhello hellon"
print(re.findall('hello',s)) # hello也可以換成正則表達式

然后是網頁字符串處理的高端用法:

綜合運用requests模塊,beautifulsoup模塊,re模塊等

1.requests獲取一個鏈接的內容并原封不動寫入文件

import requests

r = requests.get('https://baike.baidu.com')
with open('test.html', 'wb') as fd:
    for chunk in r.iter_content(100):
        fd.write(chunk)

2.讀取一個文件的所有內容存到一個字符串里

with open('test.html','r',encoding='utf-8') as f:
    content = f.readlines()
content = ''.join(content)
# content = content.replace('n','') # 如果想去掉回車可以加上這行
print(content)

3.把網頁字符串用BeautifulSoup存起來處理

from bs4 import BeautifulSoup

soup = BeautifulSoup(content,'html.parser')
print(soup.prettify())

4.存到BeautifulSoup里之后這個字符串就可以任你擺布了,比如:提取出所有<a>標簽

soup = BeautifulSoup(content,'html.parser')
print(soup.find_all('a'))

或者提取出所有<a>標簽和<b>標簽

soup = BeautifulSoup(content,'html.parser')
print(soup.find_all(['a','b']))

這些屬于beautifulsoup的內容了

5.多個關鍵字切分字符串

import re
re.split('; |, ',str)

>>> a='Beautiful, is; better*thannugly'
>>> import re
>>> re.split('; |, |*|n',a)
['Beautiful', 'is', 'better', 'than', 'ugly'

分享到:
標簽:Python
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定