正則表達(dá)式
一、概述
1. 概念
正則表達(dá)式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規(guī)則字符串”,這個“規(guī)則字符串”用來表達(dá)對字符串的一種過濾邏輯。
2. 目的
給定一個正則表達(dá)式和另一個字符串,我們可以達(dá)到如下的目的:
-
a. 給定的字符串是否符合正則表達(dá)式的過濾邏輯(稱作“匹配”);
-
例如:郵箱匹配,電話號碼匹配
-
b. 可以通過正則表達(dá)式,從字符串中獲取我們想要的特定部分。
-
爬蟲中解析 html 數(shù)據(jù)
-
3. 特點(diǎn):
-
a. 靈活性、邏輯性和功能性非常的強(qiáng);
-
b. 可以迅速地用極簡單的方式達(dá)到字符串的復(fù)雜控制。
-
c. 對于剛接觸的人來說,比較晦澀難懂。
-
4. 學(xué)習(xí)方法
-
a. 做好筆記,不要死記硬背
-
b. 大量練習(xí)
Python/ target=_blank class=infotextkey>Python 中通過系統(tǒng)庫 re 實現(xiàn)正則表達(dá)式的所有功能
二、正則表達(dá)式符號
1. 普通字符
下面的案例使用 re
模塊的 findall()
函數(shù),函數(shù)參考如下:
-
re.findall(pattern, string, flag)
-
在字符串中找到正則表達(dá)式所匹配的所有子串,并返回列表,如果沒有找到返回空列表
-
pattern
: 正則表達(dá)式 -
string
:被匹配的字符串 -
flag
:標(biāo)志位用來控制正則表達(dá)式匹配方式
在最簡單的情況下,一個正則表達(dá)式看上去就是一個普通的查找串
import re
s1 = "testing123"
s2 = "Testing123"
r = re.findall("test", s1) # 表示在s1中找到字符串"test"
print(r)
運(yùn)行結(jié)果:
['test']
r = re.findall("test", s2)
print(r)
運(yùn)行結(jié)果:
[]
r = re.findall("test", s2, re.I) # 修飾符re.I:使匹配對大小寫不敏感
print(r)
運(yùn)行結(jié)果:
['Test']
2. 元字符
. ^ $ * + ? { } [ ] | ( )
符號 | 功能 |
---|---|
. | 通配符 . 匹配除 n 之外的任何單個字符 |
^ | 脫字符 ^ 匹配輸入字符串的開始位置 |
$ | 美元符 $ 匹配輸入字符串的結(jié)束位置 |
* | 重復(fù)元字符 * 匹配前面的子表達(dá)式任意次 |
+ | 重復(fù)元字符 + 匹配前面的子表達(dá)式一次或多次(至少一次) |
? | 重復(fù)元字符 ? 匹配前面的子表達(dá)式 0 次或 1 次 |
{} | 重復(fù)元字符{} 也是控制匹配前面的子表達(dá)式次數(shù) |
[ ] | 字符組 [] 表示匹配給出的任意字符 |
| | 選擇元字符 ` |
( ) | 分組元字符 () 將括號之間的表達(dá)式定義為組(group),并且將匹配這個子表達(dá)式的字符返回 |
轉(zhuǎn)義元字符 用來匹配元字符本身時的轉(zhuǎn)義,和特定字符組成字符串,見預(yù)定義字符組 |
2.1 通配符 .
匹配除 n 之外的任何單個字符s1 = "testing123"
s2 = "testing123n"
r = re.findall(".", s1)
print(r)
運(yùn)行結(jié)果:
['t', 'e', 's', 't', 'i', 'n', 'g', '1', '2', '3']
r = re.findall(".", s2) # 除“n”
print(r)
運(yùn)行結(jié)果:
['t', 'e', 's', 't', 'i', 'n', 'g', '1', '2', '3']
修飾符 re.S 使 .
匹配包括換行在內(nèi)的所有字符
r = re.findall(".", s2, re.S)
print(r)
運(yùn)行結(jié)果:
['t', 'e', 's', 't', 'i', 'n', 'g', '1', '2', '3', 'n']
2.2 脫字符 ^
匹配輸入字符串的開始位置
s1 = "testingnTestingntest"
r = re.findall("^test", s1) # 默認(rèn)只匹配單行
print(r)
運(yùn)行結(jié)果:
['test']
r = re.findall("^test", s1, re.M) # 修飾符re.M:多行匹配
print(r)
運(yùn)行結(jié)果:
['test', 'test']
r = re.findall("^test", s1, re.I | re.M)
print(r) # 輸出['test', 'Test', 'test']
運(yùn)行結(jié)果:
['test', 'Test', 'test']
2.3美元符 $
匹配輸入字符串的結(jié)束位置
s1 = "testingnTestingntest"
r = re.findall("testing$", s1) # 默認(rèn)匹配單行
print(r)
運(yùn)行結(jié)果:
[]
r = re.findall("testing$", s1, re.M) # 修飾符re.M:多行匹配
print(r) # 輸出['testing']
運(yùn)行結(jié)果:
['testing']
r = re.findall("testing$", s1, re.I | re.M) # 多個修飾符通過 OR(|) 來指定
print(r) # 輸出['testing', 'Testing']
運(yùn)行結(jié)果:
['testing', 'Testing']
2.4 重復(fù)元字符 *,+,?
-
*
匹配前面的子表達(dá)式任意次 -
+
匹配前面的子表達(dá)式一次或多次(至少一次) -
?
匹配前面的子表達(dá)式 0 次或 1 次
s1 = "znzonzoo"
r = re.findall("zo*", s1) # 匹配o{0,}
print(r)
運(yùn)行結(jié)果:
['z', 'zo', 'zoo']
r = re.findall("zo+", s1) # 匹配o{1,}
print(r)
運(yùn)行結(jié)果:
['zo', 'zoo']
r = re.findall("zo?", s1) # 匹配o{0,1}
print(r)
運(yùn)行結(jié)果:
['z', 'zo', 'zo']
2.5重復(fù)元字符 {}
也是控制匹配前面的子表達(dá)式次數(shù)
s1 = "znzonzoo"
r = re.findall("zo*", s1) # 匹配o{0,},逗號后不能空格
r1 = re.findall(r"zo{0,}", s1)
print(r) # ['z', 'zo', 'zoo']
print(r1) # ['z', 'zo', 'zoo']
運(yùn)行結(jié)果:
['z', 'zo', 'zoo']
['z', 'zo', 'zoo']
r = re.findall("zo+", s1) # 匹配o{1,}
r1 = re.findall(r"zo{1,}", s1)
print(r) # 輸出['zo', 'zoo']
print(r1) # 輸出['zo', 'zoo']
運(yùn)行結(jié)果:
['zo', 'zoo']
['zo', 'zoo']
r1 = re.findall("zo{2}", s1)
print(r1) # 輸出['zoo']
運(yùn)行結(jié)果:
['zoo']
2. 6 字符組 []
表示匹配給出的任意字符
s1 = "吳建國n李建國n黃建國"
r = re.findall("[黃劉李]建國", s1) # 匹配包含的任意字符
print(r)
運(yùn)行結(jié)果:
['李建國', '黃建國']
s1 = "testnTestingnzoo"
r = re.findall("[e-o]", s1) # 匹配包含的字符范圍
print(r)
運(yùn)行結(jié)果:
['e', 'e', 'i', 'n', 'g', 'o', 'o']
s1 = "testnTestingnzoo"
r = re.findall("^[tz]", s1, re.M) # 回憶脫字符,匹配以[tz]開頭字符。
print(r)
運(yùn)行結(jié)果:
['t', 'z']
s1 = "吳建國n李建國n黃建國"
r = re.findall("[^黃劉李]建國", s1) # ^放到[]的里面,表示排除
print(r)
運(yùn)行結(jié)果:
['吳建國']
s1 = "testnTestingnzoo"
r1 = re.findall("[^e-o]", s1) # 匹配未包含的字符范圍
print(r1)
# 輸出
['t', 's', 't', 'n', 'T', 's', 't', 'n', 'z']
2.7 選擇元字符 |
表示兩個表達(dá)式選擇一個匹配
s1 = "znzoodnfood"
r = re.findall("z|food", s1) # 匹配"z"或"food"
print(r)
運(yùn)行結(jié)果:
['z', 'z', 'food']
r = re.findall("[z|f]ood", s1) # 匹配"zood"或"food"
print(r)
運(yùn)行結(jié)果:
['zood', 'food']
2.8 分組元字符 ()
將括號之間的表達(dá)式定義為組(group),并且將匹配這個子表達(dá)式的字符返回
s1 = "znzoodnfood"
r = re.findall("[z|f]o*", s1) # 不加分組,拿到的引號內(nèi)正則表達(dá)式匹配到的字符
print(r)
運(yùn)行結(jié)果:
['z', 'zoo', 'foo']
r = re.findall("[z|f](o*)", s1) # 加上分組,返回的將是引號內(nèi)正則表達(dá)式匹配到的字符中()中的內(nèi)容。
print(r) # ['', 'oo', 'oo']
運(yùn)行結(jié)果:
['', 'oo', 'oo']
2.9轉(zhuǎn)義元字符
用來匹配元字符本身時的轉(zhuǎn)義,和特定字符組成字符串,見預(yù)定義字符組
s = '12345@qq.com'
r = re.findall('.', s)
print(r)
運(yùn)行結(jié)果:
['.']
2.10 非貪婪模式
非貪婪模式
在默認(rèn)情況下,元字符 *,+ 和 {n,m} 會盡可能多的匹配前面的子表達(dá)式,這叫貪婪模式。
s = "abcadcaec"
r = re.findall(r"ab.*c", s) # 貪婪模式,盡可能多的匹配字符(.*或者.+)
print(r)
['abcadcaec']
在重復(fù)元字符后面加上一個?號就表示非貪婪,盡可能少的匹配
r = re.findall(r"ab.+?c", s) # 非貪婪模式,盡可能少的匹配字符
print(r)
['abcadc']
r = re.findall(r"ab.*?c", s) # 非貪婪模式,盡可能少的匹配字符
print(r)
['abc']
s = "<a href=' asdf'>1360942725</a>"
a = re.findall('d', s)
print(a)
['1', '3', '6', '0', '9', '4', '2', '7', '2', '5']
a = re.findall('D', s)
print(a)
['<', 'a', ' ', 'h', 'r', 'e', 'f', '=', "'", ' ', 'a', 's', 'd', 'f', "'", '>', '<', '/', 'a', '>']
s = 'fdfa**68687+ 我怕n fdgtf_dn'
a = re.findall('s', s)
print(a)
[' ', ' ', 't', 'n']
a = re.findall("w", s)
print(a)
['f', 'd', 'f', 'a', '6', '8', '6', '8', '7', '我', '怕', 'n', 'f', 'd', 'g', 'f', '_', 'd']
3. 預(yù)定義字符組
元字符 與某些字符組合在一起表示特定的匹配含義
3.1 d
匹配單個數(shù)字,等價于[0-9]s = "<a href=' asdf'>1360942725</a>"
a = re.findall('d', s)
print(a)
運(yùn)行結(jié)果:
['1', '3', '6', '0', '9', '4', '2', '7', '2', '5']
a = re.findall('d+', s)
print(a)
運(yùn)行結(jié)果:
['1360942725']
3.2 D
匹配任意單個非數(shù)字字符,等價于[^0-9]
a = re.findall('D', s)
print(a)
結(jié)果:
['<', 'a', ' ', 'h', 'r', 'e', 'f', '=', "'", ' ', 'a', 's', 'd', 'f', "'", '>', '<', '/', 'a', '>']
3.3 s
匹配任意單個空白符,包括空格,制表符(tab),換行符等
s = 'fdfa**68687+ 我怕n fdgtf_dn'
a = re.findall('s', s)
print(a)
運(yùn)行結(jié)果:
[' ', ' ', 't', 'n']
3.4 S
匹配任何非空白字符s = 'fdfa**68687+ 我怕n fdgtf_dn'
a = re.findall('S', s)
print(a)
運(yùn)行結(jié)果:
['f', 'd', 'f', 'a', '', '', '6', '8', '6', '8', '7', '+', '我', '怕', 'n', 'f', 'd', 'g', 'f', '_', 'd']
3.5 w
匹配除符號外的單個字母,數(shù)字,下劃線或漢字等
a = re.findall("w", s)
print(a)
運(yùn)行結(jié)果:
['f', 'd', 'f', 'a', '6', '8', '6', '8', '7', '我', '怕', 'n', 'f', 'd', 'g', 'f', '_', 'd']
元字符 | 說明 |
---|---|
. | 匹配除換行符以外的任意字符 |
w | 匹配字母或數(shù)字或下劃線 |
W | 和 w 相反 |
d | 匹配數(shù)字 |
D | 和 d 相反 |
s | 匹配任意的空白符 |
S | 和 s 相反 |
小案例
-
檢測郵箱
s = "3003756995@qq.com"
a = re.findall('^w+@w+.com$', s) # 檢測郵箱
if a:
print('是正確格式的郵箱')
else:
print('不是郵箱地址')
output:
是正確格式的郵箱
-
檢測手機(jī)號碼
s = '13812345678'
r = re.findall('^1[3-9]d{9}$', s) # 檢查手機(jī)號碼
if r:
print('手機(jī)號碼格式正確')
else:
print('手機(jī)號碼格式不正確')
output:
手機(jī)號碼格式正確
4.re 模塊常用函數(shù)
4.1 re.match
-
re.match(pattern, string, flag)
-
嘗試從字符串的起始位置匹配一個模式,成功返回匹配對象,否則返回 None
-
pattern
: 正則表達(dá)式 -
string
: 被匹配的字符串 -
flag
: 標(biāo)志位,表示匹配模式
import re
url = 'www.hhxpython.com'
res = re.match('www', url) # 'www' 就是正則表達(dá)式,沒有元字符表示匹配字符本身
# re.match默認(rèn)是從字符串開頭匹配,等價于'^www'
print(res)
運(yùn)行結(jié)果:
<re.Match object; span=(0, 3), match='www'>
res2 = re.match('hhx', url)
print(res2)
運(yùn)行結(jié)果:
None
匹配對象
match
函數(shù)返回一個匹配對象,通過這個對象可以取出匹配到的字符串和分組字符串
line = 'Good good study, Day day up!'
match_obj = re.match('(?P<aa>.*), (.*) (.*)', line)
if match_obj:
print(match_obj.group()) # 返回匹配到的字符串
print(match_obj.group(1)) # 返回對應(yīng)序號分組字符串 從1開始
print(match_obj.group(2))
print(match_obj.group(3))
else:
print('not found')
print(match_obj.groups()) # 返回分組字符串元組
print(match_obj.groupdict()) # 按照分組名和分組字符串組成字典 (?P<name>pattern)
運(yùn)行結(jié)果:
Good good study, Day day up!
Good good study
Day day
up!
('Good good study', 'Day day', 'up!')
{'aa': 'Good good study'}
4.2 re.search
-
re.search(pattern, string, flag)
-
掃描整個字符串返回第一個成功的匹配對象
-
pattern
: 正則表達(dá)式 -
string
: 被匹配的字符串 -
flag
: 標(biāo)志位,表示匹配模式
url = 'www.hhxpython.com'
res = re.search('www', url) # 'www' 就是正則表達(dá)式,沒有元字符表示匹配字符本身
print(res)
運(yùn)行結(jié)果:
<re.Match object; span=(0, 3), match='www'>
res2 = re.search('hhx', url)
print(res2)
運(yùn)行結(jié)果:
<re.Match object; span=(4, 7), match='hhx'>
res3 = re.search('h', url)
print(res3)
運(yùn)行結(jié)果:
<re.Match object; span=(4, 5), match='h'>
4.3 re.sub
-
re.sub(pattern, repl, string, count=0, flag)
-
將表達(dá)式匹配到的部分替換為制定字符串,返回替換后的新字符串
-
pattern
: 正則表達(dá)式 -
repl
: 用來替換的字符串 -
string
: 被匹配的字符串 -
count
: 替換次數(shù),默認(rèn)為 0,表示全部替換 -
flags
: 標(biāo)志位,表示匹配模式
phone = '2004-959-559 # 這是一個國外電話號碼'
# 刪除字符串中的python注釋
num = re.sub('#.*', '', phone)
print(num)
運(yùn)行結(jié)果:
2004-959-559
# 刪除連接符號 -
num = re.sub('-', '', num)
print(num)
運(yùn)行結(jié)果:
2004959559
4.4 re.findall
-
re.findall(pattern, string, flags=0
-
在字符串中找到正則表達(dá)式匹配的所有子串,返回一個列表,匹配失敗則返回空列表
-
pattern
: 正則表達(dá)式 -
string
: 被匹配的字符串 -
flags
: 標(biāo)志位,表示匹配模式
-
res1 = re.findall('day', line, re.I)
res2 = re.search('day', line, re.I)
res3 = re.match('day', line, re.I)
print('findall', res1)
print('search', res2.group())
print('search', res3)
運(yùn)行結(jié)果:
findall ['Day', 'day']
search Day
search None
match,search,findall 的區(qū)別
-
match
從頭開始匹配,成功返回匹配對象,失敗返回 None -
search
只匹配第一個,成功返回匹配對象,失敗返回 None -
findall
匹配所有,成功返回所有匹配到的字符串組成的列表,失敗返回空列表
4.5 re.compile
-
re.compile(pattern, [flags])
-
compile 函數(shù)用于編譯正則表達(dá)式,生成一個正則表達(dá)式對象,該對象調(diào)用 findall,search,match,sub 等方法
-
pattern
: 正則表達(dá)式 -
flags
: 標(biāo)志位,表示匹配模式
面向?qū)ο缶幊虝r使用
-
attern = re.compile('day', re.I)
res1 = pattern.findall(line)
res2 = pattern.search(line)
res3 = pattern.match(line)
print('findall', res1)
print('search', res2.group())
print('match', res3)
運(yùn)行結(jié)果:
findall ['Day', 'day']
search Day
match None
三、正則表達(dá)式超全速查手冊
校驗數(shù)字的表達(dá)式
數(shù)字:^[0-9]*$
n位的數(shù)字:^d{n}$
至少n位的數(shù)字:^d{n,}$
m-n位的數(shù)字:^d{m,n}$
零和非零開頭的數(shù)字:^(0|[1-9][0-9]*)$
非零開頭的最多帶兩位小數(shù)的數(shù)字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
帶1-2位小數(shù)的正數(shù)或負(fù)數(shù):^(-)?d+(.d{1,2})?$
正數(shù)、負(fù)數(shù)、和小數(shù):^(-|+)?d+(.d+)?$
有兩位小數(shù)的正實數(shù):^[0-9]+(.[0-9]{2})?$
有1~3位小數(shù)的正實數(shù):^[0-9]+(.[0-9]{1,3})?$
非零的正整數(shù):^[1-9]d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^+?[1-9][0-9]*$
非零的負(fù)整數(shù):^-[1-9][]0-9"*$ 或 ^-[1-9]d*$
非負(fù)整數(shù):^d+$ 或 ^[1-9]d*|0$
非正整數(shù):^-[1-9]d*|0$ 或 ^((-d+)|(0+))$
非負(fù)浮點(diǎn)數(shù):^d+(.d+)?$ 或 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$
非正浮點(diǎn)數(shù):^((-d+(.d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$
正浮點(diǎn)數(shù):^[1-9]d*.d*|0.d*[1-9]d*$ 或 ^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$
負(fù)浮點(diǎn)數(shù):^-([1-9]d*.d*|0.d*[1-9]d*)$ 或 ^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$
浮點(diǎn)數(shù):^(-?d+)(.d+)?$ 或 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$
校驗字符的表達(dá)式
漢字:^[u4e00-u9fa5]{0,}$
英文和數(shù)字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
長度為3-20的所有字符:^.{3,20}$
由26個英文字母組成的字符串:^[A-Za-z]+$
由26個大寫英文字母組成的字符串:^[A-Z]+$
由26個小寫英文字母組成的字符串:^[a-z]+$
由數(shù)字和26個英文字母組成的字符串:^[A-Za-z0-9]+$
由數(shù)字、26個英文字母或者下劃線組成的字符串:^w+$ 或 ^w{3,20}
中文、英文、數(shù)字包括下劃線:^[u4E00-u9FA5A-Za-z0-9_]+$
中文、英文、數(shù)字但不包括下劃線等符號:^[u4E00-u9FA5A-Za-z0-9]+$ 或 ^[u4E00-u9FA5A-Za-z0-9]{2,20}$
可以輸入含有^%&',;=?" 等字符:`[^%&',;=?x22]+`
禁止輸入含有~的字符[^~x22]+
其它
.*匹配除 n 以外的任何字符。/[u4E00-u9FA5]/ 漢字
/[uFF00-uFFFF]/ 全角符號
/[u0000-u00FF]/ 半角符號
特殊需求表達(dá)式
EmAIl 地址:^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$
域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.? Inte.NETURL:[a-zA-z]+://[^s]* 或 ^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$
手機(jī)號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])d{8}$
電話號碼(“XXX-XXXXXXX”、”XXXX-XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX):^((d{3,4}-)|d{3.4}-)?d{7,8}$
國內(nèi)電話號碼(0511-4405222、021-87888822):d{3}-d{8}|d{4}-d{7}
身份證號(15位、18位數(shù)字):^d{15}|d{18}$
短身份證號碼(數(shù)字、字母x結(jié)尾):^([0-9]){7,18}(x|X)?$ 或 ^d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
帳號是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
密碼(以字母開頭,長度在6~18之間,只能包含字母、數(shù)字和下劃線):^[a-zA-Z]w{5,17}$
強(qiáng)密碼(必須包含大小寫字母和數(shù)字的組合,不能使用特殊字符,長度在8-10之間):^(?=.*d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
日期格式:^d{4}-d{1,2}-d{1,2}
一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
錢的輸入格式
有四種錢的表示形式我們可以接受:”10000.00” 和 “10,000.00”, 和沒有 “分” 的 “10000” 和 “10,000”:^[1-9][0-9]*$
這表示任意一個不以0開頭的數(shù)字,但是,這也意味著一個字符”0”不通過,所以我們采用下面的形式:^(0|[1-9][0-9]*)$
一個0或者一個不以0開頭的數(shù)字.我們還可以允許開頭有一個負(fù)號:^(0|-?[1-9][0-9]*)$
4.這表示一個0或者一個可能為負(fù)的開頭不為0的數(shù)字.讓用戶以0開頭好了.把負(fù)號的也去掉,因為錢總不能是負(fù)的吧.下面我們要加的是說明可能的小數(shù)部分:^[0-9]+(.[0-9]+)?$
必須說明的是,小數(shù)點(diǎn)后面至少應(yīng)該有1位數(shù),所以”10.”是不通過的,但是 “10” 和 “10.2” 是通過的:^[0-9]+(.[0-9]{2})?$
這樣我們規(guī)定小數(shù)點(diǎn)后面必須有兩位,如果你認(rèn)為太苛刻了,可以這樣:^[0-9]+(.[0-9]{1,2})?$
這樣就允許用戶只寫一位小數(shù).下面我們該考慮數(shù)字中的 逗號 了,我們可以這樣:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
1到3個數(shù)字,后面跟著任意個 逗號+3個數(shù)字,逗號成為可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
備注:這就是最終結(jié)果了,別忘了+可以用*替代如果你覺得空字符串也可以接受的話,最后,別忘了在用函數(shù)時去掉去掉那個反
xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+.[x|X][m|M][l|L]$
中文字符的正則表達(dá)式:[u4e00-u9fa5]
雙字節(jié)字符:^x00-xff)
空白行的正則表達(dá)式:ns*r (可以用來刪除空白行)
HTML標(biāo)記的正則表達(dá)式:<(S?)[^>]>.?</1>|<.? />(網(wǎng)上流傳的版本太糟糕,上面這個也僅僅能部分,對于復(fù)雜的嵌套標(biāo)記依舊無能為力)
首尾空白字符的正則表達(dá)式:^s|s
(可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達(dá)式)
騰訊QQ號:[1-9][0-9]{4,}(騰訊QQ號從10000開始)
中國郵政編碼:[1-9]d{5}(?!d)(中國郵政編碼為6位數(shù)字)
IP地址:d+.d+.d+.d+(提取IP地址時有用)
IP地址:((?:(?:25[0-5]|2[0-4]d|[01]?d?d).){3}(?:25[0-5]|2[0-4]d|[01]?d?d))
IP-v4地址:b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)b(提取IP地址時有用)
校驗IP-v6地址:(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))
子網(wǎng)掩碼:((?:(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))
校驗日期:^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$("yyyy-mm-dd")
抽取注釋:<!--(.*?)-->
查找css屬性:^\s*[a-zA-Z\-]+\s*[:]{1}\s[a-zA-Z0-9\s.#]+[;]{1}
提取頁面超鏈接:(<a\s*(?!.*\brel=)[^>]*)(href="https?:\/\/)((?!(?:(?:www\.)?'.implode('|(?:www\.)?', $follow_list).'))[^" rel="external nofollow" ]+)"((?!.*\brel=)[^>]*)(?:[^>]*)>
提取網(wǎng)頁圖片:\< *[img][^\\>]*[src] *= *[\"\']{0,1}([^\"\'\ >]*)
提取網(wǎng)頁顏色代碼:^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$
文件擴(kuò)展名效驗:^([a-zA-Z]\:|\\)\\([^\\]+\\)*[^\/:*?"<>|]+\.txt(l)?$
判斷IE版本:^.*MSIE [5-8](?:\.[0-9]+)?(?!.*Trident\/[5-9]\.0).*$