為方便正則表達式記憶的口訣,口訣描述了正則表達式的書寫規則和常用方法
正則表達式基本概念,正則表達式口訣,正則表達式書寫規則,保留字,字元,字元類,常用正則表達式,正則表達式用例,
正則表達式基本概念
1.貪婪:+,*,?,{m,n}等默認是貪婪匹配,即儘可能多匹配,也叫最大匹配
如果後面加上?,就轉化為非貪婪匹配,需要高版本支持
2.獲取:默認用(x ¦y)是獲取匹配,很多時候只是測試,不一定要求得到所匹配的數據,尤其在嵌套匹配或大數據中就要用非獲取匹配(?:x ¦y),這樣提高了效率,最佳化了程式。
3.消耗:默認是消耗匹配,一般在預查中是非消耗匹配。
舉個例子,2003-2-8要變為2003-02-08
如果用/-(\d)-/第二次匹配將從8開始,從而只替換第一個2,錯誤
如果用/-(\d)(?=-)/則第二次匹配從第二個-開始,即不消耗字元
4.預查:js中分為正向預查和負向預查
如上面的(?=pattern)是正向預查,在任何匹配 pattern 的字元串開始處匹配查找字元串。還有 (?!pattern)是負向預查,在任何不匹配 pattern 的字元串開始處匹配查找字元串。負向預查有時會用在對[^]的擴充,[^]只是一些字元,而?!可以使整個字元串。
5.回調:一般用在替換上,即根據不用的匹配內容返回不用的替換值,從而簡化了程式,需要高版本支持
6.引用:\num 對所獲取的第num個匹配的引用。
例如,’(.)\1\1′ 匹配AAA型。’(.)(.)\2\1′ 匹配ABBA型。
如果後面加上?,就轉化為非貪婪匹配,需要高版本支持
2.獲取:默認用(x ¦y)是獲取匹配,很多時候只是測試,不一定要求得到所匹配的數據,尤其在嵌套匹配或大數據中就要用非獲取匹配(?:x ¦y),這樣提高了效率,最佳化了程式。
3.消耗:默認是消耗匹配,一般在預查中是非消耗匹配。
舉個例子,2003-2-8要變為2003-02-08
如果用/-(\d)-/第二次匹配將從8開始,從而只替換第一個2,錯誤
如果用/-(\d)(?=-)/則第二次匹配從第二個-開始,即不消耗字元
4.預查:js中分為正向預查和負向預查
如上面的(?=pattern)是正向預查,在任何匹配 pattern 的字元串開始處匹配查找字元串。還有 (?!pattern)是負向預查,在任何不匹配 pattern 的字元串開始處匹配查找字元串。負向預查有時會用在對[^]的擴充,[^]只是一些字元,而?!可以使整個字元串。
5.回調:一般用在替換上,即根據不用的匹配內容返回不用的替換值,從而簡化了程式,需要高版本支持
6.引用:\num 對所獲取的第num個匹配的引用。
例如,’(.)\1\1′ 匹配AAA型。’(.)(.)\2\1′ 匹配ABBA型。
正則表達式口訣
正則其實也勢利,削尖頭來把錢揣; (指開始符號^和結尾符號$)
特殊符號認不了,弄個倒槓來引路; (指\. \*等特殊符號)
倒槓後面跟小w, 數字字母來表示; (\w跟數字字母;\d跟數字)
倒槓後面跟小d, 只有數字來表示;
倒槓後面跟小a, 報警符號嘀一聲;
倒槓後面跟小b, 單詞分界或退格;
倒槓後面跟小t, 制表符號很明了;
倒槓後面跟小r, 回車符號知道了;
倒槓後面跟小s, 空格符號很重要;
小寫跟罷跟大寫,多得實在不得了;
倒槓後面跟大W, 字母數字靠邊站;
倒槓後面跟大S, 空白也就靠邊站;
倒槓後面跟大D, 數字從此靠邊站;
倒框後面跟大B, 不含開頭和結尾;
單個字元要重複,三個符號來幫忙; (* + ?)
0 星加1 到無窮,問號只管0 和1; (*表0-n;+表1-n;?表0-1次重複)
花括弧里學問多,重複操作能力強; ({n} {n,} {n,m})
若要重複字元串,園括把它括起來; ((abc){3} 表示字元串“abc”重複3次 )
特殊集合自定義,中括弧來幫你忙;
轉義符號行不通,一個一個來排隊;
實在多得排不下,橫槓請來幫個忙; ([1-5])
尖頭放進中括弧,反義定義威力大; ([^a]指除“a”外的任意字元 )
1豎作用可不小,兩邊正則互替換; (鍵盤上與“\”是同一個鍵)
1豎能用很多次,複雜定義很方便;
園括弧,用途多;
反向引用指定組,數字排符對應它; (“\b(\w+)\b\s+\1\b”中的數字“1”引用前面的“(\w+)”)
支持組名自定義,問號加上尖括弧; (“(?\w+)”中把“\w+”定義為組,組名為“Word”)
園括弧,用途多,位置指定全靠它;
問號等號字元串,定位字元串前面; (“\b\w+(?=ing\b)”定位“ing”前面的字元串)
若要定位串後面,中間插個小於號; (“(?<=\bsub)\w+\b”定位“sub”後面的字元串)
問號加個驚嘆號,後面跟串字元串;
phper都知道, !是取反的意思;
後面不跟這一串,統統符合來報到; (“\w*d(?!og)\w*”,“dog”不符合,“do”符合)
問號小於驚嘆號,後面跟串字元串;
前面不放這一串,統統符合來報到;
點號星號很貪婪,加個問號不貪婪;
加號問號有保底,至少重複一次多;
兩個問號老規矩,0次1次團團轉;
花括弧後跟個?,貪婪變成不貪婪;
還有很多裝不下,等著以後來增加
特殊符號認不了,弄個倒槓來引路; (指\. \*等特殊符號)
倒槓後面跟小w, 數字字母來表示; (\w跟數字字母;\d跟數字)
倒槓後面跟小d, 只有數字來表示;
倒槓後面跟小a, 報警符號嘀一聲;
倒槓後面跟小b, 單詞分界或退格;
倒槓後面跟小t, 制表符號很明了;
倒槓後面跟小r, 回車符號知道了;
倒槓後面跟小s, 空格符號很重要;
小寫跟罷跟大寫,多得實在不得了;
倒槓後面跟大W, 字母數字靠邊站;
倒槓後面跟大S, 空白也就靠邊站;
倒槓後面跟大D, 數字從此靠邊站;
倒框後面跟大B, 不含開頭和結尾;
單個字元要重複,三個符號來幫忙; (* + ?)
0 星加1 到無窮,問號只管0 和1; (*表0-n;+表1-n;?表0-1次重複)
花括弧里學問多,重複操作能力強; ({n} {n,} {n,m})
若要重複字元串,園括把它括起來; ((abc){3} 表示字元串“abc”重複3次 )
特殊集合自定義,中括弧來幫你忙;
轉義符號行不通,一個一個來排隊;
實在多得排不下,橫槓請來幫個忙; ([1-5])
尖頭放進中括弧,反義定義威力大; ([^a]指除“a”外的任意字元 )
1豎作用可不小,兩邊正則互替換; (鍵盤上與“\”是同一個鍵)
1豎能用很多次,複雜定義很方便;
園括弧,用途多;
反向引用指定組,數字排符對應它; (“\b(\w+)\b\s+\1\b”中的數字“1”引用前面的“(\w+)”)
支持組名自定義,問號加上尖括弧; (“(?\w+)”中把“\w+”定義為組,組名為“Word”)
園括弧,用途多,位置指定全靠它;
問號等號字元串,定位字元串前面; (“\b\w+(?=ing\b)”定位“ing”前面的字元串)
若要定位串後面,中間插個小於號; (“(?<=\bsub)\w+\b”定位“sub”後面的字元串)
問號加個驚嘆號,後面跟串字元串;
phper都知道, !是取反的意思;
後面不跟這一串,統統符合來報到; (“\w*d(?!og)\w*”,“dog”不符合,“do”符合)
問號小於驚嘆號,後面跟串字元串;
前面不放這一串,統統符合來報到;
點號星號很貪婪,加個問號不貪婪;
加號問號有保底,至少重複一次多;
兩個問號老規矩,0次1次團團轉;
花括弧後跟個?,貪婪變成不貪婪;
還有很多裝不下,等著以後來增加
正則表達式書寫規則
保留字
^ (carat)
. (period)
[ (left bracket}
$ (dollar sign)
( (left parenthesis)
) (right parenthesis)
? (pipe)
* (asterisk)
+ (plus symbol)
? (question mark)
{ (left curly bracket, or left brace)
\ backslash view plaincopy to clipboardprint?
構造 匹配於
構造 匹配於 view plaincopy to clipboardprint?
. (period)
[ (left bracket}
$ (dollar sign)
( (left parenthesis)
) (right parenthesis)
? (pipe)
* (asterisk)
+ (plus symbol)
? (question mark)
{ (left curly bracket, or left brace)
\ backslash view plaincopy to clipboardprint?
構造 匹配於
構造 匹配於 view plaincopy to clipboardprint?
字元
x 字元 x
\\ 反斜線字元
\0n 八進制值的字元0n (0 <= n <= 7)
\0nn 八進制值的字元 0nn (0 <= n <= 7)
\0mnn 八進制值的字元0mnn 0mnn (0 <= m <= 3, 0 <= n <= 7)
\xhh 十六進制值的字元0xhh
\uhhhh 十六進制值的字元0xhhhh
\t 制表符('\u0009')
\n 換行符 ('\u000A')
\r 回車符 ('\u000D')
\f 換頁符 ('\u000C')
\a 響鈴符 ('\u0007')
\e 轉義符 ('\u001B')
\cx T對應於x的控制字元 x
\\ 反斜線字元
\0n 八進制值的字元0n (0 <= n <= 7)
\0nn 八進制值的字元 0nn (0 <= n <= 7)
\0mnn 八進制值的字元0mnn 0mnn (0 <= m <= 3, 0 <= n <= 7)
\xhh 十六進制值的字元0xhh
\uhhhh 十六進制值的字元0xhhhh
\t 制表符('\u0009')
\n 換行符 ('\u000A')
\r 回車符 ('\u000D')
\f 換頁符 ('\u000C')
\a 響鈴符 ('\u0007')
\e 轉義符 ('\u001B')
\cx T對應於x的控制字元 x
字元類
[abc] a, b, or c (簡單類)
[^abc] 除了a、b或c之外的任意 字元(求反)
[a-zA-Z] a到z或A到Z ,包含(範圍)
[a-z-[bc]] a到z,除了b和c : [ad-z](減去)
[a-z-[m-p]] a到z,除了m到 p: [a-lq-z]
[a-z-[^def]] d, e, 或 f view plaincopy to clipboardprint?
預定義的字元類
. 任意字元(也許能與行終止符匹配,也許不能)
\d 數字: [0-9]
\D 非數字: [^0-9]
\s 空格符: [ \t\n\x0B\f\r]
\S 非空格符: [^\s]
\w 單詞字元: [a-zA-Z_0-9]
\W 非單詞字元: [^\w]
[^abc] 除了a、b或c之外的任意 字元(求反)
[a-zA-Z] a到z或A到Z ,包含(範圍)
[a-z-[bc]] a到z,除了b和c : [ad-z](減去)
[a-z-[m-p]] a到z,除了m到 p: [a-lq-z]
[a-z-[^def]] d, e, 或 f view plaincopy to clipboardprint?
預定義的字元類
. 任意字元(也許能與行終止符匹配,也許不能)
\d 數字: [0-9]
\D 非數字: [^0-9]
\s 空格符: [ \t\n\x0B\f\r]
\S 非空格符: [^\s]
\w 單詞字元: [a-zA-Z_0-9]
\W 非單詞字元: [^\w]
常用正則表達式
1.^\d+$ //匹配非負整數(正整數 + 0)
2.^[0-9]*[1-9][0-9]*$ //匹配正整數
3.^((-\d+) ?(0+))$ //匹配非正整數(負整數 + 0)
4.^-[0-9]*[1-9][0-9]*$ //匹配負整數
5.^-?\d+$ //匹配整數
6.^\d+(\.\d+)?$ //匹配非負浮點數(正浮點數 + 0)
7.^(([0-9]+\.[0-9]*[1-9][0-9]*) ?([0-9]*[1-9][0-9]*\.[0-9]+) ?([0-9]*[1-9][0-9]*))$ //匹配正浮點數
8.^((-\d+(\.\d+)?) ?(0+(\.0+)?))$ //匹配非正浮點數(負浮點數 + 0)
9.^(-(([0-9]+\.[0-9]*[1-9][0-9]*) ?([0-9]*[1-9][0-9]*\.[0-9]+) ?([0-9]*[1-9][0-9]*)))$ //匹配負浮點數
10.^(-?\d+)(\.\d+)?$ //匹配浮點數
11.^[A-Za-z]+$ //匹配由26個英文字母組成的字元串
12.^[A-Z]+$ //匹配由26個英文字母的大寫組成的字元串
13.^[a-z]+$ //匹配由26個英文字母的小寫組成的字元串
14.^[A-Za-z0-9]+$ //匹配由數字和26個英文字母組成的字元串
15.^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字元串
16.^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ //匹配email地址
17.^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ //匹配url
18.匹配中文字元的正則表達式: [\u4e00-\u9fa5]
19.匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
20.套用:計算字元串的長度(一個雙位元組字元長度計2,ASCII字元計1)
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,”aa”).length;}
21.匹配空行的正則表達式:\n[\s ? ]*\r
22.匹配HTML標記的正則表達式:/ .* \1> ? /
23.匹配首尾空格的正則表達式:(^\s*) ?(\s*$)
2.^[0-9]*[1-9][0-9]*$ //匹配正整數
3.^((-\d+) ?(0+))$ //匹配非正整數(負整數 + 0)
4.^-[0-9]*[1-9][0-9]*$ //匹配負整數
5.^-?\d+$ //匹配整數
6.^\d+(\.\d+)?$ //匹配非負浮點數(正浮點數 + 0)
7.^(([0-9]+\.[0-9]*[1-9][0-9]*) ?([0-9]*[1-9][0-9]*\.[0-9]+) ?([0-9]*[1-9][0-9]*))$ //匹配正浮點數
8.^((-\d+(\.\d+)?) ?(0+(\.0+)?))$ //匹配非正浮點數(負浮點數 + 0)
9.^(-(([0-9]+\.[0-9]*[1-9][0-9]*) ?([0-9]*[1-9][0-9]*\.[0-9]+) ?([0-9]*[1-9][0-9]*)))$ //匹配負浮點數
10.^(-?\d+)(\.\d+)?$ //匹配浮點數
11.^[A-Za-z]+$ //匹配由26個英文字母組成的字元串
12.^[A-Z]+$ //匹配由26個英文字母的大寫組成的字元串
13.^[a-z]+$ //匹配由26個英文字母的小寫組成的字元串
14.^[A-Za-z0-9]+$ //匹配由數字和26個英文字母組成的字元串
15.^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字元串
16.^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ //匹配email地址
17.^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ //匹配url
18.匹配中文字元的正則表達式: [\u4e00-\u9fa5]
19.匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
20.套用:計算字元串的長度(一個雙位元組字元長度計2,ASCII字元計1)
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,”aa”).length;}
21.匹配空行的正則表達式:\n[\s ? ]*\r
22.匹配HTML標記的正則表達式:/ .* \1> ? /
23.匹配首尾空格的正則表達式:(^\s*) ?(\s*$)
正則表達式用例
1、^\S+[a-z A-Z]$ 不能為空 不能有空格 只能是英文字母
2、\S{6,} 不能為空 六位以上
3、^\d+$ 不能有空格 不能非數字
4、(.*)(\.jpg ?\.bmp)$ 只能是jpg和bmp格式
5、^\d{4}\-\d{1,2}-\d{1,2}$ 只能是2004-10-22格式
6、^0$ 至少選一項
7、^0{2,}$ 至少選兩項
8、^[\s ?\S]{20,}$ 不能為空 二十字以上
9、^\+?[a-z0-9](([-+.] ?[_]+)?[a-z0-9]+)*@([a-z0-9]+(\. ?\-))+[a-z]{2,6}$郵件
10、\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*([,;]\s*\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*)* 輸入多個地址用逗號或空格分隔郵件
11、^(\([0-9]+\))?[0-9]{7,8}$電話號碼7位或8位或前面有區號例如(022)87341628
12、^[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+(\,[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+)*$
只能是字母、數字、下劃線;必須有@和.同時格式要規範 郵件
13 ^\w+@\w+(\.\w+)+(\,\w+@\w+(\.\w+)+)*$上面表達式也可以寫成這樣子,更精練。
14 ^\w+((-\w+) ?(\.\w+))*\@\w+((\. ¦-)\w+)*\.\w+$
匹配中文字元的正則表達式: [\u4e00-\u9fa5]
評註:匹配中文還真是個頭疼的事,有了這個表達式就好辦了
匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
評註:可以用來計算字元串的長度(一個雙位元組字元長度計2,ASCII字元計1)
匹配空白行的正則表達式:\n\s*\r
評註:可以用來刪除空白行
匹配HTML標記的正則表達式: ]*>.*? ?
評註:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對於複雜的嵌套標記依舊無能為力
匹配首尾空白字元的正則表達式:^\s* ?\s*$
評註:可以用來刪除行首行尾的空白字元(包括空格、制表符、換頁符等等),非常有用的表達式
匹配Email地址的正則表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
評註:表單驗證時很實用
匹配網址URL的正則表達式:[a-zA-z]+://[^\s]*
評註:網上流傳的版本功能很有限,上面這個基本可以滿足需求
匹配帳號是否合法(字母開頭,允許5-16位元組,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評註:表單驗證時很實用
匹配國內電話號碼:\d{3}-\d{8} ?\d{4}-\d{7}
評註:匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號:[1-9][0-9]{4,}
評註:騰訊QQ號從10000開始
匹配中國郵政編碼:[1-9]\d{5}(?!\d)
評註:中國郵政編碼為6位數字
匹配身份證:\d{15} ?\d{18}
評註:中國的身份證為15位或18位
匹配ip地址:\d+\.\d+\.\d+\.\d+
評註:提取ip地址時有用
匹配特定數字:
^[1-9]\d*$ //匹配正整數
^-[1-9]\d*$ //匹配負整數
^-?[1-9]\d*$ //匹配整數
^[1-9]\d* ¦0$ //匹配非負整數(正整數 + 0)
^-[1-9]\d* ¦0$ //匹配非正整數(負整數 + 0)
^[1-9]\d*\.\d* ¦0\.\d*[1-9]\d*$ //匹配正浮點數
^-([1-9]\d*\.\d* ¦0\.\d*[1-9]\d*)$ //匹配負浮點數
^-?([1-9]\d*\.\d* ¦0\.\d*[1-9]\d* ¦0?\.0+ ¦0)$ //匹配浮點數
^[1-9]\d*\.\d* ¦0\.\d*[1-9]\d* ¦0?\.0+ ¦0$ //匹配非負浮點數(正浮點數 + 0)
^(-([1-9]\d*\.\d* ¦0\.\d*[1-9]\d*)) ¦0?\.0+ ¦0$ //匹配非正浮點數(負浮點數 + 0)
評註:處理大量數據時有用,具體套用時注意修正
匹配特定字元串:
^[A-Za-z]+$ //匹配由26個英文字母組成的字元串
^[A-Z]+$ //匹配由26個英文字母的大寫組成的字元串
^[a-z]+$ //匹配由26個英文字母的小寫組成的字元串
^[A-Za-z0-9]+$ //匹配由數字和26個英文字母組成的字元串
^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字元串
“^[\\w-]+(\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+___FCKpd___0quot; //email地址
“^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?___FCKpd___0quot; //url