2025-03-04发表2025-03-04更新正则表达式17 分钟读完 (大约2552个字)

正则表达式-介绍

一、元字符

元字符	描述
\	转义字符，即将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。用于匹配一些保留的字符：[ ] ( ) . * + ? ^ $ \ \| 例如：“\n” 匹配一个换行符，”\\“ 匹配 “\“
^	匹配字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性，^ 也匹配 \n 或 \r 之后的位置
$	匹配字符串的结束位置。如果设置了 RegExp 对象的 Multiline 属性，$ 也匹配 \n 或 \r 之前的位置
.	句点符号，匹配除了换行符之外的任意字符。如果要匹配包括 \n 在内的任意字符，请使用 (.\|\n) 的模式。
*	匹配前面的子表达式0次或多次（即 >=0 ）。例如 zq* 能匹配 z 和 zqq，等价于 {0,}
+	匹配前面的子表达式1次或多次（即 >=1 ）。例如 zq+ 能匹配 zq 和 zqq，但不能匹配 z ，等价于 {1,}
?	（1）匹配前面的子表达式0次或1次。例如，ab{cd}? 可以匹配 abcd 或 abcd 中的 ab，等价于 {0,1} 。（2）当该字符紧跟在任何一个其他限制符（*, +, ?, {n}, {n,}, {n,m}）后面时，匹配模式是非贪婪的。非贪婪模式尽可能少地匹配所搜索的字符串，而默认的贪婪模式则尽可能多地匹配所搜索的字符串。例如：对于字符串 oooo，o+? 将匹配单个 o ，而 o+ 将匹配所有 o 。
{n}	n 是一个非负整数，匹配确定的 n 次。例如：o{2} 不能匹配 Bob 中的 o 和 photo 中的o，但是能匹配 food 中的两个 o
{n,}	n 是一个非负整数，至少匹配 n 次。例如：o{2,} 不能匹配 Bob 中的 o，但能匹配 fooooood 中的所有 o，o{1,} 等价于 o+ ，o{0,} 等价于 o*
{n,m}	n 和ｍ均为非负整数，其中 n <= m，最少匹配 n 次且最多匹配 m 次，例如 o{1,3} 将匹配 fooooood 中的前三个 o，o{0,1} 等价于 o? 。注意在逗号和两个数之间不能有空格。
(pattern)	匹配 pattern 并获取这一匹配。所获取的匹配可以从产生的 Matches 集合中得到，在 VBScript 中使用 SubMatches 集合，在JScript 中使用 $1…$9 属性（在VSCode中好像要通过 \1…\n 来引用），要匹配圆括号字符，请使用 $ 或 $
(?:pattern)	匹配pattern但不获取匹配结果，也就是说这是一个非获取匹配，不进行存储供以后使用。这在使用或字符“`(\|)`“来组合一个模式的各个部分是很有用。例如”`industr(?:y\|ies)`“就是一个比”`industry\|industries`“更简略的表达式。
(?=pattern)	正向肯定预查，在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，“`Windows(?=95\|98\|NT\|2000)`“能匹配”`Windows2000`“中的”`Windows`“，但不能匹配”`Windows3.1`“中的”`Windows`“。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始（也就是说在 Windows2000 中匹配到了 Windows之后，会从 2000 开始匹配，而不是从 2000 的后面开始匹配）。
(?!pattern)	正向否定预查，在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如“`Windows(?!95\|98\|NT\|2000)`“能匹配”`Windows3.1`“中的”`Windows`“，但不能匹配”`Windows2000`“中的”`Windows`“。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始
(?<=pattern)	反向肯定预查，与正向肯定预查类拟，只是方向相反。例如，“`(?<=95\|98\|NT\|2000)Windows`“能匹配”`2000Windows`“中的”`Windows`“，但不能匹配”`3.1Windows`“中的”`Windows`“。
(?<!pattern)	反向否定预查，与正向否定预查类拟，只是方向相反。例如“`(?<!95\|98\|NT\|2000)Windows`“能匹配”`3.1Windows`“中的”`Windows`“，但不能匹配”`2000Windows`“中的”`Windows`“。
x\|y	匹配x或y。
[xyz]	字符集合，匹配所包含xyz的任意一个字符。
[^xyz]	负值字符集合，匹配除了xyz之外的任意一个字符。
[a-z]	字符范围，匹配指定范围内的任意字符。
[^a-z]	负值字符范围，匹配任何不在指定范围内的任意字符。
\b	匹配一个单词边界，也就是指单词和空格间的位置。例如：er\b 可以匹配 never 中的 er，但不能匹配 verb 中的 er
\B	匹配非单词边界。er\B 能匹配 verb 中的 er，但不能匹配 never 中的 er
\cx	匹配由 x 指明的控制字符。例如：\cM 匹配一个 Control-M 或回车符。x 的值必须为A-Z 或 a-z 之一，否则将 c 视为一个原义的 “c” 字符。
\d	匹配一个数字字符。等价于[0-9]
\D	匹配一个非数字字符。等价于[^0-9]
\f	匹配一个换页符。等价于\x0c和\cL。
\n	匹配一个换行符。等价于\x0a和\cJ。
\r	匹配一个回车符。等价于\x0d和\cM。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
\S	匹配任何非空白字符。等价于[^ \f\n\r\t\v]。
\t	匹配一个制表符。等价于\x09和\cI。
\v	匹配一个垂直制表符。等价于\x0b和\cK。
\w	匹配包括下划线的任何单词字符。等价于“`[A-Za-z0-9_]`“。
\W	匹配任何非单词字符。等价于“`[^A-Za-z0-9_]`“。
\xn	匹配n，其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如，“`\x41`“匹配”`A`“。”`\x041`“则等价于”`\x04&1`“。正则表达式中可以使用ASCII编码。.
\num	匹配num，其中num是一个正整数。对所获取的匹配的引用。例如，“`(.)\1`“匹配两个连续的相同字符。
\n	标识一个八进制转义值或一个向后引用。如果n之前至少n个获取的子表达式，则n为向后引用。否则，如果n为八进制数字（0-7），则n为一个八进制转义值。
\nm	标识一个八进制转义值或一个向后引用。如果nm之前至少有nm个获得子表达式，则nm为向后引用。如果nm之前至少有n个获取，则n为一个后跟文字m的向后引用。如果前面的条件都不满足，若n和m均为八进制数字（0-7），则nm将匹配八进制转义值nm。
\nml	如果n为八进制数字（0-3），且m和l均为八进制数字（0-7），则匹配八进制转义值nml。
\un	匹配n，其中n是一个用四个十六进制数字表示的Unicode字符。例如，\u00A9匹配版权符号（©）。

二、常用正则表达式

含义	正则表达式
用户名	`/^[a-z0-9_-]{3,16}$/`
密码	`/^[a-z0-9_-]{6,18}$/`
密码2	`(?=^.{8,}$)(?=.\d)(?=.\W+)(?=.[A-Z])(?=.[a-z])(?!.\n).$` (由数字/大写字母/小写字母/标点符号组成，四种都必有，8位以上)
十六进制值	`/^#?([a-f0-9]{6}\|[a-f0-9]{3})$/`
电子邮箱	（1）`/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/` （2）`/^[a-z\d]+(\.[a-z\d]+)@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$/` （3）`\w+([-+.]\w+)@\w+([-.]\w+)\.\w+([-.]\w+)`
URL	`/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-])\/?$/` 或 `[a-zA-z]+://[^\s]*`
IP地址	（1）`/((2[0-4]\d\|25[0-5]\|[01]?\d\d?)\.){3}(2[0-4]\d\|25[0-5]\|[01]?\d\d?)/` （2）`/^(?:(?:25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)$/` （3）`((2[0-4]\d\|25[0-5]\|[01]?\d\d?)\.){3}(2[0-4]\d\|25[0-5]\|[01]?\d\d?)`
HTML标签	`/^<([a-z]+)([^<]+)(?:>(.)<\/\1>\|\s+\/>)$/`或`<(.)(.)>.<\/\1>\|\s+\/>)$/` 或 `<(.)(.)>.<\/\1>`
删除代码 // 注释	`(?<!http:\|\S)//.*$`
匹配双字节字符(包括汉字在内)	`[^\x00-\xff]`
汉字(字符)	`[\u4e00-\u9fa5]`
Unicode编码中的汉字范围	`/^[\u2E80-\u9FFF]+$/`
中文及全角标点符号(字符)	`[\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]`
日期(年-月-日)	`(\d{4}\|\d{2})-((0?([1-9]))\|(1[1\|2]))-((0?[1-9])\|([12]([1-9]))\|(3[0\|1]))`
日期(月/日/年)	`((0?[1-9]{1})\|(1[1\|2]))/(0?[1-9]\|([12][1-9])\|(3[0\|1]))/(\d{4}\|\d{2})`
时间(小时:分钟, 24小时制)	`((1\|0?)[0-9]\|2[0-3]):([0-5][0-9])`
中国大陆固定电话号码	`(\d{4}-\|\d{3}-)?(\d{8}\|\d{7})`
中国大陆手机号码	`1\d{10}`
中国大陆邮政编码	`[1-9]\d{5}`
中国大陆身份证号(15位或18位)	`\d{15}(\d\d[0-9xX])?`
非负整数(正整数或零)	`\d+`
正整数	`[0-9][1-9][0-9]`
负整数	`-[0-9][1-9][0-9]`
整数	`-?\d+`
小数	`(-?\d+)(\.\d+)?`
空白行	`\n\s\r 或者 \n\n(editplus) 或者 ^[\s\S ]\n`
匹配首尾空白字符	`^\s\|\s$`

三、修饰符（标记）

标记也称为修饰符，正则表达式的标记用于指定额外的匹配策略。

标记不写在正则表达式里，标记位于表达式之外，格式如下：

1	/pattern/flags

正则表达式常用的修饰符：

修饰符	含义	描述
i	ignore - 不区分大小写	将匹配设置为不区分大小写，搜索时不区分大小写: A 和 a 没有区别。
g	global - 全局匹配	查找所有的匹配项。
m	multi line - 多行匹配	使边界字符 ^ 和 $ 匹配每一行的开头和结尾，记住是多行，而不是整个字符串的开头和结尾。
s	让特殊字符圆点 . 中包含换行符 \n	默认情况下的圆点 . 是匹配除换行符 \n 之外的任何字符，加上 s 修饰符之后, . 中包含换行符 \n。

在线测试工具：

菜鸟：https://www.jyshare.com/front-end/854/

正则表达式-介绍

https://rainbowsea.xyz/2025/03/04/other/正则表达式-介绍/

作者

悟道心得

发布于

2025-03-04

更新于

2025-03-04

正则表达式-介绍

一、元字符

二、常用正则表达式

三、修饰符（标记）

作者

发布于

更新于

许可协议

链接

分类

目录

最新文章

归档

标签