admin 管理员组

文章数量: 1086019


2024年3月10日发(作者:简单代码大全计算机)

. :匹配任何单个字符。例如正则表达式“b.g”能匹配如下字符串:“big”、“bug”、

“b g”,但是不匹配“buug”,“b..g”可以匹配“buug”。

[ ] :匹配括号中的任何一个字符。例如正则表达式“b[aui]g”匹配bug、big和bag,

但是不匹配beg、baug。可以在括号中使用连字符“-”来指定字符的区间来简化表示,

例如正则表达式[0-9]可以匹配任何数字字符,这样正则表达式“a[0-9]c”等价于

“a[]c”就可以匹配“a0c”、“a1c”、“a2c”等字符串;还可以制定多个区间,

例如“[A-Za-z]”可以匹配任何大小写字母,“[A-Za-z0-9]”可以匹配任何的大小写字母

或者数字。

( ) :将 () 之间括起来的表达式定义为“组”(group),并且将匹配这个表达式的字

符保存到一个临时区域,这个元字符在字符串提取的时候非常有用。把一些字符表示为一个

整体。改变优先级、定义提取组两个作用。

| :将两个匹配条件进行逻辑“或”运算。'z|food' 能匹配 "z" 或 "food"。'(z|f)ood'

则匹配 "zood" 或 "food"。

*:匹配0至多个在它之前的子表达式,和通配符*没关系。例如正则表达式“zo*”能

匹配 “z” 、“zo”以及 “zoo”;因此“.*”意味着能够匹配任意字符串。"z(b|c)*"→zb、

zbc、zcb、zccc、zbbbccc。"z(ab)*"能匹配z、zab、zabab(用括号改变优先级)。

+ :匹配前面的子表达式一次或多次,和*对比(0到多次)。例如正则表达式9+匹配

9、99、999等。 “zo+”能匹配 “zo”以及 “zoo” ,不能匹配"z"。

:匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 。

一般用来匹配“可选部分”。

{n} :匹配确定的 n 次。"zo{2}"→zoo。例如,“e{2}” 不能匹配“bed”中的“e”,

但是能匹配“seed”中的两个“e”。

{n,} :至少匹配n次。例如,“e{2,}”不能匹配“bed”中的“e”,但能匹配 “seeeeeeeed”

中的所有“e”。

{n,m} :最少匹配 n 次且最多匹配 m 次。“e{1,3}”将匹配“seeeeeeeed”中的前

三个“e”。

^(shift+6) :匹配一行的开始。例如正则表达式“^regex”能够匹配字符串“regex

我会用”的开始,但是不能匹配“我会用regex”。

^另外一种意思:非!(暂时不用理解)

$ :匹配行结束符。例如正则表达式“浮云$” 能够匹配字符串“一切都是浮云”的

末尾,但是不能匹配字符串“浮云呀”

d:代表一个数字,等同于[0-9]

D:代表非数字,等同于[^0-9]

s:代表换行符、Tab制表符等空白字符

S:代表非空白字符

w:匹配字母或数字或下划线或汉字,即能组成单词的字符

W:非w ,等同于[^w]

d:digital;s:space、w:word。大写就是“非”

h("bbbbg","^b.*g $");

h("bg", "^b.*g $ ");

h("gege", "^b.*g $ ");

"^d{3,4}-?d+$"表示被匹配的字符序列应该是由三至四位数字组成,由于长途区号

的连字符“-”可有可无,所以这里使用“?”元字符进行说明。由于连字符“-”在正则表

达式中有特殊含义(表示范围,比如[0-9]),所以要对其进行转义。

[]括号中的任意字符,w字母、数字、下划线,+一到多个。由于.在正则表达式中有

特殊的含义,因此对于真正想表达“.”则需要转移“.”。先想正则表达式是语言无关的。

+、*的匹配默认是贪婪(greedy)的:尽可能多的匹配,直到“再贪婪一点儿”其后的

匹配模式就没法匹配为止。

在+、*后添加?就变成非贪婪模式(? 的另外一个用途):让其后的匹配模式尽早的匹

配。修改成"我是(.+?)。"

图片 src[^>]*[^/].(?:jpg|bmp|gif)(?:"|')

中文 ^([u4e00-u9fa5]+|[a-zA-Z0-9]+)$

"foundAnchor>[^'"">]+?)[^>]*?>"

匹配中文字符的正则表达式: [u4e00-u9fa5]

匹配双字节字符(包括汉字在内):[^x00-xff]

匹配空行的正则表达式:n[s| ]*r

匹配HTML标记的正则表达式:/<(.*)>.*<1>|<(.*) >/

匹配首尾空格的正则表达式:(^s*)|(s*$)(像vbscript那样的trim函数)

匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

匹配网址URL的正则表达式:([w-]+.)+[w-]+(/[w- ./?%&=]*)?


本文标签: 匹配 字符 字符串 表示 不能