第五招 PHP之正则表达式

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/lwqBrell/article/details/85614376

定界符

界定符用来标识正则表达式的开始和结束位置,可以用斜杆(/)、花括号({})、#,笔者习惯用斜杆来标识正则表达式的位置,具体用那个看个人开发习惯。

 

可见原子

看得见的元素,如字母、数字、符号等。

 

不可见原子

看不见的元素、如空格、换行、制表符。

 

原子集合

原子集合
. 匹配除换行符之外的任意字符
\d 匹配任意一个十进制数字,[0-9]
\D 匹配任意一个非十进制数字,[^0-9]
\s 匹配一个不可见原子,[\f\n\r\t\v]
\S 匹配一个可见原子,[^\f\n\r\t\v]
\w 匹配任意一个数字、字母或下划线,[0-9a-zA-Z]
\W 匹配任意一个非数字、字母或下划线,[^0-9a-zA-Z]

原子筛选

原子筛选
| 匹配两个或者多个分支
 [ ] 匹配方括号中的任意一个原子
[^] 匹配除方括号中的原子之外的任意字符

 

量词

量词
{n} 表示前面的原子恰好出现次
{n,} 表示前面的原子最少出现n次
{n,m} 表示前面的原子最少出现n次,最多出现m次
* 匹配0、1或者多次之前的原子{0,}
+ 匹配1次或者多次其之前的原子{1,}
? 匹配0次或者1次其之前的原子,{0,1}

 

边界控制

边界控制
^ 匹配字符串开始的位置
$ 匹配字符串结尾的位置

 

模式单元

模式单元
() 将括号内的字符作为一个整体进行匹配

 

修正模式

修正模式
U 懒惰匹配
i 忽略英文字母大小写
x 忽略空白
s 让 ‘.’ 匹配包括换行符在内的所有字符

 

常用字符串函数解析

int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int$offset = 0 ]]] )

pattern
要搜索的模式,字符串类型。

subject
输入字符串。

matches
如果提供了参数matches,它将被填充为搜索结果。 $matches[0]将包含完整模式匹配到的文本, $matches[1] 
将包含第一个捕获子组匹配到的文本,以此类推。

flags
flags可以被设置为以下标记值:

PREG_OFFSET_CAPTURE

int preg_match_all ( string $pattern , string $subject [, array &$matches [, int $flags = PREG_PATTERN_ORDER [, int $offset = 0 ]]] )

pattern
要搜索的模式,字符串形式。

subject
输入字符串。

matches
多维数组,作为输出参数输出所有匹配结果, 数组排序通过flags指定。

flags
可以结合下面标记使用(注意不能同时使用PREG_PATTERN_ORDER和 PREG_SET_ORDER):

PREG_PATTERN_ORDER
结果排序为$matches[0]保存完整模式的所有匹配, $matches[1] 保存第一个子组的所有匹配,以此类推。

mixed preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )

pattern
要搜索的模式。可以使一个字符串或字符串数组。

可以使用一些PCRE修饰符。

replacement
用于替换的字符串或字符串数组。如果这个参数是一个字符串,并且pattern 是一个数组,那么所有的模式都使用这个字符串进行替换。如果pattern和replacement 都是数组,每个pattern使用replacement中对应的 元素进行替换。如果replacement中的元素比pattern中的少, 多出来的pattern使用空字符串进行替换。

replacement中可以包含后向引用\\n 或$n,语法上首选后者。 每个 这样的引用将被匹配到的第n个捕获子组捕获到的文本替换。 n 可以是0-99,\\0和$0代表完整的模式匹配文本。 捕获子组的序号计数方式为:代表捕获子组的左括号从左到右, 从1开始数。如果要在replacement 中使用反斜线,必须使用4个("\\\\",译注:因为这首先是php的字符串,经过转义后,是两个,再经过 正则表达式引擎后才被认为是一个原文反斜线)。

当在替换模式下工作并且后向引用后面紧跟着需要是另外一个数字(比如:在一个匹配模式后紧接着增加一个原文数字), 不能使用\\1这样的语法来描述后向引用。比如, \\11将会使preg_replace() 不能理解你希望的是一个\\1后向引用紧跟一个原文1,还是 一个\\11后向引用后面不跟任何东西。 这种情况下解决方案是使用${1}1。 这创建了一个独立的$1后向引用, 一个独立的原文1。

当使用被弃用的 e 修饰符时, 这个函数会转义一些字符(即:'、"、 \ 和 NULL) 然后进行后向引用替换。当这些完成后请确保后向引用解析完后没有单引号或 双引号引起的语法错误(比如: 'strlen(\'$1\')+strlen("$2")')。确保符合PHP的 字符串语法,并且符合eval语法。因为在完成替换后, 引擎会将结果字符串作为php代码使用eval方式进行评估并将返回值作为最终参与替换的字符串。

subject
要进行搜索和替换的字符串或字符串数组。

如果subject是一个数组,搜索和替换回在subject 的每一个元素上进行, 并且返回值也会是一个数组。

limit
每个模式在每个subject上进行替换的最大次数。默认是 -1(无限)。

count
如果指定,将会被填充为完成的替换次数。

mixed preg_filter ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )

如果subject是一个数组,返回一个数组, 其他情况返回一个字符串。

如果没有找到匹配或者发生了错误,当subject是数组 时返回一个空数组,其他情况返回NULL。

array preg_grep ( string $pattern , array $input [, int $flags = 0 ] )

pattern
要搜索的模式, 字符串形式.

input
输入数组.

flags
如果设置为PREG_GREP_INVERT, 这个函数返回输入数组中与 给定模式pattern不匹配的元素组成的数组.

array preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] )

pattern
用于搜索的模式,字符串形式。

subject
输入字符串

limit
如果指定,将限制分隔得到的子串最多只有limit个,返回的最后一个 子串将包含所有剩余部分。limit值为-1, 0或null时都代表"不限制", 作为php的标准,你可以使用null跳过对flags的设置。

flags
flags 可以是任何下面标记的组合(以位或运算 | 组合):

PREG_SPLIT_NO_EMPTY
如果这个标记被设置, preg_split() 将仅返回分隔后的非空部分。
PREG_SPLIT_DELIM_CAPTURE
如果这个标记设置了,用于分隔的模式中的括号表达式将被捕获并返回。
PREG_SPLIT_OFFSET_CAPTURE
如果这个标记被设置, 对于每一个出现的匹配返回时将会附加字符串偏移量. 注意:这将会改变返回数组中的每一个元素, 使其每个元素成为一个由第0 个元素为分隔后的子串,第1个元素为该子串在subject 中的偏移量组成的数组。

string preg_quote ( string $str [, string $delimiter = NULL ] )

str
输入字符串

delimiter
如果指定了可选参数 delimiter,它也会被转义。这通常用于 转义PCRE函数使用的分隔符。 / 是最常见的分隔符。

猜你喜欢

转载自blog.csdn.net/lwqBrell/article/details/85614376
今日推荐