作者:十一月听雨 | 来源:互联网 | 2013-07-22 14:06
【posix正则含义和符号解释】
1、portable Operation System interface
2、原子、模式修饰符、元子符等组成
3、| 管道操作符 可以理解为或的意思多个正则共存 php|zend
4、() 代表匹配一组 p(hp)*=>php phphp p
5、[] 代表一定范围内的 [^]只有这种情况下为非[^a-zA-Z0-9_]
6、();代表一组原子和反引用
7、?匹配0次或者1次或非贪婪匹配
8、^ 在开头叫做以什么开始 而在匹配模式内代表取反
【量词的含义】
符号
|
含义
|
+
|
>=1 重复的次数至少一次
|
*
|
>=0 重复的次数至少零次
|
?
|
0或者1(在特定的场合代表非贪婪)
|
{n,}
|
>=n次 至少出现N次
|
{n,m}
|
在n至m之间 n<=次数<=m
|
{n}
|
匹配n次
|
.
|
匹配任何字符
|
^
|
匹配开头或者取反
|
$
|
代表结尾
|
【内置的匹配模式】
符号
|
含义
|
[:alnum:]
|
匹配数字、字母[a-zA-Z0-9]
|
[:alpha:]
|
匹配大小写字母 [A-Za-z]
|
[:cntrl:]
|
控制字符,例如制表退格反斜杠
|
[:digit:]
|
匹配数字[0-9]
|
[:graph:]
|
匹配可打印字符,ASCII33-126
|
[:lower:]
|
匹配小写字母[a-z]
|
[:upper:]
|
匹配大写字母[A-Z]
|
[:punct:]
|
匹配标点符号除 \ |
|
[:space:]
|
\n \t \r等空白字符
|
[:xdigit:]
|
16进制[a-f0-9A-F]
|
【posix相关函数】
1、ereg($pattern,$string,&数组);eregi()忽略$string的大小写 //匹配并返回
2、ereg_replace($pattern,$replacement,$string);//匹配替换
3、split($pattern,$string,$limit) //匹配并分开
【perl正则pcre】
1、修饰符
i://不去分大小写
g://全句搜索 preg_match_all(报错,原因不详)
m://将字符换视为多行,每一行都以^开始$结束
s://见字符串视为一行
x://忽略正则表达式中的空白和注释
U://第一次匹配后停止 也可以通过? 而posix中问号不可以做为非贪婪匹配
例如:/apple/i 匹配apple这个单词,不区分大小写APPLE
/banan/ig://匹配banana,忽略字符串的大小写,同时全局搜索
preg_match()
pcre的pattern要加上’/pattern/’ ‘|pattern|’;
附录:
i :如果在修饰符中加上”i”,则正则将会取消大小写敏感性,即”a”和”A” 是一样的。
m:默认的正则开始”^”和结束”$”只是对于正则字符串如果在修饰符中加上”m”,那么开始和结束将会指字符串的每一行:每一行的开头就是”^”,结尾就是”$”。
s:如果在修饰符中加入”s”,那么默认的”.”代表除了换行符以外的任何字符将会变成任意字符,也就是包括换行符!
x:如果加上该修饰符,表达式中的空白字符将会被忽略,除非它已经被转义。
e:本修饰符仅仅对于replacement有用,代表在replacement中作为PHP代码。
A:如果使用这个修饰符,那么表达式必须是匹配的字符串中的开头部分。比如说”/a/A”匹配”abcd”。
E:与”m”相反,如果使用这个修饰符,那么”$”将匹配绝对字符串的结尾,而不是换行符前面,默认就打开了这个模式。
U:和问号的作用差不多,用于设置”贪婪模式”。
【pcre内置模式】
符号
|
含义
|
\b
|
匹配边界/abc\b/;以abc结尾的字符串
|
\B
|
匹配除边界之外的
|
\d
|
匹配数字
|
\D
|
匹配非数字
|
\s
|
匹配空白符
|
\S
|
匹配除空白符
|
\w
|
匹配字母数字下划线^[a-z0-9A-Z_]$
|
\W
|
匹配除数字字母下划线
|
【pcre正则函数】
1、preg_match($pattern,$string,&$result);
2、preg_grep($pattern,$array,$flag);$flag = true输出相反的匹配
3、preg_match_all($pattern,$string,&$result,order)
order = PREG_PATTERN_ORDER(默认值) | PREG_SET_ORDER;
4、preg_quote($string);将string中的具有正则特殊意义的字符转义
5、preg_replace($pattern,’反引用|$replace’,$string,$limit);
反引用:\\0 \\1 \\2……\\99
6、preg_split($pattern,$string,$limit,$flag)
$flag:
PREG_SPLIT_NO_EMPTY //去除数组中的空值
PREG_SPLIT_DELIM_CAPTURE//子模式的值也存入数组
PREG_SPLIT_OFFSET_CAPTURE//模式偏移量的值记入数组
7、preg_replace_callback($pattern,callback,$string,$limit)
【注意事项】
1、posix正则不需要加/ pattern /,而pcre正则需要加| /
2、?只能在pcre中量词之后代表非贪婪
3、U和?同时出现无效
4、反引用要注意子模式匹配从\\0开始
5、[]中所有的字符都作为普通字符处理 并且不需要转义 代表范围
6、^符号只有在[]中代表非的意思,[]外面代表以什么开始
7、$和^只能在匹配模式的结尾和开头
8、注意posix和pcre中内置模式不要混淆
9、posix中的内置模式是个范围,使用时外面加[]例如[[:alpha:]]