对于正则表达式一直不是很擅长,所以有必要记录一下。
正则表达式的基本知识
行定位符(^与$)
行定位符是用来描述字符串的边界。“$”表示行结尾“^”表示行开始如"^de",表示以de开头的字符串 "de$",表示以de结尾的字符串。
单词定界符
我们在查找的一个单词的时候,如an是否在一个字符串”gril and body”中存在,很明显如果匹配的话,an肯定是可以匹配字符串“gril and body”匹配到,怎样才能让其匹配单词,而不是单词的一部分呢?这时候,我们可以是哟个单词定界符b。
banb 去匹配”gril and body”的话,就会提示匹配不到。
当然还有一个大写的B,它的意思,和b正好相反,它匹配的字符串不能使一个完整的单词,而是其他单词或字符串中的一部分。如BanB。
选择字符(|) ,表示或
选择字符表示或的意思。如Aa|aA,表示Aa或者是aA的意思。注意使用”[]”与”|”的区别,在于”[]”只能匹配单个字符,而”|”可以匹配任意长度的字符串。在使用”[]”的时候,往往配合连接字符”-“一起使用,如[a-d],代表a或b或c或d。
排除字符,排除操作
正则表达式提供了”^”来表示排除不符合的字符,^一般放在[]中。如1,该字符不是1~5之间的数字。
限定符(?*+{n,m})
限定符主要是用来限定每个字符串出现的次数。
限定字符 | 含义 |
---|---|
? | 零次或一次 |
* | 零次或多次 |
+ | 一次或多次 |
{n} | n次 |
{n,} | 至少n次 |
{n,m} | n到m次 |
/x表示16进制
/u 表示按unicode(utf-8)匹配(主要针对多字节比如汉字)
/i 表示不区分大小写(如果表达式里面有 a, 那么 A 也是匹配对象)
/s 表示将字符串视为单行来匹配
必须只有中英文和数字
$match = "/^[\x{4e00}-\x{9fa5}A-Za-z0-9]+$/u"; if(!preg_match($match,$title)){ echo "含有中文,英文,数字以外的字符"; }else{ echo "只有中文,英文,数字以外的字符"; }
只需包含中英文和数字
$match = "/[\x{4e00}-\x{9fa5}A-Za-z0-9]/u"; if(!preg_match($match,$title)){ echo "不含有中文,英文,数字字符"; }else{ echo "含有中文,英文,数字字符"; }
参考文章:http://www.jb51.net/article/6...
http://www.cnblogs.com/helloh...
- 1-5 ↩