谈谈正则表达式,AS3.0中引进了正则表达式。正则表达式是用于验证文本值是否符合特定模式。
正则表达式有四个部分。1元子符。2元序列。3标志。4数量表达符。
可以这样看 pattern RegExp= /匹配字符串元字符元序列/标志当然顺序可能不完全是这样.别把他想的太复杂其实他就是个组合。
现在我们来看看元字符: ^ $ . * + ? ( ) [ ] { } |
前面说的是转义字符串的使用
元子符
1.^的用法:匹配字符串的开头
var pattern:RegExp=/^小虫/;
var str:String="小虫是好人";
trace(str," is valid:",pattern.test(str));小虫是好人 is valid: true
2.$的用法:匹配字符串的结尾
var pattern:RegExp=/lizhen$/;
var str:String="My name is lizhen";
仔细看一下两个符号在匹配字符串中的位置,注意:如果同时使用^符号和$符号,将进行精确匹配。
3.的用法:匹配字符串的结尾
如果匹配字符串中包含有"/"比如 1/2 的时候,使用如下定义
var pattern:RegExp = /1/2/;
var str:String="1/2是多少?";
如果匹配字符串中包含有""比如 "lizhen" 的时候,使用如下定义
var pattern:RegExp=/"lizhen"/;
var str:String="My name is "lizhen"";
4.*的用法:匹配0个或多个前面的字符.
var pattern:RegExp=/我的*/;
var str:String="我的我的我的";或者var str:String="我的"
5.+的用法:匹配至少一个前面的字符
var pattern:RegExp=/我的+/;
var str:String="我的ID是...";或者var str:String="我的"
注意+和*的区别。如果var str:String="我的"那就会显示false
6.?的用法:匹配0个或1个前面的字符
var pattern:RegExp=/天?/;
var str:String="一天快乐";或者var str:String="天天快乐";
7..的用法:匹配任意单个字符
var pattern:RegExp=/天./;
8.[ ]的用法:匹配某一个范围而不局限于具体的单个字符
var pattern:RegExp=/[a-z]/
var str:String="a"
9.( )的用法:这个就相当于是个集合。
var pattern:RegExp=/([a-z][A-Z][0-9])+/ 比如说这个就是定义了一个四个字符的字符串第一个字符是a到z之间的字符第二个是A到Z之间的字符第三个是0-9之间的字符,第四个重复前面的数字。
var str:String="aD77aaaaaaaaaaaaaaaa"
10.|的用法:匹配左边或者右边的字符。
var pattern:RegExp=/小虫|lizhen/
var str:String="小虫是好人"
元序列
元序列是在正则表达式模式中具有特殊含义的字符序列
{n} {n,} {n,m} b B d D f n r s S t unnnn v w w W xnn
1.{n}的用法:匹配恰好n个(n为非负整数)前面的字符。
var pattern:RegExp=/(小虫){2}/ 对象中连续出现2次小虫.注意下(),如果用var pattern:RegExp=/小虫{2}/ 那么就是var str:String="小虫虫"
var str:String="小虫小虫"
2.{n,}的用法:匹配恰好n个(n为非负整数)或更多个前面的字符。
3.{n,m}的用法:匹配至少n个,至多m个前面的字符。
4.b的用法:匹配单词字符和非单词字符之间的位置只能放在开头和结尾。
NN的,他不支持中文.用中文还是用^.
var pattern:RegExp=/b小虫/
var pattern:RegExp=/.mp3b/
var str:String="小虫.mp3"可以判断是否是mp3格式。
5.B的用法:匹配对象必须位于目标字符串的开头和结尾两个边界之内,
即匹配对象既不能作为目标字符串的开头,也不能作为目标字符串的结尾和b相反。
var pattern:RegExp=/B是/
var str:String="我是虫子"
6.d的用法:用于匹配从0到9的数字;
var pattern:RegExp=/bd/ 开头的第一字符必须为数字
var str:String="900/元"
7.D的用法:匹配除数字以外的任何字符
var pattern:RegExp=/bD/ 开头的第一字符必须不为数字
var str:String="a900/元"
8.f的用法:匹配换页符DOS操作时代的概念
9.n的用法:匹配换行符
var pattern:RegExp=/n/
var str:String="欢迎来到虫子的空间!n"
10.r的用法:匹配回车符
var pattern:RegExp=/r/
var str:String="欢迎来到虫子的空间!r"
11.s的用法:匹配任何空白字符(空格、制表符、换行符或回车符)
var pattern:RegExp=/s/
var str:String="欢迎来到虫子的 空间!"
12.S的用法:匹配除空白字符以外的任何字符
var pattern:RegExp=/S/
var str:String="欢迎来到虫子的空间!"
13.t的用法:匹配制表符DOS操作时代的概念
14.unnnn用法:匹配字符代码由十六进制数字 nnnn 指定的 Unicode 字符。
例如,u263a 是一个笑脸字符
var pattern:RegExp=/u263a/
var str:String="欢迎来到虫子的空间!u263a"
15.v 用法:匹配垂直换页符DOS操作时代的概念
16.w用法:匹配单词字符(A-Z、a-z、0-9 或 _)。
请注意,w不匹配非英文字符,如é、ñ 或 ç。他和[]是有区别的。
var pattern:RegExp=/^w/
var str:String="a虫子"
var str:String="0虫子"
var str:String="A虫子"
var str:String="_虫子"
17.W用法:匹配除单词字符以外的任何字符。
var pattern:RegExp=/^W/
var str:String="虫子"
18.xnn用法:匹配具有指定 ASCII 值(由十六进制数字 nn 定义)的字符。
var pattern:RegExp=/^x41/;"A"
var str:String="ABCD";
标志:标志可以作为正则表达式对象属性进行访问。
正则表达式有五个标志:g i m s x
1.g的用法:如果不指定g,那么在查找的时候只会返回一个。
如:
var str:String = "she sells seashells by the seashore.";
var pattern:RegExp = /shw*/;
trace(str.match(pattern)) 输出:she
指定g后:
var pattern:RegExp = /shw*/g;
trace(str.match(pattern)) 输出:she,shells,shore
2.i的用法:默认情况下,正则表达式匹配区分大小写。如果设置 i (ignoreCase) 标志,将忽略区分大小写。
var str:String = "She sells seaShells by the seaShore.";
var pattern:RegExp = /shw*/gi;
trace(str.match(pattern)) 输出:She,Shells,Shore
3.m的用法:匹配"行"的开头和结尾.注意这里的行只有 n 字符表示行的结束,其余的都不行。包括r。比如:
var str:String = "She sells seaShells by the seaShore.n";
str+="She's your mother"
var pattern:RegExp = /^shw*/gim;
也可以在结尾使用.比如:
str+="She's your mother.n"
var pattern:RegExp = /n$w*/gim;
trace("====="+str.match(pattern)) 输出:=====
4.s的用法:用点来匹配换行符
var str:String = "<p>Testn";
str += "Multiline</p>";
var re:RegExp = /<p>.*?</p>/s;
trace(str.match(re));
5.x的用法:在正则表达式中使用 x (extended) 标志时,则会忽略在模式中键入的所有空格。
var str:String = "lizhen";
var re:RegExp = /li zhen/x
trace(str.match(re));输出:lizhen
数量表示符
使用数量表示符指定字符或序列在模式中的重复次数,如下所示:
数量表示符元字符
描述
*(星号)
匹配前面重复零次或多次的项目。
+(加号)
匹配前面重复一次或多次的项目。
?(问号)
匹配前面重复零次或一次的项目。
{n}
{n,}
和
指定前一项目的数值数量或数量范围:
/A{27}/ 匹配重复 27 次的字符 A。
/A{3,}/ 匹配重复 3 次或更多次的字符 A。
您可以将数量表示符应用到单个字符、字符类或组:
/a+/ 匹配重复一次或多次的字符 a。
/d+/ 匹配一个或多个数字。
/[abc]+/ 匹配重复的一个或多个字符,这些字符可能是 a、b 或 c 中的某个。
/(very,)*/ 匹配重复零次或多次的后跟逗号和空格的单词 very。
您可以在应用数量表示符的括号组内使用数量表示符。例如,下面的数量表示符匹配诸如 word 和 word-word-word 的字符串:
/w+(-w+)*/
默认情况下,正则表达式执行所谓的“无限匹配”。正则表达式中的任何子模式(如 .*)都会尝试在字符串中匹配尽可能多的字符,然后再执行正则表达式的下一部分。例如,使用以下正则表达式和字符串:
var pattern:RegExp = /<p>.*</p>/;
str:String = "<p>Paragraph 1</p> <p>Paragraph 2</p>";
正则表达式匹配整个字符串:
<p>Paragraph 1</p> <p>Paragraph 2</p>
但是,假如您只想匹配一个 <p>...</p> 组。则可以通过以下操作实现:
<p>Paragraph 1</p>
在所有数量表示符后添加问号 (?) 以将其更改为所谓的“惰性数量表示符”。例如,下面的正则表达式使用惰性数量表示符 *? 匹配 <p> 后跟数量最少(惰性)的字符,再跟 </p> 的模式:
/<p>.*?</p>/
有关数量表示符,请牢记以下几点:
数量表示符 {0} 和 {0,0} 不会从匹配中排除项目。
不要结合使用多个数量表示符,例如 /abc+*/ 中。
在除非设置 s (dotall) 标志,否则不会跨越多行,即使后跟 * 数量表示符。例如,请考虑使用以下代码:
var re:RegExp = /<p>.*</p>/;
trace(str.match(re)); // null;
re = /<p>.*</p>/s;
// output: <p>Test
// Multiline</p>
常用的正则表达式语句
^d+$ //匹配非负整数(正整数 + 0)
^[0-9]*[1-9][0-9]*$ //匹配正整数
^((-d+)|(0+))$ //匹配非正整数(负整数 + 0)
^-[0-9]*[1-9][0-9]*$ //匹配负整数
^-?d+$ //匹配整数
^d+(.d+)?$ //匹配非负浮点数(正浮点数 + 0)
^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$ //匹配正浮点数
^((-d+(.d+)?)|(0+(.0+)?))$ //匹配非正浮点数(负浮点数 + 0)
^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配负浮点数
^(-?d+)(.d+)?$ //匹配浮点数
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
^w+$ //匹配由数字、26个英文字母或者下划线组成的字符串
^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$ //匹配email地址
^[a-zA-z]+://匹配(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$ //匹配url
匹配中文字符的正则表达式: [u4e00-u9fa5]
匹配双字节字符(包括汉字在内):[^x00-xff]
匹配空行的正则表达式:n[s| ]*r
匹配HTML标记的正则表达式:/<(.*)>.*</>|<(.*) />/
匹配首尾空格的正则表达式:(^s*)|(s*$)
匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配网址URL的正则表达式:^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配国内电话号码:(d{3}-|d{4}-)?(d{8}|d{7})?
匹配腾讯QQ号:^[1-9]*[1-9][0-9]*$
下表是元字符及其在正则表达式上下文中的行为的一个完整列表:
将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向引用、或一个八进制转义符。
^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的Multiline 属性,^ 也匹配 ’n’ 或 ’r’ 之后的位置。
$ 匹配输入字符串的结束位置。如果设置了 RegExp 对象的Multiline 属性,$ 也匹配 ’n’ 或 ’r’ 之前的位置。
* 匹配前面的子表达式零次或多次。
+ 匹配前面的子表达式一次或多次。+ 等价于 {1,}。
? 匹配前面的子表达式零次或一次。? 等价于 {0,1}。
{n} n 是一个非负整数,匹配确定的n 次。
? 当该字符紧跟在任何一个其他限制符 (*,+,?,{n},{n,},m}) 后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。
. 匹配除 "n" 之外的任何单个字符。要匹配包括 ’n’ 在内的任何字符,请使用象 ’[.n]’ 的模式。
(pattern) 匹配pattern 并获取这一匹配。
(?:pattern) 匹配pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。
(?=pattern) 正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。
(?!pattern) 负向预查,与(?=pattern)作用相反
x|y 匹配 x 或 y。
[xyz] 字符集合。
[^xyz] 负值字符集合。
[a-z] 字符范围,匹配指定范围内的任意字符。
[^a-z] 负值字符范围,匹配任何不在指定范围内的任意字符。
b 匹配一个单词边界,也就是指单词和空格间的位置。
B 匹配非单词边界。
cx 匹配由x指明的控制字符。
d 匹配一个数字字符。等价于 [0-9]。
D 匹配一个非数字字符。等价于 [^0-9]。
f 匹配一个换页符。等价于 x0c 和 cL。
n 匹配一个换行符。等价于 x0a 和 cJ。
r 匹配一个回车符。等价于 x0d 和 cM。
s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ fnrtv]。
S 匹配任何非空白字符。等价于 [^ fnrtv]。
t 匹配一个制表符。等价于 x09 和 cI。
v 匹配一个垂直制表符。等价于 x0b 和 cK。
w 匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’。
W 匹配任何非单词字符。等价于 ’[^A-Za-z0-9_]’。
xn 匹配 n,其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。
num 匹配 num,其中num是一个正整数。对所获取的匹配的引用。
n 标识一个八进制转义值或一个后向引用。如果 n 之前至少 n 个获取的子表达式,则 n 为后向引用。否则,如果 n 为八进制数字 (0-7),则 n 为一个八进制转义值。
nm 标识一个八进制转义值或一个后向引用。如果 nm 之前至少有is preceded by at least nm 个获取得子表达式,则 nm 为后向引用。如果 nm 之前至少有 n 个获取,则 n 为一个后跟文字 m 的后向引用。如果前面的条件都不满足,若 n 和 m 均为八进制数字 (0-7),则 nm 将匹配八进制转义值 nm。