1、javascripte正则表达式 主页 建站基础 o 了解建站领域 o 域名和空间 o CMS和Blog XHTML o XHMTL基础 o 一网打尽HTML o XHTML文章 CSS o CSS入门 o CSS实验室 o 应用教程 o 一网打尽CSS教程 JavaScript o 菜鸟的JS笔记 o DOM简介 o JavaScript对象 o JS正则表达式 o 菜鸟的Ajax笔记 o JavaScript实例 o 经典JS学习总结 o DHTML教程 单片机 o 单片机笔记 o C51笔记 o 单片机实验 o 51单片机Proteus ARM笔记 o Proteus仿真ARM 其它 o
2、 后台 后台简介 PHP简介 ASP简介 .NET简介 Linux o 网站运营 搜索排名 广告与收入 流量与经验 免费空间 o 模拟器 关于 o 关于本站 o 关于小菜鸟 菜鸟读书 菜鸟的软件 菜鸟的博客 菜鸟的历史 改变内容文字大小:12像素14像素16像素JavaScript正则表达式什么是正则表达式?这个问题可以参见:“正则表达式30分钟入门教程”,很多编程语言都支持正则表达式,本文仅仅讨论JavaScript中的正则表达式。创建一个正则表达式第一种方法:var reg = /pattern/;第二种方法:var reg = new RegExp(pattern);正则表达式的exec
3、方法简介语法:reg.exec(str);其中str为要执行正则表达式的目标字符串。例如:var reg = /test/;var str = testString;var result = reg.exec(str);alert(result);将会输出test,因为正则表达式reg会匹配str(testString)中的test子字符串,并且将其返回。我们使用下面的函数来做匹配正则的练习:function execReg(reg,str) var result = reg.exec(str); alert(result);函数接受一个正则表达式参数reg和一个目标字符串参数str,执行之后
4、会alert出正则表达式与字符串的匹配结果。用这个函数测试上面的例子就是:function execReg(reg,str) var result = reg.exec(str); alert(result);var reg = /test/;var str = testString;execReg(reg,str);上面的例子用正则里的test去匹配字符串里的test,实在是很无聊,同样的任务用indexOf方法就可以完成了。用正则,自然是要完成更强大的功能:一片两片三四片,落尽正则全不见上面的小标题翻译成正则就是1,2,3,4,1,。cn1表示一个的意思。/c1/只能匹配一个c。/c2/则
5、会匹配两个连续的c。以此类推,/cn/则会匹配n个连续的c。看下面的例子:reg = /c1/;str=cainiao;execReg(reg,str);返回结果creg = /c2/;str=cainiao;execReg(reg,str);返回结果null,表示没有匹配成功。reg = /c2/;str=ccVC果冻爽;execReg(reg,str);返回结果cc。cm,nc3,4的意思是,连续的3个c或者4个c。例如reg = /c3,4/;str=ccVC果冻爽;execReg(reg,str);返回结果null,表示没有匹配成功。reg = /c3,4/;str=cccTest;e
6、xecReg(reg,str);结果返回ccc。reg = /c3,4/;str=ccccTest;execReg(reg,str);结果返回cccc,这表明正则会尽量多品牌,可3可4的时候它会选择多匹配一个。reg = /c3,4/;str=cccccTest;execReg(reg,str);仍然只匹配4个c。由以上例子可以推断出,cm,n表示m个到n个c,且m小于等于n。cn,c1,表示1个以上的c。例如:reg = /c1,/;str=cainiao;execReg(reg,str);结果返回c。reg = /c1,/;str=cccccTest;execReg(reg,str);返回
7、ccccc,再次说明了正则表达式会尽量多地匹配。reg = /c2,/;str=cainiao;execReg(reg,str);结果返回null,c2,表示2个以上的c,而cainiao中只有1个c。由以上例子可知,cn,表示最少n个c,最多则不限个数。*,+,?*表示0次或者多次,等同于0,,即c* 和 c0, 是一个意思。+表示一次或者多次,等同于1,,即c+ 和 c1, 是一个意思。最后,?表示0次或者1次,等同于0,1,即c? 和 c0,1 是一个意思。贪心与非贪心人都是贪婪的,正则也是如此。我们在例子reg = /c3,4/;str=ccccTest;的例子中已经看到了,能匹配四个
8、的时候,正则绝对不会去匹配三个。上面所介绍的所有的正则都是这样,只要在合法的情况下,它们会尽量多去匹配字符,这就叫做贪心模式。如果我们希望正则尽量少地匹配字符,那么就可以在表示数字的符号后面加上一个?。组成如下的形式:n,?, *?, +?, ?, m,n?同样来看一个例子:reg = /c1,?/;str=ccccc;execReg(reg,str);返回的结果只有1个c,尽管有5个c可以匹配,但是由于正则表达式是非贪心模式,所以只会匹配一个。/开头,结尾$/表示只匹配字符串的开头。看下面的例子:reg = /c/;str=维生素c;execReg(reg,str);结果为null,因为字符
9、串维生素c的开头并不是c,所以匹配失败。reg = /c/;str=cainiao;execReg(reg,str);这次则返回c,匹配成功,因为cainiao恰恰是以c开头的。与相反,$则只匹配字符串结尾的字符,同样,看例子:reg = /c$/;str=cainiao;execReg(reg,str);返回null,表示正则表达式没能在字符串的结尾找到c这个字符。reg = /c$/;str=维生素c;execReg(reg,str);这次返回的结果是c,表明匹配成功。点.会匹配字符串中除了换行符n之外的所有字符,例如reg = /./;str=cainiao;execReg(reg,st
10、r);结果显示,正则匹配到了字符c。reg = /./;str=blueidea;execReg(reg,str);这次是b。reg = /.+/;str=blueidea经典论坛 好_。;execReg(reg,str);结果是“blueidea经典论坛 好_。“也就是说所有的字符都被匹配掉了,包括一个空格,一个下滑线,和一个破折号。reg = /.+/;reg = /.+/;str=;execReg(reg,str);同样,直接返回整个字符串,可见”.”也匹配”.”本身。reg = /./;str=ncainiao;execReg(reg,str);结果是null,终于失败了,正则要求字符
11、串的第一个字符不是换行,但是恰恰字符是以n开始的。二选一,正则表达式中的或,“|“b|c表示,匹配b或者c。例如:reg = /b|c/;str=blueidea;execReg(reg,str);结果是b。reg = /b|c/;str=cainiao;execReg(reg,str);结果是c。reg = /b|c.+/;str=cainiao;execReg(reg,str);匹配掉整个cainiao。reg = /b|c.+/;str=;execReg(reg,str);结果只有一个b,而不是整个字符串。因为上面正则表达式的意思是,匹配开头的b或者是c.+。括号reg = /(b|c)
12、.+/;str=;execReg(reg,str);这次的结果是整个串,机上上面的括号这后,这个正则的意思是,如果字符串的开头是b或者c,那么匹配开头的b或者c以及其后的所有的非换行字符。如果你也实验了的话,会发现返回的结果后面多出来一个“,b“,这是()内的b|c所匹配的内容。我们在正则表达式内括号里写的内容会被认为是子正则表达式,所匹配的结果也会被记录下来供后面使用。我们暂且不去理会这个特性。字符集合abcabc表示a或者b或者c中的任意一个字符。例如:reg = /abc/;str=;execReg(reg,str);返回结果是b。reg = /abc/;str=test;execReg
13、(reg,str);这次的结果就是null了。我们在字字符集合中使用如下的表示方式:a-z,A-Z,0-9,分别表示小写字母,大写字母,数字。例如:reg = /a-zA-Za-zA-Z0-9_+/;str=test;execReg(reg,str);结果是整个test,正则的意思是开头必须是英文字母,后面可以是英文字母或者数字以及下划线。反字符集合abc在正则表达式开始部分的时候表示开头的意思,例如/c/表示开头是c;但是在字符集和中,它表示的是类似“非“的意思,例如abc就表示不能是a,b或者c中的任何一个。例如:reg = /abc/;str=blueidea;execReg(reg,s
14、tr);返回的结果是l,因为它是第一个非abc的字符(即第一个b没有匹配)。同样:reg = /abc/;str=cainiao;execReg(reg,str);则返回i,前两个字符都是abc集合中的。由此我们可知:0-9表示非数字,a-z表示非小写字母,一次类推。边界与非边界b表示的边界的意思,也就是说,只有字符串的开头和结尾才算数。例如/bc/就表示字符串开始的c或者是结尾的c。看下面的例子:reg = /bc/;str=cainiao;execReg(reg,str);返回结果c。匹配到了左边界的c字符。reg = /bc/;str=维生素c;execReg(reg,str);仍然返回
15、c,不过这次返回的是右侧边界的c。reg = /bc/;str=bcb;execReg(reg,str);这次匹配失败,因为bcb字符串中的c被夹在中间,既不在左边界也不再右边界。与b对应B表示非边界。例如:reg = /Bc/;str=bcb;execReg(reg,str);这次会成功地匹配到bcb中的c,。然而reg = /Bc/;str=cainiao;execReg(reg,str);则会返回null。因为B告诉正则,只匹配非边界的c。数字与非数字d表示数字的意思,相反,D表示非数字。例如:reg = /d/;str=cainiao8;execReg(reg,str);返回的匹配结果
16、为8,因为它是第一个数字字符。reg = /D/;str=cainiao8;execReg(reg,str);返回c,第一个非数字字符。空白f匹配换页符,n匹配换行符,r匹配回车,t匹配制表符,v匹配垂直制表符。s匹配单个空格,等同于fnrtv。例如:reg = /s.+/;str=This is a test String.;execReg(reg,str);返回“is a test String.”,正则的意思是匹配第一个空格以及其后的所有非换行字符。同样,S表示非空格字符。reg = /S+/;str=This is a test String.;execReg(reg,str);匹配结
17、果为This,当遇到第一个空格之后,正则就停止匹配了。单词字符w表示单词字符,等同于字符集合a-zA-Z0-9_。例如:reg = /w+/;str=blueidea;execReg(reg,str);返回完整的blueidea字符串,因为所有字符都是单词字符。reg = /w+/;str=.className;execReg(reg,str);结果显示匹配了字符串中的className,只有第一个“.”唯一的非单词字符没有匹配。reg = /w+/;str=中文如何?;execReg(reg,str);试图用单词字符去匹配中文自然行不通了,返回null。W表示非单词字符,等效于a-zA-Z0
18、-9_reg = /W+/;str=中文如何?;execReg(reg,str);返回完整的字符串,因为,无论是中文和“?”都算作是非单词字符。反向引用形式如下:/(子正则表达式)1/依旧用例子来说明:1.reg = /w/;str=blueidea;execReg(reg,str);返回b。2.reg = /(w)(w)/;str=blueidea;execReg(reg,str);返回bl,b,lbl是整个正则匹配的内容,b是第一个括号里的子正则表达式匹配的内容,l是第二个括号匹配的内容。3.reg = /(w)1/;str=blueidea;execReg(reg,str);则会返回nu
19、ll。这里的“1”就叫做反向引用,它表示的是第一个括号内的字正则表达式匹配的内容。在上面的例子中,第一个括号里的(w)匹配了b,因此“1”就同样表示b了,在余下的字符串里自然找不到b了。与第二个例子对比就可以发现,“1”是等同于“第1个括号匹配的内容”,而不是“第一个括号的内容”。reg = /(w)1/;str=;execReg(reg,str);这个正则则会匹配到bb。同样,前面有几个子正则表达式我们就可以使用几个反向引用。例如:reg = /(w)(w)21/;str=woow;execReg(reg,str);会匹配成功,因为第一个括号匹配到w,第二个括号匹配到o,而21则表示ow,恰
20、好匹配了字符串的最后两个字符。括号(2)前面我们曾经讨论过一次括号的问题,见下面这个例子:reg = /(b|c).+/;str=;execReg(reg,str);这个正则是为了实现只匹配以b或者c开头的字符串,一直匹配到换行字符,但是。上面我们已经看到了,可以使用“1”来反向引用这个括号里的子正则表达式所匹配的内容。而且exec方法也会将这个字正则表达式的匹配结果保存到返回的结果中。不记录子正则表达式的匹配结果使用形如(?:pattern)的正则就可以避免保存括号内的匹配结果。例如:reg = /(?:b|c).+/;str=;execReg(reg,str);可以看到返回的结果不再包括那
21、个括号内的字正则表达式多匹配的内容。同理,反向引用也不好使了:reg = /(b|c)1/;str=;execReg(reg,str);返回bb,b。bb是整个正则表达式匹配的内容,而b是第一个子正则表达式匹配的内容。reg = /(?:b|c)1/;str=;execReg(reg,str);返回null。由于根本就没有记录括号内匹配的内容,自然没有办法反向引用了。正向预查形式:(?=pattern)所谓正向预查,意思就是:要匹配的字符串,后面必须紧跟着pattern!我们知道正则表达式/cainiao/会匹配cainiao。同样,也会匹配cainiao9中的cainiao。但是我们可能希望
22、,cainiao只能匹配cainiao8中的菜鸟。这时候就可以像下面这样写:/cainiao(?=8)/,看两个实例:reg = /cainiao(?=8)/;str=cainiao9;execReg(reg,str);返回null。reg = /cainiao(?=8)/;str=cainiao8;execReg(reg,str);匹配cainiao。需要注意的是,括号里的内容并不参与真正的匹配,只是检查一下后面的字符是否符合要求而已,例如上面的正则,返回的是cainiao,而不是cainiao8。再来看两个例子:reg = /blue(?=idea)/;str=blueidea;execR
23、eg(reg,str);匹配到blue,而不是blueidea。reg = /blue(?=idea)/;str=bluetooth;execReg(reg,str);返回null,因为blue后面不是idea。reg = /blue(?=idea)/;str=bluetoothidea;execReg(reg,str);同样返回null。?!形式(?!pattern)和?=恰好相反,要求字符串的后面不能紧跟着某个pattern,还拿上面的例子:reg = /blue(?!idea)/;str=blueidea;execReg(reg,str);返回null,因为正则要求,blue的后面不能是
24、idea。reg = /blue(?!idea)/;str=bluetooth;execReg(reg,str);则成功返回blue。匹配元字符首先要搞清楚什么是元字符呢?我们之前用过*,+,?之类的符号,它们在正则表达式中都有一定的特殊含义,类似这些有特殊功能的字符都叫做元字符。例如reg = /c*/;表示有任意个c,但是如果我们真的想匹配c*这个字符串的时候怎么办呢?只要将*转义了就可以了,如下:reg = /c*/;str=c*;execReg(reg,str);返回匹配的字符串:c*。同理,要匹配其他元字符,只要在前面加上一个“”就可以了。正则表达式的修饰符全局匹配,修饰符g形式:/
25、pattern/g例子:reg = /b/g;后面再说这个g的作用。先看后面的两个修饰符。不区分大小写,修饰符i形式:/pattern/i例子:var reg = /b/;var str = BBS;execReg(reg,str);返回null,因为大小写不符合。var reg = /b/i;var str = BBS;execReg(reg,str);匹配到B,这个就是i修饰符的作用了。行首行尾,修饰符m形式:/pattern/mm修饰符的作用是修改和$在正则表达式中的作用,让它们分别表示行首和行尾。例如:var reg = /b/;var str = testnbbs;execReg(r
26、eg,str);匹配失败,因为字符串的开头没有b字符。但是加上m修饰符之后:var reg = /b/m;var str = testnbbs;execReg(reg,str);匹配到b,因为加了m修饰符之后,已经表示行首,由于bbs在字符串第二行的行首,所以可以成功地匹配。exec方法详解exec方法的返回值exec方法返回的其实并不是匹配结果字符串,而是一个对象,简单地修改一下execReg函数,来做一个实验就可以印证这一点:function execReg(reg,str) var result = reg.exec(str); alert(typeof result);var reg
27、= /b/;var str=;execReg(reg,str);结果显示result的类型是object。而且是一个类似数组的对象。使用for in可以知道它的属性: index input 0。其中index是表示匹配在原字符串中的索引;而input则是表示输入的字符串;至于0则是表示只有一个匹配结果,可以用下标0来引用这个匹配结果,这个数量可能改变。我们可以通过返回值的length属性来得知匹配结果的总数量。根据以上对返回值的分析,修改execReg函数如下:function execReg(reg,str) var result = reg.exec(str); document.write(index:+result.index+ +input:+result.input+ ); for(i=0;iresult.length;i+) document.write(result+i+:+resulti+) 马上来实验一下:var reg = /w/;var str=;execReg(reg,str);结果如下: index:0 input: result0:b
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1