jsp正则表达式使用详解.docx

资源描述

jsp正则表达式使用详解.docx

《jsp正则表达式使用详解.docx》由会员分享，可在线阅读，更多相关《jsp正则表达式使用详解.docx（18页珍藏版）》请在冰豆网上搜索。

jsp正则表达式使用详解.docx

jsp正则表达式使用详解

正则表达式使用详解

简介

简单的说，正则表达式是一种可以用于模式匹配和替换的强有力的工具。

其作用如下：

测试字符串的某个模式。

例如，可以对一个输入字符串进行测试，看在该字符串是否存在一个电话号码模式或一个信用卡号码模式。

这称为数据有效性验证。

替换文本。

可以在文档中使用一个正则表达式来标识特定文字，然后可以全部将其删除，或者替换为别的文字。

根据模式匹配从字符串中提取一个子字符串。

可以用来在文本或输入字段中查找特定文字。

基本语法

在对正则表达式的功能和作用有了初步的了解之后，我们就来具体看一下正则表达式的语法格式。

正则表达式的形式一般如下：

/love/　　其中位于“/”定界符之间的部分就是将要在目标对象中进行匹配的模式。

用户只要把希望查找匹配对象的模式内容放入“/”定界符之间即可。

为了能够使用户更加灵活的定制模式内容，正则表达式提供了专门的“元字符”。

所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符，可以用来规定其前导字符（即位于元字符前面的字符）在目标对象中的出现模式。

较为常用的元字符包括：

“+”，“*”，以及“?

”。

“+”元字符规定其前导字符必须在目标对象中连续出现一次或多次。

“*”元字符规定其前导字符必须在目标对象中出现零次或连续多次。

“?

”元字符规定其前导对象必须在目标对象中连续出现零次或一次。

下面，就让我们来看一下正则表达式元字符的具体应用。

/fo+/　　因为上述正则表达式中包含“+”元字符，表示可以与目标对象中的“fool”,“fo”,或者“football”等在字母f后面连续出现一个或多个字母o的字符串相匹配。

/eg*/　　因为上述正则表达式中包含“*”元字符，表示可以与目标对象中的“easy”,“ego”,或者“egg”等在字母e后面连续出现零个或多个字母g的字符串相匹配。

/Wil?

/　　因为上述正则表达式中包含“？

”元字符，表示可以与目标对象中的“Win”,或者“Wilson”,等在字母i后面连续出现零个或一个字母l的字符串相匹配。

有时候不知道要匹配多少字符。

为了能适应这种不确定性，正则表达式支持限定符的概念。

这些限定符可以指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。

{n}n是一个非负整数。

匹配确定的n次。

例如，'o{2}'不能匹配"Bob"中的'o'，但是能匹配"food"中的两个o。

{n,}n是一个非负整数。

至少匹配n次。

例如，'o{2,}'不能匹配"Bob"中的'o'，但能匹配"foooood"中的所有o。

'o{1,}'等价于'o+'。

'o{0,}'则等价于'o*'。

{n,m}m和n均为非负整数，其中n<=m。

最少匹配n次且最多匹配m次。

例如，"o{1,3}"将匹配"fooooood"中的前三个o。

'o{0,1}'等价于'o?

'。

请注意在逗号和两个数之间不能有空格。

除了元字符之外，用户还可以精确指定模式在匹配对象中出现的频率。

例如，/jim{2,6}/上述正则表达式规定字符m可以在匹配对象中连续出现2-6次，因此，上述正则表达式可以同jimmy或jimmmmmy等字符串相匹配。

在对如何使用正则表达式有了初步了解之后，我们来看一下其它几个重要的元字符的使用方式。

\s：

用于匹配单个空格符，包括tab键和换行符；

\S：

用于匹配除单个空格符之外的所有字符；

\d：

用于匹配从0到9的数字；

\w：

用于匹配字母，数字或下划线字符；

\W：

用于匹配所有与\w不匹配的字符；

.：

用于匹配除换行符之外的所有字符。

（说明：

我们可以把\s和\S以及\w和\W看作互为逆运算）

下面，我们就通过实例看一下如何在正则表达式中使用上述元字符。

/\s+/上述正则表达式可以用于匹配目标对象中的一个或多个空格字符。

/\d000/　如果我们手中有一份复杂的财务报表，那么我们可以通过上述正则表达式轻而易举的查找到所有总额达千元的款项。

除了我们以上所介绍的元字符之外，正则表达式中还具有另外一种较为独特的专用字符，即定位符。

定位符用于规定匹配模式在目标对象中的出现位置。

较为常用的定位符包括：

“^”,“$”,“\b”以及“\B”。

“^”定位符规定匹配模式必须出现在目标字符串的开头

“$”定位符规定匹配模式必须出现在目标对象的结尾

“\b”定位符规定匹配模式必须出现在目标字符串的开头或结尾的两个边界之一

“\B”定位符则规定匹配对象必须位于目标字符串的开头和结尾两个边界之内，

即匹配对象既不能作为目标字符串的开头，也不能作为目标字符串的结尾。

同样，我们也可以把“^”和“$”以及“\b”和“\B”看作是互为逆运算的两组定位符。

举例来说：

/^hell/　因为上述正则表达式中包含“^”定位符，所以可以与目标对象中以“hell”,“hello”或“hellhound”开头的字符串相匹配。

/ar$/　因为上述正则表达式中包含“$”定位符，所以可以与目标对象中以“car”,“bar”或“ar”结尾的字符串相匹配。

/\bbom/　因为上述正则表达式模式以“\b”定位符开头，所以可以与目标对象中以“bomb”,或“bom”开头的字符串相匹配。

/man\b/　因为上述正则表达式模式以“\b”定位符结尾，所以可以与目标对象中以“human”,“woman”或“man”结尾的字符串相匹配。

为了能够方便用户更加灵活的设定匹配模式，正则表达式允许使用者在匹配模式中指定某一个范围而不局限于具体的字符。

例如：

/[A-Z]/　　上述正则表达式将会与从A到Z范围内任何一个大写字母相匹配。

/[a-z]/　　上述正则表达式将会与从a到z范围内任何一个小写字母相匹配。

/[0-9]/　上述正则表达式将会与从0到9范围内任何一个数字相匹配。

/（[a-z][A-Z][0-9]）+/　上述正则表达式将会与任何由字母和数字组成的字符串，如“aB0”等相匹配。

这里需要提醒用户注意的一点就是可以在正则表达式中使用“（）”把字符串组合在一起。

“（）”符号包含的内容必须同时出现在目标对象中。

因此，上述正则表达式将无法与诸如“abc”等的字符串匹配，因为“abc”中的最后一个字符为字母而非数字。

如果我们希望在正则表达式中实现类似编程逻辑中的“或”运算，在多个不同的模式中任选一个进行匹配的话，可以使用管道符“|”。

例如：

/to|too|2/　上述正则表达式将会与目标对象中的“to”,“too”,或“2”相匹配。

正则表达式中还有一个较为常用的运算符，即否定符“[^]”。

与我们前文所介绍的定位符“^”不同，否定符“[^]”规定目标对象中不能存在模式中所规定的字符串。

例如：

/[^A-C]/　上述字符串将会与目标对象中除A，B，和C之外的任何字符相匹配。

一般来说，当“^”出现在“[]”内时就被视做否定运算符；而当“^”位于“[]”之外，或没有“[]”时，则应当被视做定位符。

最后，当用户需要在正则表达式的模式中加入元字符，并查找其匹配对象时，可以使用转义符“\”。

例如：

/Th\*/　上述正则表达式将会与目标对象中的“Th*”而非“The”等相匹配。

在构造正则表达式之后，就可以象数学表达式一样来求值，也就是说，可以从左至右并按照一个优先级顺序来求值。

优先级如下：

1．\转义符

2．（）,（?

）,（?

=）,[]圆括号和方括号

3．*,+,?

{n},{n,},{n,m}限定符

4．^,$,\anymetacharacter位置和顺序

5．|“或”操作

18pt">使用实例

在JavaScript1.2中带有一个功能强大的RegExp（）对象，可以用来进行正则表达式的匹配操作。

其中的test（）方法可以检验目标对象中是否包含匹配模式，并相应的返回true或false。

我们可以使用JavaScript编写以下脚本，验证用户输入的邮件地址的有效性。

--starthiding

　　　　functionverifyAddress（obj）

　　　　　{

　　　　　　varemail=obj.email.value;

　　　　　　varpattern=

/^（[a-zA-Z0-9_-]）+@（[a-zA-Z0-9_-]）+（\.[a-zA-Z0-9_-]）+/;

　　　　　　flag=pattern.test（email）;

　　　　　　if（flag）

　　　　　　{

　　　　　　　alert（“Youremailaddressiscorrect!

”）;

　　　　　　　returntrue;

　　　　　　}

　　　　　　else

　　　　　　　{

　　　　　　　　alert（“Pleasetryagain!

”）;

　　　　　　　　returnfalse;

　　　　　　　}

　　　　//stophiding-->

18pt">正则表达式对象

本对象包含正则表达式模式以及表明如何应用模式的标志。

语法1re=/pattern/[flags]

语法2re=newRegExp（"pattern",["flags"]）

参数

必选项。

将要赋值为正则表达式模式的变量名。

Pattern

必选项。

要使用的正则表达式模式。

如果使用语法1，用"/"字符分隔模式。

如果用语法2，用引号将模式引起来。

Flags

可选项。

如果使用语法2要用引号将flag引起来。

标志可以组合使用，可用的有：

g（全文查找出现的所有pattern）

i（忽略大小写）

m（多行查找）

18pt">示例

下面的示例创建一个包含正则表达式模式及相关标志的对象（re），向您演示正则表达式对象的用法。

在本例中，作为结果的正则表达式对象又用于match方法中：

functionMatchDemo（）

{

varr,re;//声明变量。

vars="TheraininSpainfallsmainlyintheplain";

re=newRegExp（"ain","g"）;//创建正则表达式对象。

r=s.match（re）;//在字符串s中查找匹配。

return（r）;

}

返回值：

ain,ain,ain,ain\\

属性lastIndex属性|source属性\\

方法compile方法|exec方法|test方法\\

要求版本3\\

请参阅RegExp对象|正则表达式语法|String对象\\

18pt">exec方法

用正则表达式模式在字符串中运行查找，并返回包含该查找结果的一个数组。

rgExp.exec（str）

参数

rgExp

必选项。

包含正则表达式模式和可用标志的正则表达式对象。

str

必选项。

要在其中执行查找的String对象或字符串文字。

说明\\

如果exec方法没有找到匹配，则它返回null。

如果它找到匹配，则exec方法返回一个数组，并且更新全局RegExp对象的属性，以反映匹配结果。

数组的0元素包含了完整的匹配，而第1到n元素中包含的是匹配中出现的任意一个子匹配。

这相当于没有设置全局标志（g）的match方法。

如果为正则表达式设置了全局标志，exec从以lastIndex的值指示的位置开始查找。

如果没有设置全局标志，exec忽略lastIndex的值，从字符串的起始位置开始搜索。

exec方法返回的数组有三个属性，分别是input、index和lastIndex。

Input属性包含了整个被查找的字符串。

Index属性中包含了整个被查找字符串中被匹配的子字符串的位置。

LastIndex属性中包含了匹配中最后一个字符的下一个位置。

示例\\

下面的例子举例说明了exec方法的用法：

functionRegExpTest（）

{

varver=Number（ScriptEngineMajorVersion（）+"."+ScriptEngineMinorVersion（））

if（ver>=5.5）{//测试JScript的版本。

varsrc="TheraininSpainfallsmainlyintheplain.";

varre=/\w+/g;//创建正则表达式模式。

vararr;

while（（arr=re.exec（src））!

=null）

document.write（arr.index+"-"+arr.lastIndex+arr+"\t"）;

}

else{

alert（"请使用JScript的更新版本"）;

}

返回值：

0-3The4-8rain9-11in12-17Spain18-23falls24-30mainly31-33in34-37the38-43plain

test方法\\

返回一个Boolean值，它指出在被查找的字符串中是否存在模式。

rgexp.test（str）

参数\\

rgexp

必选项。

包含正则表达式模式或可用标志的正则表达式对象。

str

必选项。

要在其上测试查找的字符串。

说明

test方法检查在字符串中是否存在一个模式，如果存在则返回true，否则就返回false。

全局RegExp对象的属性不由test方法来修改。

示例

下面的例子举例说明了test方法的用法：

functionTestDemo（re,s）

{

vars1;//声明变量。

//检查字符串是否存在正则表达式。

if（re.test（s））//测试是否存在。

s1="contains";//s包含模式。

else

s1="doesnotcontain";//s不包含模式。

return（"'"+s+"'"+s1+"'"+re.source+"'"）;//返回字符串。

}

函数调用：

document.write（TestDemo（/ain+/,"TheraininSpainfallsmainlyintheplain."））;

返回值：

'TheraininSpainfallsmainlyintheplain.'contains'ain+'

18pt">match方法

使用正则表达式模式对字符串执行查找，并将包含查找的结果作为数组返回。

stringObj.match（rgExp）

参数\\

stringObj

必选项。

对其进行查找的String对象或字符串文字。

rgExp

必选项。

为包含正则表达式模式和可用标志的正则表达式对象。

也可以是包含正则表达式模式和可用标志的变量名或字符串文字。

说明\\

如果match方法没有找到匹配，返回null。

如果找到匹配返回一个数组并且更新全局RegExp对象的属性以反映匹配结果。

match方法返回的数组有三个属性：

input、index和lastIndex。

Input属性包含整个的被查找字符串。

Index属性包含了在整个被查找字符串中匹配的子字符串的位置。

LastIndex属性包含了最后一次匹配中最后一个字符的下一个位置。

如果没有设置全局标志（g），数组的0元素包含整个匹配，而第1到n元素包含了匹配中曾出现过的任一个子匹配。

这相当于没有设置全局标志的exec方法。

如果设置了全局标志，元素0到n中包含所有匹配。

示例\\

下面的示例演示了match方法的用法：

functionMatchDemo（）

{

varr,re;//声明变量。

vars="TheraininSpainfallsmainlyintheplain";

re=/ain/i;//创建正则表达式模式。

r=s.match（re）;//尝试匹配搜索字符串。

return（r）;//返回第一次出现"ain"的地方。

}

返回值：

ain

本示例说明带g标志设置的match方法的用法。

functionMatchDemo（）

{

varr,re;//声明变量。

vars="TheraininSpainfallsmainlyintheplain";

re=/ain/ig;//创建正则表达式模式。

r=s.match（re）;//尝试去匹配搜索字符串。

return（r）;//返回的数组包含了所有"ain"

//出现的四个匹配。

}

返回值：

ain,ain,ain,ain

上面几行代码演示了字符串文字的match方法的用法。

varr,re="Spain";

r="TheraininSpain".replace（re,"Canada"）;

returnr;

返回值：

TheraininCanada

18pt">search方法

返回与正则表达式查找内容匹配的第一个子字符串的位置。

stringObj.search（rgExp）

参数\\

stringObj

必选项。

要在其上进行查找的String对象或字符串文字。

rgExp

必选项。

包含正则表达式模式和可用标志的正则表达式对象。

说明

search方法指明是否存在相应的匹配。

如果找到一个匹配，search方法将返回一个整数值，指明这个匹配距离字符串开始的偏移位置。

如果没有找到匹配，则返回-1。

示例\\

下面的示例演示了search方法的用法。

functionSearchDemo（）

{

varr,re;//声明变量。

vars="TheraininSpainfallsmainlyintheplain.";

re=/falls/i;//创建正则表达式模式。

r=s.search（re）;//查找字符串。

return（r）;//返回Boolean结果。

}

返回值：

18pt">正则表达式语法

一个正则表达式就是由普通字符（例如字符a到z）以及特殊字符（称为元字符）组成的文字模式。

该模式描述在查找文字主体时待匹配的一个或多个字符串。

正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。

这里有一些可能会遇到的正则表达式示例：

JScriptVBScript匹配

/^\[\t]*$/"^\[\t]*$"匹配一个空白行。

/\d{2}-\d{5}/"\d{2}-\d{5}"验证一个ID号码是否由一个2位数字，一个连字符以及一个5位数字组成。

/<（.*）>.*<\/\1>/"<（.*）>.*<\/\1>"匹配一个HTML标记。

下表是元字符及其在正则表达式上下文中的行为的一个完整列表：

字符描述

\将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向引用、或一个八进制转义符。

例如，'n'匹配字符"n"。

'\n'匹配一个换行符。

序列'\\'匹配"\"而"\（"则匹配"（"。

^匹配输入字符串的开始位置。

如果设置了RegExp对象的Multiline属性，^也匹配'\n'或'\r'之后的位置。

$匹配输入字符串的结束位置。

如

展开阅读全文