ImageVerifierCode 换一换
格式:DOCX , 页数:13 ,大小:21.61KB ,
资源ID:2270832      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2270832.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(学点Java正则表达式.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

学点Java正则表达式.docx

1、学点Java正则表达式学点Java正则表达式正则表达式用来指定字符串模式。当你需要定位匹配某种模式的字符串时就可以使用正则表达式。例如,我们下面的一个例程就是在一个HTML文件中通过查找字符串模式来定位所有的超链接。 当然,为了指定一种模式,使用.这种记号是不够精确的。你需要精确地指定什么样的字符排列是一个合法的匹配。当描述某种模式时,你需要使用一种特殊的语法。 这里有一个简单例子。正则表达式Jjava.+匹配下列形式的任何字符串:首字母是J或j 后续的三个字母是ava 字符串的剩余部分由一个或多个任意字符组成 例如,字符串“javaness”匹配这个特殊的正则表达式,但是字符串“Core J

2、ava”却不匹配。 如你所见,你需要了解一点语法来理解正则表达式的含意。幸运的是对于大多数的用途,使用少量的简单构造(straightforward constructs)就已足够。字符类是可选自符的集合,用封装,比如Jj,0-9,A-Za-z或0-9。这里的-表示范围(Unicode落在两个边界之间的所有字符),表示求补(指定字符外的所有字符)。 有许多预定以的字符类,像d(数字)或pSc(Unicode货币符号),见表12-8和12-9。 大多数字符与它们自身匹配,像上例中的ava字符。 符号.匹配任何字符(可能行终止符(line terminators)除外,这依赖于标识设置(flag

3、settings) 用作转义符,比如.匹配一个句点,匹配一个反斜杠。 和$分别匹配行头和行尾 如果X和Y都是正则表达式,则XY表示“X的匹配后面跟着Y的匹配”。X|Y表示“任何X或Y的匹配” 可以将量词(quantifier)用到表达式中,X+ 表示X重复1次或多次,X* 表示X重复0次或多次,X? 表示X重复0次或1次 默认地,一个量词总是与使总体成功匹配的最长的可能重复匹配。可以加上后缀?(称为reluctant或stingy 匹配,用以匹配最小的重复数),和+(称为possessive或贪婪匹配,用以即使在总体匹配失败的情况下也匹配最大的重复数)来更改这种属性。 例如,字符串cab匹配a

4、-z*ab,但不匹配a-z*+ab。第一种情况下,a-z*只匹配字符c,因此字符ab正好与模式的剩余部分匹配。但是贪婪版本a-z*+就与字符cab匹配,模式的剩余部分ab就匹配失败(,这样总体也就匹配失败)。可以使用分组来定义子表达式。将分组封装在()中,如(+-?)(0-9+)。然后你可以让模式匹配符(the pattern matcher)返回每个分组的匹配,或者使用n来回引分组(refer back to a group with n),其中n是组号(以1起始) 这里有一个稍微有点复杂却又很有用的正则表达式它用来描述十进制和十六进制的整数。+-?0-9+|0Xx0-9A-Fa-f+ 不幸

5、的是,在使用正则表达式的各种程序和库之间,它的语法还没有完全标准化。对基本的构造上已达成了共识,但在细节方面有许多令人“抓狂”的区别(many maddening differences)。Java的正则表达式类使用了与Perl语言类似的语法,但也不尽相同。表12-8显示了Java语法的所有正则表达式构造。要了解更多关于正则表达式的信息,请参考Pattern类的API文档,或者Jeffrey E. F. Friedl的著作Mastering Regular Expressions(OReilly and Associates, 1997)(刚去第二书店查了一下,东南大学出版社已经引入了其第二版

6、,影印)表12-8 正则表达式语法-语法 解释-字符c 字符cunnnn, xnn, 0n, 0nn, 0nnn 带有十六或八进制值的代码单元0n 八进制0n代表的字符(0=n=7)0nn 八进制0nn代表的字符(0=n=7)0mnn 八进制0mnn代表的字符(0=m=3,0=n=7)xnn 十六进制 0xnn所代表的字符uhhhh 十六进制 0xhhhh所代表的字符t, n, r, f, a, e 控制字符,依次是制表符,换行符,回车符,换页符,报警符和转义符cc 控制字符中出现的相应字符c-字符类C1C2. . . C1、C2中的任何字符。Ci可以是字符,字符范围(C1-C2)或者字符类。

7、. . . 字符类的补集 . . . & . . . 两个字符类的交集-预定义字符类. 除行终止符外的任何字符(如果DOTALL标志置位,则表示任何字符)d 数字0-9D 非数字0-9s 空白字符tnrfx0BS 非空白字符w 单词字符a-zA-Z0-9_W 非单词字符pname 一个指定的字符类,见表12-9Pname 指定字符类的补集-边界匹配符 $ 输入的开头和结尾(在多行模式(multiline mode)下是行的开头和结尾)b 单词边界B 非单词边界A 输入的开头z 输入的结尾Z 除最后行终止符之外的输入结尾G 上个匹配的结尾-量词X? 可选的X(即X可能出现,也可能不出现)X* X

8、,可以重复0次或多次X+ X,可以重复1次或多次Xn Xn, Xn,m X重复n次,至少重复n次,重复n到m次-量词后缀? 设默认(贪婪)匹配为reluctant匹配+ 设默认(贪婪)匹配为possessive匹配-集合操作XY X的匹配后面跟着Y的匹配X|Y X或Y的匹配-分组(X) 匹配X并且在一个自动计数的分组中捕获它n 与第n个分组的匹配-转义c 字符c(必须不是字母)Q.E 逐字地引用.(?.) 特殊构造,看Pattern类的API- 正则表达式的最简单使用是测试一个特殊的字符串是否与之匹配。这里有一个Java写的测试程序。首先从表示正则表达式的字符串构造一个Pattern对象。然后

9、从该模式获得一个Matcher对象,并且调用它的matches()方法:Pattern pattern = Ppile(patternString);Matcher matcher = pattern.matcher(input);if (matcher.matches() . . . 表12.9 预定义的字符类名(Predefined Character Class Names)-Lower 小写的ASII字符a-zUpper 大写的ASCII字符A-ZAlpha ASCII字母A-Za-zDigit ASCII 数字 0-9Alnum ASCII 字母或数字A-Za-z0-9Xdigit

10、十六进制数字0-9A-Fa-f Print or Graph 可打印的ASCII字符x21-x7EPunct 非字母或数字ASCII pPrint&PAlnum ASCII 所有ASCII字符 x00-x7FCntrl ASCII控制字符x00-x1FBlank 空格符或制表符 tSpace 空白符 tnrf0x0BjavaLowerCase 取决于Character.isLowerCase()的小写字符javaUpperCase 取决于Character.isUpperCase()的大写字符javaWhitespace 取决于Character.isWhitespace()的空白符javaM

11、irrored 取决于Character.isMirrored()的Mirrored(?) InBlock 这里的Block是unicode字符的块名,用空格隔开,比如BasicLatin 或 Mongolian。块名列表 参考http:/www.unicode.orgCategory 或InCategory 这里的Category是Unicode字符的种类名,比如L(字母)或者Sc(货币符号)。种类 名列表参考http:/www.unicode.org - matcher的输入可以是实现CharSequence接口的任何类对象,像String,StringBuilder或CharBuffer。 当编译模式时,可以设置一个或多个标志,例如Pattern pattern = Ppile(patternString,Pattern.CASE_INSENSITIVE + Pattern.UNICODE_CASE);下面六个标志都是支持的:CASE_INSENSITIVE:匹配字符时与大小写无关,该标志默认只考虑US ASCII字符。UNICODE_CASE:当与CASE_INSENSITIVE结合时,使用Un

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1