文章分类 | 推荐文章 | 最新文章 | 热点文章 | 最新软件 | 精品软件 | 下载排行 | 推荐下载 | 免费看大片 | WPS | 杀毒软件
清风网络
首 页 软件下载 网络学院 数码学院
QQ 电脑入门 游戏 操作系统 图形处理 办公软件 媒体动画 精文荟萃 工具软件 网络编程 程序开发 网络技术 认证考试 网站建设 文章专栏
当前位置:清风网络学院程序开发数据结构正则表达式从入门到精通
精品推荐
特别推荐
·网游外挂编写完全攻略
·开发WDM型的USB设备驱动程序
·数据库设计范式深入浅出
·理解软件保护技术之序列号方式
·大型网站必鉴:分销渠道的结构
·你的代码真的很健壮吗
·利用HOOK拦截封包原理
·四种网络游戏外挂的设计方法
·程序语言效率比较
·五子棋算法
·正则表达式从入门到精通
·SQL Server不能启动的常见故障
·Windows应用程序设计的基本术语
·软件本地化与汉化
·Windows中断编程
·windows nt 4.0中文版的开机过程
热点TOP10
·网游外挂编写完全攻略
·兵之利器 软件开发辅助工具纵览
·开发WDM型的USB设备驱动程序
·DCOM揭秘之六
·VS2008 第一次安装心得及使用
·游戏外挂设计技术探讨
·《数据结构》试题下载2004
·饺子馆的物流故事之二——供应链视角下的缺货及品类管理
·代码静态分析工具PC-LINT安装配置
·使用BHO定制你的IE浏览器
·原始套接字透析之Raw Socket基础
·基于CS模式的Winsock网络通讯程序
·程序语言效率比较
·《Windows程序设计》读书笔记之六
·四种网络游戏外挂的设计方法
·用CVSNT与WINCVS实现CVS的架设
·利用HOOK拦截封包原理
·简单对象访问协议(SOAP)初级指南
·带你全面了解数据库应用系统的开发步骤
·UML业务建模实例分析

正则表达式从入门到精通

日期:2007年5月3日 作者: 查看:[大字体 中字体 小字体]


  下面的 VBScript 正则表达式执行同样的匹配:

  "Chapter [1-9][0-9]*"
  请注意限定符出现在范围表达式之后。因此,它将应用于所包含的整个范围表达式,在本例中,只指定了从 0 到 9 的数字。

  这里没有使用 '+' 限定符,因为第二位或后续位置上并不一定需要一个数字。同样也没有使用 '?' 字符,因为这将把章节数限制为只有两位数字。在 'Chapter' 和空格字符之后至少要匹配一个数字。

  如果已知章节数限制只有99 章,则可以使用下面的 JScript 表达式来指定至少有一位数字,但不超过两个数字。

  /Chapter [0-9]{1,2}/
  对 VBScript 可以使用下述正则表达式:

  "Chapter [0-9]{1,2}"
  上述表达式的缺点是如果有一个章节号大于 99,它仍只会匹配前两位数字。另一个缺点是某些人可以创建一个 Chapter 0,而且仍能匹配。一个更好的用来匹配两位数的 JScript 表达式如下:

  /Chapter [1-9][0-9]?/
  或者

  /Chapter [1-9][0-9]{0,1}/
  对 VBScript 而言,下述表达式与上面等价:

  "Chapter [1-9][0-9]?"
  或者

  "Chapter [1-9][0-9]{0,1}"
  '*'、'+' 和 '?' 限定符都称之为贪婪的,也就是说,他们尽可能多地匹配文字。有时这根本就不是所希望发生的情况。有时则正好希望最小匹配。

  例如,你可能要搜索一个 HTML 文档来查找一处包含在 H1 标记中的章节标题。在文档中该文字可能具有如下形式:

  <H1>Chapter 1 – Introduction to Regular Expressions</H1>
  下面的表达式匹配从开始的小于号 (<) 到 H1 标记结束处的大于号之间的所有内容。

  /<.*>/
  VBScript 的正则表达式为:

  "<.*>"
  如果所要匹配的就是开始的 H1 标记,则下述非贪婪地表达式就只匹配。

  /<.*?>/
  或者

  "<.*?>"
  通过在 '*'、 '+' 或 '?' 限定符后放置 '?',该表达式就从贪婪匹配转为了非贪婪或最小匹配。
定位符

  到现在为止,所看到的示例都只考虑查找任何地方出现的章节标题。出现的任何一个字符串 'Chapter' 后跟一个空格和一个数字可能是一个真正的章节标题,也可能是对其他章节的交叉引用。由于真正的章节标题总是出现在一行的开始,因此需要设计一个方法只查找标题而不查找交叉引用。

  定位符提供了这个功能。定位符可以将一个正则表达式固定在一行的开始或结束。也可以创建只在单词内或只在单词的开始或结尾处出现的正则表达式。下表包含了正则表达式及其含义的列表:


字符 描述 ^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置。 $ 匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性,$ 也匹配 '\n' 或 '\r' 之前的位置。 \b 匹配一个单词边界,也就是指单词和空格间的位置。 \B 匹配非单词边界。

  不能对定位符使用限定符。因为在一个换行符或者单词边界的前面或后面不会有连续多个位置,因此诸如 '^*' 的表达式是不允许的。

  要匹配一行文字开始位置的文字,请在正则表达式的开始处使用 '^' 字符。不要把 '^' 的这个语法与其在括号表达式中的语法弄混。它们的语法根本不同。

  要匹配一行文字结束位置的文字,请在正则表达式的结束处使用 '$' 字符。

  要在查找章节标题时使用定位符,下面的 JScript 正则表达式将匹配位于一行的开始处最多有两个数字的章节标题:

  /^Chapter [1-9][0-9]{0,1}/
  VBScript 中相同功能的正则表达式如下:

  "^Chapter [1-9][0-9]{0,1}"
  一个真正的章节标题不仅出现在一行的开始,而且这一行中也仅有这一个内容,因此,它必然也位于一行的结束。下面的表达式确保所指定的匹配只匹配章节而不会匹配交叉引用。它是通过创建一个只匹配一行文字的开始和结束位置的正则表达式来实现的。   /^Chapter [1-9][0-9]{0,1}$/
  对 VBScript 则使用:

  "^Chapter [1-9][0-9]{0,1}$"
  匹配单词边界有少许不同,但却给正则表达式增加了一个非常重要的功能。单词边界就是单词和空格之间的位置。非单词边界就是其他任何位置。下面的 JScript 表达式将匹配单词 'Chapter' 的前三个字符,因为它们出现在单词边界后:

  /\bCha/
  对 VBScript 为:

  "\bCha"
  这里 '\b' 操作符的位置很关键。如果它位于要匹配的字符串的开始,则将查找位于单词开头处的匹配;如果它位于改字符串的末尾,则查找位于单词结束处的匹配。例如,下面的表达式将匹配单词 'Chapter' 中的 'ter',因为它出现在单词边界之前:

  /ter\b/
  以及

  "ter\b"

上一页 [1] [2] [3] [4] [5] [6] 下一页 




上一篇:DirectShow编程之Filter原理

下一篇:Windows 2000缓冲区溢出技术原理

正则表达式从入门到精通 相关文章:
·最详细的黑客入门法则
·大智慧股票软件Level-2入门手册
·从零开始学黑客:网络黑客新手入门指南
·用Photoshop画漫画教程之基础入门
·Visual C++ ADO数据库编程入门
·破解入门教学(二)
·网页设计基础:Div+CSS布局入门教程
·MyEclipse JSF 快速入门中文版(上)
·Windows下C语言网络编程快速入门
·DirectX游戏开发入门
正则表达式从入门到精通 相关软件:
·孙鑫VC++从入门到精通开发详解视频教程FLASH版
·完全精通局域网手册(PDF)
·Photoshop 入门教程
·CorelDraw12 入门与实例(图文教程 菜鸟先飞系列教材)
·ASP入门教程
·催眠大师密训专业教程之入门指导手册(繁体版)
·Flash MX 从入门到精通
·精通英语词汇8000 [mp3]
·AutoCAD2002入门与实例详解
·逐步精通数据库 sql server 视频教程

特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
[打印本页] [关闭窗口] 转载请注明来源:http://www.viphot.com
| 帮助(?) | 版权声明 | 友情连接 | 关于我们 | 信息发布
Copyright 2007 www.viphot.com All Rights Reserved. 鄂ICP备05000083号Powered by:viphot