2016年08月18日 03:52:33

如何理解正则表达式匹配过程的原理

作者: 

本文通过实例,为你介绍正则表达式匹配过程,通过对匹配过程的理解,将有助于你更加深入理解正则表达式匹配逻辑。

正则: console.log(('12345').match(/\d*/g));
匹配结果: ["12345", ""]
匹配过程如下:

  1. 第一次匹配:
  2. \d*,因为没有位置限定,因此是从文本开始位置开始,也就是^
  3. 这个^是虚拟字符,也就是12345里的1前面的位置
  4. \d*,贪婪匹配,0-n个,尽可能多匹配,因此,12345都匹配了
  5. 此时,正则匹配的位置到了5后面,完成第一次匹配。
  6. 第二次匹配:
  7. 但是,因为g模式,做的是全局匹配,因此,\d*从5后面位置开始,继续匹配,直到文本结束位置,也就是$
  8. 这个$也是虚拟字符,匹配文本的结束位置
  9. \d*,因为是0-n个,此时,利用的0个匹配,因此得到"",完成第二次匹配。
  10. 上面,主要利用的知识点有:
  11. 1. 开始(^)和结束位置($
  12. 2. 贪婪模式
  13. 3. * 的含义
  14. 4. 正则匹配的位置移动原理(正则引擎匹配原理)

正则: console.log(('12345').match(/1*/g));
匹配结果: ["1", "", "", "", "", ""]
匹配过程如下:

  1. 1* 首先从123451前面位置开始,贪婪模式,尽可能多匹配1,因此,匹配完后,正则的匹配开始位置到了2前面位置
  2. 1* 2前面位置开始,单字符匹配,因为1没法匹配2,因此,用了*的特性,匹配0个,正则的匹配开始位置到了3前面位置
  3. 1* 3前面位置开始,单字符匹配,因为1没法匹配3,因此,用了*的特性,匹配0个,正则的匹配开始位置到了4前面位置
  4. 1* 4前面位置开始,单字符匹配,因为1没法匹配4,因此,用了*的特性,匹配0个,正则的匹配开始位置到了5前面位置
  5. 1* 5前面位置开始,单字符匹配,因为1没法匹配5,因此,用了*的特性,匹配0个,正则的匹配开始位置到了5后面位置
  6. 1* 5后面位置,单字符匹配,匹配文本结束位置,没有匹配1,用了*的特性,匹配0个,正则的匹配完成

更多示例,读者可尝试推演一下:

  1. console.log(('12345').match(/12345??/g)); //1234
  2. console.log(('12345').match(/12345?/g)); //12345
  3. 注:?? 等价于 {0,1}? 非贪婪模式,不匹配优先
  4. ? 等价于 {0,1} 贪婪模式,匹配优先

关于匹配次数???的讲解可以参考《正则表达式匹配次数



未经同意禁止转载!
转载请附带本文原文地址:如何理解正则表达式匹配过程的原理,首发自 Zjmainstay学习笔记
阅读( 2018 )
看完顺手点个赞呗:
(6 votes)

1.PHP cURL群:PHP cURL高级技术
2.正则表达式群:专精正则表达式
3. QQ联系(加请说明):QQ联系博主(951086941)
4. 邮箱:zjmainstay@163.com
5. 打赏博主: 捐赠支持本博客

阿里云幸运券分享
网站总访问量: