深入浅析正则表达式 捕获组

 更新时间:2019-06-25 03:00:47   作者:佚名   我要评论(0)

捕获组(capturing group)是正则表达式里比较常用,也是比较重要的概念,我个人觉得掌握这部分的知识是非常重要的。


这篇文章内容不会很深入,但是尽量做

捕获组(capturing group)是正则表达式里比较常用,也是比较重要的概念,我个人觉得掌握这部分的知识是非常重要的。

这篇文章内容不会很深入,但是尽量做到简单易懂又全面。接下来的内容主要是围绕以下7个点:

1: () 捕获组
2: (?:) non capturing group
3: (?=) positive lookahead
4: (?!) negative lookahead
5: (?<=) positive lookbehind
6: (?<!) negative lookbehind
7: (?=), (?!), (?<=), (?<!)的捕获

1: () 捕获组

/go+/

以上的正则表达式表示一个字母g后面跟上一个或者多个字母o,他能匹配go或者goooo。但是如果我们想+不只是运用到字母o上,而是运用到go这个整体上怎么办呢?办法就是给go加括号:

/(go)+/

为了全局匹配以及不考虑大小写,我们接下来会给我们的正则加上ig,这两个flag:

let reg = /(go)+/ig;
'go is g gogo'.match(reg); //["go", "gogo"]

在上面的例子里面(go)就形成了一个捕获组(capturing group)。接下来看一个使用捕获组的例子来加深对它的理解:

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //10
RegExp.$2; //25
RegExp.$2; //2017

在上面这个例子里,我们有三组括号,形成了三个捕获组,正则表达式(在javaScript里就是我们的RegExp)会缓存捕获组所匹配的串,以$n表示,n就代表这第几个捕获组。

假如现在我们有一个需求:把显示格式为 10.25.2017 的时间改为 2017-10-25 格式。

我们知道String的replace()方法经常和正则表达式一起使用。在replace()方法里,我们可以直接使用捕获组的结果:

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
let newString = originString.replace(reg, '$3-$1-$2');
console.log(newString);//"2017-10-25"

2: (?:) non capturing group 非捕获型分组

有的时候我们可能只想匹配分组,但是并不想缓存(不想捕获)匹配到的结果,就可以在我们的分组模式前面加上?:。例如上面的时间的例子,我们不想捕获第一个分组的结果,就可以这么做:

let reg = /(?:\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //25
RegExp.$2; //2017
originString.match(reg);// ["10.25.2017", "25", "2017", index: 0, input: "10.25.2017", groups: undefined]

从上面的例子可以看出,我们的正则表达式依然是匹配的(test()的结果依然为true),但是RegExp.$1不是数字10,而是25,因为我们在第一个括号里加了?:,10就不会被捕获。match()的执行结果也会受?:的影响:match()的结果里不再有‘10'。

3: (?=) positive lookahead 正向前瞻型捕获

有一个句子:1 apple costs 10?. 我们想要匹配?前面的价格(这里是一个数字),但是注意不能匹配到句子开头的数字1。这种情况,就可以用到正向前瞻型捕获:

let reg = /\d+(?=?)/g;
let reg1 = /\d+/g;
let str = '1 apple costs 10?';
str.match(reg); //["10"]
str.match(reg1); //["1", "10"]

上面的例子里面reg1就只需要匹配数字,对于数字后面跟什么并没有要求,所以它能匹配到1,10。但是reg使用了前瞻型匹配,就只能匹配到10。
或许你已经能从上面的对比里了解到什么是正向前瞻型捕获了,意思是:

/x(?=y)/ 匹配x, 但是必须在x的【后面】【是】y的情况下

4: (?!) negative lookahead 负向前瞻型捕获

上面我们了解了什么是正向前瞻型匹配,从字面意思也能猜出来负向前瞻型捕获就是:

/x(?!y)/ 匹配x, 但是必须在x的【后面】【不是】y的情况下

例如下面的例子,我们要匹配数字1,而不要?前面的2,就可以用到?!:

let reg = /\d+(?!?)/g;
let str = '1 apple costs 2?';
str.match(reg); ['1']

5: (?<=) positive lookbehind 正向后顾型捕获

后顾型和前瞻型正好相反,意思就是:

/(?<=y)x/ 匹配x, 但是只在【前面】【有】y的情况下

来看一个例子:

let str = "1 turkey costs $2";
console.log( str.match(/(?<=\$)\d+/g) ); //["2"]

这里的要求是前面有$的数字,所以这里匹配到了数字2,而没有1.

6: (?<!) negative lookbehind 负向后顾型捕获

负向就是与正向相反,那么负向后顾型捕获就是:

/(?<=y)x/ 匹配x, 但是只在【前面】【没有】y的情况下

来看一个例子:

let str = "1 turkey costs $2";
console.log( str.match(/(?<!\$)\d+/g) ); //['1']

7: (?=), (?!), (?<=), (?<!)的捕获

默认情况下上面的前瞻后顾4种都是默认不匹配捕获组里面的内容的,也就是不匹配括号里的条件的。例如我们的正向前瞻/d+(?=?)/g,只会匹配到数字,并不会匹配到?。如果我们想要也匹配到?怎么办呢?答案就是给?也包上一个括号:

let str = "1 turkey costs 2?";
let reg = /\d+(?=(?))/; 
str.match(reg); //["2", "?", index: 15, input: "1 turkey costs 2?", groups: undefined]

这样就匹配到了数字2和它后面的?。

下面再来看看后顾型:

let str = "1 turkey costs $2";
let reg = /(?<=(\$|£))\d+/;
console.log( str.match(reg) ); //["2", "$", index: 16, input: "1 turkey costs $2", groups: undefined]

需要特别注意到的一点是,对于后顾型,虽然条件在匹配项的前面,但是匹配出来的结果顺序依然是条件在匹配项的后面。所以这里match()出来的结果是2在$的前面。

总结

以上所述是小编给大家介绍的正则表达式 捕获组,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

您可能感兴趣的文章:

  • PHP正则表达式之捕获组与非捕获组
  • PHP之正则表达式捕获组与非捕获组(详解)
  • 正则表达式之捕获组/非捕获组介绍

相关文章

  • 深入浅析正则表达式 捕获组

    深入浅析正则表达式 捕获组

    捕获组(capturing group)是正则表达式里比较常用,也是比较重要的概念,我个人觉得掌握这部分的知识是非常重要的。 这篇文章内容不会很深入,但是尽量做
    2019-06-25
  • js中值引用和地址引用实例分析

    js中值引用和地址引用实例分析

    本文实例讲述了js中值引用和地址引用。分享给大家供大家参考,具体如下: js中任何事务都是对象。包括基本数据类型(undefined,boolean,number,string,null)
    2019-06-25
  • 10种JavaScript最常见的错误(小结)

    10种JavaScript最常见的错误(小结)

    前言 查看了数千个项目后,发现了 10 个最常见的 JavaScript 错误。我们会告诉你什么原因导致了这些错误,以及如何防止这些错误发生。如果你能够避免落入这些
    2019-06-25
  • JavaScript迭代器的含义及用法

    JavaScript迭代器的含义及用法

    什么是迭代器 迭代器就是为实现对不同集合进行统一遍历操作的一种机制,只要给需要遍历的数据结构部署Iterator接口,通过调用该接口,或者使用消耗该接口的
    2019-06-25
  • Javascript正则表达式验证账号、手机号、电话和邮箱的合法性

    Javascript正则表达式验证账号、手机号、电话和邮箱的合法性

    正则表达式是用于匹配字符串中字符组合的模式。在 JavaScript中,正则表达式也是对象。这些模式被用于 RegExp 的 exec 和 test 方法, 以及 String 的 match、
    2019-06-25
  • 正则表达式使用示例详解

    正则表达式使用示例详解

    正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。 正则表达式使用单个字符串来描述、匹
    2019-06-25
  • 一个正则表达式导致CPU 利用率居高不下

    一个正则表达式导致CPU 利用率居高不下

    前几天线上一个项目监控信息突然报告异常,上到机器上后查看相关资源的使用情况,发现 CPU 利用率将近 100%。通过 Java 自带的线程 Dump 工具,我们导出了出问
    2019-06-25
  • js类的继承定义与用法分析

    js类的继承定义与用法分析

    本文实例讲述了js类的继承定义与用法。分享给大家供大家参考,具体如下: 如何实现类的继承呢? 有如下2个构造函数: function PeopleClass(){ this.type
    2019-06-25
  • 详解正则表达式后面不要包含指定的字符串内容

    详解正则表达式后面不要包含指定的字符串内容

    以前只会/<abc(&#63;!def).+>/.exec("<abcdef>\n<abczzz>"),匹配到<abczzz>,这种简单的固定写法,但实际使用次数几乎趋近于0。 很多场景不能写死abc,顺理成
    2019-06-25
  • 开发过程最全的正则表达式匹配中英文、字母和数字

    开发过程最全的正则表达式匹配中英文、字母和数字

    在做项目的过程中,使用正则表达式来匹配一段文本中的特定种类字符,是比较常用的一种方式,下面是对常用的正则匹配做了一个归纳整理。 1、匹配中文:[\u4e00-
    2019-06-25

最新评论