正则详细教程系列可以看此链接的文章哦

https://www.cnblogs.com/poloyy/category/1796055.html

 

分组和编号

  • ( ) 在正则中可以用于分组
  • 被括号起来的部分是子表达式,当做一个分组
  • 场景类比:小学算术,括号表示单独计算里面的内容 (1+1)*2

 

分组和编号的规则

第几个括号就是第几个分组

 

举栗子

 (\d{4}-\d{2}-\d{2})(\d{2}:\d{2}:\d{2}) 

这个表达式由两个子表达式组成,第一个分组是日期,第二个分组是时间

 

不保存分组

  • 默认在 ( ) 里面的表达式会保存成分组,但有些情况下,只想用括号将某些部分看成一个整体,临时使用,后续不再用
  • 可以通过 ?: 不保存分组, (?:正则表达式) 

 

不保存分组的好处

  • 正则表达式中出现了括号,那么这个子表达式在后续可能会再次被引用
  • 不保存分组可以提高正则的性能
  • 分组变少了,在分组计数时也更不容易出错。

 

不保存分组的理解

那到底啥是不保存分组呢?可以理解成,括号只用于归组,把某些表达式当做一个单独的整体,不分配编号,后面不会再进行这部分的引用

 

保存分组的栗子

 

678 是分组一 

 

不保存分组的栗子

678 并不是分组,无法引用

 

括号嵌套

括号嵌套 (( )) 这种情况肯定会出现,就好像小学算术 ((1+1)+(1+1)) 一样

直接看栗子,然后就知道括号嵌套情况下,分组编号的规则是什么了

看右边的 Group 1 - 8

 

分组编号

 

分组引用

知道分组编号后,我们会需要引用分组

 

引用规则

反斜扛 + 编号: \number 

 

不同编程语言,有不同的引用方式

有印象即可,用到再来查一查~

 

分组引用在查找中使用

找到重复的单词

 

分组引用在替换中使用

可以通过分组引用替换文本内容

 

扩展

在 Python 中,sub 函数可用于正则的替换