这两天在牛客刷题,总是碰到正则的题,自己之前学的差不多忘得一干二净,做的题错的也是惨不忍睹,这里重新复习一下正则的内容。

正则表达式

语法:

  • 普通字符
  • 简单的转义字符
  • 标准字符集合(注意区分大小写,大写是相反)
  1. \d 任意一个数字,0~9中的任意一个
  2. \w 任意一个字母或数字或下划线,A~Z,a~z,0~9,_,中任意一个
  3. \s 包括空格、制表符、换行符等空白字符的其中任意一个
  4. . 小数点可以匹配任意一个字符,除了换行符
  • 自定义字符集合:
    []方括号匹配方式,能够匹配方括号中任意一个字符
    [a-k] : 匹配a到k之间的任意一个字母
    [^0-9] : 匹配除了0-9之外的任意一个字符
    正则表达式的特殊符号,被包含到中括号中,则失去特殊意义,除了^,-之外
    标准字符集合,除了小数点外,如果被包含于中括号,自定义字符集合将包含该集合

  • 量词:修饰匹配次数的特殊符号
    {n} : 表达式重复n次
    {m,n} : 表达式至少重复m次,最多重复n次
    {m,} : 表达式至少重复m次
    ? : 匹配表达式0次或者1次,相当于{0,1}
    + : 表达式至少出现一次,相当于{1,}
    * : 表达式不出现或出现任意次,相当于{0,}
    匹配次数中的非贪婪模式(匹配字符越少越好,修饰匹配次数的特殊符号后再加上一个"?"号)

  • 字符边界(零宽匹配,匹配的不是字符而是位置)
    ^ : 与字符串开始的地方匹配
    $ : 与字符串结束的地方匹配
    \b : 匹配一个单词边界,前面的字符和后面的字符不全是\w

  • 选择符和分组
    | : 或
    () :
    捕获组,再被修饰匹配次数的时候,括号中的表达式可以作为整体被修饰
    取匹配结果的时候,括号中的表达式匹配到的内容可以被单独得到
    每一对括号会分配一个编号,使用()的捕获组根据左括号的顺序从1开始自动编号
    (?:Expression):
    非捕获组,一些表达式中,不得不使用(),但又不需要保存()中子表达式匹配的内容
    这时候可以用非捕获组来抵消使用()带来的副作用

  • 反向引用(\nn)
    每一对()会分配一个编号,使用()的捕获根据左括号的顺序从1开始自动编号
    通过反向引用,可以对分组已捕获的字符串进行引用

  • 预搜索(零宽断言)
    对位置的匹配
    (?=Exp) : 断言自身出现的位置的后面能匹配表达式Exp
    (?<=Exp) : 断言自身出现的位置的前面面能匹配表达式Exp
    (?!Exp) : 断言自身出现的位置的后面不能匹配表达式Exp
    (?<!Exp) : 断言自身出现的位置的前面不能匹配表达式Exp

简述正则表达式及其用途。
在编写处理字符串的程序时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。
Java中是如何支持正则表达式操作的?
Java中的String类提供了支持正则表达式操作的方法,包括:matches()、replaceAll()、replaceFirst()、split()。此外,Java中可以用Pattern类表示正则表达式对象,它提供了丰富的API进行各种正则表达式操作。

这里记录下错题:
Java中用正则表达式截取字符串中第一个出现的英文左括号之前的字符串。比如:北京市(海淀区)(朝阳区)(西城区),截取结果为:北京市。正则表达式为".*?(?=\\()"