正则表达式_牛客博客

常用操作符

操作符	说明	例子
.	表示任何单个字符
[ ]	字符集	[abc]表示a/b/c，[a-z]表示a到z
[^]	非字符集，对单个字符给出排除范围	[^abc]表示非a且非b且非c的单个字符
*	前一个字符0次或无限次扩展	abc* 表示 ab、abc、abcc、abccc等
+	前一个字符1次或无限次扩展	abc+ 表示 abc、abcc、abccc等
?	前一个字符0次或1次扩展	abc? 表示 ab、abc
\|	左右表达式任意一个	abc\|def 表示 abc、def
{m}	扩展前一个字符m次	ab{2}c表示abbc
{m,n}	扩展前一个字符m至n次（含n）	ab{1,2}c表示abc、abbc
^	匹配字符串开头	^abc表示abc在一个字符串的开头
$	匹配字符串结尾	abc$表示abc且在一个字符串的结尾， abc\|def)表示abc、def
\d	数字，等价于[0‐9]
\w	单词字符，等价于[A‐Za‐z0‐9_]

常用实例

表达式	说明
^[A‐Za‐z]+$	由26个字母组成的字符串
^[A‐Za‐z0‐9]+$	由26个字母和数字组成的字符串
^‐?\d+$	整数形式的字符串
^[0‐9][1‐9][0‐9]$	正整数形式的字符串
[1‐9]\d{5}	中国境内邮政编码，6位
[\u4e00‐\u9fa5]	中文字符
\d{3}‐\d{8}\|\d{4}‐\d{7}	国内电话号码，010‐68913536
(([1‐9]?\d\| 1\d{2}\|2[0‐4]\d \| 25[0‐5]).){3}([1‐9]?\d \| 1\d{2} \| 2[0‐4]\d \| 25[0‐5])	IP地址字符串

python正则表达式

import re

# re.search(pattern, string, flags=0)
match = re.search(r'[1-9]\d{5}','BIT 100081')
if match: print(match.group(0))
# 100081

# re.findall(pattern, string, flags=0)
ls = re.findall(r'[1-9]\d{5}','BIT100081 TSU100084')
print(ls)
# ['100081','100084']

re库主要功能函数

函数	说明
re.search()	在一个字符串中搜索匹配正则表达式的第一个位置，返回match对象
re.match()	从一个字符串的开始位置起匹配正则表达式，返回match对象
re.findall()	搜索字符串，以列表类型返回全部能匹配的子串
re.split()	将一个字符串按照正则表达式匹配结果进行分割，返回列表类型
re.finditer()	搜索字符串，返回一个匹配结果的迭代类型，每个迭代元素是match对象
re.sub()	在一个字符串中替换所有匹配正则表达式的子串，返回替换后的字符串

match对象的属性

属性	说明
.string	待匹配的文本
.re	匹配时使用的patter对象（正则表达式）
.pos	正则表达式搜索文本的开始位置
.endpos	正则表达式搜索文本的结束位置

最小匹配

操作符	说明
*?	前一个字符0次或无限次扩展，最小匹配
+?	前一个字符1次或无限次扩展，最小匹配
??	前一个字符0次或1次扩展，最小匹配
{m,n}?	扩展前一个字符m至n次（含n），最小匹配

只要长度输出可能不同的，都可以通过在操作符后增加?变成最小匹配

在线工具

http://c.runoob.com/front-end/854