作用:简化匹配机制,增加匹配灵活度
假设我们要判定一个字符串是不是电话号码
格式是 xxx-xxx-xxxx
那么如果我们用if elif语句的话,要先判定前三个,然后判定第四个……
而且这样灵活性很差,一堆代码只能检查一种格式
所以正则表达式粉墨登场,re是正则表达式引用的类库,我们可以在命令行中 pip install re安装好
# 接下来这三行代码很重要
# 首先re.compile()传入一个我们需要的格式,每个\d表示一个整数
# 然后在phoneNumber中搜索传入的number,此时返回的对象mo,就是搜到的对象,也即电话号码
#最后通过mo.group()获得字符,并打印,mo本身包含了很多信息,你也可以打印出来看看
import re
def checkNumber(number):
phoneNumber = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')
mo=phoneNumber.search(number)
print(mo.group())
print(checkNumber('444-123-1234'))
#如果没有,返回none
print(checkNumber('12345678'))
打印结果,即会用re.compile(r’),search(),group()
现在你已经会了一点正则,但是继续往下其实还有很多问题
比如如果传入的字符串中有多个目标字符要怎么返回?
有些字符不管存不存在都不影响目标字符怎么办?……
再看这段代码
#在\d后面用{}包含的数字表示相同的整数
#同时在第一个\d周围加上括号,后面两个共同加括号,就可以实现分离出目标字符的功能
phoneNumber=re.compile(r'(\d{3})-(\d{3}-\d{4})')
mo=phoneNumber.search("444-122-1232")
#
#传入参数0,打印出整个字符串
print(mo.group(0))
#传入参数2,打印出第二个字符串
print(mo.group(2))
#通过元祖形式,打印出目标字符串的内容
print(mo.groups())
#这里是最让我惊艳的,可以将mo中包含的字符串分别传入两个字符串,就是按括号分的
first,second=mo.groups()
print(first+","+second)
效果如下,就是()可以分割字符,{}可以设定同样的字符有多少个,group()传参可以决定输出的字符
如果你理解了上面,接下来就势如破竹,对你来说已经没有困难了
| 表示当搜索到其中一个就返回
phoneNumber=re.compile(r'chensong|kangxin')
mo=phoneNumber.search('chensong with kangxin')
mo2=phoneNumber.search('kangxin with chensong')
print(mo.group())
print(mo2.group())
?表示前面被括号包含的字符有就输出,没有也没关系
phoneNumber2=re.compile(r'chensong(wo)?')
mo3=phoneNumber2.search('chensong')
mo4=phoneNumber2.search('chensongwo')
print("mo3="+mo3.group())
print(“mo4="+mo.group())
*号表示前面的字符可以出现零次或多次,都可以一起打印
phoneNumber3=re.compile(r'chensong(wo)*')
mo5=phoneNumber3.search('chensongwowowow')
mo6=phoneNumber3.search('chensong')
print("mo5="+mo5.group())
print("mo6="+mo6.group())
+和类似,加号表示一次或多次,但是号可以没有
phoneNumber4=re.compile(r'chensong(wo)+man')
#现在是搜索不到的情况
mo7=phoneNumber4.search('chensong')
mo8=phoneNumber4.search('chensongwomanman')
#判定mo7是否为空
print(mo7 is None)
print(mo8.group())
规则多了就有点烦了,所以今天就这么多基础的,已经可以解决很多问题了,后面的都要加上括号来分割才有用哦
除此之外,还有贪心和非贪心,findall()方法,通配符,替换等用法
下次聊咯