Python基础知识——正则表达式

正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。本文将简单介绍在python语言中使用正则表达式的步骤。

在代码中引入re模块

python语言所有需要使用的正则表达式函数都封装在re模块中,我们可以在代码中写入以下代码来引入re模块:

import re

定义正则表达式匹配规则

通过调用re.compile()函数并传入一个表示正则表达式的字符串值,即可得到一个Regex对象,我们现在来创建一个匹配手机号码的正则表达式:

phoneNumRegex = re.compile(r'1\d\d\d\d\d\d\d\d\d\d')

我们的手机号一般是“1”开头,并且有11位数字,所以上面这个正则表达式就是表达了”以1开头,接着10个数字“这样一个字符串。

进行regex匹配

通过调用Regex对象的search()函数去匹配传入的字符串,并寻找到该正则表达式匹配的所有结果,代码如下:

phoneMatch = phoneNumRegex.search('我的手机号是:13888999777')

如果本次Regex没有匹配到任何结果,则search()函数会返回None。如果存在匹配,则可以调用phoneMatch的group()函数来返回被查找到的字符串的具体内容:

print('找到了手机号:' + phoneMatch.group())

完整代码如下:

import re

phoneNumRegex = re.compile(r'1\d\d\d\d\d\d\d\d\d\d')
phoneMatch = phoneNumRegex.search('我的手机号是:13888999777')
print('找到了手机号:' + phoneMatch.group())

运行后得到以下结果:

python的正则表达式的使用步骤到这里就讲完了。

发表评论

邮箱地址不会被公开。 必填项已用*标注