Python基础知识——正则表达式
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。本文将简单介绍在python语言中使用正则表达式的步骤。
在代码中引入re模块
python语言所有需要使用的正则表达式函数都封装在re模块中,我们可以在代码中写入以下代码来引入re模块:
import re
定义正则表达式匹配规则
通过调用re.compile()函数并传入一个表示正则表达式的字符串值,即可得到一个Regex对象,我们现在来创建一个匹配手机号码的正则表达式:
phoneNumRegex = re.compile(r'1\d\d\d\d\d\d\d\d\d\d')
我们的手机号一般是“1”开头,并且有11位数字,所以上面这个正则表达式就是表达了”以1开头,接着10个数字“这样一个字符串。
进行regex匹配
通过调用Regex对象的search()函数去匹配传入的字符串,并寻找到该正则表达式匹配的所有结果,代码如下:
phoneMatch = phoneNumRegex.search('我的手机号是:13888999777')
如果本次Regex没有匹配到任何结果,则search()函数会返回None。如果存在匹配,则可以调用phoneMatch的group()函数来返回被查找到的字符串的具体内容:
print('找到了手机号:' + phoneMatch.group())
完整代码如下:
import re
phoneNumRegex = re.compile(r'1\d\d\d\d\d\d\d\d\d\d')
phoneMatch = phoneNumRegex.search('我的手机号是:13888999777')
print('找到了手机号:' + phoneMatch.group())
运行后得到以下结果:

python的正则表达式的使用步骤到这里就讲完了。