正则表达式

🕗 发布于 2024-07-21 00:13 正则表达式 Python re

正则表达式与re模块简介

正则表达式(regular expression)描述了一种字符串匹配的模式(pattern)
正则表达式是一个模糊的匹配(不是精准匹配)
re: python自1.5版本开始增加了re模块,该模块提供了perl风格的正则表达式,re模块是python中所有正则表达式的功能

如下四个方法经常使用

match()
search()
findall()
finditer()

正则表达式

.               匹配除换行符以外的任意字符
[]              里面是字符集合,匹配[]里任意一个字符
[0123456789]    匹配任意一个数字字符
[0-9]           匹配任意一个数字字符
[a-z]           匹配任意一个小写英文字母字符
[A-Z]           匹配任意一个大写英文字母字符
[A-Za-z]        匹配任意一个英文字母字符
[A-Za-z0-9]     匹配任意一个数字或英文字母字符
[^lucky]        []里的^称为脱字符,表示非,匹配不在[]内的任意一个字符
^[lucky]        以[]中内的某一个字符作为开头
\d              匹配任意一个数字字符,相当于[0-9]
\D              匹配任意一个非数字字符,相当于[^0-9]
\w              匹配字母、下划线、数字中的任意一个字符,相当于[0-9A-Za-z_]
\W              匹配非字母、下划线、数字中的任意一个字符,相当于[^0-9A-Za-z_]
\s              匹配空白符(空格、换页、换行、回车、制表),相当于[ \f\n\r\t]
\S              匹配非空白符(空格、换页、换行、回车、制表),相当于[^ \f\n\r\t]
*               匹配0次到任意次
+               匹配1次以上

match()函数

原型

def match(pattern, string, flags=0)

功能

匹配成功返回匹配的对象
匹配失败返回None

获取匹配结果

使用group()方法获取到匹配的值
groups() 返回一个包含所有小组字符串的元组, 从 1 到所含的小组号

参数

参数            说明
pattern         匹配成功的正则表达式(一种字符串的模式)
string          要匹配的字符串
flags           标记位, 用于控制正则表达式的匹配方式

特点

只匹配一次，必须从第一位开始，类似于search(“^”)

测试

import re #导入re正则模块
print(re.match("a", '123456'))  #None
print(re.match("[a-z]", '123x456')) #None
print(re.match("^1[3-9][0-9]{9}$", '19350302289'))  #<re.Match object; span=(0, 11), match='19350302289'>
print(re.match("^1[3-9][0-9]{9}$", '19350302289').group())  #19350302289

search()函数

原型:

def search(pattern, string, flag=0)

功能

扫描整个字符串string, 并返回第一个pattern模式成功的匹配
匹配失败返回 None

参数

参数            说明
pattern         匹配成功的正则表达式(一种字符串的模式)
string          要匹配的字符串
flags           标记位, 用于控制正则表达式的匹配方式

特点

只匹配一次,匹配任意位置

测试

import re #导入re正则模块
print(re.search("a", '123456'))     #None
print(re.search("[a-z]", '123x456'))    #<re.Match object; span=(3, 4), match='x'>
print(re.search("^1[3-9][0-9]{9}$", '19350302289')) #<re.Match object; span=(0, 11), match='19350302289'>
print(re.search("^1[3-9][0-9]{9}$", '19350302289').group()) #19350302289

findall()函数

原型:

def findall(pattern, string, flag=0)

功能

扫描整个字符串string, 并返回所有匹配的pattern模式结果的字符串列表

参数

参数            说明
pattern         匹配成功的正则表达式(一种字符串的模式)
string          要匹配的字符串
flags           标记位, 用于控制正则表达式的匹配方式

特点

多次匹配,匹配任意位置

测试

import re #导入re正则模块
print(re.findall("<b>.*</b", '<b>测试</b><b>测试01</b><b>测试02</b>'))  #['<b>测试</b><b>测试01</b><b>测试02</b']
print(re.findall("<b>.*?</b", '<b>测试</b><b>测试01</b><b>测试02</b>')) #['<b>测试</b', '<b>测试01</b', '<b>测试02</b']

finditer()函数

原型:

def finditer(pattern, string, flag=0)

功能

扫描整个字符串string, 并返回所有匹配的pattern模式结果的字符串列表

参数

参数            说明
pattern         匹配成功的正则表达式(一种字符串的模式)
string          要匹配的字符串
flags           标记位, 用于控制正则表达式的匹配方式

特点

多次匹配,匹配任意位置

测试

# 代码
import re #导入re正则模块
obj = re.finditer("<b>.*</b", '<b>测试</b><b>测试01</b><b>测试02</b>')
print(obj)
for i in obj:
    print(i.group())

obj1 = re.finditer("<b>.*?</b", '<b>测试</b><b>测试01</b><b>测试02</b>')
print(obj1)
for i in obj1:
    print(i.group())

# 运行结果
# <callable_iterator object at 0x000001FBC4933F10>
# <b>测试</b><b>测试01</b><b>测试02</b
# <callable_iterator object at 0x000001FBC4933F40>
# <b>测试</b
# <b>测试01</b
# <b>测试02</b

split()函数

原型:

def split(pattern, string, maxsplit=0, flags=0)

功能

切割字符串

参数

pattern         正则表达式
string          要拆分的字符串
maxsplit        最大拆分次数    默认拆分全部
flags           修正符

测试

import re
str = "Hello, I'm zhangsan, nice to meet you!"
print(re.split(",",str))
print(re.split(",",str,maxsplit=1))

# 运行结果
# ['Hello', " I'm zhangsan", ' nice to meet you!']
# ['Hello', " I'm zhangsan, nice to meet you!"]

修正符(flags)

值              说明
re.I            使匹配对大小写不敏感
re.M            多行匹配, 影响到^和$
re.S            使.匹配包括换行符在内的所有字符

分组起名称

概念

处理简单的判断是否匹配之外, 正则表达式还有提取子串的功能, 用()表示的就是要提取的分组

测试

#分组起名称语法     "表达式(?P<别名>表达式)表达式"
import re
print(re.search("(?P<id>\D)", '123w32').group(0))
print(re.search("(?P<id>\D)", '123w32').group('id'))
print(re.search("(?P<number>\d+)", 'hello666').group(0))
print(re.search("(?P<number>\d+)", 'hello666').group('number'))

#运行结果
# w
# w
# 666
# 666

编译

概念

当在python中使用正则表达式时, re模块会做两件事, 一件是编译正则表达式, 如果正则表达式的字符串本身不合法, 会报错。另一件是用编译好的正则表达式提取信息。

编译优点

如果一个正则表达式要使用几千遍, 每一次都会编译, 出于效率的考虑会进行预先编译, 就不需要每次都编译了, 节省了编译的时间, 从而提升效率。

compile()函数

原型

def compile(pattern, flags=0)

功能

将pattern模式编译成正则对象

参数

参数            说明
pattern         匹配的正则表达式(一种字符串的模式)
flags           标识位, 用于控制正则表达式的匹配方式

测试

import re
str = "\d"
reObj = re.compile(str, re.I)
print(reObj)
print(reObj.match("1dfa"))
print(reObj.match("1dfa").group())

#运行结果
# re.compile('\\d', re.IGNORECASE)
# <re.Match object; span=(0, 1), match='1'>
# 1

原文地址：https://blog.csdn.net/m0_73431159/article/details/140505736

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

推荐系统与大模型
目前大模型在推荐系统取得巨大进展的同时也上主要一些的问题。主要有以下三点。1. Position Bias.在推荐系统的生成语言建模范式中，用户行为序列和推荐候选序列等各种信息以文本序列描述的形式输入
阅读更多2024-11-19
element-ui】使用el_upload上传文件无法动态修改action
问题：最近在使用el_upload上传文件时，发现无法动态修改action的值，进行提交时，caseId2还是默认值null。原因：el-upload的先执行上传，后执行action里的响应，也就是赋
阅读更多2024-11-19
JavaScript 如何获取本机IP地址
获取本机IP地址是前端工程师经常需要处理的问题。JavaScript 有几种方法可以获取客户端的IP地址。下面是三种获取本机IP的方法。
阅读更多2024-11-19
如何用 JavaScript 复制到剪贴板
以上就是几种在 JavaScript 中实现文本复制到剪贴板的方法。随着技术的发展，建议尽量使用最新的异步剪贴板 API，但为了兼容性，可以结合使用方法。希望本文能够帮助你更好地理解和应用这些 API
阅读更多2024-11-19
【第29章】MyBatis-Plus之分页插件
的分页插件提供了强大的分页功能，支持多种数据库，使得分页查询变得简单高效。属性名类型默认值描述overflowbooleanfalse溢出总页数后是否进行处理maxLimitLong单页分页条数限制d
阅读更多2024-11-19
weixin-java-miniapp 微信小程序登陆
1. 用户在小程序中选择使用微信授权登录功能。2. 小程序调用 `` 接口，向发起登录请求。3. 微信服务器验证小程序的合法性，如果合法，会返回一个。4. 小程序。5. 后台服务器接收到 **code
阅读更多2024-11-19
都2023年了，Servlet还有必要学习吗？一文带你快速了解Servlet
不得不说，Servlet 确实是一门古老的技术了，现在很少有公司直接使用 Servlet 来写项目了，大家都在用 SpringMVC-Spring-MyBatis / SpringBoot 做开发了，
阅读更多2024-11-19
掌握Java中集合的交集与并集操作
本文还有配套的精品资源，点击获取简介：集合操作是编程中的基础任务，涉及找出多个集合的共有元素（交集）和所有不同元素的总和（并集）。本文介绍如何在Java中利用 HashSet 和 St
阅读更多2024-11-19
Java 环境配置——Java 语言的安装、配置、编译与运行
正确配置 Java 开发环境是进行 Java 开发的第一步。通过本文的详细介绍，读者应能够在不同操作系统上安装和配置 JDK，并熟练编写、编译和运行 Java 程序。随着技术的发展，Java 生态系统
阅读更多2024-11-19
java 配置多数据源
mysql和clickhouse多数据源配置。
阅读更多2024-11-19

正则表达式

正则表达式与re模块简介

正则表达式

match()函数

原型

功能

获取匹配结果

参数

特点

测试

search()函数

原型:

功能

参数

特点

测试

findall()函数

原型:

功能

参数

特点

测试

finditer()函数

原型:

功能

参数

特点

测试

split()函数

原型:

功能

参数

测试

修正符(flags)

分组起名称

概念

测试

编译

概念

编译优点

compile()函数

原型

功能

参数

测试

相关文章