首页技术博客 PHP教程数据库技术前端开发 HTML5 Nginx php论坛

新用户注册 | 会员登录

热门标签 | HotTags

当前位置: 开发笔记 > 编程语言 > 正文

Python正则表达式学习日志CSDN21天学习挑战赛(二)更多学习请期待下期！

作者：张哥他爹 | 来源：互联网 | 2023-09-15 21:17

目录正则表达式常用方法一、match函数和findall函数1.match(patter

目录

正则表达式常用方法

一、match函数和findall函数

1.match(pattern, string, flags=0)

2.findall(pattern, string, flags=0)

二、正则表达式语法学习

1.元字符

2.转义字符

3.数量规则

4.边界处理器：

5.分组匹配

三、正则表达式函数学习

这就是正则表达式基础内容的学习笔记啦~

谢谢观看！

活动地址：CSDN21天学习挑战赛

学习的最大理由是想摆脱平庸，早一天就多一份人生的精彩；迟一天就多一天平庸的困扰。各位小伙伴，如果您：
想系统/深入学习某技术知识点…
一个人摸索学习很难坚持，想组团高效学习…
想写博客但无从下手，急需写作干货注入能量…
热爱写作，愿意让自己成为更好的人…

正则表达式常用方法
正则表达式是一串特殊的字符串，可以用于对字符串筛选等操作。

一、match函数和findall函数

为了方便学习正则表达式，先引入两个正则表达式函数。

1.match(pattern, string, flags=0)

pattern对应正则表达式，string对应需要进行筛选等处理的字符串.
函数根据正则表达式从string左边到右进行匹配，匹配不成功则返回None.
import re # 导入re模块，用于学习正则表达式 a = re.match('ad', 'adadad') # ‘ ad ’是正则表达式，表示字符串从左到右的第一第二个字符串必须是ad # ‘adadad’是被匹配的字符串 # 打印匹配结果 print(a) # 匹配成功时返回匹配的结果 print('匹配成功：',a.group()) 匹配结果： >>> # 这是匹配成功的返情况，如果不成功，打印出None # 返回值末尾的match对的值就是匹配后的返回值 >>> 匹配成功：ad

2.findall(pattern, string, flags=0)

匹配字符串中所有符合条件的字符串，并以列表（数组）形式呈现。
a = re.findall('ad', 'adadad') print(a) 配对结果： >>> ['ad', 'ad', 'ad']

二、正则表达式语法学习

1.元字符

a.单字符:只匹配单个字符，有：“.” ，“\d\D” ，“\w\W” ，“\s\S”
1）‘ . ’：用于匹配一个任意的字符串，‘\n’除外。
print(re.match('.', 'acsdfsfdsfa')) print(re.match('.', '\ncsdfsfdsfa')) 匹配结果： >>> # 匹配成功，匹配到第一个字符串‘a’，且只匹配一个字符串 None >>> # 表示不能与‘\n’相匹配
2）‘ \d ’ 与‘\D’：
# \b表示匹配10-9，\D表示匹配非数字 print(re.match('\d', '12a')) print(re.match('\D', 'aca')) 匹配结果： >>> >>>
3）“\w”与“\W”：
# \w匹配大小写字母，数字，下划线 print(re.match('\w', 'acsdfsfdsfa')) print(re.match('\w', '#@acsdfsfdsfa')) # \W与\w相反，匹配特殊字符 print(re.match('\W', '#@acsdfsfdsfa')) print(re.match('\W', 'acsdfsfdsfa')) 返回结果： >>> >>> None >>> >>> None
4）“s” 与“S”：
# \s用来匹配空格和缩进 print(re.match('\s', ' ac')) print(re.match('\s', ' ac')) # \S表示的和 \s 相反。 print("==================") print(re.match('\S', 'ac')) print(re.match('\S', '@#ac')) 匹配结果： >>> >>> >>> ================== >>> >>>
b.字符集
字符集是一个中括号 “ [ ] ”，表示单个字符的一个范围。
# a-z表示从字母a到字母z，还有A-z，0-9 print(re.match('[dhcpa]', 'acsdfsfdsfa')) print(re.match('[dhcpa]', 'zacsdfsfdsfa')) print(re.match('[a-d]', 'acsdfsfdsfa')) print(re.match('[f-z]', 'zacsdfsfdsfa')) print(re.match('[^a-d]', '*zacsdfsfdsfa')) # 表示匹配非a-d的所有字符，包括特殊字符 print(re.match('[0-9a-zA-Z]', 'zacsdfsfdsfa')) # 表示匹配所有的大小写字母和数字 print(re.match('[0-9][a-z][A-Z]', '1zAacsdfsfdsfa')) # 多字符同时匹配 # 多匹配进阶 print(re.match('1as[A-Z][^a-zA-Z][^0-9]', '1asA我@Python')) print(re.match('[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]@qq.com','2154585881@qq.com')) 返回结果： >>> >>> None >>> >>> >>> >>> >>> >>> >>>

2.转义字符

a.路径转义：
# 假设有路径信息为：D:\\baidu\new\tabay # Python直接解释翻译时，会出现信息残缺的现象，无法保证字符串的完整 print("D:\\baidu\new\tabay") # 加上转义字符后，正常显示输出 print("D:\\\\baidu\\new\\tabay") # 还有一个办法，就是前面加个r print(r"D:\\baidu\new\tabay") 匹配结果： >>> D:\baidu >>> ew abay >>> D:\\baidu\new\tabay >>> D:\\baidu\new\tabay
b.正则表达式中的转义
# 正则表达式的转义字符：至少三个斜杠 print(re.match('\d', '\d')) print(re.match('\\d', '\d')) print(re.match('\\\d', '\d')) print(re.match('\\\\d', '\d')) # 优先使用Python语法处理，再使用正则表达式处理 print(re.match(r"D:\\baidu\new\tabay", "D:\\baidu\new\tabay")) # 转义的过程略微有些复杂输出结果： >>> None >>> None >>> >>> >>>

3.数量规则

匹配规则：* + ? {1}
# 匹配电话号码：18138199999 print(re.match("\d\d\d\d\d\d\d\d\d\d\d", '18138199949')) # 费劲，不简洁 # “ * ” 匹配前一个字符出现任意次数的数字 print(re.match("\d*", '18138199949')) # 表示数字出现了11次 print(re.match("\w*", '181as38#199949')) # 尽可能的匹配字符（贪婪模式） # 匹配前一个字符出现一次以上 print(re.match("\w+", '181as38#199949')) # 1次或者0次 print(re.match("\w?", '181as38#199949')) print(re.match("(\w?)+", '181as38#199949')) print(re.match("\w?", '')) # z{x,y} x控制前面z出现的次数 print(re.match("\d{3}", '18138199949')) # 控制数字出三次进行匹配 print(re.match("\d{3,}", '18138199949')) # 控制字符串至少出现三次以上，不封顶 print(re.match("\d{3,6}", '18138199949')) # 至少3次，最多6次匹配结果： >>> >>> >>> >>> >>> >>> >>> >>> >>> >>>

4.边界处理器：

a.普通边界
# 控制为11位的电话号码 tel = '185381999491aa121' print(re.match("\d{11}", tel)) # 匹配格式设置：[1] [3 5 8] [5-9] {8} ^控制开头，$控制结尾 11位电话号码的匹配 print(re.match('^1[358][5-9]\d{7}[0-9]', tel)) print(re.match('^1[358][5-9]\d{7}[0-9]$', '1350900990')) # 少一位 print(re.match('^1[358][5-9]\d{7}[0-9]$', '135090099012')) # 多一位 print(re.match('^1[358][5-9]\d{7}[0-9]$', '1350900990qa1')) # 多两位输出结果： >>> >>> >>> None >>> None >>> None
b. 单词边界\b 与非边界\D(需要转义) ==>边界：符号，空格
str = 'TypeError: match() missing 1 required positional argument: string' # 单词边界 \b ：\b所在的地方即为边界 print(re.findall(r'\bre',str)) print(re.findall(r'[rlt]\b',str)) # 单词非边界 \B ：\B所在的地方为非边界区域，可以是单词内 print(re.findall(r're\B',str)) print(re.findall(r'\Bre',str)) # 输出结果： >>> ['re'] >>> ['r', 'l', 't'] >>> ['re', 're'] >>> ['re']

5.分组匹配

a.分组：使用小括号作为分组标识符
# 实践：匹配日期，将月日限制范围 # group后面的括号数字是用来输出分配小组用的，每个括号算是一个小组！不论是不是小括号嵌小括号，都按照括号来算. # 下面是由简单到逐步嵌入正则表达式的匹配 print(re.match('2022-08-03','2022-08-03')) print(re.match('\d{4}-\d{2}-\d{2}','2022-08-03')) print(re.match('\d{4}(-\d{2}){2}','2022-08-03')) print(re.match('(1([\d]{3})|20[\d]{2})-([0][1-9]|1[012])-(0[1-9]|[1-2][0-9]|3[01])','2090-11-31')) print(re.match('(1([\d]{3})|(20[\d]{2}))-(([0][1-9])|(1[012]))-((0[1-9])|([1-2][0-9])|(3[01]))','2090-11-31')) print(re.match('(1([\d]{3})|(20[\d]{2}))-(([0][1-9])|(1[012]))-((0[1-9])|([1-2][0-9])|(3[01]))','2090-11-31').group()) print(re.match('(1([\d]{3})|(20[\d]{2}))-(([0][1-9])|(1[012]))-((0[1-9])|([1-2][0-9])|(3[01]))','2090-11-31').group(0)) print(re.match('(1([\d]{3})|(20[\d]{2}))-(([0][1-9])|(1[012]))-((0[1-9])|([1-2][0-9])|(3[01]))','2090-11-31').group(1)) 输出结果： >>> >>> >>> >>> >>> >>> 2090-11-31 >>> 2090-11-31 >>> 2090
b.数据采集和清洗
# 使用小括号单独匹配出html标签的内容 str = '' print(re.match(r'',str)) print(re.match(r'',str).group()) print('---------------') # 取出需要采集的东西 ==> 数据清洗 ==> 不断加深取出的深度 print(re.match(r'',str).group(1)) print(re.match(r'<(\w+)>([\W\w]*)',str).group(1)) print(re.match(r'<(\w+)>([\W\w]*)',str).group(1)) # \1相当于group(1)，保证了两者值相同 # 给分组起别名：(?P)，引用分组别名(?P=) == 路由 print(re.match(r'<(?P\w+)>([\W\w]*)',str).group()) 输出结果： >>> >>> >>> --------------- >>> PHP文本框读取 >>> title >>> title >>>

三、正则表达式函数学习

基础函数如下：(以下使用'>>> '直接表示返回输出结果)
import re # compile(pattern, flags=0): 编译，一般用于同一个正则表达式被多次调用 == 方便调用正则表达式 str = '' print(re.match(r'',str)) sw = re.compile(r'') # 使用相应的字符串替代正则表达式 print(sw.match(str)) # 只需要传入一个字符串，有的类似于类里面的方法调用，忽略了正则表达式的传入（忽略了self） >>> >>> # flags:选择匹配方式 ==> 不太常用，暂时忽略 sw1=re.compile('ASDcd',flags=re.I) # 忽略大小写 print(sw1.match('ASDCd')) >>> # match函数的方法 print(re.match('(1[\d]{3}|20[\d]{2})-([0][1-9]|1[012])-(0[1-9]|[1-2][0-9]|3[01])','2090-11-31').group(0)) print(re.match('(1[\d]{3}|20[\d]{2})-([0][1-9]|1[012])-(0[1-9]|[1-2][0-9]|3[01])','2090-11-31').groups(0)) # 复数模式，返回分组的元组 print(re.match('(1[\d]{3}|20[\d]{2})-([0][1-9]|1[012])-(0[1-9]|[1-2][0-9]|3[01])','2090-11-31').start(2)) # 经过试验，这个从字符串最左边开始的光标，匹括号内的数字是匹配字符串在正则表达式中的位置 print(re.match('(1[\d]{3}|20[\d]{2})-([0][1-9]|1[012])-(0[1-9]|[1-2][0-9]|3[01])','2090-11-31').end()) # 这是字符串最右边光标 print(re.match('(1[\d]{3}|20[\d]{2})-([0][1-9]|1[012])-(0[1-9]|[1-2][0-9]|3[01])','2090-11-31').span()) # 将开头和结尾糅合在一起 print(re.match('(1[\d]{3}|20[\d]{2})-([0][1-9]|1[012])-(0[1-9]|[1-2][0-9]|3[01])','2090-11-31').string) # 返回字符串 >>> 2090-11-31 >>> ('2090', '11', '31') >>> 5 >>> 10 >>> (0, 10) >>> 2090-11-31 # re.search() (搜索功能) print(re.search('a','1bdada1')) # re.findall() (搜索字符串，拍出对应列表) print(re.findall('a','1badada1a')) # re.split() 分割--默认按照组进行切割 print(re.split('(1[\d]{3}|20[\d]{2})-([0][1-9]|1[012])-(0[1-9]|[1-2][0-9]|3[01])','2090-11-31')) print(re.split('-','2090-11-31')) # sub替换默认替换了全部 print(re.sub('-','!!!','2090-11-31')) print(re.sub('-','!!!','2090-11-31',count=1)) >>> >>> ['a', 'a', 'a', 'a'] >>> ['', '2090', '11', '31', ''] >>> ['2090', '11', '31'] >>> 2090!!!11!!!31 >>> 2090!!!11-31

这就是正则表达式基础内容的学习笔记啦~

谢谢观看！

版权声明：本文为weixin_44016181原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/weixin_44016181/article/details/126138177

推荐阅读

object
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
object
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
object
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
object
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
object
使用 Ubuntu 中的 Python 获取浏览器历史记录

使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]

蜡笔小新 2023-12-14 08:57:59
object
Android JSON基础，音视频开发进阶指南目录

Array里面的对象数据是有序的，json字符串最外层是方括号的，方括号：[]解析jsonArray代码try{json字符串最外层是 ... [详细]

蜡笔小新 2023-12-13 15:05:45
object
Java中vector的使用详解

本文详细介绍了Java中vector的使用方法和相关知识，包括vector类的功能、构造方法和使用注意事项。通过使用vector类，可以方便地实现动态数组的功能，并且可以随意插入不同类型的对象，进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下，使用vector类是一个很好的选择。 ... [详细]

蜡笔小新 2023-12-13 14:14:39
post
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
web
搭建Windows Server 2012 R2 IIS8.5+PHP（FastCGI）+MySQL环境的详细步骤

本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP（FastCGI）+MySQL环境的步骤，包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]

蜡笔小新 2023-12-14 17:03:58
object
如何使用Java获取服务器硬件信息和磁盘负载率

本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务，并获取服务器的磁盘信息，并将结果输出。然后在本地使用JS编写一个AJAX脚本，远程请求服务端的程序，得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]

蜡笔小新 2023-12-14 13:56:20
object
LeetCode笔记：剑指Offer 41. 数据流中的中位数（Java、堆、优先队列、知识点）

本文介绍了LeetCode剑指Offer 41题的解题思路和代码实现，主要涉及了Java中的优先队列和堆排序的知识点。优先队列是Queue接口的实现，可以对其中的元素进行排序，采用小顶堆的方式进行排序。本文还介绍了Java中queue的offer、poll、add、remove、element、peek等方法的区别和用法。 ... [详细]

蜡笔小新 2023-12-14 13:34:58
object
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
process
scrapy存入excel时，excel文件被反复擦除重写。文件大小始终不超过100k，请问这种情况改如何解决

怀疑是每次都在新建文件，具体代码如下 ... [详细]

蜡笔小新 2023-12-13 17:53:49
object
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
sum
[大整数乘法] java代码实现

本文介绍了使用java代码实现大整数乘法的过程，同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率，并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]

蜡笔小新 2023-12-13 11:21:32

张哥他爹

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |

京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区版权所有