当前位置: 开发笔记 > 编程语言 > 正文

python的re模块是自带的吗_Python正则re模块使用步骤及原理解析

作者：zJv老方有点坑爹额B | 来源：互联网 | 2023-10-16 11:13

python中使用正则表达式的步骤：1.导入re模块：importre2.初始化一个Regex对象：re.compile()3.刚刚创建的

python中使用正则表达式的步骤&＃xff1a;

1.导入re模块&＃xff1a;import re

2.初始化一个Regex对象&＃xff1a;re.compile()

3.刚刚创建的Regex对象调用search方法进行匹配&＃xff0c;返回要给March对象

4.刚刚的March对象调用group方法&＃xff0c;展示匹配到的字符串

下面例子的知识点&＃xff1a;

对正则表达式分组用&＃xff1a;()&＃xff0c;正则里的分组计数从1开始&＃xff0c;不是从0&＃xff0c;切记~~

group(数字)&＃xff1a;去对应的分组的值

groups():返回所有分组的元组形式

\d表示一个数字

regex_obj &＃61; re.compile(r&＃39;(\d\d\d)-(\d\d\d)-(\d\d\d\d)&＃39;)

match_obj &＃61; regex_obj.search(&＃39;我司电话&＃xff1a;035-411-1234&＃39;)

result1 &＃61; match_obj.group(1)

result2 &＃61; match_obj.group(2)

result3 &＃61; match_obj.group(3)

print(result1)

print(result2)

print(result3)

result4 &＃61; match_obj.group()

print(result4)

result5 &＃61; match_obj.groups()

print(result5)

执行结果&＃xff1a;

035

411

1234

035-411-1234

(&＃39;035&＃39;, &＃39;411&＃39;, &＃39;1234&＃39;)

补充知识点&＃xff1a;\w表示一个单词&＃xff0c;\s表示一个空格

regex_obj &＃61; re.compile(r&＃39;(\d\w\d)-(\d\d\d)-(\d\d\d\d)&＃39;)

match_obj &＃61; regex_obj.search(&＃39;我司电话&＃xff1a;0a5-411-1234&＃39;)

result &＃61; match_obj.group(1)

print(result)

regex_obj &＃61; re.compile(r&＃39;(\d\w\d)-(\d\d\d)-(\d\d\d\d)&＃39;)

match_obj &＃61; regex_obj.search(&＃39;我司电话&＃xff1a;0哈5-411-1234&＃39;)

result &＃61; match_obj.group(1)

print(result)

regex_obj &＃61; re.compile(r&＃39;(\d\s\d)-(\d\d\d)-(\d\d\d\d)&＃39;)

match_obj &＃61; regex_obj.search(&＃39;我司电话&＃xff1a;0 5-411-1234&＃39;)

result &＃61; match_obj.group(1)

print(result)

执行结果&＃xff1a;

0a5

0哈5

0 5

| 或&＃xff1a;

regex_obj &＃61; re.compile(r&＃39;200|ok|successfully&＃39;)

match_obj1 &＃61; regex_obj.search(&＃39;vom get request and stored successfully&＃39;)

result1 &＃61; match_obj1.group()

print(result1)

match_obj2 &＃61; regex_obj.search(&＃39;vom get request,response 200 ok&＃39;)

result2 &＃61; match_obj2.group()

print(result2)

match_obj3 &＃61; regex_obj.search(&＃39;vom get request,response ok 200&＃39;)

result3 &＃61; match_obj3.group()

print(result3)

执行结果&＃xff1a;

successfully

200

注意&＃xff1a;如果search返回的March对象只有一个结果值的话&＃xff0c;不能用groups&＃xff0c;只能用group

regex_obj &＃61; re.compile(r&＃39;200|ok|successfully&＃39;)

match_obj1 &＃61; regex_obj.search(&＃39;vom get request and stored successfully&＃39;)

result2 &＃61; match_obj1.groups()

print(result2)

result1 &＃61; match_obj1.group()

print(result1)

执行结果&＃xff1a;

()

successfully

? &＃xff1a;可选匹配项

&＃43; &＃xff1a;1次或 n次匹配

* &＃xff1a;*前面的字符或者字符串匹配 0次、n次

注意&＃xff1a;*前面必须要有内容

regex_obj &＃61; re.compile(r&＃39;(haha)*,welcome to vom_admin system&＃39;) 指haha这个字符串匹配0次或者多次

regex_obj &＃61; re.compile(r&＃39;(ha*),welcome to vom_admin system&＃39;) 指ha这个字符串匹配0次或者多次

. : 通配符&＃xff0c;匹配任意一个字符

所以常常用的组合是&＃xff1a;.*

regex_obj &＃61; re.compile(r&＃39;(.*),welcome to vom_admin system&＃39;)

match_obj1 &＃61; regex_obj.search(&＃39;Peter,welcome to vom_admin system&＃39;)

name &＃61; match_obj1.group(1)

print(name)

执行结果&＃xff1a;

Peter

{} &＃xff1a; 匹配特定的次数

里面只写一个数字&＃xff1a;匹配等于数字的次数

里面写{3,5}这样两个数字的&＃xff0c;匹配3次或 4次或 5次&＃xff0c;按贪心匹配法&＃xff0c;能满足5次的就输出5次的&＃xff0c;没有5次就4次&＃xff0c;4次也没有才是3次

regex_obj &＃61; re.compile(r&＃39;((ha){3}),this is very funny&＃39;)

match_obj1 &＃61; regex_obj.search(&＃39;hahahaha,this is very funny&＃39;)

print("{3}结果",match_obj1.group(1))

regex_obj &＃61; re.compile(r&＃39;((ha){3,5}),this is very funny&＃39;)

match_obj1 &＃61; regex_obj.search(&＃39;hahahaha,this is very funny&＃39;)

print("{3,5}结果",match_obj1.group(1))

执行结果&＃xff1a;

{3}结果 hahaha

{3,5}结果 hahahaha

findall()&＃xff1a;返回所有匹配到的字串的列表

regex_obj &＃61; re.compile(r&＃39;\d\d\d&＃39;)

match_obj &＃61; regex_obj.findall(&＃39;我是101班的&＃xff0c;小李是103班的&＃39;)

print(match_obj)

regex_obj &＃61; re.compile(r&＃39;(\d\d\d)-(\d\d\d)-(\d\d\d\d)&＃39;)

match_obj &＃61; regex_obj.findall(&＃39;我家电话是123-123-1234&＃xff0c;我公司电话是890-890-7890&＃39;)

print(match_obj)

打印结果&＃xff1a;

[&＃39;101&＃39;, &＃39;103&＃39;]

[(&＃39;123&＃39;, &＃39;123&＃39;, &＃39;1234&＃39;), (&＃39;890&＃39;, &＃39;890&＃39;, &＃39;7890&＃39;)]

[]&＃xff1a;创建自己的字符集&＃xff1a;

[abc]&＃xff1a;包括[]内的字符

[^abc]&＃xff1a;不包括[]内的所有字符

也可以使用:[a-zA-Z0-9]这样简写

regex_obj &＃61; re.compile(r&＃39;[!&＃64;#$%^&*()]&＃39;)

name &＃61; input("请输入昵称&＃xff0c;不含特殊字符&＃xff1a;")

match_obj &＃61; regex_obj.search(name)

if match_obj:

print("昵称输入不合法&＃xff0c;包含了特殊字符&＃xff1a;", match_obj.group())

else:

print("昵称有效")

执行结果&＃xff1a;

请输入昵称&＃xff0c;不含特殊字符&＃xff1a;*h

昵称输入不合法&＃xff0c;包含了特殊字符&＃xff1a; *

^&＃xff1a;开头

$&＃xff1a;结尾

regex_obj &＃61; re.compile(r&＃39;(^[A-Z])(.*)&＃39;)

name &＃61; input("请输入昵称&＃xff0c;开头必须大写字母&＃xff1a;")

match_obj &＃61; regex_obj.search(name)

print(match_obj.group())

执行结果&＃xff1a;

请输入昵称&＃xff0c;开头必须大写字母&＃xff1a;A1234

A1234

sub()&＃xff1a;第一个参数为要替换成的&＃xff0c;第二个参数传被替换的&＃xff0c;返回替换成功后的字符串

regex_obj &＃61; re.compile(r&＃39;[!&＃64;#$%^&*()]&＃39;)

match_obj &＃61; regex_obj.sub(&＃39;嘿&＃39;,&＃39;haha,$%^,hahah&＃39;)

print(match_obj)

执行结果&＃xff1a;

haha,嘿嘿嘿,hahah

补充一下正则表达式的表&＃xff0c;正则太复杂了&＃xff0c;要常看常用才能熟练

以上就是本文的全部内容&＃xff0c;希望对大家的学习有所帮助&＃xff0c;也希望大家多多支持。

推荐阅读

php
Python 爬虫基础教程及代码实例

根据最新发布的《互联网人才趋势报告》，尽管大量IT从业者已转向Python开发，但随着人工智能和大数据领域的迅猛发展，仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-26 10:42:40
join
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
client
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
version
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
php
PHP 过滤器详解

本文深入探讨了 PHP 中的过滤器机制，包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时，详细介绍了各种过滤器的用途和用法。 ... [详细]

蜡笔小新 2024-12-23 19:05:02
regex
C＃字符串处理如何从字符串中获取路径和args - C# string handling how get path and args from a string

Ihaveastringwithquotesaroundthepathasfollows:我在路径周围有一个带引号的字符串,如下所示:C:\ProgramFiles(x ... [详细]

蜡笔小新 2024-12-23 16:21:52
php
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
join
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
python
深入理解Tornado模板系统

本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块，支持嵌入Python代码片段，帮助开发者快速构建动态网页。 ... [详细]

蜡笔小新 2024-12-27 19:22:16
range
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
range
分页插件3指定到某一页

前言--页数多了以后需要指定到某一页（只做了功能，样式没有细调）html ... [详细]

蜡笔小新 2024-12-27 15:19:01
client
掌握远程执行Linux脚本和命令的技巧

本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令，帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释，让初学者也能轻松上手。 ... [详细]

蜡笔小新 2024-12-26 19:47:05
sum
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
php
PHP 实现网页内容抓取及数据解析

本文由杨勇和思远于2012年12月27日撰写，主要探讨了如何使用PHP进行网页内容抓取，特别是针对字符较多的网站。文章详细介绍了正则表达式失效的原因，并提供了优化方法，同时展示了如何抓取淘宝服饰栏、天气信息以及IP地址对应的地理位置。 ... [详细]

蜡笔小新 2024-12-23 11:27:18
range
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55

zJv老方有点坑爹额B

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章