当前位置: 开发笔记 > 编程语言 > 正文

python表示二元一次表达式_python模块之re正则表达式详解

作者：哎呦我去2502859031 | 来源：互联网 | 2023-09-17 22:52

一、简单介绍正则表达式是一种小型的、高度专业化的编程语言，并不是python中特有的，是许多编程语言中基础而又重要的一部分。在python中࿰

一、简单介绍

正则表达式是一种小型的、高度专业化的编程语言&＃xff0c;并不是python中特有的&＃xff0c;是许多编程语言中基础而又重要的一部分。在python中&＃xff0c;主要通过re模块来实现。

正则表达式模式被编译成一系列的字节码&＃xff0c;然后由用c编写的匹配引擎执行。那么正则表达式通常有哪些使用场景呢&＃xff1f;

比如为想要匹配的相应字符串集指定规则&＃xff1b;

该字符串集可以是包含e-mail地址、Internet地址、电话号码&＃xff0c;或是根据需求自定义的一些字符串集&＃xff1b;

当然也可以去判断一个字符串集是否符合我们定义的匹配规则&＃xff1b;

找到字符串中匹配该规则的部分内容&＃xff1b;

修改、切割等一系列的文本处理&＃xff1b;

......

二、特殊符号和字符(元字符)

这里介绍常见的一些元字符&＃xff0c;它给予正则表达式强大的功能和灵活性。表2-1列出了比较常见的符号和字符。

三、正则表达式

1、使用 compile()函数编译正则表达式

由于python代码最终会被翻译成字节码&＃xff0c;然后在解释器上执行。所以对于我们代码中经常要用到的一些正则表达式进行预编译&＃xff0c;执行起来会更加便捷。

re模块中的大多数函数和已经编译的正则表达式对象和正则匹配对象的方法同名并且具有相同的功能。

示例&＃xff1a;

>>> import re

>>> r1 &＃61; r&＃39;bugs&＃39; # 字符串前加"r"反斜杠就不会被任何特殊方式处理&＃xff0c;这是个习惯&＃xff0c;虽然这里没用到

>>> re.findall(r1, &＃39;bugsbunny&＃39;) # 直接利用re模块进行解释性地匹配

[&＃39;bugs&＃39;]

>>>

>>> r2 &＃61; re.compile(r1) # 如果r1这个匹配规则你会经常用到&＃xff0c;为了提高效率&＃xff0c;那就进行预编译吧

>>> r2 # 编译后的正则对象

>>>

>>> r2.findall(&＃39;bugsbunny&＃39;) # 访问对象的findall方法得到的匹配结果与上面是一致的

[&＃39;bugs&＃39;] # 所以说&＃xff0c;re模块中的大多数函数和已经编译的正则表达式对象和正则匹配对象的方法同名并且具有相同的功能

re.compile()函数也接受可选的标志参数&＃xff0c;常用来实现不同的特殊功能和语法变更。这些标志也可以作为参数适用于大多数re模块函数。这些标志可以用操作法(|)合并。

示例&＃xff1a;

>>> import re

>>> r1 &＃61; r&＃39;bugs&＃39;

>>> r2 &＃61; re.compile(r1,re.I) # 这里选择的是忽略大小写的标志&＃xff0c;完整的是re.IGNORECASE&＃xff0c;这里简写re.I

>>> r2.findall(&＃39;BugsBunny&＃39;)

[&＃39;Bugs&＃39;]
# re.S 使.匹配换行符在内的所有字符
# re.M 多行匹配&＃xff0c;英雄^和$
# re,X 用来使正则匹配模式组织得更加清晰

完整的标志参数列表和用法可以参考相关官方文档。

2、使用正则表达式

re模块提供了一个正则表达式引擎的接口&＃xff0c;下面具体介绍一些常用的函数和方法。

匹配对象以及group()和groups()方法

当处理正则表达式时&＃xff0c;除了正则表达式对象之外&＃xff0c;还有一个对象类型&＃xff1a;匹配对象。这些是成功调用 match()或者search()返回的对象。匹配对象有两个主要的方法&＃xff1a;group()和groups()。

group()要么返回整个匹配对象&＃xff0c;要么根据要求返回特定子组。groups()则仅返回一个包含唯一或者全部子组的元组。如果没有子组的要求&＃xff0c;那么当group()仍然返回整个匹配时&＃xff0c;groups返回一个空元组。下面一些函数示例会演示到此方法。

使用 match()方法匹配字符串

match()函数从字符串的起始部分对模式进行匹配。如果匹配成功&＃xff0c;就返回一个匹配对象&＃xff1b;如果匹配失败&＃xff0c;就返回 None&＃xff0c;匹配对象的方法 group()方法就能够用于显示那个成功的匹配。

示例如下&＃xff1a;

>>> m &＃61; re.match(&＃39;bugs&＃39;, &＃39;bugsbunny&＃39;) # 模式匹配字符串

>>> if m is not None: # 如果匹配成功&＃xff0c;就输出匹配内容

... m.group()

...

&＃39;bugs&＃39;
>>> m<_sre.sre_match object at> # 确认返回的匹配对象

使用search()在一个字符串中查找模式

search()的工作方式与match()完全一致&＃xff0c;不同之处在于search()是对给定正则表达式模式搜索第一次出现的匹配情况。简单来说&＃xff0c;就是在任意位置符合都能匹配成功&＃xff0c;不仅仅是字符串的起始部分&＃xff0c;这就是与match()函数的区别&＃xff0c;用脚指头想想search()方法使用的范围更多更广。

示例&＃xff1a;

>>> m &＃61; re.search(&＃39;bugs&＃39;, &＃39;hello bugsbunny&＃39;)

>>> if m is not None:

... m.group()

...

&＃39;bugs&＃39;

使用findall()和finditer()查找每一次出现的位置

findall()是用来查找字符串中所有(非重复)出现的正则表达式模式&＃xff0c;并返回一个匹配列表&＃xff1b;finditer()与findall()不同的地方是返回一个迭代器&＃xff0c;对于每一次匹配&＃xff0c;迭代器都返回一个匹配对象。

>>> m &＃61; re.findall(&＃39;bugs&＃39;, &＃39;bugsbunnybugs&＃39;)

>>> m

[&＃39;bugs&＃39;, &＃39;bugs&＃39;]

>>> m &＃61; re.finditer(&＃39;bugs&＃39;, &＃39;bugsbunnybugs&＃39;)

>>> m.next() # 迭代器用next()方法返回一个匹配对象

<_sre.sre_match object at> # 匹配用group()方法显示出来

>>> m.next().group()

&＃39;bugs&＃39;

使用sub()和subn()搜索与替换

都是将某字符串中所有匹配正则表达式的部分进行某种形式的替换。sub()返回一个用来替换的字符串&＃xff0c;可以定义替换次数&＃xff0c;默认替换所有出现的位置。subn()和sub()一样&＃xff0c;但subn()还返回一个表示替换的总是&＃xff0c;替换后的字符串和表示替换总数一起作为一个拥有两个元素的元组返回。

示例&＃xff1a;

>>> r &＃61; &＃39;a.b&＃39;

>>> m &＃61; &＃39;acb abc aab aac&＃39;

>>> re.sub(r,&＃39;hello&＃39;,m)

&＃39;hello abc hello aac&＃39;
>>> re.subn(r,&＃39;hello&＃39;,m)
(&＃39;hello abc hello aac&＃39;, 2)

字符串也有一个replace()方法&＃xff0c;当遇到一些模糊搜索替换的时候&＃xff0c;就需要更为灵活的sub()方法了。

使用split()分割字符串

同样的&＃xff0c;字符串中也有split()&＃xff0c;但它也不能处理正则表达式匹配的分割。在re模块中&＃xff0c;分居正则表达式的模式分隔符&＃xff0c;split函数将字符串分割为列表&＃xff0c;然后返回成功匹配的列表。

示例&＃xff1a;

>>> s &＃61; &＃39;1&＃43;2-3*4&＃39;

>>> re.split(r&＃39;[\&＃43;\-\*]&＃39;,s)

[&＃39;1&＃39;, &＃39;2&＃39;, &＃39;3&＃39;, &＃39;4&＃39;]

分组

有时在匹配的时候我们只想提取一些想要的信息或者对提取的信息作一个分类&＃xff0c;这时就需要对正则匹配模式进行分组&＃xff0c;只需要加上()即可。

示例&＃xff1a;

>>> m &＃61; re.match(&＃39;(\w{3})-(\d{3})&＃39;,&＃39;abc-123&＃39;)

>>> m.group() # 完整匹配

&＃39;abc-123&＃39;

>>> m.group(1) # 子组1

&＃39;abc&＃39;

>>> m.group(2) # 子组2

&＃39;123&＃39;

>>> m.groups() # 全部子组

(&＃39;abc&＃39;, &＃39;123&＃39;)

由以上的例子可以看出&＃xff0c;group()通常用于以普通方式显示所有的匹配部分&＃xff0c;但也能用于获取各个匹配的子组。可以使用groups()方法来获取一个包含所有匹配字符串的元组。

以上所述是小编给大家介绍的python模块之re正则表达式详解&＃xff0c;希望对大家有所帮助&＃xff0c;如果大家有任何疑问请给我留言&＃xff0c;小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持&＃xff01;

推荐阅读

string
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
join
python模块之正则

re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求，从一段字符串中找到符合要求的内容。在 ... [详细]

蜡笔小新 2024-11-14 15:52:38
string
java解析json转Map

java解析json转Map前段时间在做json报文处理的时候，写了一个针对不同格式json转map的处理工具方法，总结记录如下：1、单节点单层级、单节点多层级json转mapim ... [详细]

蜡笔小新 2024-11-15 18:21:27
string
Go语言中正则表达式的简易应用

本文介绍了Go语言中正则表达式的基本使用方法，并提供了一些实用的示例代码。 ... [详细]

蜡笔小新 2024-11-14 20:27:47
import
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
string
Java反射机制详解及应用场景

本文详细介绍了Java反射机制的基本概念、获取Class对象的方法、反射的主要功能及其在实际开发中的应用。通过具体示例，帮助读者更好地理解和使用Java反射。 ... [详细]

蜡笔小新 2024-11-13 16:08:08
import
如何将Python与Excel高效结合：常用操作技巧解析

本文深入探讨了如何将Python与Excel高效结合，涵盖了一系列实用的操作技巧。文章内容详尽，步骤清晰，注重细节处理，旨在帮助读者掌握Python与Excel之间的无缝对接方法，提升数据处理效率。 ... [详细]

蜡笔小新 2024-11-11 15:18:30
string
使用HTML和JavaScript实现视频截图功能

本文介绍了如何利用HTML和JavaScript实现从远程MP4、本地摄像头及本地上传的MP4文件中截取视频帧，并展示了具体的实现步骤和示例代码。 ... [详细]

蜡笔小新 2024-11-15 00:19:42
string
Android Studio SQLite 数据库增删改查简单（代码参考）

一个建表一个执行crud操作建表代码importandroid.content.Context;importandroid.database.sqlite.SQLiteDat ... [详细]

蜡笔小新 2024-11-14 11:01:49
import
Python 主成分分析（PCA）及其相关系数计算方法

本文详细介绍了如何使用 Python 进行主成分分析（PCA），包括数据导入、预处理、模型训练和结果可视化等步骤。通过具体的代码示例，帮助读者理解和应用 PCA 技术。 ... [详细]

蜡笔小新 2024-11-13 19:56:29
regex
开发笔记：JavaScript 正则表达式

本文记录了 JavaScript 中正则表达式的使用方法和常见操作，包括匹配、替换、搜索等。 ... [详细]

蜡笔小新 2024-11-12 11:48:21
string
检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0

检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]

蜡笔小新 2024-11-12 11:35:01
string
在 QQmlPropertyMap 的派生类中无法调用槽函数或 Q_INVOKABLE 方法？

在尝试对 QQmlPropertyMap 类进行测试驱动开发时，发现其派生类中无法正常调用槽函数或 Q_INVOKABLE 方法。这可能是由于 QQmlPropertyMap 的内部实现机制导致的，需要进一步研究以找到解决方案。 ... [详细]

蜡笔小新 2024-11-11 15:34:22
string
DVWA学习笔记系列：深入理解CSRF攻击机制

DVWA学习笔记系列：深入理解CSRF攻击机制 ... [详细]

蜡笔小新 2024-11-11 13:19:51
search
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39

哎呦我去2502859031

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章