热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python的re模块是自带的吗_Python正则re模块使用步骤及原理解析

python中使用正则表达式的步骤:1.导入re模块:importre2.初始化一个Regex对象:re.compile()3.刚刚创建的

python中使用正则表达式的步骤:

1.导入re模块:import re

2.初始化一个Regex对象:re.compile()

3.刚刚创建的Regex对象调用search方法进行匹配,返回要给March对象

4.刚刚的March对象调用group方法,展示匹配到的字符串

下面例子的知识点:

对正则表达式分组用:(),正则里的分组计数从1开始,不是从0,切记~~

group(数字):去对应的分组的值

groups():返回所有分组的元组形式

\d表示一个数字

regex_obj = re.compile(r'(\d\d\d)-(\d\d\d)-(\d\d\d\d)')

match_obj = regex_obj.search('我司电话:035-411-1234')

result1 = match_obj.group(1)

result2 = match_obj.group(2)

result3 = match_obj.group(3)

print(result1)

print(result2)

print(result3)

result4 = match_obj.group()

print(result4)

result5 = match_obj.groups()

print(result5)

执行结果:

035

411

1234

035-411-1234

('035', '411', '1234')

补充知识点:\w表示一个单词,\s表示一个空格

regex_obj = re.compile(r'(\d\w\d)-(\d\d\d)-(\d\d\d\d)')

match_obj = regex_obj.search('我司电话:0a5-411-1234')

result = match_obj.group(1)

print(result)

regex_obj = re.compile(r'(\d\w\d)-(\d\d\d)-(\d\d\d\d)')

match_obj = regex_obj.search('我司电话:0哈5-411-1234')

result = match_obj.group(1)

print(result)

regex_obj = re.compile(r'(\d\s\d)-(\d\d\d)-(\d\d\d\d)')

match_obj = regex_obj.search('我司电话:0 5-411-1234')

result = match_obj.group(1)

print(result)

执行结果:

0a5

0哈5

0 5

| 或:

regex_obj = re.compile(r'200|ok|successfully')

match_obj1 = regex_obj.search('vom get request and stored successfully')

result1 = match_obj1.group()

print(result1)

match_obj2 = regex_obj.search('vom get request,response 200 ok')

result2 = match_obj2.group()

print(result2)

match_obj3 = regex_obj.search('vom get request,response ok 200')

result3 = match_obj3.group()

print(result3)

执行结果:

successfully

200

ok

注意:如果search返回的March对象只有一个结果值的话,不能用groups,只能用group

regex_obj = re.compile(r'200|ok|successfully')

match_obj1 = regex_obj.search('vom get request and stored successfully')

result2 = match_obj1.groups()

print(result2)

result1 = match_obj1.group()

print(result1)

执行结果:

()

successfully

? :可选匹配项

+ :1次 或 n次 匹配

* :*前面的字符或者字符串匹配 0次、n次

注意:*前面必须要有内容

regex_obj = re.compile(r'(haha)*,welcome to vom_admin system') 指haha这个字符串匹配0次或者多次

regex_obj = re.compile(r'(ha*),welcome to vom_admin system') 指ha这个字符串匹配0次或者多次

. : 通配符,匹配任意一个字符

所以常常用的组合是:.*

regex_obj = re.compile(r'(.*),welcome to vom_admin system')

match_obj1 = regex_obj.search('Peter,welcome to vom_admin system')

name = match_obj1.group(1)

print(name)

执行结果:

Peter

{} : 匹配特定的次数

里面只写一个数字:匹配等于数字的次数

里面写{3,5}这样两个数字的,匹配3次 或 4次 或 5次,按贪心匹配法,能满足5次的就输出5次的,没有5次就4次,4次也没有才是3次

regex_obj = re.compile(r'((ha){3}),this is very funny')

match_obj1 = regex_obj.search('hahahaha,this is very funny')

print("{3}结果",match_obj1.group(1))

regex_obj = re.compile(r'((ha){3,5}),this is very funny')

match_obj1 = regex_obj.search('hahahaha,this is very funny')

print("{3,5}结果",match_obj1.group(1))

执行结果:

{3}结果 hahaha

{3,5}结果 hahahaha

findall():返回所有匹配到的字串的列表

regex_obj = re.compile(r'\d\d\d')

match_obj = regex_obj.findall('我是101班的,小李是103班的')

print(match_obj)

regex_obj = re.compile(r'(\d\d\d)-(\d\d\d)-(\d\d\d\d)')

match_obj = regex_obj.findall('我家电话是123-123-1234,我公司电话是890-890-7890')

print(match_obj)

打印结果:

['101', '103']

[('123', '123', '1234'), ('890', '890', '7890')]

[]:创建自己的字符集:

[abc]:包括[]内的字符

[^abc]:不包括[]内的所有字符

也可以使用:[a-zA-Z0-9]这样简写

regex_obj = re.compile(r'[!@#$%^&*()]')

name = input("请输入昵称,不含特殊字符:")

match_obj = regex_obj.search(name)

if match_obj:

print("昵称输入不合法,包含了特殊字符:", match_obj.group())

else:

print("昵称有效")

执行结果:

请输入昵称,不含特殊字符:*h

昵称输入不合法,包含了特殊字符: *

^:开头

$:结尾

regex_obj = re.compile(r'(^[A-Z])(.*)')

name = input("请输入昵称,开头必须大写字母:")

match_obj = regex_obj.search(name)

print(match_obj.group())

执行结果:

请输入昵称,开头必须大写字母:A1234

A1234

sub():第一个参数为要替换成的,第二个参数传被替换的,返回替换成功后的字符串

regex_obj = re.compile(r'[!@#$%^&*()]')

match_obj = regex_obj.sub('嘿','haha,$%^,hahah')

print(match_obj)

执行结果:

haha,嘿嘿嘿,hahah

补充一下正则表达式的表,正则太复杂了,要常看常用才能熟练

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。



推荐阅读
  • PHP 过滤器详解
    本文深入探讨了 PHP 中的过滤器机制,包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时,详细介绍了各种过滤器的用途和用法。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • Ihaveastringwithquotesaroundthepathasfollows:我在路径周围有一个带引号的字符串,如下所示:C:\ProgramFiles(x ... [详细]
  • 实用正则表达式有哪些
    小编给大家分享一下实用正则表达式有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下 ... [详细]
  • 本文介绍如何从字符串中移除大写、小写、特殊、数字和非数字字符,并提供了多种编程语言的实现示例。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 使用Pandas高效读取SQL脚本中的数据
    本文详细介绍了如何利用Pandas直接读取和解析SQL脚本,提供了一种高效的数据处理方法。该方法适用于各种数据库导出的SQL脚本,并且能够显著提升数据导入的速度和效率。 ... [详细]
  • 本文由杨勇和思远于2012年12月27日撰写,主要探讨了如何使用PHP进行网页内容抓取,特别是针对字符较多的网站。文章详细介绍了正则表达式失效的原因,并提供了优化方法,同时展示了如何抓取淘宝服饰栏、天气信息以及IP地址对应的地理位置。 ... [详细]
  • 利用决策树预测NBA比赛胜负的Python数据挖掘实践
    本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据,结合《Python数据挖掘入门与实践》一书中的方法,展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]
  • 本文探讨了为何相同的HTTP请求在两台不同操作系统(Windows与Ubuntu)的机器上会分别返回200 OK和429 Too Many Requests的状态码。我们将分析代码、环境差异及可能的影响因素。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 深入理解Tornado模板系统
    本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块,支持嵌入Python代码片段,帮助开发者快速构建动态网页。 ... [详细]
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • 前言--页数多了以后需要指定到某一页(只做了功能,样式没有细调)html ... [详细]
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
author-avatar
zJv老方有点坑爹额B
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有