当前位置:  开发笔记 > 编程语言 > 正文

PHP、Python相关正则函数一点实例

当我们在做字符串处理时,如果字符串处理函数不能实现我们想要的时,我们就借助正则来帮助我们实现了。一般使用正则的情况有:匹配、查找、分割、查找并替换,下面我们就将这几种情况分别用PHP和Python语言来实现...">

当我们在做字符串处理时,如果字符串处理函数不能实现我们想要的时,我们就借助正则来帮助我们实现了。

一般使用正则的情况有:匹配、查找、分割、查找并替换,下面我们就将这几种情况分别用PHP和Python语言来实现,并做一下对比。
PHP正则采用:PCRE风格。

#1 匹配Math(并获取出结果)(注意这里是要获取出匹配结果的,与不获取结果有所不同)

 
Python:
		

#coding:utf-8 import re strs = '我爱P你y你t知h吗o?n哈哈fe哈' patt = re.compile(r'^.*?(\w+).*?$',re.I) print patt.match(strs).group(1) #输出 P

说明match的作用是一个匹配的过程,不是查找。这个方法并不是完全匹配,想要完全匹配,可以在表达式末尾加上边界匹配符'$'。
 
PHP:
		

php $strs = '我爱P你y你t知h吗o?n哈哈fe哈'; preg_match('/^.*?(\w+).*?$/i',$strs,$m); var_dump($m[1]);

#输出:string 'P' (length=1)

 

说明:preg_match()与python中的match一样,在第一次匹配后 将会停止搜索。而preg_match_all()不同于此, 它会一直搜索subject 直到到达结尾。
实际上,在PHP中正则表达式还可以这样:
		

preg_match('/(\w+)/',$strs,$m);

#2 搜索查找Search
 
Python:
		

patt = re.compile(r'(\w+)',re.I) print patt.search(strs).group(1) #输出 P

说明search方法一样,若查找到了就立即返回,否则一直搜索到字符串末尾,在PHP中可以使用preg_match(_all) 来实现。
 
PHP:
同上
 
#3 匹配分割
 
Python:
		

patt = re.compile(r'\w+',re.I) for i in patt.split(strs): #注意这里要使用unicode对象输出 print unicode(i,'utf-8') #以上输出 ''' 我爱 哈哈 哈'''

在PHP中可以使用preg_split()来实现
 
PHP:
		

php $strs = '我爱P你y你t知h吗o?n哈哈fe哈'; $m = preg_split('/\w+/i',$strs); var_dump($m);

/**输出:

 

		array
  0 => string '我爱' (length=6)
  1 => string '你' (length=3)
  2 => string '你' (length=3)
  3 => string '知' (length=3)
  4 => string '吗' (length=3)
  5 => string '?' (length=3)
  6 => string '哈哈' (length=6)
  7 => string '哈' (length=3)

 

**/

 
#4 搜索查找所有结果(ALL)
 
Python:
		

print patt.findall(strs) #输出 ['P', 'y', 't', 'h', 'o', 'n', 'fe']

在PHP中可使用preg_match_all() 来实现
PHP:
			

php $strs = '我爱P你y你t知h吗o?n哈哈fe哈'; preg_match_all('/(\w+)/i',$strs,$m); var_dump($m);

/**

 

			array
  0 => 
    array
      0 => string 'P' (length=1)
      1 => string 'y' (length=1)
      2 => string 't' (length=1)
      3 => string 'h' (length=1)
      4 => string 'o' (length=1)
      5 => string 'n' (length=1)
      6 => string 'fe' (length=2)
  1 => 
    array
      0 => string 'P' (length=1)
      1 => string 'y' (length=1)
      2 => string 't' (length=1)
      3 => string 'h' (length=1)
      4 => string 'o' (length=1)
      5 => string 'n' (length=1)
      6 => string 'fe' (length=2)

 

**/

#5 查找替换
 实际上finditer()方法在python中不是查找替换,它仅是返回一个顺序访问每一个匹配结果(Match对象)的迭代器
python:
		

for i in patt.finditer(strs): print i.group() #以上输出 ''' P y t h o n fe '''

这和PHP中的preg_filter()有所不同,preg_filter()与preg_replace()都是执行一个正则表达式的搜索和替换。在python中正则方法中,用于查找替换的是:sub()与subn()。
需要注意的是sub()返回的一个新字符串,不是作用在原对象上。
subn()返回的是一个以“新字符串和替换的次数”组成的元组,也没有作用到原对象上。
		

#替换三次 print patt.sub('99',strs,3) #输出 '我爱99你99你99知h吗o?n哈哈fe哈'

 

print patt.subn('99',strs) #输出:是一个元组('我爱99你99你99知99吗99?99哈哈99哈',7)

替换与引用
			

#这里批量替换文章中的图片的路径(old_c 是文章的内容)

img_dir = 'test'

img_patt = re.compile('src=".*?/(\w+\.\w+)"')

new_c = img_patt.sub(r'src="./%s/\1"'%img_dir,old_c)

 
 
 
PHP:
		

 

		

#这里批量替换文章中的图片的路径(old_c 是文章的内容)

img_dir = 'test' img_patt = re.compile('src=".*?/(\w+\.\w+)"') new_c = img_patt.sub(r'src="./%s/\1"'%img_dir,old_c)

 

#输出:

		string '我爱999你999你999知999吗999?999哈哈999哈' (length=51)
另注   1 对于正则的基础知识可以GOOGLE一下,Python正则的基础知识也可以GOOGLE一下。
          2 对于更多关于PHP PCRE风格的正则基础,可以参看:http://cn2.php.net/manual/zh/regexp.introduction.php
          3 另外有一点需要注意的是:对于处理字符串能用字符串函数处理的就用函数处理,千万别用正则。
 
PHP、Python 相关正则函数实例 - fc_lamp - @fc_lamp

 

 

 


推荐阅读
  • 如何使用Python高效绘制矩形图形
    本文详细介绍了如何利用Python的Turtle库高效绘制矩形图形,适合初学者快速上手。通过具体示例代码,帮助读者理解Turtle库的基本绘图方法和技巧,同时探讨了在不同应用场景中绘制矩形的实际操作,为后续复杂图形的绘制打下坚实基础。 ... [详细]
  • 本文首先对信息漏洞的基础知识进行了概述,重点介绍了几种常见的信息泄露途径。具体包括目录遍历、PHPINFO信息泄露以及备份文件的不当下载。其中,备份文件下载涉及网站源代码、`.bak`文件、Vim缓存文件和`DS_Store`文件等。目录遍历漏洞的详细分析为后续深入研究奠定了基础。 ... [详细]
  • Python学习:环境配置与安装指南
    Python作为一种跨平台的编程语言,适用于Windows、Linux和macOS等多种操作系统。为了确保本地已成功安装Python,用户可以通过终端或命令行界面输入`python`或`python3`命令进行验证。此外,建议使用虚拟环境管理工具如`venv`或`conda`,以便更好地隔离不同项目依赖,提高开发效率。 ... [详细]
  • Python数学模块详解与应用 ... [详细]
  • 本文介绍了如何利用Python的`os.path`模块来获取当前脚本文件的绝对路径,实现对文件位置的精准定位。通过示例代码展示了在复杂目录结构下(如 `C:\Users\songlihui\PycharmProjects\test001keshanchu\test\test1\test2\test3\test`)中准确获取文件路径的方法,帮助开发者在实际项目中更高效地管理文件资源。 ... [详细]
  • 开发心得:深入探讨Servlet、Dubbo与MyBatis中的责任链模式应用
    开发心得:深入探讨Servlet、Dubbo与MyBatis中的责任链模式应用 ... [详细]
  • 在长度为 n 的数组 `nums` 中,所有元素均位于 0 到 n-1 的范围内。该数组中存在一些重复的数字,但具体哪些数字重复以及重复次数未知。本文通过 Python 编程实战,详细探讨如何高效地识别并找出这些重复的数字,提供了一种简洁且高效的解决方案。 ... [详细]
  • Python 中使用 Numpy 实现高效对数加法运算函数 `logaddexp()` 的详解与应用 ... [详细]
  • Python作为当今IT领域中最受欢迎且高效的语言之一,其框架能够显著加速Web应用程序的开发过程。本文推荐并对比了十大顶级Python Web开发框架,其中CubicWeb以其卓越的代码重用性和模块化设计脱颖而出,为开发者提供了强大的支持。 ... [详细]
  • 如何利用Python脚本实现钉钉自动化考勤打卡
    本文详细探讨了利用Python脚本实现钉钉自动化考勤打卡的方法。通过具体实例操作,解决了很多用户在实际应用中遇到的难题,帮助读者高效掌握这一实用技能。 ... [详细]
  • 本文介绍了使用 Python 编程语言高效抓取微博文本和动态网页图像数据的方法。通过详细的示例代码,展示了如何利用爬虫技术获取微博内容和动态图片,为数据采集和分析提供了实用的技术支持。对于对网络数据抓取感兴趣的读者,本文具有较高的参考价值。 ... [详细]
  • 对于Python初学者而言,掌握类的概念及其应用场景是至关重要的。本文详细探讨了类的定义、功能及其实用价值。类作为一种抽象的数据结构,能够有效地模拟现实世界中的对象,通过封装属性和方法,实现代码的复用性和模块化设计。文章结合实例分析,帮助读者深入理解何时以及为何需要定义类,从而提升编程效率和代码质量。 ... [详细]
  • 深入解析Python中的循环双向链表数据结构
    本文详细探讨了Python中循环双向链表的数据结构,包括其定义、特点及应用场景。文章首先介绍了循环双向链表的基本概念,随后深入分析了其核心操作,如节点的插入、删除和遍历等。最后,通过具体的Python代码示例,展示了如何高效地实现这些操作,帮助读者全面理解并掌握这一重要数据结构。 ... [详细]
  • Python – 遍历日期序列的高效方法与技巧 ... [详细]
  • 工厂方法模式详解:莫勇鹏老师的深入解析与应用实例
    2019年,独角兽企业高薪招聘Python工程师时特别关注工厂方法模式(Factory Method Pattern)。该模式通过定义一个创建对象的接口,让子类决定实例化哪一个类。莫勇鹏老师深入解析了这一设计模式,并提供了丰富的应用实例,帮助开发者更好地理解和运用工厂方法模式,提升软件设计的灵活性和可扩展性。 ... [详细]
author-avatar
小艾6456
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有