热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PHP正则表达式实例

这个条件语句来判断开始的标记跟闭合的标记是否相等,不相等就说明没闭合。最后用in_array($start_tags[1][$i],

1 使用正则表达式来检测HTML 是否关闭
代码片段
 

PHP代码
  1. function check_html($html) {   
  2. preg_match_all("/<([a-zA-Z0-9]+)\\s*[^\\/>]*>/",$html,$start_tags);   
  3. preg_match_all("/<\\/([a-zA-Z0-9]+)>/", $html, $end_tags);   
  4. if(count($start_tags[1]) != count($end_tags[1])) return false;   
  5. for($i = 0; $i < count($start_tags[1]); $i++) {   
  6. if(!in_array($start_tags[1][$i], $end_tags[1])) return false;   
  7. }   
  8. return true;   
  9. }   

解释:
/<([a-zA-Z0-9]+)\\s*[^\\/>]*>/这个模式是用来匹配HTML 的标记(如:、

等等,但是除了
这种)的,并且在$start_tags 保持着标签
的名字(如:head、div 等)。而/<\\/([a-zA-Z0-9]+)>/这个模式是用来匹配闭合的HTML
标记(如:,
等)的。并且在$end_tags 中保持这闭合的标签名。然后我们用
count($start_tags[1]) != count($end_tags[1])这个条件语句来判断开始的标记跟闭合的
标记是否相等,不相等就说明没闭合。最后用in_array($start_tags[1][$i], $end_tags[1])
来判断开始标跟闭合的标记是否相等。至此,我们就完成了HTML 的匹配了!
2 匹配E-mail 格式
代码片段
 

PHP代码
  1. function check_email($email) {   
  2. if(preg_match("/^[\w\d!#$%&'*+-\/=?^`{|}~]+(\.[\w\d!#$%&'*+-\/=?^`{|}~]+)*@([a-z\d][-a-z\  
  3. d]*[a-z\d]\.)+[a-z][-a-z\d]*[a-z]$/", $eamil)) return true;   
  4. return false;   
  5. }   

解释:
不要被
/^[\w\d!#$%&'*+-\/=?^`{|}~]+(\.[\w\d!#$%&'*+-\/=?^`{|}~]+)*@([a-z\d][-a-z\d]*[az\
d]\.)+[a-z][-a-z\d]*[a-z]$/
这条模式给吓跑了, 其实也很简单的。前部分
[\w\d!#$%&'*+-\/=?^`{|}~]+(\.[\w\d!#$%&'*+-\/=?^`{|}~]+)*只是匹配符合RFC-2882 标
准的E-mail 地址允许出现的字符,就是英文字母,数字跟一些符号,有兴趣可以查询
RFC-2882 手册,而([a-z\d][-a-z\d]*[a-z\d]\.)+就是匹配HOST 的。最后[a-z][-a-z\d]*[a-z]
就是匹配顶级域名的(如:.com、.org)。
3 非贪心模式
有时候使用正则表达式的时候,你会发现有以下的问题:
代码片段
 

PHP代码
  1. preg_match('/".*"/', 'Tony say:"hello", Jack say: "Hi"', $matches);   
  2. print_r($matches);  


很惊奇的你会发现匹配的是这样的内容"hello", Jack say: "Hi",而不是"hello"和
"Hi"。这就是贪心匹配引起的。在贪心匹配中,正则表达式会尽可能的匹配最多的字
符,所以出现了第一种情况,但是我们想要的是第二种情况,那我们要怎么做呢?
我们可以使用非贪心匹配,将刚才的模式改为/".*?"/这样就可以看见我们想要的
结果了。*?这个就是非贪心匹配模式。还有另外一种就是+?。
? *?:前面的字符可以出现任意多次,但是遇到*?后的一个字符即停止匹配。
? +?:前面的字符可以出现一次或者多次,但是遇到+?后的一个字符即停止匹
配。
4 检测一个用户密码是否安全
代码片段
 

PHP代码
  1. function is_good_pw($pw) {   
  2. if(preg_match('/(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]).{8,16}/', $pw)) {   
  3. return true;   
  4. }   
  5. return false;   
  6. }  


解释:
在本例中,我们使用了/(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]).{8,16}/模式来匹配我们的
密码。在这个模式中,我们使用了正则表达式中的前瞻模式(?=)。(?=.*[0-9])这个是匹
配密码中有数字,而(?=.*[a-z])是匹配密码中有小写字母,最后(?=.*[A-Z])就是匹配密
码中有大写字母。而.{8,16}这个就是匹配密码是由8 至16 个字符组成的。那么我们
的密码就需要有数字,大写字母和小写字母组成的就属于安全的密码了~
5 匹配一个网站中的所有链接
代码片段
 

PHP代码
  1. function get_links($link) {   
  2. $html = file_get_contents($link);   
  3. $html = str_replace("\n", "", $html);   
  4. $html = preg_replace('/
  5. $html = preg_replace('/<\/a>/', "\n", $html);   
  6. preg_match_all('/.*?<\/a>/', $html, $matches);   
  7. return($matches);   
  8. }  


在这个例子中,我们想用file_get_contents 来取得一个网页的内容。然后用
str_replace("\n", "", $html)把所有的换行去掉。再用preg_replace('/ preg_replace('/<\/a>/', "\n", $html)来把所有的.....模式另起一行。
最后就用preg_match_all('/.*?<\/a>/', $html, $matches) 匹配链接模式。
/.*?<\/a>/就是匹配.....这种模式的正则表达式。那我们为什
么要把.....链接另起一行呢??因为在/.*?<\/a>/模式中,.*
是不能匹配换行的,所以就如不在同一行就不能匹配了!!所以我们要这样
做!



推荐阅读
  • Docker的安全基准
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • 深入理解OAuth认证机制
    本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准,旨在为第三方应用提供安全的用户资源访问授权,同时确保用户的账户信息(如用户名和密码)不会暴露给第三方。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 在计算机技术的学习道路上,51CTO学院以其专业性和专注度给我留下了深刻印象。从2012年接触计算机到2014年开始系统学习网络技术和安全领域,51CTO学院始终是我信赖的学习平台。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 使用Numpy实现无外部库依赖的双线性插值图像缩放
    本文介绍如何仅使用Numpy库,通过双线性插值方法实现图像的高效缩放,避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理,并提供了完整的代码示例。 ... [详细]
  • QUIC协议:快速UDP互联网连接
    QUIC(Quick UDP Internet Connections)是谷歌开发的一种旨在提高网络性能和安全性的传输层协议。它基于UDP,并结合了TLS级别的安全性,提供了更高效、更可靠的互联网通信方式。 ... [详细]
  • 程序员妻子吐槽:丈夫北漂8年终薪3万,存款情况令人意外
    一位程序员的妻子在网上分享了她丈夫在北京工作八年的经历,月薪仅3万元,存款情况却出乎意料。本文探讨了高学历人才在大城市的职场现状及生活压力。 ... [详细]
  • Valve 发布 Steam Deck 的新版 Windows 驱动程序
    Valve 最新发布了针对 Steam Deck 掌机的 Windows 驱动程序,旨在提升其在 Windows 环境下的兼容性、安全性和性能表现。 ... [详细]
  • CSS 布局:液态三栏混合宽度布局
    本文介绍了如何使用 CSS 实现液态的三栏布局,其中各栏具有不同的宽度设置。通过调整容器和内容区域的属性,可以实现灵活且响应式的网页设计。 ... [详细]
  • Linux 系统启动故障排除指南:MBR 和 GRUB 问题
    本文详细介绍了 Linux 系统启动过程中常见的 MBR 扇区和 GRUB 引导程序故障及其解决方案,涵盖从备份、模拟故障到恢复的具体步骤。 ... [详细]
  • This guide provides a comprehensive step-by-step approach to successfully installing the MongoDB PHP driver on XAMPP for macOS, ensuring a smooth and efficient setup process. ... [详细]
  • 本文总结了汇编语言中第五至第八章的关键知识点,涵盖间接寻址、指令格式、安全编程空间、逻辑运算指令及数据重复定义等内容。通过详细解析这些内容,帮助读者更好地理解和应用汇编语言的高级特性。 ... [详细]
  • 探讨如何高效使用FastJSON进行JSON数据解析,特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]
  • 本文介绍了如何使用jQuery根据元素的类型(如复选框)和标签名(如段落)来获取DOM对象。这有助于更高效地操作网页中的特定元素。 ... [详细]
author-avatar
姚威阳_489
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有