热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

正则表达式与文本处理三剑客深入解析

本文深入解析了正则表达式及其在文本处理中的应用,详细介绍了常用的正则表达式模式,如`[0-9]`用于匹配任意一个数字字符,`[^0-9]`匹配任意一个非数字字符,`^[0-9]`表示以数字开头,`[a-z]`匹配任意一个小写字母,而`[a-zA-Z]`则匹配任意一个字母,并强调了正则表达式中大小写的区分。此外,文章还探讨了正则表达式在文本处理中的高级用法,包括模式匹配、字符串替换和数据提取等技术,为读者提供了丰富的实战案例和应用场景。

1.正则表达式

  [0-9]             任意一个数字字符

  [^0-9]           任意一个非数字,取非

  ^[0-9]           表示以数字开头   

  [a-z]              任意一个小写字母

  [a-zA-Z]        任意一个字母,正则表达式中区分大小写

    .                  表示任意一个字符

   *                   表示匹配*号前面的字符任意次,包含0次        

  .*                   表示任意个任意字符                   

  \+                   表示匹配+号前面的字符1次或多次,至少1次

                        技术分享图片

 \?                   表示匹配?号前面的字符0次或1次

{n}                    表示其前面字符出现的次数

\{n,m\}             表示匹配其前面的字符至少n次,最多m次

                       技术分享图片

 |                      表示匹配|号左面或右面

 2.  grep/egrep命令

   grep  [-cinvABC]  ‘word‘  filename1  filename1…..

  选项

 -c           count,统计匹配的行数

 -n           number,匹配的行显示在原文件中的行号

 -v            取反,显示不匹配的行

 -r            递归遍历子目录下的所有文件

 -A     过滤显示出匹配行的上面的n行,不包括匹配行

 -B     过滤显示出匹配行的下面的n行,不包括匹配行

 -C     context(上下文),过滤出匹配行的上面和下面n行,不包括匹配行

      技术分享图片

注意:grep  -E   等价于  egrep

3. sed命令

 1)选项

   -n                    取消默认输出,仅输出匹配的行

   -r                     类似grep的-E选项,特殊符号不需要脱义

           

   -i                     sed命令处理文件,仅输出处理的结果,文件的内容不会更改保存;

                  -i选项,文件的内容会更改保存。

   -e                    多次处理匹配行

                            技术分享图片

 2)打印输出匹配行,类似grep,但匹配的关健字不带颜色显示

      技术分享图片

 

 3)打印指定行

  1)sed  -n  ‘2’p   file               打印第2行

  2)sed  -n  ‘2,5’p  file              打印第2到第5行

       sed  -n  ‘2,$’p  file              打印第2到最后(尾)行

       sed  -n  ‘1,$’p  file              打印所有行

 4)查找替换字符

    针对字符

        技术分享图片

   针对正则表达式

      技术分享图片

 5)删除某些字符,即把某些字符替换成空

    技术分享图片

  6)在行首新增字符

   技术分享图片

  7)引用()内的内容;贪婪匹配

   test.txt的内容,把第一个冒号前的内容和最后一个冒号后的内容调换

     技术分享图片

 


推荐阅读
  • Python自动化测试入门:Selenium环境搭建
    本文详细介绍如何在Python环境中安装和配置Selenium,包括开发工具PyCharm的安装、Python环境的设置以及Selenium包的安装方法。此外,还提供了编写和运行第一个自动化测试脚本的步骤。 ... [详细]
  • 通常情况下,修改my.cnf配置文件后需要重启MySQL服务才能使新参数生效。然而,通过特定命令可以在不重启服务的情况下实现配置的即时更新。本文将详细介绍如何在线调整MySQL配置,并验证其有效性。 ... [详细]
  • Appium + Java 自动化测试中处理页面空白区域点击问题
    在进行移动应用自动化测试时,有时会遇到某些页面没有返回按钮,只能通过点击空白区域返回的情况。本文将探讨如何在Appium + Java环境中有效解决此类问题,并提供详细的解决方案。 ... [详细]
  • 如何清除Chrome浏览器地址栏的特定历史记录
    在使用Chrome浏览器时,你可能会发现地址栏保存了大量浏览记录。有时你可能希望删除某些特定的历史记录而不影响其他数据。本文将详细介绍如何单独删除地址栏中的特定记录以及批量清除所有历史记录的方法。 ... [详细]
  • 利用Selenium与ChromeDriver实现豆瓣网页全屏截图
    本文介绍了一种使用Selenium和ChromeDriver结合Python代码,轻松实现对豆瓣网站进行完整页面截图的方法。该方法不仅简单易行,而且解决了新版Selenium不再支持PhantomJS的问题。 ... [详细]
  • 嵌入式开发环境搭建与文件传输指南
    本文详细介绍了如何为嵌入式应用开发搭建必要的软硬件环境,并提供了通过串口和网线两种方式将文件传输到开发板的具体步骤。适合Linux开发初学者参考。 ... [详细]
  • 解决TensorFlow CPU版本安装中的依赖问题
    本文记录了在安装CPU版本的TensorFlow过程中遇到的依赖问题及解决方案,特别是numpy版本不匹配和动态链接库(DLL)错误。通过详细的步骤说明和专业建议,帮助读者顺利安装并使用TensorFlow。 ... [详细]
  • 探索新一代API文档工具,告别Swagger的繁琐
    对于后端开发者而言,编写和维护API文档既繁琐又不可或缺。本文将介绍一款全新的API文档工具,帮助团队更高效地协作,简化API文档生成流程。 ... [详细]
  • 本文探讨了在构建应用程序时,如何对不同类型的数据进行结构化设计。主要分为三类:全局配置、用户个人设置和用户关系链。每种类型的数据都有其独特的用途和应用场景,合理规划这些数据结构有助于提升用户体验和系统的可维护性。 ... [详细]
  • 气象对比分析
    本文探讨了不同地区和时间段的天气模式,通过详细的图表和数据分析,揭示了气候变化的趋势及其对环境和社会的影响。 ... [详细]
  • 深入理解ExtJS:从入门到精通
    本文详细介绍了ExtJS的功能及其在大型企业前端开发中的应用。通过实例和详细的文件结构解析,帮助初学者快速掌握ExtJS的核心概念,并提供实用技巧和最佳实践。 ... [详细]
  • 本文详细介绍如何在 iOS 7 环境下申请苹果开发者账号,涵盖从访问开发者网站到最终激活账号的完整流程。包括选择个人或企业账号类型、付款方式及注意事项等。 ... [详细]
  • 本文介绍了如何通过Java代码计算一个整数的位数,并展示了多个基础编程示例,包括求和、平均分计算、条件判断等。 ... [详细]
  • 本题要求在一组数中反复取出两个数相加,并将结果放回数组中,最终求出最小的总加法代价。这是一个经典的哈夫曼编码问题,利用贪心算法可以有效地解决。 ... [详细]
  • 本篇文章介绍如何将两个分别表示整数的链表进行相加,并生成一个新的链表。每个链表节点包含0到9的数值,如9-3-7和6-3相加得到1-0-0-0。通过反向处理链表、逐位相加并处理进位,最终再将结果链表反向,即可完成计算。 ... [详细]
author-avatar
zhangiloveyou
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有