热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

我们一起来学Shell–正则表达式

 文章目录什么是正则表达式正则表达式元字符正则表达式应用举例POSIX方括号表达式POSIX字符集列表:我们一起来学Shell-初识shell我们一起来学Shell-sh

 


文章目录





    • 什么是正则表达式

    • 正则表达式元字符



      • 正则表达式应用举例



        • POSIX 方括号表达式





    • POSIX 字符集列表:





我们一起来学Shell - 初识shell




我们一起来学Shell - shell的变量




我们一起来学Shell - shell的条件判断




我们一起来学Shell - shell的循环控制




我们一起来学Shell - shell的数组




我们一起来学Shell - shell的函数




我们一起来学Shell - shell的并发及并发控制




我们一起来学Shell - 正则表达式

 


什么是正则表达式



  • 正则表达式(Regular Expression,通常简称为 regex 或 RE)是一种字符表达方式,可以用它来查找匹配特定准则的文本。在许多编程语言中都有用到正则表达式,常用它来实现一些复杂的匹配。



  • 正则表达式是对字符串进行操作的一种逻辑公式,即用事先定义好的的一些特定字符以及这些特定字符的组合,组成一个有一定规则的字符串(Regular Expression),使用这个有一定规则的字符串来表达对字符串的一种过滤逻辑。正则表达式被广泛应用于Linux和许多其他编程语言中,而且不论在哪里,其基本原理都是一样的。



  • 正则表达式是由两个基本组成部分所建立:一般字符特殊字符一般字符是指没有任何特殊意义的字符特殊字符,常称为元字符 (metacharacter),或 meta 字符,正则表达式将匹配被查找行中任何位置出现的相同模式。在正则表达式中,元字符是最重要的概念。在某些情况下,特殊字符也可被视为一般字符(使用转义符 \ 进行转义)



  • POSIX 有两种风格的正则表达式,基本正则表达式(BRE)扩展正则表达式(ERE)。这两种风格的正则表达式在一些字符含义上有细微的差距。以常用的 grep 指令来说,grep 指令默认支持的是 BRE若要使用 ERE 进行匹配,可以使用 -E 选项




正则表达式元字符

































































































字符BRE/ERE含义
.BRE&ERE匹配任意单个字符(除字符串结束符 NUL)
^BRE&ERE匹配行首,如 ^abc,匹配以 abc 开头的字符串
$BRE&ERE匹配行尾,如 abc$,匹配以 abc 结尾的字符串
*BRE&ERE匹配 0 个或任意多的单个字符,前置字符可以是正则表达式
+ERE匹配前面正则表达式的 1 个或多个实例
ERE匹配前面正则表达式的 0 个或 1 个实例
[...]BRE&ERE方括号表达式,匹配方括号内的任一字符,常配合 - 符使用,表示匹配一个连续的范围。 ^ 字符作为方括号内的第一个字符表示匹配不在方括号内的任意字符
-BRE&ERE连字符,在方括号表达式中使用,表示连续字符的范围(范围会因 locale 而有所不同,因此不具可移植性)
{n,m}ERE区间表达式,表示匹配在它前面的字符 n 到 m次。其中,n 与 m 的值必须介于 0-RE_DUM _MAX(含)之间,后者最小值为255
{n}ERE表示匹配在这之前的字符 n 次
\{n,m\}BRE功能同 {n,m}
\{n\}BRE功能同{n}
\BRE&ERE转义符
()ERE匹配位于方括号括起来的正则表达式群
\( \)BRE将( 与 )\ 之间的模式保存在特殊的“保留空间”中,最多可以存储9个,可以通过后续的转义序列 \n 来匹配保留空间中的模式
\nBRE与 ( ) 结合起来使用,\1匹配第一个子模式、 \2匹配第二个,最多到 \9
\|ERE匹配位于 | 符号前或后的正则表达式

正则表达式应用举例











































字符用处
.*所有字符
^[^]非字符组内的字符开头的行
[a-z]小写字母
[A-Z]大写字母
[a-Z]小写和大写字母
[0-9]数字
\<单词头 单词一般以空格或特殊字符做分隔,连续的字符串被当做单词
\>单词尾

POSIX 方括号表达式



  • 为了配合非英语的环境,POSIX 标准强化其字符集范围的能力 (如 [a-z]),以匹配非英文字母字符。POSIX 使用方括号表达式 […] 来表示一个范围值,在方括号表达式里,除了字面上的字符外(a、b、c等),另有额外的组成部分,包括:



  1. 字符集:以 [: ... :] 将关键字组合括起来的 POSIX 字符集,关键字描述各种不同的字符集;



  2. 排序符号:排序符号将多个字符序列视为一个单位(如,locale 中将 ch 这两个字符视为一个单位),它使用 [..] 将字符组合括起来,在系统所使用的特定 locale 上各有其定义;



  3. 等价字符集:等价字符集列出的是应视为等值的一组字符,它由取自于 locale 的名字元素组成,以 [==] 括住。




POSIX 字符集列表:



























































类别匹配字符
[:alnum:]数字字符
[:alpha:]字母字符
[:blank:]空格与定位符
[:cntrl:]控制字符
[:digit:]数字字符
[:graph:]非空格字符
[:lower:]小写字母字符
[:upper:]大写字母字符
[:space:]空白符
[:print:]可显示的字符
[:punct:]标点符号字符
[:xdigit:]十六进制数字

 



推荐阅读
  • 本文深入探讨了MySQL中常见的面试问题,包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析,帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]
  • 本文详细介绍了如何在PHP中进行数组删除、清空等操作,并提供了在Visual Studio Code中创建PHP文件的步骤。 ... [详细]
  • 本文介绍如何从JSON格式的文件中提取数据并将其分配给Bash脚本中的变量。我们将探讨具体的命令和工具,帮助你高效地完成这一任务。 ... [详细]
  • 历经三十年的开发,Mathematica 已成为技术计算领域的标杆,为全球的技术创新者、教育工作者、学生及其他用户提供了一个领先的计算平台。最新版本 Mathematica 12.3.1 增加了多项核心语言、数学计算、可视化和图形处理的新功能。 ... [详细]
  • 深入解析Java虚拟机(JVM)架构与原理
    本文旨在为读者提供对Java虚拟机(JVM)的全面理解,涵盖其主要组成部分、工作原理及其在不同平台上的实现。通过详细探讨JVM的结构和内部机制,帮助开发者更好地掌握Java编程的核心技术。 ... [详细]
  • 在高并发需求的C++项目中,我们最初选择了JsonCpp进行JSON解析和序列化。然而,在处理大数据量时,JsonCpp频繁抛出异常,尤其是在多线程环境下问题更为突出。通过分析发现,旧版本的JsonCpp存在多线程安全性和性能瓶颈。经过评估,我们最终选择了RapidJSON作为替代方案,并实现了显著的性能提升。 ... [详细]
  • 深入解析动态代理模式:23种设计模式之三
    在设计模式中,动态代理模式是应用最为广泛的一种代理模式。它允许我们在运行时动态创建代理对象,并在调用方法时进行增强处理。本文将详细介绍动态代理的实现机制及其应用场景。 ... [详细]
  • 本章详细介绍SP框架中的数据操作方法,包括数据查找、记录查询、新增、删除、更新、计数及字段增减等核心功能。通过具体示例和详细解析,帮助开发者更好地理解和使用这些方法。 ... [详细]
  • 主调|大侠_重温C++ ... [详细]
  • 本文详细介绍了C语言中的基本数据类型,包括整型、浮点型、字符型及其各自的子类型,并探讨了这些类型在不同编译环境下的表现。 ... [详细]
  • python开发mysql:单表查询&多表查询
    一单表查询,以下是表内容二多表查询,一下是表内容三总结&表创建过程单 ... [详细]
  • Nature Microbiology: 人类肠道古菌基因组目录
    本研究揭示了人类肠道微生物群落中古细菌的多样性,分析了来自24个国家、农村和城市人群的1,167个非冗余古细菌基因组。研究鉴定了多个新分类群,并探讨了古菌对宿主的适应性及其与社会人口特征的关系。 ... [详细]
  • 探讨如何修复Visual Studio Code中JavaScript的智能感知和自动完成功能在特定场景下无法正常工作的问题,包括配置检查、语言模式选择以及类型注释的使用。 ... [详细]
  • 本题要求在一组数中反复取出两个数相加,并将结果放回数组中,最终求出最小的总加法代价。这是一个经典的哈夫曼编码问题,利用贪心算法可以有效地解决。 ... [详细]
  • 对于许多初学者而言,遇到总线错误(bus error)或段错误(segmentation fault/core dump)是极其令人困扰的。本文详细探讨了这两种错误的成因、表现形式及解决方法,并提供了实用的调试技巧。 ... [详细]
author-avatar
phba
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有