当前位置: 开发笔记 > 编程语言 > 正文

正则匹配到第二个_JavaScript正则表达式迷你书（读书笔记）

作者：啊啦哈200601 | 来源：互联网 | 2023-07-19 02:17

1.正则表达式字符匹配攻略：要么匹配字符，要么匹配位置两种模糊匹配：横向模糊和纵向模糊1.1.横向模糊匹配：一个正则可匹配的

1. 正则表达式字符匹配攻略&＃xff1a;要么匹配字符&＃xff0c;要么匹配位置

两种模糊匹配&＃xff1a;横向模糊和纵向模糊

1.1. 横向模糊匹配&＃xff1a;一个正则可匹配的字符串的长度不是固定的&＃xff0c;可以是多种情况的

其实现的方式是使用量词。譬如 {m,n}&＃xff0c;表示连续出现最少 m 次&＃xff0c;最多 n 次。
eg: 比如正则 /ab{2,5}c/ 表示匹配这样一个字符串&＃xff1a;第一个字符是 "a"&＃xff0c;接下来是 2 到 5 个字符 "b"&＃xff0c;最后是字符 "c"。其可视化和测试如下&＃xff1a;

1.2. 纵向模糊匹配&＃xff1a; 一个正则匹配的字符串&＃xff0c;具体到某一位字符时&＃xff0c;它可以不是某个确定的字符&＃xff0c;可以有多种可能

其实现的方式是使用字符组。譬如 [abc]&＃xff0c;表示该字符是可以字符 "a"、"b"、"c" 中的任何一个。
比如 /a[123]b/ 可以匹配如下三种字符串&＃xff1a; "a1b"、"a2b"、"a3b"。

字符组

1.3. 范围表示法

比如 [123456abcdefGHIJKLM]&＃xff0c;可以写成 [1-6a-fG-M]。用连字符 - 来省略和简写。
需要注意的是&＃xff0c;连字符有特殊用途&＃xff0c;如果匹配"a"、"-"、"z"中的任意一个&＃xff0c;不能写成[a-z],可以写成&＃xff1a;[-az]、[za-]、[a-z]。

1.4. 排除字符法

其实现的方式是使用反义字符组。譬如 [^abc]&＃xff0c;表示该字符是排除字符 "a"、"b"、"c" 之外的任意字符。

1.5. 常见的简写形式

有了字符组概念&＃xff0c;一些常见的符号就好理解了&＃xff0c;系统提供了自带的简写方式

量词的简写形式

贪恋匹配和惰性匹配

1.6. 贪婪匹配

正则 /d{2,5}/&＃xff0c;表示数字连续出现 2 到 5 次。会匹配 2 位、3 位、4 位、5 位连续数字。但是其是贪婪的&＃xff0c;它会尽可能多的匹配。只要在能力范围内&＃xff0c;越多越好。

1.7. 惰性匹配

正则 /d{2,5}?/ 表示&＃xff0c;虽然 2 到 5 次都行&＃xff0c;当 2 个就够的时候&＃xff0c;就不再往下尝试了。通过在量词后面加个问号就能实现惰性匹配。

1.8. 多选分支

一个模式可以实现横向和总想模糊匹配&＃xff0c;而多选分之可以支持多个自模式任选其一
具体形式&＃xff1a;(p1|p2|p3)&＃xff0c;其中 p1、p2 和 p3 是子模式&＃xff0c;用 |&＃xff08;管道符&＃xff09;分隔&＃xff0c;表示其中任何之一
需要注意的是&＃xff0c;分之匹配是惰性的&＃xff0c;比如我用 /good|goodbye/&＃xff0c;去匹配 "goodbye" 字符串时&＃xff0c;结果是 "good"。

2. 正则表达式位置匹配攻略&＃xff1a;位置&＃xff08;锚&＃xff09;是相邻字符之间的位置

如何匹配位置&＃xff0c;在 ES5 中有 6 个锚&＃xff1a;^、$、b、B、(?&＃61;p)、(?!p)

^&＃xff08;脱字符&＃xff09;匹配开头&＃xff0c;在多行匹配中匹配行开头。
$&＃xff08;美元符号&＃xff09;匹配结尾&＃xff0c;在多行匹配中匹配行结尾。
b 是单词边界&＃xff0c;具体就是 w 与 W 之间的位置&＃xff0c;也包括 w 与 ^ 之间的位置&＃xff0c;和 w 与 $ 之间的位置。
B 就是 b 的反面的意思&＃xff0c;非单词边界。例如在字符串中所有位置中&＃xff0c;扣掉 b&＃xff0c;剩下的都是 B 的。
(?&＃61;p)&＃xff0c;其中 p 是一个子模式&＃xff0c;即 p 前面的位置&＃xff0c;或者说&＃xff0c;该位置后面的字符要匹配 p。

而 (?!p) 就是 (?&＃61;p) 的反面意思

3. 正则表达式括号的作用&＃xff1a;分组和分支是括号最直觉的作用

分组

3.1. 我们知道 /a&＃43;/ 匹配连续出现的 "a"&＃xff0c;而要匹配连续出现的 "ab" 时&＃xff0c;需要使用 /(ab)&＃43;/。其中括号是提供分组功能。

分支结构

3.2. 而在多选分支结构 (p1|p2) 中&＃xff0c;此处括号的作用也是不言而喻的&＃xff0c;提供了分支表达式的所有可能。

分组引用

3.3. 如&＃xff1a;/d{4}-d{2}-d{2}/ 和 /(d{4})-(d{2})-(d{2})/; 后者多了分组的编号。

搭配合理的 API&＃xff0c;实现更强大的操作。如下可视化正则&＃xff0c;多了分组引用的概念

反向引用

3.4. 除了使用相应的 API 来引用分组&＃xff0c;也可以在正则本身里引用分组&＃xff0c;但只能引用之前出现的分组&＃xff0c;即为反向引用。

如匹配前后分隔符一致的日期"2017-06-12"&＃xff0c;可以使用正则 /d{4}(-|/|.)d{2}1d{2}/;其中里面的 1&＃xff0c;表示的引用之前的那个分组 (-|/|.)。那么2 和 3 自然理解了&＃xff0c;表示第二个和第三个分组。
那么 10 表示第十个分组&＃xff0c;还是表示1 和 0 呢&＃xff1f; 答案是前者&＃xff0c;如果要表示后者&＃xff0c;请使用(?:1)0 或者 1(?:0)

引用不存在的分组&＃xff0c;正则匹配时不会报错&＃xff0c;只是匹配反向引用的字符本身。
分组后面有量词&＃xff0c;分组最终捕获的是最后一次的匹配。

3.5. 非捕获括号

- 上文提到的括号&＃xff0c;都会匹配他们捕获到的数据&＃xff0c;以便后续作为引用&＃xff0c;成为捕获型分组或分支。如果想要括号原始功能&＃xff0c;此时应使用非捕获括号(?:p) 或 (?:p1|p2|p3)

4. 正则表达式回溯法原理

回溯匹配的概念

4.1. 没有回溯的匹配

例如正则是/ab{1,2}c/&＃xff0c;如果目标字符串是“abbbc”&＃xff0c;其匹配就是没有回溯的&＃xff0c;其匹配过程如下&＃xff1a;

4.2. 有回溯的匹配

如上正则&＃xff0c;如果目标字符串是“abbc”&＃xff0c;其匹配就是有回溯的&＃xff0c;其匹配过程如下&＃xff0c;其第6步就是回溯&＃xff1a;

贪婪量词和惰性量词

4.3. 贪婪量词

比如 b{1,3}&＃xff0c;因为其是贪婪的&＃xff0c;尝试可能的顺序是从多往少的方向去尝试。首先会尝试 "bbb"&＃xff0c;然后再看整个正则是否能匹配。不能匹配时&＃xff0c;吐出一个 "b"&＃xff0c;即在 "bb" 的基础上&＃xff0c;再继续尝试。如果还不行&＃xff0c;再吐出一个&＃xff0c;再试。如果还不行呢&＃xff1f;只能说明匹配失败了。

4.4. 惰性量词

惰性量词就是在贪婪量词后面加个问号。表示尽可能少的匹配。

5. 正则表达式的拆分

正则表达式有哪些结构&＃xff1f;

5.1. 字符字面量、字符组、量词、锚、分组、选择分支、反向引用&＃xff0c;

具体含义如下&＃xff1a;

涉及到的操作符有&＃xff1a;

尝试拆分一个正则&＃xff1a;/ab?(c|de*)&＃43;|fg/
- 由于括号的存在&＃xff0c;所以(c|de*)是一个整体
- 而(c|de)存在一个量词&＃xff0c;所以 e是一个整体
- 而分支结构|优先级较低&＃xff0c;所以 c 是一个整体&＃xff0c;de*是一个整体

最终被拆分为 a、b?、(…)&＃43; 和 f、g 两个部分

量词连缀问题

如果匹配每个字符为‘a’&＃xff0c;‘b’&＃xff0c;‘c’任意一个&＃xff0c;字符串长度是 3 的倍数&＃xff0c;如果正则想当然地写成 /^[abc]{3}&＃43;$/&＃xff0c;这样会报错&＃xff0c;说 &＃43; 前面没什么可重复的。而要修改为&＃xff1a;

元字符转译问题

5.2. 所谓元字符&＃xff0c;就是正则中有特殊含义的字符&＃xff1a;^、$、.、*、&＃43;、?、|、、/、(、)、[、]、{、}、&＃61;、!、:、- ,

如果要使用这些元字符&＃xff0c;需要对其转义&＃xff0c;但并不是所有的字符都需要转义
在字符组中的元字符&＃xff0c;比如匹配 "[abc]" 和 "{3,5}"&＃xff0c;可以写成/[abc]/ 或 /[abc]/&＃xff0c;/{3,5}/ 或 /{3,5}/
其余情况&＃xff0c;比如 &＃61;、!、:、-、, 等符号&＃xff0c;只要不在特殊结构中&＃xff0c;并不需要转义&＃xff1b;括号需要前后都转义的&＃xff1b;于剩下的 ^、$、.、*、&＃43;、?、|、、/ 等字符&＃xff0c;只要不在字符组内&＃xff0c;都需要转义的。

6. 正则表达式的构建和编程

平衡法则

匹配预期的字符串
不匹配非预期字符串
可读性和可维护性
效率

正则表达式相关 API

6.1. 用于正则操作的方法&＃xff0c;共有 6 个&＃xff0c;字符串实例 4 个&＃xff0c;正则实例 2 个&＃xff1a;

6.2. search 和 match 参数问题&＃xff0c;会把参数 string 转为 regexp。

6.3. match 返回结果的格式&＃xff0c;与正则对象时候有修饰符 g 有关。没有 g&＃xff0c;返回标准格式&＃xff1b;有 g&＃xff0c;返回所有匹配内容

6.4. exec 比 match 强大&＃xff0c;exec 作为对 match 含有 g 匹配内容的补充&＃xff0c;包含所有匹配内容的 index 信息

6.5. g 对 exec 和 test 的影响&＃xff0c;对于字符串的四个方法&＃xff0c;都是从 0 开始的&＃xff0c;lastIndex 属性始终保持不变。而对于正则的两个方法&＃xff0c;lastIndex 会受 g 的影响

- 注意下面代码中的第三次调用 test&＃xff0c;因为这一次尝试匹配&＃xff0c;开始从下标 lastIndex&＃xff0c;即 3 位置处开始查找&＃xff0c;自然就找不到了。

- 如果没有 g&＃xff0c;都是从字符串第 0 个位置开始尝试匹配

6.6. test 整体匹配时需要使用 ^ 和 $

6.7. replace 是很强大的。总体来说 replace 有两种使用形式&＃xff0c;这是因为它的第二个参数&＃xff0c;可以是字符串&＃xff0c;也可以是函数。

- 当第二个参数是字符串时&＃xff0c;如下的字符有特殊的含义&＃xff1a;

6.8. 正则表达式 ES5 有 3 个修饰符

推荐阅读

string
splitjava的简单介绍

本文目录一览：1、Javasplit方法2、 ... [详细]

蜡笔小新 2023-10-16 15:51:58
string
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
string
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
string
利用Visual Basic开发SAP接口程序初探的方法与原理

本文介绍了利用Visual Basic开发SAP接口程序的方法与原理，以及SAP R/3系统的特点和二次开发平台ABAP的使用。通过程序接口自动读取SAP R/3的数据表或视图，在外部进行处理和利用水晶报表等工具生成符合中国人习惯的报表样式。具体介绍了RFC调用的原理和模型，并强调本文主要不讨论SAP R/3函数的开发，而是针对使用SAP的公司的非ABAP开发人员提供了初步的接口程序开发指导。 ... [详细]

蜡笔小新 2023-12-13 10:56:31
io
单击时动态创建
元素 - Dynamically create
element on click

Ihavethefollowingonhtml我在html上有以下内容<html><head><scriptsrc..3003_Tes ... [详细]

蜡笔小新 2023-12-12 15:59:36
string
node . js urlsearchparams API

node.jsurlsearchparamsAPI哎哎哎 ... [详细]

蜡笔小新 2023-12-09 18:08:10
string
javascrip中的函数参数个数未知时的用法

巧用arguments在Javascript的函数中有个名为arguments的类数组对象。它看起来是那么的诡异而且名不经传，但众多的Javascript库都使用着它强大的功能。所 ... [详细]

蜡笔小新 2023-10-17 19:06:27
string
javaSpring MVC 3.2.5无法识别的字段Jackson

我将SpringMVC升级到Spring3.2.5.我的一些剩余调用即使存在,也会返回无法识别的字段异常.这是错误.Resolvingexceptionfrom ... [详细]

蜡笔小新 2023-10-17 14:01:01
string
JavaScript范例体系详解

基础数据范例ECMAScript中有5种简朴数据范例（也称基础数据范例）：Undefined，Null，Boolean，Number和String。另有一种庞杂数据范例（援用型）O ... [详细]

蜡笔小新 2023-10-16 12:35:21
string
字面|开辟_一文入门JavaScript

篇首语：本文由编程笔记#小编为大家整理，主要介绍了一文入门JavaScript相关的知识，希望对你有一定的参考价值。@toc ... [详细]

蜡笔小新 2023-10-15 10:59:01
string
获取当前模块所在路径的GetModuleFileName函数用法详解

本文详细介绍了GetModuleFileName函数的用法，该函数可以用于获取当前模块所在的路径，方便进行文件操作和读取配置信息。文章通过示例代码和详细的解释，帮助读者理解和使用该函数。同时，还提供了相关的API函数声明和说明。 ... [详细]

蜡笔小新 2023-12-14 19:29:57
string
Redis数据结构之string应用场景解析

本文介绍了Redis的基础数据结构string的应用场景，并以面试的形式进行问答讲解，帮助读者更好地理解和应用Redis。同时，描述了一位面试者的心理状态和面试官的行为。 ... [详细]

蜡笔小新 2023-12-14 14:02:42
string
Java中检查字符串是否仅包含数字的方法及示例代码

本文介绍了在Java中检查字符串是否仅包含数字的方法，包括使用正则表达式的示例代码，并提供了测试案例进行验证。同时还解释了Java中的字符转义序列的使用。 ... [详细]

蜡笔小新 2023-12-10 12:58:56
string
数组或散列中的正则表达式排序 - Regex in array or hash - sorting

Ihaveaworkfolderdirectory.我有一个工作文件夹目录。holderDir.glob(*)>holder[ProjectOne, ... [详细]

蜡笔小新 2023-12-10 12:41:53
string
javaftp上传,javaftp下载文件

本文目录一览：1、javaftp上传5G以上大文件，怎么做 ... [详细]

蜡笔小新 2023-10-16 18:12:51

啊啦哈200601

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章