java如何判断一个字符串是不是纯数字正则表达式_哈哈哈哈这个好玩！正则表达式王国奇遇记......

作者：猪猪寂寞的王子_125 | 来源：互联网 | 2023-09-24 12:19

公众号关注“GitHubDaily”设为“星标”，带你了解技术圈内新鲜事！01初来乍到欢迎来到正则表达式的国度，勇士！这里的

公众号关注 “GitHubDaily”

设为 “星标”&＃xff0c;带你了解技术圈内新鲜事&＃xff01;01初来乍到

欢迎来到正则表达式的国度&＃xff0c;勇士&＃xff01;这里的每一个人都使用正则表达式&＃xff0c;我是这里的 NPC&＃xff0c;每一个来到这里的人都将由我代为介绍正则世界的规则&＃xff0c;至于能领悟到何种境界&＃xff0c;就看你的造化了。祝你好运&＃xff0c;勇士&＃xff01;

啊&＃xff0c;好的&＃xff0c;正则表达式......有点奇怪的名字&＃xff0c;它是什么呢&＃xff1f;

什么&＃xff1f;你还没有听过正则表达式&＃xff0c;真是一个莽撞的小伙子。看来你也和外面世界的人一样&＃xff0c;每次只有用到 字符串匹配 时&＃xff0c;才会通过「谷鸽」来我们的国度寻找答案。一群知其然不知其所以然的家伙。

说着&＃xff0c;NPC 身前浮现出几个鎏金大字&＃xff1a;正则表达式用来匹配一系列符合某个规则的字符串的表达式

正则的意思是正规、规则。正则表达式的英文名是 Regular Expression&＃xff0c;可以直译为描述某种规则的表达式&＃xff0c;一般缩写为 regex。

02牛刀小试

我先来考考你吧&＃xff1a;你如何判断一个字符串是不是有效的电话号码&＃xff1f;这可是一个非常常见的需求。

没问题&＃xff0c;我以前确实写过一份类似的代码。首先判断字符串是否是 11 位&＃xff0c;再判断每一位是否都是数字就可以了。

public static boolean isValidPhoneNumber(String number) { // 判断是否是 11 位 if (number.length() !&＃61; 11) return false; // 判断每一位是否全为数字 for (int i &＃61; 0; i if (number.charAt(i) <&＃39;0&＃39; || number.charAt(i) > &＃39;9&＃39;) return false; } return true;}

好了好了&＃xff0c;快把你这份代码藏好&＃xff0c;这份代码放到我们正则的国度是会被笑掉大牙的。看看我们国度的人是怎么实现这份需求的吧&＃xff01;

public static boolean isValidPhoneNumber(String number) { return number.matches("\\d{11}");}

啊&＃xff1f;如此简洁的实现&＃xff0c;正则强者竟恐怖如斯&＃xff01;

这可不是什么强者写的代码&＃xff0c;充其量算是牛刀小试罢了。
03初窥门径我先给你讲讲正则表达式的精确匹配。一个普通的字符串&＃xff0c;比如 abc&＃xff0c;它如果用来做正则表达式匹配的话&＃xff0c;只能匹配自己。也就是说它只能匹配字符串 abc&＃xff0c;不能匹配 ab&＃xff0c;Abc 等其他任何字符串。
System.out.println("abc".matches("abc")); // 输出为 trueSystem.out.println("ab".matches("abc")); // 输出为 falseSystem.out.println("Abc".matches("abc")); // 输出为 false
这好像没什么用&＃xff0c;需要精确匹配的话&＃xff0c;我们可以用 String.equals() 函数&＃xff0c;不需要用正则吧&＃xff1f;
没错&＃xff0c;正则表达式的精确匹配很少用到。我只是在给你介绍正则表达式的一条基本规则而已。
如果需要匹配的字符串含有特殊字符&＃xff0c;那就需要用 \转义。比如 a&b&＃xff0c;在用正则表达式匹配时&＃xff0c;需要使用 a\&b&＃xff0c;又由于在 Java 字符串中&＃xff0c;\ 也是特殊字符&＃xff0c;它也需要转义&＃xff0c;所以 a\&b 对应的 Java 字符串是 a\\&b&＃xff0c;它是用来匹配 a&b 的。
System.out.println("a&b".matches("a\\&b")); // 输出为 true
这么说来&＃xff0c;这两个反斜杠的意义竟然还不一样&＃xff1a;一个是正则的转义&＃xff0c;一个是 Java 字符串的转义。那么我们之前那个匹配电话号码的例子里面&＃xff0c; \\d 的本意也是 \d 吗&＃xff1f;
不错不错&＃xff0c;算你还有点悟性。\d 在正则表达式中表示匹配任意数字&＃xff0c;d 是 digital 的简写。比如 00\d 就可以匹配 000&＃xff0c; 007&＃xff0c;008 等等。
那么&＃xff0c;00\d 可以匹配 0066 吗&＃xff1f;
不能&＃xff0c;\d 只能匹配单个数字。
那我要怎么才能匹配多个数字呢&＃xff1f;
你可以写多次&＃xff0c;比如 \d\d 就能匹配两个数字&＃xff0c;\d\d\d 能匹配三个数字&＃xff0c;需要匹配几个数字就写几次就行了。
System.out.println("1".matches("\\d\\d")); // 输出为 falseSystem.out.println("11".matches("\\d\\d")); // 输出为 trueSystem.out.println("111".matches("\\d\\d")); // 输出为 false
那我如果要匹配 10000 个数字呢&＃xff1f;总不能写一万次吧&＃xff1f;
那就像我们刚才匹配电话号码的例子一样&＃xff0c;在 \d 后面打上花括号 {}&＃xff0c;{n} 表示匹配 n 次。\d{10000} 就表示匹配 10000 个数字。
原来如此&＃xff0c;现在我能完全看懂刚才写的匹配电话号码的例子了&＃xff01;
趁热打铁&＃xff0c;如果要匹配 n ~ m 次&＃xff0c;用 {n,m} 即可&＃xff0c;如果要匹配至少 n 次&＃xff0c;用 {n,} 即可。需要注意 , 后不能有空格。
System.out.println("1".matches("\\d{1,2}")); // 输出为 trueSystem.out.println("12".matches("\\d{1,2}")); // 输出为 trueSystem.out.println("123".matches("\\d{1,2}")); // 输出为 falseSystem.out.println("123".matches("\\d{2,}")); // 输出为 true
按照这个写法&＃xff0c;如果要匹配最多 m 次&＃xff0c;是不是用 {,m} &＃xff1f;
刚夸了你有点悟性又被你蠢哭了&＃xff0c;最多 m 次需要这么写吗&＃xff1f;直接用 {0,m} 不就行了吗&＃xff1f;只是因为正无穷不好表示我们才用的 {n,}&＃xff0c;在正则国度根本没有 {,m} 这样的写法。
啊&＃xff0c;原来如此&＃xff0c;我想多了。
04小有所成正则的基础规则中&＃xff0c;除了 \d&＃xff0c;还有 \w和\s&＃xff0c;w 是 word 的简写&＃xff0c;表示匹配一个常用字符&＃xff0c;包括字母、数字、下划线。s 是 space 的简写&＃xff0c;表示匹配一个空格&＃xff0c;包括三种&＃xff1a;
空格键打出来的空格
Tab 键打出来的空格
回车键打出来的空格
Tab 键打出来的空格和回车键打出来的空格&＃xff1f;是指 \t 和 \n 吗&＃xff1f;
完全正确。
我明白了&＃xff0c;我来测试一下。
System.out.println("LeetCode_666".matches("\\w{12}")); // 输出为 trueSystem.out.println("\t \n".matches("\\s{3}")); // 输出为 trueSystem.out.println("Leet\tCode 666".matches("\\w{4}\\s\\w{4}\\s\\d{3}")); // 输出为 true
非常棒&＃xff0c;我的勇士&＃xff01;希望这三个基本规则还不至于让你记昏了头。不过请放心&＃xff0c;没有其他字母需要记忆了&＃xff0c;只有这三个而已。
05更进一步记住上面三个规则之后&＃xff0c;你还可以顺带获得几个新的规则。因为正则国度规定&＃xff1a;将字母换成大写&＃xff0c;就表示相反的意思。用 \d 你可以匹配一个数字&＃xff0c;\D 则表示匹配一个非数字。
System.out.println("a".matches("\\d")); // 输出为 falseSystem.out.println("1".matches("\\d")); // 输出为 trueSystem.out.println("a".matches("\\D")); // 输出为 trueSystem.out.println("1".matches("\\D")); // 输出为 false
哈&＃xff0c;设计者真是太机智了&＃xff0c;大大减少了我这种新手的学习成本。
是的&＃xff0c;这非常好记。类似地&＃xff0c;\W 可以匹配 \w 不能匹配的字符&＃xff0c;\S 可以匹配 \s 不能匹配的字符。
06渐入佳境有时候&＃xff0c;我们对某些位置的字符没有要求&＃xff0c;仅需要占个位置即可。这时候我们就可以用 . 字符。
System.out.println("a0b".matches("a.b")); // 输出为 trueSystem.out.println("a_b".matches("a.b")); // 输出为 trueSystem.out.println("a b".matches("a.b")); // 输出为 true
那是不是也可以理解为&＃xff1a;. 可以匹配任意字符。
是的&＃xff0c;可以这么理解。还记得之前说的 {n} 表示匹配 n 次吗&＃xff1f;有时候&＃xff0c;我们对匹配的次数没有要求&＃xff0c;匹配任意次均可&＃xff0c;这时&＃xff0c;我们就可以用 * 字符。
System.out.println("1".matches("\\d*")); // 输出为 trueSystem.out.println("123".matches("\\d*")); // 输出为 trueSystem.out.println("".matches("\\d*")); // 输出为 true
我有疑问&＃xff0c;为什么第三个表达式也会输出 true 呢&＃xff1f;明明没有出现数字啊&＃xff1f;
那意味着出现了 0 次&＃xff0c;* 是指 可以匹配任意次&＃xff0c;包括 0 次。也就是说&＃xff0c;* 等价于 {0,}
我感觉比较常见的需求应该是某个字符至少出现一次吧&＃xff1f;
那就可以用 &＃43; 匹配&＃xff0c;&＃43; 表示 至少匹配一次。它等价于 {1,}
System.out.println("1".matches("\\d&＃43;")); // 输出为 trueSystem.out.println("123".matches("\\d&＃43;")); // 输出为 trueSystem.out.println("".matches("\\d&＃43;")); // 输出为 false
哈哈&＃xff0c;看来设计者也发现了这个需求更常用。平时 &＃43; 号比 * 号用得多吧&＃xff01;
这倒没人统计过&＃xff0c;在我们正则的国度&＃xff0c;常常是一个场景一个正则&＃xff0c;不存在谁比谁更常用的对比&＃xff0c;按照实际场景使用就行了。
还有一种场景&＃xff0c;如果某个字符要么匹配 0 次&＃xff0c;要么匹配 1 次&＃xff0c;我们就可以用 ? 匹配。它等价于 {0,1}
System.out.println("".matches("\\d?")); // 输出为 trueSystem.out.println("1".matches("\\d?")); // 输出为 trueSystem.out.println("123".matches("\\d?")); // 输出为 false
. 匹配任意字符&＃xff1b;* 匹配任意次&＃xff0c;包括 0 次&＃xff1b;&＃43; 号匹配至少 1 次&＃xff0c;? 匹配 0 次或 1 次。我记住了&＃xff01;
07心浮气躁我感觉我已经掌握了够多的匹配规则&＃xff0c;足以应付所有的字符串匹配场景了&＃xff01;
是的&＃xff0c;你已经掌握了足够多的规则&＃xff0c;勇士。可先别得意得太早&＃xff0c;我再考考你吧。看看匹配电话号码的程序&＃xff0c;如果我们规定电话号码不能以 0 开头&＃xff0c;应该怎么写正则表达式呢&＃xff1f;
不能以 0 开头&＃xff0c;那就不能用 \d{11}了&＃xff0c;这......
刚刚谁还说「我已经掌握了足够多的匹配规则&＃xff0c;足以应付所有的字符串匹配场景了&＃xff01;」
呃&＃xff0c;还差一点......快别取笑我了&＃xff0c;快告诉我这个要用什么新的规则吧&＃xff01;
年轻人啊&＃xff0c;总是心浮气躁&＃xff0c;这样的场景需要用 [] 来匹配&＃xff0c;[] 用于匹配指定范围内的字符&＃xff0c;比如[123456789] 可以匹配 1~9。
啊哈&＃xff0c;那我就知道怎么写了&＃xff0c; 这个问题的正则匹配规则是 [123456789]\d{10}。
就是这样。这里还有一个语法糖&＃xff0c;[123456789] 写起来太麻烦&＃xff0c;可以写作 [1-9]。
只能用于数字吗&＃xff1f;可以用在字母身上吗&＃xff1f;
当然可以&＃xff0c;比如 [a-g] 表示 [abcdefg]&＃xff0c;[U-Z] 表示 [UVWXYZ]。
但如果既可以是数字 1~9&＃xff0c;又可以是字母 a~g&＃xff0c;还可以是字母 U~Z&＃xff0c;还是得把所有范围列出来。
不必&＃xff0c;你还可以这么写&＃xff1a;[1-9a-gU-Z]。
System.out.println("1".matches("[1-9a-gU-Z]")); // 输出为 trueSystem.out.println("b".matches("[1-9a-gU-Z]")); // 输出为 trueSystem.out.println("X".matches("[1-9a-gU-Z]")); // 输出为 trueSystem.out.println("A".matches("[1-9a-gU-Z]")); // 输出为 false
这可真是太方便了&＃xff01;如果是 0~1&＃xff0c;8~9 可以这样组合吗&＃xff1f;
那样的话&＃xff0c;你写 [0189] 不是更简洁吗&＃xff1f;
我想学习(装 X)。
那当然也是可以的&＃xff0c;[0-18-9] 正是你想要的。由于正则一次只匹配一个字符&＃xff0c;所以这样写并不会有歧义&＃xff0c;也就是说计算机不会把这种写法误解成要匹配 0~18 之类的。
System.out.println("1".matches("[0-18-9]")); // 输出为 trueSystem.out.println("5".matches("[0-18-9]")); // 输出为 false
还有一种写法可以实现这一点&＃xff0c;那就是用 或 运算符&＃xff0c;正则的 或 运算符是 |&＃xff0c;[0189] 也可以写作 0|1|8|9。
System.out.println("1".matches("0|1|8|9")); // 输出为 trueSystem.out.println("5".matches("0|1|8|9")); // 输出为 false
所以说范围就是 或 的简写&＃xff0c;对吗&＃xff1f;
不对&＃xff0c;或 可以实现更多的功能&＃xff0c;它并不局限于单个字符。
System.out.println("abc".matches("abc|ABC")); // 输出为 trueSystem.out.println("ABC".matches("abc|ABC")); // 输出为 trueSystem.out.println("123".matches("abc|ABC")); // 输出为 false
如果我想排除某些字符呢&＃xff1f;比如这个位置不能是 [123]。我记得你之前说正则王国以大写表示取反&＃xff0c;[] 要怎么大写呢&＃xff1f;
[] 可没有大写之说&＃xff0c;[] 取反的方式是&＃xff1a;[^]&＃xff0c;比如不能是 [123] 的表示方法为 [^123] 或者 [^1-3]
原来如此&＃xff0c;我懂了。现在还有什么规则我没有学到的吗&＃xff1f;
新手教程到这里就结束了&＃xff0c;这已经足够你应付许多应用场景了。但我这还有两本高手秘籍&＃xff0c;你想不想学呢&＃xff1f;
高手秘籍&＃xff01;听着都让人激动啊&＃xff0c;快讲讲&＃xff01;
08探囊取物这第一本秘籍的名字叫 探囊取物。考虑一个实际需求&＃xff0c;有许许多多以下格式的字符串&＃xff0c;你需要用正则表达式匹配出其姓名和年龄。
Name&＃xff1a;Aurora        Age&＃xff1a;18
其中还夹杂着一些无关紧要的数据
Name&＃xff1a;Bob            Age&＃xff1a;20
错误的数据有着各种各样错误的格式
Name&＃xff1a;Cassin        Age&＃xff1a;22
...
没问题&＃xff0c;这已经难不倒我了。让我想想......观察字符串的规则&＃xff0c;只需要用 Name:\w&＃43;\s*Age:\d{1,3} 就能匹配了。
System.out.println("Name:Aurora   Age:18".matches("Name:\\w&＃43;\\s*Age:\\d{1,3}")); // 输出为 trueSystem.out.println("其中还夹杂着一些无关紧要的数据".matches("Name:\\w&＃43;\\s*Age:\\d{1,3}")); // 输出为 falseSystem.out.println("Name:Bob      Age:20".matches("Name:\\w&＃43;\\s*Age:\\d{1,3}")); // 输出为 trueSystem.out.println("错误的数据有着各种各样错误的格式".matches("Name:\\w&＃43;\\s*Age:\\d{1,3}")); // 输出为 falseSystem.out.println("Name:Cassin   Age:22".matches("Name:\\w&＃43;\\s*Age:\\d{1,3}")); // 输出为 true
很好&＃xff01;一般来说&＃xff0c;下一步你要做的就是取出这些表达式中的姓名和年龄&＃xff0c;以便把它们存到数据库中。
那我可以用 indexOf 和 subString 函数来取这些值。
的确可行&＃xff0c;但你现在不需要那个蠢办法了&＃xff0c;我的勇士。你已经掌握了正则的力量&＃xff0c;在我们正则国度有更简洁的取值方式。
Pattern pattern &＃61; Pattern.compile("Name:(\\w&＃43;)\\s*Age:(\\d{1,3})");Matcher matcher &＃61; pattern.matcher("Name:Aurora   Age:18");if(matcher.matches()) {    String group1 &＃61; matcher.group(1);    String group2 &＃61; matcher.group(2);    System.out.println(group1);   // 输出为 Aurora    System.out.println(group2);   // 输出为 18}
看吧&＃xff0c;只要用 () 将需要取值的地方括起来&＃xff0c;传给 Pattern 对象&＃xff0c;再用 Pattern 对象匹配后获得的 Matcher 对象来取值就行了。每个匹配的值将会按照顺序保存在 Matcher 对象的 group 中。
你可以看到我用 ()  把 \\w&＃43;  和 \\d{1,3} 分别括起来了&＃xff0c;判断 Pattern 对象与字符串是否匹配的方法是  Matcher.matches()&＃xff0c;如果匹配成功&＃xff0c;这个函数将返回 true&＃xff0c;如果匹配失败&＃xff0c;则返回 false。
这里是不是写错了&＃xff0c;为什么 group 是从下标 1 开始取值的&＃xff0c;计算机不都从 0 开始数吗&＃xff1f;
并没有写错&＃xff0c;这是因为 group(0) 被用来保存整个匹配的字符串了。
System.out.println(matcher.group(0));   // 输出为 Name:Aurora   Age:18
原来是这样&＃xff0c;分组可真是太方便了。但我们之前都是用的 String.matches 方法来匹配的正则表达式&＃xff0c;这里用的 Pattern 又是什么呢&＃xff1f;
想知道这个问题的答案的话&＃xff0c;我们不妨来看一下 String.matches 方法的源码。
public boolean matches(String regex) {    return Pattern.matches(regex, this);}
源码中调用了 Pattern.matches 方法&＃xff0c;我们再跟进去。
public static boolean matches(String regex, CharSequence input) {    Pattern p &＃61; Pattern.compile(regex);    Matcher m &＃61; p.matcher(input);    return m.matches();}
啊&＃xff0c;我明白了&＃xff01;原来 Pattern 并不是什么新鲜东西&＃xff0c;String.matches  内部就是调用的 Pattern&＃xff0c;两种写法的原理是一模一样的&＃xff01;
没错&＃xff0c;并且阅读源码之后&＃xff0c;你可以发现&＃xff0c;每次调用 String.matches 函数&＃xff0c;都会新建出一个 Pattern 对象。所以如果要用同一个正则表达式多次匹配字符串的话&＃xff0c;最佳的做法不是直接调用 String.matches 方法&＃xff0c;而应该先用正则表达式新建一个 Pattern 对象&＃xff0c;然后反复使用&＃xff0c;以提高程序运行效率。
// 错误的做法&＃xff0c;每次都会新建一个 Pattern&＃xff0c;效率低boolean result1 &＃61; "Name:Aurora   Age:18".matches("Name:(\\w&＃43;)\\s*Age:(\\d{1,3})"); boolean result2 &＃61; "Name:Bob      Age:20".matches("Name:(\\w&＃43;)\\s*Age:(\\d{1,3})");boolean result3 &＃61; "Name:Cassin   Age:22".matches("Name:(\\w&＃43;)\\s*Age:(\\d{1,3})");                                                 // 正确的做法&＃xff0c;复用同一个 Pattern&＃xff0c;效率高Pattern pattern &＃61; Pattern.compile("Name:(\\w&＃43;)\\s*Age:(\\d{1,3})");boolean result4 &＃61; pattern.matcher("Name:Aurora    Age:18").matches();boolean result5 &＃61; pattern.matcher("Name:Bob      Age:20").matches();boolean result6 &＃61; pattern.matcher("Name:Cassin   Age:22").matches();09移花接木
我这第二本秘籍名为 移花接木。再考虑一个实际场景&＃xff1a;你有一个让用户输入标签的输入框&＃xff0c;用户可以输入多个标签。可是你并没有提示用户&＃xff0c;标签之前用什么间隔符号隔开。
你还别说&＃xff0c;我之前真遇到过这个问题。结果用户的输入五花八门&＃xff0c;有用逗号的&＃xff0c;有用分号的&＃xff0c;有用空格的&＃xff0c;还有用制表符的......
二分&＃xff0c;回溯&＃xff0c;递归&＃xff0c;分治
搜索&＃xff1b;查找&＃xff1b;旋转&＃xff1b;遍历
数论 图论 逻辑 概率
那你是怎么解决的呢&＃xff1f;
用 String.split 函数呗&＃xff0c;这个函数我已经用得很熟练了。将各种分隔符号依次传入尝试&＃xff0c;最后总算是解决了。
public static String[] splitTabs(String tabs) {    if(tabs.split(",").length &＃61;&＃61; 4) return tabs.split(",");    if(tabs.split(";").length &＃61;&＃61; 4) return tabs.split(";");    if(tabs.split(" ").length &＃61;&＃61; 4) return tabs.split(" ");    return new String[0];}public static void main(final String[] args){    System.out.println(Arrays.toString(splitTabs("二分,回溯,递归,分治")));    System.out.println(Arrays.toString(splitTabs("搜索;查找;旋转;遍历")));    System.out.println(Arrays.toString(splitTabs("数论 图论 逻辑 概率")));}
输出为&＃xff1a;
[二分, 回溯, 递归, 分治][搜索, 查找, 旋转, 遍历][数论, 图论, 逻辑, 概率]
暴殄天物啊&＃xff01;你这种行为就好比拿着精心打磨的钻石当电钻头&＃xff0c;这样的代码在我们正则王国是会遭人唾骂的。
String.split 函数不就是用来分割字符串的吗&＃xff1f;
当然是&＃xff0c;但 split 函数可不是你这样用的&＃xff0c;不知你是否看过 split 函数的源码&＃xff0c;这个函数传入的参数实际上是一个正则表达式。
啊&＃xff1f;但我之前没写过正则表达式&＃xff0c;分割出来也没出错啊&＃xff01;
当然&＃xff0c;你忘了我最开始给你讲的了吗&＃xff1f;你直接使用字符串&＃xff0c;在正则王国属于精确匹配&＃xff0c;只能匹配你写死的那个字符串。
原来如此。那么我应该怎么做呢&＃xff1f;
当然是用正则表达式模糊匹配&＃xff0c;只要能匹配成功&＃xff0c;就以其分割。
System.out.println(Arrays.toString("二分,回溯,递归,分治".split("[,;\\s]&＃43;")));System.out.println(Arrays.toString("搜索;查找;旋转;遍历".split("[,;\\s]&＃43;")));System.out.println(Arrays.toString("数论 图论 逻辑 概率".split("[,;\\s]&＃43;")));
输出为&＃xff1a;
[二分, 回溯, 递归, 分治][搜索, 查找, 旋转, 遍历][数论, 图论, 逻辑, 概率]
原来 split 函数这么强大&＃xff0c;我以后不会犯这种错误了&＃xff01;
字符串中&＃xff0c;可不止这一个函数是传入的正则表达式&＃xff0c;你还记得替换所有匹配字符串用的什么函数吗&＃xff1f;
用的是 replaceAll 函数&＃xff0c;这个函数不会也是传的正则表达式吧&＃xff01;
正是这样&＃xff0c;所以我们可以用正则表达式模糊匹配&＃xff0c;将符合规则的字符串全部替换掉。比如就现在这个例子&＃xff0c;我们可以把用户输入的所有数据统一规范为使用 ; 分隔&＃xff0c;那我们就可以这样写。
System.out.println("二分,回溯,递归,分治".replaceAll("[,;\\s]&＃43;", ";"));System.out.println("搜索;查找;旋转;遍历".replaceAll("[,;\\s]&＃43;", ";"));System.out.println("数论 图论 逻辑 概率".replaceAll("[,;\\s]&＃43;", ";"));
输出为&＃xff1a;
二分;回溯;递归;分治搜索;查找;旋转;遍历数论;图论;逻辑;概率
果然是 移花接木&＃xff0c;模糊匹配比精确匹配效率高多了&＃xff01;
还不止这一点&＃xff0c;在 replaceAll 的第二个参数中&＃xff0c;我们可以通过 $1&＃xff0c;$2&＃xff0c;...来反向引用匹配到的子串。只要将需要引用的部分用 () 括起来就可以了。
System.out.println("二分,回溯,递归,分治".replaceAll("([,;\\s]&＃43;)", "---$1---"));System.out.println("搜索;查找;旋转;遍历".replaceAll("([,;\\s]&＃43;)", "---$1---"));System.out.println("数论 图论 逻辑 概率".replaceAll("([,;\\s]&＃43;)", "---$1---"));
输出为&＃xff1a;
二分---,---回溯---,---递归---,---分治搜索---;---查找---;---旋转---;---遍历数论--- ---图论--- ---逻辑--- ---概率
哈&＃xff0c;有时候我们不需要替换&＃xff0c;只需要将正则匹配出来的部分添加一些前缀或后缀&＃xff0c;就可以用这种方式&＃xff01;
完全正确。
10蓦然回首恭喜你学完了所有的正则教程&＃xff0c;现在你知道正则表达式是什么了吧。
没错&＃xff0c;以前总感觉正则表达式晦涩难懂&＃xff0c;每次用到时就去网上搜索答案&＃xff0c;现在看来也不过如此。
说 不过如此 倒是有些托大了&＃xff0c;虽然我给你介绍了正则表达式的基本规则&＃xff0c;但正则表达式里面还有不少的学问可以去挖掘的。每种技术都有一个熟能生巧的过程。
什么&＃xff1f;还有学问&＃xff1f;我感觉我已经学完了啊&＃xff01;还有什么学问&＃xff0c;一并给我讲了吧&＃xff01;
那你看这样一道题&＃xff1a;给你一些字符串&＃xff0c;统计其末尾 e 的个数
LeetCode
LeetCodeeee
LeetCodeee
看起来并不难&＃xff0c;用 (\w&＃43;)(e*) 匹配&＃xff0c;再取 group(2) 判断即可。
Pattern pattern &＃61; Pattern.compile("(\\w&＃43;)(e*)");Matcher matcher &＃61; pattern.matcher("LeetCode");if (matcher.matches()) {    String group1 &＃61; matcher.group(1);    String group2 &＃61; matcher.group(2);    System.out.println("group1 &＃61; " &＃43; group1 &＃43; ", length &＃61; " &＃43; group1.length());    System.out.println("group2 &＃61; " &＃43; group2 &＃43; ", length &＃61; " &＃43; group2.length());}
你运行一下试试看。
group1 &＃61; LeetCode, length &＃61; 8group2 &＃61; , length &＃61; 0
怎么会这样&＃xff1f;我期望的结果是 group1 等于 LeetCod&＃xff0c;group2 等于 e 才对啊&＃xff01;
这是因为 e 仍然属于 \w 能匹配的范畴&＃xff0c;正则表达式默认会尽可能多地向后匹配&＃xff0c;我们王国将其称之为 贪婪匹配。
贪婪匹配&＃xff0c;听起来和贪心算法有异曲同工之妙。
没错&＃xff0c;贪婪匹配和贪心算法原理是一致的。与之对应的匹配方式叫做 非贪婪匹配&＃xff0c;非贪婪匹配 会在能匹配目标字符串的前提下&＃xff0c;尽可能少的向后匹配。
那么&＃xff0c;我要怎样指定匹配方式为非贪婪匹配呢&＃xff1f;
也很简单&＃xff0c;在需要非贪婪匹配的正则表达式后面加个 ? 即可表示非贪婪匹配。
Pattern pattern &＃61; Pattern.compile("(\\w&＃43;?)(e*)");Matcher matcher &＃61; pattern.matcher("LeetCode");if (matcher.matches()) {    String group1 &＃61; matcher.group(1);    String group2 &＃61; matcher.group(2);    System.out.println("group1 &＃61; " &＃43; group1 &＃43; ", length &＃61; " &＃43; group1.length());    System.out.println("group2 &＃61; " &＃43; group2 &＃43; ", length &＃61; " &＃43; group2.length());}
运行程序&＃xff0c;输出如下&＃xff1a;
group1 &＃61; LeetCod, length &＃61; 7group2 &＃61; e, length &＃61; 1
这里也用的是 ?&＃xff0c;我记得之前 ? 表示的是匹配 0 次或者 1 次&＃xff0c;两个符号不会混淆吗&＃xff1f;
不会混淆的&＃xff0c;你仔细想一想就能明白了&＃xff0c;如果只有一个字符&＃xff0c;那就不存在贪婪不贪婪的问题&＃xff0c;如果匹配多次&＃xff0c;那么表示非贪婪匹配的 ? 前面必有一个标志匹配次数的符号。所以不会出现混淆。
最后一个问题&＃xff0c;为什么这里没有匹配成 group1 等于 L&＃xff0c;group2 等于 ee...... 哦我明白了&＃xff0c;如果这样匹配的话&＃xff0c;字符串 LeetCode 就无法和正则表达式匹配起来。怪不得非贪婪匹配的定义是 在能匹配目标字符串的前提下&＃xff0c;尽可能少的向后匹配。
就是这个原理&＃xff0c;看来你是真的完全明白了。
11最终考验天下没有不散的宴席&＃xff0c;是时候说再见了。虽然我能教你的&＃xff0c;或是说想与你探讨的&＃xff0c;还不止这些内容&＃xff0c;但授人以鱼不如授人以渔&＃xff0c;以后遇到正则相关的问题&＃xff0c;还是要靠你自己动脑思考。
这么快就要告别了吗&＃xff1f;不知道为什么&＃xff0c;竟然还有点舍不得......
我最后再出一道题考考你&＃xff0c;你就可以从正则王国顺利毕业了。来看下你的题目吧&＃xff1a;我们王国有一个人口吃&＃xff0c;请你帮忙矫正他。他今天说&＃xff1a;肚...子。。好饿........&＃xff0c;....早知道.....当.....初...。。。多.....刷.....点。。。力.....扣了.........&＃xff01;
ez&＃xff0c;只需要用 str.replaceAll(__, __) 就可以解决了&＃xff01;
互动话题&＃xff1a;嘿&＃xff0c;说你呢&＃xff01;在留言区写下你的答案吧&＃xff01;    本文作者&＃xff1a;Alpinist Wang编辑&版式&＃xff1a;霍霍声明&＃xff1a;本文归 “力扣” 版权所有&＃xff0c;如需转载请联系。




    
        
                        java
                        正则
                        git
                        express
                        io
                        regex
                        static
                        string
                        int
                    
    



    
        写下你的评论吧 !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
                                    
                
            
        

        
    

    
        推荐阅读
        
            
                                
                    
                        js
                        JavaScript核心知识点与实用技巧汇总
                    

                    
                                                
                        本文总结了JavaScript的核心知识点和实用技巧，涵盖了变量声明、DOM操作、事件处理等重要方面。例如，通过`event.srcElement`获取触发事件的元素，并使用`alert`显示其HTML结构；利用`innerText`和`innerHTML`属性分别设置和获取文本内容及HTML内容。此外，还介绍了如何在表单中动态生成和操作``元素，以便更好地处理用户输入。这些技巧对于提升前端开发效率和代码质量具有重要意义。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-06 20:14:58
                    

                

                
                                
                    
                        default
                        使用JavaScript生成Java兼容的UUID代码实现与优化技巧
                    

                    
                                                
                        本文介绍了UUID（通用唯一标识符）的概念及其在JavaScript中生成Java兼容UUID的代码实现与优化技巧。UUID是一个128位的唯一标识符，广泛应用于分布式系统中以确保唯一性。文章详细探讨了如何利用JavaScript生成符合Java标准的UUID，并提供了多种优化方法，以提高生成效率和兼容性。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-05 18:19:54
                    

                

                                
                    
                    
                
                
                                
                    
                        js
                        利用 Node.js 和 Express（4.x 及以上版本）构建高效文件上传功能
                    

                    
                                                
                        本文介绍了如何使用 Node.js 和 Express（4.x 及以上版本）构建高效的文件上传功能。通过引入 `multer` 中间件，可以轻松实现文件上传。首先，需要通过 `npm install multer` 安装该中间件。接着，在 Express 应用中配置 `multer`，以处理多部分表单数据。本文详细讲解了 `multer` 的基本用法和高级配置，帮助开发者快速搭建稳定可靠的文件上传服务。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-11 18:02:17
                    

                

                
                                
                    
                        string
                        Python 字符串处理全解：常用操作与技巧汇总
                    

                    
                                                
                        本文全面解析了 Python 中字符串处理的常用操作与技巧。首先介绍了如何通过 `s.strip()`, `s.lstrip()` 和 `s.rstrip()` 方法去除字符串中的空格和特殊符号。接着，详细讲解了字符串复制的方法，包括使用 `sStr1 = sStr2` 进行简单的赋值复制。此外，还探讨了字符串连接、分割、替换等高级操作，并提供了丰富的示例代码，帮助读者深入理解和掌握这些实用技巧。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-10 09:01:29
                    

                

                
                                
                    
                        default
                        关于使用JavaScript在多个页面间传递参数的技术探讨
                    

                    
                                                
                        本文探讨了使用JavaScript在不同页面间传递参数的技术方法。具体而言，从a.html页面跳转至b.html时，如何携带参数并使b.html替代当前页面显示，而非新开窗口。文中详细介绍了实现这一功能的代码及注释，帮助开发者更好地理解和应用该技术。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-09 09:28:55
                    

                

                
                                
                    
                        string
                        详解Android连接MySQL数据库的操作流程及技术要点
                    

                    
                                                
                        在Android应用开发中，实现与MySQL数据库的连接是一项重要的技术任务。本文详细介绍了Android连接MySQL数据库的操作流程和技术要点。首先，Android平台提供了SQLiteOpenHelper类作为数据库辅助工具，用于创建或打开数据库。开发者可以通过继承并扩展该类，实现对数据库的初始化和版本管理。此外，文章还探讨了使用第三方库如Retrofit或Volley进行网络请求，以及如何通过JSON格式交换数据，确保与MySQL服务器的高效通信。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-07 19:11:13
                    

                

                
                                
                    
                        string
                        处理大数相加的函数式方法与技巧
                    

                    
                                                
                        在处理大数相加的问题时，有许多方法可以借鉴。本文介绍了两种不同的函数式编程方法：一种是从网络上找到的经典实现，另一种是作者自行设计的创新方案。通过函数式编程的方式重新实现了这两种方法，其中经典实现简洁明了，而创新方案则在性能和可读性方面有所提升。这些方法不仅适用于大数相加，还可以扩展应用于其他数值计算场景。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-05 19:50:19
                    

                

                
                                
                    
                        default
                        深入解析 Kubernetes 亲和性调度机制及其优化策略
                    

                    
                                                
                        在 Kubernetes 中，Pod 的调度通常由集群的自动调度策略决定，这些策略主要关注资源充足性和负载均衡。然而，在某些场景下，用户可能需要更精细地控制 Pod 的调度行为，例如将特定的服务（如 GitLab）部署到特定节点上，以提高性能或满足特定需求。本文深入解析了 Kubernetes 的亲和性调度机制，并探讨了多种优化策略，帮助用户实现更高效、更灵活的资源管理。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-05 17:27:07
                    

                

                
                                
                    
                        string
                        紧急求助！如何运用正则表达式（regexp）进行高效匹配操作？
                    

                    
                                                
                        如何利用正则表达式（regexp）实现高效的模式匹配？本文探讨了正则表达式在编程中的应用，并分析了一个示例程序中存在的问题。通过具体的代码示例，指出该程序在定义和使用正则表达式时的不当之处，旨在帮助读者更好地理解和应用正则表达式技术。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-04 16:53:48
                    

                

                
                                
                    
                        string
                        在 QQmlPropertyMap 的派生类中无法调用槽函数或 Q_INVOKABLE 方法？
                    

                    
                                                
                        在尝试对 QQmlPropertyMap 类进行测试驱动开发时，发现其派生类中无法正常调用槽函数或 Q_INVOKABLE 方法。这可能是由于 QQmlPropertyMap 的内部实现机制导致的，需要进一步研究以找到解决方案。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-11 15:34:22
                    

                

                
                                
                    
                        default
                        深入解析Properties属性类及其应用
                    

                    
                                                
                        属性类 `Properties` 是 `Hashtable` 类的子类，用于存储键值对形式的数据。该类在 Java 中广泛应用于配置文件的读取与写入，支持字符串类型的键和值。通过 `Properties` 类，开发者可以方便地进行配置信息的管理，确保应用程序的灵活性和可维护性。此外，`Properties` 类还提供了加载和保存属性文件的方法，使其在实际开发中具有较高的实用价值。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-11 13:55:43
                    

                

                
                                
                    
                        js
                        单链表的高效遍历及性能优化策略
                    

                    
                                                
                            
                        
                                                
                        本文探讨了单链表的高效遍历方法及其性能优化策略。在单链表的数据结构中，插入操作的时间复杂度为O(n)，而遍历操作的时间复杂度为O(n^2)。通过在 `LinkList.h` 和 `main.cpp` 文件中对单链表进行封装，我们实现了创建和销毁功能的优化，提高了单链表的使用效率。此外，文章还介绍了几种常见的优化技术，如缓存节点指针和批量处理，以进一步提升遍历性能。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-07 15:55:20
                    

                

                
                                
                    
                        function
                        Golomb 编码解析：利用零位标识商与余数的高效算法
                    

                    
                                                
                        Golomb 编码是一种高效的变长编码技术，专门用于整数的压缩。该方法通过预定义的参数 \( M \) 将输入整数分解为商 \( q \) 和余数 \( r \) 两部分。具体而言，输入整数除以 \( M \) 得到商 \( q \) 和余数 \( r \)，其中商 \( q \) 采用一元编码表示，而余数 \( r \) 则使用二进制编码。这种编码方式在数据压缩和信息传输中具有显著的优势，特别是在处理具有特定概率分布的数据时表现出色。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-05 14:49:19
                    

                

                
                                
                    
                        text
                        投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元
                    

                    
                                                
                        投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-05 04:56:42
                    

                

                
                                
                    
                        default
                        探索阿里云RDS中MySQL的高效压缩存储引擎TokuDB应用
                    

                    
                                                
                        在过去，我曾使用过自建MySQL服务器中的MyISAM和InnoDB存储引擎（也曾尝试过Memory引擎）。今年初，我开始转向阿里云的关系型数据库服务，并深入研究了其高效的压缩存储引擎TokuDB。TokuDB在数据压缩和处理大规模数据集方面表现出色，显著提升了存储效率和查询性能。通过实际应用，我发现TokuDB不仅能够有效减少存储成本，还能显著提高数据处理速度，特别适用于高并发和大数据量的场景。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-04 11:36:52

















    

    
        
            
            
                
                
            

            
                猪猪寂寞的王子_125            

            
                这个家伙很懒，什么也没留下！            


        
    

    
    

    
    

    
        Tags | 热门标签
        
            
                                
                    dagger
                
                                
                    hashcode
                
                                
                    version
                
                                
                    utf-8
                
                                
                    export
                
                                
                    md5
                
                                
                    function
                
                                
                    uri
                
                                
                    expression
                
                                
                    httprequest
                
                                
                    iostream
                
                                
                    substring
                
                                
                    netty
                
                                
                    ip
                
                                
                    format
                
                                
                    require
                
                                
                    tags
                
                                
                    httpclient
                
                                
                    text
                
                                
                    flutter
                
                                
                    heatmap
                
                                
                    bitmap
                
                                
                    php
                
                                
                    python3
                
                                
                    string
                
                                
                    usb
                
                                
                    hashtable
                
                                
                    js
                
                                
                    cpython
                
                                
                    default
                
                                
            
        
    

    
    
        
            
            
        
        RankList | 热门文章
        
            
                                
                    1使用ng-change来选择ng对象。 - getting the ng-object selected with ng-change
                
                                
                    2运动控制卡应用开发教程之C#
                
                                
                    3C语言超详细讲解字符串相乘_C 语言
                
                                
                    4ASP.NET 3.5 新特性开发向导实践（附项目源码下载）
                
                                
                    5css中margin外边距合并问题讲解及实例演示
                
                                
                    6.NET CPU爆高事故事故分析某供应链WEB网站
                
                                
                    7为什么我手机的科学计算机算的不对,“手机计算机和科学计算机算出来答案不一样，我到底该信哪个哈？”...
                
                                
                    8在Java项目中打印错误日志的正确姿势
                
                                
                    9开发笔记:ndarray对象的使用方法
                
                                
                    10Python学习18_高级形态学处理
                
                                
                    11android i2c读写,Android 平台下使用 i2ctools
                
                                
                    12CCAI2018 | 大规模文本数据挖掘的新方向
                
                                
                    13自己实现Linux系统任务管理器(附源码)
                
                                
                    14是什么 通信中unit_scala语言基础：面向对象编程中的类与对象
                
                                
                    15通过ASP与ACCESS数据库建立连接（附源码）(3)