热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据库技术:Mysql中正则表达式Regexp常见用法

mysql中regexp常见用法模糊匹配,包含特定字符串#查找content字段中包含“车友俱乐部”的记录select*fromclub_contentwhereco

mysql中regexp常见用法

模糊匹配,包含特定字符串
# 查找content字段中包含“车友俱乐部”的记录

select * from club_content where content regexp ‘车友俱乐部’

# 此时的regexp与like的以下用法是等同的

select * from club_content where content like ‘%车友俱乐部%’

模糊匹配,以特定字符串开头
# 查找content字段中以“车友”开头的记录

select * from club_content where content regexp ‘^车友’

# 此时的regexp与like的以下用法是等同的

select * from club_content where content like ‘车友%’

模糊匹配,以特定字符串结尾
# 查找content字段中以“车友”结尾的记录

select * from club_content where content regexp ‘车友$’

# 此时的regexp与like的以下用法是等同的

select * from club_content where content like ‘%车友’

模糊匹配,或关系
# 查找content字段中包含“心得”、“分享”或“技术贴”

select * from club_content where content regexp ‘心得|分享|技术贴’

模糊匹配,不包含单个字符
# 查找content字段中不包含“车”字、“友”字的记录

select * from club_content where content regexp [^车友]

这个结果跑出来一看大吃一惊,竟然把所有记录给跑出来,这是为什么呢?
因为一旦加了这个方括号”[]”,它就把里面的内容拆成单个的字符再匹配,它会逐个字符去匹配判断是不是等于“车”,或者是不是等于“友“,返回的结果是一组0、1的逻辑值。

如果想匹配不包含特定字符串,该怎么实现呢?

模糊匹配,不包含特定字符串
# 查找content字段不包含“车友”字符串的记录

select * from club_content where content not regexp ‘车友’

mysql regexp运算符匹配字符串

1 ^ 匹配以该字符后面的字符开头的字符串
举个例子: regexp ‘^x’ 表示匹配以x开头的字符
2 $匹配以该字符前面的字符结尾的字符串
举个例子: regexp ‘y$’ 表示匹配以y结尾的字符
3 .匹配任意一个字符
4 […]匹配在方括号中的任意一个字符。
如: [1-9] 匹配1到9的数字, [abc]匹配其中任意一个
5 *匹配零个或多个在它前面的字符
如: x* 匹配任何数量的x字符

mysql 如何判断 “字符串” 是否为 “数字”

这个问题有点怪 ,但很多时候我们会以字符串的形式存储数字 , 反过来我们用字符串进行数学运算时, 好像也不会出错 . 除非 , 用作数学运算的字符串不能转换成数字 .
但是我们改如何判断字符串是否能转换成数字呢 ?

采用mysql的 regexp运算符 . 怎么用?

{string} regexp ‘[^0-9.]’

前面的字符串是我们要做判断的, 后面的字符串是mysql的正则表达式,意思是 匹配不是数字或者小数点的字符。

如果string中含有不是0-9之间的数字或者是小数点时,返回true ,反之则返回false。

比如说 :

select (‘123a’ regexp ‘[^0-9.]’); –‘123a’中含有字符’a’ 输出结果为1 mysql中常量true输出为1 false输出为0

注意:如果字符串中有空格,也会匹配到正则表达式,返回1。如果是要去掉两端的空格,就要将判断的字符串,就要对字符串使用 trim()函数了。

这个只是regexp操作符的简单应用,regexp的详细应用请参考官方文档。 

mysql 正则表达式

在前面的章节我们已经了解到mysql可以通过 like …% 来进行模糊匹配。

mysql 同样也支持其他正则表达式的匹配, mysql中使用 regexp 操作符来进行正则表达式匹配。

如果您了解php或perl,那么操作起来就非常简单,因为mysql的正则表达式匹配与这些脚本的类似。

下表中的正则模式可应用于 regexp 操作符中。

模式 描述
^ 匹配输入字符串的开始位置。如果设置了 regexp 对象的 multiline 属性,^ 也匹配 ‘n’ 或 ‘r’ 之后的位置。
$ 匹配输入字符串的结束位置。如果设置了regexp 对象的 multiline 属性,$ 也匹配 ‘n’ 或 ‘r’ 之前的位置。
. 匹配除 “n” 之外的任何单个字符。要匹配包括 ‘n’ 在内的任何字符,请使用象 ‘[.n]’ 的模式。
[…] 字符集合。匹配所包含的任意一个字符。例如, ‘[abc]’ 可以匹配 “plain” 中的 ‘a’。
[^…] 负值字符集合。匹配未包含的任意字符。例如, ‘[^abc]’ 可以匹配 “plain” 中的’p’。
p1|p2|p3 匹配 p1 或 p2 或 p3。例如,’z|food’ 能匹配 “z” 或 “food”。'(z|f)ood’ 则匹配 “zood” 或 “food”。
* 匹配前面的子表达式零次或多次。例如,zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}。
+ 匹配前面的子表达式一次或多次。例如,’zo+’ 能匹配 “zo” 以及 “zoo”,但不能匹配 “z”。+ 等价于 {1,}。
{n} n 是一个非负整数。匹配确定的 n 次。例如,’o{2}’ 不能匹配 “bob” 中的 ‘o’,但是能匹配 “food” 中的两个 o。
{n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。

实例

了解以上的正则需求后,我们就可以根据自己的需求来编写带有正则表达式的sql语句。以下我们将列出几个小实例(表名:person_tbl )来加深我们的理解:

查找name字段中以’st’为开头的所有数据:

mysql> select name from person_tbl where name regexp ‘^st’;

查找name字段中以’ok’为结尾的所有数据:

mysql> select name from person_tbl where name regexp ‘ok$’;

查找name字段中包含’mar’字符串的所有数据:

mysql> select name from person_tbl where name regexp ‘mar’;

查找name字段中以元音字符开头或以’ok’字符串结尾的所有数据:

mysql> select name from person_tbl where name regexp ‘^[aeiou]|ok$’;

mysql正则regexp学习练习笔记

regexp在mysql是用来执行正则表达式的一个函数,像php中的preg之类的函数了,regexp正则函数如果只是简单的查询使用like即可,但复杂的还是需要使用regexp了,下面我们来看看。

mysql用户手册建议,在构造简单查询时,仍使用通配符。

如:

select [*|fieldname list] from [tablename] where [fieldname] like [“%someletter”|”%someletter%”,”_”,”?someletter”];

但在一些特殊查询中,不用正则表达式是不行的。mysql提供的正则表达式where谓词有三个,分别是:

regexp, rlike, not rlike

用这三个替换原有的like谓词,后面即可以跟正则表达式。
例如要查询字段中含有“_”的数据,则要用以下查询语句:

select * from tablename where fieldname rlike ‘.[_].’;

扩展正则表达式的一些字符是:

· ‘.’匹配任何单个的字符。
· 字符类“[…]”匹配在方括号内的任何字符。例如,“[abc]”匹配“a”、“b”或“c”。为了命名字符的范围,使用一个“-”。“[a-z]”匹配任何字母,而“[0-9]”匹配任何数字。
· “ * ”匹配零个或多个在它前面的字符。例如,“x*”匹配任何数量的“x”字符,“[0-9]*”匹配任何数量的数字,而“.*”匹配任何数量的任何字符。
如果regexp模式与被测试值的任何地方匹配,模式就匹配(这不同于like模式匹配,只有与整个值匹配,模式才匹配)。
为了定位一个模式以便它必须匹配被测试值的开始或结尾,在模式开始处使用“^”或在模式的结尾用“$”。
为了找出以“b”开头的名字,使用“^”匹配名字的开始:
使用正则

select * from pet where name regexp binary ‘^b’;
select * from pet where name regexp ‘fy$’;
select * from pet where name regexp ‘w’;
select * from pet where name regexp ‘^…..$’;
select * from pet where name regexp ‘^.{5}$’;

今天在应用中遇到了这样的一个问题,

有一个字段 t1,其中的值类似于:1,1,1,2,3,3,4,4,5,5,2,4,3,2,1,2
需要从里面搜索出比如说:第一个逗号前的数字范围为3-5之间,第三个逗号前的数字的范围为3-5之间,第10个逗号前的数字范围为3-5之间,其余的都为1-5之间。。。
则sql语句可以这么写:

select * from tb where t1 regexp ‘^[3-5],[1-5],[3-5],[1-5],[1-5],[1-5],[1-5],[1-5],[1-5],[3-5],[1-5],[1-5],[1-5],[1-5],[1-5],[1-5]%’;

1. 使用like和not like比较操作符(注意不能使用=或!=);
2. 模式默认是忽略大小写的;
3. 允许使用”_”匹配任何单个字符,”%”匹配任意数目字符(包括零字符);

附一些mysql正则规则

^ 匹配字符串的开始部分
$ 匹配字符串的结束部分
. 匹配任何字符(包括回车和新行)
a* 匹配0或多个a字符的任何序列
a+ 匹配1个或多个a字符的任何序列
a? 匹配0个或1个a字符
de|abc 匹配序列de或abc
(abc)* 匹配序列adc的0个或者多个实例

{n}、{m,n} {n}或{m,n}符号提供了编写正则表达式的更通用方式,能够匹配模式的很多前述原子(或“部分”)。m和n均为整数。
a* 可被写为a{0,}
a+ 可被写为a{1,}
a? 可被写为a{0,1}

[a-dx] 匹配任何是a,b,c,d或者x的字符,两个其他字符之间的’-‘字符构成一个范围
[^a-dx] 匹配任何不是a,b,c,d或者x的字符,前面的字符’^’是否定的意思

[.characters.] 在括号表达式中(使用[和]),匹配用于校对元素的字符序列,字符为单个字符或新行等字符名
mysql> select ‘~’ regexp ‘[[.~.]]’; -> 1
mysql> select ‘~’ regexp ‘[[.tilde.]]’; -> 1

[=character_class=]
在括号表达式中(使用[和]),[=character_class=]表示等同类。它与具有相同校对值的所有字符匹配,包括它本身,
[[=a=]] 等同于[a(+)],[a+],[a{1,}]

[:character_class:]
在括号表达式中(使用[和]),[:character_class:]表示与术语类的所有字符匹配的字符类。

标准的类名称是:

alnum 文字数字字符
alpha 文字字符
blank 空白字符
cntrl 控制字符
digit 数字字符
graph 图形字符
lower 小写文字字符
print 图形或空格字符
punct 标点字符
space 空格、制表符、新行、和回车
upper 大写文字字符
xdigit 十六进制数字字符

[[:<:]], [[:>:]]

这些标记表示word边界。它们分别与word的开始和结束匹配。word是一系列字字符,其前面和后面均没有字字符。字符是alnum类中的字母数字字符或下划线(_)。

mysql> select ‘fang shan zi’ regexp ‘[[:<:]]shan[[:>:]]’; -> 1
mysql> select ‘fang shan zi’ regexp ‘[[:<:]]fang[[:>:]]’; -> 1
mysql> select ‘fang shans zi’ regexp ‘[[:<:]]shan[[:>:]]’; -> 0

正则表达式使用特殊字符,应在其前面加上2个反斜杠”字符

mysql> select ‘1+2′ regexp ‘1+2′; -> 0
mysql> select ‘1+2′ regexp ‘1+2′; -> 0
mysql> select ‘1+2′ regexp ‘1+2′; -> 1

mysql 查寻条件使用正则 regexp

我用的是 mybatis

t.hobby : 条件字段
hobby : 查寻参数,值可以是多个逗号分隔的值:‘阅读,交友,围棋’




 concat(‘,’,replace (t.hobby, ‘ ‘, ”),’,’) regexp concat(‘,(‘,replace(#{hobby},’,’,’|’),’),’)



 concat(‘,’,replace (‘    吃,  喝,嫖,赌  , 抽,坑,蒙,拐,骗,偷 ‘, ‘ ‘, ”),’,’) regexp concat(‘,(‘,replace(#{hobby},’,’,’|’),’),’)



 concat(‘,’,’吃,喝,嫖,赌,抽,坑,蒙,拐,骗,偷’,’,’) regexp concat(‘,(‘,replace(#{hobby},’,’,’|’),’),’)



 ‘,吃,喝,嫖,赌,抽,坑,蒙,拐,骗,偷,’ regexp concat(‘,(‘,replace(#{hobby},’,’,’|’),’),’)



 ‘,吃,喝,嫖,赌,抽,坑,蒙,拐,骗,偷,’ regexp concat(‘,(‘,replace(‘吃,喝,嫖,嫖’,’,’,’|’),’),’)



 ‘,吃,喝,嫖,赌,抽,坑,蒙,拐,骗,偷,’ regexp concat(‘,(‘,’吃|喝|嫖|嫖’,’),’)



 ‘,吃,喝,嫖,赌,抽,坑,蒙,拐,骗,偷,’ regexp ‘,(吃|喝|嫖|嫖),’

得到结果是 1 作为条件就是真了。

复杂的过程主要是用来处理查寻条件。得到符合要求的正则作条件就ok了
但个人觉得,更理想的方式是:
被查寻字段在当初存入数据时就处理好格式:’吃,喝,嫖,赌,抽,坑,蒙,拐,骗,偷’
查寻条件可以处理好传进来:’,(吃|喝|嫖|嫖),’
那么一个查寻就可以简化成这样


 concat(‘,’, t.hobby ,’,’) regexp #{hobby}

到这就差不多了,基本上就可以看得懂了,实在不行就参考下面的相关文章。

需要了解更多数据库技术:Mysql中正则表达式Regexp常见用法,都可以关注数据库技术分享栏目—编程笔记


推荐阅读
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • PHP设置MySQL字符集的方法及使用mysqli_set_charset函数
    本文介绍了PHP设置MySQL字符集的方法,详细介绍了使用mysqli_set_charset函数来规定与数据库服务器进行数据传送时要使用的字符集。通过示例代码演示了如何设置默认客户端字符集。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
  • 本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用,包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • PHP图片截取方法及应用实例
    本文介绍了使用PHP动态切割JPEG图片的方法,并提供了应用实例,包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用,以及图片切割的具体步骤。同时,还提供了一些注意事项和优化建议。通过本文的学习,读者可以掌握PHP图片截取的技巧,实现自己的需求。 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
author-avatar
ii贵妇狗_156
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有