当前位置: 开发笔记 > 编程语言 > 正文

从零开始学习MySQL全文索引

作者：手机用户2502931183 | 来源：互联网 | 2023-05-18 09:02

目录一、为什么要用全文索引二、什么是全文索引三、如何创建全文索引四、创建测试数据五、查询-使用自然语言模式六、查询-使用布尔模式（强大的语法）语法示例七、查询-使用扩展模式八、注意

一、为什么要用全文索引

二、什么是全文索引

三、如何创建全文索引

四、创建测试数据

五、查询-使用自然语言模式

六、查询-使用布尔模式（强大的语法）
- 语法
- 示例

七、查询-使用扩展模式

八、注意事项

一、为什么要用全文索引
我们在用一个东西前，得知道为什么要用它，使用全文索引无非有以下原因

like查询太慢、json字段查询太慢（车太慢了）

没时间引入ElasticSearch、Solr或者Sphinx这样的软件，或者根本就不会用（无法将五菱宏光换成兰博基尼，即使有兰博基尼也不会开）

加索引、联合索引啥的都已经慢得不行了（限速80，车顶盖都卸了也只能开到30）

为了提升一下自己的逼格（人家问你有没有开过法拉利，你说开过肯定更有气质一点）

二、什么是全文索引
简单的说，全文索引就相当于大词典中的目录，通过查询目录可以快速定位到想看的内容。

全文索引通过建立`倒排索引`来快速匹配文档（仅在mysql5.6版本以上支持）

全文索引将连续的`字母、数字和下划线`当做一个单词，分割单词一般用`空格/逗号/句号`

MySQL的全文索引支持以下3种查询模式：

自然语言模式（`IN NATURAL LANGUAGE MODE`）

通过MATCH AGAINST 传递某个特定的字符串来进行检索

布尔模式（`IN BOOLEAN MODE`）

支持操作符，例如+表示包含，-表示不包含

扩展模式（`WITH QUERY EXPANSION`）

相当于自然语言模式下的一个扩展，执行两次检索，第一次使用给定短语检索，第二次是结合第一次相关性比较高的行进行检索.

更多请看：官方文档
下面教大家如何创建全文索引，并创建测试数据演示三种查询模式的使用

三、如何创建全文索引

方式一：建表时指定

`CREATE TABLE light_weight_baby ( id INT AUTO_INCREMENT NOT NULL PRIMARY KEY, title VARCHAR(200), content TEXT, FULLTEXT(title, content) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 ;`

方式二：ALTER添加

`ALTER TABLE table_name ADD FULLTEXT INDEX index_name (column1,column2,...);`

方式三：CRATE INDEX添加

`CREATE FULLTEXT INDEX index_name ON table_name (column1,column2,...);`

四、创建测试数据
创建一个数据库用来演示这三种模式下的检索
`CREATE DATABASE chenqionghe DEFAULT CHARSET utf8;`
创建一个文章表并插入测试数据
`CREATE TABLE articles ( id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY, title VARCHAR(200), body TEXT, FULLTEXT (title,body) ) ENGINE=InnoDB;`
插入测试数据
`INSERT INTO articles (title,body) VALUES ('MySQL Tutorial','DBMS stands for DataBase ...'), ('How To Use MySQL Well','After you went through a ...'), ('Optimizing MySQL','In this tutorial we will show ...'), ('1001 MySQL Tricks','1. Never run mysqld as root. 2. ...'), ('MySQL vs. YourSQL','In the following database comparison ...'), ('MySQL Security','When configured properly, MySQL ...');`
执行结果如下

五、查询-使用自然语言模式
这是MySQL的默认查询模式，简单示例如下
`SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('database' IN NATURAL LANGUAGE MODE);`
可以看到，不区分大小写，title或body包含database的都返回了，另外，返回的结果将以相关性进行排序。

相关性：根据行中的字段、唯一单词的数量、集合中单词总数和包含特定单词的行数计算。

下面通过两种方式统计数量
`# 第一种方式 SELECT COUNT(*) FROM articles WHERE MATCH (title,body) AGAINST ('database' IN NATURAL LANGUAGE MODE); # 第二种方式 SELECT COUNT(IF(MATCH (title,body) AGAINST ('database' IN NATURAL LANGUAGE MODE), 1, NULL)) AS count FROM articles;`
第一种做了一些额外的工作（按相关性对结果进行排序），但也能使用索引进行查询。

第二种执行了全表扫描，如果搜索项出现在大多数行中，可能比索引查询更快

匹配少数行，第一种快，匹配大多数行，第二种快
下面演示如何检索相关性，但不会进行排序（因为不包含`WHERE`和`ORDER BY`）
`SELECT id, MATCH (title,body) AGAINST ('Tutorial' IN NATURAL LANGUAGE MODE) AS score FROM articles;`
下面的示例更复杂，返回倒序后的相关性值，分别在SELECT和WHERE语句中使用了MATCH，但是不会导致额外的开销，因为mysql优化器注意到两次MATCH是相同的，只会使用一次全文搜索
`SELECT id, body, MATCH (title,body) AGAINST ('Security implications of running MySQL as root' IN NATURAL LANGUAGE MODE) AS score FROM articles WHERE MATCH (title,body) AGAINST ('Security implications of running MySQL as root' IN NATURAL LANGUAGE MODE);`
包含在("")中字符中的会被分解为单词，然后在全文索引中进行搜索，简单的说，就是进行OR查询。

六、查询-使用布尔模式（强大的语法）
使用布尔模式需要指定`IN BOOLEAN MODE`，不会自动根据相关性排序，一些字符具有特殊的含义，例如可以通过+或-表示一个单词必须存在或不存在。

下面的sql语句代表查询必须包含MySQL但不包含YourSQL
`SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('+MySQL -YourSQL' IN BOOLEAN MODE);`

语法

+

必须出现

-

必须不出现。

注意：这个操作符是用来排除其他操作符的结果，如果只指定这个，将什么都不返回

无符号

默认情况，代表或，自动分词搜索。和没有指定IN BOOLEAN MODE的结果一样

@distance

用来测试两个或两个以上的单词是否都在一个指定的距离内，在@距离前指定双引号中的搜索词，例如MATCH(col1) AGAINST('"word1 word2 word3" @8' IN BOOLEAN MODE

>

提高该条匹配数据的权重值

<

降低该条匹配数据的权重值

()

相当于表达式分组，和我们数学中的表达式一个道理

~

将其相关性由正转负，表示拥有该字会降低相关性，例如+apple ~macintosh 先匹配apple，但如果同时包含macintosh，排名会靠后

*

通配符，只能在字符串后面使用

"

完全匹配，被双引号包起来的单词必须整个被匹配

示例

apple banana

包含apple或banana其中一个

+apple +juice

必须同时包含apple和juice

+apple macintosh

包含apple，但是如果同时包含macintosh会给更高的排序

+apple -macintosh

包信apple但是不包含macintosh

+apple ~macintosh

包含apple，如果同时包含macintosh降低权重

+apple +(>turnover 1.包含apple和turnover，或，包含apple和strudel 2.包含apple和turnover权重高于包含apple和strudel的记录


apple*

包含apple单词的行， “apple”, “apples”, “applesauce”, “applet”都会被匹配到

"some words"

完全匹配·some words·的行，例如 “some words of wisdom”能匹配但“some noise words”匹配不到


七、查询-使用扩展模式当搜索短语很短时非常有用，例如搜索database可能意味着MySQL、Oracle、DB2、RDBMS都要被匹配到，这就是这个模式能做的。

添加WITH QUERY EXPANSION或 IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION启用，它会执行两次检索，第一次使用给定短语检索，第二次是结合第一次相关性比较高的行进行检索。

例如下面的例子
# 自然语言模式
SELECT * FROM articles
     WHERE MATCH (title,body)
    AGAINST ('database' IN NATURAL LANGUAGE MODE);
# 扩展模式
SELECT * FROM articles
    WHERE MATCH (title,body)
    AGAINST ('database' WITH QUERY EXPANSION);
可以看到第二条语句找到了包含MySQL的行，即使该行不包含database，但是因为在第一次的搜索中搜索引擎判断MySQL和database的相关性比较高，所以在执第二次搜索的时候返回了。

八、注意事项

只能在类型为CHAR、VARCHAR或者TEXT的字段上创建全文索引2.

MATCH (字段) AGAINST (关键词)，必须和创建时的字段一起，例如MATCH (light,weight,baby)使用的字段名与全文索引muscle(light,weight,baby)定义的字段名一致。如果只对单个字段查询，需要分别创建全文索引

全文索引是以词为基础的，innodb_ft_min_token_size和innodb_ft_max_token_size用来设置单词的最大和最小长度，不在这个长度区间的将忽略。

在停用词stopwords中的将被忽略

如果要导入大量数据，先导入数据再建全文索引，比先建全文索引再导入数据的方式快很多。

在MySQL 5.7.6之前，全文索引只支持英文全文索引，不支持中文全文索引，MySQL 5.7.6后内置了ngram全文解析器，支持中文、日文、韩文分词。




    
        
                        mysql
                        扩展
                        json
                        elasticsearch
                        solr
                        match
                        io
                        int
                        key
                    
    



    
        写下你的评论吧 !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
                                    
                
            
        

        
    

    
        推荐阅读
        
            
                                
                    
                        include
                        Docker 环境下 MySQL 双主同步配置指南
                    

                    
                                                
                            
                        
                                                
                        本文介绍了如何在 Docker 环境中配置 MySQL 的双主同步，包括目录结构的创建、配置文件的编写、容器的创建与设置以及最终的验证步骤。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-14 17:21:23
                    

                

                
                                
                    
                        include
                        MySQL学习之路(二)——数据类型和操作数据表
                    

                    
                                                
                        数据类型和操作数据表2.1MySQL类型之整型2.2MySQL数据类型之浮点型2.3日期时间型DATE1支持时间：1000年1月1日~9999年12月31日DATETIME ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 10:11:09
                    

                

                                
                    
                    
                
                
                                
                    
                        include
                        掌握MySQL数据库的基础语法与核心操作
                    

                    
                                                
                        本文详细介绍了MySQL数据库的基础语法与核心操作，涵盖从基础概念到具体应用的多个方面。首先，文章从基础知识入手，逐步深入到创建和修改数据表的操作。接着，详细讲解了如何进行数据的插入、更新与删除。在查询部分，不仅介绍了DISTINCT和LIMIT的使用方法，还探讨了排序、过滤和通配符的应用。此外，文章还涵盖了计算字段以及多种函数的使用，包括文本处理、日期和时间处理及数值处理等。通过这些内容，读者可以全面掌握MySQL数据库的核心操作技巧。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-11 23:39:51
                    

                

                
                                
                    
                        timezone
                        Spring Boot 中使用 spring-boot-starter-quartz 实现定时任务
                    

                    
                                                
                        本文介绍了如何在 Spring Boot 项目中使用 spring-boot-starter-quartz 组件实现定时任务，并将 cron 表达式存储在数据库中，以便动态调整任务执行频率。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-14 18:55:09
                    

                

                
                                
                    
                        match
                        Android Studio SQLite 数据库 增删改查 简单（代码参考）
                    

                    
                                                
                        一个建表一个执行crud操作建表代码importandroid.content.Context;importandroid.database.sqlite.SQLiteDat ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-14 11:01:49
                    

                

                
                                
                    
                        case
                        MySQL初级篇——字符串、日期时间、流程控制函数的相关应用
                    

                    
                                                
                            
                        
                                                
                        文章目录：1.字符串函数2.日期时间函数2.1获取日期时间2.2日期与时间戳的转换2.3获取年月日、时分秒、星期数、天数等函数2.4时间和秒钟的转换2. ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-14 10:57:02
                    

                

                
                                
                    
                        list
                        Java DAO模式详解与代码示例
                    

                    
                                                
                        DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-13 12:25:33
                    

                

                
                                
                    
                        python
                        Pythonmysql数据库
                    

                    
                                                
                        importpymysql#一、直接连接mysql数据库'''coonpymysql.connect(host'192.168.*.*',u ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 16:51:59
                    

                

                
                                
                    
                        python
                        Python 使用 DOM 和 SAX 解析 XML 的应用实例
                    

                    
                                                
                        本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 16:10:39
                    

                

                
                                
                    
                        list
                        如何在Java中使用DButils类
                    

                    
                                                
                            
                        
                                                
                        这期内容当中小编将会给大家带来有关如何在Java中使用DButils类，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。D ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 13:46:11
                    

                

                
                                
                    
                        version
                        php更新数据库字段的函数是,php更新数据库字段的函数是
                    

                    
                                                
                        php更新数据库字段的函数是,php更新数据库字段的函数是 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 11:37:31
                    

                

                
                                
                    
                        loops
                        Oracle 中从 XMLType 列提取数据并插入到 VARCHAR2 列：性能优化
                    

                    
                                                
                        本文讨论了在 Oracle 10gR2 和 Solaris 10 64-bit 环境下，从 XMLType 列中提取数据并插入到 VARCHAR2 列时遇到的性能问题，并提供了优化建议。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-15 11:32:10
                    

                

                
                                
                    
                        dll
                        包含phppdoerrorcode的词条
                    

                    
                                                
                        包含phppdoerrorcode的词条 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-14 12:06:14
                    

                

                
                                
                    
                        dll
                        SQL 批量导入时管理外键约束
                    

                    
                                                
                        本文介绍如何在将数据库从服务器复制到本地时，处理因外键约束导致的数据插入失败问题。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 19:05:11
                    

                

                
                                
                    
                        blob
                        MySQL 5.7 学习指南：SQLyog 中的主键、列属性和数据类型
                    

                    
                                                
                            
                        
                                                
                        本文介绍了 MySQL 5.7 中主键（Primary Key）和自增（Auto-Increment）的概念，以及如何在 SQLyog 中设置这些属性。同时，还探讨了数据类型的分类和选择，以及列属性的设置方法。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-11-12 15:57:04

















    

    
        
            
            
                
                
            

            
                手机用户2502931183            

            
                这个家伙很懒，什么也没留下！            


        
    

    
    

    
    

    
        Tags | 热门标签
        
            
                                
                    triggers
                
                                
                    hashset
                
                                
                    audio
                
                                
                    dagger
                
                                
                    testing
                
                                
                    version
                
                                
                    bash
                
                                
                    js
                
                                
                    settings
                
                                
                    foreach
                
                                
                    list
                
                                
                    blob
                
                                
                    case
                
                                
                    future
                
                                
                    range
                
                                
                    bitmap
                
                                
                    include
                
                                
                    php7
                
                                
                    window
                
                                
                    cookie
                
                                
                    cSharp
                
                                
                    python
                
                                
                    split
                
                                
                    chat
                
                                
                    timezone
                
                                
                    loops
                
                                
                    dll
                
                                
                    request
                
                                
                    match
                
                                
                    cmd
                
                                
            
        
    

    
    
        
            
            
        
        RankList | 热门文章
        
            
                                
                    1【数据结构与算法】之排序全家桶(十大排序详解及其Java实现)第七篇
                
                                
                    2终结元朝的一场决战，揭秘捕鱼儿海之役的过程
                
                                
                    3利用cacti添加mysql监控_cacti监控mysql  mysql复制
                
                                
                    4【题解】AHOI2009同类分布
                
                                
                    5java实现zookeeper的增删改查
                
                                
                    6网络Cisco考试
                
                                
                    7css画电脑键盘_html/css_WEBITnose
                
                                
                    8【Java开发岗：Spring篇】
                
                                
                    9值传递与引用数据类型传递
                
                                
                    10C#中的volatile关键字
                
                                
                    11解决HyperV无法生效
                
                                
                    12开发笔记:网络协议系列八传输层TCP之可靠传输
                
                                
                    13案例参考－IT运维整体解决方案
                
                                
                    14网络模型_地铁时刻表建模之事件活动网络模型
                
                                
                    15危险的森林里