热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SpringBoot集成ES实现分词查询,并实现相关内容高亮

SpringBoot集成ES实现分词查询一.写在前面二.准备工作三.逻辑四.具体操作1.创建索引2.给ES中添加数据3.分词查询并对相关词条进行高亮4.测试结果一.写在前面这是我第




SpringBoot集成ES实现分词查询


    • 一. 写在前面
    • 二. 准备工作
    • 三. 逻辑
    • 四. 具体操作
      • 1.创建索引
      • 2. 给ES中添加数据
      • 3. 分词查询并对相关词条进行高亮
      • 4. 测试结果



一. 写在前面

这是我第一次用ES,是直接看的文档然后实现的,只顾着实现效果去了,可能很多细节还做不到位。然后调用的是javaAPI去操作的ES。如果有写的不对的地方,或者有哪些可以改进的地方,请评论区指出,谢谢!
顺便再说一下实现的效果,搜索“英雄联盟”可以查到“英雄归来”、“和平精英”等结果。


二. 准备工作

首先我们得安装一下ES,网上这么多教程而且安装下来很简单,这里就不说了。
导入一下jar包。



org.elasticsearch
elasticsearch
7.8.0



org.elasticsearch.client
elasticsearch-rest-high-level-client
7.8.0



commons-beanutils
commons-beanutils
1.9.3


commons-collections
commons-collections
3.2.1


commons-lang
commons-lang
2.6


commons-logging
commons-logging
1.1.1


net.sf.ezmorph
ezmorph
1.0.6


net.sf.json-lib
json-lib
2.2.3
jdk15


三. 逻辑

这里大概讲一下逻辑,ES服务器我初步可以理解为一个非关系型的数据库。大概流程就是先创建一个索引(可以理解为数据库),然后将你的每条数据记录给存进去,这个记录(也就是MySQL表里面的一行数据)称为文档。然后查询的时候,就根据你的fields(理解为MySQL表中的一列也叫字段)进行查询。
ES会自动将你存入的数据给分词(ES支持的数据类型中,String类型的数据又有两种,text也是默认的,支持分词,还有一种是keyword,不支持分词,显然如果你想你的数据只能完全匹配那你就得修改你的数据类型为keyword),然后给每一个词条建立索引,构成一个倒排索引表。倒排索引,我粗略的理解是这样的,首先正向的索引,就比如从数据库中遍历每条记录去查询你模糊查询匹配的词条。倒排索引就是根据你的词条(索引)直接就可以找到对应的记录。万物皆索引和倒排索引也就是ES为什么查的快的主要原因。


四. 具体操作


1.创建索引

这个直接用postman put一个请求就行。链接依次为http协议:IP地址:端口/索引名称。ES默认的通信端口就是9200。lll是我随便取的一个索引名称。
在这里插入图片描述
没有postman的也可以写一个单元测试,然后使用javaAPI创建。

//创建客户端链接对象,localhost为IP地址,可以更改。
RestHighLevelClient client = new RestHighLevelClient(
RestClient.builder(new HttpHost("localhost", 9200, "http"))
);
//创建创建索引请求,eee为索引名称,可以更换
CreateIndexRequest request = new CreateIndexRequest("eee");
//获取ES的响应
CreateIndexResponse respOnse= client.indices().create(request,
RequestOptions.DEFAULT);
//打印true则成功创建
System.out.println(response.isAcknowledged());
//关闭客户端
client.close();

2. 给ES中添加数据

这里是添加的一行的数据,实际中可以循环添加多行,也可以一次性添加多行,ES有对应的接口。

//创建客户端,localhost为IP地址,可以更改。
RestHighLevelClient client =
new RestHighLevelClient(RestClient.builder(
new HttpHost("localhost",9200,"http")));
//创建索引请求
IndexRequest request = new IndexRequest();
//假设我们这里查出的每条记录都封装成一个map集合对象(当然也可以是普通的对象)
//eee是上面创建的索引名称
//userid是给增加的文档的ID(相当于MySQL表的一行数据的ID)ID不写也可以,ES会默认给一个ID。
request.index("eee").id(userid);
//转换为JSON字符串
ObjectMapper objectMapper = new ObjectMapper();
String string = objectMapper.writeValueAsString(map);
request.source(string, XContentType.JSON);
//发送请求并获取响应
IndexResponse respOnse= client.index(request, RequestOptions.DEFAULT);
System.out.println(response);
}
//关闭客户端
client.close();

3. 分词查询并对相关词条进行高亮

LinkedList list = new LinkedList<>();
//链接客户端
RestHighLevelClient client =
new RestHighLevelClient(RestClient.builder(
new HttpHost("localhost", 9200, "http")));
//构建查询请求
SearchRequest request = new SearchRequest();
//绑定索引
request.indices("eee");
//构建查询条件,username为想查询对应的字段,英雄联盟为输入的查询的内容
SearchSourceBuilder builder = new SearchSourceBuilder();
builder.query(QueryBuilders.matchQuery("articleTitle", "英雄联盟"));
//构建高亮条件
HighlightBuilder highlightBuilder =new HighlightBuilder();
//高亮词条前缀
highlightBuilder.preTags("");
//高亮词条后缀
highlightBuilder.postTags("
");
//高亮的字段
highlightBuilder.field("articleTitle");
builder.highlighter(highlightBuilder);
//添加查询条件到请求中
request.source(builder);
//发送请求并获得响应
SearchResponse respOnse= client.search(request, RequestOptions.DEFAULT);
//获取查询到的结果
for (SearchHit hit : response.getHits()) {
//以map集合封装,highlightFields 就是查出来一条文档(记录)
Map highlightFields = hit.getHighlightFields();
//获取高亮结果
Text[] username= highlightFields.get("articleTitle").getFragments();
//覆盖原来map集合中的username的值
hit.getSourceAsMap().put("articleTitle",articleTitles[0].toString());
}
//关闭客户端
client.close();

4. 测试结果

我这里用swagger测试,也可以用postman,或者单元测试。
在这里插入图片描述



推荐阅读
author-avatar
单纯只是一2502904797
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有