作者:单纯只是一2502904797 | 来源:互联网 | 2023-09-07 19:42
SpringBoot集成ES实现分词查询一.写在前面二.准备工作三.逻辑四.具体操作1.创建索引2.给ES中添加数据3.分词查询并对相关词条进行高亮4.测试结果一.写在前面这是我第
SpringBoot集成ES实现分词查询
- 一. 写在前面
- 二. 准备工作
- 三. 逻辑
- 四. 具体操作
- 1.创建索引
- 2. 给ES中添加数据
- 3. 分词查询并对相关词条进行高亮
- 4. 测试结果
一. 写在前面
这是我第一次用ES,是直接看的文档然后实现的,只顾着实现效果去了,可能很多细节还做不到位。然后调用的是javaAPI去操作的ES。如果有写的不对的地方,或者有哪些可以改进的地方,请评论区指出,谢谢!
顺便再说一下实现的效果,搜索“英雄联盟”可以查到“英雄归来”、“和平精英”等结果。
二. 准备工作
首先我们得安装一下ES,网上这么多教程而且安装下来很简单,这里就不说了。
导入一下jar包。
org.elasticsearch
elasticsearch
7.8.0
org.elasticsearch.client
elasticsearch-rest-high-level-client
7.8.0
commons-beanutils
commons-beanutils
1.9.3
commons-collections
commons-collections
3.2.1
commons-lang
commons-lang
2.6
commons-logging
commons-logging
1.1.1
net.sf.ezmorph
ezmorph
1.0.6
net.sf.json-lib
json-lib
2.2.3
jdk15
这里大概讲一下逻辑,ES服务器我初步可以理解为一个非关系型的数据库。大概流程就是先创建一个索引(可以理解为数据库),然后将你的每条数据记录给存进去,这个记录(也就是MySQL表里面的一行数据)称为文档。然后查询的时候,就根据你的fields(理解为MySQL表中的一列也叫字段)进行查询。
ES会自动将你存入的数据给分词(ES支持的数据类型中,String类型的数据又有两种,text也是默认的,支持分词,还有一种是keyword,不支持分词,显然如果你想你的数据只能完全匹配那你就得修改你的数据类型为keyword),然后给每一个词条建立索引,构成一个倒排索引表。倒排索引,我粗略的理解是这样的,首先正向的索引,就比如从数据库中遍历每条记录去查询你模糊查询匹配的词条。倒排索引就是根据你的词条(索引)直接就可以找到对应的记录。万物皆索引和倒排索引也就是ES为什么查的快的主要原因。
四. 具体操作
1.创建索引
这个直接用postman put一个请求就行。链接依次为http协议:IP地址:端口/索引名称。ES默认的通信端口就是9200。lll是我随便取的一个索引名称。
没有postman的也可以写一个单元测试,然后使用javaAPI创建。
//创建客户端链接对象,localhost为IP地址,可以更改。
RestHighLevelClient client = new RestHighLevelClient(
RestClient.builder(new HttpHost("localhost", 9200, "http"))
);
//创建创建索引请求,eee为索引名称,可以更换
CreateIndexRequest request = new CreateIndexRequest("eee");
//获取ES的响应
CreateIndexResponse respOnse= client.indices().create(request,
RequestOptions.DEFAULT);
//打印true则成功创建
System.out.println(response.isAcknowledged());
//关闭客户端
client.close();
2. 给ES中添加数据
这里是添加的一行的数据,实际中可以循环添加多行,也可以一次性添加多行,ES有对应的接口。
//创建客户端,localhost为IP地址,可以更改。
RestHighLevelClient client =
new RestHighLevelClient(RestClient.builder(
new HttpHost("localhost",9200,"http")));
//创建索引请求
IndexRequest request = new IndexRequest();
//假设我们这里查出的每条记录都封装成一个map集合对象(当然也可以是普通的对象)
//eee是上面创建的索引名称
//userid是给增加的文档的ID(相当于MySQL表的一行数据的ID)ID不写也可以,ES会默认给一个ID。
request.index("eee").id(userid);
//转换为JSON字符串
ObjectMapper objectMapper = new ObjectMapper();
String string = objectMapper.writeValueAsString(map);
request.source(string, XContentType.JSON);
//发送请求并获取响应
IndexResponse respOnse= client.index(request, RequestOptions.DEFAULT);
System.out.println(response);
}
//关闭客户端
client.close();
3. 分词查询并对相关词条进行高亮
LinkedList list = new LinkedList<>();
//链接客户端
RestHighLevelClient client =
new RestHighLevelClient(RestClient.builder(
new HttpHost("localhost", 9200, "http")));
//构建查询请求
SearchRequest request = new SearchRequest();
//绑定索引
request.indices("eee");
//构建查询条件,username为想查询对应的字段,英雄联盟为输入的查询的内容
SearchSourceBuilder builder = new SearchSourceBuilder();
builder.query(QueryBuilders.matchQuery("articleTitle", "英雄联盟"));
//构建高亮条件
HighlightBuilder highlightBuilder =new HighlightBuilder();
//高亮词条前缀
highlightBuilder.preTags("");
//高亮词条后缀
highlightBuilder.postTags("");
//高亮的字段
highlightBuilder.field("articleTitle");
builder.highlighter(highlightBuilder);
//添加查询条件到请求中
request.source(builder);
//发送请求并获得响应
SearchResponse respOnse= client.search(request, RequestOptions.DEFAULT);
//获取查询到的结果
for (SearchHit hit : response.getHits()) {
//以map集合封装,highlightFields 就是查出来一条文档(记录)
Map highlightFields = hit.getHighlightFields();
//获取高亮结果
Text[] username= highlightFields.get("articleTitle").getFragments();
//覆盖原来map集合中的username的值
hit.getSourceAsMap().put("articleTitle",articleTitles[0].toString());
}
//关闭客户端
client.close();
4. 测试结果
我这里用swagger测试,也可以用postman,或者单元测试。