热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES

一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&#

一、认识ElasticSearch

是一个基于Lucene的开源搜索引擎,通过简单的RESTful API来隐藏Lucene的复杂性。全文搜索,分析系统,分布式数据库;elasticsearch的革命性就在于将这些单一的有用的技术整合成一个一体化的”实时的应用”。

 

二、ElasticSearch环境搭建

1.安装ElasticSearch

从官网下载,https://www.elastic.co/downloads/elasticsearch,选择自己想要的版本下载到本地,然后解压;

 

2.安装Kibana

从官网下载,https://www.elastic.co/downloads/kibana,这里选择和ElasticSearch一样的版本,然后解压。

Kibana是一个为 ElasticSearch 提供数据分析的 Web 接口。可使用它对日志进行高效的搜索、可视化、分析等各种操作。

 

3.安装X-pack

是ElasticSearch的一个扩展包,包括安全、警告、监视、图形、报告等功能集成在一个软件包,方便我们操作ElasticSearch。

到ElasticSearch目录,执行./bin/elasticsearch-plugin install x-pack;到Kibana目录,执行./bin/kibana-plugin install x-pack。

 

4.启动ElasticSearch和Kibana+访问

启动ElasticSearch:ES目录执行./bin/elasticsearch;

启动Kibana:Kibana目录执行./bin/kibana

 

访问Kibana:http://localhost:5601/



 

 

特别注意:登录的默认用户名和密码分别是:elastic和changeme 。

 

三、MySQL数据同步到ElasticSearch

自己在网上找了很多资料,最后选择采用logstash-input-jdbc的方式进行MySQL数据到ES的同步,已经做了一个初步的尝试,感觉还不错。现在仅仅尝试了一次同步一个表的数据,批量数据同步还需要研究。下面是我们进行数据同步的一些步骤:

 

步骤一:安装Ruby

因为logstash-input-jdbc是logstash的一个插件,使用ruby开发。自己本地是在MacOS上,安装方式:ruby -e "$(curl --insecure -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)";

 

步骤二:安装logstash-input-jdbc

首先从官网下载logstash:https://www.elastic.co/downloads/logstash,解压之后进入本地的logstash目录,到bin目录下面执行命令:./logstash-plugin install logstash-input-jdbc,安装的过程需要花费一点时间,静待一会儿,耐心等待,直到出现Installation successful。

 

步骤三:使用logstash-input-jdbc

进入本地的logstash/bin目录,创建mysql目录,并添加jdbc.confjdbc.sql两个文件,并且加入mysql驱动。下面贴出jdbc.conf和jdbc.sql文件的内容,这里实现了同步MySQL中一个表的数据到ES。

 

jdbc.conf文件内容如下:

input {  

    stdin {

    }  

 

    jdbc {  

      # mysql 数据库链接,test为数据库名  

      jdbc_connection_string => "jdbc:mysql://127.0.0.1:3306/test"  

      # 登录mysql数据库用户名和密码  

      jdbc_user => "root"  

      jdbc_password => "root"  

      # 驱动  

      jdbc_driver_library => "/Users/wuhoujian/Documents/myself/learning/elasticsearch/logstash-5.5.1/bin/mysql/mysql-connector-java-5.1.38.jar"  

      # 驱动类名  

      jdbc_driver_class => "com.mysql.jdbc.Driver"  

      jdbc_paging_enabled => "true"  

      jdbc_page_size => "50000"  

      # 执行的sql 文件路径+名称  

      statement_filepath => "/Users/wuhoujian/Documents/myself/learning/elasticsearch/logstash-5.5.1/bin/mysql/jdbc.sql"  

      # 设置监听间隔  各字段含义(由左至右)分、时、天、月、年,全部为*默认含义为每分钟都更新  

      #schedule => "* * * * *"  

      # 索引类型  

      type => "pattern"  

    }  

}  

  

filter {  

    json {  

        source => "pattern" 

    }  

}  

  

output {  

    elasticsearch {  

        # ES的IP地址及端口  

        hosts => ["localhost:9200"]  

        # 索引名称  

        index => "test"  

        # 自增ID 需要关联的数据库中有有一个id字段,对应索引的id号  

        document_id => "%{id}"  

    }  

    stdout {  

       # JSON格式输出  

        codec => json_lines  

    }  

 

}

 

jdbc.sql文件内容如下:

select * from 要同步的MySQL数据库中的表名

 

bin目录下执行命令:./logstash -f  ./mysql/jdbc.conf

 

四、Java HTTP REST API访问ElasticSearch

Java访问ES的两种方式:第一种——通过TransportClient访问;第二种——通过Jest访问。我们采用Jest(一个封装了对ES各种操作的轻量的框架)。

 

步骤一:pom.xml中添加相关依赖

<dependency>

    <groupId>io.searchboxgroupId>

    <artifactId>jestartifactId>

    <version>5.3.3version>

dependency>

 

<dependency>

<groupId>org.elasticsearchgroupId>

<artifactId>elasticsearchartifactId>

<version>5.5.1.0version>

dependency>

 

<dependency>

<groupId>org.apache.httpcomponentsgroupId>

<artifactId>httpcoreartifactId>

<version>4.4.7version>

dependency>

 

<dependency>

<groupId>org.apache.httpcomponentsgroupId>

<artifactId>httpclientartifactId>

<version>4.5.3version>

dependency>

 

<dependency>

<groupId>commons-logginggroupId>

<artifactId>commons-loggingartifactId>

<version>1.1.1version>

 

dependency>

 

步骤二&#xff1a;准备工具类&#xff0c;封装各种Jest操作ES的方法

 package com.jhzz.jizhitong.common.util;

 

import java.util.List;

 

import com.google.gson.GsonBuilder;

 

import io.searchbox.client.JestClient;

import io.searchbox.client.JestClientFactory;

import io.searchbox.client.JestResult;

import io.searchbox.client.config.HttpClientConfig;

import io.searchbox.core.Bulk;

import io.searchbox.core.BulkResult;

import io.searchbox.core.Count;

import io.searchbox.core.CountResult;

import io.searchbox.core.Delete;

import io.searchbox.core.DocumentResult;

import io.searchbox.core.Get;

import io.searchbox.core.Index;

import io.searchbox.core.Search;

import io.searchbox.core.SearchResult;

import io.searchbox.indices.CreateIndex;

import io.searchbox.indices.DeleteIndex;

import io.searchbox.indices.mapping.GetMapping;

import io.searchbox.indices.mapping.PutMapping;

 

/**

 * Jest操作ES工具类

 * 

 * &#64;author wuhoujian

 *

 */

public class JestUtil {

/**

* 获取JestClient对象

* &#64;return

*/

public static JestClient getJestClient() {

 

JestClientFactory factory &#61; new JestClientFactory();

factory.setHttpClientConfig(new HttpClientConfig.Builder("http://127.0.0.1:9200")

.gson(new GsonBuilder().setDateFormat("yyyy-MM-dd&#39;T&#39;hh:mm:ss").create()).connTimeout(1500)

.readTimeout(3000).multiThreaded(true).build());

return factory.getObject();

}

 

/**

* 创建索引

* &#64;param jestClient

* &#64;param indexName

* &#64;return

* &#64;throws Exception

*/

public boolean createIndex(JestClient jestClient, String indexName) throws Exception {

 

JestResult jr &#61; jestClient.execute(new CreateIndex.Builder(indexName).build());

return jr.isSucceeded();

}

 

/**

* Put映射

* &#64;param jestClient

* &#64;param indexName

* &#64;param typeName

* &#64;param source

* &#64;return

* &#64;throws Exception

*/

public boolean createIndexMapping(JestClient jestClient, String indexName, String typeName, String source)

throws Exception {

 

PutMapping putMapping &#61; new PutMapping.Builder(indexName, typeName, source).build();

JestResult jr &#61; jestClient.execute(putMapping);

return jr.isSucceeded();

}

 

/**

* Get映射

* &#64;param jestClient

* &#64;param indexName

* &#64;param typeName

* &#64;return

* &#64;throws Exception

*/

public String getIndexMapping(JestClient jestClient, String indexName, String typeName) throws Exception {

 

GetMapping getMapping &#61; new GetMapping.Builder().addIndex(indexName).addType(typeName).build();

JestResult jr &#61; jestClient.execute(getMapping);

return jr.getJsonString();

}

 

/**

* 索引文档

* &#64;param jestClient

* &#64;param indexName

* &#64;param typeName

* &#64;param objs

* &#64;return

* &#64;throws Exception

*/

public boolean index(JestClient jestClient, String indexName, String typeName, List objs) throws Exception {

 

Bulk.Builder bulk &#61; new Bulk.Builder().defaultIndex(indexName).defaultType(typeName);

for (Object obj : objs) {

Index index &#61; new Index.Builder(obj).build();

bulk.addAction(index);

}

BulkResult br &#61; jestClient.execute(bulk.build());

return br.isSucceeded();

}

 

/**

* 搜索文档

* &#64;param jestClient

* &#64;param indexName

* &#64;param typeName

* &#64;param query

* &#64;return

* &#64;throws Exception

*/

public SearchResult search(JestClient jestClient, String indexName, String typeName, String query)

throws Exception {

 

Search search &#61; new Search.Builder(query).addIndex(indexName).addType(typeName).build();

return jestClient.execute(search);

}

 

/**

* Count文档

* &#64;param jestClient

* &#64;param indexName

* &#64;param typeName

* &#64;param query

* &#64;return

* &#64;throws Exception

*/

public Double count(JestClient jestClient, String indexName, String typeName, String query) throws Exception {

 

Count count &#61; new Count.Builder().addIndex(indexName).addType(typeName).query(query).build();

CountResult results &#61; jestClient.execute(count);

return results.getCount();

}

 

/**

* Get文档

* &#64;param jestClient

* &#64;param indexName

* &#64;param typeName

* &#64;param id

* &#64;return

* &#64;throws Exception

*/

public static JestResult get(JestClient jestClient, String indexName, String typeName, String id) throws Exception {

 

Get get &#61; new Get.Builder(indexName, id).type(typeName).build();

return jestClient.execute(get);

}

 

/**

* Delete索引

* &#64;param jestClient

* &#64;param indexName

* &#64;return

* &#64;throws Exception

*/

public boolean delete(JestClient jestClient, String indexName) throws Exception {

 

JestResult jr &#61; jestClient.execute(new DeleteIndex.Builder(indexName).build());

return jr.isSucceeded();

}

 

/**

* Delete文档

* &#64;param jestClient

* &#64;param indexName

* &#64;param typeName

* &#64;param id

* &#64;return

* &#64;throws Exception

*/

public boolean delete(JestClient jestClient, String indexName, String typeName, String id) throws Exception {

 

DocumentResult dr &#61; jestClient.execute(new Delete.Builder(id).index(indexName).type(typeName).build());

return dr.isSucceeded();

}

}

 

 

步骤三&#xff1a;编码访问ES

JestResult jestResult &#61; JestUtil.get(JestUtil.getJestClient(), "jizhitong", "pattern", "5");

 

System.out.println(jestResult.getSourceAsString());



推荐阅读
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 使用Vultr云服务器和Namesilo域名搭建个人网站
    本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站,包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南,帮助读者顺利完成建站过程。 ... [详细]
  • 使用Python在SAE上开发新浪微博应用的初步探索
    最近重新审视了新浪云平台(SAE)提供的服务,发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用,并分享开发过程中的关键步骤。 ... [详细]
  • 本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询,并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率,还简化了代码逻辑。 ... [详细]
  • 本文详细介绍了IBM DB2数据库在大型应用系统中的应用,强调其卓越的可扩展性和多环境支持能力。文章深入分析了DB2在数据利用性、完整性、安全性和恢复性方面的优势,并提供了优化建议以提升其在不同规模应用程序中的表现。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 如何配置Unturned服务器及其消息设置
    本文详细介绍了Unturned服务器的配置方法和消息设置技巧,帮助用户了解并优化服务器管理。同时,提供了关于云服务资源操作记录、远程登录设置以及文件传输的相关补充信息。 ... [详细]
  • 360SRC安全应急响应:从漏洞提交到修复的全过程
    本文详细介绍了360SRC平台处理一起关键安全事件的过程,涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例,展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]
  • 离线环境下的Python及其第三方库安装指南
    在项目开发中,有时会遇到电脑只能连接内网或完全无法联网的情况。本文将详细介绍如何在这种环境下安装Python及其所需的第三方库,确保开发工作的顺利进行。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文介绍如何使用JPA Criteria API创建带有多个可选参数的动态查询方法。当某些参数为空时,这些参数不会影响最终查询结果。 ... [详细]
author-avatar
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有