mysql不对称复制数据_实例详解MySQL与Elasticsearch数据不对称问题

作者：yukiyu227232 | 来源：互联网 | 2023-06-11 13:02

jdbc-input-plugin只能实现数据库的追加，对于elasticsearch增量写入，但经常jdbc源一端的数据库可能会做数据库删除或者更新操

jdbc-input-plugin 只能实现数据库的追加&＃xff0c;对于 elasticsearch 增量写入&＃xff0c;但经常jdbc源一端的数据库可能会做数据库删除或者更新操作。这样一来数据库与搜索引擎的数据库就出现了不对称的情况。本文主要介绍了MySQL 与 Elasticsearch 数据不对称问题解决办法的相关资料,对于 elasticsearch 增量写入&＃xff0c;但经常jdbc源一端的数据库可能会做数据库删除或者更新操作&＃xff0c;这里提供解决办法&＃xff0c;需要的朋友可以参考下&＃xff0c;希望能帮助到大家。

当然你如果有开发团队可以写程序在删除或者更新的时候同步对搜索引擎操作。如果你没有这个能力&＃xff0c;可以尝试下面的方法。

这里有一个数据表 article , mtime 字段定义了 ON UPDATE CURRENT_TIMESTAMP 所以每次更新mtime的时间都会变化

mysql> desc article;

&＃43;-------------&＃43;--------------&＃43;------&＃43;-----&＃43;--------------------------------&＃43;-------&＃43;

&＃43;-------------&＃43;--------------&＃43;------&＃43;-----&＃43;--------------------------------&＃43;-------&＃43;

| id | int(11) | NO | | 0 | |

| status | enum(&＃39;Y&＃39;,&＃39;N&＃39;)| NO | | &＃39;N&＃39; | |

&＃43;-------------&＃43;--------------&＃43;------&＃43;-----&＃43;--------------------------------&＃43;-------&＃43;

7 rows in set (0.00 sec)

logstash 增加 mtime 的查询规则

jdbc {

jdbc_driver_library &＃61;> "/usr/share/java/mysql-connector-java.jar"

jdbc_driver_class &＃61;> "com.mysql.jdbc.Driver"

jdbc_connection_string &＃61;> "jdbc:mysql://localhost:3306/cms"

jdbc_user &＃61;> "cms"

jdbc_password &＃61;> "password"

schedule &＃61;> "* * * * *" #定时cron的表达式,这里是每分钟执行一次

statement &＃61;> "select * from article where mtime > :sql_last_value"

use_column_value &＃61;> true

tracking_column &＃61;> "mtime"

tracking_column_type &＃61;> "timestamp"

record_last_run &＃61;> true

last_run_metadata_path &＃61;> "/var/tmp/article-mtime.last"

}

创建回收站表&＃xff0c;这个事用于解决数据库删除&＃xff0c;或者禁用 status &＃61; &＃39;N&＃39; 这种情况的。

CREATE TABLE &＃96;elasticsearch_trash&＃96; (

&＃96;id&＃96; int(11) NOT NULL,

&＃96;ctime&＃96; timestamp NULL DEFAULT CURRENT_TIMESTAMP,

PRIMARY KEY (&＃96;id&＃96;)

) ENGINE&＃61;InnoDB DEFAULT CHARSET&＃61;utf8

为 article 表创建触发器

CREATE DEFINER&＃61;&＃96;dba&＃96;&＃64;&＃96;%&＃96; TRIGGER &＃96;article_BEFORE_UPDATE&＃96; BEFORE UPDATE ON &＃96;article&＃96; FOR EACH ROW

BEGIN

-- 此处的逻辑是解决文章状态变为 N 的时候&＃xff0c;需要将搜索引擎中对应的数据删除。

IF NEW.status &＃61; &＃39;N&＃39; THEN

insert into elasticsearch_trash(id) values(OLD.id);

END IF;

-- 此处逻辑是修改状态到 Y 的时候&＃xff0c;方式elasticsearch_trash仍然存在该文章ID&＃xff0c;导致误删除。所以需要删除回收站中得回收记录。

IF NEW.status &＃61; &＃39;Y&＃39; THEN

delete from elasticsearch_trash where id &＃61; OLD.id;

END IF;

END

CREATE DEFINER&＃61;&＃96;dba&＃96;&＃64;&＃96;%&＃96; TRIGGER &＃96;article_BEFORE_DELETE&＃96; BEFORE DELETE ON &＃96;article&＃96; FOR EACH ROW

BEGIN

-- 此处逻辑是文章被删除同事将改文章放入搜索引擎回收站。

insert into elasticsearch_trash(id) values(OLD.id);

END

接下来我们需要写一个简单地 Shell 每分钟运行一次&＃xff0c;从 elasticsearch_trash 数据表中取出数据&＃xff0c;然后使用 curl 命令调用 elasticsearch restful 接口&＃xff0c;删除被收回的数据。

你还可以开发相关的程序&＃xff0c;这里提供一个 Spring boot 定时任务例子。

实体

package cn.netkiller.api.domain.elasticsearch;

import java.util.Date;

import javax.persistence.Column;

import javax.persistence.Entity;

import javax.persistence.Id;

import javax.persistence.Table;

&＃64;Entity

&＃64;Table

public class ElasticsearchTrash {

&＃64;Id

private int id;

&＃64;Column(columnDefinition &＃61; "TIMESTAMP DEFAULT CURRENT_TIMESTAMP")

private Date ctime;

public int getId() {

return id;

}

public void setId(int id) {

this.id &＃61; id;

}

public Date getCtime() {

return ctime;

}

public void setCtime(Date ctime) {

this.ctime &＃61; ctime;

}

仓库

package cn.netkiller.api.repository.elasticsearch;

import org.springframework.data.repository.CrudRepository;

import com.example.api.domain.elasticsearch.ElasticsearchTrash;

public interface ElasticsearchTrashRepository extends CrudRepository{

}

定时任务

package cn.netkiller.api.schedule;

import org.elasticsearch.action.delete.DeleteResponse;

import org.elasticsearch.client.transport.TransportClient;

import org.elasticsearch.rest.RestStatus;

import org.slf4j.Logger;

import org.slf4j.LoggerFactory;

import org.springframework.beans.factory.annotation.Autowired;

import org.springframework.scheduling.annotation.Scheduled;

import org.springframework.stereotype.Component;

import com.example.api.domain.elasticsearch.ElasticsearchTrash;

import com.example.api.repository.elasticsearch.ElasticsearchTrashRepository;

&＃64;Component

public class ScheduledTasks {

private static final Logger logger &＃61; LoggerFactory.getLogger(ScheduledTasks.class);

&＃64;Autowired

private TransportClient client;

&＃64;Autowired

private ElasticsearchTrashRepository alasticsearchTrashRepository;

public ScheduledTasks() {

}

&＃64;Scheduled(fixedRate &＃61; 1000 * 60) // 60秒运行一次调度任务

public void cleanTrash() {

for (ElasticsearchTrash elasticsearchTrash : alasticsearchTrashRepository.findAll()) {

DeleteResponse response &＃61; client.prepareDelete("information", "article", elasticsearchTrash.getId() &＃43; "").get();

RestStatus status &＃61; response.status();

logger.info("delete {} {}", elasticsearchTrash.getId(), status.toString());

if (status &＃61;&＃61; RestStatus.OK || status &＃61;&＃61; RestStatus.NOT_FOUND) {

alasticsearchTrashRepository.delete(elasticsearchTrash);

}

Spring boot 启动主程序。

package cn.netkiller.api;

import org.springframework.boot.SpringApplication;

import org.springframework.boot.autoconfigure.SpringBootApplication;

import org.springframework.scheduling.annotation.EnableScheduling;

&＃64;SpringBootApplication

&＃64;EnableScheduling

public class Application {

public static void main(String[] args) {

SpringApplication.run(Application.class, args);

}

推荐阅读

email
MySQL初级篇——字符串、日期时间、流程控制函数的相关应用

文章目录：1.字符串函数2.日期时间函数2.1获取日期时间2.2日期与时间戳的转换2.3获取年月日、时分秒、星期数、天数等函数2.4时间和秒钟的转换2. ... [详细]

蜡笔小新 2024-11-14 10:57:02
string
Spring 3.0.5 中获取 MySQL 表的自增主键

本文介绍了如何在 Spring 3.0.5 中使用 JdbcTemplate 插入数据并获取 MySQL 表中的自增主键。 ... [详细]

蜡笔小新 2024-11-13 18:00:32
import
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
dll
包含phppdoerrorcode的词条

包含phppdoerrorcode的词条 ... [详细]

蜡笔小新 2024-11-14 12:06:14
import
Android Studio SQLite 数据库增删改查简单（代码参考）

一个建表一个执行crud操作建表代码importandroid.content.Context;importandroid.database.sqlite.SQLiteDat ... [详细]

蜡笔小新 2024-11-14 11:01:49
buffer
C#实现文件的压缩与解压

2019独角兽企业重金招聘Python工程师标准一、准备工作1、下载ICSharpCode.SharpZipLib.dll文件2、项目中引用这个dll二、文件压缩与解压共用类 ... [详细]

蜡笔小新 2024-11-14 10:37:34
import
Spring Data JdbcTemplate 入门指南

本文将介绍如何使用 Spring JdbcTemplate 进行数据库操作，包括查询和插入数据。我们将通过一个学生表的示例来演示具体步骤。 ... [详细]

蜡笔小新 2024-11-14 10:33:29
import
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
string
JVM钩子函数的应用场景详解

本文详细介绍了JVM钩子函数的多种应用场景，包括正常关闭、异常关闭和强制关闭。通过具体示例和代码演示，帮助读者更好地理解和应用这一机制。适合对Java编程和JVM有一定基础的开发者阅读。 ... [详细]

蜡笔小新 2024-11-13 18:34:48
match
javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例

javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 15:24:50
import
Spring Boot 中配置全局文件上传路径并实现文件上传功能

本文介绍如何在 Spring Boot 项目中配置全局文件上传路径，并通过读取配置项实现文件上传功能。通过这种方式，可以更好地管理和维护文件路径。 ... [详细]

蜡笔小新 2024-11-13 11:19:38
import
Java 编程错误：对象无法转换为 long 类型

本文介绍了在 Java 编程中遇到的一个常见错误：对象无法转换为 long 类型，并提供了详细的解决方案。 ... [详细]

蜡笔小新 2024-11-13 10:57:24
string
oracle c3p0 dword 60,web_day10 dbcp c3p0 dbutils

createdatabasemydbcharactersetutf8;alertdatabasemydbcharactersetutf8;1.自定义连接池为了不去经常创建连接和释放 ... [详细]

蜡笔小新 2024-11-12 19:26:15
string
com.hazelcast.config.MapConfig.isStatisticsEnabled()方法的使用及代码示例

com.hazelcast.config.MapConfig.isStatisticsEnabled()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-12 14:33:17
string
如何在Java中使用DButils类

这期内容当中小编将会给大家带来有关如何在Java中使用DButils类，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。D ... [详细]

蜡笔小新 2024-11-12 13:46:11

yukiyu227232

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章