monstache实时同步mongodb数据到elasticsearch

作者：allenn2012 | 来源：互联网 | 2023-07-01 13:41

最近在做数据统计功能，需要将mongodb数据实时同步到 elasticsearch中。目前找到的方案有两种1、通过flinkmongodbcdc flinkmongodbcdc的

最近在做数据统计功能，需要将mongodb数据实时同步到 elasticsearch 中。目前找到的方案有两种

1、通过flink mongodb cdc

flink mongodb cdc 的优点是比较灵活，可以将mongodb中的数据同步到任意支持的目标库中,不限于elasticsearch ，但是目前在使用的过程共发现同步时会自动加一个Changelog Normalize 算子,背压比较严重。网上找了很多资料，暂时无法解决。

2、monstache 优点的话就是同步速度很快暂时没有发现性能问题，缺点也比较明显就是只能同步mongodb 数据到elasticsearch 中。

docker 中部署monstache（需要注意monstache版本要与elasticsearch 版本匹配）

docker run --privileged --name monstache -v /home/docker/monstache/config/monstache.config.toml:/app/monstache.config.toml -d -t rwynn/monstache '-f' '/app/monstache.config.toml'

monstache.config.toml 内容如下

1 # ip地址注意要修改
2 mongo-url = "mongodb://xx.x.xxx.xxx:27017,xx.x.xxx.xxx:27018,xx.x.xxx.xxx:27019"
3 # ip地址注意要修改
4 elasticsearch-urls = ["http://xx.x.xxx.xxx:9200"]
5 # mydb指的是需要同步的数据库
6 direct-read-namespaces = ["xx.xxxx","xx.xxxx","xx.xxxx"]
7 change-stream-namespaces = ["xx.xxxx","xx.xxxx","xx.xxxx"]
8 #elasticsearch-user = "elastic"
9 #elasticsearch-password = "pwd"
10 #elasticsearch-max-cOnns= 4
11 dropped-collectiOns= true
12 dropped-databases = true
13 resume = true
14 resume-strategy = 0
15 verbose = true
16 cluster-name = 'docker-cluster'
17
18 [[mapping]]
19 namespace = "xx.xxxx"
20 index = "xxxx"
21 type= "type-xxx"
22
23 [[mapping]]
24 namespace = "xx.xxxx"
25 index = "xxxx"
26 type= "type-xxx"
27
28 [[mapping]]
29 namespace = "xx.xxxx"
30 index = "xxxx"
31 type= "type-xxx"

推荐阅读

ip
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
ip
小王详解：内部网络中最易理解的NAT原理剖析，挑战你的认知极限

小王详解：内部网络中最易理解的NAT原理剖析，挑战你的认知极限 ... [详细]

蜡笔小新 2024-11-07 15:11:42
export
在Kubernetes上部署多个Mitmproxy代理服务器以实现高效流量管理

在Kubernetes上部署多个Mitmproxy代理服务器以实现高效流量管理 ... [详细]

蜡笔小新 2024-11-03 14:38:15
ip
以Flink为例，消除流处理常见的六大谬见

以Flink为例，消除流处理常见的六大谬见 ... [详细]

蜡笔小新 2024-10-08 12:59:58
function
两种方式实现Flink异步IO查询Mysql

如官网所描述的Flink支持两种方式实现异步IO查询外部系统http ... [详细]

蜡笔小新 2024-09-28 11:27:02
get
markdown Elasticsearch：更新现有索引的映射和设置

本文由编程笔记#小编为大家整理，主要介绍了markdownElasticsearch：更新现有索引的映射和设置相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2024-09-27 19:09:21
import
如何在Docker环境中高效利用数据库？ | Baeldung

在本文中，我们将探讨如何在Docker环境中高效地管理和利用数据库。首先，需要安装Docker Desktop以确保本地环境准备就绪。接下来，可以从Docker Hub中选择合适的数据库镜像，并通过简单的命令将其拉取到本地。此外，我们还将介绍如何配置和优化这些数据库容器，以实现最佳性能和安全性。 ... [详细]

蜡笔小新 2024-11-09 19:34:33
ip
Python 伦理黑客技术：深入探讨后门攻击（第三部分）

在《Python 伦理黑客技术：深入探讨后门攻击（第三部分）》中，作者详细分析了后门攻击中的Socket问题。由于TCP协议基于流，难以确定消息批次的结束点，这给后门攻击的实现带来了挑战。为了解决这一问题，文章提出了一系列有效的技术方案，包括使用特定的分隔符和长度前缀，以确保数据包的准确传输和解析。这些方法不仅提高了攻击的隐蔽性和可靠性，还为安全研究人员提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 16:33:02
ip
体积小巧的vsftpd与pureftpd Docker镜像在Unraid系统中的详细配置指南：支持TLS加密及IPv6协议

本文详细介绍了如何在Unraid系统中配置体积小巧的vsftpd和Pure-FTPd Docker镜像，以支持TLS加密和IPv6协议。通过这些配置，用户可以实现安全、高效的文件传输服务，适用于各种网络环境。配置过程包括镜像的选择、环境变量的设置以及必要的安全措施，确保了系统的稳定性和数据的安全性。 ... [详细]

蜡笔小新 2024-11-09 12:46:23
ip
《从零开始掌握容器云网络实战》技术专栏全新上线

大家好，全新的技术专栏《从零开始掌握容器云网络实战》正式上线。该专栏将系统地介绍容器云网络的基础知识、核心技术和实际应用案例，帮助读者全面理解和掌握容器云网络的关键技术与实践方法。 ... [详细]

蜡笔小新 2024-11-05 15:13:22
get
CentOS 7环境下Jenkins的安装与前后端应用部署详解

CentOS 7环境下Jenkins的安装与前后端应用部署详解 ... [详细]

蜡笔小新 2024-11-04 16:46:02
get
数据库性能优化与管理策略深度解析

本文深入探讨了数据库性能优化与管理策略，通过实例分析和理论研究，详细阐述了如何有效提升数据库系统的响应速度和处理能力。文章首先介绍了数据库性能优化的基本原则和常用技术，包括索引优化、查询优化和存储管理等。接着，结合实际应用场景，讨论了如何利用容器化技术（如Docker）来部署和管理数据库，以提高系统的可扩展性和稳定性。最后，文章还提供了具体的配置示例和最佳实践，帮助读者在实际工作中更好地应用这些策略。 ... [详细]

蜡笔小新 2024-10-31 11:16:59
ip
从用户转型为开发者：一场思维升级的旅程 | 专访 StarRocks Committer 周威

从用户转变为开发者，不仅是一次角色的转换，更是一场深刻的思维升级之旅。本次专访中，StarRocks Committer 周威分享了他如何在这一过程中逐步提升技术能力与思维方式，为开源社区贡献自己的力量。 ... [详细]

蜡笔小新 2024-10-31 09:21:44
export
优化后的标题：部署与配置Rancher操作系统指南

RancherOS 是由 Rancher Labs 开发的一款专为 Docker 设计的轻量级 Linux 发行版，提供了一个全面的 Docker 运行环境。其引导镜像仅 20MB，非常适合在资源受限的环境中部署。本文将详细介绍如何在 ESXi 虚拟化平台上安装和配置 RancherOS，帮助用户快速搭建高效、稳定的容器化应用环境。 ... [详细]

蜡笔小新 2024-10-28 22:49:28
export
什么是大数据lambda架构

一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出，根据维基百科的定义，Lambda架构的设计是为了在处理大规模数 ... [详细]

蜡笔小新 2023-10-17 16:06:09

allenn2012

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章