【231期】Elasticsearch在各大互联网公司大量真实的应用场景案例

作者：ayuanliang | 来源：互联网 | 2023-06-11 09:59

点击上方“Java精选”，选择“设为星标”别问别人为什么，多问自己凭什么！下方有惊喜，留言必回，有问必答&#x

点击上方“Java精选”&＃xff0c;选择“设为星标”

别问别人为什么&＃xff0c;多问自己凭什么&＃xff01;

下方有惊喜&＃xff0c;留言必回&＃xff0c;有问必答&＃xff01;

每天 08:15 更新文章&＃xff0c;每天进步一点点...

国内现在有大量的公司都在使用 Elasticsearch&＃xff0c;包括携程、滴滴、今日头条、饿了么、360安全、小米、vivo等诸多知名公司。

除了搜索之外&＃xff0c;结合Kibana、Logstash、Beats&＃xff0c;Elastic Stack还被广泛运用在大数据*实时分析领域&＃xff0c;包括日志分析、指标监控、信息安全等多个领域。它可以帮助你探索海量结构化、非结构化数据&＃xff0c;按需创建可视化报表&＃xff0c;对监控数据设置报警阈值&＃xff0c;甚至通过使用机器学习技术&＃xff0c;自动识别异常状况。

一、京东到家订单中心 Elasticsearch 演进历程

京东到家订单中心系统业务中&＃xff0c;无论是外部商家的订单生产&＃xff0c;或是内部上下游系统的依赖&＃xff0c;订单查询的调用量都非常大&＃xff0c;造成了订单数据读多写少的情况。京东到家的订单数据存储在MySQL中&＃xff0c;但显然只通过DB来支撑大量的查询是不可取的&＃xff0c;同时对于一些复杂的查询&＃xff0c;Mysql支持得不够友好&＃xff0c;所以订单中心系统使用了Elasticsearch来承载订单查询的主要压力。

Elasticsearch 做为一款功能强大的分布式搜索引擎&＃xff0c;支持*实时的存储、搜索数据&＃xff0c;在京东到家订单系统中发挥着巨大作用&＃xff0c;目前订单中心ES集群存储数据量达到10亿个文档&＃xff0c;日均查询量达到5亿。随着京东到家*几年业务的快速发展&＃xff0c;订单中心ES架设方案也不断演进&＃xff0c;发展至今ES集群架设是一套实时互备方案&＃xff0c;很好的保障了ES集群读写的稳定性。

如上图&＃xff0c;订单中心ES集群架设示意图。整个架设方式通过VIP来负载均衡外部请求&＃xff0c;第一层gateway节点实质为ES中client node&＃xff0c;相当于一个智能负载均衡器&＃xff0c;充当着分发请求的角色。第二层为data node&＃xff0c;负责存储数据以及执行数据的相关操作。整个集群有一套主分片&＃xff0c;二套副分片&＃xff08;一主二副&＃xff09;&＃xff0c;从网关节点转发过来的请求&＃xff0c;会在打到数据节点之前通过轮询的方式进行均衡。集群增加一套副本并扩容机器的方式&＃xff0c;增加了集群吞吐量&＃xff0c;从而提升了整个集群查询性能。

当然分片数量和分片副本数量并不是越多越好&＃xff0c;在此阶段中&＃xff0c;对选择适当的分片数量做了*一步探索。分片数可以理解为Mysql中的分库分表&＃xff0c;而当前订单中心ES查询主要分为两类&＃xff1a;单ID查询以及分页查询。分片数越大&＃xff0c;集群横向扩容规模也更大&＃xff0c;根据分片路由的单ID查询吞吐量也能大大提升&＃xff0c;但对于聚合的分页查询性能则将降低。分片数越小&＃xff0c;集群横向扩容规模更小&＃xff0c;单ID的查询性能也将下降&＃xff0c;但对于分页查询&＃xff0c;性能将会得到提升。所以如何均衡分片数量和现有查询业务&＃xff0c;我们做了很多次调整压测&＃xff0c;最终选择了集群性能较好的分片数。

由于大部分ES查询的流量都来源于*几天的订单&＃xff0c;且订单中心数据库数据已有一套归档机制&＃xff0c;将指定天数之前已经关闭的订单转移到历史订单库。

架构的快速迭代源于业务的快速发展&＃xff0c;正是由于*几年到家业务的高速发展&＃xff0c;订单中心的架构也不断优化升级。而架构方案没有最好的&＃xff0c;只有最合适的。相信再过几年&＃xff0c;订单中心的架构又将是另一个面貌&＃xff0c;但吞吐量更大&＃xff0c;性能更好&＃xff0c;稳定性更强&＃xff0c;将是订单中心系统永远的追求。

二、携程Elasticsearch应用案例

1. 携程酒店订单Elasticsearch实战

选择对分片后的数据库建立实时索引&＃xff0c;把查询收口到一个独立的 Web Service&＃xff0c;在保证性能的前提下&＃xff0c;提升业务应用查询时的便捷性。

最终我们选择了 Elasticsearch&＃xff0c;看中的是它的轻量级、易用和对分布式更好的支持&＃xff0c;整个安装包也只有几十兆。

http://developer.51cto.com/art/201807/579354.htm

2. 携程机票ElasticSearch集群运维驯服记

这个是比较通用的数据的流程&＃xff0c;一般会通过Kafka分离产生数据的应用程序和后面的*台&＃xff0c;通过ETL落到不同的地方&＃xff0c;按照优先级和冷热程度采取不同的存储方式。一般来说&＃xff0c;冷数据存放到HDFS&＃xff0c;如果温数据、或者热数据会采用Database以及Cache。

一旦数据落地&＃xff0c;我们会做两方面的应用&＃xff0c;第一个方面的应用是传统BI&＃xff0c;比如会产生各种各样的报表&＃xff0c;报表的受众是更高的决策层和管理层&＃xff0c;他们看了之后&＃xff0c;会有相应的业务调整和更高层面的规划或转变。这个使用路径比较传统的&＃xff0c;在数据仓库时代就已经存在了。现在有一种新兴的场景就是利用大数据进行快速决策&＃xff0c;数据不是喂给人的&＃xff0c;数据分析结果由程序来消费&＃xff0c;其实是再次的反馈到数据源头即应用程序中&＃xff0c;让他们基于快速分析后的结果&＃xff0c;调整已有策略&＃xff0c;这样就形成了一个数据使用的循环。

这样我们从它的输入到输出会形成一种闭环&＃xff0c;而且这个闭环全部是机器参与的&＃xff0c;这也是为什么去研究这种大规模的&＃xff0c;或者快速决策的原因所在。如果数据最终还会给人本身来看的话&＃xff0c;就没有必要更新那么快&＃xff0c;因为一秒钟刷新一次或者10秒钟刷新一次对人是没有意义的&＃xff0c;因为我们脑子不可能一直转那么快&＃xff0c;基于数据一直的做调整也是不现实的&＃xff0c;但是对机器来讲&＃xff0c;就完全没有问题。

http://www.sohu.com/a/199672012_411876

3. 携程&＃xff1a;大规模 Elasticsearch 集群管理心得

目前&＃xff0c;我们最大的日志单集群有120个data node&＃xff0c;运行于70台物理服务器上。数据规模如下:

单日索引数据条数600亿&＃xff0c;新增索引文件25TB (含一个复制片则为50TB)
业务高峰期峰值索引速率维持在百万条/秒
历史数据保留时长根据业务需求制定&＃xff0c;从10天 - 90天不等
集群共3441个索引、17000个分片、数据总量约9300亿, 磁盘总消耗1PB

https://www.jianshu.com/p/6470754b8248

三、去哪儿&＃xff1a;订单中心基于elasticsearch 的解决方案

15年去哪儿网酒店日均订单量达到30w&＃43;&＃xff0c;随着多*台订单的聚合日均订单能达到100w左右。原来采用的热表分库方式&＃xff0c;即将最*6个月的订单的放置在一张表中&＃xff0c;将历史订单放在在history表中。history表存储全量的数据&＃xff0c;当用户查询的下单时间跨度超过6个月即查询历史订单表&＃xff0c;此分表方式热表的数据量为4000w左右&＃xff0c;当时能解决的问题。但是显然不能满足携程艺龙订单接入的需求。如果继续按照热表方式&＃xff0c;数据量将超过1亿条。全量数据表保存2年的可能就超过4亿的数据量。所以寻找有效途径解决此问题迫在眉睫。由于对这预计4亿的数据量还需按照预定日期、入住日期、离店日期、订单号、联系人姓名、电话、酒店名称、订单状态……等多个条件查询。所以简单按照某一个维度进行分表操作没有意义。Elasticsearch分布式搜索储存集群的引入&＃xff0c;就是为了解决订单数据的存储与搜索的问题。

对订单模型进行抽象和分类&＃xff0c;将常用搜索字段和基础属性字段剥离。DB做分库分表&＃xff0c;存储订单详情&＃xff1b;Elasticsearch存储搜素字段。

订单复杂查询直接走Elasticsearch&＃xff0c;基于OrderNo的简单查询走DB&＃xff0c;如下图所示。

系统伸缩性&＃xff1a;Elasticsearch 中索引设置了8个分片&＃xff0c;目前ES单个索引的文档达到1.4亿&＃xff0c;合计达到2亿条数据占磁盘大小64G&＃xff0c;集群机器磁盘容量240G。

https://elasticsearch.cn/article/6197

四、Elasticsearch 在58集团信息安全部的应用

全面介绍 Elastic Stack 在58集团信息安全部的落地&＃xff0c;升级&＃xff0c;优化以及应用。

包括如下几个方面&＃xff1a;接入背景&＃xff0c;存储选型&＃xff0c;性能挑战&＃xff0c;master node以及data node优化&＃xff0c;安全实践&＃xff0c;高吞吐量以及低延迟搜索优化&＃xff1b;kibana 的落地&＃xff0c;本地化使其更方便产品、运营使用。

https://elasticsearch.cn/slides/124

五、滴滴Elasticsearch多集群架构实践

滴滴 2016 年初开始构建 Elasticsearch *台&＃xff0c;如今已经发展到超过 3500&＃43; Elasticsearch 实例&＃xff0c;超过 5PB 的数据存储&＃xff0c;峰值写入 tps 超过了 2000w/s 的超大规模。

Elasticsearch 在滴滴有着非常丰富的使用场景&＃xff0c;例如线上核心的打车地图搜索&＃xff0c;客服、运营的多维度查询&＃xff0c;滴滴日志服务等*千个*台用户。

先看看滴滴 Elasticsearch 单集群的架构&＃xff1a;

滴滴在单集群架构的时候&＃xff0c;写入和查询就已经通过 Sink 服务和 Gateway 服务管控起来。

1. Sink服务

滴滴几乎所有写入 Elasticsearch 的数据都是经由 kafka 消费入到 Elasticsearch。kafka 的数据包括业务 log 数据、mysql binlog 数据和业务自主上报的数据&＃xff0c;Sink 服务将这些数据实时消费入到 Elasticsearch。另外&＃xff0c;关于更多es面试题&＃xff0c;公众号Java精选&＃xff0c;回复java面试&＃xff0c;最新es面试题资料&＃xff0c;支持在线随时随地刷题。

最初设计 Sink 服务是想对写入 Elasticsearch 集群进行管控&＃xff0c;保护 Elasticsearch 集群&＃xff0c;防止海量的数据写入拖垮 Elasticsearch&＃xff0c;之后我们也一直沿用了 Sink 服务&＃xff0c;并将该服务从 Elasticsearch *台分离出去&＃xff0c;成立滴滴 Sink 数据投递*台&＃xff0c;可以从 kafka 或者 MQ 实时同步数据到 Elasticsearch、HDFS、Ceph 等多个存储服务。

有了多集群架构后&＃xff0c;Elasticsearch *台可以消费一份 MQ 数据写入多个 Elasticsearch 集群&＃xff0c;做到集群级别的容灾&＃xff0c;还能通过 MQ 回溯数据进行故障恢复。

2. Gateway 服务

所有业务的查询都是经过 Gateway 服务&＃xff0c;Gateway 服务实现了 Elasticsearch 的 http restful 和 tcp 协议&＃xff0c;业务方可以通过 Elasticsearch 各语言版本的 sdk 直接访问 Gateway 服务&＃xff0c;Gateway 服务还实现了 SQL 接口&＃xff0c;业务方可以直接使用 SQL 访问 Elasticsearch *台。

Gateway 服务最初提供了应用权限的管控&＃xff0c;访问记录&＃xff0c;限流、降级等基本能力&＃xff0c;后面随着*台演进&＃xff0c;Gateway 服务还提供了索引存储分离、DSL 级别的限流、多集群灾备等能力。

https://mp.weixin.qq.com/s/K44-L0rclaIM40hma55pPQ

六、Elasticsearch实用化订单搜索方案

搜索引擎中&＃xff0c;主要考虑到Elasticsearch支持结构化数据查询以及支持实时频繁更新特性&＃xff0c;传统订单查询报表的痛点&＃xff0c;以及Elasticsearch能够帮助解决的问题。

订单搜索系统架构

整个业务线使用服务化方式&＃xff0c;Elasticsearch集群和数据库分库&＃xff0c;作为数据源被订单服务系统封装为对外统一接口&＃xff1b;各前、后台应用和报表中心&＃xff0c;使用服务化的方式获取订单数据。

https://my.oschina.net/u/2485991/blog/533163

作者&＃xff1a;Rickie
https://www.cnblogs.com/rickie/p/11648622.html

公众号“Java精选”所发表内容注明来源的&＃xff0c;版权归原出处所有&＃xff08;无法查证版权的或者未注明出处的均来自网络&＃xff0c;系转载&＃xff0c;转载的目的在于传递更多信息&＃xff0c;版权属于原作者。如有侵权&＃xff0c;请联系&＃xff0c;笔者会第一时间删除处理&＃xff01;

------ THE END ------

精品资料&＃xff0c;超赞福利&＃xff01;

>Java精选面试题<
3000&＃43; 道面试题在线刷&＃xff0c;最新、最全 Java 面试题&＃xff01;

期往精选点击标题可跳转

【223期】面试官问&＃xff1a;什么是 YAML&＃xff1f;和 Spring Boot 有什么关系&＃xff1f;

【224期】Java 字符串拼接五种方法的性能比较分析&＃xff0c;从执行100次到90万次&＃xff1f;

【225期】为什么数据库连接池不采用 IO 多路复用&＃xff1f;

【226期】面试问我&＃xff0c;HashMap 的默认初始容量是多少&＃xff0c;我该怎么说&＃xff1f;

【227期】面试官&＃xff1a;MySQL 数据查询太多会 OOM 吗&＃xff1f;

【228期】面试官&＃xff1a;跨库多表存在大量数据依赖问题&＃xff0c;有哪些解决方案&＃xff1f;

【229期】Spring Boot 使用令牌桶算法&＃43;拦截器&＃43;自定义注解&＃43;自定义异常实现简单的限流

【230期】Spring Boot 集成 Elasticsearch7.6 实现高亮分词及简单查询

技术交流群&＃xff01;

最近有很多人问&＃xff0c;有没有读者&异性交流群&＃xff0c;你懂的&＃xff01;想知道如何加入。加入方式很简单&＃xff0c;有兴趣的同学&＃xff0c;只需要点击下方卡片&＃xff0c;回复“加群”&＃xff0c;即可免费加入交流群&＃xff01;

文章有帮助的话&＃xff0c;在看&＃xff0c;转发吧&＃xff01;

推荐阅读

io
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
java
深入解析浏览器内核与版本的发展历程

浏览器作为我们日常不可或缺的软件工具，其背后的运作机制却鲜为人知。本文将深入探讨浏览器内核及其版本的演变历程，帮助读者更好地理解这一关键技术组件，揭示其内部运作的奥秘。 ... [详细]

蜡笔小新 2024-11-11 13:34:37
java
深入解析几种常用的Java后端开发框架组合及其应用场景

本文详细探讨了几种常用的Java后端开发框架组合及其具体应用场景。通过对比分析Spring Boot、MyBatis、Hibernate等框架的特点和优势，结合实际项目需求，为开发者提供了选择合适框架组合的参考依据。同时，文章还介绍了这些框架在微服务架构中的应用，帮助读者更好地理解和运用这些技术。 ... [详细]

蜡笔小新 2024-11-11 10:12:51
java
提升 Kubernetes 集群管理效率的七大专业工具

Kubernetes 在云原生环境中的应用日益广泛，然而集群管理的复杂性也随之增加。为了提高管理效率，本文推荐了七款专业工具，这些工具不仅能够简化日常操作，还能提升系统的稳定性和安全性。从自动化部署到监控和故障排查，这些工具覆盖了集群管理的各个方面，帮助管理员更好地应对挑战。 ... [详细]

蜡笔小新 2024-11-07 17:01:31
io
第二章：Kafka基础入门与核心概念解析

本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统，以其卓越的性能和高吞吐量而著称。最初，Kafka被设计用于LinkedIn的活动流和运营数据处理，旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景，读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]

蜡笔小新 2024-11-06 11:10:03
java
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
io
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
java
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
io
Python错误重试让多少开发者头疼？高效解决方案出炉

### 优化后的摘要在处理 Python 开发中的错误重试问题时，许多开发者常常感到困扰。为了应对这一挑战，`tenacity` 库提供了一种高效的解决方案。首先，通过 `pip install tenacity` 安装该库。使用时，可以通过简单的规则配置重试策略。例如，可以设置多个重试条件，使用 `|`（或）和 `&`（与）操作符组合不同的参数，从而实现灵活的错误重试机制。此外，`tenacity` 还支持自定义等待时间、重试次数和异常处理，为开发者提供了强大的工具来提高代码的健壮性和可靠性。 ... [详细]

蜡笔小新 2024-11-11 10:33:20
java
您的数据库配置是否安全？DBSAT工具助您一臂之力！

本文探讨了Oracle提供的免费工具DBSAT，该工具能够有效协助用户检测和优化数据库配置的安全性。通过全面的分析和报告，DBSAT帮助用户识别潜在的安全漏洞，并提供针对性的改进建议，确保数据库系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-11-11 14:44:47
java
PHP 各版本对比：标准版与最新顶级版的详细分析

PHP 各版本对比：标准版与最新顶级版的详细分析 ... [详细]

蜡笔小新 2024-11-11 13:23:25
io
在Linux系统中避免安装MySQL的简易指南

在Linux系统中避免安装MySQL的简易指南 ... [详细]

蜡笔小新 2024-11-11 13:22:28
io
基于Net Core 3.0与Web API的前后端分离开发：Vue.js在前端的应用

本文介绍了如何使用Net Core 3.0和Web API进行前后端分离开发，并重点探讨了Vue.js在前端的应用。后端采用MySQL数据库和EF Core框架进行数据操作，开发环境为Windows 10和Visual Studio 2019，MySQL服务器版本为8.0.16。文章详细描述了API项目的创建过程、启动步骤以及必要的插件安装，为开发者提供了一套完整的开发指南。 ... [详细]

蜡笔小新 2024-11-11 10:58:21
java
从小微企业到大型企业：Java架构师实战训练营首周体验

在当今的软件开发领域，分布式技术已成为程序员不可或缺的核心技能之一，尤其在面试中更是考察的重点。无论是小微企业还是大型企业，掌握分布式技术对于提升工作效率和解决实际问题都至关重要。本周的Java架构师实战训练营中，我们深入探讨了Kafka这一高效的分布式消息系统，它不仅支持发布订阅模式，还能在高并发场景下保持高性能和高可靠性。通过实际案例和代码演练，学员们对Kafka的应用有了更加深刻的理解。 ... [详细]

蜡笔小新 2024-11-09 11:21:43
io
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42

ayuanliang

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章