热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

58同城的Elasticsearch应用与平台构建实践

本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。
### 58同城Elasticsearch应用与平台构建
#### 分享概览
- **分享人**:于伯伟,58同城高级架构师
- **编辑整理**:陈树昌
- **来源**:DataFunTalk

#### 引言
Elasticsearch是一种强大的分布式搜索和分析引擎,适用于全文检索、结构化查询和数据分析等场景。它基于Lucene构建,是当前最受欢迎的开源搜索引擎之一。58同城不仅在其主要搜索引擎中使用Elasticsearch,还在内部创新搜索业务和大规模实时OLAP(在线分析处理)中广泛应用。

#### 集群优化与管理
- **背景**:初期,58同城各部门自行维护Elasticsearch,随着使用频率和重要性的提升,数据库团队接手了全公司的Elasticsearch管理,面临多种挑战,如复杂的使用场景、版本不统一、缺乏监控等问题。
- **常见问题**:
- **磁盘空间不足**:索引泛滥、缺乏生命周期管理、分片设置不当等。
- **写入性能下降**:索引设计不合理、分片过多、副本设置不当等。
- **应对措施**:
- 实施严格的索引管理和权限控制。
- 优化索引生命周期,及时清理不再需要的数据。
- 合理规划分片数量,避免单个分片过大。
- 日志类索引按天或更细粒度划分。
- 不同集群避免共享同一服务器节点。

#### 典型应用案例
- **ELKB日志管理方案**:利用Elasticsearch、Logstash、Kibana和Beats组成的日志管理框架,实现日志的收集、存储和可视化。
- **实时日志平台**:通过Flume和Filebeat收集日志,Kafka缓存,Logstash过滤,最终存储于Elasticsearch,并通过Kibana展示。
- **MySQL实时慢日志系统**:通过Filebeat收集MySQL慢日志,经Logstash处理后存储至Elasticsearch,支持实时查看和分析。

#### 平台化建设
- **用户端**:提供Elasticsearch的查询、统计和状态监控等功能。
- **管理端**:实现Elasticsearch集群的一键部署和索引治理。
- **监控与报警**:使用Zabbix + Grafana进行集群监控和报警。

#### 未来规划
- **版本升级**:计划升级至Elasticsearch 7.X,以利用其性能优化特性。
- **智能诊断**:开发自动化的故障检测和处理机制。
- **私有云探索**:优化资源配置,提高资源利用率。

#### 问答环节
- **数据同步**:Hadoop或Hive数据可通过官方组件或自定义程序同步至Elasticsearch。
- **日志格式定义**:使用Filebeat的多行合并功能和Logstash的过滤规则处理复杂日志。
- **MySQL数据同步**:通过业务层双写、DataX或Canal等工具实现MySQL数据的实时同步。
- **二级索引**:采用类似MySQL回表查询的方式,在Elasticsearch中存储相关记录ID,查询后再从MySQL或HBase中获取完整数据。

### 嘉宾介绍
- **姓名**:于伯伟
- **职位**:58同城高级架构师
- **职责**:负责58同城数据库部门,提供高可靠、高性能的数据库服务,涵盖MySQL、Redis、MongoDB、TiDB和Elasticsearch等数据库类型。
推荐阅读
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
  • CentOS系统安装与配置常见问题及解决方案
    本文详细介绍了在CentOS系统安装过程中遇到的常见问题及其解决方案,包括Vi编辑器的操作、图形界面的安装、网络连接故障排除等。通过本文,读者可以更好地理解和解决这些常见问题。 ... [详细]
  • Docker的安全基准
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 计算机网络复习:第五章 网络层控制平面
    本文探讨了网络层的控制平面,包括转发和路由选择的基本原理。转发在数据平面上实现,通过配置路由器中的转发表完成;而路由选择则在控制平面上进行,涉及路由器中路由表的配置与更新。此外,文章还介绍了ICMP协议、两种控制平面的实现方法、路由选择算法及其分类等内容。 ... [详细]
  • This guide provides a comprehensive step-by-step approach to successfully installing the MongoDB PHP driver on XAMPP for macOS, ensuring a smooth and efficient setup process. ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 本文基于刘洪波老师的《英文词根词缀精讲》,深入探讨了多个重要词根词缀的起源及其相关词汇,帮助读者更好地理解和记忆英语单词。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 前言--页数多了以后需要指定到某一页(只做了功能,样式没有细调)html ... [详细]
  • 在哈佛大学商学院举行的Cyberposium大会上,专家们深入探讨了开源软件的崛起及其对企业市场的影响。会议指出,开源软件不仅为企业提供了新的增长机会,还促进了软件质量的提升和创新。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 深入剖析 DEX 赛道:从 60 大头部项目看五大趋势
    本文通过分析 60 大头部去中心化交易平台(DEX),揭示了当前 DEX 赛道的五大发展趋势,包括市场集中度、跨链协议、AMM+NFT 结合、新公链崛起以及稳定币和衍生品交易的增长潜力。 ... [详细]
author-avatar
男人着责任
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有