KAFKA进阶：深入探讨kafka分区数过多的问题及影响

作者：10灬月 | 来源：互联网 | 2023-10-14 18:34

大家好，这是一个为了梦想而保持学习的博客。这个专题会记录我对于KAFKA的学习和实战经验，希望对大家有所帮助，目录形式依旧为问答的方式，相当于是模拟面试。一、概述在对kafka有了

大家好，这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验，希望对大家有所帮助，目录形式依旧为问答的方式，相当于是模拟面试。

一、概述

在对 kafka 有了基础的认知之后，回过头来看看，当前 kafka 的存储架构还存在哪些问题呢？
很多地方有提到 kafka 无法承载大量的分区这个问题，但是都只给了个结论，没有说明其中缘由，这里我们就来梳理一下。

二、磁盘顺序写特性被破坏，导致写入吞吐量下降

我们从前面的【十一】小节知道，kafka 有如此高的写入吞吐量，主要是得益于追加写的性能极高，但是如果这个特性被破坏，那么写入吞吐量就会有明显的下降，那么什么时候会破坏这个特性呢？我们先从基本的磁盘 IO 说起。

机械硬盘的 IO 过程可以简单的理解为两个阶段：寻址 + 数据写入其中寻址是个物理动作，就是需要通过旋转加上磁臂去找到对应的扇区，这个过程的耗时是毫秒级的，相对于其他计算机类的操作，高出了好几个数量级。而数据写入呢，就是将我们的数据写入物理载体中，相对来说也是很快的。

从这个大概的过程中，我们知道，机械硬盘的 IO 过程慢就慢在寻址这个操作上，那我们有没有什么办法能优化掉这个过程呢？其中一个优化点就是追加写。
试想你一直只对一个文件进行写入，那么磁臂就根本就不需要再寻址了呀，接着往下写就好啦，所以就省去了寻址的这个开销，让写磁盘的性能能接近写内存。
也正是由于追加写的这个特性，在 Linux 的 IO 调度层面，有 4 种不同的调度策略，都尝试将随机的 IO 请求尽可能的合并成顺序写或者临近读，从而优化 IO 性能，在这里我简单的提一下，大家有兴趣可以进行查阅相关资料：

NOOP：大致上就是所有进程共用一个先进先出队列，做了简单的相邻请求合并。

CFQ（默认）：特点是按照 I/O 请求的地址进行排序，而不是按照先进先出的顺序响应的，并且会为每个进程都创建一个这样特点的队列。但是存在 “饿死” 的场景，也就是我一个很小的读请求要读取很后面的地址，但是因为排序之后，被前面的很大的 I/O 请求给卡住了，导致无法被执行。

DEADLINE：针对 CFQ 算法进行了优化，为每个请求设置了超时时间，如果达到了这么个时间一定要被调度执行，读等待时间为 500ms，写等待时间为 5s。

ANTICIPATORY：为每个 I/O 都设置 6ms 的等待时间窗口，如果 6ms 内收到了相邻的 I/O 请求，那么就进行合并，通过增加时间的方式来获取更高的性能，尽可能的将随机读写转换为顺序读写。

进入正题，为什么 kafka 的分区数多了知道会破坏追加写的特性呢？
分区底层对应的是底层一个个 segment 文件，如果一个 broker 上，有上万个分区，那么对应的就需要去写上万个 segment，那么从磁盘的角度来说就是我刚写完 A 文件，又要重新寻址去写 B 文件，以此类推，当文件一多，就相当于是随机 IO 了，追加写的特性就由此被破坏，写入吞吐量就受到了非常大的影响。另外提一句，RocketMQ 就是基于这个原因将所有分区数据都写到一个 commitLog 中来规避这个问题。

最后再提一句，我们在说随机 I/O 和追加写的时候，是站在磁盘的角度去说的，跟上层持不持有 file 的引用或者用什么流去写入没有什么关系，这也是我之前认知的一个误区。

另外就是，这个问题只会存在于机械硬盘，云盘和 SSD 都不会存在，因为云盘走的是带宽，而 SSD 是元器件也不需要物理旋转寻址。

三、集群故障转移受影响，导致故障转移耗时增加

另外一个影响点就是我们日常运维会遇到的问题，故障转移和集群状态恢复时间受到影响。
其中的影响点主要是由于 kafka 故障转移时主要依靠 controller+zk 去实现的，而整个过程的是单线程顺序去执行的，整个过程大概分为：计算新的 leader + 更新 zk 数据 + 通知其他节点将 follower 变为 leader + 更新元数据。而在这个过着执行完之前，对应受影响的分区都是没有 leader 可以去提供读写服务的，所以对业务的影响是很大的。
试想我们集群有几十万的分区数，那么这个过程将非常耗时，达到分钟级别甚至小时级别。但是 kafka 在 1.1.0 版本优化了这个问题，主要优化点三个：zk 批量异步写 / 批量计算通知 / 日志优化。
具体参见胡夕大佬的翻译文章：【译】Apache Kafka 支持单集群 20 万分区

四、元数据太过庞大，导致更新元数据操作变重

这个问题就是显而易见的了，当分区数很多的时候，整个集群的元数据将会变得庞大，一旦集群状态变化，整个集群都会更新元数据，但是由于元数据太过庞大会让这个更新操作变得非常沉重。

五、日志清理受影响

kafka 的日志文件操作，是 broker 有个后台清理线程去定时检查执行的，一旦一台 broker 上的文件过多，会导致线程处理不过来，无法及时清理掉对应的磁盘文件，从而导致磁盘被打满等异常情况。

推荐阅读

netty
收割机|篇幅_国内最牛逼的笔记，不接受反驳！！

收割机|篇幅_国内最牛逼的笔记，不接受反驳！！ ... [详细]

蜡笔小新 2024-12-14 10:20:42
go
数据管理权威指南：《DAMA-DMBOK2 数据管理知识体系》

本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释，构建了数据管理的总体框架，为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]

蜡笔小新 2024-12-27 18:29:55
go
Netflix利用Druid实现高效实时数据分析

本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid，实现了高效的数据采集、处理和实时分析，从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践，并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]

蜡笔小新 2024-12-23 11:10:01
go
全面解析运维监控：白盒与黑盒监控及四大黄金指标

本文深入探讨了白盒和黑盒监控的概念，以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法，结合四个黄金指标的解读，帮助读者更好地理解和实施有效的监控策略。 ... [详细]

蜡笔小新 2024-12-22 14:02:29
input
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
go
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
version
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10
range
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
command
macOS系统及其关键功能解析

本文详细介绍了macOS系统的核心组件，包括如何管理其安全特性——系统完整性保护（SIP），并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说，了解这些信息有助于更好地管理和优化系统性能。 ... [详细]

蜡笔小新 2024-12-26 18:05:04
go
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
go
Ralph的Kubernetes进阶之旅：集群架构与对象解析

本文深入探讨了Kubernetes集群的架构和核心对象，详细介绍了Pod、Service、Volume等基本组件，以及更高层次的抽象如Deployment、StatefulSet等，帮助读者全面理解Kubernetes的工作原理。 ... [详细]

蜡笔小新 2024-12-26 14:15:32
go
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
replace
深入解析 org.apache.xmlbeans.SchemaType.getBaseEnumType() 方法及其应用

本文详细介绍了 Java 中 org.apache.xmlbeans.SchemaType 类的 getBaseEnumType() 方法，提供了多个代码示例，并解释了其在不同场景下的使用方法。 ... [详细]

蜡笔小新 2024-12-26 11:46:55
uml
深入理解领域驱动设计及其实践

本文探讨了领域驱动设计（DDD）的核心概念、应用场景及其实现方式，详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型，展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]

蜡笔小新 2024-12-25 18:45:55
uml
掌握Java EE的全面指南

探讨如何真正掌握Java EE，包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法，并提供了详尽的标准。 ... [详细]

蜡笔小新 2024-12-25 13:38:29

10灬月

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章