Kafka生产消息降低网络io

作者：mobiledu2502929507 | 来源：互联网 | 2023-09-23 13:58

一、Kafka消息Kafka消息分为两层：消息集合（messageset）以及消息（message）一个消息集合中包含若干条日志项（recorditem），而日志项才是真正封装消息

一、Kafka消息

Kafka消息分为两层：消息集合（message set）以及消息（message）

一个消息集合中包含若干条日志项（record item），而日志项才是真正封装消息的地方。Kafka 底层的消息日志由一系列消息集合日志项组成。Kafka 通常不会直接操作具体的一条条消息，它总是在消息集合这个层面上进行写入操作。

在 Kafka 中，压缩可能发生在两个地方：生产者端和 Broker 端。

生产者程序中配置 compression.type 参数即表示启用指定类型的压缩算法。构建一个开启 GZIP 的 Producer 对象代码例子：

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("acks", "all");
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
// 开启 GZIP 压缩
props.put("compression.type", "gzip");

Producer producer = new KafkaProducer<>(props);

Broker端的压缩，其实很少会发生，因为大部分情况下 Broker 从 Producer 端接收到消息后仅仅是原封不动地保存而不会对其进行任何修改。

但有两个情况会出现：

情况一：Broker 端指定了和 Producer 端不同的压缩算法。除了producer端，Broker 端也可以设置compression.type 值，如果两者设置的不同，就一定要小心了，因为可能会发生预料之外的压缩 / 解压缩操作，通常表现为 Broker 端 CPU 使用率飙升。

情况二：Broker 端发生了消息格式转换。主要是为了兼容老版本的消费者程序，为了兼容老版本的格式，Broker 端会对新版本消息执行向老版本格式的转换。这个过程中会涉及消息的解压缩和重新压缩。一般情况下这种消息格式转换对性能是有很大影响的，除了这里的压缩之外，它还让 Kafka 丧失了 Zero Copy 特性。

Producer 端压缩、Broker 端保持、Consumer 端解压缩。

除了Consumer端会解压缩，Broker 端也会进行解压缩。每个压缩过的消息集合在 Broker 端写入时都要发生解压缩操作，目的就是为了对消息执行各种验证。这里会对cpu有消耗。

zstd 算法有着最高的压缩比， LZ4 算法吞吐量最高。

即在吞吐量方面：LZ4 > Snappy > zstd 和 GZIP；而在压缩比方面，zstd > LZ4 > GZIP > Snappy。具体到物理资源，使用 Snappy 算法占用的网络带宽最多，zstd 最少，这是合理的，毕竟 zstd 就是要提供超高的压缩比；在 CPU 使用率方面，各个算法表现得差不多，只是在压缩时 Snappy 算法使用的 CPU 较多一些，而在解压缩时 GZIP 算法则可能使用更多的 CPU。

推荐阅读

c语言
电商高并发解决方案详解

本文以京东为例，详细探讨了电商中常见的高并发解决方案，包括多级缓存和Nginx限流技术，旨在帮助读者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-11-18 14:59:39
string
[编程题] LeetCode上的Dynamic Programming(动态规划)类型的题目

继上次把backTracking的题目做了一下之后：backTracking，我把LeetCode的动态规划的题目又做了一下，还有几道比较难的Medium的题和Hard的题没做出来，后面会继续 ... [详细]

蜡笔小新 2024-11-26 14:31:10
install
在CentOS 7中部署Nginx并配置SSL证书

本文详细介绍了如何在CentOS 7操作系统上安装Nginx服务器，并配置SSL证书以增强网站的安全性。适合初学者和中级用户参考。 ... [详细]

蜡笔小新 2024-11-24 02:18:19
string
Java实现AC自动机进行高效多模式匹配

本文介绍如何使用Java实现AC自动机（Aho-Corasick算法），以实现高效的多模式字符串匹配。文章涵盖了Trie树和KMP算法的基础知识，并提供了一个详细的代码示例，包括构建Trie树、设置失败指针以及执行搜索的过程。 ... [详细]

蜡笔小新 2024-11-28 14:52:17
string
20145209刘一阳《JAVA程序设计》第三周课堂测试

第三周课堂测试1、使用汇编语言编写指令时，用一些简单的容易记忆的符号来代替二进制指令，比机器语言更为方便，属于高级语言。（B ... [详细]

蜡笔小新 2024-11-28 13:02:41
go
计算机视觉初学者指南：如何顺利入门

本文旨在为计算机视觉领域的初学者提供一套全面的入门指南，涵盖基础知识、技术工具、学习资源等方面，帮助读者快速掌握计算机视觉的核心概念和技术。 ... [详细]

蜡笔小新 2024-11-27 13:38:50
tree
时序数据库的应用与设计策略

时序数据是指按时间顺序排列的数据集。通过时间轴上的数据点连接，可以构建多维度报表，揭示数据的趋势、规律及异常情况。 ... [详细]

蜡笔小新 2024-11-26 17:30:42
format
详解Linux命令：mysqlshow的使用方法

本文详细介绍了如何使用Linux下的mysqlshow命令来查询MySQL数据库的相关信息，包括数据库、表以及字段的详情。通过本文的学习，读者可以掌握mysqlshow命令的基本语法及其常用选项。 ... [详细]

蜡笔小新 2024-11-24 11:25:08
string
PHP Memcached 使用详解

本文详细介绍了如何在PHP中使用Memcached进行数据缓存，包括服务器连接、数据操作、高级功能等。 ... [详细]

蜡笔小新 2024-11-24 09:51:34
spring
必须为元素类型 mapper 声明属性 namespace解决

在使用mybatis进行mapper.xml测试的时候发生必须为元素类型“mapper”声明属性“namespace”的错误项目目录结构UserMapper和UserMappe ... [详细]

蜡笔小新 2024-11-23 20:06:58
string
Qt应用开发：创建基本窗口

本文介绍如何使用Qt框架创建基础窗口的两种方法。第一种方法直接在main函数中创建并显示窗口；第二种方法通过定义一个继承自QWidget的类来实现更复杂的功能。 ... [详细]

蜡笔小新 2024-11-28 03:27:55
string
5G时代的广域网革新：企业迈向万物智联的新起点

随着2020年初“新基建”概念的提出，以5G、AI、IoT等为核心的新型基础设施建设正逐步改变企业的运营模式。本文探讨了在这一背景下，企业广域网（WAN）如何通过5G与SD-WAN技术的融合实现转型升级，成为推动企业智能化、数字化发展的关键力量。 ... [详细]

蜡笔小新 2024-11-27 21:25:17
string
Lua脚本深入解析：元表与元方法的应用

本文探讨了Lua中元表和元方法的使用，通过具体的代码示例展示了如何利用这些特性来实现类似C语言中的运算符重载功能。 ... [详细]

蜡笔小新 2024-11-27 19:31:10
string
【Java数据结构和算法】008栈

目录0、警醒自己一、栈的应用场景和介绍1、栈的应用场景一个实际的场景：我的思考：2、栈的介绍入栈演示图：出栈演示图 ... [详细]

蜡笔小新 2024-11-27 12:54:42
spring
解决Spring Cloud Eureka自定义端口时连接错误的问题

在尝试通过自定义端口部署Spring Cloud Eureka时遇到了连接失败的问题。本文详细描述了问题的现象，并提供了有效的解决方案，以帮助遇到类似情况的开发者。 ... [详细]

蜡笔小新 2024-11-20 13:05:47

mobiledu2502929507

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章