kafka（一）的基本应用

作者：mobiledu2502852923 | 来源：互联网 | 2023-08-07 11:37

对于消费者模式，在一般应用中可以使用阻塞队列线程池来实现。比如说在一个应用中，A方法调用B方法去执行一些任务处理。我们可以同步调用。但是如果这个时候请求

对于消费者模式&＃xff0c;在一般应用中可以使用阻塞队列&＃43;线程池来实现。比如说在一个应用中&＃xff0c;A方法调用B方法去执行一些任务处理。我们可以同步调用。但是如果这个时候请求比较多的情况下&＃xff0c;同步调用比较耗时会导致请求阻塞。我们会使用阻塞队列加线程池来实现异步任务的处理。

那么&＃xff0c;问题来了&＃xff0c;如果是在分布式系统中&＃xff0c;两个服务之间需要通过这种异步队列的方式来处理任务&＃xff0c;那单进程级别的队列就无法解决这个问题了。因此&＃xff0c;引入了消息中间件&＃xff0c;也就是把消息处理交给第三方的服务&＃xff0c;这个服务能够实现数据的存储以及传输&＃xff0c;使得在分布式架构下实现跨进程的远程消息通信。

所以&＃xff0c;简单来说&＃xff1a; 消息中间件是指利用高效可靠的消息传输机制进行平台无关的数据交流&＃xff0c;并且基于数据通信来进行分布式系统的集成。

我们每学习一个东西&＃xff0c;更应该去学会如何设计实现&＃xff1f;同样道理&＃xff0c;如果要设计一种消息中间件需要怎么去设计实现&＃xff1f;

可以先从基本的需求开始思考 &＃xff1a;

1、最基本的是要能支持消息的发送和接收&＃xff0c;需要涉及到网络通信就一定会涉及到NIO

2、消息中心的消息存储&＃xff08;持久化/非持久化&＃xff09;

3、消息的序列化和反序列化

4、是否跨语言

5、消息的确认机制&＃xff0c;如何避免消息重发

高级功能

1、消息的有序性

2、是否支持事务消息

3、消息收发的性能&＃xff0c;对高并发大数据量的支持

4、是否支持集群

5、消息的可靠性存储

6、是否支持多协议

这个思考的过程其实就是做需求的整理&＃xff0c;然后在使用已有的技术体系进行技术的实现。而我们目前阶段所去了解的&＃xff0c;无非就是别人根据实际需求进行实现之后&＃xff0c;我们如何使用他们提供的api进行应用而已。但是有了这样一个全局的思考&＃xff0c;那么对于后续学习这个技术本身而言&＃xff0c;也显得很容易了。

发展过程&＃xff1a;

实际上消息中间件的发展也是挺有意思的&＃xff0c;我们知道任何一个技术的出现都是为了解决实际问题&＃xff0c;这个问题是通过一种通用的软件“总线”也就是一种通信系统&＃xff0c;解决应用程序之间繁重的信息通信工作。最早的小白鼠就是金融交易领域&＃xff0c;因为在当时这个领域中&＃xff0c;交易员需要通过不同的终端完成交易&＃xff0c;每台终端显示不同的信息。如果接入消息总线&＃xff0c;那么交易员只需要在一台终端上操作&＃xff0c;然后订阅其他终端感兴趣的消息。于是就诞生了发布订阅模型&＃xff08;pubsub&＃xff09;&＃xff0c;同时诞生了世界上第一个现代消息队列软件&＃xff08;TIB&＃xff09; The information Bus, TIB允许开发者建立一系列规则去描述消息内容&＃xff0c;只要消息按照这些规则发布出去&＃xff0c;任何消费者应用都能订阅感兴趣的消息。随着TIB带来的甜头被广泛应用在各大领域&＃xff0c;IBM也开始研究开发自己的消息中间件&＃xff0c;3年后IBM的消息队列IBM MQ产品系列发布&＃xff0c;之后的一段时间MQ系列进化成了WebSphere MQ统治商业消息队列平台市场。

包括后期微软也研发了自己的消息队列&＃xff08;MSMQ&＃xff09;

各大厂商纷纷研究自己的MQ&＃xff0c;但是他们是以商业化模式运营自己的MQ软件&＃xff0c;商业MQ想要解决的是应用互通的问题&＃xff0c;而不是创建标准接口来允许不同MQ产品互通。所以有些大型的金融公司可能会使用来自多个供应商的MQ产品&＃xff0c;来服务企业内部不同的应用。那么问题来了&＃xff0c;如果应用已经订阅了TIB MQ的消息然后突然需要消费IBM MQ的消息&＃xff0c;那么整个实现过程会很麻烦。为了解决这个问题&＃xff0c;在2001年诞生了 Java Message Service(JMS)&＃xff0c;JMS通过提供公共的Java API方式&＃xff0c;隐藏单独MQ产品供应商的实现接口&＃xff0c;从而跨越了不同MQ消费和解决互通问题。从技术层面来说&＃xff0c;Java应用程序只需要针对JMS API编程&＃xff0c;选择合适的MQ驱动即可。JMS会处理其他部分。这种方案实际上是通过单独标准化接口来整合很多不同的接口&＃xff0c;效果还是不错的&＃xff0c;但是碰到了互用性的问题。两套使用两种不同编程语言的程序如何通过它们的异步消息传递机制相互通信呢。这个时候就需要定义一个异步消息传递的通用标准

所以AMQP&＃xff08;Advanced Message Queuing Protocol&＃xff09;高级消息队列协议产生了&＃xff0c;它使用了一套标准的底层协议&＃xff0c;加入了许多其他特征来支持互用性&＃xff0c;为现代应用丰富了消息传递需求&＃xff0c;针对标准编码的任何人都可以和任意AMQP供应商提供的MQ服务器进行交互。

除了JMS和AMQP规范以外&＃xff0c;还有一种MQTT&＃xff08;Message Queueing Telemetry[特莱米缺] Transport&＃xff09;&＃xff0c;它是专门为小设备设计的。因为计算性能不高的设备不能适应AMQP上的复杂操作&＃xff0c;它们需要一种简单而且可互用的方式进行通信。这是MQTT的基本要求&＃xff0c;而如今&＃xff0c;MQTT是物联网&＃xff08;IOT&＃xff09; 生态系统中主要成分之一

今天要讲解的Kafka&＃xff0c;它并没有遵循上面所说的协议规范&＃xff0c;注重吞吐量&＃xff0c;类似udp 和 tcp

kafka的介绍&＃xff08;基于2.0版本&＃xff09;

什么是Kafka

Kafka是一款分布式消息发布和订阅系统&＃xff0c;它的特点是高性能、高吞吐量。

最早设计的目的是作为LinkedIn的活动流和运营数据的处理管道。这些数据主要是用来对用户做用户画像分析以及服务器性能数据的一些监控所以kafka一开始设计的目标就是作为一个分布式、高吞吐量的消息系统&＃xff0c;所以适合运用在大数据传输场景。

所以kafka在我们大数据的课程里面也有讲解&＃xff0c;但是在Java的课程中&＃xff0c;我们仍然主要是讲解kafka 作为分布式消息中间件来讲解。不会去讲解到数据流的处理这块

Kafka的应用场景

由于kafka具有更好的吞吐量、内置分区、冗余及容错性的优点(kafka每秒可以处理几十万消息)&＃xff0c;让 kafka成为了一个很好的大规模消息处理应用的解决方案。所以在企业级应用长&＃xff0c;主要会应用于如下几个方面&＃xff1a;

1、行为跟踪&＃xff1a;kafka可以用于跟踪用户浏览页面、搜索及其他行为。通过发布-订阅模式实时记录到对应的 topic中&＃xff0c;通过后端大数据平台接入处理分析&＃xff0c;并做更进一步的实时处理和监控

2、日志收集&＃xff1a;日志收集方面&＃xff0c;有很多比较优秀的产品&＃xff0c;比如Apache Flume&＃xff0c;很多公司使用kafka代理日志聚合。日志聚合表示从服务器上收集日志文件&＃xff0c;然后放到一个集中的平台&＃xff08;文件服务器&＃xff09;进行处理。在实际应用开发中&＃xff0c;我们应用程序的log都会输出到本地的磁盘上&＃xff0c;排查问题的话通过linux命令来搞定&＃xff0c; 如果应用程序组成了负载均衡集群&＃xff0c;并且集群的机器有几十台以上&＃xff0c;那么想通过日志快速定位到问题&＃xff0c; 就是很麻烦的事情了。所以一般都会做一个日志统一收集平台管理log日志用来快速查询重要应用的问题。所以很多公司的套路都是把应用日志集中到kafka上&＃xff0c;然后分别导入到es和hdfs上&＃xff0c;用来做实时检索分析和离线统计数据备份等。而另一方面&＃xff0c;kafka本身又提供了很好的api来集成日志并且做日志收集

Kafka本身的架构

一个典型的kafka集群包含若干Producer&＃xff08;可以是应用节点产生的消息&＃xff0c;也可以是通过Flume收集日志产生的事件&＃xff09;&＃xff0c;若干个Broker&＃xff08;kafka支持水平扩展&＃xff09;、若干个Consumer Group&＃xff0c;以及一个 zookeeper集群。kafka通过zookeeper管理集群配置及服务协同。Producer使用push模式将消息发布到broker&＃xff0c;consumer通过监听使用pull模式从broker订阅并消费消息。

多个broker协同工作&＃xff0c;producer和consumer部署在各个业务逻辑中。三者通过zookeeper管理协调请求和转发。这样就组成了一个高性能的分布式消息发布和订阅系统。

图上有一个细节是和其他mq中间件不同的点&＃xff0c;producer 发送消息到broker的过程是push&＃xff0c;而 consumer从broker消费消息的过程是pull&＃xff0c;主动去拉数据。而不是broker把数据主动发送给consumer。

名词解释

1&＃xff09;Broker

Kafka集群包含一个或多个服务器&＃xff0c;这种服务器被称为broker。broker端不维护数据的消费状态&＃xff0c;提升了性能。直接使用磁盘进行存储&＃xff0c;线性读写&＃xff0c;速度快&＃xff1a;避免了数据在JVM内存和系统内存之间的复制&＃xff0c; 减少耗性能的创建对象和垃圾回收。

2&＃xff09;Producer

负责发布消息到Kafka broker

3&＃xff09;Consumer

消息消费者&＃xff0c;向Kafka broker读取消息的客户端&＃xff0c;consumer从broker拉取(pull)数据并进行处理。

4&＃xff09;Topic

每条发布到Kafka集群的消息都有一个类别&＃xff0c;这个类别被称为Topic。&＃xff08;物理上不同Topic的消息分开存储&＃xff0c;逻辑上一个Topic的消息虽然保存于一个或多个broker上但用户只需指定消息的Topic即可生产或消费数据而不必关心数据存于何处&＃xff09;

5&＃xff09;Partition

Parition是物理上的概念&＃xff0c;每个Topic包含一个或多个Partition.

6&＃xff09;Consumer Group

每个Consumer属于一个特定的Consumer Group&＃xff08;可为每个Consumer指定group name&＃xff0c;若不指定 group name则属于默认的group&＃xff09;

7&＃xff09;Topic & Partition

Topic在逻辑上可以被认为是一个queue&＃xff0c;每条消费都必须指定它的Topic&＃xff0c;可以简单理解为必须指明把这条消息放进哪个queue里。为了使得Kafka的吞吐率可以线性提高&＃xff0c;物理上把Topic分成一个或多个 Partition&＃xff0c;每个Partition在物理上对应一个文件夹&＃xff0c;该文件夹下存储这个Partition的所有消息和索引文件。若创建topic1和topic2两个topic&＃xff0c;且分别有13个和19个分区&＃xff0c;则整个集群上会相应会生成共32个文件夹&＃xff08;本文所用集群共8个节点&＃xff0c;此处topic1和topic2 replication-factor均为1&＃xff09;。

Kafka的安装部署

单机部署docker&＃xff1a;https://blog.csdn.net/qq_16563637/article/details/81701445?utm_medium&＃61;distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source&＃61;distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param

一、单机&＃xff1a;

下载kafka https://archive.apache.org/dist/kafka/2.0.0/kafka_2.11-2.0.0.tgz

安装过程

安装过程非常简单&＃xff0c;只需要解压就行&＃xff0c;因为这个是编译好之后的可执行程序 tar -zxvf kafka_2.11-2.0.0.tgz 解压

配置zookeeper

因为kafka依赖于zookeeper来做master选举一起其他数据的维护&＃xff0c;所以需要先启动zookeeper节点 &＃xff0c;kafka内置了zookeeper的服务&＃xff0c;所以在bin目录下提供了这些脚本。

zookeeper-server-start.sh zookeeper-server-stop.sh
在config目录下&＃xff0c;存在一些配置文件&＃xff1a;
zookeeper.properties server.properties

所以我们可以通过下面的脚本来启动zk服务&＃xff0c;当然&＃xff0c;也可以自己搭建zk的集群来实现

sh zookeeper-server-start.sh -daemon ../config/zookeeper.properties
启动和停止kafka

修改server.properties, 增加zookeeper的配置

zookeeper.connect&＃61;localhost:2181
启动kafka

sh kafka-server-start.sh -damoen config/server.properties
停止kafka

sh kafka-server-stop.sh -daemon config/server.properties

kafka的基本操作

创建topic&＃xff1a;

sh kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 -- partitions 1 --topic test
Replication-factor 表示该topic需要在不同的broker中保存几份&＃xff0c;这里设置成1&＃xff0c;表示在两个broker中保存两份 Partitions 分区数

查看topic&＃xff1a;

sh kafka-topics.sh --list --zookeeper localhost:2181
查看topic属性

sh kafka-topics.sh --describe --zookeeper localhost:2181 --topic first_topic
消费消息

sh kafka-console-consumer.sh --bootstrap-server 192.168.13.106:9092 --topic test --from-beginning
发送消息

sh kafka-console-producer.sh --broker-list 192.168.244.128:9092 --topic first_topic

集群环境安装

一、普通部署&＃xff1a;

https://blog.csdn.net/xuesp/article/details/88094326&＃xff08;用的是kafka自带的zk脚本&＃xff09;

二、docker部署&＃xff1a;

1、https://blog.csdn.net/weixin_42831855/article/details/91980398(standlone模式)&＃xff08;使用docker-compose&＃xff09;(自己部署的zk)

2、https://www.jianshu.com/p/630381fcb078&＃xff08;没用docker-compose&＃xff0c;使用自带的zk&＃xff09;

3、https://blog.csdn.net/yjp19871013/article/details/105165972/

https://www.jianshu.com/p/1ebaa1b12688&＃xff08;没用docker-compose&＃xff0c;自己部署zk&＃xff09;

推荐阅读

byte
Spring Boot + RabbitMQ 消息确认机制详解

本文详细介绍如何在 Spring Boot 项目中使用 RabbitMQ 的消息确认机制，包括消息发送确认和消息接收确认，帮助开发者解决在实际操作中可能遇到的问题。 ... [详细]

蜡笔小新 2024-11-16 20:54:38
header
深入探讨C++中的GCD函数与队列

在iOS开发中，多线程技术的应用非常广泛，能够高效地执行多个调度任务。本文将重点介绍GCD（Grand Central Dispatch）在多线程开发中的应用，包括其函数和队列的实现细节。 ... [详细]

蜡笔小新 2024-11-16 14:59:50
erlang
RocketMQ在秒杀时的应用

目录一、RocketMQ是什么二、broker和nameserver2.1Broker2.2NameServer三、MQ在秒杀场景下的应用3.1利用MQ进行异步操作3. ... [详细]

蜡笔小新 2024-11-14 12:27:39
erlang
ABP框架概览及其前后端开发系列（一）

ABP框架是ASP.NET Boilerplate的简称，它不仅是一个开源且文档丰富的应用程序框架，还提供了一套基于领域驱动设计（DDD）的最佳实践架构模型。本文将详细介绍ABP框架的特点、项目结构及其在Web API优先架构中的应用。 ... [详细]

蜡笔小新 2024-11-16 18:09:51
header
2023年最新指南：如何在PHP中屏蔽警告和错误

本文详细介绍了如何在PHP中屏蔽警告和错误，包括多种方法和最佳实践，帮助开发者提升代码质量和安全性。 ... [详细]

蜡笔小新 2024-11-16 02:00:40
hash
面试题总结_2019年全网最热门的123个Java并发面试题总结

面试题总结_2019年全网最热门的123个Java并发面试题总结 ... [详细]

蜡笔小新 2024-11-15 11:58:13
header
Cookie学习小结

Cookie学习小结 ... [详细]

蜡笔小新 2024-11-14 16:26:25
header
Kubernetes Metric Server Pod 运行异常：缺少 IP SANs

检查 Kubernetes 系统命名空间中的 Pod 状态时，发现 Metric Server Pod 虽然处于运行状态，但存在异常：日志显示 'it doesn’t contain any IP SANs'。 ... [详细]

蜡笔小新 2024-11-14 07:58:56
header
为什么多数程序员难以成为架构师？

探讨80%的程序员为何难以晋升为架构师，涉及技术深度、经验积累和综合能力等方面。本文将详细解析Tomcat的配置和服务组件，帮助读者理解其内部机制。 ... [详细]

蜡笔小新 2024-11-14 03:39:46
jsp
Java代码分层详解及其应用场景

本文详细介绍了Java代码分层的基本概念和常见分层模式，特别是MVC模式。同时探讨了不同项目需求下的分层策略，帮助读者更好地理解和应用Java分层思想。 ... [详细]

蜡笔小新 2024-11-13 17:03:49
jsp
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
list
Java高并发与多线程（二）：线程的实现方式详解

本文将深入探讨Java中线程的三种主要实现方式，包括继承Thread类、实现Runnable接口和实现Callable接口，并分析它们之间的异同及其应用场景。 ... [详细]

蜡笔小新 2024-11-12 14:31:23
foreach
深入解析 Lifecycle 的实现原理

本文将详细介绍 Android Jetpack 中 Lifecycle 组件的实现原理，帮助开发者更好地理解和使用 Lifecycle，避免常见的内存泄漏问题。 ... [详细]

蜡笔小新 2024-11-12 14:05:19
foreach
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
list
深入解析 Synchronized 锁的升级机制及其在并发编程中的应用

深入解析 Synchronized 锁的升级机制及其在并发编程中的应用 ... [详细]

蜡笔小新 2024-11-11 13:09:38

mobiledu2502852923

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章