热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

云平台队列服务-Qbus实践

点击蓝字关注我们

云平台队列服务-Qbus实践

点击蓝字关注我们

本篇文章 从Qbus服务介绍、架构、使用场景开展, 涉及到队列底层具体实现原理, 只讲把Qbus服务上 到私有云的过程,希望给有相同需求的各位带来一点有价值的东西。下来就跟随作者一同学习下吧。

1

服务介绍

Qbus作为云平台队列服务,服务于公司各个业务线,目前 每天流量PB+ , topic 1W

Qbus以kafka组件为核心,及其周边配套服务 ,包括 日志收集 各种语言的sdk 持久化存储到hdfs 业务定制监控 等服务。

2

使用场景

场景广泛,包括日志系统,打点服务,大数据,流处理等常见场景。主要作用为   服务解耦 消息通讯 流量削峰   等。

3

服务架构

云平台队列服务-Qbus实践

4

业务接入方法

读写客户端主要有以下三种:

  • 日志收集;

  • sdk 写入;

  • 其他组件或者平台的读写(比如flink,hadoop);

其中前两种,可以直接在云平台提交工单,自动审核通过。第三种需要人工沟通,我们提供多版本集群,适配更多业务平台。

5

服务具体实现

其中我结合整个服务的实现。说一下我们主要做了的东西,及遇到的问题。这篇只讲解决方案。不涉及到具体细节。

日志收集组件:

日志收集使用 logstash 组件做了定制, filebeat 版在研发马上上线。

一般用户在云平台申请了日志收集的 topic ,填写了机器,与收集路径,就会生成一个自动工单,由命令系统自动去业务机器安装logstash。当然还包括日常的路径增删改查,这些由我们为云平台提供接口来实现。

定制功能包括

  • 配置统一管理,自动更新;

  • 收集进度汇报;

  • 服务自检;

  • 日志头添加机器名,特殊日志归并;

  • bug 修改;

配置存放在云平台配置中心。

状态展示如图:

云平台队列服务-Qbus实践

6

SDK

SDK是组内自研的。kafka-bridge 目前已经开源。欢迎大家使用。

定制功能包括

  • 使用VIP代替broker_list;

  • 更强大的错误处理,当有不可用副本时候直接跳过;

  • 相关参数优化;

7

持续化保存到HDFS

这是 Qbus队列周边的配套服务,提供持久化到HDFS的功能。

HDFS我们直接用的兄弟部门的平台。

服务架构如下:

云平台队列服务-Qbus实践

如图示,主要实现了以下内容:

  • 消费组件使用 flume , 我们给他做了容器化;

  • 相关配置存放在云平台配置中心 ,支持动态更改;

  • 我们在外围增加了一个动态调整工具,实时监控消费状态,自动的加减副本;

  • 还做了历史状态保存,统一展示,做到有据可查;

这样用户只需要在页面点一下开通或者关闭,就可以了,非常方便。

云平台队列服务-Qbus实践

8

监控服务

监控服务作为整体服务的基础,为整体服务提供数据支撑,包括上层的动态调整工具,都非常依赖监控。

当然业务们也有权限在云平台查看自己topic的流量情况。   云平台队列服务-Qbus实践

监控服务我们主要使用了 Prometheus

如图:

云平台队列服务-Qbus实践

对它做了以下改造:

  • 根据业务水平切分为多个进程,做HA;

  • 统一的后端存储(influxdb 集群);

  • prometheus 前增加了nginx做反向代理;

  • 增加权限验证;

这样为上层提供稳定的监控数据接口。

9

总结和展望

在Qbus 服务依托云平台已经做到了工单全自动,除非kafka集群故障需要人工处理。

但是随着越来越多的业务都把服务上到容器平台之后,横向扩容变得非常迅捷,频繁,异常处理也可能不太合理,这也对基础服务带来了更多的挑战。

基础服务要做的更加健壮,才能应付这一切。

这其中包括:

  • 更迅速的扩容,迁移能力;

  • 更丰富的业务隔离;

  • 更强大的客户端兼容;

说到这里,更期待 pulsar 加入到新版本的qbus了。

往期精彩回顾

Golang开发入门(一)

实习招聘|360云平台火热招聘中

360S tack裸金属服务器部署实践

云平台队列服务-Qbus实践
云平台队列服务-Qbus实践

360技术公众号

技术干货|一手资讯|精彩活动

扫码关注我们


以上所述就是小编给大家介绍的《云平台队列服务-Qbus实践》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 我们 的支持!


推荐阅读
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 第二章:Kafka基础入门与核心概念解析
    本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统,以其卓越的性能和高吞吐量而著称。最初,Kafka被设计用于LinkedIn的活动流和运营数据处理,旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景,读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]
  • 字节跳动深圳研发中心安全业务团队正在火热招募人才! ... [详细]
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  • 马蜂窝数据总监分享:从数仓到数据中台,大数据演进技术选型最优解
    大家好,今天分享的议题主要包括几大内容:带大家回顾一下大数据在国内的发展,从传统数仓到当前数据中台的演进过程;我个人认为数 ... [详细]
  • 数据库异常智能分析与诊断
    数据库,异常, ... [详细]
  • Flume 数据采集组件
    目录1、数据收集工具系统产生背景2、专业的数据收集工具2.1、Chukwa2.2、Scribe2.3、Fluentd2.4、Logstash2.5、ApacheFlu ... [详细]
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • 本文探讨了 Kafka 集群的高效部署与优化策略。首先介绍了 Kafka 的下载与安装步骤,包括从官方网站获取最新版本的压缩包并进行解压。随后详细讨论了集群配置的最佳实践,涵盖节点选择、网络优化和性能调优等方面,旨在提升系统的稳定性和处理能力。此外,还提供了常见的故障排查方法和监控方案,帮助运维人员更好地管理和维护 Kafka 集群。 ... [详细]
  • 美团优选推荐系统架构师 L7/L8:算法与工程深度融合 ... [详细]
  • 你知道Kafka和Redis的各自优缺点吗?一文带你优化选择,不走弯路 ... [详细]
  • ELK stack 学习记录
    ELK日志分析平台学习记录首先ELK主要指elasticsearch、logstash和kibana,三个开源软件组合而成的一套日志平台解决方案。可以将平时收集到的日志,通过前台展 ... [详细]
  • 在计算机领域,数据仓库(DW或DWH),是一个用于报告和数据分析的零碎,被认为是商业智能的一个外围组成部分。它将以后和历史数据存储在一个中央,为整个企 ... [详细]
  • 目录摘要SQL的现在NoSQL,NotOnlySQL要分布式,也要SQL总结引用摘要毫不夸张的说,关系数据库是企业软件系统的核心,企业形形色色信息行为的背后,都有关系数据库的支撑。 ... [详细]
  • 无服务器_云原生数据湖架构中的无服务器 Kafka
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了云原生数据湖架构中的无服务器Kafka相关的知识,希望对你有一定的参考价值。 ... [详细]
author-avatar
萌萌美人鱼
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有