当前位置: 开发笔记 > 后端 > 正文

日均万亿事件：Netflix怎么做实时流处理？

作者：龙井龙井2502908921 | 来源：互联网 | 2023-07-07 17:15

在这篇文章中，我们将讨论流式处理所面临的挑战、Keystone的设计原则、思维模式、架构总览、我们的愿景以及Keystone为Netflix所带来的核心价值。单个流式作业：通过平台

在这篇文章中，我们将讨论流式处理所面临的挑战、Keystone 的设计原则、思维模式、架构总览、我们的愿景以及 Keystone 为 Netflix 所带来的核心价值。

单个流式作业：

通过平台管理这些作业：

在用户签入代码后，CI 自动化流程将开始构建 Docker 镜像，并通过平台后端注册镜像，用户可以执行部署和其他操作。

4. 流式处理引擎

我们目前正在基于 Apache Flink 为 Keystone 的分析用例构建一个生态系统。我们计划集成和扩展 Mantis 流式处理引擎。

5. 连接器、托管 operator 和应用程序抽象

为了帮助我们的用户提高开发敏捷性和创新，我们提供了全方位的抽象，包括托管连接器、让用户可以接入处理 DAG 的 operator，以及与各种平台服务的集成。

我们为 Kafka、Elasticsearch、Hive 等提供了托管连接器。这些连接器抽象出了自定义连线格式、序列化、批处理 / 限定行为以及接入处理 DAG 的便利性。我们还提供动态数据源 / 接收器 operator，用户可以在不同的数据源或接收器之间切换，而无需重新构建。

其他托管的 operator 还包括过滤器、投影聚合和易于理解的数据卫生自定义 DSL。我们将继续与用户合作开发更多的 operator，并让更多团队可以使用这些 operator。

6. 配置和不可变部署

多租户配置管理有一定的挑战性。我们希望提供动态且易于管理的配置体验（用户无需重新提交和构建代码）。

托管的配置和用户定义配置都保存在应用程序的属性文件中，这些配置可以被环境变量覆盖，也可以通过自助 UI 覆盖这些属性。这种方法适用于我们的调和架构，用户通过 UI 声明想要的配置并部署编排，确保运行时的最终一致性。

7. 自我恢复

在分布式系统中，故障是不可避免的。我们完全相信故障会在任何时候发生，所以我们的系统被设计成具有自我恢复能力，这样就不必在半夜醒来处理事故。

从架构上看，平台组件服务被隔离出来，以便在发生故障时减少影响范围。调和架构还通过持续调和来确保系统级别的自我恢复能力。

单个作业遵循相同的隔离模式，以减少故障影响。但是，为了处理故障并从故障中恢复，每个托管流式作业都配有健康监视器。健康监视器是运行在 Flink 集群中的内部组件，负责检测故障情况并执行自我修复：

集群任务管理器漂移：当 Flink 容器资源视图与容器运行时视图不匹配时就会出现漂移，通过主动终止受影响的容器，可以自动纠正漂移。
暂停作业管理器首领：如果未能选举出首领，集群就会进入无脑状态，此时需要对作业管理器执行纠正措施。
不稳定的容器资源：如果某个任务管理器出现不稳定的模式（如定期重启 / 故障），它将被替换。
网络分区：如果容器遇到网络连接问题，它将自动终止。

8. 回填和回放

因为故障是不可避免的，所以有时候用户可能需要回填或回放处理作业。

对于备份到数据仓库中的源数据，我们在平台中构建了相应的功能，用来动态切换数据源而无需修改和重新构建代码。这种方法有一定的局限性，建议将它应用在无状态作业上。

或者，用户可以选择回到之前自动保存的检查点开始重新处理。

9. 监控和警报

所有单个的流式作业都配有个性化的监控和警报仪表盘。这有助于平台 / 基础设施团队和应用程序团队监控和诊断问题。

10. 可靠性和测试

随着平台和底层基础设施服务不断创新，提供越来越多的新功能和改进，快速采用这些变化的压力是自下而上的（架构层面）。

随着应用程序的开发和发布，可靠性的压力是自上而下的。

于是，压力在中间相遇了。为了获得信任，我们需要让平台和用户能够有效地测试整个技术栈。

我们坚持为所有用户进行单元测试、集成测试、金丝雀运营。我们正在这方面取得进展，但仍然有很多问题需要解决。

现在和未来

在过去的一年半中，Keystone 流式处理平台每天可以处理万亿个事件。我们的合作伙伴团队已经用它构建各种流式分析应用。此外，我们也看到了一些建立在 Keystone 之上的更高级别的平台。

但是，我们的故事并未就此结束。要实现我们的平台愿景，还有很长的路要走。以下是我们正在研究的一些有趣的事项：

模式（schema）
让平台交互变得更灵活的服务层
提供流式 SQL 和其他更高级别的抽象，为不同的用户提供价值
分析和机器学习用例
微服务事件溯源架构模式

推荐阅读

hive
马蜂窝数据总监分享：从数仓到数据中台，大数据演进技术选型最优解

大家好，今天分享的议题主要包括几大内容：带大家回顾一下大数据在国内的发展，从传统数仓到当前数据中台的演进过程；我个人认为数 ... [详细]

蜡笔小新 2023-10-14 14:20:07
queue
你知道Kafka和Redis的各自优缺点吗？一文带你优化选择，不走弯路

你知道Kafka和Redis的各自优缺点吗？一文带你优化选择，不走弯路 ... [详细]

蜡笔小新 2023-10-15 17:24:27
queue
什么是大数据lambda架构

一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出，根据维基百科的定义，Lambda架构的设计是为了在处理大规模数 ... [详细]

蜡笔小新 2023-10-17 16:06:09
queue
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
service
数据库异常智能分析与诊断

数据库,异常, ... [详细]

蜡笔小新 2023-10-14 10:52:47
queue
关于存储:Streaming-Data-Warehouse-存储需求与架构

在计算机领域，数据仓库（DW或DWH），是一个用于报告和数据分析的零碎，被认为是商业智能的一个外围组成部分。它将以后和历史数据存储在一个中央，为整个企 ... [详细]

蜡笔小新 2023-10-12 23:20:28
x86
Windows下配置PHP5.6的方法及注意事项

本文介绍了在Windows系统下配置PHP5.6的步骤及注意事项，包括下载PHP5.6、解压并配置IIS、添加模块映射、测试等。同时提供了一些常见问题的解决方法，如下载缺失的msvcr110.dll文件等。通过本文的指导，读者可以轻松地在Windows系统下配置PHP5.6，并解决一些常见的配置问题。 ... [详细]

蜡笔小新 2023-12-14 12:37:25
x86
Voicewo在线语音识别转换jQuery插件的特点和示例

本文介绍了一款名为Voicewo的在线语音识别转换jQuery插件，该插件具有快速、架构、风格、扩展和兼容等特点，适合在互联网应用中使用。同时还提供了一个快速示例供开发人员参考。 ... [详细]

蜡笔小新 2023-12-13 20:01:16
x86
Web学习历程记录（七）——Tomcat基本概念和配置

本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念，以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器，包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实，适合初学者了解Tomcat的基础知识。 ... [详细]

蜡笔小新 2023-12-13 17:08:24
service
flowable工作流流程变量_信也科技工作流平台的技术实践

1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下：目前OA流程引擎无法满足企业特定业务流程需求，且移动端体 ... [详细]

蜡笔小新 2023-12-13 10:17:15
curl
Linux如何安装Mongodb的详细步骤和注意事项

本文介绍了Linux如何安装Mongodb的详细步骤和注意事项，同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库，适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作，能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]

蜡笔小新 2023-12-12 21:54:15
curl
KAFKA 进阶：深入探讨 kafka 分区数过多的问题及影响

大家好，这是一个为了梦想而保持学习的博客。这个专题会记录我对于KAFKA的学习和实战经验，希望对大家有所帮助，目录形式依旧为问答的方式，相当于是模拟面试。一、概述在对kafka有了 ... [详细]

蜡笔小新 2023-10-14 18:34:27
curl
Flink（三）IDEA开发Flink环境搭建与测试

一.IDEA开发环境1.pom文件设置1.8 ... [详细]

蜡笔小新 2023-10-14 15:13:26
curl
flask json传输失败_GO小知识之实例演示 json 如何转化为 map 和 struct

简单谈一些JSON数据处理的小知识。近期工作中，因为要把数据库数据实时更新到elasticsearch，在实践过程中遇到了一些JSON数据处理的问题。实 ... [详细]

蜡笔小新 2023-10-13 12:14:39
curl
将日志从远程服务器拉入Elasticsearch

简短的问题是：是否可以从远程服务器中提取日志（在日志文件中）并将其提取到 ... [详细]

蜡笔小新 2023-10-13 11:23:51

龙井龙井2502908921

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章