热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

海豚调度5月Meetup:6个月重构大数据平台,帮你避开调度升级改造/集群迁移踩过的坑

当今许多企业都有着技术架构的DataOps程度不够、二次开发成本高、迁移成本高、集群部署混乱等情况,团队在技术选型之后发现并不适合自己的需求,但是迁移成本和难度又比较大,甚至前团队

当今许多企业都有着技术架构的DataOps程度不够、二次开发成本高、迁移成本高、集群部署混乱等情况,团队在技术选型之后发现并不适合自己的需求,但是迁移成本和难度又比较大,甚至前团队还留下了不少坑,企业自有的开发能力又比较有限,导致后面的小伙伴上手难度高体验差。

俗话说“工具选得好,下班回家早;调度用得对,半夜安心睡”,面对各种难点和痛点:



  • 如何有效地评估数据调度工具?



  • 如何平滑的过渡到Apache DolphinScheduler?



  • 如何稳定高效的对已有的工具升级改造?



这几个问题是改善现有状况的重中之重,是保障企业和团队数据调度任务高效运行的引擎。

不论你是处在什么企业,如果你正为数据调度工具的选型或迁移而苦恼;缺乏任务可视化编辑界面、补数和重试等必要功能;甚至连监控和管理功能都没有;

这就说明,你是时候来参加本期Meetup活动啦 !

2022年5月28日,Apache DolphinScheduler 社区邀请了来自当贝科技、Fordeal、JuiceFS社区等企业的资深大数据工程师与开发者,分享他们在技术选型、平台迁移、场景探索、优化与改造 Apache DolphinScheduler 过程中遭遇的问题与挑战。

除此之外,我们还特别邀请到了JuiceFS社区技术专家,跟大家延伸探讨关于设计云文件系统和日志归档场景中Apache DolphinScheduler的实践。无论你是Apache DolphinScheduler的开发工程师还是个人爱好者,来到本次Meetup,你一定能听到一手的分享,得到一手的收获!

Apache DolphinScheduler作为新一代的大数据任务调度系统,致力于让调度变得更加容易。身为一款专门针对于大数据平台的工作调度系统,具有本土化风格和多样化的部署方式。


01 报名通道

Apache DolphinScheduler Meetup | 5 月线上直播报名通道已开启,赶快预约吧!

时间:2022-5-28 14:00-16:10

形式:线上直播

点击原文链接或扫码预约报名(免费): https://zhibo.51cto.com/liveDetail/126

扫码预约报名

扫码添加群聊


02议程介绍

王昱翔 当贝大数据平台基础开发工程师

毕业于电子科技大学,主要是做大数据平台的构建、集成及组件的运维的工作

演讲时间:14:00-14:40

演讲题目:Apache DolphinScheduler在当贝大数据环境中的应用

演讲概要:之前当贝的大数据平台用的是Hadoop和CDH混合产物 ,调度用的是Oozie,主要问题是缺少补数和重试机制没有,导致用户上手难体验差,还存在hadoop集群部署混乱和clickhouse混合部署等问题,经过调研后,现在主要用Apache DolphinScheduler解决迁移集群、大数据平台重构、数据迁移、调度告警等问题!

卢栋    Fordeal 大数据开发工程师

5年的数据开发相关经验,目前就职于Fordeal

主要关注的数据技术方向包括:湖仓一体、MPP数据库、数据可视化等

演讲时间:14:40-15:30

演讲题目:数据平台调度升级改造,从Azkaban平滑过渡到Apache DolphinScheduler

演讲概要:Fordeal数据平台调度系统之前是基于Azkaban进行二次开发的,用户层面的问题是缺少任务可视化编辑界面、补数等必要功能,导致用户上手难体验差。技术层面的问题是架构过时持续迭代难度大。经过调研后,新版系统决定基于DolphinScheduler进行升级改造。整个迁移过程中面临最大的问题是如何让使用方平滑过渡到新系统,为了平滑迁移做了哪些升级改造?


15:30-15:35 填写问卷抽奖环节

苏锐Juicedata 合伙人

毕业于西安电子科技大学。在北航攻读硕士期间,作为早期工程师先后在傲游(Maxthon)浏览器、豆瓣任职。2014 年创立上门汽车服务品牌功夫洗车,并任 CEO 带领团队完成两轮融资。2017 年加入 Juicedata 开始新一次创业之旅,公司旗下的核心产品 JuiceFS 是一款面向云环境设计的分布式文件系统,以创新的设计定义了云时代文件存储的架构,服务数字化时代对海量数据、海量文件的存储与计算需求,已落地近百家领先科技企业。

演讲时间:15:35-16:05

演讲题目:设计云文件系统和日志归档场景中DolphinScheduler的实践

演讲概要:介绍什么是云文件系统;介绍设计架构与设计中的思考;如果用云文件系统做日志归档,分享在Nginx和Apache DolphinScheduler中的实践

欢迎大家参与5月28日Apache DolphinScheduler的线上交流会,下午14:00,我们不见不散!



推荐阅读
  • 服务器部署中的安全策略实践与优化
    服务器部署中的安全策略实践与优化 ... [详细]
  • 基于iSCSI的SQL Server 2012群集测试(一)SQL群集安装
    一、测试需求介绍与准备公司计划服务器迁移过程计划同时上线SQLServer2012,引入SQLServer2012群集提高高可用性,需要对SQLServ ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • Linux CentOS 7 安装PostgreSQL 9.5.17 (源码编译)
    近日需要将PostgreSQL数据库从Windows中迁移到Linux中,LinuxCentOS7安装PostgreSQL9.5.17安装过程特此记录。安装环境&#x ... [详细]
  • Spark与HBase结合处理大规模流量数据结构设计
    本文将详细介绍如何利用Spark和HBase进行大规模流量数据的分析与处理,包括数据结构的设计和优化方法。 ... [详细]
  • Ansible:自动化运维工具详解
    Ansible 是一款新兴的自动化运维工具,基于 Python 开发,集成了多种运维工具(如 Puppet、CFEngine、Chef、Func 和 Fabric)的优点,实现了批量系统配置、程序部署和命令执行等功能。本文将详细介绍 Ansible 的架构、特性和优势。 ... [详细]
  • Hadoop平台警告解决:无法加载本机Hadoop库的全面应对方案
    本文探讨了在Hadoop平台上遇到“无法加载本机Hadoop库”警告的多种解决方案。首先,通过修改日志配置文件来忽略该警告,这一方法被证明是有效的。其次,尝试指定本地库的路径,但未能解决问题。接着,尝试不使用Hadoop本地库,同样没有效果。然后,通过替换现有的Hadoop本地库,成功解决了问题。最后,根据Hadoop的源代码自行编译本地库,也达到了预期的效果。以上方法适用于macOS系统。 ... [详细]
  • 在ElasticStack日志监控系统中,Logstash编码插件自5.0版本起进行了重大改进。插件被独立拆分为gem包,每个插件可以单独进行更新和维护,无需依赖Logstash的整体升级。这不仅提高了系统的灵活性和可维护性,还简化了插件的管理和部署过程。本文将详细介绍这些编码插件的功能、配置方法,并通过实际生产环境中的应用案例,展示其在日志处理和监控中的高效性和可靠性。 ... [详细]
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • 提升 Kubernetes 集群管理效率的七大专业工具
    Kubernetes 在云原生环境中的应用日益广泛,然而集群管理的复杂性也随之增加。为了提高管理效率,本文推荐了七款专业工具,这些工具不仅能够简化日常操作,还能提升系统的稳定性和安全性。从自动化部署到监控和故障排查,这些工具覆盖了集群管理的各个方面,帮助管理员更好地应对挑战。 ... [详细]
  • MySQL 8.0 MGR 自动化部署与配置:DBA 和开源工具的高效解决方案
    MySQL 8.0 MGR 自动化部署与配置:DBA 和开源工具的高效解决方案 ... [详细]
  • 本文探讨了 Kafka 集群的高效部署与优化策略。首先介绍了 Kafka 的下载与安装步骤,包括从官方网站获取最新版本的压缩包并进行解压。随后详细讨论了集群配置的最佳实践,涵盖节点选择、网络优化和性能调优等方面,旨在提升系统的稳定性和处理能力。此外,还提供了常见的故障排查方法和监控方案,帮助运维人员更好地管理和维护 Kafka 集群。 ... [详细]
  • Docker入门指南:初探容器化技术
    Docker入门指南:初探容器化技术摘要:Docker 是一个使用 Go 语言开发的开源容器平台,旨在实现应用程序的构建、分发和运行的标准化。通过将应用及其依赖打包成轻量级的容器,Docker 能够确保应用在任何环境中都能一致地运行,从而提高开发和部署的效率。本文将详细介绍 Docker 的基本概念、核心功能以及如何快速上手使用这一强大的容器化工具。 ... [详细]
  • 本文探讨了利用Python编程语言开发自动化脚本来实现文件的全量和增量备份方法。通过详细分析不同备份策略的特点,文章介绍了如何使用Python标准库中的os和shutil模块来高效地管理和执行备份任务。此外,还提供了示例代码和最佳实践,帮助读者快速掌握自动化备份技术,确保数据的安全性和完整性。 ... [详细]
author-avatar
V铿锵花木兰V
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有