热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

海豚调度5月Meetup:6个月重构大数据平台,帮你避开调度升级改造/集群迁移踩过的坑

当今许多企业都有着技术架构的DataOps程度不够、二次开发成本高、迁移成本高、集群部署混乱等情况,团队在技术选型之后发现并不适合自己的需求,但是迁移成本和难度又比较大,甚至前团队

当今许多企业都有着技术架构的DataOps程度不够、二次开发成本高、迁移成本高、集群部署混乱等情况,团队在技术选型之后发现并不适合自己的需求,但是迁移成本和难度又比较大,甚至前团队还留下了不少坑,企业自有的开发能力又比较有限,导致后面的小伙伴上手难度高体验差。

俗话说“工具选得好,下班回家早;调度用得对,半夜安心睡”,面对各种难点和痛点:



  • 如何有效地评估数据调度工具?



  • 如何平滑的过渡到Apache DolphinScheduler?



  • 如何稳定高效的对已有的工具升级改造?



这几个问题是改善现有状况的重中之重,是保障企业和团队数据调度任务高效运行的引擎。

不论你是处在什么企业,如果你正为数据调度工具的选型或迁移而苦恼;缺乏任务可视化编辑界面、补数和重试等必要功能;甚至连监控和管理功能都没有;

这就说明,你是时候来参加本期Meetup活动啦 !

2022年5月28日,Apache DolphinScheduler 社区邀请了来自当贝科技、Fordeal、JuiceFS社区等企业的资深大数据工程师与开发者,分享他们在技术选型、平台迁移、场景探索、优化与改造 Apache DolphinScheduler 过程中遭遇的问题与挑战。

除此之外,我们还特别邀请到了JuiceFS社区技术专家,跟大家延伸探讨关于设计云文件系统和日志归档场景中Apache DolphinScheduler的实践。无论你是Apache DolphinScheduler的开发工程师还是个人爱好者,来到本次Meetup,你一定能听到一手的分享,得到一手的收获!

Apache DolphinScheduler作为新一代的大数据任务调度系统,致力于让调度变得更加容易。身为一款专门针对于大数据平台的工作调度系统,具有本土化风格和多样化的部署方式。


01 报名通道

Apache DolphinScheduler Meetup | 5 月线上直播报名通道已开启,赶快预约吧!

时间:2022-5-28 14:00-16:10

形式:线上直播

点击原文链接或扫码预约报名(免费): https://zhibo.51cto.com/liveDetail/126

扫码预约报名

扫码添加群聊


02议程介绍

王昱翔 当贝大数据平台基础开发工程师

毕业于电子科技大学,主要是做大数据平台的构建、集成及组件的运维的工作

演讲时间:14:00-14:40

演讲题目:Apache DolphinScheduler在当贝大数据环境中的应用

演讲概要:之前当贝的大数据平台用的是Hadoop和CDH混合产物 ,调度用的是Oozie,主要问题是缺少补数和重试机制没有,导致用户上手难体验差,还存在hadoop集群部署混乱和clickhouse混合部署等问题,经过调研后,现在主要用Apache DolphinScheduler解决迁移集群、大数据平台重构、数据迁移、调度告警等问题!

卢栋    Fordeal 大数据开发工程师

5年的数据开发相关经验,目前就职于Fordeal

主要关注的数据技术方向包括:湖仓一体、MPP数据库、数据可视化等

演讲时间:14:40-15:30

演讲题目:数据平台调度升级改造,从Azkaban平滑过渡到Apache DolphinScheduler

演讲概要:Fordeal数据平台调度系统之前是基于Azkaban进行二次开发的,用户层面的问题是缺少任务可视化编辑界面、补数等必要功能,导致用户上手难体验差。技术层面的问题是架构过时持续迭代难度大。经过调研后,新版系统决定基于DolphinScheduler进行升级改造。整个迁移过程中面临最大的问题是如何让使用方平滑过渡到新系统,为了平滑迁移做了哪些升级改造?


15:30-15:35 填写问卷抽奖环节

苏锐Juicedata 合伙人

毕业于西安电子科技大学。在北航攻读硕士期间,作为早期工程师先后在傲游(Maxthon)浏览器、豆瓣任职。2014 年创立上门汽车服务品牌功夫洗车,并任 CEO 带领团队完成两轮融资。2017 年加入 Juicedata 开始新一次创业之旅,公司旗下的核心产品 JuiceFS 是一款面向云环境设计的分布式文件系统,以创新的设计定义了云时代文件存储的架构,服务数字化时代对海量数据、海量文件的存储与计算需求,已落地近百家领先科技企业。

演讲时间:15:35-16:05

演讲题目:设计云文件系统和日志归档场景中DolphinScheduler的实践

演讲概要:介绍什么是云文件系统;介绍设计架构与设计中的思考;如果用云文件系统做日志归档,分享在Nginx和Apache DolphinScheduler中的实践

欢迎大家参与5月28日Apache DolphinScheduler的线上交流会,下午14:00,我们不见不散!



推荐阅读
  • 全面解析运维监控:白盒与黑盒监控及四大黄金指标
    本文深入探讨了白盒和黑盒监控的概念,以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法,结合四个黄金指标的解读,帮助读者更好地理解和实施有效的监控策略。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 高效解决应用崩溃问题!友盟新版错误分析工具全面升级
    友盟推出的最新版错误分析工具,专为移动开发者设计,提供强大的Crash收集与分析功能。该工具能够实时监控App运行状态,快速发现并修复错误,显著提升应用的稳定性和用户体验。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • FinOps 与 Serverless 的结合:破解云成本难题
    本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理,提出了首个 Serverless 函数总成本估计模型,并分享了多种有效的成本优化策略。 ... [详细]
  • 科研单位信息系统中的DevOps实践与优化
    本文探讨了某科研单位通过引入云原生平台实现DevOps开发和运维一体化,显著提升了项目交付效率和产品质量。详细介绍了如何在实际项目中应用DevOps理念,解决了传统开发模式下的诸多痛点。 ... [详细]
  • 本文介绍了如何利用 Spring Boot 和 Groovy 构建一个灵活且可扩展的动态计算引擎,以满足钱包应用中类似余额宝功能的推广需求。我们将探讨不同的设计方案,并最终选择最适合的技术栈来实现这一目标。 ... [详细]
  • 深入解析Serverless架构模式
    本文将详细介绍Serverless架构模式的核心概念、工作原理及其优势。通过对比传统架构,探讨Serverless如何简化应用开发与运维流程,并介绍当前主流的Serverless平台。 ... [详细]
  • Spring Cloud学习指南:深入理解微服务架构
    本文介绍了微服务架构的基本概念及其在Spring Cloud中的实现。讨论了微服务架构的主要优势,如简化开发和维护、快速启动、灵活的技术栈选择以及按需扩展的能力。同时,也探讨了微服务架构面临的挑战,包括较高的运维要求、分布式系统的复杂性、接口调整的成本等问题。最后,文章提出了实施微服务时应遵循的设计原则。 ... [详细]
  • 资源推荐 | TensorFlow官方中文教程助力英语非母语者学习
    来源:机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南,帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]
  • 通过Web界面管理Linux日志的解决方案
    本指南介绍了一种利用rsyslog、MariaDB和LogAnalyzer搭建集中式日志管理平台的方法,使用户可以通过Web界面查看和分析Linux系统的日志记录。此方案不仅适用于服务器环境,还提供了详细的步骤来确保系统的稳定性和安全性。 ... [详细]
  • 在本周的白板演练中,Apache Flink 的 PMC 成员及数据工匠首席技术官 Stephan Ewen 深入探讨了如何利用保存点功能进行流处理中的数据重新处理、错误修复、系统升级和 A/B 测试。本文将详细解释保存点的工作原理及其应用场景。 ... [详细]
  • 提升Tumblr爬虫效率与功能
    本文介绍了对之前开发的Tumblr爬虫脚本进行升级,整合了两个脚本的功能,实现了自动分页爬取博客内容,并支持配置文件以下载多个博客的不同格式文件。此外,还优化了图片下载逻辑。 ... [详细]
author-avatar
V铿锵花木兰V
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有