热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【SDCC讲师专访】饿了么毕洪宇:小析饿了么大数据平台从无到有到优的架构探索三味境...

【编者按】每个人的成长曲线不同,有的人在研究生之时就已有相当知名的产品和框架,从而在接下来的工作中一路顺风顺水,有的人缺需要经历一个又一个

【编者按】每个人的成长曲线不同,有的人在研究生之时就已有相当知名的产品和框架,从而在接下来的工作中一路顺风顺水,有的人缺需要经历一个又一个的坑才能成长,不管是前者的聪明高效,还是后者的笨鸟先飞,他们都是在迈着脚步不断地向前。不妨停下脚步看下一些同行,以激励自己更好地前行。CSDN与你相约SDCC 2017·深圳站讲师。


图片描述

2017年6月10-11日,SDCC 2017将在创新之都深圳火热开启。据悉,饿了么大数据平台部总监毕洪宇将在SDCC 2017·深圳站之大数据技术实战峰会带来题为《饿了么大数据平台的工具链、技术选型及架构设计》的分享。更多峰会嘉宾和议题请点击官网。

以下为正文:

图片描述

【嘉宾】毕洪宇,饿了么大数据平台部总监。曾在eBay,PPTV任职DBA。2012年加入唯品会,依次经历从0到1参与数据库基础建设、大数据基础平台和实时计算平台的工作;2016年加入饿了么负责大数据基础架构,主要负责数据平台工具链及数据仓库。

CSDN:请先介绍下自己和目前工作的重点,以及关注哪些技术领域?

毕洪宇:我是饿了么大数据平台的负责人毕洪宇,目前重点在推动饿了么数据治理,工具链整合及基础设施效率建设。关注的技术领域主要在数据库内核、分布式存储与计算、机器学习。

CSDN:您有丰富的从业经历,更是历经唯品会数据库基础建设、大数据基础平台和实时计算平台从0到1的工作。能否谈谈毕业工作这些年来在工作中的收获和体验?

毕洪宇:四点体验:第一,在工作中不要给自己设限,保持好奇心和足够专注。第二,不要让自己觉得太舒服,不要消耗自己。第三,认真反思,不断对已有的经验和知识进行压缩和抽象。第四,坦诚、包容、同理心。

比较大的收获除了个人成长以外一定是志同道合的好友,基本上我的经历都是从无到有到优的建设过程,而这个奋斗过程是很容易形成“革命友谊”的。

CSDN:作为一个餐饮O2O平台,饿了么的数据流量与电商、搜索、游戏等平台有什么不同?具有怎样的特点?

毕洪宇:订单和运单是饿了么最大的技术挑战。第一,涉及到线上和线下的实时联动;第二,整个下单/备餐/取餐/送餐过程需要在30分钟内完成;第三,每天两个瞬时高峰。

CSDN:饿了么大数据平台在技术选型中需要考量哪些因素?怎样有效协调效率与规范、隔离和共享间的平衡?

毕洪宇:在做选型的时候主要考虑三点:场景、技术和团队。展开来说,首先需要清楚有哪些业务/技术约束,即在确认场景后有哪些备选集可供选择。其次,在备选集圈定后,团队是否对备选中的技术有很好的把控能力。最后,需要考量相关技术的生态、社区、其他公司可以借鉴的经验,以及学习和使用管理成本。

针对效率与规范:自助化、自动化的建设的重要性不言而喻,而工具链正是这两者的支撑。对于隔离与共享来说,在有限资源情况下如何做好隔离和用户体验是个很有挑战的事情,这里我的经验是:

1. 基于负载特征分时调整资源比例;
2. 将每个部门,每个作业的资源分配情况、运行状况和资源消耗做好可视化同步,降低因信息不透明导致的无效沟通和抱怨;
3. 异常作业识别和快速隔离,异常资源使用情况感知和预警。

CSDN:饿了么大数据平台的架构演进是怎样的?经历过哪几个重要的阶段?运用了哪些技术?

毕洪宇:整个平台还是在持续演进过程中,到目前为止我认为主要经历了两个阶段,正在进行第三个阶段。

第一阶段:从0到1。基础设施的搭建,满足业务对于数据的基本需求。持续重复开发相似的需求,交付链路很长,信息流转比较乱。

第二阶段:从1到10。需求随着业务的快速发展而增加,无论基础设施还是资源消耗都发生了10倍的增加,在团队规模基本不扩张的情况下,通过基础设施稳定性/效率建设和工具链建设来提高整个团队的效率以及交付质量,同时保证系统的可扩展性。当前阶段,进行数据治理以及工具链整合,提高数据和系统的内在质量。

CSDN:多样化的需求对饿了么大数据平台的高可用提出了更高的要求,您认为平台还存在哪些亟待解决的问题?未来的研究重点是什么?

毕洪宇:工具链的整合是非常重要的,现在的工具有些分散,对于用户来说存在比较高的上下文切换成本;对于开发人员来说工具间的交互损耗,一致性维护也是非常高的成本,而这些是与我们对于效率追求的初衷相违背的。

至于未来研究的重点我想主要是在于数据应用上,作为平台(包括数据和工具链、基础设施)来讲拥有大量用户/系统/任务等特征数据,如何能够把这些数据应用起来提高平台的使用效率,解锁平台的新姿势,democratize data and empower people with insights.

CSDN:您最期待在SDCC 2017·深圳站大会上看到哪些内容?

毕洪宇:物联网与大数据融合的应用。



SDCC讲师专访系列:


  • 【SDCC讲师专访】专访架构师陈波:微博近几年的架构演进之路和架构师的技能素养
  • 【SDCC讲师专访】阿里巴巴冯嘉:RocketMQ开源二三事,侦破万亿级数据容量背后的架构实践
  • 【SDCC讲师专访】阅文集团帅翔:从0到1落地分布式存储系统架构
  • 【SDCC讲师专访】专访架构师薛珂:弹性调度平台Saturn的架构设计
  • 【SDCC讲师专访】饿了么毕洪宇:小析饿了么大数据平台从无到有到优的架构探索三味境



SDCC 2017·深圳站之架构&大数据技术实战峰会将于2017年6月10-11日于深圳南山区中南海滨大酒店举行,集阿里、腾讯、百度、滴滴出行、Intel、微博、唯品会的资深架构师和一线实践者,纳知名研发案例,遇见苏宁云商大数据中心总监陈敏敏、Apache RocketMQ联合创始人冯嘉、饿了么大数据平台部总监毕洪宇等大牛。
票务火热,预购从速,团购立减1000元,更多嘉宾详细议题敬请关注大会官网和票务点击注册参会



推荐阅读
  • 揭秘腾讯云CynosDB计算层设计优化背后的不为人知的故事与技术细节
    揭秘腾讯云CynosDB计算层设计优化背后的不为人知的故事与技术细节 ... [详细]
  • 2021年Java开发实战:当前时间戳转换方法详解与实用网址推荐
    在当前的就业市场中,金九银十过后,金三银四也即将到来。本文将分享一些实用的面试技巧和题目,特别是针对正在寻找新工作机会的Java开发者。作者在准备字节跳动的面试过程中积累了丰富的经验,并成功获得了Offer。文中详细介绍了如何将当前时间戳进行转换的方法,并推荐了一些实用的在线资源,帮助读者更好地应对技术面试。 ... [详细]
  • 2019年后蚂蚁集团与拼多多面试经验详述与深度剖析
    2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]
  • 修复一个 Bug 竟耗时两天?真的有那么复杂吗?
    修复一个 Bug 竟然耗费了两天时间?这背后究竟隐藏着怎样的复杂性?本文将深入探讨这个看似简单的 Bug 为何会如此棘手,从代码层面剖析问题根源,并分享解决过程中遇到的技术挑战和心得。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 秒建一个后台管理系统?用这5个开源免费的Java项目就够了
    秒建一个后台管理系统?用这5个开源免费的Java项目就够了 ... [详细]
  • 本文深入探讨了NoSQL数据库的四大主要类型:键值对存储、文档存储、列式存储和图数据库。NoSQL(Not Only SQL)是指一系列非关系型数据库系统,它们不依赖于固定模式的数据存储方式,能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构;文档存储支持复杂的数据对象;列式存储优化了大数据量的读写性能;而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景,本文将详细分析它们的特点及应用实例。 ... [详细]
  • Web开发框架概览:Java与JavaScript技术及框架综述
    Web开发涉及服务器端和客户端的协同工作。在服务器端,Java是一种优秀的编程语言,适用于构建各种功能模块,如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示,同时借助JavaScript增强交互性和动态效果。此外,现代Web开发还广泛使用各种框架和库,如Spring Boot、React和Vue.js,以提高开发效率和应用性能。 ... [详细]
  • 第二章:Kafka基础入门与核心概念解析
    本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统,以其卓越的性能和高吞吐量而著称。最初,Kafka被设计用于LinkedIn的活动流和运营数据处理,旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景,读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]
  • 【并发编程】全面解析 Java 内存模型,一篇文章带你彻底掌握
    本文深入解析了 Java 内存模型(JMM),从基础概念到高级特性进行全面讲解,帮助读者彻底掌握 JMM 的核心原理和应用技巧。通过详细分析内存可见性、原子性和有序性等问题,结合实际代码示例,使开发者能够更好地理解和优化多线程并发程序。 ... [详细]
  • 本文推荐了六款高效的Java Web应用开发工具,并详细介绍了它们的实用功能。其中,分布式敏捷开发系统架构“zheng”项目,基于Spring、Spring MVC和MyBatis技术栈,提供了完整的分布式敏捷开发解决方案,支持快速构建高性能的企业级应用。此外,该工具还集成了多种中间件和服务,进一步提升了开发效率和系统的可维护性。 ... [详细]
  • 从无到有,构建个人专属的操作系统解决方案
    操作系统(OS)被誉为程序员的三大浪漫之一,常被比喻为计算机的灵魂、大脑、内核和基石,其重要性不言而喻。本文将详细介绍如何从零开始构建个人专属的操作系统解决方案,涵盖从需求分析到系统设计、开发与测试的全过程,帮助读者深入理解操作系统的本质与实现方法。 ... [详细]
  • 作为140字符的开创者,Twitter看似简单却异常复杂。其简洁之处在于仅用140个字符就能实现信息的高效传播,甚至在多次全球性事件中超越传统媒体的速度。然而,为了支持2亿用户的高效使用,其背后的技术架构和系统设计则极为复杂,涉及高并发处理、数据存储和实时传输等多个技术挑战。 ... [详细]
  • 优化后的标题:PHP分布式高并发秒杀系统设计与实现
    PHPSeckill是一个基于PHP、Lua和Redis构建的高效分布式秒杀系统。该项目利用php_apcu扩展优化性能,实现了高并发环境下的秒杀功能。系统设计充分考虑了分布式架构的可扩展性和稳定性,适用于大规模用户同时访问的场景。项目代码已开源,可在Gitee平台上获取。 ... [详细]
author-avatar
老猫
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有