热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【SDCC讲师专访】饿了么毕洪宇:小析饿了么大数据平台从无到有到优的架构探索三味境...

【编者按】每个人的成长曲线不同,有的人在研究生之时就已有相当知名的产品和框架,从而在接下来的工作中一路顺风顺水,有的人缺需要经历一个又一个

【编者按】每个人的成长曲线不同,有的人在研究生之时就已有相当知名的产品和框架,从而在接下来的工作中一路顺风顺水,有的人缺需要经历一个又一个的坑才能成长,不管是前者的聪明高效,还是后者的笨鸟先飞,他们都是在迈着脚步不断地向前。不妨停下脚步看下一些同行,以激励自己更好地前行。CSDN与你相约SDCC 2017·深圳站讲师。


图片描述

2017年6月10-11日,SDCC 2017将在创新之都深圳火热开启。据悉,饿了么大数据平台部总监毕洪宇将在SDCC 2017·深圳站之大数据技术实战峰会带来题为《饿了么大数据平台的工具链、技术选型及架构设计》的分享。更多峰会嘉宾和议题请点击官网。

以下为正文:

图片描述

【嘉宾】毕洪宇,饿了么大数据平台部总监。曾在eBay,PPTV任职DBA。2012年加入唯品会,依次经历从0到1参与数据库基础建设、大数据基础平台和实时计算平台的工作;2016年加入饿了么负责大数据基础架构,主要负责数据平台工具链及数据仓库。

CSDN:请先介绍下自己和目前工作的重点,以及关注哪些技术领域?

毕洪宇:我是饿了么大数据平台的负责人毕洪宇,目前重点在推动饿了么数据治理,工具链整合及基础设施效率建设。关注的技术领域主要在数据库内核、分布式存储与计算、机器学习。

CSDN:您有丰富的从业经历,更是历经唯品会数据库基础建设、大数据基础平台和实时计算平台从0到1的工作。能否谈谈毕业工作这些年来在工作中的收获和体验?

毕洪宇:四点体验:第一,在工作中不要给自己设限,保持好奇心和足够专注。第二,不要让自己觉得太舒服,不要消耗自己。第三,认真反思,不断对已有的经验和知识进行压缩和抽象。第四,坦诚、包容、同理心。

比较大的收获除了个人成长以外一定是志同道合的好友,基本上我的经历都是从无到有到优的建设过程,而这个奋斗过程是很容易形成“革命友谊”的。

CSDN:作为一个餐饮O2O平台,饿了么的数据流量与电商、搜索、游戏等平台有什么不同?具有怎样的特点?

毕洪宇:订单和运单是饿了么最大的技术挑战。第一,涉及到线上和线下的实时联动;第二,整个下单/备餐/取餐/送餐过程需要在30分钟内完成;第三,每天两个瞬时高峰。

CSDN:饿了么大数据平台在技术选型中需要考量哪些因素?怎样有效协调效率与规范、隔离和共享间的平衡?

毕洪宇:在做选型的时候主要考虑三点:场景、技术和团队。展开来说,首先需要清楚有哪些业务/技术约束,即在确认场景后有哪些备选集可供选择。其次,在备选集圈定后,团队是否对备选中的技术有很好的把控能力。最后,需要考量相关技术的生态、社区、其他公司可以借鉴的经验,以及学习和使用管理成本。

针对效率与规范:自助化、自动化的建设的重要性不言而喻,而工具链正是这两者的支撑。对于隔离与共享来说,在有限资源情况下如何做好隔离和用户体验是个很有挑战的事情,这里我的经验是:

1. 基于负载特征分时调整资源比例;
2. 将每个部门,每个作业的资源分配情况、运行状况和资源消耗做好可视化同步,降低因信息不透明导致的无效沟通和抱怨;
3. 异常作业识别和快速隔离,异常资源使用情况感知和预警。

CSDN:饿了么大数据平台的架构演进是怎样的?经历过哪几个重要的阶段?运用了哪些技术?

毕洪宇:整个平台还是在持续演进过程中,到目前为止我认为主要经历了两个阶段,正在进行第三个阶段。

第一阶段:从0到1。基础设施的搭建,满足业务对于数据的基本需求。持续重复开发相似的需求,交付链路很长,信息流转比较乱。

第二阶段:从1到10。需求随着业务的快速发展而增加,无论基础设施还是资源消耗都发生了10倍的增加,在团队规模基本不扩张的情况下,通过基础设施稳定性/效率建设和工具链建设来提高整个团队的效率以及交付质量,同时保证系统的可扩展性。当前阶段,进行数据治理以及工具链整合,提高数据和系统的内在质量。

CSDN:多样化的需求对饿了么大数据平台的高可用提出了更高的要求,您认为平台还存在哪些亟待解决的问题?未来的研究重点是什么?

毕洪宇:工具链的整合是非常重要的,现在的工具有些分散,对于用户来说存在比较高的上下文切换成本;对于开发人员来说工具间的交互损耗,一致性维护也是非常高的成本,而这些是与我们对于效率追求的初衷相违背的。

至于未来研究的重点我想主要是在于数据应用上,作为平台(包括数据和工具链、基础设施)来讲拥有大量用户/系统/任务等特征数据,如何能够把这些数据应用起来提高平台的使用效率,解锁平台的新姿势,democratize data and empower people with insights.

CSDN:您最期待在SDCC 2017·深圳站大会上看到哪些内容?

毕洪宇:物联网与大数据融合的应用。



SDCC讲师专访系列:


  • 【SDCC讲师专访】专访架构师陈波:微博近几年的架构演进之路和架构师的技能素养
  • 【SDCC讲师专访】阿里巴巴冯嘉:RocketMQ开源二三事,侦破万亿级数据容量背后的架构实践
  • 【SDCC讲师专访】阅文集团帅翔:从0到1落地分布式存储系统架构
  • 【SDCC讲师专访】专访架构师薛珂:弹性调度平台Saturn的架构设计
  • 【SDCC讲师专访】饿了么毕洪宇:小析饿了么大数据平台从无到有到优的架构探索三味境



SDCC 2017·深圳站之架构&大数据技术实战峰会将于2017年6月10-11日于深圳南山区中南海滨大酒店举行,集阿里、腾讯、百度、滴滴出行、Intel、微博、唯品会的资深架构师和一线实践者,纳知名研发案例,遇见苏宁云商大数据中心总监陈敏敏、Apache RocketMQ联合创始人冯嘉、饿了么大数据平台部总监毕洪宇等大牛。
票务火热,预购从速,团购立减1000元,更多嘉宾详细议题敬请关注大会官网和票务点击注册参会



推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商,服务新产业周期的IoT&5G、边缘计算与云计算市场,交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]
  • 数字账号安全与数据资产问题的研究及解决方案
    本文研究了数字账号安全与数据资产问题,并提出了解决方案。近期,大量QQ账号被盗事件引起了广泛关注。欺诈者对数字账号的价值认识超过了账号主人,因此他们不断攻击和盗用账号。然而,平台和账号主人对账号安全问题的态度不正确,只有用户自身意识到问题的严重性并采取行动,才能推动平台优先解决这些问题。本文旨在提醒用户关注账号安全,并呼吁平台承担起更多的责任。令牌云团队对此进行了长期深入的研究,并提出了相应的解决方案。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 本文介绍了OpenStack的逻辑概念以及其构成简介,包括了软件开源项目、基础设施资源管理平台、三大核心组件等内容。同时还介绍了Horizon(UI模块)等相关信息。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 2021最新总结网易/腾讯/CVTE/字节面经分享(附答案解析)
    本文分享作者在2021年面试网易、腾讯、CVTE和字节等大型互联网企业的经历和问题,包括稳定性设计、数据库优化、分布式锁的设计等内容。同时提供了大厂最新面试真题笔记,并附带答案解析。 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • 说到C语言的语句块,真是一堆血泪史。第一大坑就是优先级。刚工作那会儿,C的书没看几本,自信满满的认为C语言都会了,拿出搞ACM培养的豪情壮志,代码倒是写得爽,却到处留 ... [详细]
  • 容器管理与容器监控influxDB
    容器管理与容器监控-influxDB什么是influxDBinfluxDB安装(1)下载镜像(2)创建容器(3 ... [详细]
  • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
  • 前言:拿到一个案例,去分析:它该是做分类还是做回归,哪部分该做分类,哪部分该做回归,哪部分该做优化,它们的目标值分别是什么。再挑影响因素,哪些和分类有关的影响因素,哪些和回归有关的 ... [详细]
author-avatar
老猫
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有