热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

首届ApacheHadoop技术社区中国Meetup在京举办(内附完整PPT)

近日,在ApacheHadoop社区主导及邀请下,腾讯开源、腾讯大数据、腾讯云联合承办了Hadoop技术社区在中国的首次Meetup。围绕Hadoop技

640?wx_fmt=jpeg

近日,在Apache Hadoop社区主导及邀请下,腾讯开源、腾讯大数据、腾讯云联合承办了Hadoop技术社区在中国的首次Meetup。围绕Hadoop技术实践,来自腾讯、Cloudera、京东、小米、阿里、滴滴、华为、字节跳动的多位嘉宾参与了分享讨论。

 

腾讯开源运营负责人王春雨表示:“中国企业的参与是开源生态建设不可或缺的一部分。腾讯作为国内开源的先行者,将持续投入社区协同合作,以开放的心态,推动更多开源社区之间的交流对话,助力技术生态发展。”

 

Hadoop是由Apache基金会所开发的分布式系统基础架构。自2006年诞生以来,Hadoop改变了企业对数据的存储、处理和分析的过程,形成了一个极其丰富的技术生态圈,并在经历了大数据技术高速发展之后,迎来了3.x的时代。

 

作为Apache Member, HadoopPMC & Committer, Hadoop社区负责人之一,堵俊平于2011年开始持续关注Hadoop技术的进展,参与社区贡献,并积极推动 Hadoop技术在全球各地的落地推广。他同时也是腾讯TEG数据平台部海量存储与计算研发负责人、腾讯开源联盟主席、开源管理委员会委员。据介绍,腾讯是最早采用Hadoop技术的中国公司之一,这两年向社区贡献了大量patch和特性,包括HDFS稳定性增强、YARN增强型资源隔离方案、Ozone项目的新特性等,并作为国内首家企业率先在社区发布2.8.4与2.8.5 release。

640?wx_fmt=png

堵俊平展示了大数据Hadoop技术与社区发展的Roadmap。包括存储平台(HDFS,Ozone)向大规模、云、容器化、机器学习等方向的演进路线以及近期的热点feature,包括RBF(Router Based Federation),即基于路由机制的集群联邦方案来应对海量数据存储的增长,HDFS对外部对象存储的管理,OpenTracing机制的支持,以及Ozone的特性。据悉,Hadoop项目的近期发布计划将包括2.8.6, 3.1.3,3.2.1和3.3.0。

 

堵俊平表示,此次Meetup将是Hadoop社区交流的良好开端,腾讯将积极参与社区交流,贡献自己的技术实践,推动Hadoop技术生态发展。未来Apache Hadoop社区在中国的Meetup将沿用之前在硅谷的方式,即:由Hadoop PMC组织发起,志愿参与社区贡献的公司来自愿承办,开源贡献者共同参与并提交议题,活动向开源社区所有用户与贡献者免费开放。未来,Hadoop社区将在中国形成每季度举办一次中小型的Meetup的惯例,甚至开创新的形式,包括举办较大规模的HadoopCon。

 

腾讯大数据工程师、Apache Hadoop Committer & PMC member陈怡以Ozone为例,介绍了Hadoop原生对象存储服务的解决方案。

640?wx_fmt=png

Ozone是由Hadoop社区新发起的一个强一致性分布式对象存储服务,旨在解决目前HDFS Namenode的扩展性上限问题。Ozone 拥有和HDFS一样的可靠性,一致性和可用性,支持Hadoop文件系统接口,无缝对接YARN,SPARK 和HIVE。支持S3接口,提供CNCF CSI驱动。Ozone不仅适用于on-premise大数据环境,同时也是大数据上云,云端存储的一个很好的选择。

 

陈怡在分享中介绍了Ozone的动机和目标,namespace管理和数据管理分离的构架,支持的对象存储的语义,对象读写流程,访问控制,用户可自定义的弹性网络拓扑结构,和Kubernetes集成的支持等等将要发布的0.5版本的新特性。

 

腾讯高级工程师、Hadoop YARN和Kubernetes社区活跃贡献者龚军、陈东东则介绍了腾讯大规模YARN集群实践。腾讯的Hadoop YARN集群在2014年就已经支持单集群8800台上的规模,每日调度上亿的container。龚军分享了优化调度器性能的一些基本思路和方法,包括改进热点代码的算法、降低时间复杂度、避免重复的查找与计算、减少锁竞争以及优化锁粒度等。通过这些调度性能优化,使YARN能满足大规模集群的吞吐量。

640?wx_fmt=png

陈东东则主要介绍了如何使用cgroup对底层资源进行弹性控制,确保业务的请求资源可以得到保障,特别是对多资源纬度的管理,包括cpu、内存、网络io、磁盘io等,同时在有空闲资源的情况下,可以临时借用更多的资源,以此来提高底层资源利用率。

640?wx_fmt=png

此外,Cloudera、京东、小米、阿里、滴滴、华为、字节跳动的多位嘉宾也参与了分享,分别围绕Hadoop在各大企业的大规模实践、HDFS的改进优化,YARN与机器学习和云原生结合,以及架构演进等话题进行了讨论。

640?wx_fmt=gif

扫码关注“腾讯技术工程”公众号,回复“PPT”即可领取嘉宾的演讲PPT。如果你还想了解更多,请点击底部“阅读原文”或者扫描下方二维码查看现场直播回放。

640?wx_fmt=jpeg

640?wx_fmt=jpeg


推荐阅读
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文探讨了MariaDB在当前数据库市场中的地位和挑战,分析其可能面临的困境,并提出了对未来发展的几点看法。 ... [详细]
  • 深入解析 Apache Shiro 安全框架架构
    本文详细介绍了 Apache Shiro,一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作,使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API,同时确保高度的安全性和灵活性。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 探讨如何真正掌握Java EE,包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法,并提供了详尽的标准。 ... [详细]
  • HBase运维工具全解析
    本文深入探讨了HBase常用的运维工具,详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说,这些工具是日常管理和故障排查的重要手段。 ... [详细]
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 本文详细探讨了Netty中Future及其子类的设计与实现,包括其在并发编程中的作用和具体应用场景。我们将介绍Future的继承体系、关键方法的实现细节,并讨论如何通过监听器和回调机制来处理异步任务的结果。 ... [详细]
  • 该平台旨在为大型企业提供一个高效、灵活且可扩展的分布式微服务架构解决方案。它采用模块化、微服务化和热部署的设计理念,结合当前最先进且无商业限制的主流开源技术,如Spring Cloud、Spring Boot2、MyBatis、OAuth2和Element UI,实现前后端分离的系统管理平台。 ... [详细]
  • 从零开始构建完整手机站:Vue CLI 3 实战指南(第一部分)
    本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点,并确保这些内容与实际工作中的需求紧密结合。 ... [详细]
  • 本文探讨了领域驱动设计(DDD)的核心概念、应用场景及其实现方式,详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型,展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 探讨架构师在项目中应如何平衡对产品的关注和对团队成员的关注,以实现最佳的开发成果。 ... [详细]
  • 深入理解一致性哈希算法及其应用
    本文详细介绍了分布式系统中的一致性哈希算法,探讨其原理、优势及应用场景,帮助读者全面掌握这一关键技术。 ... [详细]
author-avatar
别他妈给脸不要脸别动老子东西
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有