热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据平台十大能力

大数据公司遍地开花,有的做PaaS有的做SaaS,每一家都会根据自己的产品定位、适用的业务场景突出大数据平台的能力,同时,大数据平台又可以有无数个技术点。而面对客户时,有时候客户更

大数据公司基因不同侧重点也不同,有的做PaaS有的做SaaS,有的做SI,每一家都会根据自己的产品定位、适用的业务场景突出大数据平台的能力。而客户和用户更关注你的大数据平台是什么架构具有哪些技术能力。以下抛开零碎的技术细节,概括性系统性的分享大数据平台的能力。



  1. 基于存储和计算分离的架构

    在传统MPP架构下,计算存储共享一个节点,每个节点有自己独立的CPU、内存、磁盘资源,互相不共享,不太容易满足云时代不同场景下的不同workload需求。

    而通过分离存储资源、计算资源,可以独立规划存储、计算的资源规格和容量。这样计算资源的扩容、缩容、释放,均可以比较快完成,并且不会带来额外的数据搬迁的代价。存储、计算也可以更好的结合各自的特征,选择更适合自己的资源规格和设计。

    image.png

  2. 基于云原生的数据平台

    基于云平台进行构建、部署和交付的数据库服务。

    公有云和私有云部署:支持微软、亚马逊、阿里云等公有云平台。

    容器部署支持:Docker与Kubernetes。

  3. 面向开源生态的存储引擎

    与Hadoop生态融合。

    Hadoop Native:从存储(HDFS),资源管理(YARN)到部署(Ambari)。

    轻松访问所有HDFS数据(TXT、CSV、ORC等)和外部系统数据(例如,Hive)。

    开发插件来访问新的数据源:高级C/C++访问库到HDFS和YARN:libHDFS3和libYARN。

    结合新的执行器,外部存储的性能得到很大提升。

  4. 基于并行处理和代价的优化器

    负责接受查询树,生成查询计划。针对一个查询,可能有数亿个等价的查询计划,但执行性能差别很大。优化器的作用是找出优化的查询计划。

    优化器基于代价而不是基于规则。

  5. 基于SIMD(单指令多数据流)的执行器

    执行器是数据库最核心的部件之一,新一代SIMD执行器使用了多项专利技术,可以充分利用最新CPU的每一个特性,比如SIMD(单指令多数据流),可以做到指令内并行,达到性能的极致。比其他数据库要快一个量级以上。

  6. 基于Raft协议的一致性

    raft是工程上使用较为广泛的强一致性、去中心化、高可用的分布式协议。

    分布式存储系统通常通过维护多个副本来进行容错,提高系统的可用性。要实现此目标,就必须要解决分布式存储系统的最核心问题:维护多个副本的一致性。

  7. 基于数据挖掘的机器学习函数库

    为AI应用开发者提供的机器学习函数库,包含大部分通用深度学习算法函数,并针对分布式架构进行了优化,易于使用及高性能。

  8. 面向复杂网络环境下的跨域数据共享交换技术

    跨域共享交换面向复杂网络条件下的数据交换需求,通过建立统一的数据生成、采集、处理、传输、交换的应用服务渠道,搭建统一的开发配置、部署、监控和服务体系,实现数据交换全生命周期的信息化管理和应用能力。

    核心能力包括:

    1、确保交换业务的全程安全保密性,支持多种算法的数据加解密,保障信息的跨安全域交换的安全可控性。支持与专业安全传输设备协同传输的方式,支持在不同密级、不同网域、不同场景下的协同联动;

    2、实现跨层级、跨部门、跨应用业务的交换服务,满足不同组织结构内部数据共享和业务协同;

    3、支持多种交换任务触发方式,包括定时/实时触发器、时间戳、标志位等多种数据捕捉方式,支持任务的人工审核和系统自动触发的能力;

    4、支持基于数据库库表、数据文件的资源目录服务管理,实现统一配置部署、运维监控的交换管理;

    5、支持路由转发功能,实现节点间数据交换和远程管理。

  9. 基于数据全生命周期的安全体系

    提供敏感数据识别、数据安全审计、数据脱敏、智能异常检测等安全能力,形成一体化的数据安全解决方案。

    以及多种认证手段,包括:信任认证、口令认证、Kerberos认证、基于Ident认证、通过TCP/IP 进行Ident认证、通过本地套接字进行Ident认证、Ident映射、LDAP认证、PAM 认证。

    加密技术保障数据传输、数据接入和数据存储安全。

  10. 基于多维属性的数据权限管理技术

    基于资源统一定义和管理框架为角色以及资源叠加附件属性策略和限制条件,支撑在策略执行点的动态权限管控;以继承模型实现角色和权限的复用,避免每次由于权限和业务变动产生的大量新增问题;通过融合不同权限模型结合在应用运行时权限决策点实时计算实现基于属性策略的权限控制,解决传统数据权限管理存在权限与角色紧耦合,扩展性、动态性、可控性较差等问题。



推荐阅读
  • 全面解读Apache Flink的核心架构与优势
    Apache Flink作为大数据处理领域的新兴力量,凭借其独特的流处理能力和高效的批处理性能,迅速获得了广泛的关注。本文旨在深入探讨Flink的关键技术特点及其应用场景,为大数据处理提供新的视角。 ... [详细]
  • 本文详细探讨了UML用例图中的两种重要关系——包含关系和扩展关系,通过具体示例解析这两种关系的应用场景及其实现方式。 ... [详细]
  • 本文源自 SysML 2018,由星云 Cluster 翻译,并经 InfoQ 授权发布。原文链接:http://www.sysml.cc/doc/151.pdf。文章详细介绍了 Blink 的设计理念及其在提高 GPU 间参数聚合速度方面的创新贡献。 ... [详细]
  • 死锁的概念“死锁”指的是:多个线程各自占有一些共享资源,并且互相等待其他线程占有的资源才能进行,而导致两个或者多个线程都在等待对方释放资源 ... [详细]
  • 深入理解SAP Fiori及其核心概念
    本文详细介绍了SAP Fiori的基本概念、发展历程、核心特性、应用类型、运行环境以及开发工具等,旨在帮助读者全面了解SAP Fiori的技术框架和应用场景。 ... [详细]
  • 本文详细介绍了如何利用go-zero框架从需求分析到最终部署至Kubernetes的全过程,特别聚焦于微服务架构中的网关设计与实现。项目采用了go-zero及其生态组件,涵盖了从API设计到RPC调用,再到生产环境下的监控与维护等多方面内容。 ... [详细]
  • 本文回顾了作者在求职阿里和腾讯实习生过程中,从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历,还提供了宝贵的面试准备建议和技巧。 ... [详细]
  • Python3爬虫入门:pyspider的基本使用[python爬虫入门]
    Python学习网有大量免费的Python入门教程,欢迎大家来学习。本文主要通过爬取去哪儿网的旅游攻略来给大家介绍pyspid ... [详细]
  • 龙蜥社区开发者访谈:技术生涯的三次蜕变 | 第3期
    龙蜥社区的开发者们通过自己的实践和经验,推动着开源技术的发展。本期「龙蜥开发者说」聚焦于一位资深开发者的三次技术转型,分享他在龙蜥社区的成长故事。 ... [详细]
  • 深入解析Spring Boot项目的启动机制
    在Java后端开发中,Spring Boot框架以其简洁性和强大的功能受到了广泛欢迎。本文将探讨Spring Boot项目启动的核心——SpringApplication类及其run()方法的工作原理。 ... [详细]
  • 本文介绍如何使用Java实现AC自动机(Aho-Corasick算法),以实现高效的多模式字符串匹配。文章涵盖了Trie树和KMP算法的基础知识,并提供了一个详细的代码示例,包括构建Trie树、设置失败指针以及执行搜索的过程。 ... [详细]
  • 使用 Docker 部署 MongoDB 并通过 IntelliJ IDEA 远程访问
    本文详细介绍了如何使用 Docker 部署 MongoDB,并通过 IntelliJ IDEA 实现远程连接的方法。包括 MongoDB 的基本配置、用户管理以及如何在 IDE 中配置连接。 ... [详细]
  • Spring Boot 初学者指南(第一部分)
    本文介绍了Spring Boot框架的基础知识,包括其设计理念、主要优势以及如何简化传统的J2EE开发流程。 ... [详细]
  • 酷家乐 Serverless FaaS 产品实践探索
    本文探讨了酷家乐在 Serverless FaaS 领域的实践与经验,重点介绍了 FaaS 平台的构建、业务收益及未来发展方向。 ... [详细]
  • 初探Hadoop:第一章概览
    本文深入探讨了《Hadoop》第一章的内容,重点介绍了Hadoop的基本概念及其如何解决大数据处理中的关键挑战。 ... [详细]
author-avatar
是唐雨冰吗
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有