热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

腾讯云原生生态简介系列一

我们在前段时间推送了一篇有关腾讯SaaS生态的简介,今天则继续带来腾讯


我们在前段时间推送了一篇有关腾讯SaaS生态的简介《腾讯SaaS生态简析》,今天则继续带来腾讯云原生加速器首期的概况,后续我们会不定期更新腾讯生态伙伴系列,欢迎大家持续关注。

 

腾讯在2021年6月30日发布了其云原生38家企业的名单,其中包含了当前云计算及企业

服务的热点赛道,如各类数据库、中间件、网络、容器、云安全、运维自动化、边缘计算、低代码、无代码、协同办公等等。


受篇幅限制,我们今天的部分先带来主要从事中间件、数据库等基础软件开发与销售的11家企业,他们是:Kyligence(OLAP)、StreamNative(消息队列)、偶数科技(OLAP)、支流科技(API网关)、智臾科技(时序数据库)、创邻科技(图数据库)、欧若数网(图数据库)、酷客数据HashData(OLAP)、焱融科技(对象存储)、Juicedata(对象存储)、XSKY星辰天合(块、文件、对象存储)。

 

本文章分为三部分(5500多字),请大家按需取用:

  • 第一部分:数据库、分布式技术的历史发展

  • 第二部分:腾讯云原生加速器中的11家企业

  • 第三部分:部分总结与思考



第一部分:数据库、分布式技术发展的里程碑事件


资料来源:《Neo4j权威指南》(图数据库技术丛书)




第二部分:腾讯云原生加速器11家企业简介
 
1. Kyligence:Apache Kylin的商业化公司,成立于2016年1月。Apache Kylin在2015年11月正式成为Apache顶级项目,主要产品是OLAP分析型数据库(OLAP over Hadoop)。Kylin采用了预计算系统架构,即在入库时对数据进行预聚合,通过牺牲一定的灵活性去换取性能,实现对超大数据集的秒级响应。Kyligence作为Kylin的商业化公司,围绕Kylin进行了针对企业客户的优化与定制改造。


大多数时候没有一个框架能解决所有问题。客户会根据自己的实际需求选择最合适的方案,大型企业也都支持多框架。以贝壳找房的OLAP选型为例,贝壳在2016年至2019年实现了基于Kylin的OLAP平台建设,但受限于Kylin预计算方案导致系统灵活性下降,单一Kylin引擎无法满足贝壳在不同业务场景下的应用需求,因此自2020年起,贝壳的技术团队解耦了OLAP平台与Kylin的强绑定,开始建设能够支持多种OLAP引擎的OLAP平台。同样,美团也根据其业务场景设计了Kylin on Druid,而非单一选用Kylin或Druid。
 
参考资料:
面向AI技术的工程架构实践 | 贝壳OLAP平台架构演进 (qq.com)
Apache Kylin的实践与优化 (qq.com)

2. StreamNative:Apache Puslar的商业化公司,成立于2019年8月。传统网站架构的缺点主要为:a. 系统间的耦合性太强,迭代难;b. 业务逻辑常常以同步的方式运行,效率低;c. 流量请求高峰时会冲击数据库。为了将传统系统升级至分布式系统,消息队列中间件应运而生,成功实现了解耦、异步、削峰。Apache Puslar就是一款开源消息队列中间件,在2018年正式成为Apache顶级项目。同为消息队列中间件的还有大名鼎鼎的Apache Kafka,其商业化公司Confluent于2021年6月实现IPO,当前市值约110亿美元。除此之外,消息队列中间件还有很多,如RabbitMQ和阿里开源的RocketMQ。



Puslar作为新秀在挑战Kafka的历史地位。Kafka具有扩展性差、无法跨地域复制、无本地多租户、队列处理能力弱等痛点,所以当这些弱点使得Kafka无法再满足企业用户当下需求时,用户会迫切的寻找备选答案。

比如当智联招聘需要搭建企业级事件中心时,架构师们发现Kafka 应用在工作队列模式时会显得非常吃力。在现代实时流架构中,消息传递案例可以分为两类:队列和流。队列可以满足多个消费者,流则仅限于单一消费者使用消费传递通道,不可共享。在面向微服务或事件驱动的体系结构中,流和队列却都是必要的。于是,将高性能的流(Apache Kafka所追求的)和灵活的传统队列(RabbitMQ所追求的)结合到一个统一的消息模型和API中的Puslar成为智联选型时最终的选择。除此之外,Puslar不甘于只做一个消息队列中间件,其团队目前在探索消息队列、流、存储的融合,这无疑能给Puslar带来额外的想象空间。
 
参考资料:
实践 | Kafka不够好,智联招聘基于Pulsar打造企业级事件中心 (qq.com)

3. 偶数科技:Apache HAWQ的商业化公司,由HAWQ的部分创始团队于2016年12月成立。Apache HAWQ在2018年8月成为了Apache顶级项目,是一款大规模并行分析(MPP - MassivelyParallel Processing)数据库。与前文提到的Apache Kylin相同点是他们都属于SQL-on-Hadoop系统,但选用的不同架构方案:Kylin采用的是预计算方案,而HAWQ偏向于MPP系统架构。MPP解决了单个SQL数据库不能存放海量数据的问题,执行查询的时候,请求便会分散到多个SQL数据库节点上执行,再汇总给用户。缺点就是当节点数量太多的时候,稳定性会变弱。


偶数科技发布的商业化版本OushuDB比HAWQ开源版本性能更优,主要服务公安、金融类客户。除数据库产品外,偶数科技的另一款核心产品LittleBoy,一个通用的人工智能建模平台,目的是降低业务人员、数据分析人员使用人工智能系统的门槛。
 
这时候还要提一下2015-2020年发生的一系列收购案,也就是所谓的“Dell 的 EMC 的 VMware 的 Pivotal”。大致的故事线是戴尔曾在2015年以670亿美元收购了EMC,VMware与Pivotal属于EMC的一部分,被戴尔收购后VMware与Pivotal保持独立运营。Pivotal没有那么好命,2018年上市后股价表现不好直至2020年被VMware以27亿美元收购。铺垫这么多其实就是为了引出HAWQ的第一款商用产品是由Pivotal北京团队发布的Pivotal HDB,后来很可惜因美国总部那边的动荡停止商用了,于是HDB的核心人员离开公司创立了偶数科技,算是对Pivotal HDB生命的延续。


注:上图没有展示出来Pivotal最终被收购 ,下图为戴尔如今的矩阵(不过2021年四月VMware又要被戴尔剥离了,M&A又Spin-Off真是不厌其烦 



看得出来,EMC、Pivotal输送了大量的技术人才出来,本文提到的StreamNative、偶数科技、HashData的创始人均有类似的背景。小编还注意到当时Pivotal中国研发中心的另一位大牛也于2020年8月创立了一家时序数据库服务商“四维纵横 yMatrix”,不得不称赞是人才济济(yMatrix、Oushu和HashData的团队都是Pivotal Greenplum中国研发团队的老同事)。
 
4. 支流科技:Apache APISIX的商业化公司,成立于2019年4月。Apache APISIX于2020年7月正式成为Apache顶级项目,主要产品为API网关。网关是外部网络与内部服务器之间的关卡,是架构中最先得到外部请求的中间件。作为当今最流行的分布式架构,微服务架构对API网关的灵活性及性能有更高的要求,因此APISIX这种代码简洁、配置实时的高性能API更适合微服务体系下的API管理。支流科技的团队认为Service Mesh(而非Spring Cloud)会成为下一个十年的主流后端结构,于是产品战略也都是围绕着Service Mesh展开。

 
软件网关被分为传统网关和API网关两类,其中Nginx是传统网关的代表,API网关的知名代表则是Kong。Nginx缺少官方集群统一管理方案,用户配置难度大大提升;Kong则缺乏弹性扩缩容的能力,无法贴合云原生时代用户的需求。APISIX针对Nginx与Kong的缺点进行了优化改良,并逐步有互联网大厂在生产环境中使用APISIX替换Nginx和Kong。从资本角度看,APISIX的两位前辈都有不俗的表现:2019年Nginx被以6.7亿美元的价格收购,而Kong则在2021年2月完成了投后估值约14亿美元的D轮融资。如果支流科技凭借APISIX可以提供性能、功能、架构全面优于二位前辈的服务,资本市场是否也会给出相似的认可,且Kong是否还能在新秀面前维持高估值成功上市呢?

 参考资料:
有了 NGINX 和 Kong,为什么还需要 Apache APISIX?(qq.com)

5. 智臾科技:主要产品为DolphinDB时序数据库,该项目开始从2012年开始投入,公司于2016年10月才正式成立。时序数据库的全称是时间序列数据库,主要用于存储与处理带有时序标签的数据,这类数据往往第一列是时间戳,通常被用于物联网设备监控、金融交易系统监控、互联网业务监控等场景。

 
由于物联网、车联网、工业互联网等场景的兴起,时序数据库逐渐走热。在这个场景下,时序数据库要解决的问题来自于四个方面:a. 如何面对设备数量多导致的数据库高压;b. 如何高效储存这类特殊的时间戳数据;c. 如何降低因数据量庞大带来的存储成本;d. 如何针对传统企业客户降低使用难度。
 
根据最新的DB-Engine上时序数据库排名,成立于2013年的InfluxDB(商业化公司为InfluxData)稳居榜首,智臾科技DolphinDB位于第11位,来自我国的另外两位厂商阿里云Alibaba Cloud TSDB与涛思数据TDengine分别位于第20位、21位。
 
榜首InfluxDB的商业化经验非常值得研究,其成功来源于如下几个方面:a. 来自物联网传感器、在线视频、网络等场景的时序数据规模指数级增长,企业客户迫切需要存储处理此类数据的解决方案;b.开源版本仅支持单机(供开发者免费测试),集群版本用于企业版本的战略可保证高溢价空间;c.大力推行云数据库服务,按量计费。自2020年起,InfluxData的云付费客户同比增长约13倍,并陆续签约了包括劳斯莱斯、Zoom、迪士尼、日本软银、韩国SK等大型客户。同时,相比于其他SaaS公司,InfluxData并不局限于美国本土,其新增客户中美国与欧洲的比例为55:45。
 
“客户足够需要,InfluxDB足够专业”为InfluxData带来了巨大的商业成功,作为一家本应疯狂烧钱的开源公司却在2019年后就停止了融资,足以证明了其现金流的健康。参考InfluxDB的案例,在信创的大背景下,小编期待智臾科技、涛思数据等国产供应商可以实现类似的成功。
 
6. 创邻科技:Galaxybase图数据库


7. 欧若数网:Nebula Graph图数据库

 

创邻科技、欧若数网是本次云原生加速器中的图数据库供应商,公司分别创立于2016年8月,2018年10月,创始团队均具备多年图数据库开发经验。根据最新的DB-Engine上图数据库排名,老牌数据库Neo4j连年保持流行度第一,由中国企业家于2012年创立的TigerGraph排位第九名,欧若数网Nebula Graph列席第十五位。在这里提一下,DB-Engine排名偏向展示国际影响力与使用流行度,并非完全代表产品实力。
 
图数据库对人类现实世界的映射更加直接、自然,而图数据库最基础的应用方向就是知识图谱。知识图谱以图数据库作为存储引擎,使用图计算系统对数据进行分析,进而形成大规模的知识库用于支持更多应用,如拼多多的商品推荐、字节的社交关系、企查查的企业风控等等。图数据库重点面对OLTP场景,侧重于传输和查询;图计算系统面对OLAP场景,侧重于解决大规模图数据分析计算。基于此我们可以看到创邻科技的产品矩阵就是图数据库、图计算系统、数据可视化平台,帮助用户完成传输、存储、计算、分析、展示等全流程需求。腾讯云前段时间击败了阿里云、星环等数据库厂商中标中国农行约3000万元图数据库项目,不知道这背后有没有创邻的功劳(双方有股权关系)。
 
有关于图数据库的架构,大家可以参考欧若数网的这篇文章:《 Vol.03 nMeetup | 图数据库综述与 Nebula 在图数据库设计的实践 (qq.com)》,在这里我们就不展开讲了。基本市面上的厂商都考虑到了分布式架构、强一致性、存储计算分离、低时延、高吞吐、查询语言简化、适用多种图算法等等。随着图数据库的发展,同时具备“OLAP+OLTP”能力的图数据库应该也是一个不错的发展方向,目前已经能看到一些创业公司在这个方向努力了。
 
8. 酷客数据HashData:SQL on Cloud云数据仓库服务商,由前 Apache HAWQ 创始团队成员在2016年3月创立。其产品HashData数据仓库是基于 Greenplum Database 和PostgreSQL 开源数据库技术,通过对 PostgreSQL 的修改得到的MPP数据库。说起MPP架构就绕不开Pivotal公司开发的数据仓库Greenplum - 世界上第一款开源的MPP架构数据库。Greenplum的团队在OLAP场景下了非常多的心思,因此在OLAP用户群体的口碑非常好。上文我们提到偶数科技、HashData、四维纵横等公司的成员都是来自Pivotal (Greenplum)的中国团队,因此产品思路类似便解释的通了。不同的是,Hashdata在创立之初就定义为SQL on Cloud,充分利用云的优势来实现云数仓,缺点在于只能处理结构化及半结构化的数据,不能处理非结构化的数据。

 
9. 焱融科技:对象存储服务商,创立于2016年2月。当前主要产品为YRCloudFile,一款主打高性能的文件存储产品,主要应用于AI训练、影视渲染、物联网以及金融等非结构化数据量大的场景,因为需要对数据进行频繁的IO操作,对系统的IOPS要求很高。国内的提供类似产品的厂商有浪潮,国外知名厂商有Weka.IO、DDN等。

 
10. Juicedata:对象存储服务商,创立于2017年11月。当前主要产品为JuiceFS,一款主打低成本的文件存储产品,主要应用于数据备份与恢复、日志收集与归档、数据共享、异地灾备、AI训练集群存储等场景。JuiceFS通过将数据存储到对象存储的方式,有效避免了块存储的冗余和分布式系统的多机冗余,进而降低客户的存储成本。其他类似的分布式文件系统有GlusterFS(被RedHat以1.45亿美元收购)、CephFS、MooseFS等。
 

焱融科技、Juicedata两家公司都是对象存储服务商,除对象存储外,还有块存储、文件存储两种存储方式。一个高赞的知乎回答(Credit to知乎答主木头龙)是这么描述这三种存储方式的区别的:“这三者的本质差别是使用数据的‘用户’不同:块存储的用户是可以读写块设备的软件系统,例如传统的文件系统、数据库;文件存储的用户是自然人;对象存储的用户则是其它计算机软件。”我们习惯使用的Windows文件夹、目录页都属于文件存储(一个一个文件,所以被称为自然人);块存储的典型设备就是硬盘,即直接访问存储数据的物理介质;对象存储在块存储与文件存储之间,使用“软件定义存储”的方式兼备块存储和文件存储的优点,最典型的技术就是Amazon S3。当然,对象存储的存在不代表就不需要块存储和文件存储了,如今所有公有云厂商的分布式存储系统都可以同时提供这三种形式的服务。
 
11. XSKY星辰天合:软件定义基础架构(Software Defined Infrastructure,SDN)服务商,成立于2015年5月。XSKY的产品矩阵包括块存储、文件存储、对象存储、统一存储(块存储+文件存储)、分布式存储系统(块存储+文件存储+对象存储)。根据IDC 2019 年的统计,在中国软件定义存储 (SDS) 整体市场份额排名中,XSKY 位居第四,其中对象存储细分市场排名第一 (22.2%),连续三年中国对象存储市场第一,块存储细分市场排名第三 (14.1%),着实是很了不起的成绩。比上文提到的焱融科技、Juicedata体量大很多,服务的客户也更加广泛。
 

 



第三部分:结论与思考

 

  • 国产替代是“小步慢跑”而非“百米冲刺”,前段时间邮储银行单一来源采购Oracle数据库的事件也带来了不小的震动。但是在一些如时序数据库、图数据库等新需求的选型时,国产软件是不逊色的。
  • 云厂商会逐渐成为中间件销售的重要渠道。大型企业很少单独采购中间件,通常是采购整套解决方案。这种方式不好的就是有可能会造成与整套方案的强绑定,不好针对某一部分的选型进行替换。
  • 很多创业公司在成立的那一天就意味着会被并购,或者衰落。公有云厂商通常采用内部孵化、生态合作、收购这三种方式去拼凑方案。厂商会根据自身情况去调整这三种方式的比例,并购是性价比最高的方式。
  • 投资机构需要判断某项技术的生命周期。如果某个项目仅是客户当前遇到问题的短暂替代方案,当市场上有更优秀的团队带来了更高效的解决方案时,那该公司很有可能在3-5年内业绩下滑。
  • 我国商业化开源还在早期。
  • 云原生类创业以人才为导向,孵化周期很漫长。
  • 资本要慎重,催熟得太狠不是好事情。做可比公司的时候都是对标InfluxDB或者Snowflake,没准没过几年就变成了Buoyant、MapR或者Mesosphere了。

 

欢迎添加小编微信(erjinzhixiaolan)一起讨论云原生~请期待下一期


创作不易

关注一下,点个在看

跪求读者老爷们三连!!!




推荐阅读
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
  • 1,关于死锁的理解死锁,我们可以简单的理解为是两个线程同时使用同一资源,两个线程又得不到相应的资源而造成永无相互等待的情况。 2,模拟死锁背景介绍:我们创建一个朋友 ... [详细]
  • GreenDAO快速入门
    前言之前在自己做项目的时候,用到了GreenDAO数据库,其实对于数据库辅助工具库从OrmLite,到litePal再到GreenDAO,总是在不停的切换,但是没有真正去了解他们的 ... [详细]
  • 本文介绍了Android中的assets目录和raw目录的共同点和区别,包括获取资源的方法、目录结构的限制以及列出资源的能力。同时,还解释了raw目录中资源文件生成的ID,并说明了这些目录的使用方法。 ... [详细]
  • Centos下安装memcached+memcached教程
    本文介绍了在Centos下安装memcached和使用memcached的教程,详细解释了memcached的工作原理,包括缓存数据和对象、减少数据库读取次数、提高网站速度等。同时,还对memcached的快速和高效率进行了解释,与传统的文件型数据库相比,memcached作为一个内存型数据库,具有更高的读取速度。 ... [详细]
  • 本文介绍了关系型数据库和NoSQL数据库的概念和特点,列举了主流的关系型数据库和NoSQL数据库,同时描述了它们在新闻、电商抢购信息和微博热点信息等场景中的应用。此外,还提供了MySQL配置文件的相关内容。 ... [详细]
  • 本文探讨了容器技术在安全方面面临的挑战,并提出了相应的解决方案。多租户保护、用户访问控制、中毒的镜像、验证和加密、容器守护以及容器监控都是容器技术中需要关注的安全问题。通过在虚拟机中运行容器、限制特权升级、使用受信任的镜像库、进行验证和加密、限制容器守护进程的访问以及监控容器栈,可以提高容器技术的安全性。未来,随着容器技术的发展,还需解决诸如硬件支持、软件定义基础设施集成等挑战。 ... [详细]
  • 使用freemaker生成Java代码的步骤及示例代码
    本文介绍了使用freemaker这个jar包生成Java代码的步骤,通过提前编辑好的模板,可以避免写重复代码。首先需要在springboot的pom.xml文件中加入freemaker的依赖包。然后编写模板,定义要生成的Java类的属性和方法。最后编写生成代码的类,通过加载模板文件和数据模型,生成Java代码文件。本文提供了示例代码,并展示了文件目录结构。 ... [详细]
  • 云原生应用最佳开发实践之十二原则(12factor)
    目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]
  • 1.脚本功能1)自动替换jar包中的配置文件。2)自动备份老版本的Jar包3)自动判断是初次启动还是更新服务2.脚本准备进入ho ... [详细]
  • 微信公众号:内核小王子关注可了解更多关于数据库,JVM内核相关的知识;如果你有任何疑问也可以加我pigpdong[^1]jvm一行代码是怎么运行的首先,java代码会被编译成字 ... [详细]
  • 2021OpenInfra年度报告摘要:OpenInfra在中国
    中国OpenInfra社区在多个开源项目中非常活跃,包括OpenStack、KataContainers和OpenInfra实Labs。2021年,这些 ... [详细]
author-avatar
愛妳yi輩zi
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有