热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

高坤:国泰君安云平台的建设及实践

6月14日,在由金科创新社携手IBM联合举办的“2018新一代金融云平台(上海)沙龙”上,来自国泰君安的云计算负责人高坤就“国泰君安的云计算实践”与我们分享了国泰君安云平台的建设路

6月14日,在由金科创新社携手IBM联合举办的“2018新一代金融云平台(上海)沙龙”上,来自国泰君安的云计算负责人高坤就“国泰君安的云计算实践”与我们分享了国泰君安云平台的建设路线及实践特性。

高坤:国泰君安云平台的建设及实践

以下内容为高坤先生本次演讲实录:

大家下午好,我主要负责主机、存储和云平台的工作。接下来我给大家介绍一下我们国泰君安整个建设的路线和云平台所具备的特性。

 

云计算技术发展很快,刚才李总也介绍了,云平台除了开源,包括容器编排都有不同的容器技术,我们主要考虑的是怎样与工作模式结合,更好地保持云平台的稳定性。

国泰君安云平台建设发展路线及特性


我们国泰君安从2013年开始做云平台的建设,当时所有的开发测试资源环境都是由开发人员各自负责。13年我们通过整合测试资源环境,通过虚拟化技术搭建了全仿真测试系统。14年我们完成了国家云平台课题验收,构建了以开源Cloudstack技术的云管理平台,我们最早是从14年就开始做前端的云平台管理,主要通过和OA对接,通过云管理平台实现自服务申请及流程审批。16年,我们部署Openstack开发测试环境,云管理平台进行升级开发实现异构资源池统一管理及全流程化申请、自动化部署及管理。去年到今年我们一直在做两地三中心及IDC机房的云资源池建设,及新架构的云管理平台开发。

 

国泰君安云管理平台介绍:

 

云平台建设原则


整个云平台建设原则还是以低TCO实现性能最大化,同时提升业务连续性,考虑为例业务的快速灵活扩展以及方便的运维和管理。真正的TCO和其他的行业不一样,

 

首先,证券行业和其他行业不同,它可能在不可预期的某在一个阶段,由于消息面的相关因素,会呈现交易量的爆发式的增长,所以云平台需要具备弹性伸缩,按业务需要,能自动、高效、妥善地扩展不同层次的资源,同时对业务系统保持透明。

 

第二,需要集中管控,因为现在的数据中心很多,有生产的主数据中心,还有同城的灾备、互联网区域的各托管机房,我们都是通过统一管理的方式进行管理,在南方和外高桥以容灾环境为主,今年5月份通过自动化切换在灾备云环境完成公司的灾备演练。

 

第三,异构兼容,平台开放,我们不被特定品牌绑定,降低首次虚拟化风险和平台整体拥有成本,为未来混合云模式打下基础。

 

第四,安全可靠、灵活调整,我们根据需求定制安全等级,保证运行在云平台上的所有资源的安全和稳定。

 

第五,快速交付,主要的目的是让客户可以自主的申请,完成生命周期,可以自动调度得更快速。

 

第六个是降低成本和节能高效。

 

云管理平台功能架构


说一下云管理平台,包括与Itil流程,不同地域、异构资源池的自动化匹配及一些云服务对接的工作。说这个的目的是为了统一管理异构。新架构云管理平台是基于微服务化,通过框架实现自动注册与服务的调度,云管理平台能够实现业务模块横向扩展。

 

接下来是云运维,我们CMP管理平台和自动化平台、监控平台进行对接,主要是做云主机的自动化配置,包括操作系统基线配置、应用软件安装等。Zabbix主要是对虚机和主机的阈值监控。最早的云管平台把所有的工单、查询等数据写在一个数据库中,但是经过两三年的发展,数据量越来越大,就发现在做资源更新、网络调整、云主机查询或者是虚机自服务的操作速度特别慢,所以这次新架构调整上,数据存储选择把数据分拆。redis主要用于资源数据缓存,热点数据查询,包括资源、业务热点数据查询;mysql主要用于资源数据存储,包括日志、工单、配置、报表的查询;Els用于计费数据的存储查询,zabbixDB用于监控数据存储查询。除此之外还有上层的数据运营,这是和管理相关的东西,用户的管理、住户的管理、项目管理、标签的管理、地域管理等等各种不同的管理模块都是通过微服务框架做的。我们希望从申请到最后的批准、实施的整个流程是全自动化的。

 

云管理平台架构特点及优势

 

最终,新的云管理平台希望:

1.所有的业务支撑横向扩展,性能支持横向扩展。

2.前后台均采用异步操作,第三方平台执行效率不影响云管本身操作的流畅性。

3.性能Redis,单点登陆,session共享,热点数据缓存。

4.可配置化的数据标签。

 

云主机的生命周期管理


这是整个云主机的生命周期管理,包括对云主机的重启、管理等等都可以进行运维和操作。这是我们前端的软件,可以和我们一体化运维平台对接,实现应用场景及软件的自动化安装及业务部署。

 

改版后的数据字典


这是本次改版之后的数据字典,以前我们参数都写在程序代码里面,这次我们通过一定的方式可以进行相应的调整和编辑。这是我们自己做的监控图形,这是鉴于生产数据中心ceph监控报表,因为我们底层从最开始的实施到现在我们坚持的都是开源的方式,我们用的还是开源的分布式存储架构来做的。最终就是想通过应用使用者通过自服务的方式申请流程,基础架构和管理,基础架构是我们来做所有底层的管理,最终实现自动交付。

 

云数据中心资源池化建设


第三个方面是我们整个云数据中心资源池的建设。云数据中心有两地三中心及各个托管IDC中心,不同的数据中心,不同的逻辑区域,我们采用了不同的资源池部署方式。在生产中心资源池的架构分了4个逻辑区域分别是前后台应用,交易和非交易类业务,不同的逻辑区域采用的不同的资源池部署模式。

 

在同城和异地灾备,资源池分了3个逻辑区域,分别是前台应用,包括互联网生产、呼叫中心生产、互联网灾备、业务支撑灾备等多种形式。后台应用分为综合业务灾备,还有核心业务灾备,二者中间是逻辑隔离。第三个资源池是测试环境,包括开发测试环境和新技术试验区。容器平台现在已经在开发测试环境上线应用。整个容器发布和业务系统的微服务改造需要业务开发人员配合,我们现在在容器这块走得比较慢,只有四五个应用在做改造,主要是在算法交易低频交易系统、移动APP等系统上做了容器化部署和微服务改造。

 

资源池部署网络架构

 

这个是我们整个资源池网络的部署架构,不管超融合还是集中存储或者是分布式的部署方式,各个网络层面都是通过万兆交换机互联来进行数据流传输,在分布式架构中,业务数据流万兆交换机通过端口trunk的方式用于虚机的业务流量,存储数据流万兆交换机用于分布式存储群集内部数据流,互联万兆交换机用于计算节点和存储节点互联,识别存储。接下来讲的是不同资源可用的布局设计,由三机柜组成的模块化单元:

 

第一个是通过分布式虚拟资源池布局,每个模块(三机柜)规划三个虚拟机资源池,初始为每个资源池三个节点,后续逐步进行扩容,应用系统的集群或主备机分别打散在不同资源池中,避免一个资源池故障导致所有应用节点不可用的情况发生。

 

存储双活的资源池部署方式,目的是保证业务高可用、数据不会有所丢失。每个模块(四机柜)规划一个虚拟机资源池,初始必须购买集中存储设备并进行存储双活配置,后续逐步按模块进行计算资源和存储扩容。

 

还有一种是超融合部署方式,每个模块(三机柜)规划三个虚拟机资源池,初始为每个资源池三个节点,后续逐步进行扩容,应用系统的集群或主备机分别打散在不同资源池中,避免一个资源池故障导致所有应用节点不可用的情况发生。同时不同资源池可以采用不同品牌超融合方案达到异构冗余。

 

我们针对不同应用类型、环境、安全合规做了一些资源匹配和逻辑隔离,按要求在业务系统自助申请时,自动匹配的相应业务类型的资源池进行部署。


推荐阅读
  • 考前准备方面,我的考试时间安排在上午11点至12点,只需提前20分钟到达考场的接待休息区即可。由于我居住在福田区,交通便利,可以选择多种方式前往考场。为了确保顺利通过考试,我建议考生提前熟悉考试流程和环境,并合理规划出行时间,以保持良好的心态和状态。此外,考前复习应注重理论与实践相结合,多做模拟题,加强对重点知识点的理解和掌握。 ... [详细]
  • 从无到有,构建个人专属的操作系统解决方案
    操作系统(OS)被誉为程序员的三大浪漫之一,常被比喻为计算机的灵魂、大脑、内核和基石,其重要性不言而喻。本文将详细介绍如何从零开始构建个人专属的操作系统解决方案,涵盖从需求分析到系统设计、开发与测试的全过程,帮助读者深入理解操作系统的本质与实现方法。 ... [详细]
  • NoSQL数据库,即非关系型数据库,有时也被称作Not Only SQL,是一种区别于传统关系型数据库的管理系统。这类数据库设计用于处理大规模、高并发的数据存储与查询需求,特别适用于需要快速读写大量非结构化或半结构化数据的应用场景。NoSQL数据库通过牺牲部分一致性来换取更高的可扩展性和性能,支持分布式部署,能够有效应对互联网时代的海量数据挑战。 ... [详细]
  • Docker入门指南:初探容器化技术
    Docker入门指南:初探容器化技术摘要:Docker 是一个使用 Go 语言开发的开源容器平台,旨在实现应用程序的构建、分发和运行的标准化。通过将应用及其依赖打包成轻量级的容器,Docker 能够确保应用在任何环境中都能一致地运行,从而提高开发和部署的效率。本文将详细介绍 Docker 的基本概念、核心功能以及如何快速上手使用这一强大的容器化工具。 ... [详细]
  • 掌握PHP框架开发与应用的核心知识点:构建高效PHP框架所需的技术与能力综述
    掌握PHP框架开发与应用的核心知识点对于构建高效PHP框架至关重要。本文综述了开发PHP框架所需的关键技术和能力,包括但不限于对PHP语言的深入理解、设计模式的应用、数据库操作、安全性措施以及性能优化等方面。对于初学者而言,熟悉主流框架如Laravel、Symfony等的实际应用场景,有助于更好地理解和掌握自定义框架开发的精髓。 ... [详细]
  • 数据结构与算法:HyperLogLog 统计、布隆过滤器应用、缓存机制挑战及解决方案、Redis 性能优化与监控、哨兵模式、版本控制工具 Git
    本文探讨了数据结构与算法在实际应用中的多个方面。首先介绍了HyperLogLog算法,用于高效地进行基数统计,能够准确估算大规模数据集中的唯一元素数量。接着讨论了布隆过滤器的应用,该过滤器在空间效率和查询速度上具有显著优势,适用于大数据场景下的快速成员检测。此外,文章分析了缓存机制面临的挑战及其解决方案,包括LRU和LFU等策略,并详细阐述了Redis的性能优化与监控方法,如使用哨兵模式实现高可用性。最后,介绍了版本控制工具Git的基本操作和最佳实践,帮助开发者有效管理代码版本。 ... [详细]
  • 修复一个 Bug 竟耗时两天?真的有那么复杂吗?
    修复一个 Bug 竟然耗费了两天时间?这背后究竟隐藏着怎样的复杂性?本文将深入探讨这个看似简单的 Bug 为何会如此棘手,从代码层面剖析问题根源,并分享解决过程中遇到的技术挑战和心得。 ... [详细]
  • 如何正确配置与使用日志组件:Log4j、SLF4J及Logback的连接与整合方法
    在当前的软件开发实践中,无论是开源项目还是日常工作中,日志框架都是不可或缺的工具之一。本文详细探讨了如何正确配置与使用Log4j、SLF4J及Logback这三个流行的日志组件,并深入解析了它们之间的连接与整合方法,旨在帮助开发者高效地管理和优化日志记录流程。 ... [详细]
  • 开发心得:利用 Redis 构建分布式系统的轻量级协调机制
    开发心得:利用 Redis 构建分布式系统的轻量级协调机制 ... [详细]
  • 本文精选了几个结合 Vue 和 Spring Boot 的优质开源项目,适合开发者学习和参考。这些项目不仅涵盖了前后端分离的最佳实践,还提供了丰富的功能示例和详细的文档,有助于提升开发效率和技术水平。项目地址:https://github.com/ 示例链接。 ... [详细]
  • Spring框架的核心组件与架构解析 ... [详细]
  • 美团优选推荐系统架构师 L7/L8:算法与工程深度融合 ... [详细]
  • 人人租机作为国内领先的信用免押租赁平台,为企业和个人提供全方位的新租赁服务。通过接入支付宝小程序功能,该平台实现了从零到百的迅猛增长,成为全国首家推出“新租赁小程序”开发服务的阿里巴巴小程序服务商(ISV)。这一创新举措不仅提升了用户体验,还显著增强了平台的市场竞争力。 ... [详细]
  • HBase在金融大数据迁移中的应用与挑战
    随着最后一台设备的下线,标志着超过10PB的HBase数据迁移项目顺利完成。目前,新的集群已在新机房稳定运行超过两个月,监控数据显示,新集群的查询响应时间显著降低,系统稳定性大幅提升。此外,数据消费的波动也变得更加平滑,整体性能得到了显著优化。 ... [详细]
  • 利用Redis HyperLogLog高效统计微博日活跃和月活跃用户数
    本文探讨了如何利用Redis的HyperLogLog数据结构高效地统计微博平台的日活跃用户(DAU)和月活跃用户(MAU)数量。通过HyperLogLog的高精度和低内存消耗特性,可以实现对大规模用户数据的实时统计与分析,为平台运营提供有力的数据支持。 ... [详细]
author-avatar
diuhunpo_813
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有