热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【案例集】金融行业IT运维精选案例集

IT运维指,根据业务需要规划信息、网络、服务,通过网络监控、事件预警、业务调度、排障升级等手段,使服务处于长期稳定可用状态。IT运维范围涵盖网络、服务器、系统、环境、应用、监控、虚

IT运维指,根据业务需要规划信息、网络、服务,通过网络监控、事件预警、业务调度、排障升级等手段,使服务处于长期稳定可用状态。IT运维范围涵盖网络、服务器、系统、环境、应用、监控、虚拟化、容器化、自动化、智能化等众多领域。运维体系经历了从人工运维到自动化运维的转变,正迈向智能化运维的新阶段。

对于金融行业来说,运维是科技管理的核心和重点工作,是金融企业数字化转型的助推器,关键信息基础设施的稳定运行需要更规范、标准化的运维能力,核心业务需求的快速响应需要更高效、自动化的运维能力,产业跨界融合发展需要更立体、平台化的运维能力。央行《金融科技发展规划(2022-2025年)》提出,建立健全金融数据中心智能化运维机制,加强多场景协同联动、多节点一体管控,提升节点感知、异常发现和故障预测能力,降低人工操作风险,推动运维管理模式转型升级。是保障金融业务稳定运行的关键环节。银保监会下发的《关于银行业保险业数字化转型的指导意见》中,提到要建立“前端敏态、后端稳态”的运行模式,同时还需建立能够快速响应需求的敏捷研发运维体系,积极引入研发运维一体化工具等科技能力建设。

金科创新社收集、归纳、整理了近年来金融行业 50个IT运维案例,按照云运维、应用运维、系统运维、运维开发、运维安全等内容进行分类,以期推动金融IT运维从传统运维向智能运维转型,探索运维新模式,实现运维更高效、更安全并可持续的业务目标,助力金融数字化转型构筑坚实数字底座。

云运维

金融行业云计算、虚拟化技术的发展,给运维带来新的挑战:一是资源池基础架构多样,异构资源池难以有效的统一管理与调度;二是业务系统上云后,管理理念、技术工具、业务流程未充分融合,导致在提升效率,释放IT人力资源的效果并不明显;三是数据中心云化后,资源快速部署,自助交付效率逐渐成为瓶颈。光大证券、北京农商银行、贵州农信等金融机构在多云异构管理、灾备云建设等方面进行了有益探索。

光大证券:数智化数据中心多云管理平台

光大证券数智化数据中心多云管理平台(MCMP)实现多云(私有基础设施云、桌面云、容器云和公有云)服务和资源的统筹管理。MCMP在多云异构资源池管理、跨云资源调度和编排、智能管控、统一自助交付及运营管理五个功能领域提供了“自助、敏捷、开放”运营一体的服务能力。

北京农商银行:云平台建设项目

云平台创新项目通过构建标准化、完整的IaaS、云平台、规范、流程, 建立起标准化、自动化,支持快速开发测试与管理的一体化云平台, 屏蔽异构的底层硬件复杂环境,实现了在混合IT环境下统一部署交付混合IT资源和环境, 统一部署交付各类应用业务系统。

云平台项目采用成熟度较高的商业云计算平台产品,形成具有本行特色的商业云计算落地最佳实践,制定了一体化管理框架;采用多台服务器实现分布式存储以及计算与内存池化,提高了系统的可靠性、可用性、可扩展性和存取效率;建立了IAAS+的私有云平台,形成资源层、平台层灵活调度的敏捷环境,为开发测试提供了快速可靠的IT资源交付服务。

贵州农信:观山湖数据中心工程建设云管理平台

云管理平台通过负载均衡和资源均衡的策略,从共享资源池中为上层的应用系统创建和提供运行环境。其总体架构设计可分为:硬件基础设施层、云资源调度层、云资源服务层以及云资源应用层。通过采用实时高效能耗监控和管理技术、资源智能运维技术,实现了云计算环境资源能效管理和智能运维。

应用运维

金融企业业务、科技的快速发展,应用系统、数据量、IT基础设施数量和规模越来越大,系统间关联关系越来越复杂,操作风险、运维成本、应急能力等诸多问题日益显现,应用运维以保障生产系统安全稳定运行为目标,通过优化线上服务的发布变更、服务健康状况监控、服务的容灾高可用和数据安全备份等工作,不断提升运维精细化水平。珠江人寿、农信银资金清算中心、福建农信等金融企业在业务运维平台、日志分析平台、自动化运维方面的创新经验值得借鉴。

珠江人寿:智能业务运维平台

智能业务运维平台包含应用性能分析、用户体验分析、可视化分析数据展示、统一运维门户等功能,支持监控系统底层代码、系统内部及系统间接口的调用链,实现端对端的数据链路分析,从而形成完整系统拓扑图,实现系统性能分析及系统定位故障。

平台主要实现以下关键目标:一是应用性能分析,通过分析实现对移动互联网服务系统、业务支撑系统的运行性能与故障状况进行实时的监控与定位,对问题进行提前预警与实时告警;二是用户体验分析,通过采集、统计与分析每位用户使用系统的性能状态,主动掌握用户在使用系统过程中出现的异常问题,先于用户发现并解决问题,提高服务质量与提升用户体验;三是业务健康度分析,通过对关键业务的业务量、业务健康情况进行分析,为业务部门进行业务流程优化、制定营销策略等提供决策依据;四是可视化数据展示,通过可视化技术展示监控对象的关键运行数据,如系统拓扑图、业务健康度数据、系统故障数据、基础资源使用情况数据等。

农信银资金清算中心:智能日志分析平台

农信银支付清算系统覆盖全国8万家农村中小金融机构的业务网点,其所提供的金融服务惠及近10亿农村地区用户。覆盖全机构业务系统的实时日志分析平台,通过日志分析加强业务运维支撑能力。

福建农信:自动化运维系统项目

自动化运维系统是以流程管理为核心,以保障安全和提升效率为理念,系统包括作业调度、应急操作、健康巡检、灾备切换、脚本服务、文件同步等功能模块。项目立足于解决IT运维中的痛点,着力实现运维操作标准化、管理精细化,提升运维服务水平,主要在以下方面进行了创新:一是实现作业可视化、集中管理,通过对各类定时作业、批量作业进行梳理,经过流程化改造接入自动化运维系统,将分散在各个应用系统的服务器的批量作业集中管控;实现作业开发配置可视化,运行结果监控可视化,异常处理处置流程规范化,关联作业可设置依赖关系;作业支持集群调用,规避作业单点风险。二是实现自动化灾备切换,通过自动化运维系统实现灾备切换的自动化,解决手工操作,切换时间长,切换效率低的问题,有效降低RTO;实现灾备切换过程可视化,切换风险可控;实现灾备切换流程可固化,切换执行步骤、脚本可集中管控,使得切换的知识、经验可传承。三是实现环境一致性,通过文件同步模块实现可视化界面,进行环境同步配置和同步状态实时展示与监控,有效确保灾备环境的可用性。

系统运维

数字化转型已经成为金融企业保持竞争力、拓展业务边界的必经之路。这让数字底座的金融IT基础设施运维面临海量数据、架构转型等挑战。系统运维聚焦基础服务和底层网络,关注性能、可用性、稳定性及负载调度能力等,前海人寿、兴业银行等金融机构自动化、智能化运维实践带来有益的思考和启发。

前海人寿:162自动化运维平台

162自动化运维平台综合利用了风险管理、质量管理、大数据分析及多种新技术,以活动事务过程管控为基础,发挥IT系统运行数据积累优势,对运行风险诱因进行管理,化被动为主动,构建了一个过程治理数据、数据驱动流程、流程驱动管理、管理促进规范的服务管理闭环。

平台承载超过200多个应用系统的管理支持工作。其中,ARMS应用资源管理系统,管理涉及基础设施类、应用系统类、信息安全类等应用基础资源数千项;ODAP运营数据分析平台,日分析上亿数据量,产生近200张各类型清单报表,涉及指标分析、IT服务、监管审计、监控分析、安全与桌面、版本分析、定采需求等;ASM应用监控平台,实施监控目标作业数千个,预警消息推送及监控告警超过1000笔/天,主动及时发现大量的生产问题隐患并推动问题解决;IT服务管理系统通过ITSM处理IT服务事件、权限作业、生产异常、变更请求、数据处理等超过1000笔/月。

兴业银行:商业银行一体化智能运维平台

一体化智能运维平台是将兴业银行福州中山机房、马江机房、上海张江机房及各分行的主机、服务器和网络等各种生产设备以及各地运维人力资源纳入到统一的运维平台来管理,以提高全行运行维护的的可靠性和安全性的实践。

该平台的建设完善了兴业银行完整的运维授权访问控制体系,实现运维人员身份认证、运维操作和访问控制、设备密码的统一管理,实现了集中的用户访问痕迹跟踪和审计,实现跨区域、跨机房维护,提高了运维工作效率,保障了全行各信息系统安全、稳定、高效运行。 

运维开发

随着金融业务的高速发展,以及大量新技术的引入,对传统的运维管理方法提出挑战。在高速变化的环境下,系统如何保持可用性要求,需要有更先进的IT管理思路和更高效的运维管理平台。运维开发指运维平台设计、开发和实施部署,郑州银行、哈密商业银行、江西农信等金融企业在DevOps、统一运维管理平台、智能运维平台方面进行了创新实践。

郑州银行:DevOps工具链容器化项目

项目主要内容包括规划和搭建应用容器云平台(DevOps环境)及其管理端。容器云平台采用云原生开源的K8S+Docker技术,根据应用需求,搭建开发测试集群、DMZ集群、互联网应用集群3套业务集群,并通过管理平台实现统一管理。在开发测试中心的开发测试区、DMZ区、互联网应用区各搭建1套高可用集群,实现互联网应用区的应用通过DMZ区暴露到外部访问,并在开发测试区和互联网应用区均提供共享存储,满足集群应用的数据持久化需求。所有集群共同使用同一镜像仓库。管理平台可以对多集群进行统一的可视化管理,提供多集群的注册、修改、运维、监控等核心功能支持,实现多集群的一站式管理。

哈密市商业银行:IT运维数字化转型的场景实践

IT运维管理平台实现一套管控体系、一套低代码与运维开发方法;通过建立统一运维管理平台,整合贯通CMDB、流程平台、监控平台、运维数据分析、知识库、门户及可视化等,实现企业IT运维工具化、可视化、标准化、数字化、一体化的体系化演进。

哈密银行采用数字化驱动运维战略,底层依托大数据平台的算力,实现运维数据的采、存、管、析、用,从监、管、控三方面整体提升运维能力。建立监控体系使监控平台覆盖运维全领域,实现运维数据数字化,并围绕CMDB配置管理作为主数据,建立指标、日志、告警、工单等统一运维大数据模型。基于可视化、低代码的编排设计引擎界面,实现对数据接入、数据标准、数据治理、数据消费、算法服务的闭环,进而提供可视化、白盒化的数据算法和训练能力。构建面向业务视角的数据地图和服务目录,促进数据的分析消费和深度挖掘,大幅提升运维数据资产的价值,提高问题处理的效率。

江西农信:基于大数据与人工智能的农信行业智能运维体系建设

智能运维平台的整体系统架构采用Hadoop和Elasticsearch作为存储和计算的支撑平台,开放式的智能模型架构提供智能能力输出,通过基于微服务与分布式消息的运维管理总线为主线,搭建而成。

功能上,实现应用系统交易智能分析、企业级系统智能感知、企业级数据库智能洞察、企业级运维智能提升、企业级存储智能评估。

技术创新上,一是为满足业务日志采集实时性、高吞吐量以及系统资源低消耗的要求,对Flume在源码层面进行大量改造和验证,保障数据采集层长期稳定运行;二是应用微服务设计理念,数据解析实现完全的配置化定义,并对外以RESTful接口提供调用,快速响应用户需求的变化;三是结合缓存集群以及Structured Streaming的使用,完成如交易日志合并、异步消息处理等复杂业务逻辑的实现;四是整个运维大数据平台基于虚拟化平台构建,具备完全的资源动态扩容与调整能力。

运维安全

近几年来由于运维管理不当造成金融机构信息科技风险事件时有发生。运维安全负责各方面的安全加固工作,如安全扫描、渗透测试等,进行安全工具和系统研发以及安全事件应急处理,对于信息科技风险的有效控制和管理至关重要。

恒丰银行:安全开发运营管理解决方案

平台将安全业务自动化处理与数据深度挖掘相结合,优化企业安全处理过程,结合人、资产、威胁、法规政策等相关因素,做到真正的移动业务风险管理。大数据技术使原有被动式的事前策略预防,事中处理和事后审计流程,转为更加主动的自动评估预测与智能检测加固防护,帮助企业安全管理部门实现从追求功能价值到追求数据价值的核心诉求。

平台主要包含数据感知中心、数据流程中心与数据展现中心三个主要功能模块,数据感知中心集成行业最先进的源代码安全测试、应用安全检测、基础环境漏洞扫描、基础环境安全配置核查、Web安全检测工具等,对于具体的移动业务自动进行安全感知数据搜集。数据流程中心与前后端主流管理软件jenkins、DevOps、OpenStack、项目管理系统等平台数据交互,形成以安全漏洞视角为核心的问题处理流程管理机制,对于问题进行过程管控与预警通告,同时建立以零日威胁防护为目标的应急响应机制。数据展现中心则将安全过程数据、安全生产数据与安全结果数据进行业务建模与数据挖掘,提供业务安全评估、已知风险统计、业务安全溯源与安全态势预测的深度数据服务。展现中心特有的数据量化展现工具,可与现行政策法规与企业安全基线相结合,形成问题源、风险关联、事件过程与态势影响的企业实时全景安全监控。

吉林农信:基于模拟仿真技术的自动化业务拨测系统

为加强科技风险防范能力,提升运维管理水平,吉林农信结合自身运维体系的建设情况,以客户体验为中心,利用模拟仿真、自动化技术,建立业务拨测系统,对业务进行监控,避免业务故障发现、处理不及时,影响客户满意度进而造成客户流失;实现及时、有效获取系统可靠性指标(可用率、MTBF、MTTR、MTTF等重要指标);增加主动监控维度,驱动现有监控体系形成良性、自优化闭环体系;形成应用系统级别的故障定位,及构建业务故障影响范围快速判定方法;弥补现有运维体系存在短板,解决交易监控系统夜间无交易情况下的盲区。


注:金融行业IT运维精选案例集来源于金科创新社近年来主办、协办的评选活动及网络。


图片

扫码查看IT运维51个精选案例


推荐阅读
  • 服务器部署中的安全策略实践与优化
    服务器部署中的安全策略实践与优化 ... [详细]
  • 软件测试行业深度解析:迈向高薪的必经之路
    本文深入探讨了软件测试行业的发展现状及未来趋势,旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]
  • Docker安全策略与管理
    本文探讨了Docker的安全挑战、核心安全特性及其管理策略,旨在帮助读者深入理解Docker安全机制,并提供实用的安全管理建议。 ... [详细]
  • 本文详细介绍了如何在Linux系统中使用nslookup命令查询DNS服务器地址,这对于Linux服务器的运维管理是非常重要的基础知识。 ... [详细]
  • 本文详细介绍了Java代码分层的基本概念和常见分层模式,特别是MVC模式。同时探讨了不同项目需求下的分层策略,帮助读者更好地理解和应用Java分层思想。 ... [详细]
  • 本文介绍了如何利用HTTP隧道技术在受限网络环境中绕过IDS和防火墙等安全设备,实现RDP端口的暴力破解攻击。文章详细描述了部署过程、攻击实施及流量分析,旨在提升网络安全意识。 ... [详细]
  • 提升 Kubernetes 集群管理效率的七大专业工具
    Kubernetes 在云原生环境中的应用日益广泛,然而集群管理的复杂性也随之增加。为了提高管理效率,本文推荐了七款专业工具,这些工具不仅能够简化日常操作,还能提升系统的稳定性和安全性。从自动化部署到监控和故障排查,这些工具覆盖了集群管理的各个方面,帮助管理员更好地应对挑战。 ... [详细]
  • 从运维繁忙到屡获殊荣:一位CIO的辉煌转型之路
    企业首席信息官(CIO)常常面临一个棘手的问题:如何有效推动公司的数字化转型?尽管数字化转型已成为企业未来发展的重要共识,但如何具体实施依然是许多CIO面临的重大挑战。在日常运营中,企业需要处理大量的业务问题和制定各种发展规划,这使得数字化转型往往被排在较低的优先级。此外,不断涌现的新问题和新规划也常常打乱原有的计划,进一步增加了转型的难度。 ... [详细]
  • Node.js在服务器上的多种部署策略
    本文探讨了Node.js应用程序在服务器上部署的几种有效方法,包括使用Screen、PM2以及通过宝塔面板进行简易管理。 ... [详细]
  • 本文详细介绍了如何在Azure DevOps Services和Azure DevOps Server中调整时区设置,以及这些设置对不同功能的影响。 ... [详细]
  • 探讨密码安全的重要性
    近期,多家知名网站如CSDN、人人网、多玩、开心网等的数据库相继被泄露,其中大量用户的账户密码因明文存储而暴露无遗。本文将探讨黑客获取密码的常见手段,网站如何安全存储用户信息,以及用户应如何保护自己的密码。 ... [详细]
  • Java作为全球最流行的编程语言之一,应用广泛。本文将详细介绍Java开发的相关岗位及其具体职责,帮助读者更好地了解这一领域的职业发展路径。 ... [详细]
  • 基于iSCSI的SQL Server 2012群集测试(一)SQL群集安装
    一、测试需求介绍与准备公司计划服务器迁移过程计划同时上线SQLServer2012,引入SQLServer2012群集提高高可用性,需要对SQLServ ... [详细]
  • 本文详细介绍了如何在Linux系统(以CentOS为例)上彻底卸载Zimbra邮件系统,包括停止服务、删除文件和用户等步骤。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
author-avatar
佳蓁政睿9
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有