热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

复星保德信人寿:数据架构建设项目

一、项目背景公司存在多个业务系统,数据存储分散,未能统一集中管理,不同系统间的数据存储口径差异大,无统一的数据标准,给日常经营分析和监管数据报送带来了诸多不便;同时随着大数据和人工

一、项目背景

公司存在多个业务系统,数据存储分散,未能统一集中管理,不同系统间的数据存储口径差异大,无统一的数据标准,给日常经营分析和监管数据报送带来了诸多不便;同时随着大数据和人工智能等新技术的快速普及,以关系型数据库为基础的传统数据架构已无法完全适应新业务场景的使用要求,无法快速提供经营分析指标,无法有效应对新型监管要求,也无法直接提高销售队伍产能。

二、项目方案

通过数据架构建设项目,将核心系统、销售管理系统和财务系统等多个系统数据整合加载,搭建具备实时计算能力的企业级数据平台;实现数据存储的集中、数据模型的标准化、数据开发的高效,弥补长期以来公司的数据架构短板;以数据湖和标准化数据模型为基础,全面升级可视化报表平台;搭建实时计算引擎,实现代理人佣金业绩考核和客户累计风险保额的实时计算,为公司提供标准化和高时效的数据计算查询服务。

项目实施平台:星环Transwarp大数据平台+Oracle19c

复星保德信人寿:数据架构建设项目

三、创新点

1)新型数据架构:搭建了基于传统关系型数据库和星环大数据平台的新型混合数据架构。数据湖和标准化数据模型建立在关系型数据库上,充分发挥传统数据仓库的长处;实时流计算引擎建立在大数据平台上,支持秒级计算,两套架构相互融合,取长补短。

2)集中化数据湖:实时归集11个系统的完整数据,解决了数据不集中和读写不分离的问题,清单报表数据查询效率由原来的20秒提升至1秒,监管数据报送工作效率获得大幅提升;

3)标准化数据模型:分析983张数据表,整理超过2万个数据字段,建立82个数据模型,解决数据模型不标准的问题;

4)智慧决策平台:搭建可视化智慧决策平台,支持业务自助分析、领导驾驶舱、移动报表和手工填报等全新功能;

5)实时化流式计算引擎:首次引入实时计算平台,改变过去单一的批量处理数据方式,计算速度提高到秒级。

复星保德信人寿:数据架构建设项目

四、技术实现特点

1)星环Transwarp大数据平台技术

数据推送使用OGG和Kafka技术,实时流计算使用Slipstream技术,数据存储使用Hyperbase、Inceptor和HDFS技术,离线数据加载和调度使用Transporter和Workflow技术,这些技术的使用有效确保实时流计算引擎的稳定运行。

2)Redis缓存技术

代理人佣金计算考核和客户累计风险保额计算需要合并实时计算的当日数据和离线计算的历史数据,通过Java Stream实现实时与离线计算结果的整合同步,通过K-V形式在Redis缓存中实现全量实时数据的合并,统一对外提供高效极速的数据查询服务。

五、项目过程管理

项目各阶段的实施周期为:

复星保德信人寿:数据架构建设项目

项目管理上严格遵循PMP方法标准,专注于项目范围、进度、干系人、人力、沟通、风险和质量等管理规范,推动完成项目按计划交付,工作方法如下:

范围管理:编写《合同》和《工作说明书》共17181字,明确项目实施范围和执行细节;

进度管理:制定《项目计划》,详细分解成345项工作任务包,并明确每项任务包的责任人和完成日期,推动每项任务目标达成;

关系人管理:识别和管理36位干系人,输出5份《需求分析文档》,确保干系人预期达成;

人力管理:优选和管理18人的技术实施团队,并制定《人员配备管理计划》,解决资源使用瓶颈;

沟通管理:组织召开69次专项沟通会议和92次团队站会,协调7家支持厂商配合提供83次技术服务,收集输入超50份技术参考文档;

风险管理:识别和处置48个项目风险,确保项目正常执行和交付; 

质量管理:审核修改项目文档超30万字,检查代码超2万行,验收核对数据百万条,确保项目高质量交付。

六、运营情况

平台从2021年1月上线试运行至今,在智慧决策平台上已上线70余张报表,受到用户部门广泛好评,实时流计算引擎运行稳定,已完成生产数据验证工作,业务系统接入工作有序开展。

七、项目成效

项目上线后,达成了预定目标,取得了很好的项目成效:

1)降低硬件部署成本:引入的Hadoop大数据平台相比Oracle等传统关系型数据库,服务器与存储价格低廉,降低了硬件成本;

2)降低报表开发成本:标准化数据模型提高了技术人员开发报表的效率,开发一张报表平均由5天降至1天;

3)提高数据统计效率:数据湖大幅提升智慧决策平台查询效率,且支持业务人员自助制作报表,数据统计效率提升60%;

4)提高数据报送效率:通过系统汇总不同来源数据,并进行标准化处理,将监管数据报送工作量减少2-3倍;

5)激发一线展业积极性:代理人佣金和业绩KPI实时计算,支持晋升和降级考核结果数据实时查询,提高了销售团队展业积极性。

八、经验总结

搭建了基于传统关系型数据库和大数据平台的新型混合数据架构,充分发挥两种技术的优势;建立集中化数据湖和标准化数据模型,降低了报表开发和监管数据报送的成本;升级智慧决策平台,提升数据服务效率;搭建实时流计算引擎,实现代理人佣金业绩考核和累计风险保额的实时计算,赋能一线销售队伍,助力公司数字化转型。


推荐阅读
  • 在Linux系统中避免安装MySQL的简易指南
    在Linux系统中避免安装MySQL的简易指南 ... [详细]
  • Python 伦理黑客技术:深入探讨后门攻击(第三部分)
    在《Python 伦理黑客技术:深入探讨后门攻击(第三部分)》中,作者详细分析了后门攻击中的Socket问题。由于TCP协议基于流,难以确定消息批次的结束点,这给后门攻击的实现带来了挑战。为了解决这一问题,文章提出了一系列有效的技术方案,包括使用特定的分隔符和长度前缀,以确保数据包的准确传输和解析。这些方法不仅提高了攻击的隐蔽性和可靠性,还为安全研究人员提供了宝贵的参考。 ... [详细]
  • 数字图书馆近期展出了一批精选的Linux经典著作,这些书籍虽然部分较为陈旧,但依然具有重要的参考价值。如需转载相关内容,请务必注明来源:小文论坛(http://www.xiaowenbbs.com)。 ... [详细]
  • 阿里云MySQL与Oracle数据库的主从复制技术详解 ... [详细]
  • 2016-2017学年《网络安全实战》第三次作业
    2016-2017学年《网络安全实战》第三次作业总结了教材中关于网络信息收集技术的内容。本章主要探讨了网络踩点、网络扫描和网络查点三个关键步骤。其中,网络踩点旨在通过公开渠道收集目标信息,为后续的安全测试奠定基础,而不涉及实际的入侵行为。 ... [详细]
  • 本文介绍了如何利用Shell脚本高效地部署MHA(MySQL High Availability)高可用集群。通过详细的脚本编写和配置示例,展示了自动化部署过程中的关键步骤和注意事项。该方法不仅简化了集群的部署流程,还提高了系统的稳定性和可用性。 ... [详细]
  • 本文详细探讨了Oracle数据库中Number和Float数据类型的特性和使用方法。通过对比分析,解释了Number类型在精度和范围上的优势,以及Float类型在处理科学计算时的灵活性。文章还介绍了Number数据类型的语法结构及其在实际应用中的最佳实践,帮助读者更好地理解和选择合适的数据类型以满足不同的业务需求。 ... [详细]
  • POJ 2482 星空中的星星:利用线段树与扫描线算法解决
    在《POJ 2482 星空中的星星》问题中,通过运用线段树和扫描线算法,可以高效地解决星星在窗口内的计数问题。该方法不仅能够快速处理大规模数据,还能确保时间复杂度的最优性,适用于各种复杂的星空模拟场景。 ... [详细]
  • Oracle字符集详解:图表解析与中文乱码解决方案
    本文详细解析了 Oracle 数据库中的字符集机制,通过图表展示了不同字符集之间的转换过程,并针对中文乱码问题提供了有效的解决方案。文章深入探讨了字符集配置、数据迁移和兼容性问题,为数据库管理员和开发人员提供了实用的参考和指导。 ... [详细]
  • 在2015年1月的MySQL内核报告中,我们详细探讨了性能优化和Group Commit机制的改进。尽管网上已有大量关于Group Commit的资料,本文将简要回顾其发展,并重点分析MySQL 5.6及之前版本中引入的二进制日志(Binlog)对性能的影响。此外,我们还将深入讨论最新的优化措施,如何通过改进Group Commit机制显著提升系统的整体性能和稳定性。 ... [详细]
  • 在深入掌握Spring框架的事务管理之前,了解其背后的数据库事务基础至关重要。Spring的事务管理功能虽然强大且灵活,但其核心依赖于数据库自身的事务处理机制。因此,熟悉数据库事务的基本概念和特性是必不可少的。这包括事务的ACID属性、隔离级别以及常见的事务管理策略等。通过这些基础知识的学习,可以更好地理解和应用Spring中的事务管理配置。 ... [详细]
  • 如何使用mysql_nd:Python连接MySQL数据库的优雅指南
    无论是进行机器学习、Web开发还是爬虫项目,数据库操作都是必不可少的一环。本文将详细介绍如何使用Python通过 `mysql_nd` 库与 MySQL 数据库进行高效连接和数据交互。内容涵盖以下几个方面: ... [详细]
  • 润乾报表JNDI配置异常分析与解决方法
    在使用润乾报表时,通过JNDI连接数据源是常见的配置方式。本文详细分析了JNDI配置异常的原因,并提供了具体的解决方法。重点讨论了JNDI名称在三个关键位置的配置:1. Tomcat或应用服务器的数据源配置(以Tomcat为例);2. 润乾报表中的数据源配置;3. 应用程序代码中的JNDI名称引用。通过这些步骤,可以有效解决JNDI配置异常问题,确保报表系统的稳定运行。 ... [详细]
  • 如何高效启动大数据应用之旅?
    在前一篇文章中,我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目,涵盖关键步骤和最佳实践,帮助读者快速踏上大数据之旅。 ... [详细]
  • 在处理遗留数据库的映射时,反向工程是一个重要的初始步骤。由于实体模式已经在数据库系统中存在,Hibernate 提供了自动化工具来简化这一过程,帮助开发人员快速生成持久化类和映射文件。通过反向工程,可以显著提高开发效率并减少手动配置的错误。此外,该工具还支持对现有数据库结构进行分析,自动生成符合 Hibernate 规范的配置文件,从而加速项目的启动和开发周期。 ... [详细]
author-avatar
三毛2502858553
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有