热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

GBASE助力铁科院12306新一代客票系统

2016年7月,国家发展改革委、交通运输部、中国铁路总公司联合发布了《中长期铁路网规划》,勾画了新时期八纵八横高速铁路网的宏大蓝图。铁科院为配合这一战略,着手开展新一代客票及电子支付平台等系

2016年7月,国家发展改革委、交通运输部、中国铁路总公司联合发布了《中长期铁路网规划》,勾画了新时期"八纵八横"高速铁路网的宏大蓝图。铁科院为配合这一战略,着手开展新一代客票及电子支付平台等系统升级和扩容工程。

工程涉及到的系统有:新一代客票系统、铁路电子支付平台、短信及语音平台等7个。本期铁科院的项目属于新一代客票系统。铁路新一代客票系统的大数据应用创新主要聚焦12306互联网风控、票额预分应用和针对12306用户画像三个方面:

12306互联网风控:主要是用来解决互联网售票比较严峻的抢票等应用场景。新一代客票系统通过构建风控系统实现风险的预判,然后进行精确打击。通过大数据平台,实时收集网上购票用户的行为数据,以及第三方数据,然后开展实时分析和实时计算,完成对风险的决策和管理,实现实时卡控。

票额预分应用:它以历史客运数据为基础,以列车运行图为约束,对列车的分席别OD客流进行分席别的需求预测,在客流预测的基础上,以票额最大化利用率为优化目标,实施的售票组织策略。基于大数据平台的分析,优先分配重点客流,努力保证稳定客流,科学兼顾其它客流,对销售时机和数量进行预测,通过精细化管理提升发送量和收入。

12306用户画像:铁路旅客用户画像系统是通过对铁路用户的行为数据、交易数据等进行采集、加工和分析,形成用户精准画像数据,为旅客提供精准服务推荐和个性化的客运服务,对内提升铁路客户服务能力和行业核心竞争力,对外支撑精准广告投放以及开展数据增值服务。

业务需求

随着客运业务的运输量增大,和数据分析种类的增多,现有系统已经愈加难以支撑当前业务的需求和数据多样化趋势。基于Sybase IQ建立的分析类系统遇到性能瓶颈,无法及时完成数据加载处理,无法有效支撑更多的分析和访问,铁科院打算引进相关平台级产品进行能力升级,寻求技术成熟、能力充分的数据平台产品,以满足现在和未来业务的性能要求。在此期间,铁科院基于Tez、Hive等SQL on Hadoop类技术应用于历史客票的分析应用,但基于Hadoop的批处理特征,主要还是局限对历史数据的批量分析场景,对于复杂且实时性要求高的分析类应用,仍然依赖Sybase IQ,铁科院此次改造,一方面要解决Sybase IQ在线分析平台的处理瓶颈问题,一方面也是解决Hadoop上客票历史库与在线分析平台的统一数据管理和统一分析问题。

本期项目为扩容,在原有GBase 8a MPP的22节点集群中再增加6个节点,建设完成的28个节点进行动态数据重分布。

作为Sybase IQ的替代,通过在大数据平台中引进GBase 8a MPP数据库,增强了客户数据的分析计算能力,消除了传统Shared
Disk型数据库的处理瓶颈,实现了包括多维分析在内的在线查询能力。

利用GBase UP将基于Hadoop建设的客户历史库和GBase 8a MPP在线库进行整合。用户应用可将在线库数据和历史库数据作为一个统一视图,进行查询和分析计算,使应用不用意识所查询和处理的数据的具体位置,实现应用对数据层透明化访问,并且通过标准SQL统一数据访问,降低了开发难度,防止了1个应用中SQL和HQL混在的局面。并且GBase
UP可以基于标准接口对Cognos这样的第三方BI工具实现直接的数据开放,从而平滑继承之前BI应用。

基于GBase UP的跨引擎的客票数据的生命周期管理,可自动根据数据的生命周期在引擎间自动搬运数据,而对于上层应用又封装为统一视图,这种生命周期管理可综合数据价值和存储成本,实现数据的“适才适所”的分布。

基于GBase UP的大数据平台,可以将各类客运数据统合在一起,形成客运数据湖,各类客运分析应用可以基于GBase UP提供的标准化接口实现DaaS(Data as Service)式服务,从而有效共享全路局数据。








铁科院客票分析系统架构图


海量数据存储和处理:基于GBase UP下的大数据平台(MPP + Hadoop)有效支撑总公司及各地方路局几十TB的数据量,并具有很好的可扩展性,可动态应对今后不断增长的数据分析需要,彻底解决之前Sybase IQ平台上数据处理能力不足的问题。

海量数据的高效分析查询:通过GBase 8a MPP数据库的分布式架构、列存、压缩存储和大规模数据并行处理能力,有效支撑了并行条件下,海量数据分析查询,即席查询能力,实现十亿级数据的秒级在线分析,并且具有线性的系统扩展能力。


数据的统一整合管理:基于GBase UP大数据平台,有效整合了MPP 和 Hadoop两大种类集群能力,将在线数据和历史数据统合成一个统一视图,并以标准SQL封装的方式,对上层应用开放数据分析和数据挖掘能力,简化了大数据应用开发,并通过数据生命周期管理等特性,降低了数据运维难度,提升了系统整体的性价比。


推荐阅读
  • 本文探讨了使用Python实现监控信息收集的方法,涵盖从基础的日志记录到复杂的系统运维解决方案,旨在帮助开发者和运维人员提升工作效率。 ... [详细]
  • 七大策略降低云上MySQL成本
    在全球经济放缓和通胀压力下,降低云环境中MySQL数据库的运行成本成为企业关注的重点。本文提供了一系列实用技巧,旨在帮助企业有效控制成本,同时保持高效运作。 ... [详细]
  • 为何Compose与Swarm之后仍有Kubernetes的诞生?
    探讨在已有Compose和Swarm的情况下,Kubernetes是如何以其独特的设计理念和技术优势脱颖而出,成为容器编排领域的领航者。 ... [详细]
  • 本文介绍了SIP(Session Initiation Protocol,会话发起协议)的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]
  • 软件测试行业深度解析:迈向高薪的必经之路
    本文深入探讨了软件测试行业的发展现状及未来趋势,旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 从理想主义者的内心深处萌发的技术信仰,推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]
  • 本文探讨了在一个物理隔离的环境中构建数据交换平台所面临的挑战,包括但不限于数据加密、传输监控及确保文件交换的安全性和可靠性。同时,作者结合自身项目经验,分享了项目规划、实施过程中的关键决策及其背后的思考。 ... [详细]
  • 对于非计算机专业背景的开发者而言,如何快速掌握.NET基础知识以应对技术面试是一个挑战。本文将提供一系列实用建议,帮助读者在短时间内提高.NET基础水平。 ... [详细]
  • Java虚拟机及其发展历程
    Java虚拟机(JVM)是每个Java开发者日常工作中不可或缺的一部分,但其背后的运作机制却往往显得神秘莫测。本文将探讨Java及其虚拟机的发展历程,帮助读者深入了解这一关键技术。 ... [详细]
  • 本文回顾了作者在求职阿里和腾讯实习生过程中,从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历,还提供了宝贵的面试准备建议和技巧。 ... [详细]
  • 一家位于长沙的知名网络安全企业,现面向全国诚聘高级后端开发工程师,特别欢迎具有一线城市经验的技术精英回归故乡,共创辉煌。 ... [详细]
  • 本文详细介绍了在尝试启动MySQL服务时,如果遇到错误提示‘MySQL未运行,但锁定文件(/var/lock/subsys/mysql)存在’应如何处理,包括具体的操作步骤和可能的原因分析。 ... [详细]
  • 本文探讨了如何通过Service Locator模式来简化和优化在B/S架构中的服务命名访问,特别是对于需要频繁访问的服务,如JNDI和XMLNS。该模式通过缓存机制减少了重复查找的成本,并提供了对多种服务的统一访问接口。 ... [详细]
  • 本文总结了一次针对大厂Java研发岗位的面试经历,探讨了面试中常见的问题及其背后的原因,并分享了一些实用的面试准备资料。 ... [详细]
author-avatar
李雪萱849
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有