热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

GBASE助力铁科院12306新一代客票系统

2016年7月,国家发展改革委、交通运输部、中国铁路总公司联合发布了《中长期铁路网规划》,勾画了新时期八纵八横高速铁路网的宏大蓝图。铁科院为配合这一战略,着手开展新一代客票及电子支付平台等系

2016年7月,国家发展改革委、交通运输部、中国铁路总公司联合发布了《中长期铁路网规划》,勾画了新时期"八纵八横"高速铁路网的宏大蓝图。铁科院为配合这一战略,着手开展新一代客票及电子支付平台等系统升级和扩容工程。

工程涉及到的系统有:新一代客票系统、铁路电子支付平台、短信及语音平台等7个。本期铁科院的项目属于新一代客票系统。铁路新一代客票系统的大数据应用创新主要聚焦12306互联网风控、票额预分应用和针对12306用户画像三个方面:

12306互联网风控:主要是用来解决互联网售票比较严峻的抢票等应用场景。新一代客票系统通过构建风控系统实现风险的预判,然后进行精确打击。通过大数据平台,实时收集网上购票用户的行为数据,以及第三方数据,然后开展实时分析和实时计算,完成对风险的决策和管理,实现实时卡控。

票额预分应用:它以历史客运数据为基础,以列车运行图为约束,对列车的分席别OD客流进行分席别的需求预测,在客流预测的基础上,以票额最大化利用率为优化目标,实施的售票组织策略。基于大数据平台的分析,优先分配重点客流,努力保证稳定客流,科学兼顾其它客流,对销售时机和数量进行预测,通过精细化管理提升发送量和收入。

12306用户画像:铁路旅客用户画像系统是通过对铁路用户的行为数据、交易数据等进行采集、加工和分析,形成用户精准画像数据,为旅客提供精准服务推荐和个性化的客运服务,对内提升铁路客户服务能力和行业核心竞争力,对外支撑精准广告投放以及开展数据增值服务。

业务需求

随着客运业务的运输量增大,和数据分析种类的增多,现有系统已经愈加难以支撑当前业务的需求和数据多样化趋势。基于Sybase IQ建立的分析类系统遇到性能瓶颈,无法及时完成数据加载处理,无法有效支撑更多的分析和访问,铁科院打算引进相关平台级产品进行能力升级,寻求技术成熟、能力充分的数据平台产品,以满足现在和未来业务的性能要求。在此期间,铁科院基于Tez、Hive等SQL on Hadoop类技术应用于历史客票的分析应用,但基于Hadoop的批处理特征,主要还是局限对历史数据的批量分析场景,对于复杂且实时性要求高的分析类应用,仍然依赖Sybase IQ,铁科院此次改造,一方面要解决Sybase IQ在线分析平台的处理瓶颈问题,一方面也是解决Hadoop上客票历史库与在线分析平台的统一数据管理和统一分析问题。

本期项目为扩容,在原有GBase 8a MPP的22节点集群中再增加6个节点,建设完成的28个节点进行动态数据重分布。

作为Sybase IQ的替代,通过在大数据平台中引进GBase 8a MPP数据库,增强了客户数据的分析计算能力,消除了传统Shared
Disk型数据库的处理瓶颈,实现了包括多维分析在内的在线查询能力。

利用GBase UP将基于Hadoop建设的客户历史库和GBase 8a MPP在线库进行整合。用户应用可将在线库数据和历史库数据作为一个统一视图,进行查询和分析计算,使应用不用意识所查询和处理的数据的具体位置,实现应用对数据层透明化访问,并且通过标准SQL统一数据访问,降低了开发难度,防止了1个应用中SQL和HQL混在的局面。并且GBase
UP可以基于标准接口对Cognos这样的第三方BI工具实现直接的数据开放,从而平滑继承之前BI应用。

基于GBase UP的跨引擎的客票数据的生命周期管理,可自动根据数据的生命周期在引擎间自动搬运数据,而对于上层应用又封装为统一视图,这种生命周期管理可综合数据价值和存储成本,实现数据的“适才适所”的分布。

基于GBase UP的大数据平台,可以将各类客运数据统合在一起,形成客运数据湖,各类客运分析应用可以基于GBase UP提供的标准化接口实现DaaS(Data as Service)式服务,从而有效共享全路局数据。








铁科院客票分析系统架构图


海量数据存储和处理:基于GBase UP下的大数据平台(MPP + Hadoop)有效支撑总公司及各地方路局几十TB的数据量,并具有很好的可扩展性,可动态应对今后不断增长的数据分析需要,彻底解决之前Sybase IQ平台上数据处理能力不足的问题。

海量数据的高效分析查询:通过GBase 8a MPP数据库的分布式架构、列存、压缩存储和大规模数据并行处理能力,有效支撑了并行条件下,海量数据分析查询,即席查询能力,实现十亿级数据的秒级在线分析,并且具有线性的系统扩展能力。


数据的统一整合管理:基于GBase UP大数据平台,有效整合了MPP 和 Hadoop两大种类集群能力,将在线数据和历史数据统合成一个统一视图,并以标准SQL封装的方式,对上层应用开放数据分析和数据挖掘能力,简化了大数据应用开发,并通过数据生命周期管理等特性,降低了数据运维难度,提升了系统整体的性价比。


推荐阅读
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 创邻科技成功举办Graph+X生态合作伙伴大会,30余家行业领军企业共聚杭州
    9月22日,创邻科技在杭州举办“Graph+X”生态合作伙伴大会,汇聚了超过30家行业头部企业的50多位企业家和技术领袖,共同探讨图技术的前沿应用与发展前景。 ... [详细]
  • 深入解析Hadoop的核心组件与工作原理
    本文详细介绍了Hadoop的三大核心组件:分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制,帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]
  • 国内BI工具迎战国际巨头Tableau,稳步崛起
    尽管商业智能(BI)工具在中国的普及程度尚不及国际市场,但近年来,随着本土企业的持续创新和市场推广,国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争,国内BI工具通过不断优化产品和技术,赢得了越来越多用户的认可。 ... [详细]
  • 深入探讨CPU虚拟化与KVM内存管理
    本文详细介绍了现代服务器架构中的CPU虚拟化技术,包括SMP、NUMA和MPP三种多处理器结构,并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景,帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]
  • 本文探讨了2012年4月期间,淘宝在技术架构上的关键数据和发展历程。涵盖了从早期PHP到Java的转型,以及在分布式计算、存储和网络流量管理方面的创新。 ... [详细]
  • Hadoop发行版本选择指南:技术解析与应用实践
    本文详细介绍了Hadoop的不同发行版本及其特点,帮助读者根据实际需求选择最合适的Hadoop版本。内容涵盖Apache Hadoop、Cloudera CDH等主流版本的特性及应用场景。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 本文详细分析了Hive在启动过程中遇到的权限拒绝错误,并提供了多种解决方案,包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]
  • 使用Python在SAE上开发新浪微博应用的初步探索
    最近重新审视了新浪云平台(SAE)提供的服务,发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用,并分享开发过程中的关键步骤。 ... [详细]
  • HBase运维工具全解析
    本文深入探讨了HBase常用的运维工具,详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说,这些工具是日常管理和故障排查的重要手段。 ... [详细]
  • 本文深入探讨了SQL数据库中常见的面试问题,包括如何获取自增字段的当前值、防止SQL注入的方法、游标的作用与使用、索引的形式及其优缺点,以及事务和存储过程的概念。通过详细的解答和示例,帮助读者更好地理解和应对这些技术问题。 ... [详细]
  • 本文提供了 CIW Dreamweaver MX2004 认证考试的详细试题解析,涵盖不同难度级别的选择题、多项选择题和判断题。通过这些题目,考生可以更好地理解考试内容并为实际考试做好准备。 ... [详细]
  • 本文详细介绍了 Linux 系统中用户、组和文件权限的设置方法,包括基本权限(读、写、执行)、特殊权限(SUID、SGID、Sticky Bit)以及相关配置文件的使用。 ... [详细]
  • 本文探讨了当前技术发展趋势,特别是大数据和人工智能如何推动工业互联网的发展。文章分析了全球主要国家在工业互联网领域的进展,并展望了未来工业互联网技术的发展方向。 ... [详细]
author-avatar
李雪萱849
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有