热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

对金融大数据存在意义的思考(一)之渠道产品金融大数据

目标读者java开发工程师与渠道业务人员场景不少同学在疑惑:金融大数据团队能给自己所在的产品线提供什么服务?背景部门非大数据团队主流开发语言是

目标读者

java 开发工程师 与 渠道业务人员


场 景

不少同学在疑惑:金融大数据团队能给自己所在的产品线提供什么服务?


背 景

部门非大数据团队主流开发语言是 java,存储用 mysql 。目前,总数据量在 T B 级别,业务系统刚起步,数据量确实不多,业务对数据实时性要求也不高,大数据团队能干的活,java webers 好像也可以干




分 析

在往下讲之前,先普及两个常识:


  • 美的金融门户 = 美信入口美的金融 app + 独立美的金融app + 美的金融pc端

  • mysq一般只能处理一亿条记录以内的数据:超过一个亿,即使做了分库、分表与读写分离等优化后,查询性能也是极低的 - 一个一般业务负责度的查询可能需要10s才能出结果

接下来,我们从技术与业务的角度,粗略描述一下当前金融大数据团队旗下魔镜产品能够给渠道产品(就是美的金融门户啦)提供什么服务


技术上

从海量数据的存储与分析角度来展开,先谈‘存储‘。来看一张魔分生产环境的报表 :

这里写图片描述

上面这张报表简要地统计与分析了用户通过美信使用美的金融app的情况。有同事要拍砖了,这么简单的报表要你大数据团队做吗,随便找一个java工程师,写几个查询语句、关联几张表不就可以轻松搞定了吗? 额,一起来看看这张报表背后的数据 - 目前我们只接入了美信入口美的金融app段的数据:

日 增 :18,1028 条 总 量 :362,0572 条
保守估计一年后的数据量 : 6607,5220 条

注 意,这个只是美信入口美的金融app的数据,我们还有独立app与pc端的数据(当前没有接入,见上文常识)。保守估计一年后的数据量在 1 亿这个数量级(当然,业务发展的快的话,可能是 10亿,甚至100亿级别):这样的数据量 mysql 是没法有效存储的。
再简单聊一下分析:用大数据技术,你要考虑分布式海量数据存储,大规模分布式并行计算,要理解Hadoop和Spark底层的复杂技术原理,解决各种大数据场景下出现的问题,最后才能针对海量数据(10亿、100亿级别甚至以上)产出一些普通的业务报表和分析报告。

好了,总结一下:单从做报表分析来说,海量数据的报表分析也不简单 - 而这,用传统的java web技术也根本做不到?数据没法存,更没法快速的取。但是,这张报表的业务价值很大?有多少用户在使用我们的美的金融app、使用频率等数据指标,产品运营人员是肯定需要掌握的。


业务上

这里结合魔分产品的一个核心功能‘渠道分析’来简单聊一下
渠道分析 – 降低产品推广成本

渠道产品或者说渠道团队的梦想是什么?大胆猜测一下:让更多的有效用户使用美的金融app与pc(这样就可能贷更多的钱粗去从而赚更多的钱啦)!
现实来了:怎么获取、吸引更多的用户使用渠道的产品呢?要打广告,要宣传,专业一点的说法是:需要在 百度、广告联盟、社交媒体等等外部或者内部渠道投放广告。大家知道外部渠道广告的投放都是需要真金白银的支持,所以对获客渠道的分析至关重要,它直接决定我们能否将一定的预算效果最大化。比如,我现在广告预算是 10w,在百度、360还是其他渠道投放广告好呢?这个通过我们 ‘魔分’产品的渠道分析功能就可以知道:

这里写图片描述

说到这里,顺便发散一句,作为营销鼻祖的可口可乐,最近废除已执行24年的CMO(首席营销官),设立CGO - Chief Growth Officer ?首席增长官。




总 结


  1. 技术上:单从做报表分析来说,海量数据的报表分析也不简单 - 而这,用 java web技术也根本做不到?数据没法存,更没法快速的分析与展现。
  2. 业务上:渠道分析-魔镜的这个小功能能直接降低渠道产品的推广成本。

以上只是结合魔镜产品粗略地聊了一下大数据团队对渠道产品运营的重要意义。大家知道大数据的杀手锏是预测 - 关于这个话题,我们将在后续结合真实的业务场景与大家分享,敬请关注。


参 考

mysql海量数据的存储和访问 轶名
用户行为分析最重要的3个点 by 张溪梦
营销理论分析:为何首席增长官会取代首席营销官? by TalkingData 林逸飞


推荐阅读
  • 【转】腾讯分析系统架构解析
    TA(TencentAnalytics,腾讯分析)是一款面向第三方站长的免费网站分析系统,在数据稳定性、及时性方面广受站长好评,其秒级的实时数据更新频率也获得业界的认可。本文将从实 ... [详细]
  • 一次上线事故,30岁+的程序员踩坑经验之谈
    本文主要介绍了一位30岁+的程序员在一次上线事故中踩坑的经验之谈。文章提到了在双十一活动期间,作为一个在线医疗项目,他们进行了优惠折扣活动的升级改造。然而,在上线前的最后一天,由于大量数据请求,导致部分接口出现问题。作者通过部署两台opentsdb来解决问题,但读数据的opentsdb仍然经常假死。作者只能查询最近24小时的数据。这次事故给他带来了很多教训和经验。 ... [详细]
  • 大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记
    本文介绍了大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记,包括outputFormat接口实现类、自定义outputFormat步骤和案例。案例中将包含nty的日志输出到nty.log文件,其他日志输出到other.log文件。同时提供了一些相关网址供参考。 ... [详细]
  • ejava,刘聪dejava
    本文目录一览:1、什么是Java?2、java ... [详细]
  • mapreduce源码分析总结
    这篇文章总结的非常到位,故而转之一MapReduce概述MapReduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的ÿ ... [详细]
  • 本文介绍了在Win10上安装WinPythonHadoop的详细步骤,包括安装Python环境、安装JDK8、安装pyspark、安装Hadoop和Spark、设置环境变量、下载winutils.exe等。同时提醒注意Hadoop版本与pyspark版本的一致性,并建议重启电脑以确保安装成功。 ... [详细]
  • 本文介绍了在sqoop1.4.*版本中,如何实现自定义分隔符的方法及步骤。通过修改sqoop生成的java文件,并重新编译,可以满足实际开发中对分隔符的需求。具体步骤包括修改java文件中的一行代码,重新编译所需的hadoop包等。详细步骤和编译方法在本文中都有详细说明。 ... [详细]
  • Sleuth+zipkin链路追踪SpringCloud微服务的解决方案
    在庞大的微服务群中,随着业务扩展,微服务个数增多,系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来,实现请求链路跟踪。通过Feign调用和Request传递TraceId,将整个调用链路的服务日志归组合并,提供定位和追踪的功能。 ... [详细]
  • 2021最新总结网易/腾讯/CVTE/字节面经分享(附答案解析)
    本文分享作者在2021年面试网易、腾讯、CVTE和字节等大型互联网企业的经历和问题,包括稳定性设计、数据库优化、分布式锁的设计等内容。同时提供了大厂最新面试真题笔记,并附带答案解析。 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  • Maven构建Hadoop,
    Maven构建Hadoop工程阅读目录序Maven安装构建示例下载系列索引 序  上一篇,我们编写了第一个MapReduce,并且成功的运行了Job,Hadoop1.x是通过ant ... [详细]
  • Hadoop源码解析1Hadoop工程包架构解析
    1 Hadoop中各工程包依赖简述   Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。   GoogleCluster:ht ... [详细]
  • 关于MySQL92和99等值连接、非等值连接、自连接、外连接及多表查询的代码示例总结!一.MySQL92语法*1.内连接没有关联关系的数据是不在查询范围之内的*1 ... [详细]
  • vue.js的ui框架是什么
    小编给大家分享一下vue.js的ui框架是什么,希望大家阅读完这篇文章后大所收获,下面让我们一起去探讨吧!vue.js的ui框架有:Element、iview、vuetify、vu ... [详细]
author-avatar
龙猫123456
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有