热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

如何将数据分析的时效性提升30倍?

本文作者:桂陈我们常说的数据分析时效性,是指数据从产生到执行分析的时间差,例如本月产生的数据,在经过清洗和处理后ÿ

本文作者:桂陈

我们常说的数据分析时效性,是指数据从产生到执行分析的时间差,例如本月产生的数据,在经过清洗和处理后,在下月初提供给业务方进行分析。过低的时效性可能无法满足业务需求,例如某企业的服务部署在多个云平台上,由于云平台的账单数据多而杂,该企业每月手动统计汇总并分析一次云成本数据,这种情况下,可能出现云上账单金额激增企业却感知不到的情况。

在之前的通过图形化界面,两步创建一个指标_Kyligence的博客-CSDN博客中,我们知道可以通过 Kyligence Zen 快速搭建一站式云端指标中台,实现实时的云成本管理,那么在这篇博客中,我们将介绍如何结合 S3 存储桶和 Kyligence Zen 对增量数据的支持特性,将数据分析时效性从月提升至天

Image by our-team on Freepik

 首先,我们在 Kyligence 的数据页面中,选择数据源为 Amazon S3,根据右侧配置向导完成授权并填写存储桶、文件路径等信息。

Amazon S3 配置 图片来源 Kyligence Zen

接下来,我们需要前往云平台中创建每天自动生成云账单的任务,以亚马逊云平台为例,我们可以创建云成本和使用率报告,让云平台每天生成云账单数据并存储为 CSV 文件。此处填写的存储桶可以和上一步的一致,同时推荐采用不同的文件路径来存储原始账单文件。

由于原生的云账单数据包含数据非常繁杂,我们可以利用 Amazon Glue 或者开源工具 Byzer 对数据进行清洗和处理(受限于篇幅不展开介绍),保留我们关心的业务数据,然后将加工好的数据保存为一个新文件,将其每天定时上传至作为 Kyligence Zen 数据源的 Amazon S3 对应路径中,整体的数据流转流程如下图所示。

至此,我们已经搭建好了数据流转流程,云账单数据每天会定期存放至 Amazon S3 中,而在执行数据分析时,Kyligence Zen 会自动检索 S3 存储桶路径中的 CSV 文件,并将其视为一个整体执行查询,从而将数据分析的时效性从月提升至天,当然更高的时效性(如小时)也可以参照此流程实现。

Kyligence Zen 提供了免费试用,欢迎前往 Kyligence Zen 官网试用,如您有任何疑问或者有好的想法,欢迎留言交流!


点击下载文中提到的数据集 csv 文件和指标定义文件。

KyligenceZen企业云成本管控北极星指标、指标yaml文件及数据csv文件-统计分析文档类资源-CSDN下载



推荐阅读
  • 本文总结了使用不同方式生成 Dataframe 的方法,包括通过CSV文件、Excel文件、python dictionary、List of tuples和List of dictionary。同时介绍了一些注意事项,如使用绝对路径引入文件和安装xlrd包来读取Excel文件。 ... [详细]
  • 数据对比分析图PPT(127.0.0.1表示什么)的使用方法和意义
    本文介绍了数据对比分析图PPT的使用方法和意义,解释了127.0.0.1的含义,并提供了相关资源下载。同时还讨论了目标管理的概念和MBO的实施方法。 ... [详细]
  • 动量|收益率_基于MT策略的实战分析
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了基于MT策略的实战分析相关的知识,希望对你有一定的参考价值。基于MT策略的实战分析 ... [详细]
  • 一、概述nmon是一种在AIX与各种Linux操作系统上广泛使用的监控与分析工具,相对于其它一些系统资源监控工具来说,nmon所记录的信息是比较全面的 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • 本文讨论了在手机移动端如何使用HTML5和JavaScript实现视频上传并压缩视频质量,或者降低手机摄像头拍摄质量的问题。作者指出HTML5和JavaScript无法直接压缩视频,只能通过将视频传送到服务器端由后端进行压缩。对于控制相机拍摄质量,只有使用JAVA编写Android客户端才能实现压缩。此外,作者还解释了在交作业时使用zip格式压缩包导致CSS文件和图片音乐丢失的原因,并提供了解决方法。最后,作者还介绍了一个用于处理图片的类,可以实现图片剪裁处理和生成缩略图的功能。 ... [详细]
  • php支持中文文件名
    2019独角兽企业重金招聘Python工程师标准大家可能遇到过上传中文文件名的文件,或者读取中文目录时不能读取,出现错误的情况这种情况是因为php自动将中文字符转成了utf8 ... [详细]
  • 集成电路企业在进行跨隔离网数据交换时面临着安全性问题,传统的数据交换方式存在安全性堪忧、效率低下等问题。本文以《Ftrans跨网文件安全交换系统》为例,介绍了如何通过丰富的审批流程来满足企业的合规要求,保障数据交换的安全性。 ... [详细]
  • 阿里云虚拟主机安装多个织梦系统的方法
    本文介绍了在阿里云虚拟主机上安装多个织梦系统的方法。通过创建不同名称的文件夹并将不同的域名解析到对应的目录,可以实现多个系统的安装。在安装过程中需要注意修改数据库前缀,并在系统设置中还原数据库。同时还介绍了阿里云虚拟主机二级域名绑定二级目录和域名重定向的用法。 ... [详细]
  • 本文详细介绍了git常用命令及其操作方法,包括查看、添加、提交、删除、找回等操作,以及如何重置修改文件、抛弃工作区修改、将工作文件提交到本地暂存区、从版本库中删除文件等。同时还介绍了如何从暂存区恢复到工作文件、恢复最近一次提交过的状态,以及如何合并多个操作等。 ... [详细]
  • SpringMVC接收请求参数的方式总结
    本文总结了在SpringMVC开发中处理控制器参数的各种方式,包括处理使用@RequestParam注解的参数、MultipartFile类型参数和Simple类型参数的RequestParamMethodArgumentResolver,处理@RequestBody注解的参数的RequestResponseBodyMethodProcessor,以及PathVariableMapMethodArgumentResol等子类。 ... [详细]
  • 小程序自动授权和手动接入的方式及操作步骤
    本文介绍了小程序支持的两种接入方式:自动授权和手动接入,并详细说明了它们的操作步骤。同时还介绍了如何在两种方式之间切换,以及手动接入后如何下载代码包和提交审核。 ... [详细]
author-avatar
花颖年华
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有