当前位置: 开发笔记 > 编程语言 > 正文

如何处理计量计费日志？

作者：mobiledu2502904893 | 来源：互联网 | 2023-10-11 17:02

使用云服务最大好处是按量付费，无需预留资源，因此各云产品都有计量计费需求。这里我们介绍一种基于日志服务计量计费方案，该方案每天处理千亿级计量日志，被众多云产品使用：

使用云服务最大好处是按量付费，无需预留资源，因此各云产品都有计量计费需求。这里我们介绍一种基于
日志服务计量计费方案，该方案每天处理千亿级计量日志，被众多云产品使用：

计量日志生成计费结果过程

计量日志记录了用户涉及计费的项目，后台计费模块根据计费项和规则进行运算，产生最后账单。例如如下原始访问日志记录了项目（Project）使用情况：

microtime:1457517269818107 Method:PostLogStoreLogs Status:200 Source:10.145.6.81 ClientIP:112.124.143.241 Latency:1968 InFlow:1409 NetFlow:474 OutFlow:0 UserId:44 AliUid:1264425845278179 ProjectName:app-myapplication ProjectId:573 LogStore:perf UserAgent:ali-sls-logtail APIVersion:0.5.0 RequestId:56DFF2D58B3D939D691323C7

计量计费程序读取原始日志，根据规则生成用户在各维度使用数据（包括流量、使用次数、出流量等）：

让我们看下几个计量日志计费场景：

电力公司：每10秒会收到一条日志，记录该10秒内每个用户ID下该周期内功耗、峰值、均值等，每天、每小时和每月给用户提供账单

运营商：每隔10秒从基站收到时间段内某个手机号码的动作（上网、电话、短信、VoIP），使用量（流量），时长等信息，后台计费服务统计出该区间内消耗资费

天气预测API服务：根据用户调用接口类型、城市、查询类型、结果大小等对用户请求进行收费

要求与挑战

既要算对，又要算准是一件要求很高的事情，系统要求如下：

准确可靠：多算用户吃亏，少算我们吃亏

灵活：支持补数据等场景，例如一部分数据没有推过来，当需要修正时可以重新计算

实时性强：能够做到秒级计费，对于欠费场景快速切断

其他需求（Plus）：

账单修正功能：在实时计费失败时，我们可以通过理想计费进行对账

查询明细：支持用户查看自己消费明细

现实中还有两类不小的挑战：

不断增长数据大量：随着用户以及调用上升，数据规模会越来越大，如何保持架构的弹性伸缩

容错处理：计费程序可能有Bug，如何确保计量数据与计费程序独立

这里我们讨论一种阿里云基于日志服务开发计量计费方案，该方案已在线上稳定运行多年，从未出现过一粒算错，延迟等情况，供单价参考

系统架构

以
阿里云日志服务的LogHub功能为例：

使用LogHub进行计量日志实时采集与计量程序对接：LogHub 支持的30+种API和接入手段，接入计量日志非常容易

计量程序每隔固定时间消费LogHub中步长数据，在内存中计算结果生成计费数据

（附加）对明细数据查询需求，可以将计量日志配置索引查询

（附加）将计量日志推送至OSS、MaxCompute进行离线存储，进行T+1等对账与统计

实时计量程序内部结构：

根据LogHub读取接口GetCursor功能，选定某个时间段日志（例如10：00-11：00）Cursor

通过PullLogs接口消费该时间段内数据

在内存中进行数据统计与计算，拿到结果，生成计费数据
(我们可以以此类推，把选择时间计算逻辑修改为1分钟，10秒钟等)

性能分析：

假设有10亿条/天计量日志，每条长度为200字节，数据量为200GB

LogHub 默认SDK或Agent都带压缩功能，实际存储数据量为40GB（一般至少有5倍压缩率），一个小时数据量为40/24 = 1.6GB

LogHub读取接口一次最大支持读1000个包（每个包最大为5MB），在千兆网条件下2秒内即可读完

加上内存中数据累计与计算时间，对1小时计量日志进行汇总，不超过5秒

数据量大如何解决，例如一天十万亿

在一些计费场景下（例如运营商、IoT等）计量日志量会很大（例如十万亿，数据量为2PB/Day)，折算压缩数据后一小时有16TB，以万兆网络读取需要1600秒，已不能满足快速出账单需求。
这里一般使用2种手段：

1. 控制产生的计费数据量

我们对于产生计量日志程序进行改造（例如Nginx），先在内存中做了聚合，每隔1分钟Dump一次该时间段聚合的汇总计量日志结果。这样数据量就和总体的用户数相关了：假设Nginx该时间段内有1000个用户，一个小时数据点也才1000
200 60 = 12GB（压缩后为 240 MB）

5. 将计量日志处理并行化

LogHub下每个日志库可以分配不同Shard（分区），我们可以分配3个分区，3个计量消费程序。为了保证一个用户计量数据总是由一个消费程序处理，我们可以根据用户ID Hash到固定Shard中。例如杭州市西湖区用户写在1号Shard，杭州上城区用户数据写在2号Shard，这样后台计量程序就可水平扩展。

其他问题

1.补数据怎么办？

LogHub 下每个Logstore可以设置生命周期（1-365天），如果计费程序需要重新消费数据，在生命周期内可以任意根据时间段进行计算。

2. 计量日志散落在很多服务器（前端机）怎么办

使用Logtail Agent实时采集

使用机器标示定义一套动态机器组弹性伸缩

3. 查询明细需求如何满足

对LogHub中数据可以
创建索引，支持
实时查询与
统计分析，例如我们想调查有一些特别大的计量日志：

Inflow>300000 and Method=Post* and Status in [200 300]

在对Loghub中数据打开索引后，即可实时实时查询与分析

也可以在查询后加上统计分析：

Inflow>300000 and Method=Post* and Status in [200 300] | select max(Inflow) as s, ProjectName group by ProjectName order by s desc

4. 存储日志并进行T+1对账

日志服务提供LogHub中
数据投递功能，支持自定义分区、自定义存储格式等将日志存储在OSS/MaxCompute上，利用E-MapReduce、MaxCompute、HybridDB、Hadoop、Hive、Presto、Spark等进行计算。

推荐阅读

char
Web动态服务器Python基本实现

Web动态服务器Python基本实现 ... [详细]

蜡笔小新 2024-11-21 08:01:30
io
解决Spring Cloud Eureka自定义端口时连接错误的问题

在尝试通过自定义端口部署Spring Cloud Eureka时遇到了连接失败的问题。本文详细描述了问题的现象，并提供了有效的解决方案，以帮助遇到类似情况的开发者。 ... [详细]

蜡笔小新 2024-11-20 13:05:47
char
Oracle 11g 创建表空间与基础配置

本文详细介绍了Oracle 11g中的创建表空间的方法，以及如何设置客户端和服务端的基本配置，包括用户管理、环境变量配置等。 ... [详细]

蜡笔小新 2024-11-21 18:54:39
md5
Oracle VM VirtualBox 使用指南：创建静态网页及高级功能

本文详细介绍了如何在Oracle VM VirtualBox中实现主机与虚拟机之间的数据交换，包括安装Guest Additions增强功能，以及如何利用这些功能进行文件传输、屏幕调整等操作。 ... [详细]

蜡笔小新 2024-11-21 18:13:22
jsp
SIP基础概览

本文介绍了SIP（Session Initiation Protocol，会话发起协议）的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]

蜡笔小新 2024-11-21 17:42:08
io
CentOS下ProFTPD的安装与配置指南

本文详细介绍在CentOS操作系统上安装和配置ProFTPD服务的方法，包括基本配置、安全设置及高级功能的启用。 ... [详细]

蜡笔小新 2024-11-21 09:45:56
range
深入理解：AJAX学习指南

本文详细探讨了AJAX的基本概念、工作原理及其在现代Web开发中的应用，旨在为初学者提供全面的学习资料。 ... [详细]

蜡笔小新 2024-11-20 17:58:54
search
深入解析 Bootstrap Table 的使用技巧

本文详细介绍了如何利用 Bootstrap Table 实现数据展示与操作，包括数据加载、表格配置及前后端交互等关键步骤。 ... [详细]

蜡笔小新 2024-11-20 17:21:26
io
如何在U8系统中连接服务器并获取数据

本文介绍了如何在U8系统中通过不同的方法连接服务器并获取数据，包括使用MySQL客户端连接实例的方法，如非SSL连接和SSL连接，并提供了详细的步骤和注意事项。 ... [详细]

蜡笔小新 2024-11-19 12:08:19
char
在 Ubuntu 22.04 LTS 上部署 Jira 敏捷项目管理工具

Jira 敏捷项目管理工具专为软件开发团队设计，旨在以高效、有序的方式管理项目、问题和任务。该工具提供了灵活且可定制的工作流程，能够根据项目需求进行调整。本文将详细介绍如何在 Ubuntu 22.04 LTS 上安装和配置 Jira。 ... [详细]

蜡笔小新 2024-11-19 09:56:22
io
Nginx 配置下 Chrome 和 Firefox 对静态资源缓存处理差异

在使用 Nginx 作为服务器时，发现 Chrome 能正确从缓存中读取 CSS 和 JS 文件，而 Firefox 却无法有效利用缓存，导致加载速度显著变慢。 ... [详细]

蜡笔小新 2024-11-21 19:57:43
io
Python 开发环境最佳实践：Anaconda + Jupyter Notebook 快速上手指南

对于初学者而言，搭建一个高效稳定的 Python 开发环境是入门的关键一步。本文将详细介绍如何利用 Anaconda 和 Jupyter Notebook 来构建一个既易于管理又功能强大的开发环境。 ... [详细]

蜡笔小新 2024-11-21 18:30:23
shell
设置Shadowsocks公共代理的关键步骤

本文详细介绍了如何正确设置Shadowsocks公共代理，包括调整超时设置、检查系统限制、防止滥用及遵守DMCA法规等关键步骤。 ... [详细]

蜡笔小新 2024-11-20 20:41:33
php
Windows环境下Apache频繁崩溃的解决方案

本文探讨了在Windows系统中运行Apache服务器时频繁出现崩溃的问题，并提供了多种可能的解决方案和建议。错误日志显示多个子进程因达到最大请求限制而退出。 ... [详细]

蜡笔小新 2024-11-20 13:07:27
io
Android SOAP 请求失败：服务器无法处理请求，参数值不能为空

在尝试使用 Android 发送 SOAP 请求时遇到错误，服务器返回 '无法处理请求' 的信息，并指出某个值不能为 null。本文探讨了可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-11-20 13:01:10

mobiledu2502904893

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章