数据分析真实案例：excel&sql&pandas实现数据透视表功能

作者： | 来源：互联网 | 2023-09-25 19:34

使用excel&sql&panda

一、案例背景

接到需求

事情是这样的，一个眼光明媚的早上，领导看到昨天PV增长明显，于是就提出了如下需求：

ok,get到需求后，立马行动起来！

分析需求

为什么pv会增长明显呢？首先，依据拆分的思想，网站有很多个板块，所以将总体pv拆分成n个板块（可以根据经验选择主要的板块进行分析），对这n个板块逐个进行分析；接着，由于孤数不立的原则：单看一天数据，无法判断具体哪个板块增长，哪个板块降低，因此，主要从日期、板块这两个维度进行分析。

根据分析结果提数

”无情的提数机器“来了！首先确定需要用到的表：只需要访问日志表。

原始数据形式

简单看一下日志表中我们需要的两个主要字段（日期、网页链接）：

目标数据形式

我们需要提出来的效果是这样的（数据当然不能给别人看咯）：

提数sql

太年轻的小菜我，紧急情况下，没想到用数据透视表，像个沙雕一样，写了屎一样的sql。（为了让大家引以为戒，我脸也不要了，展示出来吧）

没错，查9天的数据，我用了8个left join…

数据可视化形成报告

为了让别人一眼就能从这近1000条数据中看出来谁增高了，谁降低了，那必须画个图，然后根据图进行描述分析，得出结果。（这段不重要，就略过了）

二、使用数据透视表

用又臭又长的sql得出报告后，总觉得心里不舒服，怎么能写这么烂的sql，于是，突然想到了数据透视表。

excel实现数据透视表

excel实现数据透视表就比较理所当然啦，因为数据透视表就是excel里面的概念。

第一步：先直接简单的select查出近9天的数据并保存为excel

第二步：数据透视表的使用

好了，excel的数据透视表就是这么简单好用，顺便也出来图了，但是很丑，可以直接改改，或者copy数据自己用工具作图分析。

pandas实现数据透视表

第一步：先直接简单的select查出近9天的数据并保存为excel(如果本地可以直接连生产的数据库，可以直接pd.read_sql()一步到位获取数据)

第二步：实现pandas的数据透视表功能

import pandas as pd data = pd.read_excel('xxx.xlsx') data_result = pd.pivot_table(data, index=["page"], columns=["date"], values=["page"], aggfunc={"page": "count"}) print(data_result)

sql实现数据透视表功能

sql一步到位，为了保护隐私和更方便大家看方法，我就简化了一下sql，如下：

select page, count(case when date = '2020-07-01' then page end) as "2020-07-01", count(case when date = '2020-07-02' then page end) as "2020-07-02", count(case when date = '2020-07-03' then page end) as "2020-07-03", from table_test group by page

over!

推荐阅读

bit
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
import
Pythonmysql数据库

importpymysql#一、直接连接mysql数据库'''coonpymysql.connect(host'192.168.*.*',u ... [详细]

蜡笔小新 2024-11-12 16:51:59
import
python解决CSF布料模拟滤波的批处理问题（解决获取多个点云数据las数据）

解决问题：1、批量读取点云las数据2、点云数据读与写出3、csf滤波分类参考：https:github.comsuyunzzzCSF论文题目ÿ ... [详细]

蜡笔小新 2024-11-12 11:32:15
import
Python 序列图分割与可视化编程入门教程

本文介绍了如何使用 Python 进行序列图的快速分割与可视化。通过一个实际案例，详细展示了从需求分析到代码实现的全过程。具体包括如何读取序列图数据、应用分割算法以及利用可视化库生成直观的图表，帮助非编程背景的用户也能轻松上手。 ... [详细]

蜡笔小新 2024-11-11 07:14:26
import
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
import
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
import
Java DAO模式详解与代码示例

DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]

蜡笔小新 2024-11-13 12:25:33
import
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
import
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
import
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
import
使用Python和smtplib实现邮件发送功能

本文详细介绍了如何使用Python中的smtplib库来发送带有附件的邮件，并提供了完整的代码示例。作者：多测师_王sir，时间：2020年5月20日 17:24，微信：15367499889，公司：上海多测师信息有限公司。 ... [详细]

蜡笔小新 2024-11-12 12:21:27
import
检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0

检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]

蜡笔小新 2024-11-12 11:35:01
import
Go (Golang) 语言Golang 定时器Timer和Ticker、time.AfterFunc、time.NewTicker()实例

文章目录Golang定时器Timer和Tickertime.Timertime.NewTimer()实例time.AfterFunctime.Tickertime.NewTicke ... [详细]

蜡笔小新 2024-11-12 09:39:10
import
第二十五天接口、多态

1.java是面向对象的语言。设计模式：接口接口类是从java里衍生出来的，不是python原生支持的主要用于继承里多继承抽象类是python原生支持的主要用于继承里的单继承但是接 ... [详细]

蜡笔小新 2024-11-12 06:43:20
callback
Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨

在《Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨》中，详细介绍了Cocos2d-x的基础概念，并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解，例如在处理鱼的运动过程中，可以通过编写自定义函数来动态计算角度变化，利用CallFunc回调机制实现高效的游戏逻辑控制。此外，文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏，为开发者提供了实用的编程技巧和最佳实践。 ... [详细]

蜡笔小新 2024-11-11 14:49:31

Tags | 热门标签

RankList | 热门文章