热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MySQL/MariaDB如何实现数据透视表原创

原标题:MySQL/MariaDB如何实现数据透视表原创

原标题:MySQL/MariaDB 如何实现数据透视表
原创

pivot


文章目录



    • 使用 CASE 表达式和分组聚合

    • 使用预编译的动态 SQL 语句

    • 使用 CONNECT 存储引擎


大家好,我是只谈技术不剪发的 Tony 老师。前文介绍了 Oracle 中实现数据透视表的几种方法,今天我们来看看在 MySQL/MariaDB 中如何实现相同的功能。

?本文使用的示例数据可以点此下载。



使用 CASE 表达式和分组聚合

数据透视表的本质就是按照行和列的不同组合进行数据分组,然后对结果进行汇总;因此,它和数据库中的分组(GROUP BY)加聚合函数(COUNT、SUM、AVG 等)的功能非常类似。

我们首先使用以下 GROUP BY 子句对销售数据进行分类汇总:

select coalesce(product, '【全部产品】') "产品",
coalesce(channel, '【所有渠道】') "渠道",
any_value(coalesce(extract(year_month from saledate), '【所有月份】')) "月份",
sum(amount) "销量"
from sales_data
group by product,channel,extract(year_month from saledate) with rollup;

以上语句按照产品、渠道以及月份进行汇总;with rollup 选项用于生成不同层次的小计、合计以及总计;coalesce 函数用于将汇总行中的 NULL 值显示为相应的信息;any_value 函数用于返回分组内的任意数据,如果去掉会返回语法错误(MySQL 的一个 bug)。该查询返回的结果如下:

产品 |渠道 |月份 |销量 |
---------|---------|-----------|-------|
桔子 |京东 |201901 | 41289|
桔子 |京东 |201902 | 43913|
桔子 |京东 |201903 | 49803|
桔子 |京东 |201904 | 49256|
桔子 |京东 |201905 | 64889|
桔子 |京东 |201906 | 62649|
桔子 |京东 |【所有月份】| 311799|
桔子 |店面 |201901 | 41306|
桔子 |店面 |201902 | 37906|
桔子 |店面 |201903 | 48866|
桔子 |店面 |201904 | 48673|
桔子 |店面 |201905 | 58998|
桔子 |店面 |201906 | 58931|
桔子 |店面 |【所有月份】| 294680|
桔子 |淘宝 |201901 | 43488|
桔子 |淘宝 |201902 | 37598|
桔子 |淘宝 |201903 | 48621|
桔子 |淘宝 |201904 | 49919|
桔子 |淘宝 |201905 | 58530|
桔子 |淘宝 |201906 | 64626|
桔子 |淘宝 |【所有月份】| 302782|
桔子 |【所有渠道】|【所有月份】| 909261|
...
香蕉 |【所有渠道】|【所有月份】| 925369|
【全部产品】|【所有渠道】|【所有月份】|2771682|

实际上,我们已经得到了销量的汇总结果,只不过需要将数据按照不同月份显示为不同的列;也就是需要将行转换为列,这个功能可以使用 CASE 表达式实现:

select coalesce(product, '【全部产品】') "产品", coalesce(channel, '【所有渠道】') "渠道",
sum(case extract(year_month from saledate) when 201901 then amount else 0 end) "一月",
sum(case extract(year_month from saledate) when 201902 then amount else 0 end) "二月",
sum(case extract(year_month from saledate) when 201903 then amount else 0 end) "三月",
sum(case extract(year_month from saledate) when 201904 then amount else 0 end) "四月",
sum(case extract(year_month from saledate) when 201905 then amount else 0 end) "五月",
sum(case extract(year_month from saledate) when 201906 then amount else 0 end) "六月",
sum(amount) "总计"
from sales_data
group by product, channel with rollup;

第一个 SUM 函数中的 CASE 表达式只汇总 201901 月份的销量,其他月份销量设置为 0;后面的 SUM 函数依次类推,得到了每个月的销量汇总和所有月份的总计。该查询返回的数据透视表如下:

产品 |渠道 |一月 |二月 |三月 |四月 |五月 |六月 |总计 |
----------|----------|------|------|------|------|------|------|-------|
桔子 |京东 | 41289| 43913| 49803| 49256| 64889| 62649| 311799|
桔子 |店面 | 41306| 37906| 48866| 48673| 58998| 58931| 294680|
桔子 |淘宝 | 43488| 37598| 48621| 49919| 58530| 64626| 302文章来源地址39715.html782|
桔子 |【所有渠道】|126083|119417|147290|147848|182417|186206| 909261|
苹果 |京东 | 38269| 40593| 56552| 56662| 64493| 62045| 318614|
苹果 |店面 | 43845| 40539| 44909| 55646| 56771| 64933| 306643|
苹果 |淘宝 | 42969| 43289| 48769| 58052| 58872| 59844| 311795|
苹果 |【所有渠道】|125083|124421|150230|170360|180136|186822| 937052|
香蕉 |京东 | 36879| 36981| 51748| 54801| 64936| 60688| 306033|
香蕉 |店面 | 41210| 39420| 50884| 52085| 60249| 67597| 311445|
香蕉 |淘宝 | 42468| 41955| 52780| 54971| 56504| 59213| 307891|
香蕉 |【所有渠道】|120557|118356|155412|161857|181689|187498| 925369|
【全部产品】|【所有渠道】|371723|362194|452932|480065|544242|560526|2771682|

?MySQL 中的 IF(expr1,expr2,expr3) 函数也可以用于替换上面 CASE 表达式。

有行转列就有列转行,MySQL 也没有专门的函数处理这种情况,可以使用 UNION 操作符将多个结果集进行合并。例如:

with d as (
select product, channel,
sum(case extract(year_month from saledate) when 201901 then amount else 0 end) s01,
sum(case extract(year_month from saledate) when 201902 then amount else 0 end) s02,
sum(case extract(year_month from saledate) when 201903 then amount else 0 end) s03,
sum(case extract(year_month from saledate) when 201904 then amount else 0 end) s04,
sum(case extract(year_month from saledate) when 201905 then amount else 0 end) s05,
sum(case extract(year_month from saledate) when 201906 then amount else 0 end) s06
from sales_data
group by product, channel
)
select product, channel, 201901 saledate, s01 amount from d
union all
select product, channel, 201902 sale文章来源地址39715.htmldate, s02 from d
union all
select product, channel, 201903 saledate, s03 from d
union all
select product, channel, 201904 saledate, s04 from d
union all
select product, channel, 201905 saledate, s05 from d
union all
select product, channel, 201906 saledate, s06 from d;

通用表表达(with 子句)构造了包含多个月份的销量数据,每个月份都是一列;然后每个查询返回一个月份的数据,并且通过 union all 操作符将所有结果合并到一起。


使用预编译的动态 SQL 语句

使用 CASE 表达式和聚合函数实现数据透视表的方法存在一定的局限性,假如还有 7 月份到 12 月份的销量需要统计,我们就需要修改查询语句增加这部分的处理。为此,我们可以使用动态 SQL 自动生成行列转换的语句:

select group_concat(
distinct concat(
' sum(case extract(year_month from saledate) when ', dt,
' then amount else 0 end) as "', dt, '"')
) into @sql
from (
select extract(year_month from saledate) as dt
from sales_data
order by saledate
) d;
set @sql
= concat('select coalesce(product, ''【全部产品】'') "产品", coalesce(channel, ''【所有渠道】'') "渠道",', @sql,
', sum(amount) "总计"
from sales_data
group by product, channel with rollup;'
);
select @sql;
prepare stmt from @sql;
execute stmt;
deallocate prepare stmt;

首先,通过查询 sales_data 表找出所有的月份并且构造 sum 函数,将构造的语句存入变量 @sql 中;group_concat 函数可以将多行字符串合并成单个字符串。

?group_concat 函数允许返回的最大长度(字节)由系统变量 group_concat_max_len 进行设置,默认值为 1024。

然后,使用 set 命令将查询语句的其他部分和已有的内容进行合并,生成的查询语句如下:

select coalesce(product, '【全部产品】') "产品", coalesce(channel, '【所有渠道】') "渠道",
sum(case extract(year_month from saledate) when 201901 then amount else 0 end) as "201901",
sum(case extract(year_month from saledate) when 201902 then amount else 0 end) as "201902",
sum(case extract(year_month from saledate) when 201903 then amount else 0 end) as "201903",
www.yii666.com sum(case extract(year_month from saledate) when 201904 then amount else 0 end) as "201904",
sum(case extract(year_month from saledate) when 201905 then amount else 0 end) as "201905",
sum(case extract(year_month from saledate) when 201906 then amount else 0 end) as "201906",
sum(amount) "总计"
from sales_data
group by product, channel with rollup;

最后通过预编译命令执行该语句并返回结果,即使增加了其他月份的销售数据也不需要手动修改查询语句。


使用 CONNECT 存储引擎

如果使用 MariaDB 10.0 以上的版本,可以利用 CONNECT 存储引擎中的 PIVOT 表类型实现数据透视表。

首先,我们需要安装 CONNECT 存储引擎。Windows 系统可以执行以下命令进行动态安装:

INSTALL SONAME 'ha_connect';

也可以在配置文件 my.ini 中增加以下内容,不过需要重启服务:

[mysqld]
plugin_load_add = ha_connect

?对于 Linux 系统,安装过程可以参考官方文档。

接下来我们定义一个 pivot 类型的表:

create table pivot_sales(
product varchar(20) not null,
channel varchar(20) not null,
`201901` decimal(10,2) not null flag=1,
`201902` decimal(10,2) not null flag=1,
`201903` decimal(10,2) not null flag=1,
`201904` decimal(10,2) not null flag=1,
`201905` decimal(10,2) not null flag=1,
`201906` decimal(10,2) not null flag=1
)
engine=connect table_type=pivot
option_list='PivotCol=saledate,FncCol=amount,host=127.0.0.1,user=root, password=p123456,port=3306'
SrcDef='select product,channel,date_format(saledate, ''%Y%m'') saledate,sum(amount) amount from sales_data group by product,channel,date_format(saledate, ''%Y%m'')';

其中,engine 定义存储引擎为 connect;table_type 定义表的类型为 pivot;option_list 用于定义各种选项,PivotCol 表示要转换成多个字段的数据所在的列,FncCol 指定要进行汇总的字段,其他是连接源表服务器的信息;SrcDef 用于指定源表查询语句,也可以使用 Tabname 指定表名;上面的字段是透视表的结构,flag=1 表示聚合之后的字段。

创建成功之后,我们就可以直接查询 pivot_sales 表中的数据了:

select * from pivot_s文章来源站点https://www.yii666.com/ales;
product |channel |201901 |201902 |201903 |201904 |201905 |201906 |
--------|---------|--------|--------|--------|--------|--------|--------|
桔子 |京东 |41289.00|43913.00|49803.00|49256.00|648www.yii666.com89.00|62649.00|
桔子 |店面 |41306.00|37906.00|48866.00|48673.00|58998.00|58931.00|
桔子 |淘宝 |43488.00|37598.00|48621.00|49919.00|58530.00|64626.00|
苹果 |京东 |38269.00|40593.00|56552.00|56662.00|64493.00|62045.00|
苹果 |店面 |43845.00|40539.00|44909.00|55646.00|56771.00|64933.00|
苹果 |淘宝 |42969.00|43289.00|48769.00|58052.00|58872.00|59844.00|
香蕉 |京东 |36879.00|36981.00|51748.00|54801.00|64936.00|60688.00|
香蕉 |店面 |41210.00|39420.00|50884.00|52085.00|60249.00|67597.00|
香蕉 |淘宝 |42468.00|41955.00|52780.00|54971.00|56504.00|59213.00|

目前,PIVOT 表支持的功能有限,只能进行一些基本的操作。例如:

-- 不会出错
select * from pivot_sales
where channel ='京东';
-- 语法错误
select channel from pivot_sales
where channel ='京东';

如果觉得文章对你有用,欢迎关注❤️、评论?、点赞?!

来源于:MySQL/MariaDB 如何实现数据透视表
原创


推荐阅读
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • Oracle Database 10g许可授予信息及高级功能详解
    本文介绍了Oracle Database 10g许可授予信息及其中的高级功能,包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明,指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • Oracle分析函数first_value()和last_value()的用法及原理
    本文介绍了Oracle分析函数first_value()和last_value()的用法和原理,以及在查询销售记录日期和部门中的应用。通过示例和解释,详细说明了first_value()和last_value()的功能和不同之处。同时,对于last_value()的结果出现不一样的情况进行了解释,并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • HDU 2372 El Dorado(DP)的最长上升子序列长度求解方法
    本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法,通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • 本文详细介绍了Spring的JdbcTemplate的使用方法,包括执行存储过程、存储函数的call()方法,执行任何SQL语句的execute()方法,单个更新和批量更新的update()和batchUpdate()方法,以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]
  • 高质量SQL书写的30条建议
    本文提供了30条关于优化SQL的建议,包括避免使用select *,使用具体字段,以及使用limit 1等。这些建议是基于实际开发经验总结出来的,旨在帮助读者优化SQL查询。 ... [详细]
  • 本文讨论了在数据库打开和关闭状态下,重新命名或移动数据文件和日志文件的情况。针对性能和维护原因,需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况,以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]
  • ALTERTABLE通过更改、添加、除去列和约束,或者通过启用或禁用约束和触发器来更改表的定义。语法ALTERTABLEtable{[ALTERCOLUMNcolu ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • CentOS 7部署KVM虚拟化环境之一架构介绍
    本文介绍了CentOS 7部署KVM虚拟化环境的架构,详细解释了虚拟化技术的概念和原理,包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]
author-avatar
骑马的仓鼠
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有