热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

mysql求回购率_python循环执行mysql计算每个月的回购率+pyecharts画图+tableau画仪表盘...

查询订单表fromsqlalchemyimporttextimportpandasaspdfromsqlalchemyimportcreate_engineenginecreate

查询订单表from sqlalchemy import text

import pandas as pd

from sqlalchemy import create_engine

engine=create_engine('mysql+pymysql://账户名:密码@ip:端口号/库名')

sql = '''

select *

from demo.OrderList

limit 8

'''

df = pd.read_sql_query(sql, engine)

df

wAAACwAAAAAAQABAEACAkQBADs=

查询订单表.png

定义 回购率 = 在6月和7月都购物的会员数/ 6月的购物会员人数

先查询201606的购物会员sql = '''

select distinct memberid, substring(STime,1,7) as YearMonth

from demo.OrderList

where substring(STime,1,7)='2016-06' and memberid is not null

'''

df = pd.read_sql_query(sql, engine)

df.head(3)

wAAACwAAAAAAQABAEACAkQBADs=

6月份购物的会员.png

同理,得到201607的会员

wAAACwAAAAAAQABAEACAkQBADs=

7月分购物的会员.png

6月份和7月份的会员进行left join

学习一下left join,想一想为什么要用left join sql = '''

select * from

(

select distinct memberid as member_t1, substring(STime,1,7) as YearMonth_t1

from demo.OrderList

where substring(STime,1,7)='2016-06' and memberid is not null) t1

left join

(

select distinct memberid as member_t2, substring(STime,1,7) as YearMonth_t2

from demo.OrderList

where substring(STime,1,7)='2016-07' and memberid is not null) t2

on t1.member_t1 = t2.member_t2

'''

df = pd.read_sql_query(sql, engine)

df.head(6)

wAAACwAAAAAAQABAEACAkQBADs=

学习leftjoin.png

这样 7月份的购物会员表就只剩下和6月份的公共部分了

wAAACwAAAAAAQABAEACAkQBADs=

学习inner join.png

则两张表的会员都只有公共部分

根据业务需求, 需要用left join,于是使用count 计数公共会员数 (即回购的人数)和 6月份的购物会员数sql = '''

select t1.YearMonth_t1 as 上个月 , count(distinct t2.member_t2 )as 回购人数 ,count(distinct t1.member_t1) 当前月购物人数 ,

count(distinct t2.member_t2 )/count(distinct t1.member_t1) as 回购率

from

(

select distinct memberid as member_t1, substring(STime,1,7) as YearMonth_t1

from demo.OrderList

where substring(STime,1,7)='2016-06' and memberid is not null) t1

left join

(

select distinct memberid as member_t2, substring(STime,1,7) as YearMonth_t2

from demo.OrderList

where substring(STime,1,7)='2016-07' and memberid is not null) t2

on t1.member_t1 = t2.member_t2

group by t1.YearMonth_t1

'''

df = pd.read_sql_query(sql, engine)

df.head(6)

wAAACwAAAAAAQABAEACAkQBADs=

回购率计算.png

这样就得到了单个月的回购人数

下面利用python循环求出每个月的回购率import arrow

start = arrow.get('2016-01','YYYY-MM')

end = arrow.get('2017-12','YYYY-MM')

month_list =[each.format('YYYY-MM') for each in arrow.Arrow.range('month', start, end)]

month_list

df_col =['上个月','回购人数','当前月购物人数','回购率']

df_final = pd.DataFrame(columns=df_col)

for i in range(0,len(month_list)-1,1):

YearMonth_AIM_FORMER = month_list[i]

YearMonth_AIM_NOW = month_list[i+1]

sql = '''

select t1.YearMonth_t1 as 上个月 , count(distinct t2.member_t2 )as 回购人数 ,count(distinct t1.member_t1) 当前月购物人数 ,

count(distinct t2.member_t2 )/count(distinct t1.member_t1) as 回购率

from

(

select distinct memberid as member_t1, substring(STime,1,7) as YearMonth_t1

from demo.OrderList

where substring(STime,1,7)='{0}' and memberid is not null) t1

left join

(

select distinct memberid as member_t2, substring(STime,1,7) as YearMonth_t2

from demo.OrderList

where substring(STime,1,7)='{1}' and memberid is not null) t2

on t1.member_t1 = t2.member_t2

group by t1.YearMonth_t1;

'''.format(YearMonth_AIM_FORMER,YearMonth_AIM_NOW)

#print(YearMonth_AIM_NOW)

df = pd.read_sql_query(sql, engine)

df_final= df_final.append(df,ignore_index=True)

#print(df)df_final.to_csv('回购率.csv',encoding='utf_8_sig')

df_final

wAAACwAAAAAAQABAEACAkQBADs=

每个月的回购率.png

使用pyecharts画图# 官方0.5版本文档 https://05x-docs.pyecharts.org/#/zh-cn/themes

## pip install echarts-themes-pypkg 安装主题

from pyecharts import configure

# 将这行代码置于首部

configure(global_theme="dark")

import pyecharts

from pyecharts import Overlap, Bar, Line, Grid, EffectScatter

grid = Grid()

#grid.use_theme("dark")

v1 = list( df_final.tail(23)['当前月购物人数'].values)

v2 = list(df_final.tail(23)['回购人数'].values)

v3 = list( df_final.tail(23)['回购率'].values*100) #

my_attr = list(df_final.tail(23)['上个月'].values) # ["{}号".format(i) for i in range(1, len(v1)+1)] #attr =

bar = Bar(title="DeepWind超市(南沙区)回购率", title_pos="20%")

bar.add("当前月购物人数", my_attr, v1)

bar.add("回购人数",my_attr,v2,yaxis_formatter=" 人",

yaxis_max=5200,

legend_pos="25%",

legend_orient="horizontal",

legend_top="15%",

)

overlap = Overlap(回购率",my_attr,v3,yaxis_formatter=" %",yaxis_max=100)

es = EffectScatter()

#overlap = Overlap(", my_attr, v3, effect_scale=8,is_add_yaxis=True, yaxis_index=1,yaxis_max=4000)

#overlap.add(es)

grid.add(overlap, grid_right="20%")

grid.render()

overlap.render()

#bar

grid

#overlap

wAAACwAAAAAAQABAEACAkQBADs=

图.png

使用tableau画出仪表盘

wAAACwAAAAAAQABAEACAkQBADs=

tableau回购率仪表盘.png

https://www.jianshu.com/p/ee16baa0fdc3



推荐阅读
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • MySQL多表数据库操作方法及子查询详解
    本文详细介绍了MySQL数据库的多表操作方法,包括增删改和单表查询,同时还解释了子查询的概念和用法。文章通过示例和步骤说明了如何进行数据的插入、删除和更新操作,以及如何执行单表查询和使用聚合函数进行统计。对于需要对MySQL数据库进行操作的读者来说,本文是一个非常实用的参考资料。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 高质量SQL书写的30条建议
    本文提供了30条关于优化SQL的建议,包括避免使用select *,使用具体字段,以及使用limit 1等。这些建议是基于实际开发经验总结出来的,旨在帮助读者优化SQL查询。 ... [详细]
  • 本文介绍了iOS数据库Sqlite的SQL语句分类和常见约束关键字。SQL语句分为DDL、DML和DQL三种类型,其中DDL语句用于定义、删除和修改数据表,关键字包括create、drop和alter。常见约束关键字包括if not exists、if exists、primary key、autoincrement、not null和default。此外,还介绍了常见的数据库数据类型,包括integer、text和real。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • 本文详细介绍了如何使用MySQL来显示SQL语句的执行时间,并通过MySQL Query Profiler获取CPU和内存使用量以及系统锁和表锁的时间。同时介绍了效能分析的三种方法:瓶颈分析、工作负载分析和基于比率的分析。 ... [详细]
  • 本文介绍了在MySQL8.0中如何查看性能并解析SQL执行顺序。首先介绍了查询性能工具的开启方法,然后详细解析了SQL执行顺序中的每个步骤,包括from、on、join、where、group by、having、select distinct、union、order by和limit。同时还介绍了虚拟表的概念和生成过程。通过本文的解析,读者可以更好地理解MySQL8.0中的性能查看和SQL执行顺序。 ... [详细]
  • 本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期,包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时,还介绍了一段使用正则表达式的代码,可以支持中文日期和一些特殊的时间识别,例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]
  • 模板引擎StringTemplate的使用方法和特点
    本文介绍了模板引擎StringTemplate的使用方法和特点,包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时,还介绍了StringTemplate语法中的属性和普通字符的使用方法,并提供了向模板填充属性的示例代码。 ... [详细]
  • Android源码中的Builder模式及其作用
    本文主要解释了什么是Builder模式以及其作用,并结合Android源码来分析Builder模式的实现。Builder模式是将产品的设计、表示和构建进行分离,通过引入建造者角色,简化了构建复杂产品的流程,并且使得产品的构建可以灵活适应变化。使用Builder模式可以解决开发者需要关注产品表示和构建步骤的问题,并且当构建流程发生变化时,无需修改代码即可适配新的构建流程。 ... [详细]
  • Mysql调优的顺序及面试问题总结
    文章目录一、调优相关1.第一步:本地explain线上查询遇到的第一个坑:遇到的第二个坑:2.第二步:覆盖索引3.第三步&# ... [详细]
author-avatar
衢江大道
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有