热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开发笔记:Python图表数据可视化Seaborn:2.分类数据可视化

篇首语:本文由编程笔记#小编为大家整理,主要介绍了Python图表数据可视化Seaborn:2.分类数据可视化相关的知识,希望对你有一定的参考价值。

篇首语:本文由编程笔记#小编为大家整理,主要介绍了Python图表数据可视化Seaborn:2. 分类数据可视化相关的知识,希望对你有一定的参考价值。




1. 分类数据可视化 - 分类散点图

stripplot( ) / swarmplot( )

sns.stripplot(x="day",y="total_bill",data=tips,jitter = True, size = 5, edgecolor = \'w\',lineo\')

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
% matplotlib inline
sns.set_style(
"whitegrid")
sns.set_context(
"paper")
# 设置风格、尺度
import warnings
warnings.filterwarnings(
\'ignore\')
# 不发出警告


# 1、stripplot()
#
按照不同类别对样本数据进行分布散点图绘制

tips
= sns.load_dataset("tips")
print(tips.head())
# 加载数据
print(tips[\'day\'].value_counts())

sns.stripplot(x
="day", # x → 设置分组统计字段
y="total_bill", # y → 数据分布统计字段
# 这里xy数据对调,将会使得散点图横向分布
data=tips, # data → 对应数据
jitter = True, # jitter → 当点数据重合较多时,用该参数做一些调整,也可以设置间距如:jitter = 0.1
size = 5, edgecolor = \'w\',lineo\' # 设置点的大小、描边颜色或宽度、点样式
)


1.1 stripplot()

  hue参数可再分类


# 1、stripplot() 通过hue参数再分类

sns.stripplot(x
="sex", y="total_bill", hue="day",
data
=tips, jitter=True)


# 1、stripplot() 设置调色盘

sns.stripplot(x
="sex", y="total_bill", hue="day",
data
=tips, jitter=True,
palette
="Set2", # 设置调色盘
dodge=True, # 是否拆分
)


# 1、stripplot() 筛选分类类别
print(tips[\'day\'].value_counts())
# 查看day字段的唯一值

sns.stripplot(x
="day", y="total_bill", data=tips,jitter = True,
order
= [\'Sat\',\'Sun\'])
# order → 筛选类别


1.2 swarmplot()分簇散点图


# 2、swarmplot()
#
分簇散点图

sns.swarmplot(x
="total_bill", y="day", data=tips,
size
= 5, edgecolor = \'w\',lineo\',
palette
= \'Reds\')
# 用法和stripplot类似


2. 分类数据可视化 - 分布图

boxplot( ) / violinplot( ) / lvplot( ) 


 2.1 boxplot()箱型图

sns.boxplot(x="day", y="total_bill", data=tips,
linewidth = 2, # 线宽
width = 0.8, # 箱之间的间隔比例
fliersize = 3, # 异常点大小
palette = \'hls\', # 设置调色板
whis = 1.5, # 设置IQR
notch = True, # 设置是否以中值做凹槽
order = [\'Thur\',\'Fri\',\'Sat\',\'Sun\'], # 筛选类别

# 1、boxplot()
#
箱型图

sns.boxplot(x
="day", y="total_bill", data=tips,
linewidth
= 2, # 线宽
width = 0.8, # 箱之间的间隔比例
fliersize = 3, # 异常点大小
palette = \'hls\', # 设置调色板
whis = 1.5, # 设置IQR
notch = True, # 设置是否以中值做凹槽
order = [\'Thur\',\'Fri\',\'Sat\',\'Sun\'], # 筛选类别
)
# 绘制箱型图

sns.swarmplot(x
="day", y="total_bill", data=tips,color =\'k\',size = 3,alpha = 0.8)
# 可以添加散点图


# 1、boxplot() 通过hue参数再分类

sns.boxplot(x
="day", y="total_bill", data=tips,
hue
= \'smoker\', palette = \'Reds\')
# 绘制箱型图
#sns.swarmplot(x="day", y="total_bill", data=tips,color =\'k\',size = 3,alpha = 0.8)
#
可以添加散点图


2.2 violinplot()小提琴图

sns.violinplot(x="day", y="total_bill", data=tips,
linewidth = 2, # 线宽
width = 0.8, # 箱之间的间隔比例
palette = \'hls\', # 设置调色板
order = [\'Thur\',\'Fri\',\'Sat\',\'Sun\'], # 筛选类别
scale = \'area\', # 测度小提琴图的宽度:area-面积相同,count-按照样本数量决定宽度,width-宽度一样
gridsize = 50, # 设置小提琴图边线的平滑度,越高越平滑
inner = \'box\', # 设置内部显示类型 → “box”, “quartile”, “point”, “stick”, None
#bw = 0.8 # 控制拟合程度,一般可以不设置
)

# 2、violinplot() 小提琴图

sns.violinplot(x
="day", y="total_bill", data=tips,
linewidth
= 2, # 线宽
width = 0.8, # 箱之间的间隔比例
palette = \'hls\', # 设置调色板
order = [\'Thur\',\'Fri\',\'Sat\',\'Sun\'], # 筛选类别
scale = \'area\', # 测度小提琴图的宽度:area-面积相同,count-按照样本数量决定宽度,width-宽度一样
gridsize = 50, # 设置小提琴图边线的平滑度,越高越平滑
inner = \'box\', # 设置内部显示类型 → “box”, “quartile”, “point”, “stick”, None
#bw = 0.8 # 控制拟合程度,一般可以不设置
)
# 用法和boxplot类似


# 2、violinplot() 通过hue参数再分类

sns.violinplot(x
="day", y="total_bill", data=tips,
hue
= \'smoker\', palette="muted",
split
=True, # 设置是否拆分小提琴图
inner="quartile")

sns.violinplot()+ sns.swarmplot()小提琴图结合散点图

# 2、violinplot() 结合散点图

sns.violinplot(x
="day", y="total_bill", data=tips, palette = \'hls\', inner = None)
sns.swarmplot(x
="day", y="total_bill", data=tips, color="w", alpha=.5)
# 插入散点图


2.3 lvplot() LV图表

sns.lvplot(x="day", y="total_bill", data=tips, palette="mako",
#hue = \'smoker\',
width = 0.8, # 箱之间间隔比例
linewidth = 12,
scale = \'area\', # 设置框的大小 → “linear”、“exonential”、“area”
k_depth = \'proportion\', # 设置框的数量 → “proportion”、“tukey”、“trustworthy”
)

# 3、lvplot() LV图表

sns.lvplot(x
="day", y="total_bill", data=tips, palette="mako",
#hue = \'smoker\',
width = 0.8, # 箱之间间隔比例
linewidth = 12,
scale
= \'area\', # 设置框的大小 → “linear”、“exonential”、“area”
k_depth = \'proportion\', # 设置框的数量 → “proportion”、“tukey”、“trustworthy”
)
# 绘制LV图

sns.swarmplot(x
="day", y="total_bill", data=tips,color =\'k\',size = 3,alpha = 0.8)
# 可以添加散点图

 


3. 分类数据可视化 - 统计图

barplot( ) / countplot( ) / pointplot( )


3.1 barplot()柱状图

sns.barplot(x="sex", y="survived", hue="class", data=titanic,
palette = \'hls\',
order = [\'male\',\'female\'], # 筛选类别
capsize = 0.05, # 误差线横向延伸宽度
saturation=.8, # 颜色饱和度
errcolor = \'gray\',errwidth = 2, # 误差线颜色,宽度
ci = \'sd\' # 置信区间误差 → 0-100内值、\'sd\'、None
)

# 1、barplot()
#
柱状图 - 置信区间估计
#
置信区间:样本均值 + 抽样误差

titanic
= sns.load_dataset("titanic")
print(titanic.head())
print(\'-----\')
# 加载数据


sns.barplot(x="sex", y="survived", hue="class", data=titanic,
palette
= \'hls\',
order
= [\'male\',\'female\'], # 筛选类别
capsize = 0.05, # 误差线横向延伸宽度
saturation=.8, # 颜色饱和度
errcolor = \'gray\',errwidth = 2, # 误差线颜色,宽度
ci = \'sd\' # 置信区间误差 → 0-100内值、\'sd\'、None
)


print(titanic.groupby([\'sex\',\'class\']).mean()[\'survived\'])
print(titanic.groupby([\'sex\',\'class\']).std()[\'survived\'])
# 计算数据

 


# 1、barplot()
#
柱状图 - 置信区间估计

sns.barplot(x
="day", y="total_bill", hue="sex", data=tips,
palette
= \'Blues\',edgecolor = \'w\')
tips.groupby([
\'day\',\'sex\']).mean()
# 计算数据


# 1、barplot()
#
柱状图 - 置信区间估计

crashes
= sns.load_dataset("car_crashes").sort_values("total", ascending=False)
print(crashes.head())
# 加载数据

f, ax
= plt.subplots(figsize=(6, 15))
# 创建图表

sns.set_color_codes(
"pastel")
sns.barplot(x
="total", y="abbrev", data=crashes,
label
="Total", color="b",edgecolor = \'w\')
# 设置第一个柱状图

sns.set_color_codes(
"muted")
sns.barplot(x
="alcohol", y="abbrev", data=crashes,
label
="Alcohol-involved", color="b",edgecolor = \'w\')
# 设置第二个柱状图

ax.legend(ncol
=2, loc="lower right")
sns.despine(left
=True, bottom=True)


3.2 countplot()计数柱状图 

sns.countplot(x="class", hue="who", data=titanic,palette = \'magma\')

# 2、countplot() 计数柱状图

sns.countplot(x
="class", hue="who", data=titanic,palette = \'magma\')
#sns.countplot(y="class", hue="who", data=titanic,palette = \'magma\')
#
x/y → 以x或者y轴绘图(横向,竖向)
#
用法和barplot相似


3.3 pointplot()折线图


# 3、pointplot()
#
折线图 - 置信区间估计

sns.pointplot(x
="time", y="total_bill", hue = \'smoker\',data=tips,
palette
= \'hls\',
dodge
= True, # 设置点是否分开
join = True, # 是否连线
markers=["o", "x"], linestyles=["-", "--"], # 设置点样式、线型
)
tips.groupby([
\'time\',\'smoker\']).mean()[\'total_bill\']
# 计算数据
#
# 用法和barplot相似

 



推荐阅读
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 本文详细解析了Python中的os和sys模块,介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • 掌握远程执行Linux脚本和命令的技巧
    本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令,帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释,让初学者也能轻松上手。 ... [详细]
  • 本文详细介绍 Go+ 编程语言中的上下文处理机制,涵盖其基本概念、关键方法及应用场景。Go+ 是一门结合了 Go 的高效工程开发特性和 Python 数据科学功能的编程语言。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文详细介绍了Akka中的BackoffSupervisor机制,探讨其在处理持久化失败和Actor重启时的应用。通过具体示例,展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]
  • DNN Community 和 Professional 版本的主要差异
    本文详细解析了 DotNetNuke (DNN) 的两种主要版本:Community 和 Professional。通过对比两者的功能和附加组件,帮助用户选择最适合其需求的版本。 ... [详细]
  • 将Web服务部署到Tomcat
    本文介绍了如何在JDeveloper 12c中创建一个Java项目,并将其打包为Web服务,然后部署到Tomcat服务器。内容涵盖从项目创建、编写Web服务代码、配置相关XML文件到最终的本地部署和验证。 ... [详细]
  • RecyclerView初步学习(一)
    RecyclerView初步学习(一)ReCyclerView提供了一种插件式的编程模式,除了提供ViewHolder缓存模式,还可以自定义动画,分割符,布局样式,相比于传统的ListVi ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
author-avatar
18X712BB_923
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有