当前位置: 开发笔记 > 编程语言 > 正文

pythonseaborn_大白话Python绘图系列Seaborn篇

作者：z苏苏575 | 来源：互联网 | 2023-10-13 13:30

1.目的了解python第三方绘图包seaborn，从常用绘图实例开始，快速体验seaborn绘图。建议用时:10分钟绘图例子:12个每个例子代码量:1

1. 目的

了解python第三方绘图包seaborn&＃xff0c;从常用绘图实例开始&＃xff0c;快速体验seaborn绘图。

建议用时: 10分钟
绘图例子: 12个
每个例子代码量: 1-6行, 90%仅1行

1.1 环境

ipython notebook
安装python包: seaborn, matplotlib, pandas, numpy

在微信公共账号回复&＃xff0c;ipython&＃xff0c; 会返回临时云端学习环境网址和密码, 也可自己搭建。

2. Seaborn快速绘图

2.1 练习数据

seaborn自带很多练习数据&＃xff0c;我们任选一个数据集&＃xff0c;比如: Iris, 当做绘图数据使用, 简单介绍该数据源:

Iris数据集是常用的分类实验数据集&＃xff0c;由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集&＃xff0c;是一类多重变量分析的数据集。数据集包含150个数据集&＃xff0c;分为3类&＃xff0c;每类50个数据&＃xff0c;每个数据包含4个属性。可通过花萼长度&＃xff0c;花萼宽度&＃xff0c;花瓣长度&＃xff0c;花瓣宽度4个属性预测鸢尾花卉属于(Setosa&＃xff0c;Versicolour&＃xff0c;Virginica)三个种类中的哪一类。

加载Iris数据

import seaborn as sn import pandas as pd import matplotlib.pyplot as plt import numpy as np %matplotlib inline # 加载seaborn自带数据: iris df &＃61; sn.load_dataset("iris") df.head()

输出结果:

2.2 数据集洞察

代码: 1行

先简单看下该数据基本统计信息:

样本数量: count
平均值: mean
标准差: std
最小值: min
最大值: max
25%, 50%, 75%分位数

df.descirbe()

输出结果:

2.3 分类聚集

代码: 1行
场景: 样例两个属性, 一个是离散分类&＃xff0c;一个是连续值&＃xff0c;希望一张图绘出每类的散点图
方法:
- stripplot: 可以绘制分类数据的散点图&＃xff0c;由于过多的点会聚集一处&＃xff0c;使用jitter 进行随机抖动&＃xff0c;以在每一个分类数据中对应变量在某一点的集中/分布趋势。
- swarmplot: 函数会使用内置的算法对数据进行抖动&＃xff0c;保证点不会重合

talk is cheap, show u code.

# swarm绘图散点以树状连接个点, 不重合 sn.swarmplot(x&＃61;"species", y&＃61;"petal_length", data&＃61;df, size&＃61;10) # 可以体验下与下面绘图结果的不同: # sn.stripplot(x&＃61;&＃39;species&＃39;, y&＃61;&＃39;petal_length&＃39;, data&＃61;df, jitter&＃61;True)

输出结果:

2.4 直方图

代码: 1行
场景: 连续属性分段查看分布

sn.distplot(df.sepal_length, bins&＃61;20, kde&＃61;True, rug&＃61;True)

输出结果:

2.5 柱状图

代码: 1行
场景: 连续属性分段查看分布

sn.barplot(x&＃61;&＃39;species&＃39;, y&＃61;&＃39;sepal_length&＃39;, data&＃61;df)

输出结果:

2.6 点图

代码: 1行
介绍: 表示一个数值的中心趋势的估计。根据散点图点的位置变化&＃xff0c;并提供一些&＃xff0c;用误差线表示该估计的不确定性

# 点图 sn.pointplot(x&＃61;&＃39;species&＃39;, y&＃61;&＃39;sepal_length&＃39;, data&＃61;df)

输出结果:

2.7 双变量图

代码: 1行

sn.jointplot(x&＃61;&＃39;sepal_length&＃39;, y&＃61;&＃39;sepal_width&＃39;, data&＃61;df) # 尝试改变属性值 # sn.jointplot(x&＃61;&＃39;x&＃39;, y&＃61;&＃39;y&＃39;, data&＃61;df2, kind&＃61;&＃39;hex&＃39;) # sn.jointplot(x&＃61;&＃39;x&＃39;, y&＃61;&＃39;y&＃39;, data&＃61;df2, kind&＃61;&＃39;kde&＃39;)

输出结果:

2.8 热力图

代码: 1行

# 取10个样本, 查看不同属性的值, 用热力图显示 sn.heatmap(df.iloc[:10,:4])

输出结果:

2.9 箱图

代码: 1行
如何读箱图见《大白话Python绘图系列》Matplotlib篇箱图部分

sn.boxplot(x&＃61;&＃39;species&＃39;, y&＃61;&＃39;sepal_length&＃39;, data&＃61;df)

输出结果:

2.10 小提琴图

代码: 6行
场景: 小提琴类似箱图, 但能更直观看数据集聚程度

# 场景: 看密度分布比较形象具体 fig, axes &＃61; plt.subplots(2,2, figsize&＃61;(20,20)) sn.violinplot(x&＃61;&＃39;species&＃39;, y&＃61;&＃39;sepal_length&＃39;, data&＃61;df, ax&＃61;axes[0,0]) sn.violinplot(x&＃61;&＃39;species&＃39;, y&＃61;&＃39;sepal_length&＃39;, data&＃61;df, ax&＃61;axes[0,1], hue&＃61;&＃39;species&＃39;) sn.violinplot(y&＃61;&＃39;species&＃39;, x&＃61;&＃39;sepal_length&＃39;, data&＃61;df, ax&＃61;axes[1,0], hue&＃61;&＃39;species&＃39;, inner&＃61;&＃39;stick&＃39;) sn.violinplot(y&＃61;&＃39;species&＃39;, x&＃61;&＃39;sepal_length&＃39;, data&＃61;df, ax&＃61;axes[1,1], hue&＃61;&＃39;species&＃39;, inner&＃61;None) sn.swarmplot(y&＃61;&＃39;species&＃39;, x&＃61;&＃39;sepal_length&＃39;, data&＃61;df, ax&＃61;axes[1,1],alpha&＃61;.5, hue&＃61;&＃39;species&＃39;,color&＃61;"r")

输出结果:

2.11 线性拟合

代码: 1行
场景: 查看两列关系

sn.lmplot(x&＃61;&＃39;sepal_length&＃39;, y&＃61;&＃39;petal_length&＃39;, data&＃61;df)

输出结果:

2.12 非线性拟合

代码: 1行
场景: 查看两列关系, 下面用二次多项式

sn.regplot(x&＃61;&＃39;sepal_length&＃39;, y&＃61;&＃39;petal_length&＃39;, order&＃61;2, data&＃61;df)

输出结果:

2.13 数据集两两属性关系

代码: 2行
场景: 当需要快速了解数据集中属性两两关系时. 数据需要是连续值且非空

# 相同变量直方图显示, 不同变量散点图显示, 其中数据中不能含有NaN l &＃61; [&＃39;sepal_length&＃39;, &＃39;sepal_width&＃39;, &＃39;petal_length&＃39;, &＃39;petal_width&＃39;] sn.pairplot(df[l])

输出结果:

2.14 Grid自定义绘制

场景: 多子图显示

# 多图绘制: 数据集某属性species, 将数据集分三类 # 下面, 一次性汇出三类数据的直方图 g &＃61; sn.FacetGrid(df,col&＃61;"species") g.map(plt.hist,"sepal_length") g.add_legend()

输出结果:

3. About Me

来自北京回龙观的一名数据民工&＃xff0c; 2019年开始写写数据民工那些大白话

微信公众号: workindata
个人微信号: ITlooker
知乎专栏: 大数据那些儿大白话

推荐阅读

main
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
js
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
main
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
main
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
java
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
php
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
bit
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
bit
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
random
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
format
深入解析：手把手教你构建决策树算法

本文详细介绍了机器学习中广泛应用的决策树算法，通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字，建议阅读时间5分钟。 ... [详细]

蜡笔小新 2024-12-27 13:44:59
blob
Python 提取和替换 Word 文档中的图片

本文介绍如何使用 Python 提取和替换 .docx 文件中的图片。.docx 文件本质上是压缩文件，通过解压可以访问其中的图片资源。此外，我们还将探讨使用第三方库 docx 的方法来简化这一过程。 ... [详细]

蜡笔小新 2024-12-26 18:52:14
blob
自学编程与计算机专业背景者的差异分析

本文探讨了自学编程者和计算机专业毕业生在技能、知识结构及职业发展上的不同之处，结合实际案例分析两者的优势与劣势。 ... [详细]

蜡笔小新 2024-12-26 17:53:18
java
使用Python在SAE上开发新浪微博应用的初步探索

最近重新审视了新浪云平台（SAE）提供的服务，发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用，并分享开发过程中的关键步骤。 ... [详细]

蜡笔小新 2024-12-26 13:36:52
format
CUGB图论专题：排水系统中的最大流问题 - EK与Dinic算法解析

本题探讨如何通过最大流算法解决农场排水系统的设计问题。题目要求计算从水源点到汇合点的最大水流速率，使用经典的EK（Edmonds-Karp）和Dinic算法进行求解。 ... [详细]

蜡笔小新 2024-12-25 17:47:23
php
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32

z苏苏575

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章