Pandas散点图矩阵（scatter_matrix）绘图功能及其参数详解

作者：mobiledu2502887427 | 来源：互联网 | 2024-11-09 12:03

通过使用`pandas`库中的`scatter_matrix`函数，可以有效地绘制出多个特征之间的两两关系。该函数不仅能够生成散点图矩阵，还能通过参数如`frame`、`alpha`、`c`、`figsize`和`ax`等进行自定义设置，以满足不同的可视化需求。此外，`diagonal`参数允许用户选择对角线上的图表类型，例如直方图或密度图，从而提供更多的数据洞察。

使用散点图矩阵图，可以两两发现特征之间的联系

scatter_matrix(frame, alpha=0.5, c,figsize=None, ax=None, diagOnal='hist', marker='.', density_kwds=None,hist_kwds=None, range_padding=0.05, **kwds)

1。frame，pandas dataframe对象
2。alpha，图像透明度，一般取(0,1]
3。figsize，以英寸为单位的图像大小，一般以元组 (width, height) 形式设置
4。ax，可选一般为none
5。diagonal，必须且只能在{‘hist’, ‘kde’}中选择1个，’hist’表示直方图(Histogram plot),’kde’表示核密度估计(Kernel Density Estimation)；该参数是scatter_matrix函数的关键参数
6。marker。Matplotlib可用的标记类型，如’.’，’,’，’o’等
7。density_kwds。(other plotting keyword arguments，可选)，与kde相关的字典参数
8。hist_kwds。与hist相关的字典参数
9。range_padding。(float, 可选)，图像在x轴、y轴原点附近的留白(padding)，该值越大，留白距离越大，图像远离坐标原点
10。kwds。与scatter_matrix函数本身相关的字典参数
11。c。颜色

使用python sklearn库里的iris数据集，

import mglearn
import pandas as pd
from sklearn.datasets import load_iris
iris_dataset = load_iris()
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(iris_dataset['data'],iris_dataset['target'],random_state=0)
iris_dataframe=pd.DataFrame(X_train,columns=iris_dataset.feature_names)
grr = pd.plotting.scatter_matrix(iris_dataframe,marker='o',c = y_train,hist_kwds={'bins':20},cmap=mglearn.cm3)

矩阵的对角线是每个特征的直方图，颜色使用训练集的label，可以看出其明显的分开三个类别
这里写图片描述

get到一个新的知识点
numpy中有一些常用的用来产生随机数的函数，randn()和rand()就属于这其中。
numpy.random.randn(d0, d1, …, dn)是从标准正态分布中返回一个或多个样本值。
numpy.random.rand(d0, d1, …, dn)的随机样本位于[0, 1)中。

参考https://blog.csdn.net/hurry0808/article/details/78573585?locatiOnNum=7&fps=1

推荐阅读

int
社交网络中的级联行为

社交网络中的级联行为 ... [详细]

蜡笔小新 2024-12-22 16:47:55
int
TensorFlow 2.0 实战：多层感知机（MLP）网络入门

本教程详细介绍了如何使用 TensorFlow 2.0 构建和训练多层感知机（MLP）网络，涵盖回归和分类任务。通过具体示例和代码实现，帮助初学者快速掌握 TensorFlow 的核心概念和操作。 ... [详细]

蜡笔小新 2024-12-22 19:56:15
int
SVD与QR分解的Python实现及应用

本文介绍了SVD（奇异值分解）和QR分解的基本原理及其在Python中的实现方法。通过具体代码示例，展示了如何使用这两种矩阵分解技术处理图像数据和计算特征值。 ... [详细]

蜡笔小新 2024-12-22 14:57:42
int
Python面试题精粹

本文档汇总了Python编程的基础与高级面试题目，涵盖语言特性、数据结构、算法以及Web开发等多个方面，旨在帮助开发者全面掌握Python核心知识。 ... [详细]

蜡笔小新 2024-12-19 20:26:25
import
二维几何变换矩阵解析

本文详细介绍了二维平面上的三种常见几何变换：平移、缩放和旋转。通过引入齐次坐标系，使得这些变换可以通过统一的矩阵乘法实现，从而简化了计算过程。文中不仅提供了理论推导，还附有Python代码示例，帮助读者更好地理解这些概念。 ... [详细]

蜡笔小新 2024-12-22 18:07:54
int
深入解析Java枚举及其高级特性

本文详细介绍了Java枚举的概念、语法、使用规则和应用场景，并探讨了其在实际编程中的高级应用。所有相关内容已收录于GitHub仓库[JavaLearningmanual](https://github.com/Ziphtracks/JavaLearningmanual)，欢迎Star并持续关注。 ... [详细]

蜡笔小新 2024-12-22 14:46:52
int
字符串中特定字符的移除方法

本文介绍如何从字符串中移除大写、小写、特殊、数字和非数字字符，并提供了多种编程语言的实现示例。 ... [详细]

蜡笔小新 2024-12-22 00:08:06
int
探究同一请求在不同机器上返回不同HTTP状态码200和429的原因

本文探讨了为何相同的HTTP请求在两台不同操作系统（Windows与Ubuntu）的机器上会分别返回200 OK和429 Too Many Requests的状态码。我们将分析代码、环境差异及可能的影响因素。 ... [详细]

蜡笔小新 2024-12-21 19:35:11
int
Python 中 Pmagick 的木炭滤镜方法

本文介绍了 Python 的 Pmagick 库中用于图像处理的木炭滤镜方法，探讨其功能和用法，并通过实例演示如何应用该方法。 ... [详细]

蜡笔小新 2024-12-21 13:44:30
int
Python 条件与循环语句详解

本文详细介绍了 Python 中的条件语句和循环结构。主要内容包括：1. 分支语句（if...elif...else）；2. 循环语句（for, while 及嵌套循环）；3. 控制循环的语句（break, continue, else）。通过具体示例，帮助读者更好地理解和应用这些语句。 ... [详细]

蜡笔小新 2024-12-21 12:58:28
random
使用TensorFlow实现非线性回归模型

本文介绍了如何利用TensorFlow框架构建一个简单的非线性回归模型。通过生成200个随机数据点进行训练，模型能够学习并预测这些数据点的非线性关系。 ... [详细]

蜡笔小新 2024-12-20 11:54:20
int
java文本编辑器,java文本编辑器设计思路

java文本编辑器,java文本编辑器设计思路 ... [详细]

蜡笔小新 2024-12-19 21:02:48
int
HTML5与JavaScript实现本地文件读取、写入及路径获取

本文探讨了如何利用HTML5和JavaScript在浏览器中进行本地文件的读取和写入操作，并介绍了获取本地文件路径的方法。HTML5提供了一系列API，使得这些操作变得更加简便和安全。 ... [详细]

蜡笔小新 2024-12-20 18:36:06
join
在JSONNet中查找数组元素的索引

本文介绍如何在Grafana配置面板时，使用JSONNet获取数组中特定元素的位置，并将其应用于动态服务查询。 ... [详细]

蜡笔小新 2024-12-20 12:34:29
int
Java中XYSeries.setLineColor()方法详解与应用实例

本文详细介绍了Java库XChart中的XYSeries类下的setLineColor()方法，并提供了多个实际应用场景的代码示例。 ... [详细]

蜡笔小新 2024-12-20 08:27:06

mobiledu2502887427

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章