热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python数据可视化优秀案例,python数据可视化分析案例

python数据可视化优秀案例,python数据可视化分析案例本文主要介绍Python数

  python数据可视化优秀案例,python数据可视化分析案例

  本文主要介绍Python数据可视化探索实例分享。数据可视化是指以图形或表格的形式呈现数据。更多信息请参考以下文章的具体内容。

  00-1010一、数据可视化与探索图2。常见图表示例1。折线图2。散点图3。直方图,条形图4。圆形饼图,箱形图3。社区调查4。波士顿住房数据集。

  

目录

  数据可视化是指以图形或表格的形式呈现数据。图表可以清楚地显示数据的性质,以及数据或属性之间的关系,并且可以很容易地被人们所理解。用户可以通过探索图了解数据的特征,发现数据的趋势,降低理解数据的门槛。

  

一、数据可视化与探索图

  本章主要是用熊猫来画图,而不是用Matplotlib模块。事实上,Pandas已经将Matplotlib的绘制方法集成到DataFrame中,因此在实际应用中,用户无需直接引用Matplotlib即可完成绘制。

  

二、常见的图表实例

  折线图是最基本的图表,可以用来表示不同领域的连续数据之间的关系。Plot.line()用于绘制折线图,可以设置颜色、形状等参数。在使用中,拆线图的绘制方法完全继承了Matplotlib的用法,所以程序最终必须调用plt.show()生成一个图,如图8.4所示。

  df _ iris[[ sepallength(cm)]]. plot . line()

  plt.show()

  ax=df[[ sepallength(cm)]]. plot . line(color= green ,title=Demo ,brush:py;">df.target.value_counts().plot.pie(legend=True)

  df.boxplot(column=[target],figsize=(10,5))

  

  数据探索实战分享:

  本节利用两个真实的数据集实际展示数据探索的几种手法。

  

  

三、社区调查

  在美国社区调查(American Community Survey)中,每年约有 350 万个家庭被问到关于他们是谁及他们如何生活的详细问题。调查的内容涵盖了许多主题,包括祖先、教育、工作、交通、互联网使用和居住。

  数据名称:2013 American Community Survey。

  先观察数据的样子与特性,以及每个栏位代表的意义、种类和范围。

  

# 读取数据

  df = pd.read_csv("./ss13husa.csv")

  # 栏位种类数量

  df.shape

  # (756065,231)

  # 栏位数值范围

  df.describe()

  先将两个 ss13pusa.csv 串连起来,这份数据总共包含 30 万笔数据,3 个栏位:SCHL ( 学历,School Level)、 PINCP ( 收入,Income) 和 ESR ( 工作状态,Work Status)。

  

pusa = pd.read_csv("ss13pusa.csv") pusb = pd.read_csv("ss13pusb.csv")

  # 串接两份数据

  col = [SCHL,PINCP,ESR]

  df[ac_survey] = pd.concat([pusa[col],pusb[col],axis=0)

  依据学历对数据进行分群,观察不同学历的数量比例,接着计算他们的平均收入。

  

group = df[ac_survey].groupby(by=[SCHL]) print(学历分布: + group.size())

  group = ac_survey.groupby(by=[SCHL]) print(平均收入: +group.mean())

  

  

四、波士顿房屋数据集

  波士顿房屋数据集(Boston House Price Dataset)包含有关波士顿地区的房屋信息, 包 506 个数据样本和 13 个特征维度。

  数据名称:Boston House Price Dataset。

  先观察数据的样子与特性,以及每个栏位代表的意义、种类和范围。

  可以用直方图的方式画出房价(MEDV)的分布,如图 8.8 所示。

  

df = pd.read_csv("./housing.data")

  # 栏位种类数量

  df.shape

  # (506, 14)

  #栏位数值范围df.describe()

  import matplotlib.pyplot as plt

  df[[MEDV]].plot.hist()

  plt.show()

  

  

注:图中英文对应笔者在代码中或数据中指定的名字,实践中读者可将它们替换成自己需要的文字。

  

  接下来需要知道的是哪些维度与房价关系明显。先用散布图的方式来观察,如图8.9所示。

  

# draw scatter chart

  df.plot.scatter(x=MEDV, y=RM) .

  plt.show()

  

  最后,计算相关系数并用聚类热图(Heatmap)来进行视觉呈现,如图 8.10 所示。

  

# compute pearson correlation

  corr = df.corr()

  # draw  heatmap

  import seaborn as sns

  corr = df.corr()

  sns.heatmap(corr)

  plt.show()

  

  颜色为红色,表示正向关系;颜色为蓝色,表示负向关系;颜色为白色,表示没有关系。RM 与房价关联度偏向红色,为正向关系;LSTAT、PTRATIO 与房价关联度偏向深蓝, 为负向关系;CRIM、RAD、AGE 与房价关联度偏向白色,为没有关系。

  到此这篇关于Python数据可视化探索实例分享的文章就介绍到这了,更多相关Python数据可视化内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!



推荐阅读
  • python机器学习之数据探索
    🐱今天我们来讲解数据建模之前需要处理的工作,也就是数据探索的过程,很多同学会说,不就是处理缺失值,异常值&# ... [详细]
  • 本文介绍了如何使用python从列表中删除所有的零,并将结果以列表形式输出,同时提供了示例格式。 ... [详细]
  • 基于词向量计算文本相似度1.测试数据:链接:https:pan.baidu.coms1fXJjcujAmAwTfsuTg2CbWA提取码:f4vx2.实验代码:imp ... [详细]
  • 用pandas库修改excel文件里的内容,并把excel文件格式存为csv格式,再将csv格式改为html格式
    假设有Excel文件data.xlsx,其中内容为:     ID age height    sex weight张三  1  39    181 female     85李四  2  40    180   male     80王五  3  38    178 female     78赵六  4  59    1 ... [详细]
  • csv转为矩阵 python_Python可视化 | Seaborn5分钟入门(六)——heatmap热力图
    Seaborn是基于matplotlib的Python可视化库。它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API ... [详细]
  • 开发笔记:共享单车数据分析
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了共享单车数据分析相关的知识,希望对你有一定的参考价值。共享单车数据分析和共享单车用户行为分析PPT从数据分 ... [详细]
  • seaborn箱线图_Seaborn线图的数据可视化
    seaborn箱线图Hello,folks!Inthisarticle,wewillbetakingtheSeaborntutorialaheadandunderstandingt ... [详细]
  • Python交叉分析学习笔记
    Python交叉分析学习笔记本文将介绍两种方法来进行交叉分析:1.独立T检验2.数据透视表。数据源:百度网盘,课程来源:慕课网数据源共包括10个变量,如下:satisfaction ... [详细]
  • python3 nmap函数简介及使用方法
    本文介绍了python3 nmap函数的简介及使用方法,python-nmap是一个使用nmap进行端口扫描的python库,它可以生成nmap扫描报告,并帮助系统管理员进行自动化扫描任务和生成报告。同时,它也支持nmap脚本输出。文章详细介绍了python-nmap的几个py文件的功能和用途,包括__init__.py、nmap.py和test.py。__init__.py主要导入基本信息,nmap.py用于调用nmap的功能进行扫描,test.py用于测试是否可以利用nmap的扫描功能。 ... [详细]
  • Allegro总结:1.防焊层(SolderMask):又称绿油层,PCB非布线层,用于制成丝网印板,将不需要焊接的地方涂上防焊剂.在防焊层上预留的焊盘大小要比实际的焊盘大一些,其差值一般 ... [详细]
  • 代码如下:#coding:utf-8importstring,os,sysimportnumpyasnpimportmatplotlib.py ... [详细]
  • python seaborn_大白话Python绘图系列Seaborn篇
    1.目的了解python第三方绘图包seaborn,从常用绘图实例开始,快速体验seaborn绘图。建议用时:10分钟绘图例子:12个每个例子代码量:1 ... [详细]
  • 注意力汇聚:NadarayaWatson 核回归
    Nadaraya-Watson核回归是具有注意力机制的机器学习范例。Nadaraya-Watson核回归的注意力汇聚是对训练数据中输出的加权平均。从注意力的角度来看, ... [详细]
  • 循环发电厂电能输出预测
    前言本次项目是就某联合循环发电厂的数据,运用线性回归模型进行预测电能输出,若文中出现错误的地方,还望指正,谢谢!目录1.数据来源及背景2.数据探索分析3.相关分析4.回 ... [详细]
  • 开发笔记:如何快速绘制相关系数矩阵
    本文由编程笔记#小编为大家整理,主要介绍了如何快速绘制相关系数矩阵相关的知识,希望对你有一定的参考价值。 ... [详细]
author-avatar
mobiledu2502923963
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有