热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【数据可视化】第三章——数据可视化综合实践

Matplotlib作业数据.csv文件查看百度网盘:链接:https:pan.baidu.coms1oFB_KwhiJNlJAgXg7RaYuw?pw





Matplotlib作业数据.csv文件查看百度网盘:链接:https://pan.baidu.com/s/1oFB_KwhiJNlJAgXg7RaYuw?pwd=abcd
提取码:abcd



1.作业描述

作业:根据Matplotlib作业数据.csv做出4种不同类型的组合图像

要求:根据情况适当添加信息,如:标题,坐标轴信息,图例信息,特殊值标注等。

可参考制作内容包括并不限于:
评分最高的20部电影的投票人数分布(柱状图,条形图)
不同国家2012-2016年发行电影数量(折线图,簇状柱形图)
不同类型电影2012-2016年发行数量(簇状柱形图)
不同类型电影所占比值(饼图)
电影时长分布分析(直方图)
电影时长,豆瓣评分与投票人数的相关关系(气泡图)




2.参考代码:

import numpy as np
import matplotlib.pyplot as plt
import matplotlib
import pandas as pd
import seaborn as sbn
matplotlib.rcParams['font.family'] = 'SIMHEI'
matplotlib.rcParams['font.size'] = 18

提示:如果报错,请检查包是否下载完成,在python环境中输入:
pip install xxx

df = pd.read_csv(r"E:/Matplotlib作业数据.csv",encoding="gbk",index_col="名字").dropna()
# 评分最高的20部电影的投票人数分布(柱状图,条形图)
df1 = df.sort_values(by="评分",ascending=False)
df2 = df1.iloc[0:20,:]
# 不同国家2012-2016年发行电影数量
df3 = df["产地"].value_counts()
# 不同类型电影2012-2016年发行数量(簇状柱形图)
df4 = df["类型"].value_counts()
# 计算相关系数
df5 = df[["时长","评分","投票人数"]].corr()

plt.figure(figsize = (25,35),dpi = 150)
plt.subplot2grid(shape=(3,3),loc=(0,0),colspan=3)
# 第一个图 评分最高的20部电影的投票人数分布(柱状图,条形图)
a = [s[:5] for s in df2.index]
b = df2["投票人数"]
plt.barh(a, width =b,height = 0.5,color = 'orange',edgecolor = 'silver',linewidth = 3)
plt.yticks(a,fontsize = 12)
plt.grid(True)
plt.title('评分最高的20部电影的投票人数分布',fontweight="bold") #图标题
plt.ylabel('电影名称')
plt.xlabel('人数')
plt.subplot2grid((3,3),(1,0),colspan=2)
# 第二个图 不同国家2012-2016年发行电影数量 折线图
a = df3.index
b = df3.to_list()
plt.plot(a,b,color = 'g', linestyle = '-.',linewidth = 3,
marker = 'h', markerfacecolor = 'c', markersize = 15)
bm = np.argmax(b)
plt.text(a[bm],b[bm],'最大值', fontproperties = 'Kaiti', fontsize = 15)
plt.xticks(a,rotation = 45)
plt.title('不同国家2012-2016年发行电影数量',fontweight="bold") #图标题
plt.xlabel('国家')
plt.ylabel('电影数量')
plt.grid(True)
plt.subplot2grid((3,3),(1,2),rowspan=2)
# 第三个图
# 不同电影时长分布
a = df["时长"]
d = 20
num_bins = np.ceil((np.ptp(a))/d).astype(np.int64)
b = np.arange(min(a),max(a)+d,d)
plt.hist(a,num_bins,range = (min(a),min(a)+d*num_bins),density = False,color="coral")
plt.xticks(b)
plt.grid()
plt.xlabel("分钟")
plt.ylabel("数量")
plt.title("不同电影时长分布",fontweight="bold")
plt.subplot2grid((3,3),(2,0),colspan=1)
sbn.heatmap(df5,cmap='GnBu',annot=True,linewidths=0.3, linecolor='gray')
plt.title("相关关系热力图",fontweight="bold")
plt.subplot2grid((3,3),(2,1),colspan=1)
# 第五个图
sizes = df4.to_list() #设置每部分大小
labels = df4.index
explode = [0.05,0,0,0,0,0,0,0,0,0,0] #设置每部分凹凸
# colors = ['c','g','b','m']
colors = matplotlib.cm.rainbow(np.arange(len(sizes))/len(sizes))
plt.pie(sizes,
labels = labels,
explode = explode,
colors = colors,
labeldistance = 1,
autopct = '%.1f%%',
counterclock = False,
startangle = 170,
shadow = False)
plt.title('不同类型电影所占比值',fontweight="bold");#设置标题

最终效果如图:
在这里插入图片描述







推荐阅读
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询,并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率,还简化了代码逻辑。 ... [详细]
  • 本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误,并提供了解决方案。 ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 本文详细介绍了如何使用Python编写爬虫程序,从豆瓣电影Top250页面抓取电影信息。文章涵盖了从基础的网页请求到处理反爬虫机制,再到多页数据抓取的全过程,并提供了完整的代码示例。 ... [详细]
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • XNA 3.0 游戏编程:从 XML 文件加载数据
    本文介绍如何在 XNA 3.0 游戏项目中从 XML 文件加载数据。我们将探讨如何将 XML 数据序列化为二进制文件,并通过内容管道加载到游戏中。此外,还会涉及自定义类型读取器和写入器的实现。 ... [详细]
  • 360SRC安全应急响应:从漏洞提交到修复的全过程
    本文详细介绍了360SRC平台处理一起关键安全事件的过程,涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例,展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]
  • 本文详细解析了Python中的os和sys模块,介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]
  • 离线环境下的Python及其第三方库安装指南
    在项目开发中,有时会遇到电脑只能连接内网或完全无法联网的情况。本文将详细介绍如何在这种环境下安装Python及其所需的第三方库,确保开发工作的顺利进行。 ... [详细]
  • 掌握远程执行Linux脚本和命令的技巧
    本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令,帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释,让初学者也能轻松上手。 ... [详细]
  • 使用Python在SAE上开发新浪微博应用的初步探索
    最近重新审视了新浪云平台(SAE)提供的服务,发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用,并分享开发过程中的关键步骤。 ... [详细]
author-avatar
手机用户2502870863
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有