【Python数据分析学习实例】对学生成绩单和信息进行整合以及数据分析

作者：315空白_580 | 来源：互联网 | 2023-10-12 00:26

问题描述自建EXCEL文件，分为2个工作区，分别存放学生信息表（不少于30人）和班级职务表（不少于4种职务）。如信息表：学号姓名性别数学英语Python通信技术1001张三男958

问题描述

自建EXCEL文件，分为2个工作区，分别存放学生信息表（不少于30人）和班级职务表（不少于4种职务）。

如信息表：

学号	姓名	性别	数学	英语	Python	通信技术
1001	张三	男	95	86	87	90
1002	李四	男	98	84	88	89

如班级职务表：

学号	职务
1001	班长
1002	学习委员

读取Excel文件数据表分别存入DataFrame对象Score和Duty。要求如下：

Score对象新增一列“总分”为前四列成绩之和。
Score对象依据“总分”列的值从高到低进行排序。
Score对象根据性别列进行分组，输出男女生各自的平均分。
输出男女生的最高分。
Score对象新增一列“等级”，总分大于360的等级为A，总分小于270的等级为C，介于270到360之间为B。
以“学号”列为关联关键，将Score对象和Duty对象合并，保留所有Score对象的数据行，合并声称新的DataFrame对象Students。
把Students对象数据存入新的Excel文件students.xlsx中。

代码实现

问题分析

创建EXCEL文件，分为2个工作区，分别存放学生信息表和班级职务表。
导入所需要的库

import pandas as pd

读取EXCEL文件
使用read_excel()函数
函数的具体参数

参数	说明
io	string, path object ; excel 路径。
sheet_name	string, int, mixed list of strings/ints, or None, default 0 返回多表使用sheetname=[0,1],若sheetname=None是返回全表注意：int/string 返回的是dataframe，而none和list返回的是dict of dataframe
header	int, list of ints, default 0 指定列名行，默认0，即取第一行，数据为列名行以下的数据若数据不含列名，则设定 header = None
skiprows	list-like,Rows to skip at the beginning，省略指定行数的数据
skip_footer	int,default 0, 省略从尾部数的int行数据
index_col	int, list of ints, default None指定列为索引列，也可以使用u”strings”
names	array-like, default None, 指定列的名字。

file_name = "studata.xlsx" # 定义文件路径，这里我是将代码和EXCEL放在了同一个文件夹下，如不在同一文件夹应写成C:/studata.xlsx形式 Score = pd.read_excel(file_name, sheet_name='Sheet1', index_col=0) # 读取学生信息 Duty = pd.read_excel(file_name, sheet_name='Sheet2', index_col=0) # 读取班级职务

Score对象新增一列“总分”为前四列成绩之和

Score['总分'] = Score['数学'] + Score['英语'] + Score['Python'] + Score['通信技术']# 新增一列“总分”为成绩之和 Score['总分']

《【Python数据分析学习实例】对学生成绩单和信息进行整合以及数据分析》

Score对象依据“总分”列的值从高到低进行排序
使用sort_values()函数
函数的具体参数

参数	说明
by	指定列名(axis=0或’index’)或索引值(axis=1或’columns’)
axis	若axis=0或’index’，则按照指定列中数据大小排序；若axis=1或’columns’，则按照指定索引中数据大小排序，默认axis=0
ascending	是否按指定列的数组升序排列，默认为True，即升序排列
inplace	是否用排序后的数据集替换原来的数据，默认为False，即不替换
na_position	{‘first’,‘last’}，设定缺失值的显示位置

Score.sort_values(by='总分', inplace=True, ascending=False) # 依据“总分”列的值从高到低进行排序 Score

《【Python数据分析学习实例】对学生成绩单和信息进行整合以及数据分析》

Score对象根据性别列进行分组
输出男女生各自的平均分
输出男女生的最高分
使用groupby()函数
具体函数的规则如下：
df.groupby([df[属性],df[属性])(指分类的属性，数据的限定定语，可以有多个).mean()(对于数据的计算方式——函数名称)
举例如下：
print(df[“评分”].groupby([df[“地区”],df[“类型”]]).mean())
#上面语句的功能是输出表格所有数据中不同地区不同类型的评分数据平均值

Score.groupby(['性别'])['总分'].mean()

《【Python数据分析学习实例】对学生成绩单和信息进行整合以及数据分析》

Score.groupby(['性别'])['总分'].max()

《【Python数据分析学习实例】对学生成绩单和信息进行整合以及数据分析》

Score对象新增一列“等级”，总分大于360的等级为A，总分小于270的等级为C，介于270到360之间为B
自定义等级判断函数

# 等级判断函数 def grade(x): if x>=360: return "A" elif x>=270 return "B" else return "C"

使用apply和lambda的组合
lambda函数也叫匿名函数，即没有具体名称的函数，它允许快速定义单行函数，可以用在任何需要函数的地方
输入是传入到参数列表x的值，输出是根据表达式(expression)计算得到的值。**
Python中apply函数的格式为：apply(func,*args,**kwargs)
func可以是匿名函数。

Score['等级'] = Score['总分'].apply(lambda x: grade(x)) # 新增一列“等级”

以“学号”列为关联关键，将Score对象和Duty对象合并，保留所有Score对象的数据行，合并声称新的DataFrame对象Students
使用merge()函数
函数的具体参数

参数	说明
how	默认为inner，可设为inner/outer/left/right
on	根据某个字段进行连接，必须存在于两个DateFrame中（若未同时存在，则需要分别使用left_on和right_on来设置）
left_on	左连接，以DataFrame1中用作连接键的列
right_on	右连接，以DataFrame2中用作连接键的列
left_index	将DataFrame1行索引用作连接键
right_index	将DataFrame2行索引用作连接键
sort	根据连接键对合并后的数据进行排列，默认为True
suffixes	对两个数据集中出现的重复列，新数据集中加上后缀_x,_y进行区别

Students = pd.merge(Score, Duty, on='学号')

把Students对象数据存入新的Excel文件students.xlsx中
使用to_excel()函数
函数的具体参数

参数	说明
excel_writer	字符串或ExcelWriter 对象，文件路径或现有的ExcelWriter
sheet_name	字符串,默认“Sheet1”，将包含DataFrame的表的名称。
na_rep	字符串,默认‘ ’，缺失数据表示方式
float_format	字符串,默认None，格式化浮点数的字符串
columns	序列,可选，要编写的列
header	布尔或字符串列表，默认为Ture。写出列名。如果给定字符串列表，则假定它是列名称的别名。
index	布尔,默认的Ture，写行名（索引）
index_label	字符串或序列，默认为None。如果需要，可以使用索引列的列标签。如果没有给出，标题和索引为true，则使用索引名称。如果数据文件使用多索引，则需使用序列。
startrow	左上角的单元格行来转储数据框
startcol	左上角的单元格列转储数据帧
engine	字符串,默认没有使用写引擎 &＃8211; 您也可以通过选项io.excel.xlsx.writer，io.excel.xls.writer和io.excel.xlsm.writer进行设置。
merge_cells	布尔,默认为Ture编码生成的excel文件。只有xlwt需要，其他编写者本地支持unicode。
inf_rep	字符串,默认“正”无穷大的表示(在Excel中不存在无穷大的本地表示)
freeze_panes	整数的元组(长度2)，默认为None。指定要冻结的基于1的最底部行和最右边的列

Students.to_excel('students.xlsx')

完整代码

import pandas as pd # 等级判断函数 def grade(x): if x>=360: return "A" elif x>=270: return "B" else: return "C" file_name = "studata.xlsx" # 定义文件路径，这里我是将代码和EXCEL放在了同一个文件夹下，如不在同一文件夹应写成C:/studata.xlsx形式 Score = pd.read_excel(file_name, sheet_name='Sheet1', index_col=0) # 读取学生信息 Duty = pd.read_excel(file_name, sheet_name='Sheet2', index_col=0) # 读取班级职务 Score['总分'] = Score['数学'] + Score['英语'] + Score['Python'] + Score['通信技术'] # 新增一列“总分”为前四列成绩之和 Score['等级'] = Score['总分'].apply(lambda x: grade(x)) # 新增一列“等级” Score.sort_values(by='总分', inplace=True, ascending=False) # 依据“总分”列的值从高到低进行排序 print('男女生的平均分为:') print(Score.groupby(['性别'])['总分'].mean()) # 输出男女生各自的平均分 print('男女生的最高分为:') print(Score.groupby(['性别'])['总分'].max()) # 输出男女生的最高分 Students = pd.merge(Score, Duty, on='学号') # 以“学号”为关联关键,合并sheet1和sheet2 Students.to_excel('students.xlsx')

参考文章

8行Python代码实现excel两个sheet表合并
用Python将同一个excel中的多个sheet合并成一个sheet
python读取excel指定列名，dataframe连接，两列相减作为第三列的值
python学习002-pandas VS excel给成绩赋值等级
python：从excel文件中读取成绩，计算出平均成绩，按平均成绩降序输出，并写回到excel文件
PYTHON作业——用函数获取EXCEL中的学生成绩并做处理
pandas——很全的groupby、agg，对表格数据分组与统计

推荐阅读

int
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
int
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
数组
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
jsp
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
int
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
int
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
int
java编写的简易计算器

主要用了2个类来实现的，话不多说，直接看运行结果，然后在奉上源代码1.Index.javaimportjava.awt.Color;im ... [详细]

蜡笔小新 2024-12-27 18:18:10
int
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
heap
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
hook
解决Uploadify在IE浏览器中的兼容性问题

本文详细介绍了如何解决Uploadify插件在Internet Explorer（IE）9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码，确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]

蜡笔小新 2024-12-27 22:07:40
int
Go语言基础：Hello World 实践

本文将介绍如何使用 Go 语言编写和运行一个简单的“Hello, World!”程序。内容涵盖开发环境配置、代码结构解析及执行步骤。 ... [详细]

蜡笔小新 2024-12-27 21:29:35
bit
词根词缀解析：greg、hap、helio及其他词源故事

本文基于刘洪波老师的《英文词根词缀精讲》，深入探讨了多个重要词根词缀的起源及其相关词汇，帮助读者更好地理解和记忆英语单词。 ... [详细]

蜡笔小新 2024-12-27 18:59:50
int
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
int
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
int
将Web服务部署到Tomcat

本文介绍了如何在JDeveloper 12c中创建一个Java项目，并将其打包为Web服务，然后部署到Tomcat服务器。内容涵盖从项目创建、编写Web服务代码、配置相关XML文件到最终的本地部署和验证。 ... [详细]

蜡笔小新 2024-12-27 11:48:15

315空白_580

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章