pythonconcat函数多张表_零基础python数据分析（三）快速统计

作者：七彩咩_131 | 来源：互联网 | 2023-08-20 13:26

温馨提示：为了更好地食用本教程，你可以只浏览加粗黑字，防止沉迷在笔者废话的海洋中。在excel中，对于一个表格，

温馨提示&＃xff1a;为了更好地食用本教程&＃xff0c;你可以只浏览加粗黑字&＃xff0c;防止沉迷在笔者废话的海洋中。

在excel中&＃xff0c;对于一个表格&＃xff0c;最常用的操作&＃xff0c;可能就是对某一行求和&＃xff0c;求平均&＃xff0c;对数据进行一些统计性的运算&＃xff0c;接下来&＃xff0c;就让我们用python来进行这些基本操作&＃xff0c;并展示一下python的魅力&＃xff01;优雅、快速、高效

要进行这些操作演示&＃xff0c;当然是需要自己准备一些数据咯&＃xff0c;可是数据从哪里来&＃xff1f;既然没有现成的&＃xff0c;那我们就自己造一个&＃xff0c;你以为我会用excel去填一个表格出来吗&＃xff1f;no&＃xff01;no&＃xff01;no&＃xff01;既然我们都在学习python了&＃xff0c;当然是用python快速生成啦。

当然以下的代码比较超前&＃xff0c;你可以不用费尽心思理解&＃xff0c;我也不会出半分力讲解&＃xff0c;你尽管体验伸手党的乐趣吧&＃xff01;

新建一个python的文件&＃xff0c;复制下面的代码并运行。

应该还没忘记怎么创建&＃xff0c;怎么运行吧&＃xff1f;打开jupyter&＃xff0c;在弹出来的网页右上角点击new&＃xff0c;点击python3……

老奶奶般的叮嘱&＃xff1a;每一行代码前的空格也不要忘了复制&＃xff0c;不然代码会运行不了的&＃xff01;最好就是鼠标从第一行选到最后一行&＃xff01;

然后是把最后一行的单引号中的路径改一改&＃xff0c;你想要将这个生成的excel存到哪&＃xff0c;就改到哪。

即&＃xff1a;

generate_score_excel(r&＃39;D:\成绩.xlsx&＃39;)

改为&＃xff1a;

generate_score_excel(r&＃39;你自己的路径\文件名.xlsx&＃39;)

当然&＃xff0c;你要是不改的话&＃xff0c;它默认就是在D盘了&＃xff0c;你自己可以去可以打开看看~

(为了各位童鞋运行不出错&＃xff0c;我真是费尽心思&＃xff0c;心疼自己两秒&＃xff0c;小声BB)

import pandas as pdimport numpy as npimport redef generate_score_excel(path): # 随机姓名表 surnames &＃61; list(&＃39;赵钱孙李周吴郑王冯陈褚卫蒋沈韩杨朱秦尤许何吕施张孔曹严华金魏陶姜&＃39;) names &＃61; """供、侃、刻、卦、固、坤、姑、官、冈、庚、快、抗、昆、果、空、亟、其、具、券、卷、奇、委、季、宜、居、届、岢、岸、杰、佳、京、侄、佳、来、例、制、到、兔、两、典、卷、周、呢、坦、奈、妮、宙、定、居、屉、帖、底、店、征、忝、忠、念、技、投、政、枝、东、林、汰、决、玖、知、的、直、纠、金、两、乳、侏、佰、侗、佻、佬、具、冽、卓、拈、妲、妯、宕、岱、岭、帖、帙、底、抒、林、杼、沓、炉、竺、长、依、侑、味、夜、委、宜、宛、岳、岸、岩、往、亚、武、於、易、昂、旺、沅、沃、汪、物、艾、卧、佯、儿、咏、抑、昀、炎、杳、事、享、侍、使、侈、然、刹、刺、协、卒、洽、沁、取、受、步、垂、奇、始、炊、姓、妻、妾、尚、屈、弦、所、承、昌、升、昔、松、欣、沙、沈、社、舍、炊、采、长、青、幸、亟、徇、佳、舍、儿、争、其、刷、券、制、效、卷、姐、姒、姗、季、炙、宗、届、岫、征、承、昔、析、枕、状、八、并、佩、函、和、命、坡、坪、奉、孟、帛、水、府、佛、彼、忽、或、戽、房、扮、枇、扶、放、昏、朋、服、明、杭、杯、枚、板、沛、沐、汾、版、牧、虎、门、阜、杷、盲、非""".split(&＃39;、&＃39;) names &＃61; list(filter(lambda x: re.match(r&＃39;[\u4e00-\u9fa5]&＃39;, x), names)) # 生成随机姓名 choice_surname &＃61; np.random.choice(surnames, 1000, replace&＃61;True) choice_name1 &＃61; np.random.choice(names, 1000, replace&＃61;True) name &＃61; np.char.add(choice_surname, choice_name1) # 生成随机年龄 age &＃61; np.random.choice(list(range(15, 30)), 1000) # 生成随机性别 sex &＃61; np.random.choice([&＃39;男&＃39;, &＃39;女&＃39;], 1000) # 生成随机成绩 score1 &＃61; np.random.choice(list(range(60, 101)), 1000) score2 &＃61; np.random.choice(list(range(60, 101)), 1000) score3 &＃61; np.random.choice(list(range(60, 101)), 1000) # 生成表格 df &＃61; pd.DataFrame({&＃39;姓名&＃39;: name, &＃39;年龄&＃39;: age, &＃39;性别&＃39;: sex, &＃39;数学&＃39;: score1, &＃39;语文&＃39;: score2, &＃39;英语&＃39;: score3}) df.to_excel(path) print(&＃39;表格生成成功&＃xff01;&＃39;) generate_score_excel(r&＃39;D:\成绩.xlsx&＃39;)

然后&＃xff0c;还记得怎么运行吧&＃xff1f;没错&＃xff0c;就是在上一篇文章的最后提到的&＃xff0c;选中这个代码所在的cell&＃xff0c;按下Shift&＃43;Enter(回车)&＃xff0c;当然你也可以点击上方菜单中的cell下的run cells&＃xff0c;都可以。

当你看到你的cell下方出现这样的结果时&＃xff0c;说明你的数据已经生成完毕了&＃xff01;激动吗&＃xff1f;兴奋吗&＃xff1f;感动吗&＃xff1f;

接下来&＃xff0c;就让我们利用这份数据&＃xff0c;来做一些基本的统计操作吧&＃xff01;

创建一个新的cell&＃xff0c;我们开启接下来的旅程&＃xff0c;应该还没忘记怎么插入新的cell吧&＃xff1f;按下ESC&＃xff0c;将cell左侧变为蓝色&＃xff0c;按下B键&＃xff0c;奇迹出现啦&＃xff01;下面出现了一个新的cell(框)

然后&＃xff0c;让我们动动手指&＃xff0c;敲一敲下面的两行代码并运行&＃xff1a;

import pandasdf &＃61; pandas.read_excel(r&＃39;D:\成绩.xlsx&＃39;)df

还记得吧&＃xff0c;这就是读取excel的代码&＃xff0c;要用python对excel进行处理&＃xff0c;那当然先要把它读取过来。

(如果前面路径有修改的话&＃xff0c;这里的路径也要记得改哦&＃xff01;)

然后&＃xff0c;你就会看到我们生成数据的庐山真面目&＃xff1a;

(温馨提示&＃xff1a;数据当然不会一模一样&＃xff0c;因为每一条数据都是随机生成的)

接下来&＃xff0c;让我们来统计一下&＃xff0c;每个人的三科总成绩&＃xff0c;新建一个cell&＃xff0c;在里面写上&＃xff1a;

data &＃61; df[[&＃39;数学&＃39;, &＃39;语文&＃39;, &＃39;英语&＃39;]]score &＃61; data.sum(1)score.name &＃61; &＃39;总成绩&＃39;pandas.concat([df, score], 1)

shift&＃43;回车&＃xff0c;运行&＃xff0c;你就会看到如下结果&＃xff1a;

怎么样&＃xff0c;是不是发现多出了一列总成绩&＃xff1f;代码就是这么的简单&＃xff0c;如果你想算三科成绩的平均值、最小值、最大值&＃xff0c;你只需要做一点简单的修改&＃xff1a;

# 计算平均成绩data &＃61; df[[&＃39;数学&＃39;, &＃39;语文&＃39;, &＃39;英语&＃39;]]score &＃61; data.mean(1)score.name &＃61; &＃39;三科平均成绩&＃39;pandas.concat([df, score], 1)

# 计算三科最高分data &＃61; df[[&＃39;数学&＃39;, &＃39;语文&＃39;, &＃39;英语&＃39;]]score &＃61; data.max(1)score.name &＃61; &＃39;三科最高分&＃39;pandas.concat([df, score], 1)

# 计算三科最低分data &＃61; df[[&＃39;数学&＃39;, &＃39;语文&＃39;, &＃39;英语&＃39;]]score &＃61; data.min(1)score.name &＃61; &＃39;三科最低分&＃39;pandas.concat([df, score], 1)

代码是很简单&＃xff0c;那么接下来&＃xff0c;让我来说明下&＃xff0c;这些代码都是什么意思&＃xff0c;分别起了什么作用&＃xff0c;让你以后也能写出属于自己的代码~

让我们先把代码整合一下&＃xff0c;变成下面的亚子&＃xff1a;

import pandasdf &＃61; pandas.read_excel(r&＃39;D:\成绩.xlsx&＃39;)data &＃61; df[[&＃39;数学&＃39;, &＃39;语文&＃39;, &＃39;英语&＃39;]]score &＃61; data.sum(1)score.name &＃61; &＃39;总成绩&＃39;pandas.concat([df, score], 1)

这就是6行代码&＃xff0c;计算出三科成绩总和。

首先第一行&＃xff1a;导入pandas&＃xff0c;不用多解释了吧&＃xff1f;

第二行&＃xff0c;利用pandas中带的read_excel方法读取刚才生成的excel文件。

注意到&＃xff0c;这里比起以前多了一个df &＃61; &＃xff0c;那么&＃xff0c;这是什么意思呢&＃xff1f;

简单来说&＃xff0c;你可以把df想象成一个箱子&＃xff0c;&＃61; 号的意义就是把pandas读取到的excel文件内容放到这个箱子里&＃xff0c;之后你通过df这个箱子&＃xff0c;对箱子里的内容进行操作。

所以第二行整体的意思就是&＃xff1a;我们生成了一个叫df的箱子&＃xff0c;然后&＃xff0c;利用pandas里面的read_excel这个函数&＃xff0c;读取到了刚才生成的excel表&＃xff0c;然后&＃xff0c;把这个excel表的内容存放到了df这个箱子里&＃xff0c;以便于后续操作。

第三行&＃xff0c;看起来很复杂&＃xff0c;其实很简单&＃xff0c;现在df里面已经装着excel了&＃xff0c;而我们想要取到它里面某一列的数据该怎么办呢&＃xff1f;很简单&＃xff0c;你可以自己试试&＃xff0c;运行一下&＃xff1a;

# 这样就会获取到数学那一列&＃xff0c;你可以改为语文&＃xff0c;英语、甚至姓名、年龄df[&＃39;数学&＃39;]

那我想要取多列怎么办&＃xff1f;

# 只需要把这一串[&＃39;语文&＃39;, &＃39;数学&＃39;, &＃39;英语&＃39;]替换给&＃39;数学&＃39;# 所以就变成了df[[&＃39;数学&＃39;, &＃39;语文&＃39;, &＃39;英语&＃39;]]

所以第三行就是&＃xff0c;生成了一个叫data的箱子&＃xff0c;把excel里面的语文、英语、数学三列提取出来&＃xff0c;放到data这个箱子里。

第四行&＃xff0c;现在data这个箱子里&＃xff0c;已经只有三列了&＃xff0c;那我们就可以放心大胆的计算这三列的总和&＃xff0c;只需要data.sum(1)&＃xff0c;就能得出求和的结果。所以就是&＃xff0c;把求和出来的结果&＃xff0c;放到score这个箱子里。

第五行&＃xff0c;就是给新计算出来的列取个名字&＃xff0c;我写的是总成绩&＃xff0c;你可以随便取&＃xff0c;如果没有这一行代码&＃xff0c;将来表格上就没有列名&＃xff0c;很丑。

第六行&＃xff0c;concat这个单词&＃xff0c;是连接的意思&＃xff0c;所以就是&＃xff0c;把求和后的score这个表(列)连接到原来的表屁股后面。

# 为了更好的说明&＃xff0c;我决定举个栗子# 这样&＃xff0c;就是把score 粘到df的屁股后面pandas.concat([df, score], 1)# 这样&＃xff0c;就是把df粘到score的屁股后面# 你都可以在jupyter上随便操作看看pandas.concat([score, df], 1)

这些代码你都可以发挥你的想象&＃xff0c;自己修改了看看&＃xff0c;不用担心&＃xff0c;电脑不会爆炸也不会死机。

可以注意到&＃xff0c;concat 和 sum 里面都一个数字1&＃xff0c;那么它又是什么意思呢&＃xff1f;

其实&＃xff0c;它就是控制求和的方向&＃xff0c;如果你填0&＃xff0c;它就会从上往下求和&＃xff0c;比如&＃xff1a;

data.sum(0)

这一行代码&＃xff0c;就会把所有人三科成绩的总和加起来&＃xff0c;运行效果如下

至于&＃xff0c;pandas.concat([score, df], 1) 这个函数中的1改成0会怎么样&＃xff1f;你可以改了试试&＃xff0c;以后会对它进行更深入的说明~

欢迎关注本公众号&＃xff0c;学习更多有趣的python数据分析小知识&＃xff01;

推荐阅读

object
第四章高阶函数（参数传递、高阶函数、lambda表达式）（python进阶）的讲解和应用

本文主要讲解了第四章高阶函数（参数传递、高阶函数、lambda表达式）的相关知识，包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念，并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说，本文将是一个不错的学习资料。 ... [详细]

蜡笔小新 2023-12-12 15:52:48
eval
使用FLASK REST API的机器学习模型

在本教程中，我们将看到如何使用FLASK制作第一个用于机器学习模型的RESTAPI。我们将从创建机器学习模型开始。然后，我们将看到使用Flask创建AP ... [详细]

蜡笔小新 2023-10-17 19:13:12
eval
词向量计算文本相似度,通过词向量求文本相似度

基于词向量计算文本相似度1.测试数据：链接：https:pan.baidu.coms1fXJjcujAmAwTfsuTg2CbWA提取码：f4vx2.实验代码：imp ... [详细]

蜡笔小新 2023-10-17 12:10:15
format
用pandas库修改excel文件里的内容，并把excel文件格式存为csv格式，再将csv格式改为html格式

假设有Excel文件data.xlsx，其中内容为： ID age height sex weight张三 1 39 181 female 85李四 2 40 180 male 80王五 3 38 178 female 78赵六 4 59 1 ... [详细]

蜡笔小新 2023-10-16 17:56:35
object
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
text
Python使用Pillow包生成验证码图片的方法

本文介绍了使用Python中的Pillow包生成验证码图片的方法。通过随机生成数字和符号，并添加干扰象素，生成一幅验证码图片。需要配置好Python环境，并安装Pillow库。代码实现包括导入Pillow包和随机模块，定义随机生成字母、数字和字体颜色的函数。 ... [详细]

蜡笔小新 2023-12-10 16:51:25
text
java drools5_Java Drools5.1 规则流基础【示例】（中）

五、规则文件及规则流EduInfoRule.drl:packagemyrules;importsample.Employ;ruleBachelorruleflow-group ... [详细]

蜡笔小新 2023-12-10 15:01:31
format
Python 教学 016

Python教学练习二Python1-12练习二一、判断季节用户输入月份，判断这个月是哪个季节？3，4，5月----春 ... [详细]

蜡笔小新 2023-12-09 08:28:13
php
开发笔记:Python之路第一篇：初识Python

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Python之路第一篇：初识Python相关的知识，希望对你有一定的参考价值。Python简介& ... [详细]

蜡笔小新 2023-10-17 18:58:48
format
利用PyTorch快速实现分类任务

关于如何快速定义自己的数据集，可以参考我的前一篇文章PyTorch中快速加载自定义数据（入门）_晨曦473的博客-CSDN博客刚开始学习P ... [详细]

蜡笔小新 2023-10-17 18:12:24
object
详解 Python 的二元算术运算，为什么说减法只是语法糖？[Python常见问题]

原题|UnravellingbinaryarithmeticoperationsinPython作者|BrettCannon译者|豌豆花下猫（“Python猫 ... [详细]

蜡笔小新 2023-10-17 15:28:24
object
数学建模入门python绘制频率直方图

文章目录例题数据处理绘图操作调用演示例题数据处理将以下的数据保存到磁盘上17275169551696417165167471716216867165521696216865 ... [详细]

蜡笔小新 2023-10-17 15:01:10
object
开发笔记:python协程的理解

篇首语：本文由编程笔记#小编为大家整理，主要介绍了python协程的理解相关的知识，希望对你有一定的参考价值。一、介绍什么是并发?并发的本质就是 ... [详细]

蜡笔小新 2023-10-17 14:16:13
object
批量重命名文件夹中的文件（python）

做实验需要重命名数据集的名字，有几个容易踩坑的地方和小技巧，总结一下importospathfilelistos.listdir(path)#文件夹路 ... [详细]

蜡笔小新 2023-10-17 08:42:05
object
mapbox矢量切片标准_下载python3中的mapbox向量切片,矢量

python3下载mapbox矢量切片通过观察mapbox的页面开发者工具里的network可以发现，打开矢量切片和字体切片pbf和prite图标的链接， ... [详细]

蜡笔小新 2023-10-16 21:46:42

七彩咩_131

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章