数据分析之pandas系列

作者：飞跃星空2502906253 | 来源：互联网 | 2023-08-10 09:43

文章目录Pandas1.关于pandas2.pandas基础2.1pandas读取和写出数据2.2Series和Dataframe2.3各类排序3.索引3.1布尔索引3.2去重函数

文章目录

Pandas
- 1. 关于pandas
- 2. pandas基础
- - 2.1 pandas读取和写出数据
  - 2.2 Series和Dataframe
  - 2.3 各类排序
- 3. 索引
- - 3.1 布尔索引
  - 3.2 去重函数

Pandas

1. 关于pandas

pandas是python中一个最重要的第三方库之一&＃xff0c;将pandas使用得当是python学的怎么样的一个直接体现。现实中大多人使用excel预处理和观察数据&＃xff0c;但是一旦数据量超过一定的水平&＃xff0c;excel处理就变得棘手(例如随着数据的增加excel运行的速度明显慢于python&＃xff0c;python处理数据有着excel不具有的功能&＃xff0c;如当数据缺失或者数据异常时&＃xff0c;利用python能轻松的得出这些异常数据并加以处理)

2. pandas基础

2.1 pandas读取和写出数据

现在的场景是手上有一个csv格式的数据:
在这里插入图片描述
接下来用python读入数据

import pandas as pd #导入pandas df&＃61;pd.read_csv(&＃39;D:/BaiduNetdiskDownload/joyful-pandas-master/data/table.csv&＃39;) #第一个参数为数据文件目录 df.head()#查看数据前5行

在这里插入图片描述
假设你读入数据并处理完后想要把处理后的数据还原给原本的csv文件。

df.to_csv(&＃39;你想输入的目录&＃39;)

2.2 Series和Dataframe

Series就是一列数据(例如上表中任意一列&＃xff0c;如School或Class…)&＃xff0c;注意Series只代表一列&＃xff0c;而dataframe则更广泛&＃xff0c;代表多列。他们共同具有的属性是索引index&＃xff0c;dataframe有columns名(表头)。

2.3 各类排序

对df数据集中的身高进行排序:

df.sort_values(by&＃61;&＃39;Height&＃39;,ascending&＃61;True) &＃39;&＃39;&＃39; by:对哪一列排序 ascending:是否升序 &＃39;&＃39;&＃39;

在这里插入图片描述
可以看出数据集按Height升序输出

3. 索引

3.1 布尔索引

iloc和loc是对数据索引切片的常用方法
比如想单独取出一列(以Weight为例)

&＃39;&＃39;&＃39; 两种方式第一个参数:行索引 loc 第二个参数:列名 iloc 第二个参数:第几列 &＃39;&＃39;&＃39; #df.loc[:,&＃39;Weight&＃39;] df.iloc[:,6]

在这里插入图片描述
其他切片方式:布尔索引
比如现在想对求出男性的平均身高的体重

df[[&＃39;Height&＃39;,&＃39;Weight&＃39;]][df[&＃39;Gender&＃39;]&＃61;&＃61;&＃39;M&＃39;].mean()

在这里插入图片描述
逐一对以上代码解析&＃xff0c;df[‘Gender’]&＃61;&＃61;&＃39;M’输出布尔向量

而df[[‘Height’,‘Weight’]]代表取这两列&＃xff0c;df[[‘Height’,‘Weight’]][df[‘Gender’] &＃61;&＃61; ‘M’]指的是两列数据取对应True值的位置。随后求平均数。

3.2 去重函数

数据中可能存在错误的重复值&＃xff08;例如ID是唯一标识符&＃xff0c;不太可能有重复&＃xff09;如果数据中有重复可以用以下语句去重

&＃39;&＃39;&＃39; subset:对哪一列去重 keep: first&＃xff0c;保留重复的第一个数 inplace: 去重后的数据替换原来重复的数据集 &＃39;&＃39;&＃39; df.drop_duplicates(subset&＃61;[&＃39;ID&＃39;],keep&＃61;&＃39;first&＃39;,inplace&＃61;True)

推荐阅读

header
[pandas]高级使用

目录读写文本格式序列化使用数据库合并数据集重塑和轴向旋转数据转换读写文本格式CSV（Comma-SeparatedValues）格式的文件是指以纯文本形式存储的表格数据，这意味着不 ... [详细]

蜡笔小新 2024-09-30 11:32:48
import
如何从列表中删除所有零？

本文介绍了如何使用python从列表中删除所有的零，并将结果以列表形式输出，同时提供了示例格式。 ... [详细]

蜡笔小新 2023-12-13 13:02:00
io
Pandas 基础(3) - 生成 Dataframe 的几种方式总结

本文总结了使用不同方式生成 Dataframe 的方法，包括通过CSV文件、Excel文件、python dictionary、List of tuples和List of dictionary。同时介绍了一些注意事项，如使用绝对路径引入文件和安装xlrd包来读取Excel文件。 ... [详细]

蜡笔小新 2023-12-10 12:59:34
import
pythonMatplotlib(二)

Matplotlib+pandas作图一、对csv文件进行提取ruixi.csv对上述表格进行提取并做图画出图像二、对.xlsx进行提取:rui ... [详细]

蜡笔小新 2023-10-17 15:51:22
import
干货 | 滴滴数据分析原来是这样做的！

干货,滴滴,数据,分析, ... [详细]

蜡笔小新 2024-09-28 15:43:44
import
python 解决多张相同的excel取某一些数据合同到一张EXCEL

这样的表单有几百张把姓名和从事专业类别代码的值取出合并到一张总表里importpandasaspdimportos#第一步读取文件储存在是s列表中pathD:001#文件夹目录fi ... [详细]

蜡笔小新 2024-09-25 20:10:39
header
R语言基础_数据导入&保存

数据分析文件常用的储存格式为CSV(.csv)和EXCEL(.xlsx)，其余文 ... [详细]

蜡笔小新 2024-09-25 10:28:05
import
Python强化知识之xlwt（三）

xlwt是Python用来在Excel写入数据和格式化数据的工具包简单使用#0.导入xlst模块importxlwt#1.创建Workbookwbxlwt.Workbook ... [详细]

蜡笔小新 2024-09-25 04:06:24
import
Python实现批量文件整理的示例代码_python

批量文件整理一直是日常工作中令人头疼的事，使用 Python 进行大批量文件整理，可以大大提升工作效率。本文主要介绍了利用Python实现文件的重命名和删除，感兴趣 ... [详细]

蜡笔小新 2024-09-24 17:19:11
import
Python对Excel文件的读取方法及模块安装

本文介绍了Python对Excel文件的读取方法，包括模块的安装和使用。通过安装xlrd、xlwt、xlutils、pyExcelerator等模块，可以实现对Excel文件的读取和处理。具体的读取方法包括打开excel文件、抓取所有sheet的名称、定位到指定的表单等。本文提供了两种定位表单的方式，并给出了相应的代码示例。 ... [详细]

蜡笔小新 2023-12-14 19:49:05
import
Python3中选择文件对话框的格式打开和保存图片

本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数，可以方便地选择要打开或保存的图片文件，并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]

蜡笔小新 2023-12-14 17:46:55
import
以下不是python文件读写方法的是Python 文件I/O

Python文件IO本章只讲述所有基本的IO函数，更多函数请参考Python标准文档。打印到屏幕最简单的输出方法是用print语句，你可以给它传递 ... [详细]

蜡笔小新 2024-09-30 14:49:29
import
使用 Python 中的 Plotly 绘制三维网格图

使用Python中的Plotly绘制三维网格图原文:ht ... [详细]

蜡笔小新 2024-09-28 04:18:17
import
基于python爬虫的论文的开题报告_基于python的新闻网站网络爬虫设计与实现开题报告...

1.研究背景及其意义互联网从发展到至今，已经深入到人们的日常生活中，并且不论老人还是小孩，多少都会接触到互联网。在这个越来越信息化的社会& ... [详细]

蜡笔小新 2024-09-27 16:52:06
import
svnWebUI：一款现代化的svn服务端管理软件

svnWebUI是一款图形化管理服务端Subversion的配置工具，适用于非程序员使用。它解决了svn用户和权限配置繁琐且不便的问题，提供了现代化的web界面，让svn服务端管理变得轻松。演示地址：http://svn.nginxwebui.cn:6060。 ... [详细]

蜡笔小新 2023-12-11 11:01:10

飞跃星空2502906253

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章