当前位置: 开发笔记 > 编程语言 > 正文

python对excel增删改查_Python（数据分析篇）Pandas框架【一】DataFrame数据创建以及元素的增删改查...

作者：菜鸟 | 来源：互联网 | 2023-10-17 14:45

文章目录前言pandas主要分为如下几个阶段：表格数据操作：增删改查实现多个表格的处理数据清洗操作：缺失值、重复值、异常值、数据标准化、数

文章目录

前言

pandas主要分为如下几个阶段&＃xff1a;

表格数据操作&＃xff1a;增删改查

实现多个表格的处理

数据清洗操作&＃xff1a;缺失值、重复值、异常值、数据标准化、数据转换的操作&＃xff1b;

实现所有的excel的特殊操作&＃xff1a;生成透视表&＃xff0c;交叉表&＃xff1b;

完成统计分析&＃xff1b;

首先&＃xff0c;导入相应模块

import pandas as pd

import numpy as np

一、构建dataframe

dataframe是一种表格型数据结构&＃xff0c;拥有axis&＃61;0&＃xff0c;axis&＃61;1()&＃xff0c;所以dataframe类型肯定是二维的

方法一&＃xff1a;

df &＃61; pd.DataFrame(data&＃61;[[&＃39;ss&＃39;,20,&＃39;男&＃39;,&＃39;0831&＃39;],[&＃39;zs&＃39;,22,&＃39;男&＃39;,&＃39;0831&＃39;],[&＃39;lh&＃39;,21,&＃39;女&＃39;,&＃39;0831&＃39;]], index&＃61;[&＃39;a&＃39;,&＃39;b&＃39;,&＃39;c&＃39;], columns&＃61;[&＃39;name&＃39;,&＃39;age&＃39;,&＃39;gender&＃39;,&＃39;class&＃39;])

说明&＃xff1a;

index&＃xff1a;行索引&＃xff0c;可以不写

columns&＃xff1a;列索引&＃xff0c;必须得写

data&＃xff1a;数据

方法二&＃xff1a;

pd.DataFrame(data&＃61;{

&＃39;name&＃39;:[&＃39;ss&＃39;,&＃39;zs&＃39;,&＃39;lh&＃39;],

&＃39;age&＃39;:[20,22,21],

&＃39;gender&＃39;:[&＃39;男&＃39;,&＃39;男&＃39;,&＃39;女&＃39;],

&＃39;class&＃39;:[&＃39;0831&＃39;,&＃39;0831&＃39;,&＃39;0831&＃39;]

})

生成的表格&＃xff1a;

ageclassgendername0200831男ss

1220831男zs

2210831女lh

二、dataframe属性

1.结构

print(&＃39;结构&＃xff1a;&＃39;,df.shape)

结构&＃xff1a; (3, 4)

2.维度

print(df.ndim)

3.元素个数

print(df.size)

4.元素类型

print(df.dtypes)

name object

age int64

gender object

class object

dtype: object

5.查看列索引

print(df.columns)

Index([&＃39;name&＃39;, &＃39;age&＃39;, &＃39;gender&＃39;, &＃39;class&＃39;], dtype&＃61;&＃39;object&＃39;)

6.查看行索引

print(df.index)

Index([&＃39;a&＃39;, &＃39;b&＃39;, &＃39;c&＃39;], dtype&＃61;&＃39;object&＃39;)

7.查看数据

print(df.values)

print(type(df.values)) #

[[&＃39;ss&＃39; 20 &＃39;男&＃39; &＃39;0831&＃39;]

[&＃39;zs&＃39; 22 &＃39;男&＃39; &＃39;0831&＃39;]

[&＃39;lh&＃39; 21 &＃39;女&＃39; &＃39;0831&＃39;]]

三、元素操作

1、dataframe查找

(1) 一维切片

df[&＃39;name&＃39;]

# 切完是一维的&＃xff0c;返回的是series类型&＃xff0c;仅限于一列值的查找

(2) 二维切片

df[[&＃39;name&＃39;]]

# 切完是二维的&＃xff0c;返回的是dataframe类型

输出结果&＃xff1a;仅有一列值的表格

nameass

bzs

clh

(3)索引切片&＃xff1a;

语法&＃xff1a;df.loc [ 行索引名称/条件&＃xff0c;列的索引名称 ]

# df.loc[&＃39;a&＃39;,&＃39;name&＃39;]

df.loc[&＃39;a&＃39;,:] # 返回一维series类型

df.loc[[&＃39;a&＃39;,&＃39;b&＃39;],&＃39;name&＃39;] # 行(列)其中一个传入列表&＃xff0c;返回一维series类型

输出&＃xff1a;

a ss

b zs

Name: name, dtype: object

行(列)两个都传入列表类型&＃xff0c;返回二维dataframe类型

print(df.loc[[&＃39;a&＃39;,&＃39;b&＃39;],[&＃39;name&＃39;,&＃39;age&＃39;]])

输出&＃xff1a;

name age

a ss 20

b zs 22

(4)条件切片

使用mask&＃xff0c;生成bool值表格&＃xff0c;根据布尔值取值

# 获取所有年龄大于18岁的同学

mask &＃61; df[&＃39;age&＃39;]>18

print(mask)

df.loc[mask,&＃39;name&＃39;]

df.loc[mask,[&＃39;name&＃39;,&＃39;class&＃39;]]

布尔值mask表格&＃xff1a;

a True

b True

c True

Name: age, dtype: bool

根据mask取出的表格&＃xff1a;

nameclassass0831

bzs0831

clh0831

例2&＃xff1a;

mask可以联合使用&＃xff0c;使用逻辑符进行连接

# 获取所有年龄大于18岁的女同学

mask1 &＃61; df[&＃39;age&＃39;]>18

mask2 &＃61; df[&＃39;gender&＃39;] &＃61;&＃61; &＃39;女&＃39;

mask &＃61; mask1 & mask2 # 位运算符(&&＃xff1a;且&＃xff1b;|&＃xff1a;或)

df.loc[mask,:]

nameagegenderclassclh21女0831

(5)索引切片

df.iloc[行的位置索引&＃xff0c;列的位置索引]

# df.iloc[:2,2:] # 前闭后开

df.iloc[-1,:].index

Index([&＃39;name&＃39;, &＃39;age&＃39;, &＃39;gender&＃39;, &＃39;class&＃39;], dtype&＃61;&＃39;object&＃39;)

2、dataframe增加方法

(1)添加一列

# 分别给每一个元素添加address

df[&＃39;address&＃39;] &＃61; [&＃39;北京&＃39;,&＃39;上海&＃39;,&＃39;北京&＃39;]

print(df)

输出&＃xff1a;

name age gender class address

a ss 20 男 0831 北京

b zs 22 男 0831 上海

c lh 21 女 0831 北京

当给一个值时&＃xff0c;可将所有元素的address改为同一个值

df[&＃39;address&＃39;] &＃61; &＃39;北京&＃39;

print(df)

输出&＃xff1a;

name age gender class address

a ss 20 男 0831 北京

b zs 22 男 0831 北京

c lh 21 女 0831 北京

(2)添加一行

使用append方法

df_mini &＃61; pd.DataFrame(data&＃61;{

&＃39;name&＃39;:[&＃39;ss&＃39;,&＃39;zs&＃39;,&＃39;lh&＃39;],

&＃39;age&＃39;:[20,22,21],

&＃39;gender&＃39;:[&＃39;男&＃39;,&＃39;男&＃39;,&＃39;女&＃39;],

&＃39;class&＃39;:[&＃39;0831&＃39;,&＃39;0831&＃39;,&＃39;0831&＃39;]})

# df.append(df_mini)

df2 &＃61; df.append(df_mini,ignore_index&＃61;True)

说明&＃xff1a;

ignore_index&＃61;True&＃xff1a;表示忽略原始索引&＃xff0c;重新设置索引

添加时&＃xff0c;原始表格不会变化&＃xff0c;返回一个合并后的表格

3、dataframe删除方法

语法&＃xff1a;df.drop(labels, axis&＃61;0, level&＃61;None, inplace&＃61;False, errors&＃61;‘raise’)

说明&＃xff1a;

labels&＃xff1a;删除的哪一行(列)&＃xff0c;使用索引

axis&＃xff1a;删行(列)

inplace&＃xff1a;False默认不修改原表&＃xff0c;True表示修改原表

# 删除某些列

df2.drop(labels&＃61;[&＃39;address&＃39;,&＃39;class&＃39;],axis&＃61;1)

返回删除之后的表格

agegendername020男ss

122男zs

221女lh

320男ss

422男zs

521女lh

# 删除某些行

df2.drop(labels &＃61; [0,1,2],axis&＃61;0)

删除行还是列&＃xff0c;根据axis决定

addressageclassgendername3NaN200831男ss

4NaN220831男zs

5NaN210831女lh

4、dataframe更该数值方法

# 例&＃xff1a;将名字为‘lh’的人的班级改为‘有问题’

df.loc[df[&＃39;name&＃39;]&＃61;&＃61;&＃39;lh&＃39;,&＃39;class&＃39;] &＃61; &＃39;有问题&＃39;

print(df)

输出&＃xff1a;

name age gender class address

a ss 20 男 0831 北京

b zs 22 男 0831 北京

c lh 21 女有问题北京

推荐阅读

input
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
input
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
main
Python 文件操作与数据转换

本文详细介绍了Python中文件的基本操作，包括打开、读取、写入和关闭文件的方法，并通过实例展示了如何将Excel文件转换为CSV文件以及进一步转换为HTML文件。此外，还涉及了成绩等级替换的具体实现。 ... [详细]

蜡笔小新 2024-12-25 21:45:13
bit
Python 中读取文件和图片的元数据日期

本文介绍如何使用 Python 获取文件和图片的创建、修改及拍摄日期。通过多种方法，如 PIL 库的 _getexif() 函数和 os 模块的 getmtime() 和 stat() 方法，详细讲解了这些技术的应用场景和注意事项。 ... [详细]

蜡笔小新 2024-12-25 13:04:12
int
Python 使用 xlrd 库读取 Excel 文件

本文介绍如何使用 Python 的 xlrd 库读取 Excel 文件，并将其数据处理后存储到数据库中。通过实际案例，详细讲解了文件路径、合并单元格处理等常见问题。 ... [详细]

蜡笔小新 2024-12-24 17:29:27
int
Python Pandas 库中的 Series.round() 方法详解

本文介绍如何使用 Python 的 Pandas 库中 Series 对象的 round() 方法，对数值进行四舍五入处理。该方法在数据预处理和分析中非常有用。 ... [详细]

蜡笔小新 2024-12-23 12:13:19
timestamp
python时间序列之ADF检验(1)

读取数据，pd.read_csv默认生成DataFrame对象，需将其转换成Series对象DataFrame和Series是pandas中最常见的2 ... [详细]

蜡笔小新 2024-12-19 18:56:32
main
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
input
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
int
探索Python在STM32平台上的高效编程与应用

本文详细解析了如何使用Python语言在STM32硬件平台上实现高效的编程和快速的应用开发。通过具体的代码示例，展示了Python简洁而强大的特性。 ... [详细]

蜡笔小新 2024-12-27 12:54:18
int
掌握远程执行Linux脚本和命令的技巧

本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令，帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释，让初学者也能轻松上手。 ... [详细]

蜡笔小新 2024-12-26 19:47:05
main
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
input
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
request
Python 爬虫基础教程及代码实例

根据最新发布的《互联网人才趋势报告》，尽管大量IT从业者已转向Python开发，但随着人工智能和大数据领域的迅猛发展，仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-26 10:42:40
jsp
Python文本处理与可视化：分词及词云生成

本文介绍如何使用Python进行文本处理，包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图，展示文本数据的可视化分析方法。 ... [详细]

蜡笔小新 2024-12-26 08:37:18

菜鸟

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章