面向初学者的 Python Pandas - 完整指南(第 1 部分)
本系列文章Python Pandas for Beginner 将是初学者学习 pandas 库的最佳起点。您将学习一些最重要的 pandas 功能,例如探索、清理、转换和可视化数据。
Pandas是 Python 中的一个开源库。它是当今用于数据分析的最流行的 Python 库。强大的机器学习和可视化工具,它为您提供分析大数据集的高性能工具。
在这篇文章中,我们将介绍有关 pandas 的基本信息,从安装到优势。你应该给自己泡杯咖啡,拿你最喜欢的饼干。之后,慢慢享受和阅读这篇文章。随意停止并稍后继续,不要在短时间内被大量信息压倒。只要仔细一步一步,熊猫就会来找你。
你好熊猫
(熊猫 - 来源:壁纸播放)
什么是熊猫?
Pandas是一个用于分析、数据处理和数据科学的库。这是一个拥有 1,500 多名贡献者的大型开源项目。这是GitHub 上 Pandas项目的链接
安装
安装 Pandas 的最简单方法是使用 Anaconda 发行版。您还没有安装 Anaconda,请阅读我们的 Anaconda 安装指南帖子。
如果不想安装 Anaconda,可以通过 pip 安装。
pip install pandas
Pandas 的数据结构
Pandas 的两个主要数据结构是Series
和DataFrame
。当我们加入多个系列(列)时, ASeries
只是一个列,所以我们有一个DataFrame
.
Pandas 中的 Series 和 DataFrame
创建您的系列和数据框
系列入门
首先,通过传递值列表来创建系列数据。Pandas 默认从 0 开始计算索引。
import numpy as np
import pandas as pddata_series = pd.Series([1, 9, 3, np.nan, 8])
print(data_series)""" Output:
0 1.0
1 9.0
2 3.0
3 NaN
4 8.0
dtype: float64
"""
以最简单的方式创建 DataFrame
要创建 DataFrame,Python 中有很多方法。但是,最简单的方法是创建一个dict
. 之后,将字典数据传递给 DataFrame 构造函数,它将完成这项工作。
import pandas as pddata = {'Paris': [3, 2, 0, 1], 'Berlin': [0, 3, 7, 2]
}purchases = pd.DataFrame(data)
print(purchases)""" Output:Paris Berlin
0 3 0
1 2 3
2 0 7
3 1 2
"""
使用 Numpy 创建 DataFrame
将 Numpy 数组、日期时间数据作为索引和列标签传递给 DataFrame 构造函数:
import numpy as np
import pandas as pddates = pd.date_range('20191001', periods=6)
dataframe = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(dataframe)""" Output:A B C D
2019-10-01 0.304466 -0.699206 -2.090317 1.564566
2019-10-02 -0.876682 0.876720 1.275542 -0.757827
2019-10-03 0.029740 -1.282535 -0.420332 -1.176261
2019-10-04 -0.153740 -0.087788 1.314169 -1.835564
2019-10-05 0.301839 0.036301 0.138372 1.755769
2019-10-06 1.546020 -0.148291 0.781045 -1.789371
"""
在示例中,我们可以看到index
它将表示行标签。换句话说,column
参数用于列标签。
参考
我们在创建系列时使用了以下文档作为参考。如果您喜欢使用 Pandas,也许您应该阅读它。
- 熊猫官方文档
第 1 部分总结
通过本系列的第一部分 Python Pandas for Beginners,你基本了解了什么是 pandas 以及如何通过 pip 或 Anaconda 安装它。此外,您可以创建数据系列或数据框。
在第 2 部分中,您将学习如何从 JSON 文件中读取 pandas 数据,以及 pandas 的一些重要操作。
下一篇文章见,如果你喜欢这个系列,请分享给其他 Python Geeks。给我们留下评论,以帮助我们在下一篇文章中改进。
如果对Python有兴趣,想了解更多的Python以及AIoT知识,解决测试问题,以及入门指导,帮你解决学习Python中遇到的困惑,我们这里有技术高手。如果你正在找工作或者刚刚学校出来,又或者已经工作但是经常觉得难点很多,觉得自己Python方面学的不够精想要继续学习的,想转行怕学不会的, 都可以加入我们,可领取最新Python大厂面试资料和Python爬虫、人工智能、学习资料!微信公众号【Python大本营】等你来玩奥~