热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

面向初学者的PythonPandas–完整指南(第1部分)

面向初学者的PythonPandas-完整指南(第1部分)本系列文章PythonPandasforBeginner将是初学者学习pandas库的最佳起点

面向初学者的 Python Pandas - 完整指南(第 1 部分)

本系列文章Python Pandas for Beginner 将是初学者学习 pandas 库的最佳起点。您将学习一些最重要的 pandas 功能,例如探索、清理、转换和可视化数据。

Pandas是 Python 中的一个开源库。它是当今用于数据分析的最流行的 Python 库。强大的机器学习和可视化工具,它为您提供分析大数据集的高性能工具。

在这篇文章中,我们将介绍有关 pandas 的基本信息,从安装到优势。你应该给自己泡杯咖啡,拿你最喜欢的饼干。之后,慢慢享受和阅读这篇文章。随意停止并稍后继续,不要在短时间内被大量信息压倒。只要仔细一步一步,熊猫就会来找你。

初学者的 Python 熊猫

你好熊猫
(熊猫 - 来源:壁纸播放)

什么是熊猫?

Pandas是一个用于分析、数据处理和数据科学的库。这是一个拥有 1,500 多名贡献者的大型开源项目。这是GitHub 上 Pandas项目的链接

安装

安装 Pandas 的最简单方法是使用 Anaconda 发行版。您还没有安装 Anaconda,请阅读我们的 Anaconda 安装指南帖子。

如果不想安装 Anaconda,可以通过 pip 安装。

pip install pandas

Pandas 的数据结构

Pandas 的两个主要数据结构是SeriesDataFrame。当我们加入多个系列(列)时, ASeries只是一个列,所以我们有一个DataFrame.

Python Pandas 数据结构

Pandas 中的 Series 和 DataFrame

创建您的系列和数据框

系列入门

首先,通过传递值列表来创建系列数据。Pandas 默认从 0 开始计算索引。

import numpy as np
import pandas as pddata_series = pd.Series([1, 9, 3, np.nan, 8])
print(data_series)""" Output:
0 1.0
1 9.0
2 3.0
3 NaN
4 8.0
dtype: float64
"""

以最简单的方式创建 DataFrame

要创建 DataFrame,Python 中有很多方法。但是,最简单的方法是创建一个dict. 之后,将字典数据传递给 DataFrame 构造函数,它将完成这项工作。

import pandas as pddata = {'Paris': [3, 2, 0, 1], 'Berlin': [0, 3, 7, 2]
}purchases = pd.DataFrame(data)
print(purchases)""" Output:Paris Berlin
0 3 0
1 2 3
2 0 7
3 1 2
"""

使用 Numpy 创建 DataFrame

将 Numpy 数组、日期时间数据作为索引和列标签传递给 DataFrame 构造函数:

import numpy as np
import pandas as pddates = pd.date_range('20191001', periods=6)
dataframe = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(dataframe)""" Output:A B C D
2019-10-01 0.304466 -0.699206 -2.090317 1.564566
2019-10-02 -0.876682 0.876720 1.275542 -0.757827
2019-10-03 0.029740 -1.282535 -0.420332 -1.176261
2019-10-04 -0.153740 -0.087788 1.314169 -1.835564
2019-10-05 0.301839 0.036301 0.138372 1.755769
2019-10-06 1.546020 -0.148291 0.781045 -1.789371
"""

在示例中,我们可以看到index它将表示行标签。换句话说,column参数用于列标签。

参考

我们在创建系列时使用了以下文档作为参考。如果您喜欢使用 Pandas,也许您应该阅读它。

  • 熊猫官方文档

第 1 部分总结

通过本系列的第一部分 Python Pandas for Beginners,你基本了解了什么是 pandas 以及如何通过 pip 或 Anaconda 安装它。此外,您可以创建数据系列或数据框。

在第 2 部分中,您将学习如何从 JSON 文件中读取 pandas 数据,以及 pandas 的一些重要操作。

下一篇文章见,如果你喜欢这个系列,请分享给其他 Python Geeks。给我们留下评论,以帮助我们在下一篇文章中改进。

如果对Python有兴趣,想了解更多的Python以及AIoT知识,解决测试问题,以及入门指导,帮你解决学习Python中遇到的困惑,我们这里有技术高手。如果你正在找工作或者刚刚学校出来,又或者已经工作但是经常觉得难点很多,觉得自己Python方面学的不够精想要继续学习的,想转行怕学不会的, 都可以加入我们,可领取最新Python大厂面试资料和Python爬虫、人工智能、学习资料!微信公众号【Python大本营】等你来玩奥~



推荐阅读
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 机器学习中的标准化缩放、最小-最大缩放及鲁棒缩放技术解析 ... [详细]
  • 如何使用mysql_nd:Python连接MySQL数据库的优雅指南
    无论是进行机器学习、Web开发还是爬虫项目,数据库操作都是必不可少的一环。本文将详细介绍如何使用Python通过 `mysql_nd` 库与 MySQL 数据库进行高效连接和数据交互。内容涵盖以下几个方面: ... [详细]
  • 利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Exce ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 解决问题:1、批量读取点云las数据2、点云数据读与写出3、csf滤波分类参考:https:github.comsuyunzzzCSF论文题目ÿ ... [详细]
  • 本文介绍了如何利用 `matplotlib` 库中的 `FuncAnimation` 类将 Python 中的动态图像保存为视频文件。通过详细解释 `FuncAnimation` 类的参数和方法,文章提供了多种实用技巧,帮助用户高效地生成高质量的动态图像视频。此外,还探讨了不同视频编码器的选择及其对输出文件质量的影响,为读者提供了全面的技术指导。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • Python 程序转换为 EXE 文件:详细解析 .py 脚本打包成独立可执行文件的方法与技巧
    在开发了几个简单的爬虫 Python 程序后,我决定将其封装成独立的可执行文件以便于分发和使用。为了实现这一目标,首先需要解决的是如何将 Python 脚本转换为 EXE 文件。在这个过程中,我选择了 Qt 作为 GUI 框架,因为之前对此并不熟悉,希望通过这个项目进一步学习和掌握 Qt 的基本用法。本文将详细介绍从 .py 脚本到 EXE 文件的整个过程,包括所需工具、具体步骤以及常见问题的解决方案。 ... [详细]
  • 通过使用 `pandas` 库中的 `scatter_matrix` 函数,可以有效地绘制出多个特征之间的两两关系。该函数不仅能够生成散点图矩阵,还能通过参数如 `frame`、`alpha`、`c`、`figsize` 和 `ax` 等进行自定义设置,以满足不同的可视化需求。此外,`diagonal` 参数允许用户选择对角线上的图表类型,例如直方图或密度图,从而提供更多的数据洞察。 ... [详细]
  • 利用 Python Socket 实现 ICMP 协议下的网络通信
    在计算机网络课程的2.1实验中,学生需要通过Python Socket编程实现一种基于ICMP协议的网络通信功能。与操作系统自带的Ping命令类似,该实验要求学生开发一个简化的、非标准的ICMP通信程序,以加深对ICMP协议及其在网络通信中的应用的理解。通过这一实验,学生将掌握如何使用Python Socket库来构建和解析ICMP数据包,并实现基本的网络探测功能。 ... [详细]
  • 本指南介绍了 `requests` 库的基本使用方法,详细解释了其七个主要函数。其中,`requests.request()` 是构建请求的基础方法,支持其他高级功能的实现。此外,我们还重点介绍了如何使用 `requests.get()` 方法来获取 HTML 网页内容,这是进行网页数据抓取和解析的重要步骤。通过这些基础方法,读者可以轻松上手并掌握网页数据抓取的核心技巧。 ... [详细]
  • 每年,意甲、德甲、英超和西甲等各大足球联赛的赛程表都是球迷们关注的焦点。本文通过 Python 编程实现了一种生成赛程表的方法,该方法基于蛇形环算法。具体而言,将所有球队排列成两列的环形结构,左侧球队对阵右侧球队,首支队伍固定不动,其余队伍按顺时针方向循环移动,从而确保每场比赛不重复。此算法不仅高效,而且易于实现,为赛程安排提供了可靠的解决方案。 ... [详细]
  • 本文介绍了UUID(通用唯一标识符)的概念及其在JavaScript中生成Java兼容UUID的代码实现与优化技巧。UUID是一个128位的唯一标识符,广泛应用于分布式系统中以确保唯一性。文章详细探讨了如何利用JavaScript生成符合Java标准的UUID,并提供了多种优化方法,以提高生成效率和兼容性。 ... [详细]
  • Python 实战:异步爬虫(协程技术)与分布式爬虫(多进程应用)深入解析
    本文将深入探讨 Python 异步爬虫和分布式爬虫的技术细节,重点介绍协程技术和多进程应用在爬虫开发中的实际应用。通过对比多进程和协程的工作原理,帮助读者理解两者在性能和资源利用上的差异,从而在实际项目中做出更合适的选择。文章还将结合具体案例,展示如何高效地实现异步和分布式爬虫,以提升数据抓取的效率和稳定性。 ... [详细]
author-avatar
木扎尔特2502918527
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有