热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

面向初学者的PythonPandas–完整指南(第1部分)

面向初学者的PythonPandas-完整指南(第1部分)本系列文章PythonPandasforBeginner将是初学者学习pandas库的最佳起点

面向初学者的 Python Pandas - 完整指南(第 1 部分)

本系列文章Python Pandas for Beginner 将是初学者学习 pandas 库的最佳起点。您将学习一些最重要的 pandas 功能,例如探索、清理、转换和可视化数据。

Pandas是 Python 中的一个开源库。它是当今用于数据分析的最流行的 Python 库。强大的机器学习和可视化工具,它为您提供分析大数据集的高性能工具。

在这篇文章中,我们将介绍有关 pandas 的基本信息,从安装到优势。你应该给自己泡杯咖啡,拿你最喜欢的饼干。之后,慢慢享受和阅读这篇文章。随意停止并稍后继续,不要在短时间内被大量信息压倒。只要仔细一步一步,熊猫就会来找你。

初学者的 Python 熊猫

你好熊猫
(熊猫 - 来源:壁纸播放)

什么是熊猫?

Pandas是一个用于分析、数据处理和数据科学的库。这是一个拥有 1,500 多名贡献者的大型开源项目。这是GitHub 上 Pandas项目的链接

安装

安装 Pandas 的最简单方法是使用 Anaconda 发行版。您还没有安装 Anaconda,请阅读我们的 Anaconda 安装指南帖子。

如果不想安装 Anaconda,可以通过 pip 安装。

pip install pandas

Pandas 的数据结构

Pandas 的两个主要数据结构是SeriesDataFrame。当我们加入多个系列(列)时, ASeries只是一个列,所以我们有一个DataFrame.

Python Pandas 数据结构

Pandas 中的 Series 和 DataFrame

创建您的系列和数据框

系列入门

首先,通过传递值列表来创建系列数据。Pandas 默认从 0 开始计算索引。

import numpy as np
import pandas as pddata_series = pd.Series([1, 9, 3, np.nan, 8])
print(data_series)""" Output:
0 1.0
1 9.0
2 3.0
3 NaN
4 8.0
dtype: float64
"""

以最简单的方式创建 DataFrame

要创建 DataFrame,Python 中有很多方法。但是,最简单的方法是创建一个dict. 之后,将字典数据传递给 DataFrame 构造函数,它将完成这项工作。

import pandas as pddata = {'Paris': [3, 2, 0, 1], 'Berlin': [0, 3, 7, 2]
}purchases = pd.DataFrame(data)
print(purchases)""" Output:Paris Berlin
0 3 0
1 2 3
2 0 7
3 1 2
"""

使用 Numpy 创建 DataFrame

将 Numpy 数组、日期时间数据作为索引和列标签传递给 DataFrame 构造函数:

import numpy as np
import pandas as pddates = pd.date_range('20191001', periods=6)
dataframe = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(dataframe)""" Output:A B C D
2019-10-01 0.304466 -0.699206 -2.090317 1.564566
2019-10-02 -0.876682 0.876720 1.275542 -0.757827
2019-10-03 0.029740 -1.282535 -0.420332 -1.176261
2019-10-04 -0.153740 -0.087788 1.314169 -1.835564
2019-10-05 0.301839 0.036301 0.138372 1.755769
2019-10-06 1.546020 -0.148291 0.781045 -1.789371
"""

在示例中,我们可以看到index它将表示行标签。换句话说,column参数用于列标签。

参考

我们在创建系列时使用了以下文档作为参考。如果您喜欢使用 Pandas,也许您应该阅读它。

  • 熊猫官方文档

第 1 部分总结

通过本系列的第一部分 Python Pandas for Beginners,你基本了解了什么是 pandas 以及如何通过 pip 或 Anaconda 安装它。此外,您可以创建数据系列或数据框。

在第 2 部分中,您将学习如何从 JSON 文件中读取 pandas 数据,以及 pandas 的一些重要操作。

下一篇文章见,如果你喜欢这个系列,请分享给其他 Python Geeks。给我们留下评论,以帮助我们在下一篇文章中改进。

如果对Python有兴趣,想了解更多的Python以及AIoT知识,解决测试问题,以及入门指导,帮你解决学习Python中遇到的困惑,我们这里有技术高手。如果你正在找工作或者刚刚学校出来,又或者已经工作但是经常觉得难点很多,觉得自己Python方面学的不够精想要继续学习的,想转行怕学不会的, 都可以加入我们,可领取最新Python大厂面试资料和Python爬虫、人工智能、学习资料!微信公众号【Python大本营】等你来玩奥~



推荐阅读
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 本文详细介绍了如何使用Python编写爬虫程序,从豆瓣电影Top250页面抓取电影信息。文章涵盖了从基础的网页请求到处理反爬虫机制,再到多页数据抓取的全过程,并提供了完整的代码示例。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 扫描线三巨头 hdu1928hdu 1255  hdu 1542 [POJ 1151]
    学习链接:http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想,后期可以求解很 ... [详细]
  • 本文详细介绍了Java中org.w3c.dom.Text类的splitText()方法,通过多个代码示例展示了其实际应用。该方法用于将文本节点在指定位置拆分为两个节点,并保持在文档树中。 ... [详细]
  • 解决微信电脑版无法刷朋友圈问题:使用安卓远程投屏方案
    在工作期间想要浏览微信和朋友圈却不太方便?虽然微信电脑版目前不支持直接刷朋友圈,但通过远程投屏技术,可以轻松实现在电脑上操作安卓设备的功能。 ... [详细]
  • 从零开始构建完整手机站:Vue CLI 3 实战指南(第一部分)
    本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点,并确保这些内容与实际工作中的需求紧密结合。 ... [详细]
  • 基于KVM的SRIOV直通配置及性能测试
    SRIOV介绍、VF直通配置,以及包转发率性能测试小慢哥的原创文章,欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]
  • 在学习网页爬虫时,使用Selenium进行自动化操作。初次安装selenium模块后,第二天运行代码时遇到了ImportError:无法从'selenium'导入名称'webdriver'。本文将详细解释该问题的原因及解决方案。 ... [详细]
  • 本文介绍如何使用 Python 的 xlrd 库读取 Excel 文件,并将其数据处理后存储到数据库中。通过实际案例,详细讲解了文件路径、合并单元格处理等常见问题。 ... [详细]
  • Python 异步编程:ASGI 服务器与框架详解
    自 Python 3.5 引入 async/await 语法以来,异步编程迅速崛起,吸引了大量开发者的关注。本文将深入探讨 ASGI(异步服务器网关接口)及其在现代 Python Web 开发中的应用,介绍主流的 ASGI 服务器和框架。 ... [详细]
  • 本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误,并提供了解决方案。 ... [详细]
  • 构建基于BERT的中文NL2SQL模型:一个简明的基准
    本文探讨了将自然语言转换为SQL语句(NL2SQL)的任务,这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践,该比赛提供了金融和通用领域的表格数据,并标注了对应的自然语言与SQL语句对,旨在训练准确的NL2SQL模型。 ... [详细]
  • 在Python开发过程中,随着项目数量的增加,不同项目依赖于不同版本的库,容易引发依赖冲突。为了避免这些问题,并保持开发环境的整洁,可以使用Virtualenv和Virtualenvwrapper来创建和管理多个隔离的Python虚拟环境。 ... [详细]
author-avatar
木扎尔特2502918527
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有