热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据分析与数据挖掘:NumPy、Pandas和Matplotlib的使用指南

本文详细介绍了如何使用NumPy、Pandas和Matplotlib进行数据分析和数据可视化。通过具体的代码示例,帮助读者更好地理解和应用这些强大的Python库。

1 import numpy as np
2 import pandas as pd
3
4 """
5 NumPy -- 科学计算库
6 核心 -- ndarray
7 本质:存储单一数据类型的内存连续的N维数组
8 C 和 F 风格存储
9
10 Matplotlib -- 数据可视化的库
11 能够绘制2D 和 3D 图形
12
13 Pandas -- 进行数据处理的库
14 封装了部分NumPy 和 Matplotlib 功能
15 结构核心:
16 常用两种结构:
17 Series -- 存储一维结构
18 与DataFrame相比,只含有行索引,没有列索引
19 DataFrame(重要)-- 存储二维结构
20 数据相比ndarray,多了行索引和列索引
21 """
22
23 # 将columns 与 values 合并为同一个数据 -- 合并结果是什么类型? -- 数组
24 res = np.load("./国民经济核算季度数据.npz")
25 columns = res["columns"]
26 values = res["values"]
27
28 print("columns:", columns)
29 print("values:", values)
30 # print("*" * 100)
31 #
32 # NumPy合并数据
33 res_array = np.concatenate((columns.reshape(1, -1), values), axis=0)
34 # print("res_array:", res_array)
35
36
37 # 将数组转化为DataFrame
38 # 将上面的columns 与 values 转化为pandas中的DataFrame结构
39 # data -- 真实数据
40 # index -- 行索引的名称
41 # columns -- 列索引的名称
42 index = ["index_" + str(i) for i in range(values.shape[0])]
43 print(index)
44
45 res_df = pd.DataFrame(data=values, columns=columns, index=index)
46 print("res_df:", res_df)
47
48 # 创建一个自定义的DataFrame
49 df = pd.DataFrame(
50 data={
51 "name": ["zs", "ls", "ww"],
52 "score": [97, 89, 92.5],
53 "age": [21, 22, 23]
54 },
55 index=["stu_1", "stu_2", "stu_3"]
56 )
57 print("df:", df)
58
59 print("df的维度:", df.ndim)
60 print("df的类型:", type(df))
61
62 # print("*" * 100)
63
64 # 将DataFrame转化为Series
65 # Series 是什么?
66 se = df["name"]
67
68 print("se:", se)
69
70 print("se的类型:", type(se))
71
72 # 创建一个自定义的Series
73 # data -- Series的真实值
74 se = pd.Series(
75 data=["zs", "ls", "ww"],
76 index=["stu_1", "stu_2", "stu_3"]
77 )
78 print("se:", se)
79 print("se的维度:", se.ndim)
80 print("se的类型:", type(se))
81
82
83 # NumPy 示例
84 arr = np.array([1, 2, 3, 4]) # 将简单列表转化为数组
85 arr = np.array([[1, 2, 3, 4], [2, 3, 4, 5]]) # 将列表嵌套转化为数组
86 arr = np.array([[[1, 2, 3, 4], [2, 3, 4, 5]], [[1, 2, 3, 4], [2, 3, 4, 5]]])
87
88 print('arr:', arr)
89 print('arr的类型:', type(arr)) #
90 print('arr的维度:', arr.ndim)
91 print('arr的形状:', arr.shape)
92 print('arr的大小:', arr.size)
93 print('arr元素的数据类型:', arr.dtype)
94 print('arr每个元素的大小:', arr.itemsize)


推荐阅读
  • 自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析
    目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]
  • 浅析python实现布隆过滤器及Redis中的缓存穿透原理_python
    本文带你了解了位图的实现,布隆过滤器的原理及Python中的使用,以及布隆过滤器如何应对Redis中的缓存穿透,相信你对布隆过滤 ... [详细]
  • 如何将Python与Excel高效结合:常用操作技巧解析
    本文深入探讨了如何将Python与Excel高效结合,涵盖了一系列实用的操作技巧。文章内容详尽,步骤清晰,注重细节处理,旨在帮助读者掌握Python与Excel之间的无缝对接方法,提升数据处理效率。 ... [详细]
  • 如何将TS文件转换为M3U8直播流:HLS与M3U8格式详解
    在视频传输领域,MP4虽然常见,但在直播场景中直接使用MP4格式存在诸多问题。例如,MP4文件的头部信息(如ftyp、moov)较大,导致初始加载时间较长,影响用户体验。相比之下,HLS(HTTP Live Streaming)协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段,并生成一个M3U8播放列表文件,实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流,包括技术原理和具体操作步骤,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 如何高效启动大数据应用之旅?
    在前一篇文章中,我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目,涵盖关键步骤和最佳实践,帮助读者快速踏上大数据之旅。 ... [详细]
  • 在一个整型数组中,除了两个数字只出现一次外,其他所有数字都出现了两次。编写一个程序来找出这两个只出现一次的数字。 ... [详细]
  • 本文介绍了如何使用Python爬取妙笔阁小说网仙侠系列中所有小说的信息,并将其保存为TXT和CSV格式。主要内容包括如何构造请求头以避免被网站封禁,以及如何利用XPath解析HTML并提取所需信息。 ... [详细]
  • 普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]
  • Leetcode学习成长记:天池leetcode基础训练营Task01数组
    前言这是本人第一次参加由Datawhale举办的组队学习活动,这个活动每月一次,之前也一直关注,但未亲身参与过,这次看到活动 ... [详细]
  • iOS 不定参数 详解 ... [详细]
  • python模块之正则
    re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求,从一段字符串中找到符合要求的内容。在 ... [详细]
  • 本文介绍了如何在Python中使用插值方法将不同分辨率的数据统一到相同的分辨率。 ... [详细]
  • 目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]
  • Python多线程详解与示例
    本文介绍了Python中的多线程编程,包括僵尸进程和孤儿进程的概念,并提供了具体的代码示例。同时,详细解释了0号进程和1号进程在系统中的作用。 ... [详细]
  • 本文详细介绍了如何使用 Python 进行主成分分析(PCA),包括数据导入、预处理、模型训练和结果可视化等步骤。通过具体的代码示例,帮助读者理解和应用 PCA 技术。 ... [详细]
author-avatar
酸奶82
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有