热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据分析与数据挖掘:NumPy、Pandas和Matplotlib的使用指南

本文详细介绍了如何使用NumPy、Pandas和Matplotlib进行数据分析和数据可视化。通过具体的代码示例,帮助读者更好地理解和应用这些强大的Python库。

1 import numpy as np
2 import pandas as pd
3
4 """
5 NumPy -- 科学计算库
6 核心 -- ndarray
7 本质:存储单一数据类型的内存连续的N维数组
8 C 和 F 风格存储
9
10 Matplotlib -- 数据可视化的库
11 能够绘制2D 和 3D 图形
12
13 Pandas -- 进行数据处理的库
14 封装了部分NumPy 和 Matplotlib 功能
15 结构核心:
16 常用两种结构:
17 Series -- 存储一维结构
18 与DataFrame相比,只含有行索引,没有列索引
19 DataFrame(重要)-- 存储二维结构
20 数据相比ndarray,多了行索引和列索引
21 """
22
23 # 将columns 与 values 合并为同一个数据 -- 合并结果是什么类型? -- 数组
24 res = np.load("./国民经济核算季度数据.npz")
25 columns = res["columns"]
26 values = res["values"]
27
28 print("columns:", columns)
29 print("values:", values)
30 # print("*" * 100)
31 #
32 # NumPy合并数据
33 res_array = np.concatenate((columns.reshape(1, -1), values), axis=0)
34 # print("res_array:", res_array)
35
36
37 # 将数组转化为DataFrame
38 # 将上面的columns 与 values 转化为pandas中的DataFrame结构
39 # data -- 真实数据
40 # index -- 行索引的名称
41 # columns -- 列索引的名称
42 index = ["index_" + str(i) for i in range(values.shape[0])]
43 print(index)
44
45 res_df = pd.DataFrame(data=values, columns=columns, index=index)
46 print("res_df:", res_df)
47
48 # 创建一个自定义的DataFrame
49 df = pd.DataFrame(
50 data={
51 "name": ["zs", "ls", "ww"],
52 "score": [97, 89, 92.5],
53 "age": [21, 22, 23]
54 },
55 index=["stu_1", "stu_2", "stu_3"]
56 )
57 print("df:", df)
58
59 print("df的维度:", df.ndim)
60 print("df的类型:", type(df))
61
62 # print("*" * 100)
63
64 # 将DataFrame转化为Series
65 # Series 是什么?
66 se = df["name"]
67
68 print("se:", se)
69
70 print("se的类型:", type(se))
71
72 # 创建一个自定义的Series
73 # data -- Series的真实值
74 se = pd.Series(
75 data=["zs", "ls", "ww"],
76 index=["stu_1", "stu_2", "stu_3"]
77 )
78 print("se:", se)
79 print("se的维度:", se.ndim)
80 print("se的类型:", type(se))
81
82
83 # NumPy 示例
84 arr = np.array([1, 2, 3, 4]) # 将简单列表转化为数组
85 arr = np.array([[1, 2, 3, 4], [2, 3, 4, 5]]) # 将列表嵌套转化为数组
86 arr = np.array([[[1, 2, 3, 4], [2, 3, 4, 5]], [[1, 2, 3, 4], [2, 3, 4, 5]]])
87
88 print('arr:', arr)
89 print('arr的类型:', type(arr)) #
90 print('arr的维度:', arr.ndim)
91 print('arr的形状:', arr.shape)
92 print('arr的大小:', arr.size)
93 print('arr元素的数据类型:', arr.dtype)
94 print('arr每个元素的大小:', arr.itemsize)


推荐阅读
author-avatar
酸奶82
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有