当前位置: 开发笔记 > 编程语言 > 正文

如何系统地学习Numpy？初学者必知的Numpy基础知识

作者：8prye孙瑞D | 来源：互联网 | 2023-09-25 12:15

一、Numpy介绍Numpy（NumericalPython）是一个开源的Python科学计算库，用于快速处理任意维度的数组。Numpy

一、Numpy介绍

NumPy提供了一个N维数组类型ndarray&＃xff0c;它描述了相同类型的“items”的集合。

返回结果&＃xff1a;

提问:

使用Python列表可以存储一维数组&＃xff0c;通过列表的嵌套可以实现多维数组&＃xff0c;那么为什么还需要使用Numpy的ndarray呢&＃xff1f;

三、ndarray与Python原生list运算效率对比

在这里我们通过一段代码运行来体会到ndarray的好处

其中第一个时间显示的是使用原生Python计算时间,第二个内容是使用numpy计算时间&＃xff1a;

从中我们看到ndarray的计算速度要快很多&＃xff0c;节约了时间。

机器学习的最大特点就是大量的数据运算&＃xff0c;那么如果没有一个快速的解决方案&＃xff0c;那可能现在python也在机器学习领域达不到好的效果。

2 ndarray的形状

首先创建一些数组。

分别打印出形状

如何理解数组的形状&＃xff1f;

二维数组&＃xff1a;

三维数组&＃xff1a;

dtype是numpy.dtype类型&＃xff0c;先看看对于数组来说都有哪些类型

注意&＃xff1a;若不指定&＃xff0c;整数默认int64&＃xff0c;小数默认float64

4 总结

数组的基本属性【知道】

六、基本操作

1 生成数组的方法

1.1 生成0和1的数组

np.ones(shape, dtype)
np.ones_like(a, dtype)
np.zeros(shape, dtype)
np.zeros_like(a, dtype)

返回结果:

1.2 从现有数组生成

1.2.1 生成方式

np.array(object, dtype)
np.asarray(a, dtype)

1.2.2 关于array和asarray的不同

返回结果&＃xff1a;

1.3.2 np.arange(start,stop, step, dtype)

创建等差数组 — 指定步长

参数

step:步长,默认值为1

返回结果&＃xff1a;

1.3.3 np.logspace(start,stop, num)

创建等比数列

参数:

num:要生成的等比数列数量&＃xff0c;默认为50

返回结果:

1.4 生成随机数组

1.4.1 使用模块介绍

np.random模块

1.4.2 正态分布

一、基础概念复习&＃xff1a;正态分布&＃xff08;理解&＃xff09;

a. 什么是正态分布

正态分布是一种概率分布。正态分布是具有两个参数μ和σ的连续型随机变量的分布&＃xff0c;第一参数μ是服从正态分布的随机变量的均值&＃xff0c;第二个参

数σ是此随机变量的标准差&＃xff0c;所以正态分布记作N(μ&＃xff0c;σ )。

其中M为平均值&＃xff0c;n为数据总个数&＃xff0c;σ 为标准差&＃xff0c;σ ^2可以理解一个整体为方差

标准差与方差的意义

可以理解成数据的一个离散程度的衡量

返回结果&＃xff1a;

1.4.2 均匀分布

np.random.rand(d0, d1, ..., dn)

返回[0.0&＃xff0c;1.0)内的一组均匀分布的数。

np.random.uniform(low&＃61;0.0, high&＃61;1.0, size&＃61;None)

功能&＃xff1a;从一个均匀分布[low,high)中随机采样&＃xff0c;注意定义域是左闭右开&＃xff0c;即包含low&＃xff0c;不包含high.

参数介绍:

low: 采样下界&＃xff0c;float类型&＃xff0c;默认值为0&＃xff1b;
high: 采样上界&＃xff0c;float类型&＃xff0c;默认值为1&＃xff1b;
size: 输出样本数目&＃xff0c;为int或元组(tuple)类型&＃xff0c;例如&＃xff0c;size&＃61;(m,n,k), 则输出mnk个样本&＃xff0c;缺省时输出1个值。

返回值&＃xff1a;ndarray类型&＃xff0c;其形状和参数size中描述一致。

np.random.randint(low, high&＃61;None, size&＃61;None, dtype&＃61;&＃39;l&＃39;)

从一个均匀分布中随机采样&＃xff0c;生成一个整数或N维整数数组&＃xff0c;

取数范围&＃xff1a;若high不为None时&＃xff0c;取[low,high)之间随机整数&＃xff0c;否则取值[0,low)之间随机整数

返回结果&＃xff1a;

画图看分布状况&＃xff1a;

返回结果&＃xff1a;

3 形状修改

3.1 ndarray.reshape(shape, order)

返回一个具有相同数据域&＃xff0c;但shape不一样的视图
行、列不进行互换

3.2 ndarray.resize(new_shape)

修改数组本身的形状&＃xff08;需要保持元素个数前后相同&＃xff09;
行、列不进行互换

3.3 ndarray.T

数组的转置
将数组的行、列进行互换

4 类型修改

4.1 ndarray.astype(type)

返回修改了类型之后的数组

4.2 ndarray.tostring([order])或者ndarray.tobytes([order])

构造包含数组中原始数据字节的Python字节

4.3 jupyter输出太大可能导致崩溃问题【了解】

如果遇到

这个问题是在jupyer当中对输出的字节数有限制&＃xff0c;需要去修改配置文件

创建配置文件

取消注释,多增加

但是不建议这样去修改&＃xff0c;jupyter输出太大会崩溃

5 数组的去重

5.1 np.unique()

推荐阅读

shell
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
数组
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
go
深入理解C++中的KMP算法：高效字符串匹配的利器

本文详细介绍C++中实现KMP算法的方法，探讨其在字符串匹配问题上的优势。通过对比暴力匹配（BF）算法，展示KMP算法如何利用前缀表优化匹配过程，显著提升效率。 ... [详细]

蜡笔小新 2024-12-27 14:45:30
text
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
format
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
数组
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48
io
Python 实现字符串双拆分并转换为矩阵

本文介绍如何使用 Python 将一个字符串按照指定的行和元素分隔符进行两次拆分，最终将字符串转换为矩阵形式。通过两种不同的方法实现这一功能：一种是使用循环与 split() 方法，另一种是利用列表推导式。 ... [详细]

蜡笔小新 2024-12-28 12:15:45
foreach
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
shell
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
io
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
ip
数据管理权威指南：《DAMA-DMBOK2 数据管理知识体系》

本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释，构建了数据管理的总体框架，为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]

蜡笔小新 2024-12-27 18:29:55
regex
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
text
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
shell
掌握远程执行Linux脚本和命令的技巧

本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令，帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释，让初学者也能轻松上手。 ... [详细]

蜡笔小新 2024-12-26 19:47:05
数组
深入理解Java泛型：JDK 5的新特性

本文详细介绍了Java泛型的概念及其在JDK 5中的应用，通过具体代码示例解释了泛型的引入、作用和优势。同时，探讨了泛型类、泛型方法和泛型接口的实现，并深入讲解了通配符的使用。 ... [详细]

蜡笔小新 2024-12-26 11:15:56

8prye孙瑞D

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章