python可以提高程序执行速度N倍你知道吗？

作者：无限制空间689 | 来源：互联网 | 2023-05-18 21:13

1.1。Numba的约5分钟指南Numba是Python的即时编译器，它最适用于使用NumPy数组和函数以及循环的代码。使用Numba的最常用方法是通过其装饰器集合，可以应用于您的函数来指示Num

1.1。Numba的约5分钟指南

Numba是Python的即时编译器，它最适用于使用NumPy数组和函数以及循环的代码。使用Numba的最常用方法是通过其装饰器集合，可以应用于您的函数来指示Numba编译它们。当调用Numba修饰函数时，它被编译为机器代码“及时”执行，并且您的全部或部分代码随后可以以本机机器代码速度运行！

开箱即用的Numba使用以下方法：

操作系统：Windows（32位和64位），OSX和Linux（32位和64位）
架构：x86，x86_64，ppc64le。在armv7l，armv8l（aarch64）上进行实验。
GPU：Nvidia CUDA。AMD ROC的实验。
CPython的
NumPy 1.10 - 最新

1.1.1。我怎么得到它？

Numba可作为畅达包为蟒蛇Python发布：

$ conda install numba

Numba还有pip可供选择：

$ pip install numba

Numba也可以从源代码编译，虽然我们不建议首次使用Numba用户。

Numba通常用作核心包，因此其依赖性保持在绝对最小值，但是，可以按如下方式安装额外的包以提供其他功能：

scipy- 支持编译numpy.linalg功能。
colorama - 支持回溯/错误消息中的颜色突出显示。
pyyaml - 通过YAML配置文件启用Numba配置。
icc_rt - 允许使用Intel SVML（高性能短矢量数学库，仅限x86_64）。安装说明在性能提示中。

1.1.2。Numba会为我的代码工作吗？

这取决于你的代码是什么样的，如果你的代码是以数字为导向的（做了很多数学运算），经常使用NumPy和/或有很多循环，那么Numba通常是一个不错的选择。在这些例子中，我们将应用最基本的Numba的JIT装饰器，@jit试图加速一些函数来演示哪些有效，哪些无效。

Numba在代码看起来像这样：

from numba import jit
import numpy as np

x = np.arange(100).reshape(10, 10)

@jit(nopython=True) # Set "nopython" mode for best performance
def go_fast(a): # Function is compiled to machine code when called the first time
    trace = 0
    for i in range(a.shape[0]):   # Numba likes loops
        trace += np.tanh(a[i, i]) # Numba likes NumPy functions
    return a + trace              # Numba likes NumPy broadcasting

print(go_fast(x))

对于看起来像这样的代码，如果有的话，它将无法正常工作：

from numba import jit
import pandas as pd

x = {'a': [1, 2, 3], 'b': [20, 30, 40]}

@jit
def use_pandas(a): # Function will not benefit from Numba jit
    df = pd.DataFrame.from_dict(a) # Numba doesn't know about pd.DataFrame
    df += 1                        # Numba doesn't understand what this is
    return df.cov()                # or this!

print(use_pandas(x))

请注意，Numba不理解Pandas，因此Numba只是通过解释器运行此代码，但增加了Numba内部开销的成本！

1.1.3。什么是`nopython`模式？

Numba @jit装饰器从根本上以两种编译模式运行， nopython模式和object模式。在go_fast上面的例子中， nopython=True在@jit装饰器中设置，这是指示Numba在nopython模式下操作。nopython编译模式的行为本质上是编译装饰函数，以便它完全运行而不需要Python解释器的参与。这是使用Numba jit装饰器的推荐和最佳实践方式，因为它可以带来最佳性能。

如果编译nopython模式失败，Numba可以编译使用，如果没有设置，这是装饰器的后退模式（如上例所示）。在这种模式下，Numba将识别它可以编译的循环并将它们编译成在机器代码中运行的函数，并且它将运行解释器中的其余代码。为获得最佳性能，请避免使用此模式objectmode@jitnopython=Trueuse_pandas

1.1.4。如何衡量Numba的表现？

首先，回想一下，Numba必须为执行函数的机器代码版本之前给出的参数类型编译函数，这需要时间。但是，一旦编译完成，Numba会为所呈现的特定类型的参数缓存函数的机器代码版本。如果再次使用相同的类型调用它，它可以重用缓存的版本而不必再次编译。

测量性能时，一个非常常见的错误是不考虑上述行为，并使用一个简单的计时器来计算一次，该计时器包括在执行时编译函数所花费的时间。

例如：

from numba import jit
import numpy as np
import time

x = np.arange(100).reshape(10, 10)

@jit(nopython=True)
def go_fast(a): # Function is compiled and runs in machine code
    trace = 0
    for i in range(a.shape[0]):
        trace += np.tanh(a[i, i])
    return a + trace

# DO NOT REPORT THIS... COMPILATION TIME IS INCLUDED IN THE EXECUTION TIME!
start = time.time()
go_fast(x)
end = time.time()
print("Elapsed (with compilation) = %s" % (end - start))

# NOW THE FUNCTION IS COMPILED, RE-TIME IT EXECUTING FROM CACHE
start = time.time()
go_fast(x)
end = time.time()
print("Elapsed (after compilation) = %s" % (end - start))

这，例如打印：

Elapsed (with compilation) = 0.33030009269714355
Elapsed (after compilation) = 6.67572021484375e-06

衡量Numba JIT对您的代码的影响的一个好方法是使用timeit模块函数来执行时间，这些函数测量多次执行迭代，因此可以在第一次执行时适应编译时间。

作为旁注，如果编译时间成为问题，Numba JIT支持编译函数的磁盘缓存，并且还具有Ahead-Of-Time编译模式。

1.1.5。它有多快？

假设Numba可以在nopython模式下运行，或者至少编译一些循环，它将针对您的特定CPU进行编译。加速因应用而异，但可以是一到两个数量级。Numba有一个性能指南，涵盖了获得额外性能的常用选项。

1.1.6。Numba如何运作？

Numba读取装饰函数的Python字节码，并将其与有关函数输入参数类型的信息相结合。它分析并优化您的代码，最后使用LLVM编译器库生成函数的机器代码版本，根据您的CPU功能量身定制。每次调用函数时都会使用此编译版本。

1.1.7。其他感兴趣的东西：

Numba有相当多的装饰，我们看到@jit和@njit，但也有：

@vectorize- 生成NumPy ufunc（ufunc支持所有方法）。文件在这里。
@guvectorize- 产生NumPy广义ufuncs。文件在这里。
@stencil - 将函数声明为类似模板操作的内核。文件在这里。
@jitclass - 对于jit感知类。文件在这里。
@cfunc - 声明一个函数用作本机回调（从C / C ++等调用）。文件在这里。
@overload- 注册您自己的函数实现，以便在nopython模式下使用，例如@overload(scipy.special.j0)。文件在这里。

一些装饰者提供额外选项：

parallel = True- 启用功能的自动并行化。
fastmath = True- 为该功能启用快速数学行为。

ctypes / cffi / cython互操作性：

cffi- 模式支持调用CFFI函数nopython。
ctypes- 模式支持调用ctypes包装函数nopython。。
Cython导出的函数是可调用的。

1.1.7.1。GPU目标：

Numba可以针对Nvidia CUDA和（实验性）AMD ROC GPU。您可以使用纯Python编写内核，让Numba处理计算和数据移动（或明确地执行此操作）。单击关于CUDA或ROC的 Numba文档。

示例：接下来我们写一段简单的代码，来计算一下执行时间：

示例1：不使用numba的:

import time



def num():

    arr = []
    for i in range(10000000):
        arr.append(i)


stime = time.time()
num()
etime = time.time() - stime
# print(arr)
print('用时:{}秒'.format(etime))

示例输出时间:

用时:1.4500024318695068秒

示例2：使用numba @jit

import time
from numba import jit

@jit
def num():

    arr = []
    for i in range(10000000):
        arr.append(i)


stime = time.time()
num()
etime = time.time() - stime
# print(arr)
print('用时:{}秒'.format(etime))

示例输出:

用时:0.5530002117156982秒

结论：

上述两个示例代码，一个使用了numba，另一个没有使用numba；可以看出使用numba @jit装饰后，时间明显快了很多倍。

这只是一个简单示例；对于复杂计算提高速度更明显。

推荐阅读

format
移动 UI 设计基础：打造简洁高效的用户界面

本章将深入探讨移动 UI 设计的核心原则，帮助开发者构建简洁、高效且用户友好的界面。通过学习设计规则和用户体验优化技巧，您将能够创建出既美观又实用的移动应用。 ... [详细]

蜡笔小新 2024-12-27 08:43:40
format
Valve 发布 Steam Deck 的新版 Windows 驱动程序

Valve 最新发布了针对 Steam Deck 掌机的 Windows 驱动程序，旨在提升其在 Windows 环境下的兼容性、安全性和性能表现。 ... [详细]

蜡笔小新 2024-12-28 10:31:16
yaml
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
search
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
list
Qt 5.15.2 在银河麒麟龙芯平台打包的实战经验

本文详细记录了在银河麒麟操作系统和龙芯架构上使用 Qt 5.15.2 进行项目打包时遇到的问题及解决方案，特别关注于 linuxdeployqt 工具的应用。 ... [详细]

蜡笔小新 2024-12-26 10:54:04
stream
CUGB图论专题：排水系统中的最大流问题 - EK与Dinic算法解析

本题探讨如何通过最大流算法解决农场排水系统的设计问题。题目要求计算从水源点到汇合点的最大水流速率，使用经典的EK（Edmonds-Karp）和Dinic算法进行求解。 ... [详细]

蜡笔小新 2024-12-25 17:47:23
list
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
lua
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
lua
C语言的起源与发展历程

本文详细介绍了C语言的起源、发展及其标准化过程，涵盖了从早期的BCPL和B语言到现代C语言的演变，并探讨了其在操作系统和跨平台编程中的重要地位。 ... [详细]

蜡笔小新 2024-12-23 14:11:43
search
利用决策树预测NBA比赛胜负的Python数据挖掘实践

本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据，结合《Python数据挖掘入门与实践》一书中的方法，展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]

蜡笔小新 2024-12-23 09:07:40
search
国内BI工具迎战国际巨头Tableau，稳步崛起

尽管商业智能（BI）工具在中国的普及程度尚不及国际市场，但近年来，随着本土企业的持续创新和市场推广，国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争，国内BI工具通过不断优化产品和技术，赢得了越来越多用户的认可。 ... [详细]

蜡笔小新 2024-12-28 11:12:44
instance
解决JAX-WS动态客户端工厂弃用问题并迁移到XFire

在处理Java项目中的JAR包冲突时，我们遇到了JaxWsDynamicClientFactory被弃用的问题，并成功将其迁移到org.codehaus.xfire.client。本文详细介绍了这一过程及解决方案。 ... [详细]

蜡笔小新 2024-12-25 18:48:34
instance
SuperVivi-USB-Transfer-Tool：Windows 7 64位系统下的DNW替代方案

在Windows 7 64位系统中，使用DNW进行mini2440开发板的USB连接时遇到驱动不兼容问题。本文介绍了一种替代工具——SuperVivi-USB-Transfer-Tool，并详细说明其安装步骤和使用方法。 ... [详细]

蜡笔小新 2024-12-25 10:28:57
datetime
解析SQL查询结果的排序问题及其解决方案

本文探讨了为什么某些SQL查询返回的数据集未能按预期顺序排列，并提供了详细的解决方案，帮助开发者理解并解决这一常见问题。 ... [详细]

蜡笔小新 2024-12-23 21:21:17
datetime
南昌大学《嵌入式系统》期末考试真题解析（含答案）

本文提供南昌大学《嵌入式系统》课程期末考试的真题及详细解答，涵盖填空题、指令测试题等内容，帮助学生更好地理解和掌握相关知识点。 ... [详细]

蜡笔小新 2024-12-23 17:01:43