nvidiarapids︱cuDF与pandas一样的DataFrame库

作者：mobiledu2502900505 | 来源：互联网 | 2023-10-11 10:14

cuDF（https:github.comrapidsaicudf）是一个基于Python的GPUDataFrame库，用于处理数据&#x

cuDF&＃xff08;https://github.com/rapidsai/cudf&＃xff09;是一个基于Python的GPU DataFrame库&＃xff0c;用于处理数据&＃xff0c;包括加载、连接、聚合和过滤数据。向GPU的转移允许大规模的加速&＃xff0c;因为GPU比CPU拥有更多的内核。

笔者觉得&＃xff0c;对于我来说一个比较好的使用场景是&＃xff0c;代替并行&＃xff0c;在pandas处理比较慢的时候&＃xff0c;切换到cuDF&＃xff0c;就不用写繁琐的并行了。

官方文档&＃xff1a;
1 Docs » API Reference
2 rapidsai/cudf

相关参考&＃xff1a;

nvidia-rapids︱cuDF与pandas一样的DataFrame库
NVIDIA的python-GPU算法生态︱ RAPIDS 0.10
nvidia-rapids︱cuML机器学习加速库
nvidia-rapids︱cuGraph(NetworkX-like)关系图模型

文章目录

1 cuDF背景与安装
- 1.1 背景
- 1.2 安装
2 一些demo
- 2.1 新建dataframe
- 2.2 pandas 与 cuDF切换
- 2.3 选中某行列
- 2.4 apply_rows和apply_chunks
- 2.5 groupby

1 cuDF背景与安装

1.1 背景

cuDF在过去一年中的发展速度非常之快。每个版本都加入了令人兴奋的新功能、优化和错误修复。0.10版本也不例外。cuDF 0.10版本的一些新功能包括 groupby.quantile()、Series.isin()、从远程/云文件系统&＃xff08;例如hdfs、gcs、s3&＃xff09;读取、Series和DataFrame isna()、按分组功能中的任意长度Series分组、Series 协方差和Pearson相关性以及从DataFrame / Series .values 属性返回 CuPy数组。此外&＃xff0c;apply UDF函数API经过了优化&＃xff0c;并且加入了通过.iloc访问器的收集和散播方法。

除了提供所有上述出色的功能、优化和错误修复之外&＃xff0c;cuDF 0.10版本还花费大量的精力构建未来。该版本将cuStrings存储库合并到cuDF中&＃xff0c;并为合并两个代码库做好了准备&＃xff0c;使字符串功能能够被更紧密地集成到cuDF中&＃xff0c;以此提供更快的加速和更多的功能。此外&＃xff0c;RAPIDS添加了cuStreamz元数据包&＃xff0c;因此可以使用cuDF和Streamz库简化GPU加速流处理。cuDF继续改进其Pandas API兼容性和Dask DataFrame互操作性&＃xff0c;使我们的用户可以最大程度地无缝使用cuDF。

在幕后&＃xff0c;libcudf的内部架构正在经历一次重大的重新设计。0.10版本加入了最新的cudf :: column和cudf :: table类&＃xff0c;这些类大大提高了内存所有权控制的强健性&＃xff0c;并为将来支持可变大小数据类型&＃xff08;包括字符串列、数组和结构&＃xff09;奠定了基础。由于已构建对整个libcudf API中的新类的支持&＃xff0c;这项工作将在下一个版本周期中继续进行。此外&＃xff0c;libcudf 0.10添加了许多新的API和算法&＃xff0c;包括基于排序、支持空数据的分组功能、分组功能分位数和中位数、cudf :: unique_count&＃xff0c;cudf :: repeat、cudf :: scatter_to_tables等。与以往一样&＃xff0c;此版本还包括许多其他改进和修复。

RAPIDS内存管理器库RMM也正在进行一系列重组。这次重组包括一个基于内存资源的新架构&＃xff0c;该架构与C &＃43;&＃43; 17 std :: pmr :: memory_resource大多兼容。这使该库更容易在公共接口之后添加新类型的内存分配器。0.10还用Cython取代了CFFI Python绑定&＃xff0c;从而使C &＃43;&＃43;异常可以传播到Python异常&＃xff0c;使更多可调整的错误被传递给应用程序。下一个版本将继续提高RMM中的异常支持。

最后&＃xff0c;你会注意到cuDF在这个版本中速度有了显著提升&＃xff0c;包括join&＃xff08;最多11倍&＃xff09;、gather和scatter on tables&＃xff08;速度也快2-3倍&＃xff09;的大幅性能改进&＃xff0c;以及更多如图5所示的内容。
在这里插入图片描述
图5&＃xff1a;单个NVIDIA Tesla V100&＃xff08;立即免费试用&＃xff09; GPU与双路Intel Xeon E5–2698 v4 CPU&＃xff08;20核&＃xff09;上的cuDF vs Pandas加速

1.2 安装

有conda可以直接安装&＃xff0c;也可以使用docker&＃xff0c;参考&＃xff1a;https://github.com/rapidsai/cudf

conda版本&＃xff0c;cudf version &＃61;&＃61; 0.10

# for CUDA 9.2 conda install -c rapidsai -c nvidia -c numba -c conda-forge \cudf&＃61;0.10 python&＃61;3.6 cudatoolkit&＃61;9.2# or, for CUDA 10.0 conda install -c rapidsai -c nvidia -c numba -c conda-forge \cudf&＃61;0.10 python&＃61;3.6 cudatoolkit&＃61;10.0# or, for CUDA 10.1 conda install -c rapidsai -c nvidia -c numba -c conda-forge \cudf&＃61;0.10 python&＃61;3.6 cudatoolkit&＃61;10.1

docker版本&＃xff0c;可参考&＃xff1a;https://rapids.ai/start.html#prerequisites

在这里插入图片描述

docker pull rapidsai/rapidsai:cuda10.1-runtime-ubuntu16.04-py3.7 docker run --gpus all --rm -it -p 8888:8888 -p 8787:8787 -p 8786:8786 \rapidsai/rapidsai:cuda10.1-runtime-ubuntu16.04-py3.7

2 一些demo

2.1 新建dataframe

import cudf import numpy as np from datetime import datetime, timedeltat0 &＃61; datetime.strptime(&＃39;2018-10-07 12:00:00&＃39;, &＃39;%Y-%m-%d %H:%M:%S&＃39;) n &＃61; 5 df &＃61; cudf.DataFrame({&＃39;id&＃39;: np.arange(n),&＃39;datetimes&＃39;: np.array([(t0&＃43; timedelta(seconds&＃61;x)) for x in range(n)]) }) df

在这里插入图片描述

Build DataFrame via list of rows as tuples:

>>> import cudf >>> df &＃61; cudf.DataFrame([(5, "cats", "jump", np.nan),(2, "dogs", "dig", 7.5),(3, "cows", "moo", -2.1, "occasionally"), ]) >>> df 0 1 2 3 4 0 5 cats jump null None 1 2 dogs dig 7.5 None 2 3 cows moo -2.1 occasionally

2.2 pandas 与 cuDF切换

pandas到 cuDF

>>> import pandas as pd >>> import cudf >>> pdf &＃61; pd.DataFrame({&＃39;a&＃39;: [0, 1, 2, 3],&＃39;b&＃39;: [0.1, 0.2, None, 0.3]}) >>> df &＃61; cudf.from_pandas(pdf) >>> dfa b 0 0 0.1 1 1 0.2 2 2 nan 3 3 0.3

cuDF 到pandas

>>> import cudf >>> gdf &＃61; cudf.DataFrame({&＃39;a&＃39;: [1, 2, None], &＃39;b&＃39;: [3, None, 5]}) >>> gdf.fillna(4).to_pandas() a b 0 1 3 1 2 4 2 4 5 >>> gdf.fillna({&＃39;a&＃39;: 3, &＃39;b&＃39;: 4}).to_pandas() a b 0 1 3 1 2 4 2 3 5

2.3 选中某行列

df &＃61; cudf.DataFrame({&＃39;a&＃39;: list(range(20)),&＃39;b&＃39;: list(range(20)),&＃39;c&＃39;: list(range(20))}) df

在这里插入图片描述

df.iloc[1]a 1 b 1 c 1 Name: 1, dtype: int64

2.4 apply_rows和apply_chunks

apply_rows

import cudf import numpy as np from numba import cudadf &＃61; cudf.DataFrame() df[&＃39;in1&＃39;] &＃61; np.arange(1000, dtype&＃61;np.float64)def kernel(in1, out):for i, x in enumerate(in1):print(&＃39;tid:&＃39;, cuda.threadIdx.x, &＃39;bid:&＃39;, cuda.blockIdx.x,&＃39;array size:&＃39;, in1.size, &＃39;block threads:&＃39;, cuda.blockDim.x)out[i] &＃61; x * 2.0outdf &＃61; df.apply_rows(kernel,incols&＃61;[&＃39;in1&＃39;],outcols&＃61;dict(out&＃61;np.float64),kwargs&＃61;dict())print(outdf[&＃39;in1&＃39;].sum()*2.0) print(outdf[&＃39;out&＃39;].sum())>>> 999000.0 >>> 999000.0

apply_chunks

import cudf import numpy as np from numba import cudadf &＃61; cudf.DataFrame() df[&＃39;in1&＃39;] &＃61; np.arange(100, dtype&＃61;np.float64)def kernel(in1, out):print(&＃39;tid:&＃39;, cuda.threadIdx.x, &＃39;bid:&＃39;, cuda.blockIdx.x,&＃39;array size:&＃39;, in1.size, &＃39;block threads:&＃39;, cuda.blockDim.x)for i in range(cuda.threadIdx.x, in1.size, cuda.blockDim.x):out[i] &＃61; in1[i] * 2.0outdf &＃61; df.apply_chunks(kernel,incols&＃61;[&＃39;in1&＃39;],outcols&＃61;dict(out&＃61;np.float64),kwargs&＃61;dict(),chunks&＃61;16,tpb&＃61;8)print(outdf[&＃39;in1&＃39;].sum()*2.0) print(outdf[&＃39;out&＃39;].sum())>>> 9900.0 >>> 9900.0

2.5 groupby

from cudf import DataFrame df &＃61; DataFrame() df[&＃39;key&＃39;] &＃61; [0, 0, 1, 1, 2, 2, 2] df[&＃39;val&＃39;] &＃61; [0, 1, 2, 3, 4, 5, 6] groups &＃61; df.groupby([&＃39;key&＃39;], method&＃61;&＃39;cudf&＃39;)# Define a function to apply to each row in a group def mult(df):df[&＃39;out&＃39;] &＃61; df[&＃39;key&＃39;] * df[&＃39;val&＃39;]return dfresult &＃61; groups.apply(mult) print(result)

输出&＃xff1a;

key val out 0 0 0 0 1 0 1 0 2 1 2 2 3 1 3 3 4 2 4 8 5 2 5 10 6 2 6 12

之后&＃xff0c;用到的时候再追加。。

推荐阅读

search
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
rsa
Docker安全策略与管理

本文探讨了Docker的安全挑战、核心安全特性及其管理策略，旨在帮助读者深入理解Docker安全机制，并提供实用的安全管理建议。 ... [详细]

蜡笔小新 2024-11-21 20:03:03
text
Python 开发环境最佳实践：Anaconda + Jupyter Notebook 快速上手指南

对于初学者而言，搭建一个高效稳定的 Python 开发环境是入门的关键一步。本文将详细介绍如何利用 Anaconda 和 Jupyter Notebook 来构建一个既易于管理又功能强大的开发环境。 ... [详细]

蜡笔小新 2024-11-21 18:30:23
int
OBS Studio自动化实践：利用脚本批量生成录制场景

本文探讨了如何利用OBS Studio进行高效录屏，并通过脚本实现场景的自动生成。适合对自动化办公感兴趣的读者。 ... [详细]

蜡笔小新 2024-11-21 10:44:53
java
流处理中的计数挑战与解决方案

本文探讨了在流处理中进行计数的各种技术和挑战，并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性，还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]

蜡笔小新 2024-11-20 13:50:01
java
【小白学习C++ 教程】二十三、如何安装和使用 C++ 标准库

【小白学习C++ 教程】二十三、如何安装和使用 C++ 标准库 ... [详细]

蜡笔小新 2024-11-19 19:30:06
default
使用 Jupyter Notebook 实现 Markdown 编写与代码运行

Jupyter Notebook 是一个开源的基于网页的应用程序，允许用户在同一文档中编写 Markdown 文本和运行多种编程语言的代码，并实时查看运行结果。 ... [详细]

蜡笔小新 2024-11-15 14:50:50
default
Google Colab 免费 GPU 使用指南（第一部分）

本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境，支持多种深度学习框架，并且提供免费的 GPU 计算资源。 ... [详细]

蜡笔小新 2024-11-14 13:42:03
int
机器学习算法：SVM（支持向量机）

SVM算法（SupportVectorMachine，支持向量机）的核心思想有2点：1、如果数据线性可分，那么基于最大间隔的方式来确定超平面，以确保全局最优， ... [详细]

蜡笔小新 2024-11-14 04:33:58
int
为何Compose与Swarm之后仍有Kubernetes的诞生？

探讨在已有Compose和Swarm的情况下，Kubernetes是如何以其独特的设计理念和技术优势脱颖而出，成为容器编排领域的领航者。 ... [详细]

蜡笔小新 2024-11-22 09:26:11
nodejs
Node.js在服务器上的多种部署策略

本文探讨了Node.js应用程序在服务器上部署的几种有效方法，包括使用Screen、PM2以及通过宝塔面板进行简易管理。 ... [详细]

蜡笔小新 2024-11-21 18:58:31
c语言
汇编语言：编程世界的始祖，连C语言都敬畏三分！

当C语言还在萌芽阶段时，它首次接触到了汇编语言，并对其简洁性感到震惊。尽管汇编语言的指令极其简单，但它却是所有现代编程语言的基础，其重要性不言而喻。 ... [详细]

蜡笔小新 2024-11-20 13:33:02
java
JUC并发编程——线程的基本方法使用

目录一、线程名称设置和获取二、线程的sleep()三、线程的interrupt四、join()五、yield()六、wait(),notify(),notifyAll( ... [详细]

蜡笔小新 2024-11-18 20:33:30
int
oracle 对硬件环境要求,Oracle 10G数据库软硬件环境的要求

oracle 对硬件环境要求,Oracle 10G数据库软硬件环境的要求 ... [详细]

蜡笔小新 2024-11-18 15:17:57
int
日志处理流程：Flume+MapReduce+Hive+Sqoop+MySQL

本文介绍了如何使用Flume从Linux文件系统收集日志并存储到HDFS，然后通过MapReduce清洗数据，使用Hive进行数据分析，并最终通过Sqoop将结果导出到MySQL数据库。 ... [详细]

蜡笔小新 2024-11-13 18:47:34

mobiledu2502900505

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章