当前位置: 开发笔记 > 编程语言 > 正文

PythonPySparkStorageLevel

作者：手机用户3312丿075454 | 来源：互联网 | 2023-09-08 23:57

StorageLevel决定如何存储RDD。在ApacheSpark中，StorageLevel决定RDD是应该存储在内存中还是存储在磁盘上，或两者都存储。它还决定是否序列化RDD以及是否复制

StorageLevel决定如何存储RDD。在Apache Spark中，StorageLevel决定RDD是应该存储在内存中还是存储在磁盘上，或两者都存储。它还决定是否序列化RDD以及是否复制RDD分区。

以下代码块具有StorageLevel的类定义

class pyspark.StorageLevel(useDisk, useMemory, useOffHeap, deserialized, replication = 1)

现在，为了确定RDD的存储，有不同的存储级别，如下所示 -

DISK_ONLY = StorageLevel（True，False，False，False，1）

DISK_ONLY_2 = StorageLevel（True，False，False，False，2）

MEMORY_AND_DISK = StorageLevel（True，True，False，False，1）

MEMORY_AND_DISK_2 = StorageLevel（True，True，False，False，2）

MEMORY_AND_DISK_SER = StorageLevel（True，True，False，False，1）

MEMORY_AND_DISK_SER_2 = StorageLevel（True，True，False，False，2）

MEMORY_ONLY = StorageLevel（False，True，False，False，1）

MEMORY_ONLY_2 = StorageLevel（False，True，False，False，2）

MEMORY_ONLY_SER = StorageLevel（False，True，False，False，1）

MEMORY_ONLY_SER_2 = StorageLevel（False，True，False，False，2）

OFF_HEAP = StorageLevel（True，True，True，False，1）

让我们考虑以下StorageLevel示例，其中我们使用存储级别 MEMORY_AND_DISK_2， 这意味着RDD分区将具有2的复制。

------------------------------------storagelevel.py-------------------------------------
from pyspark import SparkContext
import pyspark
sc = SparkContext (
"local",
"storagelevel app"
)
rdd1 = sc.parallelize([1,2])
rdd1.persist( pyspark.StorageLevel.MEMORY_AND_DISK_2 )
rdd1.getStorageLevel()
print(rdd1.getStorageLevel())
------------------------------------storagelevel.py-------------------------------------

命令 - 命令如下

$SPARK_HOME/bin/spark-submit storagelevel.py

输出 - 上述命令的输出如下

Disk Memory Serialized 2x Replicated

推荐阅读

object
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
import
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
import
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
import
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
import
Spark实现高斯朴素贝叶斯模型的低配版

本文介绍了使用Spark实现低配版高斯朴素贝叶斯模型的原因和原理。随着数据量的增大，单机上运行高斯朴素贝叶斯模型会变得很慢，因此考虑使用Spark来加速运行。然而，Spark的MLlib并没有实现高斯朴素贝叶斯模型，因此需要自己动手实现。文章还介绍了朴素贝叶斯的原理和公式，并对具有多个特征和类别的模型进行了讨论。最后，作者总结了实现低配版高斯朴素贝叶斯模型的步骤。 ... [详细]

蜡笔小新 2023-12-10 21:42:37
version
国庆节到了，安利一个Android的自动动态授权插件

Android的老铁都知道申请权限时，除了要在AndroidManifest添加权限，还需要在activity中通过requestpermission对 ... [详细]

蜡笔小新 2023-10-17 06:57:20
copy
Python中程序员的面试题有哪些

小编给大家分享一下Python中程序员的面试题有哪些，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有 ... [详细]

蜡笔小新 2023-10-17 00:38:33
import
开发笔记:Spark Java API 之 CountVectorizer

篇首语：本文由编程笔记#小编为大家整理，主要介绍了SparkJavaAPI之CountVectorizer相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 16:53:30
import
jsp数据库多行返回（excel返回多行数据）

本文目录一览：1、数据库数据怎么返回到jsp页面上 ... [详细]

蜡笔小新 2023-10-15 16:34:06
copy
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
go
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
import
java 数据同步分页_JAVA的数据分页显示

importjava.util.ArrayList;publicclassPageIndex{privateintpageSize;每页要显示的行privateintpageNum ... [详细]

蜡笔小新 2023-12-13 16:40:13
heap
剑指offer 63.数据流中的中位数题目如何得到一个数据流中的中位数？

本文介绍了如何通过维持两个堆来获取一个数据流中的中位数。通过使用最大堆和最小堆，分别保存数据流中较小的一半和较大的一半数值，可以保证两个堆的大小差距为1或0。如果数据流中的数量为奇数，则中位数为较大堆的最大值；如果数量为偶数，则中位数为较大堆的最大值和较小堆的最小值的平均值。可以使用优先队列来实现堆的功能。本文还提供了相应的Java代码实现。 ... [详细]

蜡笔小新 2023-12-09 01:41:07
object
c#语言-多线程中的锁系统(一)

介绍平常在多线程开发中，总避免不了线程同步。本篇就对net多线程中的锁系统做个简单描述。目录一：lock、Monitor1：基础 ... [详细]

蜡笔小新 2023-10-16 17:56:14
import
牛B三人组快速排序堆排序归并排序

快速排序随便取个数，作为标志值，这里就默认为索引位置为0的值记录左索引和右索引，从右往左找比标志值小的，小值和左索引值交换& ... [详细]

蜡笔小新 2023-10-15 14:10:15

手机用户3312丿075454

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章