首页
技术博客
PHP教程
数据库技术
前端开发
HTML5
Nginx
php论坛
新用户注册
|
会员登录
PHP教程
技术博客
编程问答
PNG素材
编程语言
前端技术
Android
PHP教程
HTML5教程
数据库
Linux技术
Nginx技术
PHP安全
WebSerer
职场攻略
JavaScript
开放平台
业界资讯
大话程序猿
登录
极速注册
取消
热门标签 | HotTags
join
scala
dagger
bit
shell
audio
case
uri
solr
stream
php5
testing
bash
js
nodejs
search
iostream
数组
config
require
web
regex
plugins
hashcode
split
integer
usb
instance
default
flutter
actionscrip
bitmap
httprequest
replace
timestamp
import
main
jsp
ip
cookie
controller
blob
tags
format
range
ascii
export
netty
php7
const
tree
less
expression
heap
keyword
cPlusPlus
httpclient
match
random
install
filter
utf-8
cmd
datetime
rsa
python2
foreach
eval
go
include
sum
callback
header
erlang
byte
triggers
node.js
substring
chat
当前位置:
开发笔记
>
编程语言
> 正文
SPARK为啥spark用netty替换akka
作者:piggyear | 来源:互联网 | 2023-07-24 18:43
很多Spark用户也使用Akka,但是由于Akka不同版本之间无法互相通信,这就要求用户必须使用跟Spark完全一样的Akka版本,导致用
很多Spark用户也使用Akka,但是由于Akka不同版本之间无法互相通信,这就要求用户必须使用跟Spark完全一样的Akka版本,导致用户无法升级Akka。
Spark的Akka配置是针对Spark自身来调优的,可能跟用户自己代码中的Akka配置冲突。
Spark用的Akka特性很少,这部分特性很容易自己实现。同时,这部分代码量相比Akka来说少很多,debug比较容易。如果遇到什么bug,也可以自己马上fix,不需要等Akka上游发布新版本。而且,Spark升级Akka本身又因为第一点会强制要求用户升级他们使用的Akka,对于某些用户来说是不现实的。
akka 是为了通信,不适合大数据量的传输,像hadoop flink hbase 这些后面都用netty 来做节点间数据的传输
blockmanager已经要用netty传数据了,顺便实现个rpc成本不高,也不引入额外依赖。
https://issues.apache.org/jira/plugins/servlet/mobile#issue/SPARK-5293
https://www.zhihu.com/question/61638635
spark
netty
hadoop
flink
hbase
rpc
https
apache
jira
写下你的评论吧 !
吐个槽吧,看都看了
会员登录
|
用户注册
推荐阅读
web
从0到1搭建大数据平台
从0到1搭建大数据平台 ...
[详细]
蜡笔小新 2024-11-12 15:26:03
config
在Linux系统中配置环境变量以切换不同版本Python的方法与实践
在Linux系统中,原本已安装了多个版本的Python 2,并且还安装了Anaconda,其中包含了Python 3。本文详细介绍了如何通过配置环境变量,使系统默认使用指定版本的Python,以便在不同版本之间轻松切换。此外,文章还提供了具体的实践步骤和注意事项,帮助用户高效地管理和使用不同版本的Python环境。 ...
[详细]
蜡笔小新 2024-10-30 09:39:09
config
Storm集成Kakfa
一、整合说明Storm官方对Kafka的整合分为两个版本,官方说明文档分别如下:StormKafkaIntegratio ...
[详细]
蜡笔小新 2024-10-16 20:20:41
split
Spark与HBase结合处理大规模流量数据结构设计
本文将详细介绍如何利用Spark和HBase进行大规模流量数据的分析与处理,包括数据结构的设计和优化方法。 ...
[详细]
蜡笔小新 2024-11-12 19:49:05
plugins
优化Hadoop 2.7.2源代码以支持Snappy压缩和解压功能的Native编译
为了在Hadoop 2.7.2中实现对Snappy压缩和解压功能的原生支持,本文详细介绍了如何重新编译Hadoop源代码,并优化其Native编译过程。通过这一优化,可以显著提升数据处理的效率和性能。此外,还探讨了编译过程中可能遇到的问题及其解决方案,为用户提供了一套完整的操作指南。 ...
[详细]
蜡笔小新 2024-11-09 19:45:36
search
如何高效启动大数据应用之旅?
在前一篇文章中,我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目,涵盖关键步骤和最佳实践,帮助读者快速踏上大数据之旅。 ...
[详细]
蜡笔小新 2024-11-04 18:30:38
数组
深入掌握Scala面向对象编程与Spark源码解析
在第二课中,我们将深入探讨Scala的面向对象编程核心概念及其在Spark源码中的应用。首先,通过详细的实战案例,全面解析Scala中的类和对象。作为一门纯面向对象的语言,Scala的类设计和对象使用是理解其面向对象特性的关键。此外,我们还将介绍如何通过阅读Spark源码来进一步巩固对这些概念的理解。这不仅有助于提升编程技能,还能为后续的高级应用开发打下坚实的基础。 ...
[详细]
蜡笔小新 2024-11-03 14:51:55
split
构建高可用性Spark分布式集群:大数据环境下的最佳实践
在构建高可用性的Spark分布式集群过程中,确保所有节点之间的无密码登录是至关重要的一步。通过在每个节点上生成SSH密钥对(使用 `ssh-keygen -t rsa` 命令并保持默认设置),可以实现这一目标。此外,还需将生成的公钥分发到所有节点的 `~/.ssh/authorized_keys` 文件中,以确保节点间的无缝通信。为了进一步提升集群的稳定性和性能,建议采用负载均衡和故障恢复机制,并定期进行系统监控和维护。 ...
[详细]
蜡笔小新 2024-11-02 14:18:50
split
如何在Hive中合理配置Map和Reduce任务数量以优化不同场景下的性能表现
在Hive中合理配置Map和Reduce任务的数量对于优化不同场景下的性能至关重要。本文探讨了如何控制Hive任务中的Map数量,分析了当输入数据超过128MB时是否会自动拆分,以及Map数量是否越多越好的问题。通过实际案例和实验数据,本文提供了具体的配置建议,帮助用户在不同场景下实现最佳性能。 ...
[详细]
蜡笔小新 2024-10-31 14:33:41
default
HBase在金融大数据迁移中的应用与挑战
随着最后一台设备的下线,标志着超过10PB的HBase数据迁移项目顺利完成。目前,新的集群已在新机房稳定运行超过两个月,监控数据显示,新集群的查询响应时间显著降低,系统稳定性大幅提升。此外,数据消费的波动也变得更加平滑,整体性能得到了显著优化。 ...
[详细]
蜡笔小新 2024-10-31 14:06:06
instance
技术日志:深入探讨Spark Streaming与Spark SQL的融合应用
技术日志:深入探讨Spark Streaming与Spark SQL的融合应用 ...
[详细]
蜡笔小新 2024-10-30 14:20:53
instance
如何在Maven中高效管理多模块项目中的依赖关系
在Maven中高效管理多模块项目的依赖关系是一项重要的技能。通过合理配置父POM文件,可以统一管理和控制各子模块的依赖版本,避免重复导入和版本冲突。本文将探讨如何利用Maven的最佳实践,确保项目依赖的一致性和可维护性,同时提高开发效率。 ...
[详细]
蜡笔小新 2024-10-24 17:04:44
default
pyspark RDD数据的读取与保存
数据读取hadoopFileParameters:path–pathtoHadoopfileinputFormatClass–fullyqualifiedclassnameo ...
[详细]
蜡笔小新 2024-10-17 18:31:13
stream
两种方式实现Flink异步IO查询Mysql
如官网所描述的Flink支持两种方式实现异步IO查询外部系统http ...
[详细]
蜡笔小新 2024-09-28 11:27:02
stream
什么是大数据lambda架构
一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ...
[详细]
蜡笔小新 2023-10-17 16:06:09
piggyear
这个家伙很懒,什么也没留下!
Tags | 热门标签
join
scala
dagger
bit
shell
audio
case
uri
solr
stream
php5
testing
bash
js
nodejs
search
iostream
数组
config
require
web
regex
plugins
hashcode
split
integer
usb
instance
default
flutter
RankList | 热门文章
1
aspnetCore3.1网站部署到IIS
2
react 从入门到实践之 react 的虚拟 DOM 和 Diff 算法
3
Google OAuth 无法执行回调函数 finishedWithAuth
4
react学习系列之states与props
5
即时通讯软件源码,企业开发自己即时通讯软件网络
6
postgreSQL的导入导出
7
个人作业2—英语学习APP案例分析
8
2022.4.2学习成果
9
开发一个app的周期是多长
10
使用Animation实现Button的透明度Opacity变化
11
Java 批量删除Word中的空白段落示例代码_java
12
数据结构讨论课二:栈和队列的应用——停车场模拟
13
香蕉派BPI-M64-〇〇五之:烧录Ubuntu16.04到emmc中(基于win10系统下操作)
14
混合开发中,vue怎样动态获取后台的域名地址。
15
python学习整理
PHP1.CN | 中国最专业的PHP中文社区 |
DevBox开发工具箱
|
json解析格式化
|
PHP资讯
|
PHP教程
|
数据库技术
|
服务器技术
|
前端开发技术
|
PHP框架
|
开发工具
|
在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |
京公网安备 11010802041100号
|
京ICP备19059560号-4
| PHP1.CN 第一PHP社区 版权所有