热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Sparkyarn伪分布式搭建

配环境1.etcprofileexportSPARK_HOMEusrlocalsparkspark2.2exportPATH$SPARK_HOMEbin:$PATH2.spa

配环境

1.etc/profile

export SPARK_HOME=/usr/local/spark/spark2.2
export PATH=$SPARK_HOME/bin:$PATH

2.spark/conf/spark-env.sh

export JAVA_HOME=/usr/local/java/jdk1.8.0_161
export SPARK_MASTER_HOST=127.0.0.1 #不是master-ip那是1.x版本的写法
export HADOOP_HOME=/usr/local/hadoop/hadoop-2.8.3
export SPARK_HOME=/usr/local/spark/spark2.2
export SPARK_LIBARY_PATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$HADOOP_HOME/lib/native
export LD_LIBRARY_PATH=$HADOOP_HOME/lib/native/:$LD_LIBRARY_PATH

3.spark-default.conf

spark.master spark://ubuntu:7077 #这里要注意
spark.ui.port 4040#提交作业的默认UI,被占用的时候依次往下推

配置spark主要配置两个文件,一个是spark-env.sh这是spark的环境变量。另外一个是spark-defauts是每次提交作业的配置,可以不用配置,默认使用默认的配置或者提交作业的时候动态配置。

在启动sparkmaster和worker的时候,在sbin目录下用./形式启动,否则运行的是hadoop的命令,那样始终看不到master和worker

master 的端口和UI的端口不是一个端口

spark-default.conf中的spark UI port是每次提交作业默认的显示端口

整个spark的UI显示端口在8080

测试

运行示例程序sparkPI

./spark-submit --class org.apache.spark.examples.SparkPi --master spark://127.0.0.1:7077 /home/tobin/framework/spark/spark-2.2.0-bin-hadoop2.7/examples/jars/spark-examples_2.11-2.2.0.jar

class org.apache.spark.examples.SparkPi是类名

可能踩到的坑

(1)

Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

在spark-env.sh中添加

export LD_LIBRARY_PATH=$HADOOP_HOME/lib/native/:$LD_LIBRARY_PATH


(2)

WARN StandaloneAppClient$ClientEndpoint: Failed to connect to master localhost:7077

打开web UI,8080端口的那个,看上面写的master地址和端口是多少,spark-default.sh中spark.mater的值就要写多少

(3)在pycharm中使用spark的pyspark时,需要在环境变量里面把spark的python文件路径和python文件夹下lib的py4压缩文件添加进去


推荐阅读
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • HDFS2.x新特性
    一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • 本文概述了JNI的原理以及常用方法。JNI提供了一种Java字节码调用C/C++的解决方案,但引用类型不能直接在Native层使用,需要进行类型转化。多维数组(包括二维数组)都是引用类型,需要使用jobjectArray类型来存取其值。此外,由于Java支持函数重载,根据函数名无法找到对应的JNI函数,因此介绍了JNI函数签名信息的解决方案。 ... [详细]
  •     这里使用自己编译的hadoop-2.7.0版本部署在windows上,记得几年前,部署hadoop需要借助于cygwin,还需要开启ssh服务,最近发现,原来不需要借助cy ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  • 概述H.323是由ITU制定的通信控制协议,用于在分组交换网中提供多媒体业务。呼叫控制是其中的重要组成部分,它可用来建立点到点的媒体会话和多点间媒体会议 ... [详细]
  • 移动传感器扫描覆盖摘要:关于传感器网络中的地址覆盖问题,已经做过很多尝试。他们通常归为两类,全覆盖和栅栏覆盖,统称为静态覆盖 ... [详细]
  • 本文整理了Java中org.apache.hadoop.hbase.client.Increment.getDurability()方法的一些代码示例,展示了 ... [详细]
  • html结构 ... [详细]
  • 对于开源的东东,尤其是刚出来不久,我认为最好的学习方式就是能够看源代码和doc,測试它的样例为了方便查看源代码,关联导入源代 ... [详细]
  • Hello.js 是一个用于连接OAuth2服务的JavascriptRESTFULAPI库,如Go ... [详细]
  • Maven构建Hadoop,
    Maven构建Hadoop工程阅读目录序Maven安装构建示例下载系列索引 序  上一篇,我们编写了第一个MapReduce,并且成功的运行了Job,Hadoop1.x是通过ant ... [详细]
  • OAuth2.0指南
    引言OAuth2.0是一种应用之间彼此访问数据的开源授权协议。比如,一个游戏应用可以访问Facebook的用户数据,或者一个基于地理的应用可以访问Foursquare的用户数据等。 ... [详细]
  • NSD cisco高级路由与交换技术2014.8.12
    实验01:DHCP服务的应用实验目标:通过建立DHCP服务,给计算机自动分配地址实验环境:实验步骤:一、配置计算机pc8pc ... [详细]
author-avatar
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有