热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

spark之hadoop2.6环境搭建笔记

一spark、hadoop、yarn关系spark:计算hadoop:存储yarn:资源管理在这里主要配置hdfs和yarnhdfsy

一 spark、hadoop、yarn关系

spark :计算
hadoop:存储
yarn: 资源管理

在这里主要配置hdfs和yarn
hdfs
yarn
mapreduce(计算框架, spark)

yarn: 主进程:resourcemanager
yarn的开: sbin/start-yarn.sh
yarn的关闭:sbin/stop-yarn.sh
登录的url:http://localhost:8088

hdfs:
namenode 进程
datanode 进程
dfs的开与关: sbin/start-dfs.sh , sbin/stop-dfs.sh
登录url:http://localhost:50070


二 hadoop2.6集群环境搭建


  1. hadoop 下载,解压

  2. 设置环境变量
    2.1 HADOOP_HOME 设置
    2.2 hadoop_CONF_DIR 设置 $HADOOP_HOME/etc/hadoop

    2.3 YARN_CONF_DIR 设置 $HADOOP_HOME/etc/hadoop
    具体见:

    vim ~/bashrc
    export JAVA_HOME=/usr/lib/java/jdk1.8.0_45
    export JRE_HOME=${JAVA_HOME}/jre
    export HADOOP_HOME=/usr/local/hadoop/hadoop-2.6.0
    export CLASS_PATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
    export PATH=${JAVA_HOME}/bin:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH
    export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
    export YARN_CONF_DIR=${HADOOP_HOME}/etc/hadoop

  3. core-site.xml 设置

<configuration><property><name>fs.default.namename><value>hdfs://localhost:9000value>property><property><name>hadoop.tmp.dirname><value>/usr/local/hadoop/hadoop-2.6.0/tmpvalue>property>configuration>

  1. hdfs-site.xml 设置

<configuration><property><name>dfs.replicationname><value>1value>property><property><name>dfs.name.dirname><value>/usr/local/hadoop/hadoop-2.6.0/dfs/namevalue>property><property><name>dfs.data.dirname><value>/usr/local/hadoop/hadoop-2.6.0/dfs/datavalue>property>configuration>

  1. mapred-site.xml 设置

<configuration><property><name>mapred.job.trackername><value>localhost:9001value>property>configuration>

  1. hadoop-env.sh设置 $JAVA_HOME

# The java implementation to use.export JAVA_HOME&#61;/usr/lib/java/jdk1.8.0_45

  1. YARN-env.sh设置 $JAVA_HOME

export JAVA_HOME&#61;/usr/lib/java/jdk1.8.0_45

推荐阅读
  • HDFS2.x新特性
    一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]
  •     这里使用自己编译的hadoop-2.7.0版本部署在windows上,记得几年前,部署hadoop需要借助于cygwin,还需要开启ssh服务,最近发现,原来不需要借助cy ... [详细]
  • MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法,就会将job提交给本地执行器localjobrunner执行-- ... [详细]
  • Kylin 单节点安装
    软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]
  •        在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下:       1、CentOS6.7下安装JDK,地址:http:b ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  • 对于开源的东东,尤其是刚出来不久,我认为最好的学习方式就是能够看源代码和doc,測试它的样例为了方便查看源代码,关联导入源代 ... [详细]
  • 前言折腾了一段时间hadoop的部署管理,写下此系列博客记录一下。为了避免各位做部署这种重复性的劳动,我已经把部署的步骤写成脚本,各位只需要按着本文把脚本执行完,整个环境基本就部署 ... [详细]
  • MapReduce 切片机制源码分析
     总体来说大概有以下2个大的步骤1.连接集群(yarnrunner或者是localjobrunner)2.submitter.submitJobInternal()在该方法中会创建 ... [详细]
  • SparkOnYarn在YARN上启动Spark应用有两种模式。在cluster模式下,Spark驱动器(driver)在YARNApp ... [详细]
  • Hadoop之Yarn
    目录1Hadoop1.x和Hadoop2.x架构区别2Yarn概述3Yarn基本架构4Yarn工作机制5作业提交全过程6资源调度器7任务的推测执行1Hadoop1.x和Hadoo ... [详细]
  • hbase伪集群搭建
    hbase数据存储有三种跑法,跑在本地磁盘上、跑在伪分布式上、跑在完全分布式上--------额。。。官网的文档挺坑爹的,结合官网、百度、谷歌的各种 ... [详细]
  • iOS超签签名服务器搭建及其优劣势
    本文介绍了搭建iOS超签签名服务器的原因和优势,包括不掉签、用户可以直接安装不需要信任、体验好等。同时也提到了超签的劣势,即一个证书只能安装100个,成本较高。文章还详细介绍了超签的实现原理,包括用户请求服务器安装mobileconfig文件、服务器调用苹果接口添加udid等步骤。最后,还提到了生成mobileconfig文件和导出AppleWorldwideDeveloperRelationsCertificationAuthority证书的方法。 ... [详细]
  • 本文介绍了在Mac上安装Xamarin并使用Windows上的VS开发iOS app的方法,包括所需的安装环境和软件,以及使用Xamarin.iOS进行开发的步骤。通过这种方法,即使没有Mac或者安装苹果系统,程序员们也能轻松开发iOS app。 ... [详细]
  • 本文介绍了在sqoop1.4.*版本中,如何实现自定义分隔符的方法及步骤。通过修改sqoop生成的java文件,并重新编译,可以满足实际开发中对分隔符的需求。具体步骤包括修改java文件中的一行代码,重新编译所需的hadoop包等。详细步骤和编译方法在本文中都有详细说明。 ... [详细]
author-avatar
刘自龙Sophisten
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有