热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

hadoop安装(hadoop2.0.4alpha)

为什么80%的码农都做不了架构师?安装环境:centos;jdk-7-linux-x64.tar.gzhadoop-2.0.4-alpha.tar

为什么80%的码农都做不了架构师?>>>   hot3.png

安装环境:centos ;

             jdk-7-linux-x64.tar.gz

             hadoop-2.0.4-alpha.tar.gz

安装目录:/opt/cloud

1、首先安装jdk:

    tar -zvxf  jdk-7-linux-x64.tar.gz,将jdk解压至 /opt/cloud/jdk,设置环境变量,亦可不设置。

2、解压 hadoop-2.0.4-alpha.tar.gz

    tar -zvxf hadoop-2.0.4-alpha.tar.gz,将hadoop解压至 /opt/cloud/hadoop,可修改目录或者软连接。

3、配置 hadoop


  • ssh 免密码登陆:ssh-keygen -t rsa,使用 ssh localhost 测试,直接进入ssh则成功
  • Hadoop 环境变量配置
#vim /etc/profile 末行添加如下
export HADOOP_PREFIX=/opt/cloud/hadoop 
export PATH=$PATH:$HADOOP_PREFIX/bin:$HADOOP_PREFIX/sbin
export HADOOP_MAPRED_HOME=${HADOOP_PREFIX} 
export HADOOP_COMMON_HOME=${HADOOP_PREFIX} 
export HADOOP_HDFS_HOME=${HADOOP_PREFIX} 
export YARN_HOME=${HADOOP_PREFIX}



  • 修改Hadoop的配置文件:
    hadoop-env.sh:
    #vim /opt/cloud/hadoop/etc/hadoop/hadoop-env.sh

    修改 export JAVA_HOME=/opt/cloud/jdk



  • 编辑以下几个文件,加入配置信息,文件位于 hadoop/etc/hadoop

    ----------------core-site.xml



    fs.default.name
    hdfs://localhost:8020 
    The name of the default file system. Either the literal string "local" or a host:port for NDFS.
    true 




    ------------------------- yarn-site.xml


     
    yarn.nodemanager.aux-services 
    mapreduce.shuffle 
     


     
    yarn.nodemanager.aux-services.mapreduce.shuffle.class 
    org.apache.hadoop.mapred.ShuffleHandler 
     
    ------------------------ mapred-site.xml

     
    mapreduce.framework.name 
    yarn 
     


     
    mapred.system.dir 
    file:/opt/cloud/hadoop_space/mapred/system 
    true 
     


     
    mapred.local.dir 
    file:/opt/cloud/hadoop_space/mapred/local 
    true 
     



    ----------- hdfs-site.xml  


    dfs.namenode.name.dir
    file:/opt/cloud/hadoop_space/dfs/name
    Determines where on the local filesystem the DFS name node should store 
    the name table. If this is a comma-delimited list 
    of directories then the name table is replicated in all of the directories, for redundancy.
    true

    dfs.datanode.data.dir
    file:/opt/cloud/hadoop_space/dfs/data
    Determines where on the local 
    filesystem an DFS data node should store its blocks. If this is a comma-delimited 
    list of directories, then data will be stored in all named 
    directories, typically on different devices. 
    Directories that do not exist are ignored. 
    true
    dfs.replication
    1


    dfs.permissions
    false


4、测试

以上配置好后启动HDFS:
# hdfs namenode -format 
运行成功以后可以使用一下命令启动NameNode和DataNode
hadoop-daemon.sh start namenode 

# hadoop-daemon.sh start datanode 

打开:http://mycentos:50070/dfshealth.jsp




转:https://my.oschina.net/lohonx/blog/132111



推荐阅读
  •     这里使用自己编译的hadoop-2.7.0版本部署在windows上,记得几年前,部署hadoop需要借助于cygwin,还需要开启ssh服务,最近发现,原来不需要借助cy ... [详细]
  • HDFS2.x新特性
    一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • hadoop1.2.1文档中这样写:Nowcheckthatyoucansshtothelocalhostwithoutapassphrase:$sshlocalhostIfyou ... [详细]
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  • mapreduce源码分析总结
    这篇文章总结的非常到位,故而转之一MapReduce概述MapReduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的ÿ ... [详细]
  • LVS-DR直接路由实现负载均衡示例
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • 对于开源的东东,尤其是刚出来不久,我认为最好的学习方式就是能够看源代码和doc,測试它的样例为了方便查看源代码,关联导入源代 ... [详细]
  • CentOS 7配置SSH远程访问及控制
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • Kylin 单节点安装
    软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]
  •        在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下:       1、CentOS6.7下安装JDK,地址:http:b ... [详细]
  • MapReduce工作流程最详细解释
    MapReduce是我们再进行离线大数据处理的时候经常要使用的计算模型,MapReduce的计算过程被封装的很好,我们只用使用Map和Reduce函数,所以对其整体的计算过程不是太 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 在单位的一台4cpu的服务器上部署了esxserver,挂载了6个虚拟机,目前运行正常。在安装部署过程中,得到了cnvz.net论坛精华区 ... [详细]
author-avatar
挖掘机销售mv
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有