热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ubuntu16.04+Java8+hadoop2.x单机安装

关于hadoop及相关模块的安装,自己下载模块安装的话较为麻烦,有配置、版本对应的些许问题,使用cloudera集成好的平台也不错

关于hadoop及相关模块的安装,自己下载模块安装的话较为麻烦,有配置、版本对应的些许问题,使用cloudera集成好的平台也不错,但如果跑的任务多的话,机器配置要好一点,模糊的记得是最低需要8G内存?下面先记录下单机模式的安装。

hadoop集群有三种启动模式:


  • 单机模式:默认情况下运行为一个单独机器上的独立Java进程,主要用于调试环境
  • 伪分布模式:再单个机器上模拟成分布式环境,每一个hadoop守护进程都作为一个独立的java进程运行
  • 完全分布式模式:真实的环境,一般公司用到。

搭建步骤:

1、添加用户及用户组(提示输入密码,自己输入)

sudo adduser hadoop(自己输入自己想用的,在这使用hadoop)

将该用户添加进sudo用户组

sudo usermod -G sudo hadoop

2、安装jdk

java -version
echo $JAVA_HOME

首先可以使用上面两句先检查自己的ubuntu有没有安装jdk,没有的话安装一下。注意自己linux的版本,可以使用uname -a来检查操作系统的版本。JDK下载地址:

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

下载完毕后,在/usr(可自选自己习惯的放的目录)目录下创建java文件夹,将压缩包解压至此处。

sudo mkdir /usr/java
tar -zxvf jdk-8u171-linux-x64.tar.gz -C /usr/java/

解压完毕后,配置环境变量

vim ~/.bashrc
#在文件底部添加以下
export JAVA_HOME=/usr/java/jdk1.8.0_171
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$JAVA_HOME/bin:$PATH

完成后激活更改的环境变量:

source ~/.bashrc

之后便可以使用java -version 查看java是否安装成功。

3、安装ssh,并设置免密登录

因为Hadoop需要使用ssh进行通信,所以我们需要在我们的操作系统上安装ssh。在安装之前,我们需要查看系统是否已经安装并且启动了ssh。

#查看ssh安装包情况
dpkg -l | grep ssh #查看是否启动ssh服务
ps -e | grep ssh

如果没有ssh服务,则可以使用下一句来安装ssh。

$ sudo apt-get install openssh-server

安装完成,开启服务。

$ sudo /etc/init.d/ssh start

ssh作为一个安全通信协议,自然就需要通信的时候输入密码,所以我们将设置免密码登录。

在/home/hadoop目录下执行

#生成秘钥
ssh-keygen -t rsa #一直按回车就好
#导入authorized_keys
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
chmod 600 .ssh/authorized_keys
验证登录本机是否还需要密码,第一次需要密码以后不需要密码就可以登录。

$ ssh localhost #只需输入一次hadoop用户密码,之后不需要输入

至此,准备工作基本完成了。

4、下载安装Hadoop

下载地址:http://hadoop.apache.org/releases.html

https://mirrors.cnnic.cn/apache/hadoop/common/

可以找相应的版本进行下载,下载速度是有点慢,也可以使用下面方法(下载目录是当前目录,下载完毕后自行查看)

$ wget http://labfile.oss.aliyuncs.com/hadoop-2.6.0.tar.gz

解压安装:(路径为hadoop用户目录的hadoop-2.6.0目录下)

$ tar zxvf hadoop-2.6.0.tar.gz
$ mv hadoop-2.6.0 /home/hadoop/hadoop-2.6.0
$ chmod 777 /home/hadoop/hadoop-2.6.0

配置Hadoop

$ vi /home/hadoop/.bashrc

在/home/hadoop/.bashrc文件末尾添加以下内容:

export HADOOP_HOME=/home/hadoop/hadoop-2.6.0
export JAVA_HOME=/usr/java/jdk1.8.0_171
export PATH=/usr/local/sbin:/usr/local/bin/:/usr/bin:/usr/sbin:/sbin:/bin:/home/hadoop/hadoop-2.6.0/bin:/home/hadoop/hadoop-2.6.0/sbin

如果改了相应java和hadoop的安装文件目录,对应的路径更改就好。

完成添加后,激活新加的环境变量;

source ~/.bashrc

至此,单机模式的安装就完成了,验证单机模式安装成功,使用

hadoop version显示hadoop版本后,说明已经安装配置完成。









5、下面用单词统计来验证一下。

先创建一个空白文档,在里面随意输入一些词语,之后再/home/hadoop/hadoop-2.6.0目录下创建一个提供数据的文档,进行mapreduce是map方法在此处读取要统计单词的文档,创建好之后将数据文档复制到此处。命令行如下:

cd /home/hadoop/hadoop-2.6.0
mkdir hgg #我创建的文件夹
cp /home/hcx/Desktop/test ./hgg #test测试文档


执行hadoop wordcount应用(词频统计)

$ hadoop jar /home/hadoop/hadoop-2.6.0/share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.6.0-sources.jar org.apache.hadoop.examples.WordCount hgg hggoutput

查看生成的结果,在上述命令行中指定的hggoutput文件夹中,可以使用

cat /hggoutput/*查看结果。统计词频成功。













推荐阅读
  • Flume 开源分布式日志收集系统
    为什么80%的码农都做不了架构师?Flume--开源分布式日志收集系统Flume是Cloudera提供的一个高可用的、高可靠的开源分布式海量日志收集系统 ... [详细]
  • 大数据学习路线!
    大数据如此火热的现在,想必许多小伙伴都想要加入这个行业。也是AI菌今天就要拿出收藏已久的大数据学习计划。帮助你不走弯路,迈向大数据之路。1大数据应用离不开基础软件的支撑,且大部分大 ... [详细]
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • 本文总结了近年来在实际项目中使用消息中间件的经验和常见问题,旨在为Java初学者和中级开发者提供实用的参考。文章详细介绍了消息中间件在分布式系统中的作用,以及如何通过消息中间件实现高可用性和可扩展性。 ... [详细]
  • Ubuntu16.04安装CDH5.14.2
    一、安装clouderamanager(下文简称cm)(一).环境及软件准备:1.环境:Ubuntu16.04desktopx3台ip分别为:10.132.226.121,10.1 ... [详细]
  • 将Java的动态功能和JavaEnterprise标准的安全性引入大型网络应用的开发、集成、部署和管理之中。根据可能原因进行故障排查。假设有一台服务器出现故障,Keepalived ... [详细]
  • cdh添加Kafka服务配置项注意事项
    一、安装准备:下载对应版本所需软件:①kafkacsd包,下载地址:http:archive.cloudera.comcsdskafka②kafkaparcel包:地址:http: ... [详细]
  • 二维码的实现与应用
    本文介绍了二维码的基本概念、分类及其优缺点,并详细描述了如何使用Java编程语言结合第三方库(如ZXing和qrcode.jar)来实现二维码的生成与解析。 ... [详细]
  • 深入解析:存储技术的演变与发展
    本文探讨了从单机文件系统到分布式文件系统的存储技术发展过程,详细解释了各种存储模型及其特点。 ... [详细]
  • Redis:缓存与内存数据库详解
    本文介绍了数据库的基本分类,重点探讨了关系型与非关系型数据库的区别,并详细解析了Redis作为非关系型数据库的特点、工作模式、优点及持久化机制。 ... [详细]
  • 对象存储与块存储、文件存储等对比
    看到一篇文档,讲对象存储,好奇,搜索文章,摘抄,学习记录!背景:传统存储在面对海量非结构化数据时,在存储、分享与容灾上面临很大的挑战,主要表现在以下几个方面:传统存储并非为非结 ... [详细]
  • 华为捐赠欧拉操作系统,承诺不推商用版
    华为近日宣布将欧拉开源操作系统捐赠给开放原子开源基金会,并承诺不会推出欧拉的商用发行版。此举旨在推动欧拉和鸿蒙操作系统的全场景融合与生态发展。 ... [详细]
  • 使用clouderaquickstartvm无配置快速部署Hadoop应用
    http:zzj270919.blog.163.comblogstatic68997776201522561659999目录:通过CDH网站下载cloudera-vm ... [详细]
  • 2017-11-05卓明_开源中国开源中国开源中国微信号oschina2013功能介绍OSChina开源中国官方微信账号业务系统中,通常会遇到这些场景:A系统向B系统主动推送一个处 ... [详细]
  • 安装hive包[CDH下载地址](http:archive.cloudera.comcdh5cdh5)1、将hive-0.13.1-cdh5.3.10.tar.gz使用WinSCP ... [详细]
author-avatar
包千卿_413
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有