热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

利用闲置电脑安装虚拟机搭建hadoop集群

文章目录前言一、虚拟机环境的准备二、连接虚拟机上的集群1.整理需要连接的端口2.配置VMware上虚拟机的端口转发3.测试连接总结前言本人刚开始学习大数据,记录自己的一些学习笔记。

文章目录

  • 前言
  • 一、虚拟机环境的准备
  • 二、连接虚拟机上的集群
    • 1.整理需要连接的端口
    • 2.配置VMware上虚拟机的端口转发
    • 3.测试连接
  • 总结
前言

本人刚开始学习大数据,记录自己的一些学习笔记。大家在学习大数据开发的时候,第一件事情就是大数据环境的搭建,目前一般有三种搭建方式:1.使用windows环境搭建;2.自己电脑搭建linux虚拟机环境,可以自己建好多个虚拟机环境,然后搭建集群;3.购买云厂商的大数据集群或者主机自己搭建集群。第一种方式不主流,且出现问题解决资料不多,并且需要机子比较多。第二种方式自由度比较高,但是受限于自己机子的配置;第三种方式是目前的主流方式,但是要花钱。
由于电脑的升级换代,本人有一台老式12G内存、500G机械存储的某想笔记本,卡的不想做为办公电脑,还有一台8G内存、256G固态存储的新电脑(买来发现内存焊死了,不支持扩展,为什么配置这么尴尬,因为是白嫖的,便宜。。)。
想到在旧电脑上安装虚拟机,建几个linux环境,搭建hadoop集群;然后新电脑连接这个集群,还可以听老师讲课,敲代码。真是贫穷让人机智。
#博学谷IT学习技术支持#

一、虚拟机环境的准备

首先保证两台宿主机在一个网络环境下,假设他们为S1、S2,这边S1是我的新电脑、S2是我的旧电脑,它们的ip分别为:192.168.8.101、192.168.8.102。
在S2上安装虚拟机环境。使用虚拟机搭建hadoop集群的准备资料网上很多,一般就是下面几个步骤:

  1. 安装linux环境
  2. 安装jdk
  3. 安装hadoop,配置环境
  4. 安装hive,配置环境
    当前在VMware上建好了3个linux环境:node1、node2、node3,它们的ip分别为:192.168.9.101、192.168.9.102、192.168.9.103,并且安装了hadoop,hive集群,虚拟机网络配置为NAT,如下图:

《利用闲置电脑安装虚拟机搭建hadoop集群》

一定要保证宿主机和虚拟机之间网络是互通的,一般不通要么是防火墙没关或者网络配置等问题。

二、连接虚拟机上的集群

1.整理需要连接的端口

远程端口:22
hdfs端口:9870
hive端口:10000
这几个端口是我在学习hadoop集群中要连接的。

2.配置VMware上虚拟机的端口转发

S2主机上安装了虚拟机环境(hadoop01、hadoop02、hadoop03),我们要用S1主机访问S2上的虚拟机环境,它们处于不同的子网,是不通的。当前S2和hadoop01-hadoop03是可以互相访问的,S1和S2连得同一个路由器是通的,要让S1能访问hadoop01-hadoop03,这时候查看资料发现VMware其实自带端口转发,把S2虚拟机上需要连接的端口都转发出来,这时候S1就可以通过访问这些转发端口从而访问虚拟机内部的端口了。整理如下:

虚拟机IP虚拟机端口主机IP主机转发端口
192.168.9.10122192.168.8.10110202
192.168.9.1029870192.168.8.10119870
192.168.9.10310000192.168.8.10110000

1.配置虚拟网络编辑器
《利用闲置电脑安装虚拟机搭建hadoop集群》
2.更改NAT设置
《利用闲置电脑安装虚拟机搭建hadoop集群》
3.选择NAT网络,点击NAT设置
《利用闲置电脑安装虚拟机搭建hadoop集群》
4.添加映射端口
《利用闲置电脑安装虚拟机搭建hadoop集群》
5.点击确定,按照1-4步骤依次将22、9870、10000端口都映射起来。

3.测试连接

打开S2上的node1-node3虚拟机,用S1远程S2上的node1,这时候连接IP是S2的IP,端口是映射端口10022,可以连接:
《利用闲置电脑安装虚拟机搭建hadoop集群》
《利用闲置电脑安装虚拟机搭建hadoop集群》
启动hadoop集群和hive集群,然后S1上就可以访问集群了,测试连接hdfs和hive都可以。
《利用闲置电脑安装虚拟机搭建hadoop集群》

总结

本文使用VMware的端口转发功能,利用一台闲置电脑搭建虚拟机Hadoop集群,可以被相同子网中的其它主机连接,为后续学习大数据开发做准备。贫穷让我们相遇。
参考文章如下:
https://blog.csdn.net/qq_26230421/article/details/79232219


推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • AstridDAO 专访:波卡稳定币黑马 BAI
    加入Pol ... [详细]
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  •        在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下:       1、CentOS6.7下安装JDK,地址:http:b ... [详细]
  • Azkaban(三)Azkaban的使用
    界面介绍首页有四个菜单projects:最重要的部分,创建一个工程,所有flows将在工程中运行。scheduling:显示定时任务executing:显示当前运行的任务histo ... [详细]
  • Java开发实战讲解!字节跳动三场技术面+HR面
    二、回顾整理阿里面试题基本就这样了,还有一些零星的问题想不起来了,答案也整理出来了。自我介绍JVM如何加载一个类的过程,双亲委派模型中有 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 如何去除Win7快捷方式的箭头
    本文介绍了如何去除Win7快捷方式的箭头的方法,通过生成一个透明的ico图标并将其命名为Empty.ico,将图标复制到windows目录下,并导入注册表,即可去除箭头。这样做可以改善默认快捷方式的外观,提升桌面整洁度。 ... [详细]
  • HDFS2.x新特性
    一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]
  • 如何使用PLEX播放组播、抓取信号源以及设置路由器
    本文介绍了如何使用PLEX播放组播、抓取信号源以及设置路由器。通过使用xTeve软件和M3U源,用户可以在PLEX上实现直播功能,并且可以自动匹配EPG信息和定时录制节目。同时,本文还提供了从华为itv盒子提取组播地址的方法以及如何在ASUS固件路由器上设置IPTV。在使用PLEX之前,建议先使用VLC测试是否可以正常播放UDPXY转发的iptv流。最后,本文还介绍了docker版xTeve的设置方法。 ... [详细]
  • 动态多点××× 单云双HUB
    动态多点是一个高扩展的IPSEC解决方案传统的ipsecS2S有如下劣势1.中心站点配置量大,无论是采用经典ipsec***还是采用greoveripsec多一个分支 ... [详细]
  • MapReduce工作流程最详细解释
    MapReduce是我们再进行离线大数据处理的时候经常要使用的计算模型,MapReduce的计算过程被封装的很好,我们只用使用Map和Reduce函数,所以对其整体的计算过程不是太 ... [详细]
  • MapReduce 切片机制源码分析
     总体来说大概有以下2个大的步骤1.连接集群(yarnrunner或者是localjobrunner)2.submitter.submitJobInternal()在该方法中会创建 ... [详细]
author-avatar
可乐16311
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有