热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

利用闲置电脑安装虚拟机搭建hadoop集群

文章目录前言一、虚拟机环境的准备二、连接虚拟机上的集群1.整理需要连接的端口2.配置VMware上虚拟机的端口转发3.测试连接总结前言本人刚开始学习大数据,记录自己的一些学习笔记。

文章目录

  • 前言
  • 一、虚拟机环境的准备
  • 二、连接虚拟机上的集群
    • 1.整理需要连接的端口
    • 2.配置VMware上虚拟机的端口转发
    • 3.测试连接
  • 总结
前言

本人刚开始学习大数据,记录自己的一些学习笔记。大家在学习大数据开发的时候,第一件事情就是大数据环境的搭建,目前一般有三种搭建方式:1.使用windows环境搭建;2.自己电脑搭建linux虚拟机环境,可以自己建好多个虚拟机环境,然后搭建集群;3.购买云厂商的大数据集群或者主机自己搭建集群。第一种方式不主流,且出现问题解决资料不多,并且需要机子比较多。第二种方式自由度比较高,但是受限于自己机子的配置;第三种方式是目前的主流方式,但是要花钱。
由于电脑的升级换代,本人有一台老式12G内存、500G机械存储的某想笔记本,卡的不想做为办公电脑,还有一台8G内存、256G固态存储的新电脑(买来发现内存焊死了,不支持扩展,为什么配置这么尴尬,因为是白嫖的,便宜。。)。
想到在旧电脑上安装虚拟机,建几个linux环境,搭建hadoop集群;然后新电脑连接这个集群,还可以听老师讲课,敲代码。真是贫穷让人机智。
#博学谷IT学习技术支持#

一、虚拟机环境的准备

首先保证两台宿主机在一个网络环境下,假设他们为S1、S2,这边S1是我的新电脑、S2是我的旧电脑,它们的ip分别为:192.168.8.101、192.168.8.102。
在S2上安装虚拟机环境。使用虚拟机搭建hadoop集群的准备资料网上很多,一般就是下面几个步骤:

  1. 安装linux环境
  2. 安装jdk
  3. 安装hadoop,配置环境
  4. 安装hive,配置环境
    当前在VMware上建好了3个linux环境:node1、node2、node3,它们的ip分别为:192.168.9.101、192.168.9.102、192.168.9.103,并且安装了hadoop,hive集群,虚拟机网络配置为NAT,如下图:

《利用闲置电脑安装虚拟机搭建hadoop集群》

一定要保证宿主机和虚拟机之间网络是互通的,一般不通要么是防火墙没关或者网络配置等问题。

二、连接虚拟机上的集群

1.整理需要连接的端口

远程端口:22
hdfs端口:9870
hive端口:10000
这几个端口是我在学习hadoop集群中要连接的。

2.配置VMware上虚拟机的端口转发

S2主机上安装了虚拟机环境(hadoop01、hadoop02、hadoop03),我们要用S1主机访问S2上的虚拟机环境,它们处于不同的子网,是不通的。当前S2和hadoop01-hadoop03是可以互相访问的,S1和S2连得同一个路由器是通的,要让S1能访问hadoop01-hadoop03,这时候查看资料发现VMware其实自带端口转发,把S2虚拟机上需要连接的端口都转发出来,这时候S1就可以通过访问这些转发端口从而访问虚拟机内部的端口了。整理如下:

虚拟机IP虚拟机端口主机IP主机转发端口
192.168.9.10122192.168.8.10110202
192.168.9.1029870192.168.8.10119870
192.168.9.10310000192.168.8.10110000

1.配置虚拟网络编辑器
《利用闲置电脑安装虚拟机搭建hadoop集群》
2.更改NAT设置
《利用闲置电脑安装虚拟机搭建hadoop集群》
3.选择NAT网络,点击NAT设置
《利用闲置电脑安装虚拟机搭建hadoop集群》
4.添加映射端口
《利用闲置电脑安装虚拟机搭建hadoop集群》
5.点击确定,按照1-4步骤依次将22、9870、10000端口都映射起来。

3.测试连接

打开S2上的node1-node3虚拟机,用S1远程S2上的node1,这时候连接IP是S2的IP,端口是映射端口10022,可以连接:
《利用闲置电脑安装虚拟机搭建hadoop集群》
《利用闲置电脑安装虚拟机搭建hadoop集群》
启动hadoop集群和hive集群,然后S1上就可以访问集群了,测试连接hdfs和hive都可以。
《利用闲置电脑安装虚拟机搭建hadoop集群》

总结

本文使用VMware的端口转发功能,利用一台闲置电脑搭建虚拟机Hadoop集群,可以被相同子网中的其它主机连接,为后续学习大数据开发做准备。贫穷让我们相遇。
参考文章如下:
https://blog.csdn.net/qq_26230421/article/details/79232219


推荐阅读
  • HBase在金融大数据迁移中的应用与挑战
    随着最后一台设备的下线,标志着超过10PB的HBase数据迁移项目顺利完成。目前,新的集群已在新机房稳定运行超过两个月,监控数据显示,新集群的查询响应时间显著降低,系统稳定性大幅提升。此外,数据消费的波动也变得更加平滑,整体性能得到了显著优化。 ... [详细]
  • 本文介绍了如何使用Hive分析用户最长连续登录天数的方法。首先对数据进行排序,然后计算相邻日期之间的差值,接着按用户ID分组并累加连续登录天数,最后求出每个用户的最大连续登录天数。此外,还探讨了该方法在其他领域的应用,如股票市场中最大连续涨停天数的分析。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南
    2012年9月12日,优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分,有一道题目涉及中国人的血型分布情况,具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中,至少有一人为B型血的概率不低于90%,则需要选取的最少人数是多少?该问题不仅考察了概率统计的基本知识,还要求考生具备一定的逻辑推理能力。 ... [详细]
  • 字节跳动深圳研发中心安全业务团队正在火热招募人才! ... [详细]
  • 在Linux系统中,原本已安装了多个版本的Python 2,并且还安装了Anaconda,其中包含了Python 3。本文详细介绍了如何通过配置环境变量,使系统默认使用指定版本的Python,以便在不同版本之间轻松切换。此外,文章还提供了具体的实践步骤和注意事项,帮助用户高效地管理和使用不同版本的Python环境。 ... [详细]
  • 本文详细介绍了在 Ubuntu 系统上搭建 Hadoop 集群时遇到的 SSH 密钥认证问题及其解决方案。通过本文,读者可以了解如何在多台虚拟机之间实现无密码 SSH 登录,从而顺利启动 Hadoop 集群。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 结城浩(1963年7月出生),日本资深程序员和技术作家,居住在东京武藏野市。他开发了著名的YukiWiki软件,并在杂志上发表了大量程序入门文章和技术翻译作品。结城浩著有30多本关于编程和数学的书籍,其中许多被翻译成英文和韩文。 ... [详细]
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • 本文通过思维导图的形式,深入解析了大型网站技术架构的核心原理与实际案例。首先,探讨了大型网站架构的演化过程,从单体应用到分布式系统的转变,以及各阶段的关键技术和挑战。接着,详细分析了常见的大型网站架构模式,包括负载均衡、缓存机制、数据库设计等,并结合具体案例进行说明。这些内容不仅有助于理解大型网站的技术实现,还能为实际项目提供宝贵的参考。 ... [详细]
  • 本文详细介绍了批处理技术的基本概念及其在实际应用中的重要性。首先,对简单的批处理内部命令进行了概述,重点讲解了Echo命令的功能,包括如何打开或关闭回显功能以及显示消息。如果没有指定任何参数,Echo命令会显示当前的回显设置。此外,文章还探讨了批处理技术在自动化任务执行、系统管理等领域的广泛应用,为读者提供了丰富的实践案例和技术指导。 ... [详细]
  • 深入解析OSI七层架构与TCP/IP协议体系
    本文详细探讨了OSI七层模型(Open System Interconnection,开放系统互连)及其与TCP/IP协议体系的关系。OSI模型将网络通信过程划分为七个层次,每个层次负责不同的功能,从物理层到应用层逐步实现数据传输和处理。通过对比分析,本文揭示了OSI模型与TCP/IP协议在结构和功能上的异同,为理解现代网络通信提供了全面的视角。 ... [详细]
  • 本文详细介绍了HDFS的基础知识及其数据读写机制。首先,文章阐述了HDFS的架构,包括其核心组件及其角色和功能。特别地,对NameNode进行了深入解析,指出其主要负责在内存中存储元数据、目录结构以及文件块的映射关系,并通过持久化方案确保数据的可靠性和高可用性。此外,还探讨了DataNode的角色及其在数据存储和读取过程中的关键作用。 ... [详细]
  • 分布式一致性算法:Paxos 的企业级实战
    一、简介首先我们这个平台是ES专题技术的分享平台,众所周知,ES是一个典型的分布式系统。在工作和学习中,我们可能都已经接触和学习过多种不同的分布式系统了,各 ... [详细]
author-avatar
可乐16311
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有