利用闲置电脑安装虚拟机搭建hadoop集群

作者：可乐16311 | 来源：互联网 | 2023-09-12 20:21

文章目录前言一、虚拟机环境的准备二、连接虚拟机上的集群1.整理需要连接的端口2.配置VMware上虚拟机的端口转发3.测试连接总结前言本人刚开始学习大数据，记录自己的一些学习笔记。

文章目录

前言
一、虚拟机环境的准备
二、连接虚拟机上的集群
- 1.整理需要连接的端口
- 2.配置VMware上虚拟机的端口转发
- 3.测试连接
总结

前言

本人刚开始学习大数据，记录自己的一些学习笔记。大家在学习大数据开发的时候，第一件事情就是大数据环境的搭建，目前一般有三种搭建方式:1.使用windows环境搭建；2.自己电脑搭建linux虚拟机环境，可以自己建好多个虚拟机环境，然后搭建集群；3.购买云厂商的大数据集群或者主机自己搭建集群。第一种方式不主流，且出现问题解决资料不多，并且需要机子比较多。第二种方式自由度比较高，但是受限于自己机子的配置；第三种方式是目前的主流方式，但是要花钱。
由于电脑的升级换代，本人有一台老式12G内存、500G机械存储的某想笔记本，卡的不想做为办公电脑，还有一台8G内存、256G固态存储的新电脑（买来发现内存焊死了，不支持扩展，为什么配置这么尴尬，因为是白嫖的，便宜。。）。
想到在旧电脑上安装虚拟机，建几个linux环境，搭建hadoop集群；然后新电脑连接这个集群，还可以听老师讲课，敲代码。真是贫穷让人机智。
#博学谷IT学习技术支持#

一、虚拟机环境的准备

首先保证两台宿主机在一个网络环境下，假设他们为S1、S2，这边S1是我的新电脑、S2是我的旧电脑，它们的ip分别为：192.168.8.101、192.168.8.102。
在S2上安装虚拟机环境。使用虚拟机搭建hadoop集群的准备资料网上很多，一般就是下面几个步骤：

安装linux环境
安装jdk
安装hadoop，配置环境
安装hive，配置环境
当前在VMware上建好了3个linux环境：node1、node2、node3，它们的ip分别为：192.168.9.101、192.168.9.102、192.168.9.103，并且安装了hadoop，hive集群，虚拟机网络配置为NAT，如下图：

《利用闲置电脑安装虚拟机搭建hadoop集群》

一定要保证宿主机和虚拟机之间网络是互通的，一般不通要么是防火墙没关或者网络配置等问题。

二、连接虚拟机上的集群

1.整理需要连接的端口

远程端口：22
hdfs端口：9870
hive端口：10000
这几个端口是我在学习hadoop集群中要连接的。

2.配置VMware上虚拟机的端口转发

S2主机上安装了虚拟机环境（hadoop01、hadoop02、hadoop03），我们要用S1主机访问S2上的虚拟机环境，它们处于不同的子网，是不通的。当前S2和hadoop01-hadoop03是可以互相访问的，S1和S2连得同一个路由器是通的，要让S1能访问hadoop01-hadoop03，这时候查看资料发现VMware其实自带端口转发，把S2虚拟机上需要连接的端口都转发出来，这时候S1就可以通过访问这些转发端口从而访问虚拟机内部的端口了。整理如下：

虚拟机IP	虚拟机端口	主机IP	主机转发端口
192.168.9.101	22	192.168.8.101	10202
192.168.9.102	9870	192.168.8.101	19870
192.168.9.103	10000	192.168.8.101	10000

1.配置虚拟网络编辑器
《利用闲置电脑安装虚拟机搭建hadoop集群》
2.更改NAT设置

3.选择NAT网络，点击NAT设置

4.添加映射端口

5.点击确定，按照1-4步骤依次将22、9870、10000端口都映射起来。

3.测试连接

打开S2上的node1-node3虚拟机，用S1远程S2上的node1，这时候连接IP是S2的IP，端口是映射端口10022，可以连接：
《利用闲置电脑安装虚拟机搭建hadoop集群》

启动hadoop集群和hive集群，然后S1上就可以访问集群了，测试连接hdfs和hive都可以。

总结

本文使用VMware的端口转发功能，利用一台闲置电脑搭建虚拟机Hadoop集群，可以被相同子网中的其它主机连接，为后续学习大数据开发做准备。贫穷让我们相遇。
参考文章如下：
https://blog.csdn.net/qq_26230421/article/details/79232219

推荐阅读

java
HBase在金融大数据迁移中的应用与挑战

随着最后一台设备的下线，标志着超过10PB的HBase数据迁移项目顺利完成。目前，新的集群已在新机房稳定运行超过两个月，监控数据显示，新集群的查询响应时间显著降低，系统稳定性大幅提升。此外，数据消费的波动也变得更加平滑，整体性能得到了显著优化。 ... [详细]

蜡笔小新 2024-10-31 14:06:06
select
优化后的标题：利用Hive分析用户最长连续登录天数

本文介绍了如何使用Hive分析用户最长连续登录天数的方法。首先对数据进行排序，然后计算相邻日期之间的差值，接着按用户ID分组并累加连续登录天数，最后求出每个用户的最大连续登录天数。此外，还探讨了该方法在其他领域的应用，如股票市场中最大连续涨停天数的分析。 ... [详细]

蜡笔小新 2024-10-27 21:47:17
php
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
c语言
2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南

2012年9月12日，优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分，有一道题目涉及中国人的血型分布情况，具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中，至少有一人为B型血的概率不低于90%，则需要选取的最少人数是多少？该问题不仅考察了概率统计的基本知识，还要求考生具备一定的逻辑推理能力。 ... [详细]

蜡笔小新 2024-11-06 15:25:14
java
字节跳动深圳研发中心安全业务团队正在火热招募人才！

字节跳动深圳研发中心安全业务团队正在火热招募人才！ ... [详细]

蜡笔小新 2024-11-02 18:55:30
java
在Linux系统中配置环境变量以切换不同版本Python的方法与实践

在Linux系统中，原本已安装了多个版本的Python 2，并且还安装了Anaconda，其中包含了Python 3。本文详细介绍了如何通过配置环境变量，使系统默认使用指定版本的Python，以便在不同版本之间轻松切换。此外，文章还提供了具体的实践步骤和注意事项，帮助用户高效地管理和使用不同版本的Python环境。 ... [详细]

蜡笔小新 2024-10-30 09:39:09
java
解决 Ubuntu 环境下 Hadoop 集群 SSH 密钥认证问题

本文详细介绍了在 Ubuntu 系统上搭建 Hadoop 集群时遇到的 SSH 密钥认证问题及其解决方案。通过本文，读者可以了解如何在多台虚拟机之间实现无密码 SSH 登录，从而顺利启动 Hadoop 集群。 ... [详细]

蜡笔小新 2024-11-13 09:14:02
java
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
c语言
《程序员的数学》：一本适合初学者的数学指南

结城浩（1963年7月出生），日本资深程序员和技术作家，居住在东京武藏野市。他开发了著名的YukiWiki软件，并在杂志上发表了大量程序入门文章和技术翻译作品。结城浩著有30多本关于编程和数学的书籍，其中许多被翻译成英文和韩文。 ... [详细]

蜡笔小新 2024-11-12 21:47:50
php
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
php
大型网站技术架构：核心原理与案例分析的思维导图解析

本文通过思维导图的形式，深入解析了大型网站技术架构的核心原理与实际案例。首先，探讨了大型网站架构的演化过程，从单体应用到分布式系统的转变，以及各阶段的关键技术和挑战。接着，详细分析了常见的大型网站架构模式，包括负载均衡、缓存机制、数据库设计等，并结合具体案例进行说明。这些内容不仅有助于理解大型网站的技术实现，还能为实际项目提供宝贵的参考。 ... [详细]

蜡笔小新 2024-11-11 16:13:07
cmd
【源自百度知识】批处理技术详解与应用

本文详细介绍了批处理技术的基本概念及其在实际应用中的重要性。首先，对简单的批处理内部命令进行了概述，重点讲解了Echo命令的功能，包括如何打开或关闭回显功能以及显示消息。如果没有指定任何参数，Echo命令会显示当前的回显设置。此外，文章还探讨了批处理技术在自动化任务执行、系统管理等领域的广泛应用，为读者提供了丰富的实践案例和技术指导。 ... [详细]

蜡笔小新 2024-11-09 10:19:25
ascii
深入解析OSI七层架构与TCP/IP协议体系

本文详细探讨了OSI七层模型（Open System Interconnection，开放系统互连）及其与TCP/IP协议体系的关系。OSI模型将网络通信过程划分为七个层次，每个层次负责不同的功能，从物理层到应用层逐步实现数据传输和处理。通过对比分析，本文揭示了OSI模型与TCP/IP协议在结构和功能上的异同，为理解现代网络通信提供了全面的视角。 ... [详细]

蜡笔小新 2024-10-30 12:58:01
int
HDFS基础知识与数据读写机制详解

本文详细介绍了HDFS的基础知识及其数据读写机制。首先，文章阐述了HDFS的架构，包括其核心组件及其角色和功能。特别地，对NameNode进行了深入解析，指出其主要负责在内存中存储元数据、目录结构以及文件块的映射关系，并通过持久化方案确保数据的可靠性和高可用性。此外，还探讨了DataNode的角色及其在数据存储和读取过程中的关键作用。 ... [详细]

蜡笔小新 2024-10-30 11:58:25
select
分布式一致性算法：Paxos 的企业级实战

一、简介首先我们这个平台是ES专题技术的分享平台，众所周知，ES是一个典型的分布式系统。在工作和学习中，我们可能都已经接触和学习过多种不同的分布式系统了，各 ... [详细]

蜡笔小新 2024-10-21 16:29:21

可乐16311

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章