大数据脚本相关

作者：lyglpp | 来源：互联网 | 2023-09-16 07:44

1.xsync集群分发脚本首先确保集群配置了SSH免密登录。(详见5)（a）在homeatguigu目录下创建bin目录(homeatguigubin)，并在bin目录下xsync

1.xsync集群分发脚本

首先确保集群配置了SSH免密登录。(详见5)

（a）在/home/atguigu目录下创建bin目录(/home/atguigu/bin)，并在bin目录下xsync创建文件，文件内容如下：

[atguigu@hadoop102 ~]$ mkdir bin
[atguigu@hadoop102 ~]$ cd bin/
[atguigu@hadoop102 bin]$ touch xsync
[atguigu@hadoop102 bin]$ vi xsync

在该文件中编写如下代码

#!/bin/bash
#1 获取输入参数个数，如果没有参数，直接退出
pcount=$#
if((pcount==0)); then
echo no args;
exit;
fi

#2 获取文件名称
p1=$1
fname=`basename $p1`
echo fname=$fname

#3 获取上级目录到绝对路径
pdir=`cd -P $(dirname $p1); pwd`
echo pdir=$pdir
#4 获取当前用户名称
user=`whoami`
#5 循环
for((host=103; host<105; host++)); do
echo ------------------- hadoop$host --------------
rsync -rvl $pdir/$fname $user@hadoop$host:$pdir
done

（b）修改脚本 xsync 具有执行权限

[atguigu@hadoop102 bin]$ chmod 777 xsync

（c）调用脚本形式：xsync 文件名称

[atguigu@hadoop102 bin]$ xsync /home/atguigu/bin

2设置启动集群(zookeeper hdfs yarn )

在/home/atguigu/bin创建start-cluster.sh，如果zookeeper不能启动，在zkEnv.sh加上

start-cluster.sh

#!/bin/bash
user=`whoami`
echo "=============== 开始启动所有节点服务 ==============="
echo "=============== 正在启动Zookeeper...... ==============="
for((host=102; host<=104; host++)); do
echo "--------------- hadoop$host Zookeeper...... ----------------"
ssh $user@hadoop$host '/opt/module/zookeeper-3.4.10/bin/zkServer.sh start'
done
echo "================ 正在启动HDFS ==============="
ssh $user@hadoop102 '/opt/module/hadoop-2.7.2/sbin/start-dfs.sh'
echo "================ 正在启动YARN ==============="
ssh $user@hadoop103 '/opt/module/hadoop-2.7.2/sbin/start-yarn.sh'
echo "================ hadoop102正在启动JobHistoryServer ==============="
ssh $user@hadoop102 '/opt/module/hadoop-2.7.2/sbin/mr-jobhistory-daemon.sh start historyserver'
done

（b）修改脚本具有执行权限

[atguigu@hadoop102 bin]$ chmod 777 start-cluster.sh

3.关闭集群(zookeeper hdfs yarn )

在/home/atguigu/bin创建stop-cluster.sh

内容为

#!/bin/bash
user=`whoami`
echo "================ 开始停止所有节点服务 ==============="
echo "================ hadoop102正在停止JobHistoryServer ==============="
ssh $user@hadoop102 '/opt/module/hadoop-2.7.2/sbin/mr-jobhistory-daemon.sh stop historyserver'
echo "================ 正在停止YARN ==============="
ssh $user@hadoop103 '/opt/module/hadoop-2.7.2/sbin/stop-yarn.sh'
echo "================ 正在停止HDFS ==============="
ssh $user@hadoop102 '/opt/module/hadoop-2.7.2/sbin/stop-dfs.sh'
echo "=============== 正在停止Zookeeper...... ==============="
for((host=102; host<=104; host++)); do
echo "--------------- hadoop$host Zookeeper...... ----------------"
ssh $user@hadoop$host '/opt/module/zookeeper-3.4.10/bin/zkServer.sh stop'
done

修改脚本具有执行权限

[atguigu@hadoop102 bin]$ chmod 777 stop-cluster.sh

最后使用xsync 分发到其它集群上（切记要改变权限）

4.查看集群进程

在/home/atguigu/bin创建util.sh

内容为

#!/bin/bash
for ip in hadoop102 hadoop103 hadoop104
do
echo "------------------------------[ jps $ip ]-------------------------"
ssh atguigu@$ip "source /etc/profile;jps"
done

5.SSH免登录

无密钥配置

（1）免密登录原理，如图所示

（2）生成公钥和私钥：

[atguigu@hadoop102 .ssh]$ ssh-keygen -t rsa

然后敲（三个回车），就会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）

（3）将公钥拷贝到要免密登录的目标机器上

[atguigu@hadoop102 .ssh]$ ssh-copy-id hadoop102

[atguigu@hadoop102 .ssh]$ ssh-copy-id hadoop103

[atguigu@hadoop102 .ssh]$ ssh-copy-id hadoop104

6.配置群起Zookeeper

在/home/用户名/bin下，创建zkstart.sh

#!/bin/bash
user=`whoami`
echo "=============== 正在启动Zookeeper...... ==============="
for((host=102; host<=104; host++)); do
echo "--------------- hadoop$host Zookeeper...... ----------------"
ssh $user@hadoop$host '/opt/module/zookeeper-3.4.10/bin/zkServer.sh start'
done

创建zkStop.sh

#!/bin/bash
user=`whoami`
echo "=============== 正在停止Zookeeper...... ==============="
for((host=102; host<=104; host++)); do
echo "--------------- hadoop$host Zookeeper...... ----------------"
ssh $user@hadoop$host '/opt/module/zookeeper-3.4.10/bin/zkServer.sh stop'
done

修改权限 chmod 777

7.配置kafka后台启动

在kafka目录下创建startkafka.sh

nohup bin/kafka-server-start.sh config/server.properties > kafka.log 2>&1 &

修改权限 chmod 777

./startkafka.sh 即可执行

只需要把startkafka.sh分发到各个机器，再独自启动即可

【注：

a. >kafka.log 将运行的日志写到kafka中， 2>&1 的意思就是将标准错误重定向到标准输出。

　 b.　&：后台运行。当你只使用“&”时，关闭终端，进程会关闭。所以当你要让程序在后台不挂断运行时，需要将nohup和&一起使用。

c. 启动命令首位加上nohup，即使停掉crt，kafka、flume依然可以在后台执行，这样就不用每次登陆，重新运行启动命令了。如果需要停掉服务，只需运行 kill -9 [程序运行的号即可]

】

推荐阅读

default
HDFS2.x新特性

一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]

蜡笔小新 2023-12-13 13:52:40
bash
Linux Shell中的括号和整数扩展使用方法

本文介绍了Linux Shell中括号和整数扩展的使用方法，包括命令组、命令替换、初始化数组以及算术表达式和逻辑判断的相关内容。括号中的命令将会在新开的子shell中顺序执行，括号中的变量不能被脚本余下的部分使用。命令替换可以用于将命令的标准输出作为另一个命令的输入。括号中的运算符和表达式符合C语言运算规则，可以用在整数扩展中进行算术计算和逻辑判断。 ... [详细]

蜡笔小新 2023-12-12 20:48:58
default
windows部署hadoop2.7.0

这里使用自己编译的hadoop-2.7.0版本部署在windows上，记得几年前，部署hadoop需要借助于cygwin，还需要开启ssh服务，最近发现，原来不需要借助cy ... [详细]

蜡笔小新 2023-10-17 21:04:04
default
Hadoop2.6.0 + 云centos +伪分布式只谈部署

3.0.3玩不好，现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0，rm掉3.0.32.在etcp ... [详细]

蜡笔小新 2023-10-17 19:28:24
bash
GitLab SSH密钥在项目目录中不起作用

我创建了一个SSH密钥，当我以admin身份在GitBash中运行ssh-Tgit@gitlab.com时，我得到W ... [详细]

蜡笔小新 2023-10-17 12:58:58
get
eclipse学习（第三章：ssh中的Hibernate）——11.Hibernate的缓存（2级缓存，get和load）

本文介绍了eclipse学习中的第三章内容，主要讲解了ssh中的Hibernate的缓存，包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ... [详细]

蜡笔小新 2023-12-14 00:31:35
get
Cocos2dx学习笔记（14）更新函数scheduleUpdate、进度计时器CCProgressTo、滚动视图CCScrollView

本文介绍了Cocos2dx学习笔记中的更新函数scheduleUpdate、进度计时器CCProgressTo和滚动视图CCScrollView的用法。详细介绍了scheduleUpdate函数的作用和使用方法，以及schedule函数的区别。同时，还提供了相关的代码示例。 ... [详细]

蜡笔小新 2023-12-10 12:48:16
get
Hadoop 源码学习笔记(4)Hdfs 数据读写流程分析

Hdfs的数据模型在对读写流程进行分析之前，我们需要先对Hdfs的数据模型有一个简单的认知。数据模型如上图所示，在NameNode中有一个唯一的FSDirectory类负责维护文件 ... [详细]

蜡笔小新 2023-10-17 11:27:29
default
hadoop学习；block数据块；mapreduce实现样例；UnsupportedClassVersionError异常；关联项目源代码...

对于开源的东东，尤其是刚出来不久，我认为最好的学习方式就是能够看源代码和doc，測试它的样例为了方便查看源代码，关联导入源代 ... [详细]

蜡笔小新 2023-10-17 09:49:38
go
【转】腾讯分析系统架构解析

TA（TencentAnalytics，腾讯分析）是一款面向第三方站长的免费网站分析系统，在数据稳定性、及时性方面广受站长好评，其秒级的实时数据更新频率也获得业界的认可。本文将从实 ... [详细]

蜡笔小新 2023-10-16 19:05:20
go
CentOS 7配置SSH远程访问及控制

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2023-10-16 18:40:50
go
MR程序的几种提交运行模式

MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法，就会将job提交给本地执行器localjobrunner执行-- ... [详细]

蜡笔小新 2023-10-16 18:29:26
process
《Spark核心技术与高级应用》——1.2节Spark的重要扩展

本节书摘来自华章社区《Spark核心技术与高级应用》一书中的第1章，第1.2节Spark的重要扩展，作者于俊向海代其锋马海平，更多章节内容可以访问云栖社区“华章社区”公众号查看1. ... [详细]

蜡笔小新 2023-10-16 18:07:56
process
HIVE的内部表和外部表

Hive的数据表创建数据文件inner_table.dat创建表hive>createtableinner_table(keystri ... [详细]

蜡笔小新 2023-10-16 16:22:45
default
Hadoop学习笔记1：伪分布式环境搭建

在搭建Hadoop环境之前，请先阅读如下博文，把搭建Hadoop环境之前的准备工作做好，博文如下： 1、CentOS6.7下安装JDK,地址：http:b ... [详细]

蜡笔小新 2023-10-16 16:04:04

lyglpp

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章