当前位置: 开发笔记 > 编程语言 > 正文

实验六熟悉常用的HDFS操作命令

作者：Eliza | 来源：互联网 | 2023-08-08 17:33

实验五https:mp.csdn.neteditorhtml116616391配置环境和实验五一样实验内容和要求Hadoop提供的sheel的命令学习指导http:hadoop.

实验五

https://mp.csdn.net/editor/html/116616391

配置环境和实验五一样

实验内容和要求

Hadoop提供的sheel的命令学习指导http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_shell.html

一&＃xff0c;利用Hadoop提供的Shell命令完成以下任务&＃xff1a;

任务1&＃xff1a;向HDFS中上传任意文本文件&＃xff0c;如果指定的文件在HDFS中已经存在&＃xff0c;由用户指定是追加到原有文件末尾还是覆盖原有的文件。

先到Hadoop主文件夹

cd /usr/local/hadoop

启动Hadoop服务

sbin/start-dfs.sh

sbin/start-yarn.sh

创建两个任意文本文件用于实验

echo "hello world" > local.txt

echo "hello hadoop" >text.txt

创建用户工作目录(HDFS默认工作目录格式为/user/当前用户)

hadoop fs -mkdir -p /user/当前用户名 &＃xff08;此时提示hadoop不是command时&＃xff0c;按照实验五添加hadoop环境变量&＃xff09;

检查文件是否存在

hadoop fs -test -e text.txt

echo $?

上传本地文件到HDFS系统

hadoop fs -put text.txt

追加到文件末尾的指令

hadoop fs -appendToFile local.txt text.txt

查看HDFS文件的内容

hadoop fs -cat text.txt

覆盖原有文件的指令(覆盖之后再执行一遍上一步)

hadoop fs -copyFromLocal -f local.txt text.txt

以上步骤也可以用如下Shell程序实现

if $(hadoop fs -test -e text.txt);

then $(hadoop fs -appendToFile local.txt text.txt);

else $(hadoop fs -copyFromLocal -f local.txt text.txt);

任务1的1-10命令&＃xff1a;

任务2&＃xff1a;从HDFS中下载指定文件&＃xff0c;如果本地文件与要下载的文件名称相同&＃xff0c;则自动对下载的文件重命名。

Shell命令实现:

if $(hadoop fs -test -e /usr/local/hadoop/text.txt);

then $(hadoop fs -copyToLocal text.txt ./text.txt);

else $(hadoop fs -copyToLocal text.txt ./text2.txt);

任务3&＃xff1a;将HDFS中指定文件的内容输出到终端中&＃xff1b;

Shell命令实现:

hadoop fs -cat text.txt

任务4&＃xff1a;显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息

hadoop fs -ls -h text.txt

任务5&＃xff1a;给定HDFS中某一个目录&＃xff0c;输出该目录下的所有文件的读写权限、大小、创建时间、路径等信息&＃xff0c;如果该文件是目录&＃xff0c;则递归输出该目录下所有文件相关信息&＃xff1b;

Shell命令实现:

hadoop fs -ls -R -h /user/hadoop

任务6&＃xff1a;提供一个HDFS内的文件的路径&＃xff0c;对该文件进行创建和删除操作。如果文件所在目录不存在&＃xff0c;则自动创建目录。

Shell命令实现:

if $(hadoop fs -test -d dir1/dir2);

then $(hadoop fs -touchz dir1/dir2/filename);

else $(hadoop fs -mkdir -p dir1/dir2 && hdfs dfs -touchz dir1/dir2/filename);

删除操作&＃xff1a;

hadoop fs -rm dir1/dir2/filename

任务七&＃xff1a;向HDFS中指定的文件追加内容&＃xff0c;由用户指定内容追加到原有文件的开头或结尾。

追加到文件末尾

hadoop fs -appendToFile local.txt text.txt

追加到文件开头

hadoop fs -get text.txt

cat text.txt >> local.txt

hadoop fs -copyFromLocal -f text.txt text.txt

任务8&＃xff1a;在HDFS中&＃xff0c;将文件从源路径移动到目的路径

Shell命令实现&＃xff1a;

hadoop fs -mv text.txt input

实验结果

请给出每一个shell命令执行后的结果。

如任务下截图

请说明实验中hadoop fs -test -e text.txt命中hadoop fs命令组合的作用。

调用文件系统(FS)Shell命令应使用 bin/hadoop fs 的形式。所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统&＃xff0c;scheme是hdfs&＃xff0c;对本地文件系统&＃xff0c;scheme是file。其中scheme和authority参数都是可选的&＃xff0c;如果未加指定&＃xff0c;就会使用配置中指定的默认scheme。

实验中hadoop fs -copyFromLocal -f text.txt text.txt中copyFromLocal参数的作用是什么。

使用方法&＃xff1a;hadoop fs -copyToLocal [-ignorecrc] [-crc] URI

复制文件到本地文件系统&＃xff0c;除了限定目标路径是一个本地文件外&＃xff0c;和get命令类似。

实验中hadoop fs -get text.txt中-get参数的含义是什么。

使用方法&＃xff1a;hadoop fs -get [-ignorecrc] [-crc] 复制文件到本地文件系统。可用-ignorecrc选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC信息。

推荐阅读

get
在List和Set集合中存储Object类型的数据元素

在List和Set集合中存储Object类型的数据元素 ... [详细]

蜡笔小新 2024-11-09 18:55:32
java
构建高可用性Spark分布式集群：大数据环境下的最佳实践

在构建高可用性的Spark分布式集群过程中，确保所有节点之间的无密码登录是至关重要的一步。通过在每个节点上生成SSH密钥对（使用 `ssh-keygen -t rsa` 命令并保持默认设置），可以实现这一目标。此外，还需将生成的公钥分发到所有节点的 `~/.ssh/authorized_keys` 文件中，以确保节点间的无缝通信。为了进一步提升集群的稳定性和性能，建议采用负载均衡和故障恢复机制，并定期进行系统监控和维护。 ... [详细]

蜡笔小新 2024-11-02 14:18:50
io
安装hadoop2.9.2jdk1.8centos7

安装JDK1.8查看JDK1.8的安装https:www.cnblogs.comTJ21p13208514.html安装hadoop上传hadoop下载hadoop地址http:m ... [详细]

蜡笔小新 2024-10-16 12:02:42
get
简述hdfs工作原理_HDFS原理概念扫盲

1、概述hdfs文件系统主要设计为了存储大文件的文件系统；如果有个TB级别的文件，我们该怎么存储呢？分布式文件系统未出现的时候࿰ ... [详细]

蜡笔小新 2024-10-12 13:16:56
get
用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS

HTTP协议是不加密传输数据的，也就是用户跟你的网站之间传递数据有可能在途中被截获，破解传递的真实内容，所以使用不加密的HTTP的网站是不 ... [详细]

蜡笔小新 2024-11-13 14:02:50
java
Presto：高效即席查询引擎的深度解析与应用

本文深入解析了Presto这一高效的即席查询引擎，详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式，显著提升了查询性能，相比传统的MapReduce查询，不仅减少了数据传输的延迟，还提高了查询的准确性和效率。然而，Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景，展示了其在大数据分析领域的强大潜力。 ... [详细]

蜡笔小新 2024-11-07 19:17:47
io
Zookeeper在Hadoop生态系统中的关键作用与应用分析

Zookeeper作为Apache Hadoop生态系统中的一个重要组件，主要致力于解决分布式应用中的常见数据管理难题。它提供了统一的命名服务、状态同步服务以及集群管理功能，有效提升了分布式系统的可靠性和可维护性。此外，Zookeeper还支持配置管理和临时节点管理，进一步增强了其在复杂分布式环境中的应用价值。 ... [详细]

蜡笔小新 2024-11-04 15:48:51
java
HBase在金融大数据迁移中的应用与挑战

随着最后一台设备的下线，标志着超过10PB的HBase数据迁移项目顺利完成。目前，新的集群已在新机房稳定运行超过两个月，监控数据显示，新集群的查询响应时间显著降低，系统稳定性大幅提升。此外，数据消费的波动也变得更加平滑，整体性能得到了显著优化。 ... [详细]

蜡笔小新 2024-10-31 14:06:06
io
HDFS基础知识与数据读写机制详解

本文详细介绍了HDFS的基础知识及其数据读写机制。首先，文章阐述了HDFS的架构，包括其核心组件及其角色和功能。特别地，对NameNode进行了深入解析，指出其主要负责在内存中存储元数据、目录结构以及文件块的映射关系，并通过持久化方案确保数据的可靠性和高可用性。此外，还探讨了DataNode的角色及其在数据存储和读取过程中的关键作用。 ... [详细]

蜡笔小新 2024-10-30 11:58:25
java
Hadoop + Spark安装(三) —— 调hadoop

***************************测试hadoop及问题跟进***************************执行以下语句报错datahadoop-2.9. ... [详细]

蜡笔小新 2024-10-17 11:56:27
java
05Hadoop的HA搭建

前期Linux环境准备1.修改Linux主机名2.修改IP3.修改主机名和IP的映射关系4.关闭防火墙5.ssh免登陆6.安装JDK，配置环境变量等集群规划主机 IP安装软件运行进 ... [详细]

蜡笔小新 2024-10-16 18:20:36
java
【原创】七、Hadoop 2.5.2+zookeeper高可用部署

一、原理（四大要点）（1）保证元数据一致（edits）namenode（fsimage edits）a、NFSb、journalnodec、zk（2）只有一台namenode对外提 ... [详细]

蜡笔小新 2024-10-15 12:25:58
java
hadoop3.1.2 first programdefault wordcount (Mac)

hadoop3.1.2安装完成后的第一个实操示例程 ... [详细]

蜡笔小新 2024-10-15 11:11:55
plugins
Hadoop——实验七：MapReduce编程实践

文章目录一.实验目的二.实验内容三.实验步骤及结果分析 1.基于ubuntukylin14.04(7)版本，安装hadoop-eclipse-kepler-plugi ... [详细]

蜡笔小新 2024-10-14 18:07:40
install
MDT2010实验部署手册（一）

MicrosoftDeploymentToolkit2010部署培训实验手册V1.0目录实验环境说明3实验环境虚拟机使用信息3注意：4实验手册正文说 ... [详细]

蜡笔小新 2024-11-12 20:02:27

Eliza

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章