WritedataHDFSviaNFSgatewayfailedwith"Input/outputerror"

作者：地平线1232502881827 | 来源：互联网 | 2023-09-08 11:25

近期真的是忙得不可开交，在构建100个节点集群的时，由于一些特殊的业务需求需要使用NFS

今天我们聊NFSGateway，近期真的是忙得不可开交，在构建100个节点集群的时，由于一些特殊的业务需求需要使用NFS-Gateway或者HDFS-fuse功能，把HDFS分布式文件系统挂在到某些机器上，可以通过访问Linux本地文件系统操纵HDFS中的数据，这就是类似传统的NFS
文件系统的功能。通过把HDFS整个分布式文件系统，挂载到某些Linux机器，通过往挂载的目录中传递数据，即可直接上传到HDFS，让HDFS的使用方式非常的方便。

目前开源世界有很多分布式文件系统的优秀软件，比如：Ceph，Glusterfs,Alluxio等都提供了类似nfs，fuse挂载分布式文件系统到Linux主机的能力，也都大量复用了Linux本身已经有的软件，所以都是兼容NFS,FUSE的接口的。HDFS也不例外，也都通过类似的技术来支持这样的功能。

在HDFS中目前提供了两种方式：

HDFS-NFSGateway 在HDP版本中原生支持此方式
HDFS-Fuse

集群环境

HDP 2.6.1.0-129

$ hdp-select versions 2.6.1.0-129

Linux

$ cat /etc/redhat-release CentOS Linux release 7.2.1511 (Core)

NFSGateway安装

通过ambari
界面自动化去安装NFSGateway
的方法，在Ambari管理的最新的Hadoop2.x以上的版本都是支持这种方式的，并且在界面上可以自动化安装NFSGateway
。

首先，登录ambari-server的可视化界面，点击“Hosts”，任意选择一个主机单机。

其次，点击+Add
按钮，选择NFSGateway
，点击Confirm Add
进行安装NFSGateway。

最后，点击Start
按钮，启动NFSGateway。

手动教程参考：http://itweet.cn/blog/2014/02/04/HDFS_NFS_Gateway

NFSGateway挂载

首次挂载遇到如下问题，环境是Centos 7.2
我亲自安装的，采用的是最小化的安装Linux系统模式，而集群的版本HDP 2.6.1.0-129
。

# mount -t nfs -o vers=3,proto=tcp,nolock localhost:/ /hdfs mount: wrong fs type, bad option, bad superblock on localhost:/, missing codepage or helper program, or other error (for several filesystems (e.g. nfs, cifs) you might need a /sbin/mount. helper program) In some cases useful info is found in syslog - try dmesg | tail or so.

根据提示，并且进一步排除/sbin/mount.
目录发现，根本没有mount.
的文件，进而断定为缺少nfs-utils
软件包，安装即解决问题。

# yum install nfs-utils

NFSGateway挂载，HDFS分布式文件系统挂载到本地系统挂载点为/hdfs
，如下：

# mkdir /hdfs # mount -t nfs -o vers=3,proto=tcp,nolock localhost:/ /hdfs # df -h|grep hdfs localhost:/ 4.8T 3.2G 4.8T 1% /hdfs

NFSGateway测试

NFSGateway挂载成功之后，我们对他进行一些基本的读写测试，看是否满足我们的要求，让HDFS分布式文件系统的访问，就像访问Linux本地目录一样简单。

例如：

[root@bigdata-server-1 ~]# su - hdfs [hdfs@bigdata-server-1 ~]$ echo aaa > test.txt

测试cp文件到挂载点(/hdfs
)的属于分布式文件系统的/hdfs/tmp
，出现错误，表现的现象为无法正常cp数据到此目录，并且在hdfs
看到生成此相关文件大小为0

$ cp test.txt /hdfs/tmp/ cp: cannot create regular file ‘/hdfs/tmp/test.txt’: Input/output error

既然是NFS的问题，首先排查NFS
服务相关日志，定位问题，发现如下警告信息。

# tail -300 /var/log/hadoop/root/hadoop-hdfs-nfs3-bigdata-server-1.log

cannot create regular file ‘/hdfs/tmp/test.txt’: Input/output error
关键错误信息如下：

2017-07-20 22:01:52,737 WARN oncrpc.RpcProgram (RpcProgram.java:messageReceived(172)) - Invalid RPC call program 100227 2017-07-20 22:04:08,184 WARN nfs3.RpcProgramNfs3 (RpcProgramNfs3.java:setattr(471)) - Exception org.apache.hadoop.ipc.RemoteException(java.io.IOException):Access time for hdfs is not configured. Please set dfs.namenode.accesstime.precision configuration parameter. at org.apache.hadoop.hdfs.server.namenode.FSDirAttrOp.setTimes(FSDirAttrOp.java:105) at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.setTimes(FSNamesystem.java:2081) at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.setTimes(NameNodeRpcServer.java:1361) at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolServerSideTranslatorPB.setTimes(ClientNamenodeProtocolServerSideTranslatorPB.java:926) at org.apache.hadoop.hdfs.protocol.proto.ClientNamenodeProtocolProtos$ClientNamenodeProtocol$2.callBlockingMethod(ClientNamenodeProtocolProtos.java) at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:640) at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:982) at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2351) at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2347) at java.security.AccessController.doPrivileged(Native Method) at javax.security.auth.Subject.doAs(Subject.java:415) at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1866) at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2345) at org.apache.hadoop.ipc.Client.getRpcResponse(Client.java:1554) at org.apache.hadoop.ipc.Client.call(Client.java:1498) at org.apache.hadoop.ipc.Client.call(Client.java:1398) at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:233) at com.sun.proxy.$Proxy14.setTimes(Unknown Source) at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolTranslatorPB.setTimes(ClientNamenodeProtocolTranslatorPB.java:901) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:606) at org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler.java:291) at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:203) at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:185) at com.sun.proxy.$Proxy15.setTimes(Unknown Source) at org.apache.hadoop.hdfs.DFSClient.setTimes(DFSClient.java:3211) at org.apache.hadoop.hdfs.nfs.nfs3.RpcProgramNfs3.setattrInternal(RpcProgramNfs3.java:401) at org.apache.hadoop.hdfs.nfs.nfs3.RpcProgramNfs3.setattr(RpcProgramNfs3.java:465) at org.apache.hadoop.hdfs.nfs.nfs3.RpcProgramNfs3.setattr(RpcProgramNfs3.java:407) at org.apache.hadoop.hdfs.nfs.nfs3.RpcProgramNfs3.handleInternal(RpcProgramNfs3.java:2193) at org.apache.hadoop.oncrpc.RpcProgram.messageReceived(RpcProgram.java:184) at org.jboss.netty.channel.SimpleChannelUpstreamHandler.handleUpstream(SimpleChannelUpstreamHandler.java:70) at org.jboss.netty.channel.DefaultChannelPipeline.sendUpstream(DefaultChannelPipeline.java:560) at org.jboss.netty.channel.DefaultChannelPipeline$DefaultChannelHandlerContext.sendUpstream(DefaultChannelPipeline.java:787) at org.jboss.netty.channel.Channels.fireMessageReceived(Channels.java:281) at org.apache.hadoop.oncrpc.RpcUtil$RpcMessageParserStage.messageReceived(RpcUtil.java:132) at org.jboss.netty.channel.SimpleChannelUpstreamHandler.handleUpstream(SimpleChannelUpstreamHandler.java:70) at org.jboss.netty.channel.DefaultChannelPipeline.sendUpstream(DefaultChannelPipeline.java:560) at org.jboss.netty.channel.DefaultChannelPipeline$DefaultChannelHandlerContext.sendUpstream(DefaultChannelPipeline.java:787) at org.jboss.netty.channel.Channels.fireMessageReceived(Channels.java:296) at org.jboss.netty.handler.codec.frame.FrameDecoder.unfoldAndFireMessageReceived(FrameDecoder.java:462) at org.jboss.netty.handler.codec.frame.FrameDecoder.callDecode(FrameDecoder.java:443) at org.jboss.netty.handler.codec.frame.FrameDecoder.messageReceived(FrameDecoder.java:303) at org.jboss.netty.channel.SimpleChannelUpstreamHandler.handleUpstream(SimpleChannelUpstreamHandler.java:70) at org.jboss.netty.channel.DefaultChannelPipeline.sendUpstream(DefaultChannelPipeline.java:560) at org.jboss.netty.channel.DefaultChannelPipeline.sendUpstream(DefaultChannelPipeline.java:555) at org.jboss.netty.channel.Channels.fireMessageReceived(Channels.java:268) at org.jboss.netty.channel.Channels.fireMessageReceived(Channels.java:255) at org.jboss.netty.channel.socket.nio.NioWorker.read(NioWorker.java:88) at org.jboss.netty.channel.socket.nio.AbstractNioWorker.process(AbstractNioWorker.java:107) at org.jboss.netty.channel.socket.nio.AbstractNioSelector.run(AbstractNioSelector.java:312) at org.jboss.netty.channel.socket.nio.AbstractNioWorker.run(AbstractNioWorker.java:88) at org.jboss.netty.channel.socket.nio.NioWorker.run(NioWorker.java:178) at org.jboss.netty.util.ThreadRenamingRunnable.run(ThreadRenamingRunnable.java:108) at org.jboss.netty.util.internal.DeadLockProofWorker$1.run(DeadLockProofWorker.java:42) at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145) at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615) at java.lang.Thread.run(Thread.java:745)

根据日志定位问题，发现日志中有相关提示dfs.namenode.accesstime.precision
需要进行配置，在去查看相关配置的含义。

The access time for HDFS file is precise upto this value. The default value is 1 hour. Setting a value of 0 disables access times for HDFS.

理解之后，通过调整，在Ambari-Web
中查看发现默认值 dfs.namenode.accesstime.precision = 0
改为 dfs.namenode.accesstime.precision = 3600000
，根据提示重启集群相关受影响的足迹，即解决问题。

再次进行测试，发现此报错消失。

$ echo aaa > text.2 $ cp text.2 /hdfs/tmp/ $ cat /hdfs/tmp/text.2 aaa

到此，通过touch、echo、cp、cat、mv
等命令测试，依然正常使用，基本的nfs功能测试完成。

小结

NFSGateway的功能相对来说是非常不错的，降低使用HDFS成本的特性，如上我总结的在配置NFSGateway遇到的一些小问题，因为对于几百个节点的HDFS集群来说，有NFS这样的特性，可以让很多Gateway服务器通过FTP-Server接收海量数据，只要进入FTP就进入HDFS集群，这样HDFS入库就变得特别简单，可以节省时间。后续集内容会提供数据对比深度剖析HDFS提供的类似NFSGateway功能的软件性能情况和原理。

事物都是两面性的，带来便利的同时也会带来一定的代价，使用此软件会导致数据传输性能降低很多。在使用dd
命令测试结果如下：

我通过dd
命令生成一个10G的大文件，让后通过hdfs fs put
这样的命令，对比三者的上传性能。

HDFS-NFSGateway 86 MB/秒
HDFS-Fuse 132 MB/秒
HDFS-PUT 310 MB/秒

如上，Hadoop原生提供的put
命令上传效率最高，其次是Fuse，最差的是NFSGateway，这是在5台服务器万兆网络(9.84 Gbits/sec)测试的结果，仅作为参考。

综上所述，我仅仅提供了一些基础的测试数据和结论，使用非原生提供的API进行数据接入，虽然方便了很多，但是性能有很大损耗，这个就是权衡的结果，看是否在你的业务忍耐限度以内，选择哪种方案，得通过数据和相关业务经验结合选择最合适的。

写到这里，内容相对浅显，后续我会对多方测试结果进行整理汇总，发布一版更加有力的测试数据对比情况。最近我也在做一些MPP数据库的测试优化，后续会有更多精彩的生产环境经验积累，原创文章发布，敬请关注。

欢迎关注微信公众号，第一时间，阅读更多有关云计算、大数据文章。

原创文章，转载请注明：转载自Itweet的博客
本博客的文章集合: http://www.itweet.cn/blog/archive/

参考：

[1]. http://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-hdfs/HdfsNfsGateway.html
[2]. https://discuss.pivotal.io/hc/en-us/articles/204185008-Write-data-to-HDFS-via-NFS-gateway-failed-with-Input-output-error-
[3]. https://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

推荐阅读

ip
Hadoop集群搭建常见问题与解决方案（一）：避免配置过程中的常见陷阱

在搭建Hadoop集群以处理大规模数据存储和频繁读取需求的过程中，经常会遇到各种配置难题。本文总结了作者在实际部署中遇到的典型问题，并提供了详细的解决方案，帮助读者避免常见的配置陷阱。通过这些经验分享，希望读者能够更加顺利地完成Hadoop集群的搭建和配置。 ... [详细]

蜡笔小新 2024-11-03 19:59:23
join
Linux环境下MySQL的安装与部署指南

本文详细介绍了在Linux操作系统上安装和部署MySQL数据库的过程，包括必要的环境准备、安装步骤、配置优化及安全设置等内容。 ... [详细]

蜡笔小新 2024-11-20 18:10:53
c语言
JUnit下的测试和suite

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2024-11-21 16:03:49
ip
OBS Studio自动化实践：利用脚本批量生成录制场景

本文探讨了如何利用OBS Studio进行高效录屏，并通过脚本实现场景的自动生成。适合对自动化办公感兴趣的读者。 ... [详细]

蜡笔小新 2024-11-21 10:44:53
command
解决Mongoid HABTM关系中逆向关联为nil导致的子对象不持久化问题

本文探讨了在一个使用Mongoid框架的项目中，如何处理当HABTM（has_and_belongs_to_many）关系中的逆向关联设置为nil时，子对象无法正确持久化的问题。 ... [详细]

蜡笔小新 2024-11-21 00:15:06
ip
设置Shadowsocks公共代理的关键步骤

本文详细介绍了如何正确设置Shadowsocks公共代理，包括调整超时设置、检查系统限制、防止滥用及遵守DMCA法规等关键步骤。 ... [详细]

蜡笔小新 2024-11-20 20:41:33
ip
Logging all MySQL queries into the Slow Log

MySQLoptionallylogsslowqueriesintotheSlowQueryLog–orjustSlowLog,asfriendscallit.However,Thereareseveralreasonstologallqueries.Thislistisnotexhaustive:Belowyoucanfindthevariablestochange,astheyshouldbewritteninth ... [详细]

蜡笔小新 2024-11-20 12:50:01
controller
解决Tomcat启动时出现org.apache.catalina.LifecycleException异常的方法

在尝试启动Java应用服务器Tomcat时，遇到了org.apache.catalina.LifecycleException异常。本文详细记录了异常的具体表现形式，并提供了有效的解决方案。 ... [详细]

蜡笔小新 2024-11-19 11:46:52
ip
在 Ubuntu 22.04 LTS 上部署 Jira 敏捷项目管理工具

Jira 敏捷项目管理工具专为软件开发团队设计，旨在以高效、有序的方式管理项目、问题和任务。该工具提供了灵活且可定制的工作流程，能够根据项目需求进行调整。本文将详细介绍如何在 Ubuntu 22.04 LTS 上安装和配置 Jira。 ... [详细]

蜡笔小新 2024-11-19 09:56:22
ip
2019-2021年阿里Java面试真题汇总

本文总结了近年来在实际项目中使用消息中间件的经验和常见问题，旨在为Java初学者和中级开发者提供实用的参考。文章详细介绍了消息中间件在分布式系统中的作用，以及如何通过消息中间件实现高可用性和可扩展性。 ... [详细]

蜡笔小新 2024-11-18 10:03:28
timestamp
日志处理流程：Flume+MapReduce+Hive+Sqoop+MySQL

本文介绍了如何使用Flume从Linux文件系统收集日志并存储到HDFS，然后通过MapReduce清洗数据，使用Hive进行数据分析，并最终通过Sqoop将结果导出到MySQL数据库。 ... [详细]

蜡笔小新 2024-11-13 18:47:34
function
Hadoop 2.6 日志文件解析与MapReduce日志管理深入探讨

Hadoop 2.6 主要由 HDFS 和 YARN 两大部分组成，其中 YARN 包含了运行在 ResourceManager 的 JVM 中的组件以及在 NodeManager 中运行的部分。本文深入探讨了 Hadoop 2.6 日志文件的解析方法，并详细介绍了 MapReduce 日志管理的最佳实践，旨在帮助用户更好地理解和优化日志处理流程，提高系统运维效率。 ... [详细]

蜡笔小新 2024-11-03 16:23:38
split
构建高可用性Spark分布式集群：大数据环境下的最佳实践

在构建高可用性的Spark分布式集群过程中，确保所有节点之间的无密码登录是至关重要的一步。通过在每个节点上生成SSH密钥对（使用 `ssh-keygen -t rsa` 命令并保持默认设置），可以实现这一目标。此外，还需将生成的公钥分发到所有节点的 `~/.ssh/authorized_keys` 文件中，以确保节点间的无缝通信。为了进一步提升集群的稳定性和性能，建议采用负载均衡和故障恢复机制，并定期进行系统监控和维护。 ... [详细]

蜡笔小新 2024-11-02 14:18:50
ip
HBase在金融大数据迁移中的应用与挑战

随着最后一台设备的下线，标志着超过10PB的HBase数据迁移项目顺利完成。目前，新的集群已在新机房稳定运行超过两个月，监控数据显示，新集群的查询响应时间显著降低，系统稳定性大幅提升。此外，数据消费的波动也变得更加平滑，整体性能得到了显著优化。 ... [详细]

蜡笔小新 2024-10-31 14:06:06
join
如何将955万数据表的17秒SQL查询优化至300毫秒

本文详细介绍了通过优化SQL查询策略，成功将一张包含955万条记录的财务流水表的查询时间从17秒缩短至300毫秒的方法。文章不仅提供了具体的SQL优化技巧，还深入探讨了背后的数据库原理。 ... [详细]

蜡笔小新 2024-11-21 12:11:54

地平线1232502881827

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章