热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

hbase37个笔试题

以下试题是摘自互联网的基础上自己加了选项说明解释便于自己以后看时方便节省时间1.HBase来源于哪篇博文?CATheGoogleFileSystemBMapReduc
以下试题是摘自互联网的基础上自己加了选项说明解释便于自己以后看时方便节省时间

1. HBase来源于哪篇博文? C
A The Google File System
B MapReduce
C BigTable
D Chubby

2. 下面对HBase的描述哪些是正确的? B、C、D
不是开源的
是面向列的
是分布式的
是一种NoSQL数据库

3. HBase依靠()存储底层数据 A
A HDFS
B Hadoop
C Memory
D MapReduce

4. HBase依赖()提供消息通信机制 A
A Zookeeper
B Chubby
C RPC
D Socket

5. HBase依赖()提供强大的计算能力 D
A Zookeeper
B Chubby
C RPC
D MapReduce


6. MapReduce与HBase的关系,哪些描述是正确的? B、C
两者不可或缺,MapReduceHBase可以正常运行的保证
两者不是强关联关系,没有MapReduce,HBase可以正常运行
C MapReduce可以直接访问HBase
它们之间没有任何关系

7. 下面哪些选项正确描述了HBase的特性? A、B、C、D
高可靠性
高性能
面向列
D可伸缩

8. 下面与Zookeeper类似的框架是?D
A Protobuf
B Java
C Kafka
(Kafka是一个高吞吐量分布式消息系统。linkedin开源的kafka。 Kafka就跟这个名字一样,设计非常独特。首先,kafka的开发者们认为不需要在内存里缓存什么数据,操作系统的文件缓存已经足够完善和强大,只要你不搞随机写,顺序读写的性能是非常高效的。kafka的数据只会顺序append,数据的删除策略是累积到一定程度或者超过一定时间再删除。Kafka另一个独特的地方是将消费者信息保存在客户端而不是MQ服务器,这样服务器就不用记录消息的投递过程,每个客户端都自己知道自己下一次应该从什么地方什么位置读取消息,消息的投递过程也是采用客户端主动pull的模型,这样大大减轻了服务器的负担。Kafka还强调减少数据的序列化和拷贝开销,它会将一些消息组织成Message Set做批量存储和发送,并且客户端在pull数据的时候,尽量以zero-copy的方式传输,利用sendfile(对应java里的 FileChannel.transferTo/transferFrom)这样的高级IO函数来减少拷贝开销。可见,kafka是一个精心设计,特定于某些应用的MQ系统,这种偏向特定领域的MQ系统我估计会越来越多,垂直化的产品策略值的考虑)
D Chubby
(MapReduce 很多人已经知道了,但关于Chubyy似乎熟悉它的就非常有限,这倒是不奇怪,因为MapReduce是一个针对开发人员的 ProgrammingModel,自然会有很多人去学习它,而Chubby更多的是一种为了实现MapReduce或者Bigtable而构建的内部的 工具,对于开发人员来说基本上是透明的。
Chubby首先是一个分布式的文件系统。Chubby能够提供机制使得client可以在Chubby service上创建文件和执行一些文件的基本操作。说它是分布式的文件系统,是因为一个Chubby cell是一个分布式的系统,一般包含了5台机器,整个文件系统是部署在这5台机器上的。
但是,从更高一点的语义层面上,Chubby是一个 lock service,一个针对松耦合的分布式系统的lock service。所谓lock service,就是这个service能够提供开发人员经常用的“锁”,“解锁”功能。通过Chubby,一个分布式系统中的上千个client都能够 对于某项资源进行“加锁”,“解锁”。
那么,Chubby是怎样实现这样的“锁”功能的?就是通过文件。Chubby中的“锁”就是文件,在上例 中,创建文件其实就是进行“加锁”操作,创建文件成功的那个server其实就是抢占到了“锁”。用户通过打开、关闭和读取文件,获取共享锁或者独占锁; 并且通过通信机制,向用户发送更新信息。

综上所述,Chubby是一个lock service,通过这个lock service可以解决分布式中的一致性问题,而这个lock service的实现是一个分布式的文件系统。)

9. 下面与HDFS类似的框架是?C
A NTFS
B FAT32
C GFS(也是分布式文件系统,谷歌自己的分布式文件系统)
D EXT3

10. 下面哪些概念是HBase框架中使用的?A、C
A HDFS
B GridFS
C Zookeeper
D EXT3


第二部分:HBase核心知识点(对于Hbase实现核心LSM,会在下篇文章介绍)
11. LSM含义是?A
日志结构合并树(Log-Structured Merge Tree)
二叉树
平衡二叉树
长平衡二叉树

12. 下面对LSM结构描述正确的是? AC
顺序存储
直接写硬盘
需要将数据Flush到磁盘
是一种搜索平衡树

13. LSM更能保证哪种操作的性能?B
随机读
合并

14. LSM的读操作和写操作是独立的?A
是。
否。
C LSM并不区分读和写
D LSM中读写是同一种操作

15. LSM结构的数据首先存储在()。 B
硬盘上
内存中
磁盘阵列中
闪存中

16 HFile数据格式中的Data字段用于()。A
存储实际的KeyValue数据
存储数据的起点
指定字段的长度
存储数据块的起点

17 HFile数据格式中的MetaIndex字段用于()。D
A Meta块的长度
B Meta块的结束点
C Meta块数据内容
D Meta块的起始点

18 HFile数据格式中的Magic字段用于()。A
存储随机数,防止数据损坏
存储数据的起点
存储数据块的起点
指定字段的长度

19 HFile数据格式中的KeyValue数据格式,下列选项描述正确的是()。AD
byte[]数组
没有固定的结构
数据的大小是定长的
有固定的结构

20 HFile数据格式中的KeyValue数据格式中Value部分是()。C
拥有复杂结构的字符串
字符串
二进制数据
压缩数据
第三部分:HBase高级应用介绍
31 HBase中的批量加载底层使用()实现。A
A MapReduce
B Hive
C Coprocessor
D Bloom Filter

32. HBase性能优化包含下面的哪些选项?A、B、C、D
读优化
写优化
配置优化
D JVM优化

33. Rowkey设计的原则,下列哪些选项的描述是正确的?A、B、C
尽量保证越短越好
可以使用汉字
可以使用字符串
本身是无序的

34. HBase构建二级索引的实现方式有哪些? A、B
A MapReduce
B Coprocessor
(HBase在0.92之后引入了协处理器(coprocessors),实现一些激动人心的新特性:能够轻易建立二次索引、复杂过滤器(谓词下推)以及访问控制等)
C Bloom Filter
D Filter

35. 关于HBase二级索引的描述,哪些是正确的?A、B
核心是倒排表
二级索引概念是对应Rowkey这个“一级”索引
二级索引使用平衡二叉树
二级索引使用LSM结构

36. 下列关于Bloom Filter的描述正确的是?A、C
是一个很长的二进制向量和一系列随机映射函数
没有误算率
有一定的误算率
可以在Bloom Filter中删除元素
第四部分:HBase安装、部署、启动
37. HBase官方版本可以安装在什么操作系统上?A、B、C
A CentOS
B Ubuntu
C RedHat
D Windows

38. HBase虚拟分布式模式需要()个节点?A
A 1
B 2
C 3
最少3

39. HBase分布式模式最好需要()个节点?C
A 1
B 2
C 3
最少

40. 下列哪些选项是安装HBase前所必须安装的?A、B
操作系统
B JDK
C Shell Script
D Java Code

41. 解压.tar.gz结尾的HBase压缩包使用的Linux命令是?A
A tar -zxvf
B tar -zx
C tar -s
D tar -nf








推荐阅读
  • 分布式一致性算法:Paxos 的企业级实战
    一、简介首先我们这个平台是ES专题技术的分享平台,众所周知,ES是一个典型的分布式系统。在工作和学习中,我们可能都已经接触和学习过多种不同的分布式系统了,各 ... [详细]
  • 第二章:Kafka基础入门与核心概念解析
    本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统,以其卓越的性能和高吞吐量而著称。最初,Kafka被设计用于LinkedIn的活动流和运营数据处理,旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景,读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]
  • Hadoop 2.6 主要由 HDFS 和 YARN 两大部分组成,其中 YARN 包含了运行在 ResourceManager 的 JVM 中的组件以及在 NodeManager 中运行的部分。本文深入探讨了 Hadoop 2.6 日志文件的解析方法,并详细介绍了 MapReduce 日志管理的最佳实践,旨在帮助用户更好地理解和优化日志处理流程,提高系统运维效率。 ... [详细]
  • HBase在金融大数据迁移中的应用与挑战
    随着最后一台设备的下线,标志着超过10PB的HBase数据迁移项目顺利完成。目前,新的集群已在新机房稳定运行超过两个月,监控数据显示,新集群的查询响应时间显著降低,系统稳定性大幅提升。此外,数据消费的波动也变得更加平滑,整体性能得到了显著优化。 ... [详细]
  • 技术日志:深入探讨Spark Streaming与Spark SQL的融合应用
    技术日志:深入探讨Spark Streaming与Spark SQL的融合应用 ... [详细]
  • 在Linux系统中,原本已安装了多个版本的Python 2,并且还安装了Anaconda,其中包含了Python 3。本文详细介绍了如何通过配置环境变量,使系统默认使用指定版本的Python,以便在不同版本之间轻松切换。此外,文章还提供了具体的实践步骤和注意事项,帮助用户高效地管理和使用不同版本的Python环境。 ... [详细]
  • Hudi是一种数据湖的存储格式,在Hadoop文件系统之上提供了更新数据和删除数据的能力以及流式消费变化数据的能力。应用场景近实时数据摄取Hudi支持插入、更新和删除数据的能力。您 ... [详细]
  • 转载:https:blog.csdn.nethigh2011articledetails70155431清华大学镜像网:https:mirrors.tu ... [详细]
  • Hadoop的分布式架构改进与应用
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • Hadoop的文件操作位于包org.apache.hadoop.fs里面,能够进行新建、删除、修改等操作。比较重要的几个类:(1)Configurati ... [详细]
  • 本文详细介绍了Java代码分层的基本概念和常见分层模式,特别是MVC模式。同时探讨了不同项目需求下的分层策略,帮助读者更好地理解和应用Java分层思想。 ... [详细]
  • 本文详细介绍了在 CentOS 7 系统中配置 fstab 文件以实现开机自动挂载 NFS 共享目录的方法,并解决了常见的配置失败问题。 ... [详细]
  • 零拷贝技术是提高I/O性能的重要手段,常用于Java NIO、Netty、Kafka等框架中。本文将详细解析零拷贝技术的原理及其应用。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用,包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]
author-avatar
十饮魂
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有