== 1 Hbase==Hadoop Database 是Apache的Hadoop项目的子项目。
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。
- 适合于非结构化数据存储的数据库。
- 高可靠性、高性能、面向列、可伸缩的分布式存储系统
1.1 HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统
1.2 Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据
1.3 Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。
1.4
1)HBase位于结构化存储层
2)Hadoop HDFS为HBase提供了高可靠性的底层存储支持
3)Hadoop MapReduce为HBase提供了高性能的计算能力
4)Zookeeper为HBase提供了稳定服务和failover机制。
此外:
Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。
Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。