作者:运儿0315 | 来源:互联网 | 2023-01-30 13:27
当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统
当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。
这一切,都起源自web数据爆炸时代的来临 数据抓取系统 - Nutch 海量数据怎么存,当然是用分布式文件系统 - HDFS 数据怎么用呢,分析,处理 MapReduce框架,让你编写代码来实现对大数据的分析工作 非结构化数据(日志)收集处理 - fuse,webdav, chukwa, flume, Scribe 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 - Hiho, sqoop MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 – Pig, Hive, Jaql 让你的数据可见 - drilldown, Intellicus 用高级语言管理你的任务流 – oozie, Cascading Hadoop当然也有自己的监控管理工具 – Hue, karmasphere, Eclipse plugin, cacti, ganglia 数据序列化处理与任务调度 – Avro, Zookeeper 更多构建在Hadoop上层的服务 – Mahout, Elastic map Reduce OLTP存储系统 – Hbase 欢迎大家阅读《Hadoop生态图谱》 ,跪求各位点评,若觉得好的话请收藏本文,by