热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

【Hadoop学习】上:组成介绍、生态体系、环境准备、不同运行模式测试

目录:入门(上)HDFS(中)MapReduce&Yarn(下)优化(补充)一、大数据概述概念特点:VVVV应用场景二、Hadoop到大数据生态1、Ha

目录:

  • 入门(上)
  • HDFS(中)
  • MapReduce&Yarn(下)
  • 优化(补充)

一、大数据概述

概念

特点:VVVV

应用场景

二、Hadoop到大数据生态

1、Hadoop生态圈、发展历史、发行版本

2、Hadoop的优势(4高)

3、Hadoop的组成(Common辅助工具+3大【计算、调度、存储】)

具体介绍【尤其MapReduce和yarn】

4、Hadoop生态体系

spark、storm、flink、hbase、sqoop

三、环境搭建

准备虚拟机

安装jdk

安装Hadoop

查看目录结构(bin/sbin/etc/share)

四、运行模式

本地运行

完全分布式运行(编写群起分发脚本xsync、设置ssh无秘钥登录、集群配置、集群启动【hdfs、yarn】)

集群测试(上传、查看路径和内容、拼接、下载、执行wordcount程序、分开启动停止和整体启动停止)

配置历史服务器jobhistory、聚集日志收集、集群时间同步

五、Hadoop编译源码

jdk、maven、ant、g++、OpenSSL、编译源码

错误解决方案


推荐阅读
author-avatar
郎郎2502918483
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有