热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

CDH离线安装

2019独角兽企业重金招聘Python工程师标准一、相关包的下载地址ClouderaManager下载地址:http:archive.cloudera.comc

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

一、相关包的下载地址 Cloudera Manager下载地址: http://archive.cloudera.com/cm5/cm/5/ 或者 http://archive.cloudera.com/cm5/repo-as-tarball/ 下载信息: http://www.cloudera.com/content/cloudera/en/documentation/cloudera-manager/v5-latest/Cloudera-Manager-Version-and-Download-Information/Cloudera-Manager-Version-and-Download-Information.html#cmvdtopic1

CDH安装包地址:http://archive.cloudera.com/cdh5/parcels/latest/,由于我们的操作系统为CentOS6.5,需要下载以下文件: CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel.sha manifest.json 二、环境配置 只安装基础服务,节点准备: cdh-node1 主节点内存大于4G---->5.5G cdh-node2 大于2G---->2.5G cdh-node3 大于2G---->2.5G 1、配置jdk 、主节点ssh到所有节点、防火墙、selinux、ntp服务 2、安装配置MySql(主节点) 安装:yum install mysql-server -y 设置开机启动:chkconfig mysqld on 启动:service mysqld start 设置root的初试密码:mysqladmin -u root password 'hive' 进入mysql:mysql -uroot -p 创建数据库:

hive

create database hive DEFAULT CHARSET utf8 COLLATE utf8generalci;

activity monitor

create database amon DEFAULT CHARSET utf8 COLLATE utf8generalci;

授权root用户在主节点拥有所有数据库的访问权限

grant all privileges on . to 'root'@'cdh-node1' identified by 'hive' with grant option; flush privileges; 三、安装Cloudera Manager Server 和Agent 1、上传 cloudera-manager安装包,解压到/opt目录下tar xzvf cloudera-manager*.tar.gz -C /opt,得到cm-5.1.3和cloudera目录 2、为Cloudera Manager 5建立数据库 将mysql-connector-java-5.1.32.jar,放到/opt/cm-5.1.3/share/cmf/lib/ 3、主节点初始化CM5的数据库: /opt/cm-5.1.3/share/cmf/schema/scmpreparedatabase.sh mysql cm -hlocalhost -uroot -phive --scm-host localhost scm scm scm 出现All done, your SCM database is configured correctly!配置成功 4、Agent配置 修改/opt/cm-5.1.3/etc/cloudera-scm-agent/config.ini中的serverhost为主节点的主机名: vi cm-5.1.3/etc/cloudera-scm-agent/config.ini --->serverhost=cdh-node1 同步Agent到其他节点 scp -r /opt/cm-5.1.3 root@cdh-node2:/opt/ scp -r /opt/cm-5.1.3 root@cdh-node3:/opt/ 所有节点创建cloudera-scm用户 useradd --system --home=/opt/cm-5.1.3/run/cloudera-scm-server/ --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm 5、准备Parcels 将CHD5相关的Parcel包放到主节点的/opt/cloudera/parcel-repo/目录中(如果没有parcel-repo需要手动创建) 相关的文件如下: CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel.sha1 manifest.json 将CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel.sha1,重命名为CDH-5.1.3-1.cdh5.1.3.p0.12-el6.parcel.sha 6、启动脚本 启动服务端:/opt/cm-5.1.3/etc/init.d/cloudera-scm-server start 启动Agent服务:/opt/cm-5.1.3/etc/init.d/cloudera-scm-agent start

停止:stop 重启:restart

7、浏览器访问主节点 http://192.168.204.131:7180 用户名:密码默认是admin:admin

ed16116711f34a62d6b2da23760401a7a22.jpg

e6510757eba4e3bf3ca75abd754eca1a362.jpg

继续,全选继续c371c1101c55d59a89b8f455731a9d3aca8.jpg

580b8077c732030090f063db206cb100c8c.jpg

本地Parcel包配置无误,最新版是5.14.2,但是我只下载了5.1.3,所以选择5.1.3,否则会在线下载会很慢,继续

548e0f4a2b6a6d436a0f685b7e8fbc52361.jpg因为是本地Parcel包,所以第一条绿杠瞬间完成,分配过程取决于内网网速,耐心等待几分钟,等全部完成后继续874e05a9fafb355d5a64bb24d784e7df19d.jpg遇到这个问题的解决办法是echo 0 > /proc/sys/vm/swappiness,然后重新运行

eaaf0fa3c94fade1c7c0d6a1d10786ad8c0.jpga336e8c685de8ed2666895be5c0cba207b7.jpg5ead807e37909fad02f1110f13104b466f8.jpg选择安装的服务26d42cc19479efc5101da08dad335e9c27c.jpg一般按默认即可,继续a52c85b054643edb5231fb6b3d0a4be52c4.jpg数据库的设置,检查通过后继续10cd258321255e1b50ab463d66234566fc4.jpg

集群设置的审查,继续0db2db538123243de6740ab9c3edbf735a0.jpg

安装Hive的时候可能会报错,因为使用了MySql作为hive的元数据存储,hive默认没有带mysql的驱动

解决方法拷贝一个到hive路径 然后重试:

cp /opt/cm-5.1.3/share/cmf/lib/mysql-connector-java-5.1.32.jar /opt/cloudera/parcels/CDH-5.1.3-1.cdh5.1.3.p0.12/lib/hive/lib/6644451d217880646611735767182f3ab08.jpg53cce76b82b0591d5c8880fbfabaf5e94b3.jpg


转:https://my.oschina.net/zlhblogs/blog/1834868



推荐阅读
  • 选择适合生产环境的Docker存储驱动
    本文旨在探讨如何在生产环境中选择合适的Docker存储驱动,并详细介绍不同Linux发行版下的配置方法。通过参考官方文档和兼容性矩阵,提供实用的操作指南。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 使用Python在SAE上开发新浪微博应用的初步探索
    最近重新审视了新浪云平台(SAE)提供的服务,发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用,并分享开发过程中的关键步骤。 ... [详细]
  • 微软Exchange服务器遭遇2022年版“千年虫”漏洞
    微软Exchange服务器在新年伊始遭遇了一个类似于‘千年虫’的日期处理漏洞,导致邮件传输受阻。该问题主要影响配置了FIP-FS恶意软件引擎的Exchange 2016和2019版本。 ... [详细]
  • 本文详细解析了Python中的os和sys模块,介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]
  • 本文介绍了如何通过 Maven 依赖引入 SQLiteJDBC 和 HikariCP 包,从而在 Java 应用中高效地连接和操作 SQLite 数据库。文章提供了详细的代码示例,并解释了每个步骤的实现细节。 ... [详细]
  • 本文介绍了在Windows环境下使用pydoc工具的方法,并详细解释了如何通过命令行和浏览器查看Python内置函数的文档。此外,还提供了关于raw_input和open函数的具体用法和功能说明。 ... [详细]
  • 使用Vultr云服务器和Namesilo域名搭建个人网站
    本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站,包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南,帮助读者顺利完成建站过程。 ... [详细]
  • 本文介绍如何使用阿里云的fastjson库解析包含时间戳、IP地址和参数等信息的JSON格式文本,并进行数据处理和保存。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 基于KVM的SRIOV直通配置及性能测试
    SRIOV介绍、VF直通配置,以及包转发率性能测试小慢哥的原创文章,欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]
  • 最近团队在部署DLP,作为一个技术人员对于黑盒看不到的地方还是充满了好奇心。多次咨询乙方人员DLP的算法原理是什么,他们都以商业秘密为由避而不谈,不得已只能自己查资料学习,于是有了下面的浅见。身为甲方,虽然不需要开发DLP产品,但是也有必要弄明白DLP基本的原理。俗话说工欲善其事必先利其器,只有在懂这个工具的原理之后才能更加灵活地使用这个工具,即使出现意外情况也能快速排错,越接近底层,越接近真相。根据DLP的实际用途,本文将DLP检测分为2部分,泄露关键字检测和近似重复文档检测。 ... [详细]
  • 本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询,并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率,还简化了代码逻辑。 ... [详细]
  • 实体映射最强工具类:MapStruct真香 ... [详细]
  • 本文介绍如何使用布局文件在Android应用中排列多行TextView和Button,使其占据屏幕的特定比例,并提供示例代码以帮助理解和实现。 ... [详细]
author-avatar
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有