热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

20210121大数据尚学堂课程笔记day1

@R星校长内存的访问效率是硬盘的10万倍Zoo动物园Keeper管理者因为hadoop大象pig小猪都是他们开发的,再有一些这样的起名的软件,我们就成动物园了,所以我们这款产品就叫



时间煮雨
@R星校长

在这里插入图片描述
内存的访问效率是硬盘的10万倍

在这里插入图片描述
Zoo 动物园 Keeper 管理者 因为 hadoop 大象 pig 小猪 都是他们开发的,再有一些这样的起名的软件,我们就成动物园了 ,所以我们这款产品就叫动物园管理员吧

如你有几千台服务器的集群,你就需要用 ZooKeeper 监控,看那台服务器宕机了

在这里插入图片描述
ElasticSearch 学起来很快,因为它是站在巨人 Lucene 的肩膀上

在这里插入图片描述
因为实时计算 Spark 的底层代码是用 Scala 写的,所以 Scala 也需要学习,配合 Spark 做实时计算

Scala
在这里插入图片描述
在这里插入图片描述

CDH 可视化安装,解决兼容问题,它提前给你兼容的对应关系,如Hadoop和hive的兼容版本,都有推荐

在这里插入图片描述
实时计算 最近几年比较火

在这里插入图片描述
Flink 也是做实时运算,是分布式的流数据引擎
我推荐这个,国内字节跳动和阿里都是主要用的 Flink ,想多了解一些东西可以去看看阿里技术 这个公众号

在这里插入图片描述
Kylin 麒麟能在亚秒内查询巨大的 Hive 表

在这里插入图片描述
在这里插入图片描述
安装在电脑上的叫应用程序,那什么叫做进程呢?

一个应用程序运行起来就叫做进程,我们用多线程来提高进程的运行效率

开发一般都在用户级别,比如,写一个shell脚本,调用函数库,然后操控内核,一般Linux内核里的东西,稍做了解就好,不会让我们去写

内核主要负责以下四种功能:


  • 系统内存管理
  • 软件程序管理
  • 硬件设备管理
  • 文件系统管理

在这里插入图片描述
在这里插入图片描述
磁盘分区:指定分割区域起始与结束磁柱
两个分区就是两个柱面,磁盘分区是告诉操作系统,磁盘在此分割区域内可以存取的区域,例如 A 磁柱到 B 磁柱之间的区块

使用磁盘之前为啥要格式化?

因为每种操作系统所设置的文件属性/权限,以及存放数据的格式 有所不同

windows 10默认的格式都是NTFS了 在window XP 和 windows 7 之间的时候还是用的FAT32

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
把不常用的进程清空,放进虚拟内存,也就是交换分区内
假如你的内存 8G 硬盘 2T 为了 遍历查找方便,所以存放到交换分区,比如设置交换分区为 8G ,范围越小越好找

在这里插入图片描述
现在的家用路由器都已经把交换机和路由器的功能整合在一起了

在这里插入图片描述

在这里插入图片描述
十进制转换成二进制,除以2看余数,然后倒着从下网上写,如10101000,就是168

与运算规则:0&0=0; 0&1=0; 1&0=0; 1&1=1;
即:两位同时为“1”,结果才为“1”,否则为0

或运算规则:0|0=0; 0|1=1; 1|0=1; 1|1=1;
即 :参加运算的两个对象只要有一个为1,其值为1

异或运算规则:0^0=0; 0^1=1; 1^0=1; 1^1=0;
即:参加运算的两个对象,如果两个相应位为“异”(值不同),则该位结果为1,否则为0

子网掩码是用来计算网络位和主机位的

在这里插入图片描述

如果我们用 wifi 访问网络,网关就是路由器的ip地址,而我们现在要配的这个网关就是公网 ip
在这里插入图片描述
在这里插入图片描述
这是静态域名地址设置
在这里插入图片描述
restart 是重启,status是状态,start是开启,stop是关闭
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
shift+D 可以一键改值 按U是撤销

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
v
在这里插入图片描述

Hadoop-集群 网络配置

(一) 虚拟机设置
首先要修改一下虚拟机,<选择虚拟网络编辑器>

在这里插入图片描述
在这里插入图片描述
对照着上面的图一个一个解释吧. 首先要选择NAT模式,这里我选择的是VMnet8,也可以点击添加网络再添加一个;

然后就是下面的两个对勾✔一定要选上(DHCP)没有勾选可能会出现虚拟机可以ping通外面的主机,但是外面的主机ping不通虚拟机的现象。

子网IP要设置和虚拟机一个网段.

然后点击 NAT设置 ,设置网关,这里我设置的是192.168.100.1,图如下:

在这里插入图片描述
设置完这里再选择虚拟机,右键选择设置

在这里插入图片描述
选择网络适配器–>自定义–>VMnet8(根据自己的设置选择) 然后 确定

在这里插入图片描述
(二) test1 设置

之后就是打开虚拟机,设置 master 了

这里需要涉及到三个配置文件,分别是:

/etc/sysconfig/network
/etc/sysconfig/network-scripts/ifcfg-eth0
/etc/resolv.conf

首先修改 vi /etc/sysconfig/network 如下:

centos7里没有ifcfg-eth0只有 ifcfg-ens33(没有Eth0网卡)

CentOS7系统安装完毕之后,输入ifconfig命令发现没有eth0,不符合我们的习惯。而且也无法远程ssh连接,

这个问题解决起来还算简单:

一,永久搞定


  1. 进入目录/etc/sysconfig/network-scripts/

  2. 将文件ifcfg-ens33重命名为ifcfg-eth0;
    在这里插入图片描述
    我因为是复制别人的虚拟机,所以在vmware虚拟机中,当我们克隆或者复制linux系统虚拟机后,再启动系统时会发现系统下不仅仅只有 ifcfg-ens33,还多了一个ifcfg-ens34

    同理如果系统本身是 ifcfg-eth0 ,就会往下将其命名为 ifcfg-eth1(累加的原则)
     (注意:修改需要切换至root用户)

  3. 编辑 ifcfg-eth0
    使用命令:vi ifcfg-eth0
    因为我要使用ssh远程登录,所以我需要固定 ip ,使用静态地址

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这是我修改的地方
就把上面这写参数对应改一下和加上去,根据自己的网段改,BOOTPROTO一定要改为static。

  1. 修改grub文件
    目录:/etc/default
    编辑grub文件
      使用命令:vi grub
      在GRUB_CMDLINE_LINUX原有的参数后面加上"net.ifnames=0 biosdevname=0"
    在这里插入图片描述

在这里插入图片描述

保存退出

  1. 命令行运行命令
      grub2-mkconfig -o /boot/grub2/grub.cfg

在这里插入图片描述


  1. 完成了,重启一下就 ok 了,不过重启之前可以顺带修改一个计算机名
      编辑文件: vi /etc/hostname
    在这里插入图片描述
     就一行内容,就是计算机名,怎么写都行(英文的),保存退出

  2. 重启计算机
      reboot

8.完成
在这里插入图片描述

在这里插入图片描述



推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文介绍了在Win10上安装WinPythonHadoop的详细步骤,包括安装Python环境、安装JDK8、安装pyspark、安装Hadoop和Spark、设置环境变量、下载winutils.exe等。同时提醒注意Hadoop版本与pyspark版本的一致性,并建议重启电脑以确保安装成功。 ... [详细]
  • ejava,刘聪dejava
    本文目录一览:1、什么是Java?2、java ... [详细]
  • Hadoop源码解析1Hadoop工程包架构解析
    1 Hadoop中各工程包依赖简述   Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。   GoogleCluster:ht ... [详细]
  • 如何去除Win7快捷方式的箭头
    本文介绍了如何去除Win7快捷方式的箭头的方法,通过生成一个透明的ico图标并将其命名为Empty.ico,将图标复制到windows目录下,并导入注册表,即可去除箭头。这样做可以改善默认快捷方式的外观,提升桌面整洁度。 ... [详细]
  • HDFS2.x新特性
    一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]
  • 本文总结了Linux下多线程执行shell脚本的4种方法,包括切换到工作目录执行、使用绝对路径执行、直接使用bash或sh执行。同时介绍了为什么需要加上"./"来执行脚本的原因。 ... [详细]
  • Java和JavaScript是什么关系?java跟javaScript都是编程语言,只是java跟javaScript没有什么太大关系,一个是脚本语言(前端语言),一个是面向对象 ... [详细]
  • 一次上线事故,30岁+的程序员踩坑经验之谈
    本文主要介绍了一位30岁+的程序员在一次上线事故中踩坑的经验之谈。文章提到了在双十一活动期间,作为一个在线医疗项目,他们进行了优惠折扣活动的升级改造。然而,在上线前的最后一天,由于大量数据请求,导致部分接口出现问题。作者通过部署两台opentsdb来解决问题,但读数据的opentsdb仍然经常假死。作者只能查询最近24小时的数据。这次事故给他带来了很多教训和经验。 ... [详细]
  • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  • ZooKeeper 学习
    前言相信大家对ZooKeeper应该不算陌生。但是你真的了解ZooKeeper是个什么东西吗?如果别人面试官让你给他讲讲ZooKeeper是个什么东西, ... [详细]
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  • 本文总结了初学者在使用dubbo设计架构过程中遇到的问题,并提供了相应的解决方法。问题包括传输字节流限制、分布式事务、序列化、多点部署、zk端口冲突、服务失败请求3次机制以及启动时检查。通过解决这些问题,初学者能够更好地理解和应用dubbo设计架构。 ... [详细]
  • 本文讨论了在使用Git进行版本控制时,如何提供类似CVS中自动增加版本号的功能。作者介绍了Git中的其他版本表示方式,如git describe命令,并提供了使用这些表示方式来确定文件更新情况的示例。此外,文章还介绍了启用$Id:$功能的方法,并讨论了一些开发者在使用Git时的需求和使用场景。 ... [详细]
author-avatar
手机用户2502895987
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有