热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

20210121大数据尚学堂课程笔记day1

@R星校长内存的访问效率是硬盘的10万倍Zoo动物园Keeper管理者因为hadoop大象pig小猪都是他们开发的,再有一些这样的起名的软件,我们就成动物园了,所以我们这款产品就叫



时间煮雨
@R星校长

在这里插入图片描述
内存的访问效率是硬盘的10万倍

在这里插入图片描述
Zoo 动物园 Keeper 管理者 因为 hadoop 大象 pig 小猪 都是他们开发的,再有一些这样的起名的软件,我们就成动物园了 ,所以我们这款产品就叫动物园管理员吧

如你有几千台服务器的集群,你就需要用 ZooKeeper 监控,看那台服务器宕机了

在这里插入图片描述
ElasticSearch 学起来很快,因为它是站在巨人 Lucene 的肩膀上

在这里插入图片描述
因为实时计算 Spark 的底层代码是用 Scala 写的,所以 Scala 也需要学习,配合 Spark 做实时计算

Scala
在这里插入图片描述
在这里插入图片描述

CDH 可视化安装,解决兼容问题,它提前给你兼容的对应关系,如Hadoop和hive的兼容版本,都有推荐

在这里插入图片描述
实时计算 最近几年比较火

在这里插入图片描述
Flink 也是做实时运算,是分布式的流数据引擎
我推荐这个,国内字节跳动和阿里都是主要用的 Flink ,想多了解一些东西可以去看看阿里技术 这个公众号

在这里插入图片描述
Kylin 麒麟能在亚秒内查询巨大的 Hive 表

在这里插入图片描述
在这里插入图片描述
安装在电脑上的叫应用程序,那什么叫做进程呢?

一个应用程序运行起来就叫做进程,我们用多线程来提高进程的运行效率

开发一般都在用户级别,比如,写一个shell脚本,调用函数库,然后操控内核,一般Linux内核里的东西,稍做了解就好,不会让我们去写

内核主要负责以下四种功能:


  • 系统内存管理
  • 软件程序管理
  • 硬件设备管理
  • 文件系统管理

在这里插入图片描述
在这里插入图片描述
磁盘分区:指定分割区域起始与结束磁柱
两个分区就是两个柱面,磁盘分区是告诉操作系统,磁盘在此分割区域内可以存取的区域,例如 A 磁柱到 B 磁柱之间的区块

使用磁盘之前为啥要格式化?

因为每种操作系统所设置的文件属性/权限,以及存放数据的格式 有所不同

windows 10默认的格式都是NTFS了 在window XP 和 windows 7 之间的时候还是用的FAT32

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
把不常用的进程清空,放进虚拟内存,也就是交换分区内
假如你的内存 8G 硬盘 2T 为了 遍历查找方便,所以存放到交换分区,比如设置交换分区为 8G ,范围越小越好找

在这里插入图片描述
现在的家用路由器都已经把交换机和路由器的功能整合在一起了

在这里插入图片描述

在这里插入图片描述
十进制转换成二进制,除以2看余数,然后倒着从下网上写,如10101000,就是168

与运算规则:0&0=0; 0&1=0; 1&0=0; 1&1=1;
即:两位同时为“1”,结果才为“1”,否则为0

或运算规则:0|0=0; 0|1=1; 1|0=1; 1|1=1;
即 :参加运算的两个对象只要有一个为1,其值为1

异或运算规则:0^0=0; 0^1=1; 1^0=1; 1^1=0;
即:参加运算的两个对象,如果两个相应位为“异”(值不同),则该位结果为1,否则为0

子网掩码是用来计算网络位和主机位的

在这里插入图片描述

如果我们用 wifi 访问网络,网关就是路由器的ip地址,而我们现在要配的这个网关就是公网 ip
在这里插入图片描述
在这里插入图片描述
这是静态域名地址设置
在这里插入图片描述
restart 是重启,status是状态,start是开启,stop是关闭
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
shift+D 可以一键改值 按U是撤销

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
v
在这里插入图片描述

Hadoop-集群 网络配置

(一) 虚拟机设置
首先要修改一下虚拟机,<选择虚拟网络编辑器>

在这里插入图片描述
在这里插入图片描述
对照着上面的图一个一个解释吧. 首先要选择NAT模式,这里我选择的是VMnet8,也可以点击添加网络再添加一个;

然后就是下面的两个对勾✔一定要选上(DHCP)没有勾选可能会出现虚拟机可以ping通外面的主机,但是外面的主机ping不通虚拟机的现象。

子网IP要设置和虚拟机一个网段.

然后点击 NAT设置 ,设置网关,这里我设置的是192.168.100.1,图如下:

在这里插入图片描述
设置完这里再选择虚拟机,右键选择设置

在这里插入图片描述
选择网络适配器–>自定义–>VMnet8(根据自己的设置选择) 然后 确定

在这里插入图片描述
(二) test1 设置

之后就是打开虚拟机,设置 master 了

这里需要涉及到三个配置文件,分别是:

/etc/sysconfig/network
/etc/sysconfig/network-scripts/ifcfg-eth0
/etc/resolv.conf

首先修改 vi /etc/sysconfig/network 如下:

centos7里没有ifcfg-eth0只有 ifcfg-ens33(没有Eth0网卡)

CentOS7系统安装完毕之后,输入ifconfig命令发现没有eth0,不符合我们的习惯。而且也无法远程ssh连接,

这个问题解决起来还算简单:

一,永久搞定


  1. 进入目录/etc/sysconfig/network-scripts/

  2. 将文件ifcfg-ens33重命名为ifcfg-eth0;
    在这里插入图片描述
    我因为是复制别人的虚拟机,所以在vmware虚拟机中,当我们克隆或者复制linux系统虚拟机后,再启动系统时会发现系统下不仅仅只有 ifcfg-ens33,还多了一个ifcfg-ens34

    同理如果系统本身是 ifcfg-eth0 ,就会往下将其命名为 ifcfg-eth1(累加的原则)
     (注意:修改需要切换至root用户)

  3. 编辑 ifcfg-eth0
    使用命令:vi ifcfg-eth0
    因为我要使用ssh远程登录,所以我需要固定 ip ,使用静态地址

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这是我修改的地方
就把上面这写参数对应改一下和加上去,根据自己的网段改,BOOTPROTO一定要改为static。

  1. 修改grub文件
    目录:/etc/default
    编辑grub文件
      使用命令:vi grub
      在GRUB_CMDLINE_LINUX原有的参数后面加上"net.ifnames=0 biosdevname=0"
    在这里插入图片描述

在这里插入图片描述

保存退出

  1. 命令行运行命令
      grub2-mkconfig -o /boot/grub2/grub.cfg

在这里插入图片描述


  1. 完成了,重启一下就 ok 了,不过重启之前可以顺带修改一个计算机名
      编辑文件: vi /etc/hostname
    在这里插入图片描述
     就一行内容,就是计算机名,怎么写都行(英文的),保存退出

  2. 重启计算机
      reboot

8.完成
在这里插入图片描述

在这里插入图片描述



推荐阅读
  • 技术日志:深入探讨Spark Streaming与Spark SQL的融合应用
    技术日志:深入探讨Spark Streaming与Spark SQL的融合应用 ... [详细]
  • 字节跳动深圳研发中心安全业务团队正在火热招募人才! ... [详细]
  • 在Linux系统中,原本已安装了多个版本的Python 2,并且还安装了Anaconda,其中包含了Python 3。本文详细介绍了如何通过配置环境变量,使系统默认使用指定版本的Python,以便在不同版本之间轻松切换。此外,文章还提供了具体的实践步骤和注意事项,帮助用户高效地管理和使用不同版本的Python环境。 ... [详细]
  • 龙蜥社区开发者访谈:技术生涯的三次蜕变 | 第3期
    龙蜥社区的开发者们通过自己的实践和经验,推动着开源技术的发展。本期「龙蜥开发者说」聚焦于一位资深开发者的三次技术转型,分享他在龙蜥社区的成长故事。 ... [详细]
  • 流处理中的计数挑战与解决方案
    本文探讨了在流处理中进行计数的各种技术和挑战,并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性,还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]
  • Vulnhub DC3 实战记录与分析
    本文记录了在 Vulnhub DC3 靶机上的渗透测试过程,包括漏洞利用、内核提权等关键步骤,并总结了实战经验和教训。 ... [详细]
  • 本文详细介绍了 Spark 中的弹性分布式数据集(RDD)及其常见的操作方法,包括 union、intersection、cartesian、subtract、join、cogroup 等转换操作,以及 count、collect、reduce、take、foreach、first、saveAsTextFile 等行动操作。 ... [详细]
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • 在安装并配置了Elasticsearch后,我在尝试通过GET /_nodes请求获取节点信息时遇到了问题,收到了错误消息。为了确保请求的正确性和安全性,我需要进一步排查配置和网络设置,以确保Elasticsearch集群能够正常响应。此外,还需要检查安全设置,如防火墙规则和认证机制,以防止未经授权的访问。 ... [详细]
  • 本指南从零开始介绍Scala编程语言的基础知识,重点讲解了Scala解释器REPL(读取-求值-打印-循环)的使用方法。REPL是Scala开发中的重要工具,能够帮助初学者快速理解和实践Scala的基本语法和特性。通过详细的示例和练习,读者将能够熟练掌握Scala的基础概念和编程技巧。 ... [详细]
  • 本文介绍了如何在 Windows 系统上利用 Docker 构建一个包含 NGINX、PHP、MySQL、Redis 和 Elasticsearch 的集成开发环境。通过详细的步骤说明,帮助开发者快速搭建和配置这一复杂的技术栈,提升开发效率和环境一致性。 ... [详细]
  • 在第二课中,我们将深入探讨Scala的面向对象编程核心概念及其在Spark源码中的应用。首先,通过详细的实战案例,全面解析Scala中的类和对象。作为一门纯面向对象的语言,Scala的类设计和对象使用是理解其面向对象特性的关键。此外,我们还将介绍如何通过阅读Spark源码来进一步巩固对这些概念的理解。这不仅有助于提升编程技能,还能为后续的高级应用开发打下坚实的基础。 ... [详细]
  • 本文详细探讨了OpenCV中人脸检测算法的实现原理与代码结构。通过分析核心函数和关键步骤,揭示了OpenCV如何高效地进行人脸检测。文章不仅提供了代码示例,还深入解释了算法背后的数学模型和优化技巧,为开发者提供了全面的理解和实用的参考。 ... [详细]
  • 【OpenCV4实战】掌握OpenCV中的键盘和鼠标事件处理技巧
    在《OpenCV4实战》中,本文详细介绍了如何在OpenCV中处理键盘和鼠标事件。首先,针对键盘事件,文章涵盖了基本原理、如何确定按键响应值以及通过按键调节图像亮度的具体方法。接着,对于鼠标事件,文章不仅讲解了基础理论,还提供了示例程序,帮助读者更好地理解和应用这些技术。通过这些内容,读者可以全面掌握OpenCV中键盘和鼠标事件的处理技巧。 ... [详细]
  • 在使用sbt构建项目时,遇到了“对象apache不是org软件包的成员”的错误。本文详细分析了该问题的原因,并提供了有效的解决方案,包括检查依赖配置、清理缓存和更新sbt插件等步骤,帮助开发者快速解决问题。 ... [详细]
author-avatar
手机用户2502895987
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有