热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

利用ZFS和Gluster实现分布式存储系统的高效迁移与应用

本文探讨了在Ubuntu18.04系统中利用ZFS和Gluster文件系统实现分布式存储系统的高效迁移与应用。通过详细的技术分析和实践案例,展示了这两种文件系统在数据迁移、高可用性和性能优化方面的优势,为分布式存储系统的部署和管理提供了宝贵的参考。

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

我这用的Ubuntu 18.04系统(已经内置支持ZFS和Gluster文件系统了),原来磁盘存储使用的Ext4格式和LVM,现在需要迁移到ZFS/Gluster支持的分布式软件定义存储(SDS)和容器存储体系(CSI),以充分利用分布式架构的存储虚拟化、多机容错、水平扩容、网络访问的集群环境下应用的需要。

方案:

  • 集群节点既能提供存储服务,也能执行高通量、非密集型计算任务。
  • 集群存储主机至少有两个节点。
  • 每节点四核CPU,16G内存,512G高速SSD。
  • 每节点PCIE至少双槽,一块双口万兆网卡,一块SATA扩展卡或SAS阵列卡。
  • 每节点至少4块磁盘(达到400MB/s以上,磁盘越多越快;8块盘可达到800MB/s左右)。
  • 节点的磁盘使用ZFS条带卷以获得最大磁盘IO速度,将SSD设为缓存和log卷执行加速。
  • 多个节点存储通过Gluster做网络镜像存储,可以灵活地按照镜像(可靠性高)或者条带(容量大、性能高)来组织存储方案。节点越多,可靠性、性能越好。

步骤:

中间需要有多个步骤,记录如下:

  1. 先把新的存储系统准备好。
    • 安装ZFS,sudo apt install zfsutils-linux 。
    • 安装Gluster,sudo apt install glusterfs-server 。
    • 在所有节点上,创建ZFS存储池和文件系统。
    • 在所有节点上,互相添加为gluster peer。
    • 在任一节点上,创建gluster volume存储卷,可选镜像或条带模式。
    • 在需要访问的工作节点挂载gluster存储卷,映射为本地卷,然后就可以直接访问了。
      • 在Kubernetes上,每一个Node都需要能访问网络存储卷,或者挂载为本地卷、通过hostpah来使用。
  2. 把Ext4和原来磁盘阵列的数据复制到新的存储系统。
    • 确认数据已经全部复制。
  3. 把原来的存储系统重新格式化为ZFS/Gluster。
    • 再次确认数据已经全部复制。
  4. 把原始数据复制回原来的存储系统。
  5. 建立软连接,连接到原来的卷到新的存储系统主目录。
    • ln -s 新的目录 原来目录的链接名
      • 如:ln -s /zpool/data /home/supermap/data
    • 恢复原来的服务。

注意:

  • ⚠️不要出错,否则把原始数据搞丢了,就麻烦大了
  • 建议使用万兆(10Gbps)网络(存储节点使用万兆网卡,全万兆交换机连接)。
    • 网络存储传输带宽,理论上:
      • 百兆连接9MB/s。
      • 千兆连接90MB/s。
      • 万兆连接900MB/s。
      • 双万兆连接1600MB/s以上。
    • 推荐:双万兆端口网卡,双路互备、链路聚合。
  • 需要至少双倍于现有数据的存储空间。
    • 新的分布式存储启用镜像和副本,需要“数据容量X副本数量”的物理磁盘容量。

参考:

  • 万兆网与测试
    • Ubuntu测试-使用phoronix-test-suite
    • Ubuntu16.04 双网卡链路聚合
  • ZFS
    • ZFS快速安装和性能测试
    • Ubuntu上使用ZFS(Zettabyte File System)
    • 提升ZFS性能的10个简便方法
    • ZFS-最佳实践指南
    • ZFS-自我恢复RAID
  • GlusterFS
    • 安装 GlusterFS - 快速开始
    • Setting up GlusterFS Volumes
    • Intel 40G网卡与LSI MegaRAID驱动安装

转:https://my.oschina.net/u/2306127/blog/2865263



推荐阅读
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • 深入解析Spring Cloud Ribbon负载均衡机制
    本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式,帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]
  • 本文深入探讨了如何通过调整InnoDB的关键配置参数来优化MySQL的随机IO性能,涵盖了缓存、日志文件、预读机制等多个方面,帮助读者全面提升数据库系统的性能。 ... [详细]
  • 本文介绍了如何利用npm脚本和concurrently工具,实现本地开发环境中多个监听服务的同时启动,包括HTTP服务、自动刷新、Sass和ES6支持。 ... [详细]
  • 深入解析 Apache Shiro 安全框架架构
    本文详细介绍了 Apache Shiro,一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作,使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API,同时确保高度的安全性和灵活性。 ... [详细]
  • 探讨如何真正掌握Java EE,包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法,并提供了详尽的标准。 ... [详细]
  • 本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储(DAS)、网络附加存储(NAS)和存储区域网络(SAN)的特点,帮助读者理解不同存储方式的优势与局限性。 ... [详细]
  • 本文基于刘洪波老师的《英文词根词缀精讲》,深入探讨了多个重要词根词缀的起源及其相关词汇,帮助读者更好地理解和记忆英语单词。 ... [详细]
  • CentOS7源码编译安装MySQL5.6
    2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网:https:www.cmake.org如此时最新 ... [详细]
  • 深入理解Java中的volatile、内存屏障与CPU指令
    本文详细探讨了Java中volatile关键字的作用机制,以及其与内存屏障和CPU指令之间的关系。通过具体示例和专业解析,帮助读者更好地理解多线程编程中的同步问题。 ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • DNN Community 和 Professional 版本的主要差异
    本文详细解析了 DotNetNuke (DNN) 的两种主要版本:Community 和 Professional。通过对比两者的功能和附加组件,帮助用户选择最适合其需求的版本。 ... [详细]
  • 本文详细探讨了Java中StringBuffer类在不同情况下的扩容规则,包括空参构造、带初始字符串和指定初始容量的构造方法。通过实例代码和理论分析,帮助读者更好地理解StringBuffer的内部工作原理。 ... [详细]
  • 本文详细介绍了 Flink 和 YARN 的交互机制。YARN 是 Hadoop 生态系统中的资源管理组件,类似于 Spark on YARN 的配置方式。我们将基于官方文档,深入探讨如何在 YARN 上部署和运行 Flink 任务。 ... [详细]
author-avatar
Annia000
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有