热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

利用ZFS和Gluster实现分布式存储系统的高效迁移与应用

本文探讨了在Ubuntu18.04系统中利用ZFS和Gluster文件系统实现分布式存储系统的高效迁移与应用。通过详细的技术分析和实践案例,展示了这两种文件系统在数据迁移、高可用性和性能优化方面的优势,为分布式存储系统的部署和管理提供了宝贵的参考。

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

我这用的Ubuntu 18.04系统(已经内置支持ZFS和Gluster文件系统了),原来磁盘存储使用的Ext4格式和LVM,现在需要迁移到ZFS/Gluster支持的分布式软件定义存储(SDS)和容器存储体系(CSI),以充分利用分布式架构的存储虚拟化、多机容错、水平扩容、网络访问的集群环境下应用的需要。

方案:

  • 集群节点既能提供存储服务,也能执行高通量、非密集型计算任务。
  • 集群存储主机至少有两个节点。
  • 每节点四核CPU,16G内存,512G高速SSD。
  • 每节点PCIE至少双槽,一块双口万兆网卡,一块SATA扩展卡或SAS阵列卡。
  • 每节点至少4块磁盘(达到400MB/s以上,磁盘越多越快;8块盘可达到800MB/s左右)。
  • 节点的磁盘使用ZFS条带卷以获得最大磁盘IO速度,将SSD设为缓存和log卷执行加速。
  • 多个节点存储通过Gluster做网络镜像存储,可以灵活地按照镜像(可靠性高)或者条带(容量大、性能高)来组织存储方案。节点越多,可靠性、性能越好。

步骤:

中间需要有多个步骤,记录如下:

  1. 先把新的存储系统准备好。
    • 安装ZFS,sudo apt install zfsutils-linux 。
    • 安装Gluster,sudo apt install glusterfs-server 。
    • 在所有节点上,创建ZFS存储池和文件系统。
    • 在所有节点上,互相添加为gluster peer。
    • 在任一节点上,创建gluster volume存储卷,可选镜像或条带模式。
    • 在需要访问的工作节点挂载gluster存储卷,映射为本地卷,然后就可以直接访问了。
      • 在Kubernetes上,每一个Node都需要能访问网络存储卷,或者挂载为本地卷、通过hostpah来使用。
  2. 把Ext4和原来磁盘阵列的数据复制到新的存储系统。
    • 确认数据已经全部复制。
  3. 把原来的存储系统重新格式化为ZFS/Gluster。
    • 再次确认数据已经全部复制。
  4. 把原始数据复制回原来的存储系统。
  5. 建立软连接,连接到原来的卷到新的存储系统主目录。
    • ln -s 新的目录 原来目录的链接名
      • 如:ln -s /zpool/data /home/supermap/data
    • 恢复原来的服务。

注意:

  • ⚠️不要出错,否则把原始数据搞丢了,就麻烦大了
  • 建议使用万兆(10Gbps)网络(存储节点使用万兆网卡,全万兆交换机连接)。
    • 网络存储传输带宽,理论上:
      • 百兆连接9MB/s。
      • 千兆连接90MB/s。
      • 万兆连接900MB/s。
      • 双万兆连接1600MB/s以上。
    • 推荐:双万兆端口网卡,双路互备、链路聚合。
  • 需要至少双倍于现有数据的存储空间。
    • 新的分布式存储启用镜像和副本,需要“数据容量X副本数量”的物理磁盘容量。

参考:

  • 万兆网与测试
    • Ubuntu测试-使用phoronix-test-suite
    • Ubuntu16.04 双网卡链路聚合
  • ZFS
    • ZFS快速安装和性能测试
    • Ubuntu上使用ZFS(Zettabyte File System)
    • 提升ZFS性能的10个简便方法
    • ZFS-最佳实践指南
    • ZFS-自我恢复RAID
  • GlusterFS
    • 安装 GlusterFS - 快速开始
    • Setting up GlusterFS Volumes
    • Intel 40G网卡与LSI MegaRAID驱动安装

转:https://my.oschina.net/u/2306127/blog/2865263



推荐阅读
  • 解决getallheaders函数导致的500错误及8种服务器性能优化策略
    本文探讨了解决getallheaders函数引起的服务器500错误的方法,并介绍八种有效的服务器性能优化技术,包括内存数据库的应用、Spark RDD的使用、缓存策略的实施、SSD的引入、数据库优化、IO模型的选择、多核处理策略以及分布式部署方案。 ... [详细]
  • 本文详细介绍了Oracle数据库的基本架构,包括数据文件和内存结构的概念。文章重点解释了Oracle实例的组成部分,如系统全局内存区域(SGA)和后台进程,以及客户端进程与服务器进程的交互方式。此外,还探讨了SGA中的共享池、库高速缓存、锁存器及SGA缓冲区缓存等关键组件的功能和运作机制。 ... [详细]
  • CentOS 7.4 KVM虚拟化平台搭建指南
    本文详细介绍了如何在CentOS 7.4系统上搭建KVM虚拟化平台,包括环境准备、网络配置、KVM安装与管理等步骤,适用于希望利用KVM进行虚拟化部署的技术人员。 ... [详细]
  • mysql 分库分表策略_【数据库】分库分表策略
    关系型数据库本身比较容易成为系统瓶颈,单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后,由于查询维度较多, ... [详细]
  • 本文档详细介绍了服务器与应用系统迁移的策略与实施步骤。迁移不仅涉及数据的转移,还包括环境配置、应用兼容性测试等多个方面,旨在确保迁移过程的顺利进行及迁移后的系统稳定运行。 ... [详细]
  • 解决Linux Ubuntu下Ping IP正常但无法Ping域名的问题
    本文介绍了在Linux Ubuntu系统中遇到的一种常见问题——能够Ping通IP地址,但无法Ping通域名,并提供了有效的解决方案。 ... [详细]
  • CentOS 7.6环境下Oracle 11g的数据泵操作与nmon性能监控
    本文详细介绍在CentOS 7.6操作系统中使用Oracle 11g的数据泵(Data Pump)进行数据的导入导出操作,并介绍如何通过nmon工具进行系统性能的监控与分析。 ... [详细]
  • 开发笔记:三分钟快速搭建分布式高可用的Redis集群
    开发笔记:三分钟快速搭建分布式高可用的Redis集群 ... [详细]
  • 本文探讨了Go语言(Golang)的学习价值及其在Web开发领域的应用潜力,包括其独特的语言特性和为什么它是现代软件开发的理想选择。 ... [详细]
  • 在上一章【第三十九章:基于SpringBoot&Quartz完成定时任务分布式单节点持久化】中我们已经完成了任务的持久化,当我们创建一个任务时任务会被quartz定时任务框架自动持 ... [详细]
  • 本文介绍了如何在三台CentOS 7.5虚拟机上通过Docker部署RabbitMQ集群,包括环境准备、容器创建、集群配置及故障处理等内容。 ... [详细]
  • 本文介绍了如何在 Linux 系统上构建网络路由器,特别关注于使用 Zebra 软件实现动态路由功能。通过具体的案例,展示了如何配置 RIP 和 OSPF 协议,以及如何利用多路由器查看工具(MRLG)监控网络状态。 ... [详细]
  • Flutter入门指南:实现自动关闭的对话框与提示
    本文为Flutter系列教程的一部分,专注于讲解如何在Flutter应用中实现自动关闭的对话框和提示。通过具体的代码示例,帮助开发者掌握SnackBar、BottomSheet和Dialog的使用方法。 ... [详细]
  • grep、sed、awk一、grep的用法1、grep简介grep是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep包 ... [详细]
  • Lepus: 高效的企业级数据库监控解决方案
    访问官方网站:http://www.lepus.cc/。Lepus(天兔)数据库监控系统是由一位资深数据库管理员(现任职于一家知名互联网公司)专为互联网企业设计的专业数据库监控平台。该系统旨在提供全面的数据库性能监控与管理服务,支持多种主流数据库类型。 ... [详细]
author-avatar
Annia000
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有