热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

利用ZFS和Gluster实现分布式存储系统的高效迁移与应用

本文探讨了在Ubuntu18.04系统中利用ZFS和Gluster文件系统实现分布式存储系统的高效迁移与应用。通过详细的技术分析和实践案例,展示了这两种文件系统在数据迁移、高可用性和性能优化方面的优势,为分布式存储系统的部署和管理提供了宝贵的参考。

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

我这用的Ubuntu 18.04系统(已经内置支持ZFS和Gluster文件系统了),原来磁盘存储使用的Ext4格式和LVM,现在需要迁移到ZFS/Gluster支持的分布式软件定义存储(SDS)和容器存储体系(CSI),以充分利用分布式架构的存储虚拟化、多机容错、水平扩容、网络访问的集群环境下应用的需要。

方案:

  • 集群节点既能提供存储服务,也能执行高通量、非密集型计算任务。
  • 集群存储主机至少有两个节点。
  • 每节点四核CPU,16G内存,512G高速SSD。
  • 每节点PCIE至少双槽,一块双口万兆网卡,一块SATA扩展卡或SAS阵列卡。
  • 每节点至少4块磁盘(达到400MB/s以上,磁盘越多越快;8块盘可达到800MB/s左右)。
  • 节点的磁盘使用ZFS条带卷以获得最大磁盘IO速度,将SSD设为缓存和log卷执行加速。
  • 多个节点存储通过Gluster做网络镜像存储,可以灵活地按照镜像(可靠性高)或者条带(容量大、性能高)来组织存储方案。节点越多,可靠性、性能越好。

步骤:

中间需要有多个步骤,记录如下:

  1. 先把新的存储系统准备好。
    • 安装ZFS,sudo apt install zfsutils-linux 。
    • 安装Gluster,sudo apt install glusterfs-server 。
    • 在所有节点上,创建ZFS存储池和文件系统。
    • 在所有节点上,互相添加为gluster peer。
    • 在任一节点上,创建gluster volume存储卷,可选镜像或条带模式。
    • 在需要访问的工作节点挂载gluster存储卷,映射为本地卷,然后就可以直接访问了。
      • 在Kubernetes上,每一个Node都需要能访问网络存储卷,或者挂载为本地卷、通过hostpah来使用。
  2. 把Ext4和原来磁盘阵列的数据复制到新的存储系统。
    • 确认数据已经全部复制。
  3. 把原来的存储系统重新格式化为ZFS/Gluster。
    • 再次确认数据已经全部复制。
  4. 把原始数据复制回原来的存储系统。
  5. 建立软连接,连接到原来的卷到新的存储系统主目录。
    • ln -s 新的目录 原来目录的链接名
      • 如:ln -s /zpool/data /home/supermap/data
    • 恢复原来的服务。

注意:

  • ⚠️不要出错,否则把原始数据搞丢了,就麻烦大了
  • 建议使用万兆(10Gbps)网络(存储节点使用万兆网卡,全万兆交换机连接)。
    • 网络存储传输带宽,理论上:
      • 百兆连接9MB/s。
      • 千兆连接90MB/s。
      • 万兆连接900MB/s。
      • 双万兆连接1600MB/s以上。
    • 推荐:双万兆端口网卡,双路互备、链路聚合。
  • 需要至少双倍于现有数据的存储空间。
    • 新的分布式存储启用镜像和副本,需要“数据容量X副本数量”的物理磁盘容量。

参考:

  • 万兆网与测试
    • Ubuntu测试-使用phoronix-test-suite
    • Ubuntu16.04 双网卡链路聚合
  • ZFS
    • ZFS快速安装和性能测试
    • Ubuntu上使用ZFS(Zettabyte File System)
    • 提升ZFS性能的10个简便方法
    • ZFS-最佳实践指南
    • ZFS-自我恢复RAID
  • GlusterFS
    • 安装 GlusterFS - 快速开始
    • Setting up GlusterFS Volumes
    • Intel 40G网卡与LSI MegaRAID驱动安装

转:https://my.oschina.net/u/2306127/blog/2865263



推荐阅读
  • 第二章:Kafka基础入门与核心概念解析
    本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统,以其卓越的性能和高吞吐量而著称。最初,Kafka被设计用于LinkedIn的活动流和运营数据处理,旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景,读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]
  • 手指触控|Android电容屏幕驱动调试指南
    手指触控|Android电容屏幕驱动调试指南 ... [详细]
  • 探究大数据环境下Kafka实现高性能的几个关键因素
    在大数据环境下,Kafka能够实现高性能的关键因素在于其独特的设计和优化策略。尽管Kafka的消息存储在磁盘上,这通常被认为会降低性能,但通过高效的文件管理和批量处理机制,Kafka能够在高吞吐量和低延迟之间取得平衡。此外,Kafka还利用了零拷贝技术、压缩算法和异步IO等手段,进一步提升了系统的整体性能。这些技术不仅保证了数据的可靠性和持久性,还使得Kafka成为处理大规模实时数据流的理想选择。 ... [详细]
  • 本文详细介绍了在Linux系统上编译安装MySQL 5.5源码的步骤。首先,通过Yum安装必要的依赖软件包,如GCC、GCC-C++等,确保编译环境的完备。接着,下载并解压MySQL 5.5的源码包,配置编译选项,进行编译和安装。最后,完成安装后,进行基本的配置和启动测试,确保MySQL服务正常运行。 ... [详细]
  • 在Linux系统中,通过使用`read`和`write`函数可以实现文件的高效复制操作。`open`函数用于打开或创建文件,其返回值为文件描述符,成功时返回一个有效的文件描述符,失败时返回-1。`path`参数指定了要操作的文件路径,而`oflag`参数则定义了文件的打开模式和属性。此外,为了确保数据的完整性和一致性,还需要合理处理文件读取和写入过程中的错误和异常情况。 ... [详细]
  • 数字图书馆近期展出了一批精选的Linux经典著作,这些书籍虽然部分较为陈旧,但依然具有重要的参考价值。如需转载相关内容,请务必注明来源:小文论坛(http://www.xiaowenbbs.com)。 ... [详细]
  • 在Java分层设计模式中,典型的三层架构(3-tier application)将业务应用细分为表现层(UI)、业务逻辑层(BLL)和数据访问层(DAL)。这种分层结构不仅有助于提高代码的可维护性和可扩展性,还能有效分离关注点,使各层职责更加明确。通过合理的设计和实现,三层架构能够显著提升系统的整体性能和稳定性。 ... [详细]
  • 小王详解:内部网络中最易理解的NAT原理剖析,挑战你的认知极限
    小王详解:内部网络中最易理解的NAT原理剖析,挑战你的认知极限 ... [详细]
  • Android中将独立SO库封装进JAR包并实现SO库的加载与调用
    在Android开发中,将独立的SO库封装进JAR包并实现其加载与调用是一个常见的需求。本文详细介绍了如何将SO库嵌入到JAR包中,并确保在外部应用调用该JAR包时能够正确加载和使用这些SO库。通过这种方式,开发者可以更方便地管理和分发包含原生代码的库文件,提高开发效率和代码复用性。文章还探讨了常见的问题及其解决方案,帮助开发者避免在实际应用中遇到的坑。 ... [详细]
  • 作为软件工程专业的学生,我深知课堂上教师讲解速度之快,很多时候需要课后自行消化和巩固。因此,撰写这篇Java Web开发入门教程,旨在帮助初学者更好地理解和掌握基础知识。通过详细记录学习过程,希望能为更多像我一样在基础方面还有待提升的学员提供有益的参考。 ... [详细]
  • 本文探讨了利用Python实现高效语音识别技术的方法。通过使用先进的语音处理库和算法,本文详细介绍了如何构建一个准确且高效的语音识别系统。提供的代码示例和实验结果展示了该方法在实际应用中的优越性能。相关文件可从以下链接下载:链接:https://pan.baidu.com/s/1RWNVHuXMQleOrEi5vig_bQ,提取码:p57s。 ... [详细]
  • 本文详细介绍了使用 Python 进行 MySQL 和 Redis 数据库操作的实战技巧。首先,针对 MySQL 数据库,通过 `pymysql` 模块展示了如何连接和操作数据库,包括建立连接、执行查询和更新等常见操作。接着,文章深入探讨了 Redis 的基本命令和高级功能,如键值存储、列表操作和事务处理。此外,还提供了多个实际案例,帮助读者更好地理解和应用这些技术。 ... [详细]
  • SSAS入门指南:基础知识与核心概念解析
    ### SSAS入门指南:基础知识与核心概念解析Analysis Services 是一种专为决策支持和商业智能(BI)解决方案设计的数据引擎。该引擎能够为报告和客户端应用提供高效的分析数据,并支持在多维数据模型中构建高性能的分析应用。通过其强大的数据处理能力和灵活的数据建模功能,Analysis Services 成为了现代 BI 系统的重要组成部分。 ... [详细]
  • 在拉斯维加斯举行的Interop 2011大会上,Bitcurrent的Alistair Croll发表了一场主题为“如何以云计算的视角进行思考”的演讲。该演讲深入探讨了传统IT思维与云计算思维之间的差异,并提出了在云计算环境下应具备的新思维方式。Croll强调了灵活性、可扩展性和成本效益等关键要素,以及如何通过这些要素来优化企业IT架构和运营。 ... [详细]
  • Spring框架中的面向切面编程(AOP)技术详解
    面向切面编程(AOP)是Spring框架中的关键技术之一,它通过将横切关注点从业务逻辑中分离出来,实现了代码的模块化和重用。AOP的核心思想是将程序运行过程中需要多次处理的功能(如日志记录、事务管理等)封装成独立的模块,即切面,并在特定的连接点(如方法调用)动态地应用这些切面。这种方式不仅提高了代码的可维护性和可读性,还简化了业务逻辑的实现。Spring AOP利用代理机制,在不修改原有代码的基础上,实现了对目标对象的增强。 ... [详细]
author-avatar
Annia000
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有