作者:云海雨岛 | 来源:互联网 | 2023-05-28 10:06
我们在Cassandra集群上有增量备份.数据文件夹下的"备份"文件夹现在包含大量数据,其中一些文件包含数百万个文件.
根据文档:"DataStax建议在每次创建新快照时设置清除增量备份硬链接的过程."
我不清楚清除这些文件的最佳方法是什么.是否可以在创建快照时删除它们,还是应该删除超过特定时间段的文件?
我的想法是,为了安全起见,运行一个常规脚本来删除超过30天的文件:
find [Cassandra data root]/*/*/backups -type f -mtime +30 -delete
我太小心了吗?我们并不担心有很长的备份历史记录.
谢谢.
1> Andy Tolbert..:
你可能太小心了,虽然这并不总是坏事,但有很多考虑因素.一个好的模式是拥有多个快照(例如,每周快照返回到某个时间段)以及该时间段内的所有备份,以便您可以恢复到已知状态.例如,如果由于某种原因,您最近的快照因任何原因无效,如果您从那时起仍然拥有以前的快照+所有sstables,则可以使用它.
您可以在快照之后删除所有已创建的备份,作为执行快照刷新的操作并将所有sstables硬链接到快照目录.在删除旧快照和删除备份之前,只需确保您的快照实际发生并完成(这是一个非常可靠的过程,因为它是硬链接).
您还应该确保测试恢复过程,因为这会让您对所需内容有所了解.您应该能够从上一个快照还原自那时起备份的sstables.启动新群集并尝试从快照+备份中恢复数据,或者可以在测试环境中尝试此过程,这是一个好主意.
我想指出这篇文章:'Cassandra和Backups'作为备份和恢复cassandra的良好尝试.