热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PostgreSQL数据库备份与恢复操作过程记录

最近关注的研究课题:PostgreSQL大数据增量备份与恢复。欢迎有这方面资料/经验的盆友留下痕迹,希望能进一步交流。同时恳请看到的盆友帮忙传播,推介懂PostgreSQL的同学同事盆友给俺。谢了先!---------------下文为转述,如涉及版权,请与博主联系。一

最近关注的研究课题:PostgreSQL大数据增量备份与恢复。

欢迎有这方面资料/经验的盆友留下痕迹,希望能进一步交流。同时恳请看到的盆友帮忙传播,推介懂PostgreSQL的同学同事盆友给俺。谢了先!

---------------

下文为转述,如涉及版权,请与博主联系。

 

一、概述
此文档描述了Postgresql数据库备份方案, 当数据库发生崩溃时,如何利用备份恢复到崩溃前,保证数据库最少数据量丢失甚至不丢失;

 

二、备份恢复原理
运用在线备份以及即时恢复(PITR)原理,利用Postgresql 数据库的WAL(Write Ahead Logging )预写日志和基础备份( $PGDATA目录文件tar包 ),恢复到数据库崩溃前时间点,保证数据量最少丢失或者不丢失,如果数据库崩溃,我们就可以通过热备产生的备份文件data_bak.tar包 ($PGDATA目录文件tar包)和archive_command产生的WAL及我们自己备份的WAL(pg_xlog)来进行数据库的 recovery 。

 

三、在线热备
3.1 配置归档模式
配置归档需要编辑postgresql.conf文件,默认与/usr/local/pgsql/data/目录下
vi $PGDATA/postgresql.conf ,修改以下
archive_mode = on
archive_command = 'cp -i %p /home/postgres/archive/%f

注意:这里将WAL日志备份到 /home/postgres/archive 目录下,
pg_xlog/下的目录下可能还有未备份的数据,需要另外备份, 详见3.7。

3.2 重启动数据库
pg_ctl ?D $PGDATA stop
pg_ctl ?D $PGDATA sart

3.3 创建基础备份
postgres=# select pg_start_backup('bakup_test');

3.4 备份整个data目录 (tar方式)
tar cvf /database/pgdata/tbs1/pg_root/base_data.tar /database/pgdata/tbs1/pg_root/data

3.5 停止备份
postgres=# select pg_stop_backup();

3.6 切换日志
postgres=# pg_switch_xlog();

3.7 定期备份WAL新生成日志
如果单独通过archive_command来备份WAL的话, 能根本就做不到PITR, 因为pg_xlog/下面可能还有数据没有备份到archive_command指定的目录里;所以需要另外写脚本把/data/pg_xlog/下的WAL日志文件备份到预设的归档目录下,保证产生的WAL日志都已归档,这里写了个脚本,每五分钟执行一次
--每5分钟备份 (通过Crontab执行)
vi cp_pg_xlog.sh
cp -f /database/pgdata/tbs1/pg_root/data/pg_xlog/[0-9]* /home/postgres/archive/archive_bak2/

crontab ? e
*/5 * * * * /home/postgres/script/cp_pg_xlog.sh > /dev/null 2>&1

3.8 编写备份脚本hot_bak_post.sh (供参考)
附件:以上操作可以写个脚本,定时执行,热备脚本为 hot_bak_post.sh ,定时执行写在CRONTABL里,每周六零晨做一次BASE 备份。
脚本内容如下,参考
#/bin/bash#

CUR_DATE=`date +%Y%m%d`

export PGPORT=1921
export PGHOME=/database/pgdata/tbs1/pg_root
export PATH=/database/pgdata/tbs1/pg_root/bin:$PATH
export DATA_BAK_DIR=/home/postgres/archive/data_bak
export LOG_PATH=/home/postgres/archive/log
ARCHIVE_LOG="${LOG_PATH}/bak_pg_${CUR_DATE}.log"

echo "*************** Begin backup ,please wait *************************" |tee -a ${ARCHIVE_LOG}

psql -c "select pg_start_backup('backup_test');"

cd $PGHOME
tar cvf data_${CUR_DATE}.tar data
mv *.tar ${DATA_BAK_DIR}
psql -c "select pg_stop_backup();"
psql -c "select pg_switch_xlog();"
echo "Backup completed!"
~

说明:脚本已经测试,可以实现功能,目前还在完善中。

 

四、恢复
如果数据库崩溃,我们就可以使用热备产生的data_bak.tar包(即$PGDATA目录文件tar包)和archive_command产生的WAL
及我们自己备份的WAL(pg_xlog)来进行数据库的 recovery,以下实验模拟数据库崩溃时的恢复过程

4.1 创建一张测试表

psql -dmydb -Uskytf
mydb=> d
List of relations
Schema | Name | Type | Owner
--------+-------------+-------+-------
skytf | test2 | table | skytf
skytf | test_1 | table | skytf
skytf | test_3 | table | skytf

mydb=> create table test_backup (id int,remark varchar(32));
CREATE TABLE

mydb=> insert into test_backup values (1 ,'a');
INSERT 0 1
mydb=> insert into test_backup values (2 ,'b');
INSERT 0 1
mydb=> insert into test_backup values (3 ,'c');

mydb=> select * from test_backup;
id | remark
----+--------
1 | a
2 | b
3 | c
(3 rows)


4.2 停数据库
pg_ctl ?D $PGDATA stop


4.3 删除data目录
cd $PGDATA
rm -rf data

4.4 恢复备份
tar xvf ?f database/pgdata/tbs1/pg_root/data_bak.tar

4.5 修改pg_hba.conf,避免普通用户服务连接

4.6 清空/data/pg_xlog/目录下所有文件
rm ?r $PGDATA/pg_xlog/

4.7 创建/pg_xlog/及其下面的archive_status目录
mkdir -p /database/pgdata/tbs1/pg_root/pg_xlog/archive_status

4.8 在/data/目录下创建recovery.conf
vi database/pgdata/tbs1/pg_root/data/recovery.conf
写入以下行
restore_command = ' cp /home/postgres/archive/%f "%p"'

4.9 启动数据库
pg_ctl -D $PGDATA start
注意:切正常的话数据库就会自动应用WAL日志进行恢复
启动过程如有异常可以查看CSV日志,参数log_directory指定了日志目录(前提是你设置了日志记录功能);

4.10 查看数据库是否恢复
mydb=> d
List of relations
Schema | Name | Type | Owner
--------+-------------+-------+-------
skytf | test2 | table | skytf
skytf | test_1 | table | skytf
skytf | test_3 | table | skytf
skytf | test_backup | table | skytf
(4 rows)

mydb=> select * from test_backup;
id | remark
----+--------
1 | a
2 | b
3 | c
(3 rows)

4.11 库分析
vacuumdb -z -d mydb

至此,数据已成功恢复!

 

五、后续工作
5.1 清理脚本
由于备份的tar包会越来越大,后续可以写些清理脚本,例如只保留最近几个tar包,其它的都删除掉等;
5.2 由于WAL日志文件比较大,可以制定删除策略,定期删除备份目录WAL日志。


推荐阅读
  • 在Fedora 31上部署PostgreSQL 12
    本文详细介绍如何在Fedora 31操作系统上安装和配置PostgreSQL 12数据库。包括环境准备、安装步骤、配置优化以及安全设置,确保数据库能够稳定运行并提供高效的性能。 ... [详细]
  • 本文探讨了如何在Hive(基于Hadoop)环境中编写类似SQL的语句,以去除字段中的空格。特别是在处理邮政编码等数据时,去除特定位置的空格是常见的需求。 ... [详细]
  • docker镜像重启_docker怎么启动镜像dock ... [详细]
  • 本文详细介绍了 Linux 系统中用户、组和文件权限的设置方法,包括基本权限(读、写、执行)、特殊权限(SUID、SGID、Sticky Bit)以及相关配置文件的使用。 ... [详细]
  • 如何在SQL Server 2008中通过Profiler跟踪特定数据库及获取客户端信息
    本文介绍如何利用SQL Server Profiler工具来监控特定数据库的操作,并获取执行这些操作的客户端计算机名和账户名。步骤包括创建新的跟踪、配置跟踪属性以及设置列筛选器以精确过滤数据。 ... [详细]
  • 请看|间隔时间_Postgresql 主从复制 ... [详细]
  • 随着技术社区的发展,越来越多的技术爱好者选择通过撰写博客来分享自己的学习经验和项目进展。本文将介绍一个具体案例,即将一套原本运行于Windows平台的代码成功移植到Linux(Redhat)环境下的过程与挑战。 ... [详细]
  • 本文探讨了Web开发与游戏开发之间的主要区别,旨在帮助开发者更好地理解两种开发领域的特性和需求。文章基于作者的实际经验和网络资料整理而成。 ... [详细]
  • Windows 环境下安装 Git 并连接 GitHub 的详细步骤
    本文详细介绍了如何在 Windows 系统中安装 Git 工具,并通过配置 SSH 密钥实现与 GitHub 的安全连接。包括下载、安装、环境配置及验证连接等关键步骤。 ... [详细]
  • 当面临数据库清理任务时,若无删除或重建数据库的权限,可以通过编写SQL脚本来实现批量删除用户自定义的数据表和存储过程。本文将详细介绍如何构造这样的SQL脚本。 ... [详细]
  • iTOP4412开发板QtE5.7源码编译指南
    本文详细介绍了如何在iTOP4412开发板上编译QtE5.7源码,包括所需文件的位置、编译器设置、触摸库编译以及QtE5.7的完整编译流程。 ... [详细]
  • 深入理解SQL Server中的聚集与非聚集索引
    本文探讨了SQL Server数据库中两种主要的索引类型——聚集索引和非聚集索引,通过对比分析它们的特点及应用场景,旨在帮助读者更好地理解和利用这两种索引以优化查询性能。 ... [详细]
  • 在树莓派Ubuntu(ARM64)上安装Node.js
    本文详细介绍了如何在树莓派Ubuntu系统(ARM64架构)上安装Node.js,包括下载、解压、移动文件以及创建软链接等步骤。 ... [详细]
  • 一位女子向诸位神灵提问,探讨命运、爱情、正义等话题,揭示了人性和社会的多重面向。 ... [详细]
  • Android中解析XML文件的实践指南
    本文详细介绍了在Android应用开发中解析XML文件的方法,包括从本地文件和网络资源获取XML文件的不同途径,以及使用DOM、SAX和PULL三种解析方式的具体实现。 ... [详细]
author-avatar
淼淼L玖兰枢
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有