当前位置: 开发笔记 > 数据库 > 正文

Oracle教程：实例故障恢复

作者：白宇2502858015 | 来源：互联网 | 2017-05-12 15:07

调整实例恢复的持续时间：1.设置一些初始化参数影响恢复需要的refolog记录和数据块的数量；（新参数）FAST_START_MTTR_TARGET:指

调整实例恢复的持续时间：1.设置一些初始化参数影响恢复需要的refo log记录和数据块的数量；（新参数）FAST_START_MTTR_TARGET:指

MTBF：Mean-Time-Between-Failures两次故障之间的平均无故障时间
MTTR：Mean-Time-To-Recover故障恢复平均时间

故障分类：
1.SQL表达式引起的故障
BUG，非法数据，超过权限，配额限制
2.用户进程故障
断开连接，会话注销，用户进程BUG，PMON自动处理此故障
3.用户故障
人为清空、删除表
4.网络故障
断网
5.实例故障
断电，SMON进程处理此故障
6.介质故障
磁盘损坏，RMAN热备和dataguard容灾

内存结构
database buffer cache：存储从datafile中读取的blocks。数据由server process从数据文件读入database buffer cache，数据由DBWn进程从database buffer cache写入datafile；

redo log buffer：存储对数据库的任何改变，由LGWR写到redo logs

Large pool：可选组件，备份等需要使用的大内存

shared pool：存储已经解析的SQL表达式和PL/SQL过程，数据字典信息

java pool:存储java code和JVM

后台进程
DBWn（Database writer）：把database buffer cache的脏数据(即已修改的数据）写到datafile。

LGWR（Log writer）：把redo log buffer数据写到redo log files

SMON（System monitor）：自动实例恢复，恢复临时段的空间当不再使用时，合并零散空间。

PMON（Process monitor）：清理连接进程；回滚进程操作和资源。

CKPT(checkpoint) :把当前redo log信息同步到datafile和control files的头上。

ARCn（Archiver）：可选，把redo logs自动复制到其他地方。

用户进程
连接数据库的程序进程，如:sqlplus

服务进程
接收用户进程请求，处理请求。专有服务进程和共享服务进程

数据库文件
Datafile：数据的物理存储，至少一个。
Redo logs：存储数据改变，至少2组。
Control files：记录了数据库的状态，物理结构，RMAN预处理数据
Archive logs ：联机重做日志文件的物理备份。

initialization parameter file：Pfile文件，存储实例启动所需参数
Server initialization parameter file：SPfile文件，存储实例启动所需持久的参数,二进制文件。
Password file：存储能启动、停止和恢复数据库的特权用户的信息；二进制文件。可使用工具ORAPWD.EXE手工创建密码文件

动态视图
v$sga
v$sgastat
v$instance
v$process
v$bgprocess
v$database
v$datafile

large pool:用于Oracle备份和还原操作，I/O server processes，共享服务者（shared server）进程的会话内存。
配置large pool可以阻止RMAN在其它部件分配内存，RMAN用large pool进行备份和还原当你设置DBWR_IO_SLAVES或者BACKUP_TAPE_IO_SLAVES参数去模拟异步I/O时。如果2个参数都没设置，ORACLE会从local process memory分配备份缓冲区，而不是从shared pool。

如果large_pool_size参数被设置了，oracle会尝试去large pool获取内存。如果这个值不够大，oracle也不会尝试去shared pool获取缓冲区。如果没配置，oracle会分配共享内存缓冲区从shared pool。
如果orcle不能得到充足的内存，它就会从local process memory得到I/O缓冲区。而且会写信息到alert.log中，指出同步I/O被用于备份。

database buffer cache：用于存储大多数最近使用的数据块的区域，使用最近最少使用算法（LRU）去决定覆盖某些以用来容纳新的block。

DBWn：写修改过的数据到数据文件，以确保可以从datafile读取新的block到database buffer cache。周期性的同步database buffer cache和datafile（即把database buffer cache写回到datafile）。繁重的工作可配置20个DWBn进程，DBW0-DBW9，DBWA-DBWJ。

redo log buffer：是一个有对数据库改变信息的环形缓冲区，这些信息存储在redo entries。
redo entries包含需要重建或重做的信息，如INSERT、UPDATE、DELETE、CREATE、ALTER、DROP操作。redo entries用于数据库恢复，如果需要的话。redo entries被server process从用户内存空间复制到redo log buffer。

LGWR：当redo log buffer三分之一满，当每3秒,当有1MB的redo信息，当在DBWn写修改过的数据到数据文件之前，当commit时，写redo log file。

checkpoint position：恢复开始的地方，联机重做日志文件里的一个点。
它是checkpoint queue的第一个entry的开始标志。
例如：checkpoint这一点之前的redo log数据已被写到数据文件里。

checkpoint queue：内存中的队列链表。
checkpoint queue里的每个entry包含数据块的标识和与之相关的redo entry的信息。这样的一个entry被称为RBA（redo byte address）。DBWn读取checkpoint queue的一个entry写入数据文件后删除这个entry。

checkpoint的类型
FULL checkpoint：全checkpoint，把所有的buffer都写入数据文件。当shutdown normal，immediate，transactional和alter system checkpoint时发生。

Incremental checkpoint：增量checkpoint，周期性写，闲置时写。

partial checkpoint：部分checkpoint，，写表空间的脏数据。当alter tablespace begin backup和alter tablespace xxx offline normal。

CKPT:在检查点发生时通知DBWn进程去写datafile后，更新datafiles和control files的头去指出最近的checkpoint。每隔3秒，CKPT记录检查点队列里面的第一个entry的RBA信息到控制文件中。只有在日志切换的时候，CKPT才会更新数据文件的头，为了提高性能不会马上更新所有的头，而是“懒写”。日志切换时不会把所有的脏数据写到磁盘。

control file：二进制文件，它描述了数据库的结构，当数据库处于mount或open状态的时候它必须能被数据库服务器来写。它的名字取决于操作系统。没有这个文件数据库不能被mount。推荐配置最少2个控制文件放在不同的磁盘以减少控制文件丢失带来的影响。控制文件损坏一个数据库就不能工作。控制文件包含数据库名字、数据库创建的时间戳，恢复所需的同步信息、数据文件和联机重做日志文件的名字和位置、数据库的归档模式、当前log sequence number、RMAN的备份元信息。

archived log file：用作media recovery。当被设置为归档模式时，LGWR进程会等联机重做日志文件被归档后才继续工作。

ARCn:可选进程。当被启动时，它会把redo log files拷贝到指定的存储区域。这个进程对7*24数据库的备份恢复有很大的意见。当日志切换时，ARCn进程被触发，把最近没归档的redo log组的一个成员拷贝到指定位置。

数据库同步：
1.所有数据文件（除了离线与只读的）必须被同步后数据库才能被open。
2.同步是基于当前checkpoint number。
3.发现不同步，数据库使用redo log files改变的记录同步数据文件
4.redo log files自动被数据库服务器请求。

实例恢复：
1.判断数据文件是否同步；
2.利用redo log前滚：写redo log files最近一个checkpoint之后的数据（包括undo数据）到数据文件；
3.数据文件现在包含提交的和未提交的改变，数据库可以被open；
4.利用undo log回滚未提交的改变：删除datafile中未提交的数据；
5.至此所有数据都提交。
不像media recovery，crash recovery和instance recovery是自动的。crash recovery是所有实例都恢复，instance recovery是单实例恢复。

调整实例恢复的持续时间：
1.设置一些初始化参数影响恢复需要的refo log记录和数据块的数量；
（新参数）
FAST_START_MTTR_TARGET:指定恢复时间最大值，单位为秒。
（2个老参数）
LOG_CHECKPOINT_TIMEOUT：2次检查点发生间隔的时间。
LOG_CHECKPOINT_INTERVAL:增量检查点与最近写到redo log的块之间的redo log file块的数目。
2.控制redo log file的大小和refo log块的大小来影响checkpoint发生的频率；
3.用SQL表达式手动强制检查点发生
4.并行恢复

实例恢复视图v$instance_recovery；
实例恢复优化
1.前滚：采用并行块恢复策略，recovery_parallelism可以设置并行进程数。
2.回滚：采用急需和并发2种恢复策略，fast_start_parallel_rollback可以设置并行程度，false为不使用并行，low：回滚进程数为CPU数的2倍，high：回滚进程数为CPU数的4倍。
回滚对应的2个视图：v$fast_start_servers：并发进程的信息；v$fast_start_transactions：需要回滚的transaction信息。

推荐阅读

数据库
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
insert
Windows服务与数据库交互问题解析

本文探讨了在Windows 10（64位）环境下开发的Windows服务，旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行，但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 10:30:14
database
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
数据库
PHP 5.2.5 安装与配置指南

本文详细介绍了 PHP 5.2.5 的安装和配置步骤，帮助开发者解决常见的环境配置问题，特别是上传图片时遇到的错误。通过本教程，您可以顺利搭建并优化 PHP 运行环境。 ... [详细]

蜡笔小新 2024-12-27 19:05:41
insert
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
数据库
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
数据库
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
数据库
网络攻防实战：从HTTP到HTTPS的演变

本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程，探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]

蜡笔小新 2024-12-27 11:34:50
数据库
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
数据库
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
数据库
解决Hive启动时权限被拒问题

本文详细分析了Hive在启动过程中遇到的权限拒绝错误，并提供了多种解决方案，包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]

蜡笔小新 2024-12-26 19:14:29
数据库
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
数据库
使用Python在SAE上开发新浪微博应用的初步探索

最近重新审视了新浪云平台（SAE）提供的服务，发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用，并分享开发过程中的关键步骤。 ... [详细]

蜡笔小新 2024-12-26 13:36:52
数据库
MySQL 数据库迁移指南：从本地到远程及磁盘间迁移

本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移，包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机，以及解决迁移过程中可能遇到的问题。 ... [详细]

蜡笔小新 2024-12-26 13:21:38
数据库
深入浅出：Google工程师的算法学习指南

通过Google工程师的专业视角，带你系统掌握算法的核心概念与实践技巧。 ... [详细]

蜡笔小新 2024-12-26 16:49:25

白宇2502858015

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章