作者:六尾11 | 来源:互联网 | 2023-09-06 16:40
存储工程师在维护存储时不小心把链接在数据库服务器的官交换机其中一台断电再加电5分钟内又断另一台,导致数据库服务器穿线I/O error数据库hang,我们的小DBA在处理问题的时候太暴力,直接kill smon process重启数据库,在open状态时遇到ORA-00600: internal error code, arguments: [kcrfr_update_nab_2],[0x7000003EF9D93F0], [2], [], [], [], [], []
当时我们的DBA就直接傻眼,我过接到这个case并查看相关日志文件,及oracle mos上的查询,解决方法如下,使用数据库的备份,直接回复到数据库hang那一时间点,并成功开库。
原因:主备光交在较短的时间断电,导致DB server I/O写错误,oracle relog 没有写成功,强行关、开库触发此错误,根据oracle mos及网络查询解决方法如下:
1.如果有备份,利用备份进行不完全恢复,跳过最后异常的redo,数据库resetlogs打开
2.如果没有备份,尝试使用历史的控制文件进行不完全恢复,或者直接跳过数据库一致性打开库.
3.互联网有人解决删除redo第二组成员数据库open成功(http://blog.itpub.net/16976507/viewspace-1266952/)
此问题的数据库版本是Orale 11.2.0.4 OS version RedHat 6.4, PC Sever IBM 3750,单机,由于此库是用于BI研究,对实时性要求不高,日志组只用1组member,也没无法实现哪位网友的方法,以后可以测试一下。