热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

oracle创建磁盘组报错ORA15137

asm扩容本来是件很简单的事,当asm磁盘准备好之后,直接一条命令就会添加上。但是也会有异常情况,最近就碰到19c在扩容的时候,报错的故障,供大家参考。集群处于ROLL

oracle 创建磁盘组报错 ORA-15137

  • 集群处于ROLLING PATCH模式
    • 背景
    • 收集信息
    • mos
    • 解决
    • 问题原因
  • 手动安装补丁,没有执行rootcrs.sh的脚本
    • 问题现象
    • 问题原因
    • 问题解决

asm扩容本来是件很简单的事,当asm磁盘准备好之后,直接一条命令就会添加上。但是也会有异常情况,最近就碰到19c在扩容的时候,报错的故障,供大家参考。


集群处于ROLLING PATCH模式

背景

某ERP数据库采用Oracle 19c RAC集群,部署架构为传统架构即两台计算节点外挂集中存储。ASM的DATA磁盘组空闲较小需扩容,执行对DATA磁盘组的扩容操作,但报错失败

image.png

报错ORA-15137.这个报错还没见过。我们通过完整的分析过程来展现分析思路。


收集信息

1、查看asm磁盘组现有状态

通过命令查询,ASM的DATA磁盘组用于存放数据文件;ARCH磁盘组用于存放归档文件。

其中DATA磁盘组总量2TB,目前还空闲可用约300GB;ARCH磁盘组总量1TB,目前空闲可用约700GB。

[root@erp1 ~]# su - grid
Last login: Fri Jan 15 15:37:01 CST 2021
[grid@erp1 ~]$ asmcmd
ASMCMD> lsdg
State Type Rebal Sector Logical_Sector Block AU Total_MB Free_MB Req_mir_free_MB Usable_file_MB Offline_disks Voting_files Name
MOUNTED EXTERN N 512 512 4096 1048576 1048576 716705 0 716705 0 N ARCH/
MOUNTED NORMAL N 512 512 4096 4194304 15360 14388 5120 4634 0 Y CRS/
MOUNTED EXTERN N 512 512 4096 1048576 2097152 323132 0 323132 0 N DATA/
ASMCMD>

在这里插入图片描述

2、查看磁盘(权限和属组)

1.通过lsblk命令查询,sdf,sdg,sdh,sdi均为1TB磁盘;

2.通过scsi_id命令查询磁盘ID;

3.通过查看99-oracle-asmdevices.rules文件,在1月14日进行了修改,将3604fe8d100d5d230b888210a00000038磁盘绑定了别名asm-data03。

4.在/dev目录下查看绑定状态正确无误。

[root@erp1 ~]# lsblk
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 558.7G 0 disk
├─sda1 8:1 0 1G 0 part /boot
└─sda2 8:2 0 557.7G 0 part
├─centos-root 253:0 0 493.7G 0 lvm /
└─centos-swap 253:1 0 64G 0 lvm [SWAP]
sdb 8:16 0 5.5T 0 disk
└─sdb1 8:17 0 5T 0 part /backup
sdc 8:32 0 5G 0 disk
sdd 8:48 0 5G 0 disk
sde 8:64 0 5G 0 disk
sdf 8:80 0 1T 0 disk
sdg 8:96 0 1T 0 disk
sdh 8:112 0 1T 0 disk
sdi 8:128 0 1T 0 disk
up-0 252:0 0 5G 0 disk
up-1 252:1 0 5G 0 disk
up-2 252:2 0 5G 0 disk
up-3 252:3 0 1T 0 disk
up-4 252:4 0 1T 0 disk
up-5 252:5 0 1T 0 disk
up-6 252:6 0 5G 0 disk
up-7 252:7 0 5G 0 disk
loop0 7:0 0 4.3G 0 loop /media
up-10 252:10 0 1T 0 disk
up-12 252:12 0 5G 0 disk
up-13 252:13 0 5G 0 disk
up-16 252:16 0 1T 0 disk
up-20 252:20 0 5G 0 disk
up-21 252:21 0 1T 0 disk
up-23 252:23 0 1T 0 disk
up-24 252:24 0 1T 0 disk
up-25 252:25 0 1T 0 disk
up-26 252:26 0 1T 0 disk
[root@erp1 ~]#
[root@erp1 dev]# for i in `cat /proc/partitions|awk '{print $4}'|grep sd`;do echo "###$i: `/usr/lib/udev/scsi_id -g -u /dev/$i`";done
###sda: 3600508b1001cda76417cf02db9743e70
###sda1: 3600508b1001cda76417cf02db9743e70
###sda2: 3600508b1001cda76417cf02db9743e70
###sdb: 3600508b1001c7a0f06f5b4a9bf1cb976
###sdb1: 3600508b1001c7a0f06f5b4a9bf1cb976
###sdc: 3604fe8d100d5d230c0ebe3c90000001d
###sdd: 3604fe8d100d5d230c0ebe3f20000001e
###sde: 3604fe8d100d5d230c0ebe41c0000001f
###sdf: 3604fe8d100d5d230bc5ea3a50000001a
###sdg: 3604fe8d100d5d230bc5ea3ce0000001b
###sdh: 3604fe8d100d5d230bc5f19f80000001c
###sdi: 3604fe8d100d5d230b888210a00000038
[root@erp1 udev]# cd rules.d/
[root@erp1 rules.d]# ll
total 16
-rw-------. 1 root root 211 Jun 24 2020 56-nxup.rules
-rw-r--r--. 1 root root 1390 Jan 14 09:21 99-oracle-asmdevices.rules
-rw-r----- 1 root root 1653 Jun 30 2020 99-oracle-asmdevices.rules.old.bak
-rw-------. 1 root root 571 Jun 24 2020 99-ultrapath.rules
[root@erp1 rules.d]# cat 99-oracle-asmdevices.rules
KERNEL=="sd*", SUBSYSTEM=="block", PROGRAM=="/usr/lib/udev/scsi_id -g -u -d $devnode", RESULT=="3604fe8d100d5d230c0ebe3c90000001d", SYMLINK+="asm-ocr01", OWNER="grid", GROUP="asmadmin", MODE="0660"
KERNEL=="sd*", SUBSYSTEM=="block", PROGRAM=="/usr/lib/udev/scsi_id -g -u -d $devnode", RESULT=="3604fe8d100d5d230c0ebe3f20000001e", SYMLINK+="asm-ocr02", OWNER="grid", GROUP="asmadmin", MODE="0660"
KERNEL=="sd*", SUBSYSTEM=="block", PROGRAM=="/usr/lib/udev/scsi_id -g -u -d $devnode", RESULT=="3604fe8d100d5d230c0ebe41c0000001f", SYMLINK+="asm-ocr03", OWNER="grid", GROUP="asmadmin", MODE="0660"
KERNEL=="sd*", SUBSYSTEM=="block", PROGRAM=="/usr/lib/udev/scsi_id -g -u -d $devnode", RESULT=="3604fe8d100d5d230bc5ea3a50000001a", SYMLINK+="asm-data01", OWNER="grid", GROUP="asmadmin", MODE="0660"
KERNEL=="sd*", SUBSYSTEM=="block", PROGRAM=="/usr/lib/udev/scsi_id -g -u -d $devnode", RESULT=="3604fe8d100d5d230bc5ea3ce0000001b", SYMLINK+="asm-data02", OWNER="grid", GROUP="asmadmin", MODE="0660"
KERNEL=="sd*", SUBSYSTEM=="block", PROGRAM=="/usr/lib/udev/scsi_id -g -u -d $devnode", RESULT=="3604fe8d100d5d230bc5f19f80000001c", SYMLINK+="asm-arch01", OWNER="grid", GROUP="asmadmin", MODE="0660"
KERNEL=="sd*", SUBSYSTEM=="block", PROGRAM=="/usr/lib/udev/scsi_id -g -u -d $devnode", RESULT=="3604fe8d100d5d230b888210a00000038", SYMLINK+="asm-data03", OWNER="grid", GROUP="asmadmin", MODE="0660"

image.png

在这里插入图片描述

补充:

验证属组权限的,还有一个更快捷的方法,kfod,因为当我们创建磁盘组的时候,oracle就是调用kfod命令来发现磁盘的,如果能够被kfod识别,那这块盘就能够被oracle正确识别:

image.png

image.png

常用验证命令:

kfod status=true disks=all op=disks

3、查看asm alert日志,是否还有更多信息:

image.png

和前台界面报错一样,ORA-15137,再没有更多信息。

现在就是新加的这块盘没有问题,不管是os,还是oracle,都能够正常识别这块盘。按理说是可以正常扩容成功的,但是asm实例就是添加报错。


mos

现在只有查询官方文档了。看有没有蛛丝马迹。

通过报错关键词查询(ORA-15137: The ASM cluster is in rolling patch state.)

匹配文档: [OCI] Scale-up Failed in DBCS With ORA-15032: not all alterations performed, ORA-15137: The ASM cluster is in rolling patch state (Doc ID 2681040.1)

为两台计算节点补丁不一致,list of patches在计算节点1缺少一个, patch level值不一致。

1节点:

[grid@erp1 trace]$ /u01/app/19.3.0/grid/bin/kfod op=patches
---------------
List of Patches
===============
30869156
30869304
30894985
30898856
[grid@erp1 trace]$ /u01/app/19.3.0/grid/bin/kfod op=PATCHLVL
-------------------
Current Patch level
===================
3633918477
[grid@erp1 trace]$ /u01/app/19.3.0/grid/bin/crsctl query crs softwarepatch
Oracle Clusterware patch level on node erp1 is [3633918477].
[grid@erp1 trace]$ /u01/app/19.3.0/grid/bin/crsctl query crs activeversion -f
Oracle Clusterware active version on the cluster is [19.0.0.0.0]. The cluster upgrade state is [ROLLING PATCH]. The cluster active patch level is [724960844].
[grid@erp1 trace]$ /u01/app/19.3.0/grid/bin/asmcmd showclusterstate
In Rolling Patch
[grid@erp1 trace]$

2节点:

[grid@erp2 trace]$ /u01/app/19.3.0/grid/bin/kfod op=patches
---------------
List of Patches
===============
29517242
30869156
30869304
30894985
30898856
[grid@erp2 trace]$ /u01/app/19.3.0/grid/bin/kfod op=PATCHLVL
-------------------
Current Patch level
===================
1019803962
[grid@erp2 trace]$ /u01/app/19.3.0/grid/bin/crsctl query crs softwarepatch
Oracle Clusterware patch level on node erp2 is [1019803962].
[grid@erp2 trace]$ /u01/app/19.3.0/grid/bin/crsctl query crs activeversion -f
Oracle Clusterware active version on the cluster is [19.0.0.0.0]. The cluster upgrade state is [ROLLING PATCH]. The cluster active patch level is [724960844].
[grid@erp2 trace]$ /u01/app/19.3.0/grid/bin/asmcmd showclusterstate
In Rolling Patch

上述的state is [ROLLING PATCH],一般显示为state is [NORMAL]。此处已经异常。

可以看出两点:1、集群处于ROLLING PATCH模式;

2、对比发现,crs softwarepatch补丁信息不一致,而且kfod工具的补丁,2节点比1节点多一个补丁。

看起来是由于2个节点的补丁不一致,导致集群处于ROLLING PATCH模式导致的。那为什么会有补丁信息不一样的情况 哪?因为我们打补丁的时候,是通过opatchauto自动打的,而且是2个节点一起打的,经询问,打补丁的过程没有报错。这个就比较奇怪了。打算提个sr咨询下原厂,因为未来还要大批量的打补丁,这将是个隐患。

补充:这种查看补丁的方式还是第一次用,以前常用的都是opatch lspatches和opatch lsinventory来查看节点的补丁信息,如下:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

对比发现:两节点安装的RU是一致的。所以在此处,此方法查看补丁的方法是行不通的。

小结:通过命令和日志查询,发现在1月14日早9时,进行了udev绑定状态正常,进行了DATA磁盘组添加磁盘,报错失败。经过搜索查询,疑似为两台计算节点补丁不一致造成。目前数据库使用状态正常,管控应用使用状态正常。


解决

以下所有的操作都是在多余的补丁的那个节点操作的,即2节点操作

1、停止2节点数据库:shutdown immediate

2、 ./rootcrs.sh -prepatch

3、 ./patchgen commit -rb 29757256(29757256是节点二多余的那个补丁)

4、./rootcrs.sh -postpatch

执行完第三步会报错,按照MOS文档 2348013.1 处理

在这里插入图片描述

5、 ./rootcrs.sh -prepatch

6、./rootcrs.sh -postpatch

7、asmcmd进去,showclusterstate,在检查patch状态,从rolling变为normal

至此,添加asm磁盘正常。


问题原因

本次故障就是因为安装补丁的时候,由于未知原因,导致kfod这个工具的补丁不一致,集群处于ROLLING PATCH模式,识别asm磁盘都没有问题,但是会导致asm扩容失败。


手动安装补丁,没有执行rootcrs.sh的脚本

今天在测试环境,创建磁盘组的时候,报错了,虽然不知道问题是怎样产生的,但是最后解决了,特此记录以下。


问题现象

create diskgroup xxxxx;

ORA-15018: Diskgroup can not be created

ORA-15137: cluster in rolling patch


问题原因

猜测是因为打19.4.2的补丁的时候用的不是opatchauto打的,打的时候没有跑rootcrs.sh的脚本导致的


问题解决

如果下面命令查询2个节点命令不一致的话可以用下面的方法结决,可惜我的2个节点一致这个方法不行

crsctl query crs softwarepatch

crsctl stop rollingpatch

2个节点分别跑rootcrs.sh的脚本,问题得到解决

/crs/install/rootcrs.sh -prepatch

/rdbms/install/rootadd_rdbms.sh


If this is an Oracle Restart Home, as the root user execute:

/crs/install/rootcrs.sh -postpatch

在这里插入图片描述

参考:

[OCI] Scale-up Failed in DBCS With ORA-15032: not all alterations performed, ORA-15137: The ASM cluster is in rolling patch state (Doc ID 2681040.1)

Patching 12.2.0.1 Grid Infrastructure gives error CRS-6706: Oracle Clusterware Release Patch Level (‘748994161’) Does Not Match Software Patch Level (Doc ID 2348013.1)



推荐阅读
  • 本文介绍了如何清除Eclipse中SVN用户的设置。首先需要查看使用的SVN接口,然后根据接口类型找到相应的目录并删除相关文件。最后使用SVN更新或提交来应用更改。 ... [详细]
  • r2dbc配置多数据源
    R2dbc配置多数据源问题根据官网配置r2dbc连接mysql多数据源所遇到的问题pom配置可以参考官网,不过我这样配置会报错我并没有这样配置将以下内容添加到pom.xml文件d ... [详细]
  • 本文介绍了Windows Vista操作系统中的用户账户保护功能,该功能是为了增强系统的安全性而设计的。通过对Vista测试版的体验,可以看到系统在安全性方面的进步。该功能的引入,为用户的账户安全提供了更好的保障。 ... [详细]
  • PatchODAX8: ... [详细]
  • 安装mysqlclient失败解决办法
    本文介绍了在MAC系统中,使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中,可以解决安装mysqlclient失败的问题。同时,还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]
  • EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析
    本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程,并分析了其所需的资源容量。通过解决错误提示和调整内存大小,成功存储了波形数据。然后,讨论了储存环逐束团信号的意义,以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大,每天需要近250G,一年需要90T。然而,储存环逐束团信号具有重要意义,可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • 本文介绍了一种轻巧方便的工具——集算器,通过使用集算器可以将文本日志变成结构化数据,然后可以使用SQL式查询。集算器利用集算语言的优点,将日志内容结构化为数据表结构,SPL支持直接对结构化的文件进行SQL查询,不再需要安装配置第三方数据库软件。本文还详细介绍了具体的实施过程。 ... [详细]
  • DSP中cmd文件的命令文件组成及其作用
    本文介绍了DSP中cmd文件的命令文件的组成和作用,包括链接器配置文件的存放链接器配置信息、命令文件的组成、MEMORY和SECTIONS两个伪指令的使用、CMD分配ROM和RAM空间的目的以及MEMORY指定芯片的ROM和RAM大小和划分区间的方法。同时强调了根据不同芯片进行修改的必要性,以适应不同芯片的存储用户程序的需求。 ... [详细]
  • 本文介绍了如何在Azure应用服务实例上获取.NetCore 3.0+的支持。作者分享了自己在将代码升级为使用.NET Core 3.0时遇到的问题,并提供了解决方法。文章还介绍了在部署过程中使用Kudu构建的方法,并指出了可能出现的错误。此外,还介绍了开发者应用服务计划和免费产品应用服务计划在不同地区的运行情况。最后,文章指出了当前的.NET SDK不支持目标为.NET Core 3.0的问题,并提供了解决方案。 ... [详细]
  • OpenMap教程4 – 图层概述
    本文介绍了OpenMap教程4中关于地图图层的内容,包括将ShapeLayer添加到MapBean中的方法,OpenMap支持的图层类型以及使用BufferedLayer创建图像的MapBean。此外,还介绍了Layer背景标志的作用和OMGraphicHandlerLayer的基础层类。 ... [详细]
  • 广度优先遍历(BFS)算法的概述、代码实现和应用
    本文介绍了广度优先遍历(BFS)算法的概述、邻接矩阵和邻接表的代码实现,并讨论了BFS在求解最短路径或最短步数问题上的应用。以LeetCode中的934.最短的桥为例,详细阐述了BFS的具体思路和代码实现。最后,推荐了一些相关的BFS算法题目供大家练习。 ... [详细]
  • 概述H.323是由ITU制定的通信控制协议,用于在分组交换网中提供多媒体业务。呼叫控制是其中的重要组成部分,它可用来建立点到点的媒体会话和多点间媒体会议 ... [详细]
author-avatar
尛爱总_305
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有