crs只能启动一个asm实例

今天接到一个朋友的电话,说他有个客户rac安装的时候总是有问题。cluster软件已经装上,但是没法装数据库。由于网络环境比较差,无法远程,只能通过QQ来了解情况和诊断了。

一开始,先让对方运行crs_stat -t看看各个资源的状况:

发现在rac02上asm没起来,并且通过ps -ef 看asm的进程也不存在:

由于很多时候,特别是在虚拟机中,crs_start启动总是会有点问题,一般只要重启,都会解决该问题,于是尝试重启crs,用crs_stop -all和crs_start -all重启。

在启动的时候,报错了:

上面的报错中,关键的一句还是:rac02 : CRS-1019: Resource ora.rac01.ASM1.asm (application) cannot run on rac02。检查crs_stat -t,发现:

问题似乎是asm实例只能在一个节点上启动,要去看看asm的log了。

没有asm的bdump的log?!那就是似乎还没到crs去拉起asm实例的那一步了。于是继续往上追溯,去看看crs的log:

从log上看,应该是css的错误了,CSS,即Cluster Synchronization Services,根据文档的意思是说:Manages the cluster configuration by controlling which nodes are members of the cluster and by notifying members when a node joins or leaves the cluster. If you are using third-party clusterware, then the css process interfaces with your clusterware to manage node membership information.主要是负责节点间的控制和通信问题了。

尝试ping各个节点:ping rac01没问题,ping rac02没问题,ping rac01-priv没问题,ping rac02-priv没问题;尝试验证互信机制,尝试ssh rac01 date没问题,ssh rac02 date没问题,ssh rac01-priv date没问题,ssh rac02-priv date也没问题。

再次尝试用srvctl重启rac01上的asm,出现了很重要的报错信息:

根据PRKS-1009和CRS-0215,基本可以断定是网卡设置的问题了。用oifcfg检查:

问了一下,130和131网段是连存储的,和rac间的priv通信没关系。rac0x-priv是在253网段,因此不应该有eth2和eth3的配置。

用oifcfg del删除:

再次重启crs:

发现还有2个asm和nodeapp没停下来,用srvctl停:

再次启动:

搞定,可以继续安装rac数据库了!

相关文章

3条评论

  1. 根据PRKS-1009和CRS-0215,基本可以断定是网卡设置的问题了。用oifcfg检查:

    根据这个 怎么就能断定一定是网卡的问题呢?给个充分的理由先~~~

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据