sqlnet文件格式导致侦听无法启动

今天凌晨接到某省的一个电话,数据库进行MC service guard的切换,但是切换过去后,发现侦听无法启动,启动时侦听报错信息为:

检查配置,网络,都没有问题,浮动IP也是启动在10.203.41.11上,但是侦听就是起不来,检查 […]

Continue Reading

用crs实现single instance的HA

数据库的高可用方案我们通常采用的是双机热备模式,一个机器跑主机,另一个机器进行standby。当发生故障的时候,故障机上的数据库被切换到备机,在备机上起浮动IP和数据库,对应用来讲是透明的,只是发生了短暂的切换。目前行业中常用的高可用软件如HP的Service Guard、IBM的HACMP,价格都 […]

Continue Reading

启动lnsr需要写tmp权限

今天凌晨被叫醒起来,某省的数据库db01坏了一个cpu,由于有HA架构的保护,切换到了db02,但是在db02上却无法启动侦听,以下是报错信息:

看报错很奇怪:Error listening on: (ADDRESS=(PROTOCO […]

Continue Reading

设置侦听IP鉴权一段时间后侦听挂死

某省的数据库时不时的发生侦听挂死的现象。我们来看看具体的情况: 当出现侦听挂死的时候,sqlplus登录会出现如下报错:

而此时,可以看到listener.log中的内容为: [crayon-664332af9f87923196370 […]

Continue Reading

ntp服务的安装

在rac环境中,会要求几个节点之间的时间差不能超时。一般如果超过30秒,节点很可能会重启。我们需要配置一个ntp时钟服务器,来给rac的各个节点进行时间同步。 在这里,我们以windows机器(192.168.1.189)做ntp server,以2台虚拟机上的rac节点(192.168.1.131 […]

Continue Reading

安腾平台的legato的lib link

某省新上安腾平台的oracle,备份软件是legato,首先在安腾的机器上安装了networker.pkg和nmo.pkg,配置好client后,发现备份失败。查/nsr/applogs/msglog.log发现:

对于这个报错,我已 […]

Continue Reading

swap空间不够导致连接侦听失败

早上4点多就被叫起来,说某现网的数据库侦听挂了。数据库连不上去,报以下的错误:

登录后检查数据库的侦听进程还在,检查lsnrctl status的状态也是正常。 检查侦听的log发现,有大量连接拒连: [crayon-664332af […]

Continue Reading

修改hosts后,rac通讯失败

今天收到个告警某省的一个数据库的一个节点down了,重启后,只能到started状态,数据库无法open,登录上去后,看到alertlog中:

当时第一个反映是gethostbyname failed 应该是主机名解析有问题了。但是p […]

Continue Reading

主机安全加固导致dp分发客户端失败

今年的315晚会,曝光了某省移动的一些违规操作后,移动集团公司对各地分公司都进行了安全检查。在进行一系列的安全加固操作后,我们发现,还是有部分之前很顺利的操作会受到影响。 问题的起因是这样的,某省的备份软件是HP的DP。DP能对数据库进行备份,也能对文件系统进行备份(这样的功能,我想一般的备份软件都 […]

Continue Reading

用hanganalyze解决row cache lock

今天某省的一位同事来说,在执行一个split分区的脚本时长时间没有响应。登录上去查看,手工执行了split脚本,发现确实会hang住:

检查该session的等待事件:

[…]

Continue Reading

rman备份发现坏块之后的处理

今天收到某省的备份发生失败的告警:

用dbv检查发现有至少有45个坏块:

经检查,发现这些坏块上没有任何数据对象: [crayon-664332afa766546044 […]

Continue Reading