在oracle 11gR2 RAC中,oracle使用了SCAN(single client access name),在VIP的上面又加了一层网络管理,虽说方便了客户端,在RAC增加节点数量的时候,在客户端的tnsnames不进行改动,对于一个数据库服务多个应用服务器的场景提供了方便,但是,由于o […]
RAC打Patch遭遇PRKC-1002
同事在两节点的RAC上打oneoff patch,在其中一个节点上运行opatch apply,按理应该会自动检测并且分发到另外一个节点,进行patch,但是在分发到第二个节点的时候遇到了PRKC-1002的报错,此时,如果在另外一个节点运行opatch lsinventory也会报错,检测不到原来 […]
rac的clusterware安装完成之后vip无法ping通
今天同事遇到这样一个事情,安装完成clusterware之后,最后运行完root.sh之后,需要在rac2上运行vipca再次配置,在这一步骤却过不去。一起看了一下这个问题,送报错的log中有比较明显的提示:没有配置网关。 有了这个提示之后,就比较好处理,在linux上配置192.168.79.1为 […]
rac修改异步IO导致挂死
今天遇到个rac的异步IO的问题,环境是oracle 10201的双节点rac,存储使用ASM,机器是HP 的PA的机器,操作系统是11.23. 在udump下的日志中有大量的报错:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
oracle@rp8440a:/oracle/oracle/admin/gzxnh/bdump> cat gzxnh1_ora_19552.trc /oracle/oracle/admin/gzxnh/bdump/gzxnh1_ora_19552.trc Oracle Database 10g Enterprise Edition Release 10.2.0.1.0 - 64bit Production With the Partitioning, Real Application Clusters, OLAP and Data Mining options ORACLE_HOME = /oracle/oracle/product/10.2.0/db_2 System name: HP-UX Node name: rp8440a Release: B.11.23 Version: U Machine: 9000/800 Instance name: gzxnh1 Redo thread mounted by this instance: 1 Oracle process number: 0 Unix process pid: 19552, image: oracle@rp8440a Ioctl ASYNC_CONFIG error, errno = 1 |
看到这个报错,觉得很轻松,之前也遇到过,是orac […]
RAC ONE NODE
之前,一直对rac one node、Single Instance HA(SIHA)、Oracle Restart的概念没搞清楚,今天和 @jarodwang和@ricky_zhu聊了之后,才明白了其中的概念: SIHA = Oracle Restart = Oracle Grid Infrast […]
修改hosts后,rac通讯失败
今天收到个告警某省的一个数据库的一个节点down了,重启后,只能到started状态,数据库无法open,登录上去后,看到alertlog中:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
Mon Jun 15 15:38:28 2009 Errors in file /oracle/app/oracle/admin/fjmisc/udump/fjmisc2_ora_26950.trc: ORA-00603: ORACLE server session terminated by fatal error ORA-27504: IPC error creating OSD context ORA-27300: OS system dependent operation:gethostbyname failed with status: 3 ORA-27301: OS failure message: No such process ORA-27302: failure occurred at: sskgxpmyip2 ORA-27303: additional information: nodename FJ_DB02 Mon Jun 15 15:41:19 2009 Errors in file /oracle/app/oracle/admin/fjmisc/udump/fjmisc2_ora_27062.trc: ORA-00603: ORACLE server session terminated by fatal error ORA-27504: IPC error creating OSD context ORA-27300: OS system dependent operation:gethostbyname failed with status: 3 ORA-27301: OS failure message: No such process ORA-27302: failure occurred at: sskgxpmyip2 ORA-27303: additional information: nodename FJ_DB02 Mon Jun 15 15:42:37 2009 Errors in file /oracle/app/oracle/admin/fjmisc/udump/fjmisc2_ora_27147.trc: ORA-00603: ORACLE server session terminated by fatal error ORA-27504: IPC error creating OSD context ORA-27300: OS system dependent operation:gethostbyname failed with status: 3 ORA-27301: OS failure message: No such process ORA-27302: failure occurred at: sskgxpmyip2 ORA-27303: additional information: nodename FJ_DB02 Mon Jun 15 15:46:19 2009 Errors in file /oracle/app/oracle/admin/fjmisc/udump/fjmisc2_ora_27362.trc: ORA-00603: ORACLE server session terminated by fatal error ORA-27504: IPC error creating OSD context |
当时第一个反映是gethostbyname failed 应该是主机名解析有问题了。但是p […]
远程rac,比较难
下面的2张图是做远程rac(RAC on Extended Distance Clusters)的2种模式: 前者是host base的模式,近端数据库节点在读写的时候,同时读写近端和远端的存储,近端和远端的存储中的内容都是一模一样的;远端数据库节点在读写的时候也是一样,同时读写近端和远端的存储。这 […]
RAC的高可用也不是那么好用
oracle一直在“鼓吹”着他的rac是如何如何的高可用,如何如何的可以实现针对应用透明的failover,但是,在实际的使用过程中,要完全实现这样的透明,条件是何等的苛刻。 先从一次故障说起吧。某天中午正在吃饭的时候,突然接到电话做应用程序连接数据库挂死了,并且也在客户端测试连接数据库也是挂死,长 […]
关于rac的external table
今天有朋友在blog中问了这么一个问题,RAC环境中应用外部表(rac1上),如果把外部表设置并行度,在查询该外部表时是否会报错?,一开始就觉得如果是不是在共享存储,由于另一个节点访问不了directory设置的路径,因此会报错。测试结果也是如此: 在rac1的非共享存储上上创建一个用于测试的平面文 […]
tnsnames配置小结
listener.ora、tnsnames.ora和sqlnet.ora这3个文件是关系oracle网络配置的3个主要文件,其中listener.ora是和数据库服务器端相关,而tnsnames.ora和sqlnet.ora这2个文件不仅仅关系到服务器端,主要的还是和客户端关系紧密。 检查客户端or […]
sometime can connect to remote db
某省新业务数据库(192.168.1.1)实现独立组网后,在新业数据库通过dblink访问核心业务数据库经常报tns超时: SQL> select count(*) from icp@newdb_sid; select count(*) from icp@newdb_sid * ERROR at l […]
在rac 模式下维护的一些注意点
1、通过gv$session查询到的sid,serial#,然后进行alter system kill sesson ‘sid,serial#’,如果不是登陆在那个实例的机器上,会报session 不存在。 必须登陆到那个session所在的实例上,在那个实例上进行kill […]