oracle 10g rac用的service guide 作为集群基础的软件
相关目录信息:
ORA_CRS_HOME=$ORACLE_BASE/10.2/crs
Ocr信息: /dev/vgdata/rrac_ocr_1 640 root:dba
其中一个节点,两块磁盘损坏,从另外一个节点拿了一块硬盘做的mirror,更改主机名,IP后,发现数据库crs无法启动;
一 检查crs日志
无任何日志产生,证明其没有对crs发起操作
二尝试手动启动crsctl start crs,报错,crsctl check crs进程,发现无法通信,检查os进程,ps-ef|grep –i d.bin,无有价值信息,进入/sbin/init.d start
Attempting to start CRS stack Failure at scls_scr_create with code 1 Internal Error Information: Category: 1234 Operation: scls_scr_create Location: mkdir Other: Unable to make user dir Dep: 2
sh -x /sbin/iinit.d start
检查操作系统日志:
/var/adm/messages /sbin/init.d/init.cssd[537]: /var/opt/oracle/scls_scr/rqtmsdb2/root/c***un: Cannot create the specified file. Startup will be queued to init within 30 seconds.
这个错误比较有意义,有文件不存在,那么检查目录,确实不存在,手动建立之;
三再次启动crs
crsctl start crs crsctl check crs CSS appears healthy CRS appears healthy EVM appears healthy
crs,evmd,cssd启动了,但监听,数据库无法启动
四 其实可以猜到后面的原因了,因为是mirror,所有和1有关的节点信息都得改成2,后面就比较繁琐了
检查alert_jkweb2.log:
syslog: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl
修改$ORA_CRS_HOME下的日志文件目录,再次启动crs,数据库还是无法启动.
检查监听参数文件:$ORACLE_HOME/network/admin/listener.ora
手动修改监听参数文件,数据库口令文件,参数文件
手动拉起数据库;
五 重启主机,crs又无法启动了,检查service guide:cmrunnode -v
发现pkg1 并未启动,手动拉起包,cmrunpkg –v –n jkweb1 pkg1
检查:
cmviewcl 检查crs状态: cd $ORA_CRS_HOME/bin ./crs_stat –t –v
检查数据库状态:srvctl status database –d db_name
一切正常,收工;有时觉得service guide是个好东西;