Jun 11

[原]解决Failed 3 to bind listening endpoint错误 雷阵雨

linuxing , 21:24 , 基础知识 » 故障处理 , 评论(0) , 引用(0) , 阅读(13513) , Via 本站原创 | |
   今天收到客户的报障,一套两台部署了Oracle 10g R2 RAC的系统,其中一台主板损坏,更换的主板。但更换后,该机器CRS服务无法正常启动。经咨询,除因更换主板后,网卡MAC地址改变,而重新配置了网络外,本地配置没有做改动。

一、故障现象
到场后,才发现系统是:红帽 AS 4.0 Update 2的。从日志上看到如下报错:
引用
/var/log/messages:
Cluster Ready Services waiting on dependencies.Diagnostics in /tmp/crsctl.11059

再追踪到/tmp/crsctl.11059,有:
引用
Failed 3 to bind listening endpoint:(ADDRESS=(PROTOCOL=tcp)(HOST=prv2)

由此,怀疑是更换主板后,网络配置带来的影响。

二、故障解决
查看/etc/sysconfig/network-scripts/ifcfg-eth0和ifcfg-eth1文件,对比集群中另一台机器db02,IP设置正确;查看主机名,设置正确;查看/etc/hosts文件,发现只保留下面的信息:
引用
127.0.0.1               localhost.localdomain localhost

由于Oracle启动listener默然使用主机名对应,怀疑是hosts文件错误,导致主机名和IP对应失败。
从db02拷贝hosts的内容到本机:
引用
127.0.0.1       localhost.localdomain   localhost
# Public Network - (eth0)
219.142.7.143   ora01
219.142.7.144   ora02

# Private Interconnect - (eth1)
10.0.0.1   int-ora01
10.0.0.2    int-ora02

# Public Virtual IP (VIP) addresses for - (eth0)
219.142.7.201    vip-ora01
219.142.7.202    vip-ora02

重启init.crs服务:

# service init.crs start

启动正常,故障解决。
※后续:引起问题的原因,怀疑是Redhat的gnome网络配置工具,在配置网络信息后,把/etc/hosts文件恢复到初始状态,而丢失了RAC必须的主机名-IP配置关系表。但时间关系,没进一步深究。
Tags: , ,
发表评论
表情
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
打开HTML
打开UBB
打开表情
隐藏
记住我
昵称   密码   游客无需密码
网址   电邮   [注册]