H85双机切换问题总结_3g2g切换与重选总结
H85双机切换问题总结由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“3g2g切换与重选总结”。
两台H85做的双机,业务在备节点上运行,双机不能正常切换
备节点上mail中有SRN 42521的报警,查看有关SSA的资料,上面解释是由于fast-write cache option card failed造成的,cache中的数据已经丢失,和这个a卡相连的disk都不能被识别了,处于offline状态(系统中的状态是free)
当时双机不能切换,我在想备节点上做些操作应该没什么影响,现实说明当时我是错的。于事按黄哥给我的步骤在备节点上执行如下步骤:
1,首先确定是由于cache_error操作引起的问题:
araid-l a0-Iz-state=cache_data_error;这个时候系统输出损坏的raid组信息,如下:2327340C228635K2327340C228635Kwrong_cache 36.4GB Raid-5 array
2,强制禁止fastwrite属性关闭,如下命令:
araid-l a0-H-n 2327340C228635K-a fastwrite=off-a force=yes-u
3,重新创建丢失的磁盘
araid-l a0-H-n 2327340C228635K-a use=syestem-K hdisk2-d
此时输出hdisk2 available的信息,表明hdisk2磁盘恢复成功,hdisk3同上.执行些完这些之后,主节点上的业务停了,在备节点上手动起来业务了(由于当时属于下班时间了,客户的应用只在白天用,所以就让我在那折腾,现在想起来还是一身冷汗,兄弟们引以为戒啊,老大要放过我啊,黄哥也别骂我啊)。
前几天才发现黄哥给我的SSA资料上有这个问题的描述,具体讲得就是如果在双机上执行关闭或打开enable fast-write cache功能的话,都必须要在另外一个节点上把认到的共享逻辑卷删除,再重新cfgmgr一遍。也不用把卷组export出去,直接重新扫描之后就会把共享的逻辑卷添加到原先的卷组中,这个当时也让我纳闷了一下,删掉之后还能自动认到以前属于的卷组。。后来想到,这个共享的卷组只是在主节点上删掉了在其odm库中的定义,并没有共享的逻辑卷上面的信息抹掉,上面的PVID和VGID应该还存在,重新扫描之后应该能自动添加到以前的卷组中。同步双机,没有报错。起双机,然后能够正常切换。。
兄弟们一定要注意啊,遇到类似的问题千万别像我一样,步骤都想好执行后的后果会是怎么样的,有什么影响。。最后希望各位兄弟干活一帆风顺。。手感倍儿棒,运气倍儿好。。
这是做之前我发给客户的,虽然当时不明白具体的原因,但是这样做也是正确的。。
(1)做好数据以及系统备份,并保证备份的可恢复性
(2)怀疑双机信息不同步
(3)停双机及业务
(3)exportvg 把共享卷组导出
(4)在主节点上把7133所认到的逻辑卷hdisk2~5删除
(5)cfgmgr –v重新扫描设备
(6)importvg 把共享卷组导进系统
(7)smitty hacmp同步双机信息
(8)起双机及业务,查看双机及业务运行状态
(9)切换测试,把双机切换到主节点,测试是否成功。