本文发表在 rolia.net 枫下论坛两台机器硬件配置完全一样,windows 系统装在内主版集成的scsi controller上,另加一块LSI Megaraid 320-2x raid controller,只用了external channel 0, channel 1 闲置;320-2x的 firmware 升级到了最新。storage 是 Adaptec SC4100, 有一个shared bus 接口;sc4100提供内部termination; 两块320-2x 通过一个tri-link connecter 连到shared bus上, channel 0 都是terminater enable.
SCSI ID 配置:
node A 320-2x channel 0: 7
node B 320-2x channel 0: 6
SC4100 :15
disks : 2,3,4,5,8,9,10,11,12,13
10个disk建一个raid5,做quorum Z盘.
单独启动任一节点,都可以正常读写Z:
clustering 也装好了。
问题是:如果先启动节点A, 然后B,工作正常;启动后cluster也可以在节点A,B间切换。
但是如果先启动B,工作正常;再启动A, A可以通过scsi controller 检测,但是进入windows 系统时,B上的320-2x 会突然滴滴叫(好像也不是每次都叫,3次里有两次吧),cluster 会自动转到A(因为B的320-2x已经连不上storage了 ) 这时Z还是online(连在A),但是检查raid,会发现有一个disk failure.(盘肯定是好的,来回换过。) 通过rebuild可以修复,就是时间太长。
我感觉似乎和scsi id有关,因为B的id是6,如果运行正常后再加一个更高优先级7的设备,似乎就容易出问题。另一个可能是termination有问题, 不过很多设备不好找,象y cable, active terminator什么的。更多精彩文章及讨论,请光临枫下论坛 rolia.net
SCSI ID 配置:
node A 320-2x channel 0: 7
node B 320-2x channel 0: 6
SC4100 :15
disks : 2,3,4,5,8,9,10,11,12,13
10个disk建一个raid5,做quorum Z盘.
单独启动任一节点,都可以正常读写Z:
clustering 也装好了。
问题是:如果先启动节点A, 然后B,工作正常;启动后cluster也可以在节点A,B间切换。
但是如果先启动B,工作正常;再启动A, A可以通过scsi controller 检测,但是进入windows 系统时,B上的320-2x 会突然滴滴叫(好像也不是每次都叫,3次里有两次吧),cluster 会自动转到A(因为B的320-2x已经连不上storage了 ) 这时Z还是online(连在A),但是检查raid,会发现有一个disk failure.(盘肯定是好的,来回换过。) 通过rebuild可以修复,就是时间太长。
我感觉似乎和scsi id有关,因为B的id是6,如果运行正常后再加一个更高优先级7的设备,似乎就容易出问题。另一个可能是termination有问题, 不过很多设备不好找,象y cable, active terminator什么的。更多精彩文章及讨论,请光临枫下论坛 rolia.net