天下网吧 >> 无盘天下 >> 无盘故障 >> 正文

一例解决DELL无盘服务器故障导致客户机批量重启的案例

现在网吧都是用无盘的,无盘网吧服务器就显得非常重要了,如果无盘网吧服务器某些硬件出问题了,会导致网吧客户机批量出现问题甚至是整个网吧的客户机都陷入瘫痪状态,今天就来一起分享一个来自天下网吧论坛版主亲身经历的一件「一例解决DELL无盘服务器故障导致客户机批量重启的案例」:

早上接到某网吧反映,凌晨的时候网吧约半数客户机批量蓝屏后重启,但是重启后恢复了正常。

网吧用的是顺网2250+云更新1476,登入服务器后看,服务器已经启动49天,顺网服务和云更新服务都已经启动49天,状态里没有任何错误。打开系统日志,发现有报错, NTFS:系统未能将数据转储到事务日志。可能出现损坏现象。 ID57.  该日志竟然多达8w条,且每隔两三秒就增加一条。

初步怀疑是磁盘问题。但是日志中却没有更多信息。 为了定位是哪个硬盘有问题,采用排除法:

服务器系统和无盘服务正常,客户机重启后正常启动,服务器系统盘和镜像肯定没有问题(而且因为客户机有缓存,服务器镜像盘出问题,客户机也不会立即重启,据网管反映,所有机器是同时蓝屏重启的。),客户机大面积蓝屏重启(大约一半机器)应该跟游戏盘无关,游戏盘如果有问题应该只会造成游戏崩溃或报错。 那么如果硬盘有问题,应该是回写盘问题。 但是该网吧有5个回写盘,坏任意一个也不应该造成超过一半机器蓝屏重启。

打开硬盘哨兵后发现,硬盘健康度都很高,挨个点了一下,却发现一个奇怪的现象:5个回写盘都有大量的写入错误日志,最高的28940次写入错误,最低的也8340次!
一例解决DELL无盘服务器故障导致客户机批量重启的案例 
(注 Intel S3510健康度满着就是70%)

不可能5个回写盘都出问题了吧?于是怀疑系统或者别的硬件问题。
打开磁盘管理器,突然发现服务器上有2个系统盘!内容竟然是一样的,但是少了个回写盘。第二个系统盘里文件打开却都报错。
奇怪的问题来了:怎么会有2个系统盘? 当初回写盘我用的是动态磁盘格式,怎么会无缘无故变成基本磁盘里面还有2008的文件?

重启服务器到PE下,却发现只有一个回写盘。然后服务器启动,竟然又变成了只有一个回写盘。但是系统日志仍然增加了一条NTFS报错。

于是怀疑是SAS卡缓存造成的问题,因为Dell c2100用的H700的SAS卡,而且说明上该卡拔掉缓存不能使用,只能尝试禁用缓存。

开机Ctrl+R进入SAS配置,H700卡不能桥接,只能把物理盘虚拟成raid才能用。F2打开菜单只能在建立虚拟盘的时候选择是否启用缓存。只能选择Delete VD删除磁盘,将所有磁盘删除后,按F2选择Creat new VD重新创建磁盘. 创建磁盘的时候选中Advanced Settings高级设置,read policy选择 No Read Ah, write policy选Write-Through 表示关闭缓存,切记尽量不要修改别的参数,否则容易导致硬盘上的数据丢失!  全部创建完毕后重启,进入Windows2008,客户机开机,观察一小时没有再报错,问题解决。

本文来源:系统之家 作者:系统之家

声明
声明:本站所发表的文章、评论及图片仅代表作者本人观点,与本站立场无关。若文章侵犯了您的相关权益,请及时与我们联系,我们会及时处理,感谢您对本站的支持!联系Email:support@txwb.com,系统开号,技术支持,服务联系QQ:1175525021本站所有有注明来源为天下网吧或天下网吧论坛的原创作品,各位转载时请注明来源链接!
天下网吧·网吧天下