创意安天

 找回密码
 注册创意安天

怪异服务器故障带来的经验

[复制链接]
发表于 2010-3-18 10:15 | 显示全部楼层 |阅读模式
出处:51cto
最近遇到一个怪异服务器故障,费了好大劲才排除,现在拿来跟大家分享一下。
服务器故障现象

  一台Intel奔腾3/550服务器,近期频繁出现几次蓝屏幕死机故障。趁死机关闭的机会,将内存由原来的128M升级到512M(普通内存),并且在系统CMOS设置中选择装入(Load)最优参数设置,对内存每个单元进行检测。怪异服务器故障出现了,当我开机后,内存检测正常,但是屏幕提示须重新SETUP,按指定的[F2]键后却死机。我装个内存条招谁惹谁了,怎么会死机?而且内存检测正常啊?

  服务器故障处理

  服务器出了故障就要解决,哪怕是怪异服务器故障。按照缩小故障源的思路,换回原来的内存条,逐步去掉各个部分(软驱、硬盘、光驱等),可是这个怪异服务器故障依然存在。分析可能与系统SETUP设置有关,特别是关于对内存每个单元进行检测的设置。于是,拔出电池,对电池插脚短接放电,没有奏效。看来,这个怪异服务器故障还真是顽固。后来,找到主板清除 CMOS跳线设置,将插脚线由1-2改到2-3一会儿,然后恢复原位,开机正常(编者提示:不要轻易拔出电池,而是要找CMOS清除跳线)。再次将内存升级,调整CMOS SETUP设置,特别注意到对内存的检测,设置为检测到每兆,至此系统完全恢复正常。

  服务器故障经验

  后来我一分析,这个怪异服务器故障发生的根本原因是服务器的内存缺省设置为ECC(带校验),由于使用普通不带校验的内存,而系统中设置每个单元都进行检测,所以导致了上面的故障。排除的方法是清除CMOS设置,调整有关参数设置。另外,CMOSSETUP装入最优参数设置通常有2种:一种是 BIOS优化参数,这种参数稳定性最好;另一种是SETUP优化参数,优化整个系统,但是需要系统支持,其稳定性不能保证最好。所以,当系统出现故障时,不妨先将稳定性最好的参数装入,解决问题后再行恢复。
您需要登录后才可以回帖 登录 | 注册创意安天

本版积分规则

小黑屋|手机版|Archiver|创意安天 ( 京ICP备09068574,ICP证100468号。 )

GMT+8, 2024-4-28 06:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表