服务器硬件故障 分析
全面解析与应对策略
1、引言
服务器 重要性
硬件故障影响
2、常见故障类型分类
开机无显示
加电BIOS自检阶段故障
系统和软件安装阶段故障

操作系统启动失败
系统运行阶段故障
3、故障现象及其排除方法
开机无显示
加电BIOS自检报错
系统安装阶段故障
操作系统启动失败
系统运行阶段故障
4、故障排错基本原则
尽量恢复系统出厂配置
从基本到复杂
部件交换对比测试
5、 故障排除 需要收集信息
服务器信息
故障信息
6、硬件故障处理实际案例
实例一
实例二
7、相关问题与解答栏目
问题1:为什么服务器在保修期内出现故障时,建议联系售后工程师?
问题2:如何判断服务器电源是否损坏?
以上内容就是解答有关“ 服务器硬件故障分析 ”的详细内容了,我相信这篇文章可以为您解决一些疑惑,有任何问题欢迎留言反馈,谢谢阅读。
简述计算机的网络故障分类及其解决方法
网络故障极为普遍,故障种类也十分繁杂。如果把网络故障的常见故障进行归类查找,那么无疑能够迅速而准确的查找故障根源,解决网络故障。文章主要就网络常见故障的分类诊断进行了阐述。网络故障;常见故障;分类诊断;物理类故障;逻辑类故障在当今这个计算机网络技术日新月异,飞速发展的时代里,计算机网络遍及世界各个角落,应用在各行各业,普及到千家万户,它给人们可谓带来了诸多便利,但同时也带来了很多的烦恼,笔者对常见的网络故障进行了分类和排查方法的介绍,相信对你有所帮助。 根据常见的网络故障归类为:物理类故障和逻辑类故障两大类。
一、物理类故障
物理故障,一般是指线路或设备出现物理类问题或说成硬件类问题。
线路故障
在日常网络维护中,线路故障的发生率是相当高的,约占发生故障的70%。 线路故障通常包括线路损坏及线路受到严重电磁干扰。
排查方法:如果是短距离的范围内,判断网线好坏简单的方法是将该网络线一端插入一台确定能够正常连入局域网的主机的RJ45插座内,另一端插入确定正常的HUB端口,然后从主机的一端Ping线路另一端的主机或路由器,根据通断来判断即可。 如果线路稍长,或者网线不方便调动,就用网线测试器测量网线的好坏。 如果线路很长,比如由邮电部门等供应商提供的,就需通知线路提供商检查线路,看是否线路中间被切断。
对于是否存在严重电磁干扰的排查,我们可以用屏蔽较强的屏蔽线在该段网路上进行通信测试,如果通信正常,则表明存在电磁干扰,注意远离如高压电线等电磁场较强的物件。 如果同样不正常,则应排除线路故障而考虑其他原因。
端口故障
端口故障通常包括插头松动和端口本身的物理故障。
排查方法:此类故障通常会影响到与其直接相连的其他设备的信号灯。 因为信号灯比较直观,所以可以通过信号灯的状态大致判断出故障的发生范围和可能原因。 也可以尝试使用其它端口看能否连接正常。
集线器或路由器故障
集线器或路由器故障在此是指物理损坏,无法工作,导致网络不通。
排查方法:通常最简易的方法是替换排除法,用通信正常的网线和主机来连接集线器,如能正常通信,集线器或路由器正常;否则再转换集线器端口排查是端口故障还是集线器的故障;很多时候,集线器的指示灯也能提示其是否有故障,正常情况下对应端口的灯应为绿灯。 如若始终不能正常通信,则可认定是集线器或路由器故障。
主机物理故障
网卡故障,笔者把其也归为主机物理故障,因为网卡多装在主机内,靠主机完成配置和通信,即可以看作网络终端。 此类故障通常包括网卡松动,网卡物理故障,主机的网卡插槽故障和主机本身故障。
排查方法:主机本身故障在这里就不在赘述了,在这里只介绍主机与网卡无法匹配工作的情况。 对于网卡松动、主机的网卡插槽故障最好的解决办法是更换网卡插槽。 对于网卡物理故障的情况,如若上述更换插槽始终不能解决问题的话,就拿到其他正常工作的主机上测试网卡,如若仍无法工作,可以认定是网卡物理损坏,更换网卡即可。
二、逻辑类故障
逻辑故障中的最常见情况是配置错误,也就是指因为网络设备的配置错误而导致的网络异常或故障。
路由器逻辑故障
路由器逻辑故障通常包括路由器端口参数设定有误,路由器路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。
排查方法:路由器端口参数设定有误,会导致找不到远端地址。 用Ping命令或用Traceroute命令,查看在远端地址哪个节点出现问题,对该节点参数进行检查和修复。
路由器路由配置错误,会使路由循环或找不到远端地址。 比如,两个路由器直接连接,这时应该让一台路由器的出口连接到另一路由器的入口,而这台路由器的入口连接另一路由器的出口才行,这时制作的网线就应该满足这一特性,否则也会导致网络错误。 该故障可以用Traceroute工具,可以发现在Traceroute的结果中某一段之后,两个IP地址循环出现。 这时,一般就是线路远端把端口路由又指向了线路的近端,导致IP包在该线路上来回反复传递。 解决路由循环的方法就是重新配置路由器端口的静态路由或动态路由,把路由设置为正确配置,就能恢复线路了。
路由器CPU利用率过高和路由器内存余量太小,导致网络服务的质量变差。 比如路由器内存余量越小丢包率就会越高等。 检测这种故障,利用MIB变量浏览器较直观,它路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据,通常情况下网络管理系统有专门的管理进程,不断地检测路由器的关键数据,并及时给出报警。 解决这种故障,只有对路由器进行升级、扩大内存等,或者重新规划网络拓扑结构。
一些重要进程或端口关闭
一些有关网络连接数据参数得重要进程或端口受系统或病毒影响而导致意外关闭。 比如,路由器的SNMP进程意外关闭,这时网络管理系统将不能从路由器中采集到任何数据,因此网络管理系统失去了对该路由器的控制。 或者线路中断,没有流量。
排查方法:用Ping线路近端的端口看是否能Ping通,Ping不通时检查该端口是否处于down的状态,若是说明该端口已经给关闭了,因而导致故障。 这时只需重新启动该端口,就可以恢复线路的连通。
主机逻辑故障
主机逻辑故障所造成网络故障率是较高的,通常包括网卡的驱动程序安装不当、网卡设备有冲突、主机的网络地址参数设置不当、主机网络协议或服务安装不当和主机安全性故障等。
1.网卡的驱动程序安装不当。 网卡的驱动程序安装不当,包括网卡驱动未安装或安装了错误的驱动出现不兼容,都会导致网卡无法正常工作。
排查方法:在设备管理器窗口中,检查网卡选项,看是否驱动安装正常,若网卡型号前标示出现“!”或“X”,表明此时网卡无法正常工作。 解决方法很简单,只要找到正确的驱动程序重新安装即可。
2.网卡设备有冲突。 网卡设备与主机其它设备有冲突,会导致网卡无法工作。
排查方法:磁盘大多附有测试和设置网卡参数的程序,分别查验网卡设置的接头类型、IRQ、I/O端口地址等参数。 若有冲突,只要重新设置,或者更换网卡插槽,让主机认为是新设备重新分配系统资源参数,一般都能使网络恢复正常。
3.主机的网络地址参数设置不当。 主机的网络地址参数设置不当是常见的主机逻辑故障。 比如,主机配置的IP地址与其他主机冲突,或IP地址根本就不在于网范围内,这将导致该主机不能连通。
排查方法:查看网络邻居属性中的连接属性窗口,查看TCP/IP选项参数是否符合要求,包括IP地址、子网掩码、网关和DNS参数,进行修复。
4.主机网络协议或服务安装不当。 主机网络协议或服务安装不当也会出现网络无法连通。 主机安装的协议必须与网络上的其它主机相一致,否则就会出现协议不匹配,无法正常通信,还有一些服务如“文件和打印机共享服务”,不安装会使自身无法共享资源给其他用户,“网络客户端服务”,不安装会使自身无法访问网络其他用户提供的共享资源。 再比如E-mail服务器设置不当导致不能收发E-mail,或者域名服务器设置不当将导致不能解析域名等。
排查方法:在网上邻居属性或在本地连接属性窗口查看所安装的协议是否与其他主机是相一致的,如TCP/IP协议,NetBEUI协议和IPX/SPX兼容协议等。 其次查看主机所提供的服务的相应服务程序是否已安装,如果未安装或未选中,请注意安装和选中之。 注意有时需要重新启动电脑,服务方可正常工作。
5.主机安全性故障。 主机故障的另一种可能是主机安全故障。 通常包括主机资源被盗、主机被黑客控制、主机系统不稳定等。
排查方法:主机资源被盗,主机没有控制其上的finger,RPC,rlogin等服务。 攻击者可以通过这些进程的正常服务或漏洞攻击该主机,甚至得到管理员权限,进而对磁盘所有内容有任意复制和修改的权限。 还需注意的是,不要轻易的共享本机硬盘,因为这将导致恶意攻击者非法利用该主机的资源。
主机被黑客控制,会导致主机不受操纵者控制。 通常是由于主机被安置了后门程序所致。 发现此类故障一般比较困难,一般可以通过监视主机的流量、扫描主机端口和服务、安装防火墙和加补系统补丁来防止可能的漏洞。
主机系统不稳定,往往也是由于黑客的恶意攻击,或者主机感染病毒造成。 通过杀毒软件进行查杀病毒,排除病毒的可能。 或重新安装操作系统,并安装最新的操作系统的补丁程序和防火墙、防黑客软件和服务来防止可能的漏洞的产生所造成的恶性攻击。
三、结语
计算机网络技术发展迅速,网络故障也十分复杂,上述概括了常见的几类故障及其排查方法。 针对具体的诊断技术,总体来说是遵循先软后硬的原则,但是具体情况要具体分析,这些经验就需要您长期的积累了。 如果你是网络管理人员,在网络维护中的还需要注意以下几个方面:
第一,建立完整的组网文档,以供维护时查询。 如系统需求分析报告、网络设计总体思路和方案、网路拓扑结构的规划、网络设备和网线的选择、网络的布线、网络的IP分配,网络设备分布等等。
第二,做好网络维护日志的良好习惯,尤其是有一些发生概率低但危害大的故障和一些概率高的故障,对每台机器都要作完备的维护文档,以有利于以后故障的排查。 这也是一种经验的积累。
第三,提高网络安全防范意识,提高口令的可靠性,并为主机加装最新的操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞。
应用程序中的服务器错误。
故障分析硬件方面:一般来说,内存出现问题的可能性并不大,主要方面是:内存条坏了、内存质量有问题,还有就是2个不同牌子不同容量的内存混插,也比较容易出现不兼容的情况,同时还要注意散热问题,特别是超频后。 你可以使用MemTest 这个软件来检测一下内存,它可以彻底的检测出内存的稳定度。 假如是双内存,而且是不同品牌的内存条混插或者买了二手内存时,出现这个问题,这时,就要检查是不是内存出问题了或者和其它硬件不兼容。 软件方面:先简单说说原理:内存有个存放数据的地方叫缓冲区,当程序把数据放在其一位置时,因为没有足够空间,就会发生溢出现象。 举个例子:一个桶子只能将一斤的水,当放入两斤的水进入时,就会溢出来。 而系统则是在屏幕上表现出来。 这个问题,经常出现在windows2000和XP系统上,Windows 2000/XP对硬件的要求是很苛刻的,一旦遇到资源死锁、溢出或者类似Windows 98里的非法操作,系统为保持稳定,就会出现上述情况。 另外也可能是硬件设备之间的兼容性不好造成的。 几个例子例一:打开IE浏览器或者没过几分钟就会出现0x70dcf39f指令引用的0x内存。 该内存不能为“read”。 要终止程序,请单击“确定”的信息框,单击“确定”后,又出现“发生内部错误,您正在使用的其中一个窗口即将关闭”的信息框,关闭该提示信息后,IE浏览器也被关闭。 解决方法:修复或升级IE浏览器,同时打上补丁。 看过其中一个修复方法是,Win2000自升级,也就是Win2000升级到Win2000,其实这种方法也就是把系统还原到系统初始的状态下。 比如你的IE升级到了6.0,自升级后,会被IE5.0代替/运用腾讯浏览器/例二:在windows xp下双击光盘里面的“”文件,显示“0x77f745cc”指令引用的“0x”内存。 该内存不能为“written”,要终止程序,请单击“确定”,而在Windows 98里运行却正常。 解决方法:这可能是系统的兼容性问题,winXP的系统,右键“”文件,属性,兼容性,把“用兼容模式运行这个程序”项选择上,并选择“Windows 98/Me”。 win2000如果打了SP的补丁后,只要开始,运行,输入:regsvr32 c:\winnt\apppatch\。 右键,属性,也会出现兼容性的选项。 例三:RealOne Gold关闭时出现错误,以前一直使用正常,最近却在每次关闭时出现“0xffffffff”指令引用的“0xffffffff”内存。 该内存不能为“read” 的提示。 解决方法:当使用的输入法为微软拼音输入法2003,并且隐藏语言栏时(不隐藏时没问题)关闭RealOne就会出现这个问题,因此在关闭RealOne之前可以显示语言栏或者将任意其他输入法作为当前输入法来解决这个问题。 例四:我的豪杰超级解霸自从上网后就不能播放了,每次都提示“Oxf6”(每次变化)指令引用的“Oxff”内存不能为“read”,终止程序请按确定。 解决方法:试试重装豪杰超级解霸,如果重装后还会,到官方网站下载相应版本的补丁试试。 还不行,只好换就用别的播放器试试了。 例五:双击一个游戏的快捷方式,“Ox77f5cdO”指令引用“Oxffffffff”内存,该内存不能为“read” ,并且提示程序错误。 解决方法:重装显卡的最新驱动程序,然后下载并且安装DirectX9.0。 例六:一个朋友发信息过来,我的电脑便出现了错误信息:“0*772b548f”指令引用的“0*”内存,该内存不能为“written”,然后QQ自动下线,而再打开QQ,发现了他发过来的十几条的信息。 解决方法:这是对方利用QQ的BUG,发送特殊的代码,做QQ出错,只要打上补丁或升级到最新版本,就没事了。 例七:我的笔记本电脑用的XP系统,有时关闭网页时会弹出遇到问题需要关闭,然后有弹出0x03e7c738指令引用的0x03e7c738内存,该内存不能为read,请问是怎么回事?解决方法:先查杀一下病毒,另外如果你安装了浏览增强之类的软件,请卸掉。
内部服务器错误,如何解决??急用
我不知道你的具体错误是什么....
1、修改IWAM_Myserver帐号密码,在“开始”->“设置”->“控制面板”->“管理工具”->“计算机管理”中,“系统工具”->“本地用户和组”->“用户”里面,一个IWAM_Myserver(Myserver为本地计算机名)的帐号内,右键更改密码,更改为一个自定义的密码即可,假设为“1234”;2、修改IIS内部IWAM_Myserver帐号密码,在c:inetpubadminscripts目录下(IIS安装默认目录),输入:c:inetpubadminscripts> set w3svc/wamuserpass 1234.修改成功后,系统有如下提示wamuserpass: (string) ******3、在“开始”->“设置”->“控制面板”->“管理工具”->“计算机管理”中,“系统工具”->“本地用户和组”->“用户”里面,确认IWAM_My server用户只在GUEST组内,再在“本地用户和组”->“组”里面,右键点击Users组属性,添加进NT AUTHORITYAuthenticated Users和NT AUTHORITYInteractive两个用户成员,确定。 4、在IIS安装默认目录下输入:c:inetpub\adminscripts> -v将COM+程序的用户改回为IWAM用户,重新启动IIS Out-Of-process Pooled Applications应用程序,没有再报错了,再重启IIS,检查所有WEB站点服务,故障现象解除!至此,故障现象全部排除!通过此次故障的排查,得出几点需要注意的:1、事件日志的空间设置稍微放大一些,默认才512K,根据硬盘空间,适当放大一些,避免出现日志文件已满的情况;2、不要随便轻易清空事件日志中的事件记录,很多故障现象需要从这个里面下手找原因;3、所有返回的系统提示信息一定要注意仔细查看;4、IIS中的应用程序保护应为中或高,如为低,则所有ASP页面均以本地系统权限运行,安全性存在问题。 5、COM+程序的用户权限和用户启动权限很重要,应注意检查。 6、系统默认组有时有重要作用,不能轻易删除或修改。 7、系统重要文件(如SAM)不可轻易删除,应尽可能采取妥善的解决方法。 如使用外部程序修改注册表或SAM表信息以获得管理员权限。 而不要删除该文件。
发表评论