软件故障
首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。
电脑病毒的原因
系统软件的bug或漏洞造成的死机,
这种故障需要在判断硬件无故障后做出,
而且需要软件提供商提供帮助。
软件使用不当或系统工作压力过大,
可以请客户适当降低服务器的工作压力来看看是否能够解决
硬件故障
硬件冲突
电源故障或电源供电不足,
可以通过对比计算服务器电源所有的负载功率的值来作出判断。
硬盘故障(通过扫描硬盘表面来检查是否有坏道)
内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断)
主板故障(使用替换法来判断)
CPU故障(使用替换法)
板卡故障(一般是SCSI/RAID卡或其他PCI设备也有可能造成系统死机,
可用替换法判断处理)
注意:
系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检
查故障是否彻底解决。
首先分清导致服务器出故障的因素:
1、外部攻击
2、内部攻击
3、运维误操作
服务器宕机怎么办?
服务器故障应急预案
不管是外部攻击还是内部故障,备份好以及冗余措施,可以使宕机时间缩短到最低。
备份问题尽管听起来不可思议,但在实践中,不少企业并未建立起一套检验过的备份系统。
备份的意义在于危急时刻可以快速恢复或重建生产系统。
在企业网络中,经常出现的问题实际上是:
备份步骤的瑕疵导致并未完成正确的备份过程
由于有限的存储空间导致一定时间后因存储空间耗尽导致的随后备份失败
备份介质受损导致无法成功恢复
传统上,磁带因其低造价以及高存储密度使其成为了理想的备份介质。
然而,这种传统备份介质的几个致命缺点经常使其内含的数据变得不可存取:
丢失的磁带索引卡片
磁带介质在存储过程中容易受到外界磁场影响
介质本身损坏
介质读取过程中被读取设备损坏
此外,磁带备份介质本身存储在磁带仓库中,从仓库检索所需的备份磁
带、转移至数据中心并重新加载数据的时间消耗通常也是客观的。
即使有一套备份系统仍然是不能抵挡所有的意外事故的。
2014年,Samsung 数据中心的一场大火使其云服务暂停服务。如果没有异地备份,这场
大火将使其本地备份的恢复变得极为困难。
冗余对于突发性事件来说,尽快恢复,或者是持续的提供服务是非常重要的。
本月,
某知名支付公司因数据中心网络连接性故障导致了一段时间的服务中断。
如果有更好的冗余方案,此种事故的影响面将会得以降低,
甚至会化解为用户不可感知的内部事故。
大部分服务器都有两部独立的PSU(电源装置),任意一部PSU失效并不会影响其正常服务;
一般来说,服务器的两部PSU将连接到两路不同的电路
或不间断电源上以避免市电失效;
数据中心电源多数同时配备UPS(不间断电源)
和柴油发电机来避免发电公司未通知的停止供电服务导致的服务中断。网络亦然;
同时接入多路ISP(互联网服务提供商)线路,并对其进行独立布线,同时在多
条线路上宣告地址,便可使得网络服务的鲁棒性更高。
在系统的视角上,只有同时配置好的备份以及冗余方案,才能提高可用
性,避免非可控因素导致的长时间服务中断。
软件定制。
来源:抚顺市博远电子,如涉及版权问题请与我们联系。
TAG
软件定制,软件开发,瀚森HANSEN,辽宁,沈阳,抚顺