您的当前位置:首页正文

计算机系统应急方案

2020-04-30 来源:易榕旅网
计算机系统应急方案

应急规划原则

应急规划关系到计算机系统使用的持续性,因此将重点放在防止 IT 服务中断,以及中断发生后的系统恢复方面。系统中断的范围可以从应用程序、系统或网络故障,一直到应用场所的完全消失。

应急规划需考虑的可能出现的灾难包括:  火灾/爆炸/破坏/被窃

 水灾/自然灾害/虫灾/建筑物毁坏  行业行动/意外损坏

 设备丢失或故障 - 计算、网络或环境控件  软件故障  数据丢失或损坏

应急规划使用风险管理原则来确定对服务的威胁,如设备故障或火灾。通过实施一些对策(如备用网络链接),能够排除系统设计中脆弱部分造成的威胁,从而限制威胁对信息服务所造成的影响。在出现重大威胁的情况下,用于保证 IT 系统持续性的应急规划必须提供在备用位置完整恢复服务的设施、知识和步骤。

电力故障:

信息服务在某些方面很大程度地取决于其他服务。电力故障的应急处理:信息中心这些主服务器的供电是非常重要的,考虑配备在线

式的10kva的UPS集中供电,可以保证机房断电后正常使用10小时。关键科室的电脑配备了后备式的UPS,可以保证15分钟的延迟使用。由后勤保障部保证服务的恢复即后备发电,协调保证关键计算机的供电。

灾难故障:

保证在发生各种不可预料的故障、破坏性事故或灾难情况时,能够继续提供计算机服务,确保业务系统的7x24小进不间断运行。信息中心对系统进行修复,必要时联系供应商。监狱采用人工方式进行管理,灾难恢复后补录到计算机系统中。

软件故障:

应用程序级别故障:24小时的电话支持。

I.工作站:

1.工作站上的客户端软件无法使用,记录出错的信息并判断. 2.重新以正确的用户角色登录软件. 3.检查工作站上的客户端软件是否遭到破坏.

4.检查工作站上的客户端软件与服务器的通讯是否畅通。 II.服务器

1.服务器端软件无法使用,查看任务管理器和事件日志,记录出错的信息并判断.

2.kill相应的服务器进程,并重新启动该服务器进程. 3.查看数据库连接是否正确. 4.查看数据库服务器是否运行正常.

操作系统级别故障:

I.工作站:

1.工作站频繁死机,性能低下,以及采取了针对应用程序级别故障的措施后仍然无效以及出现其它和操作系统相关的故障现象时,则应该考虑从操作系统层面进行故障查找.

2.首先用备用机器替换,保证正常的日常工作. 3.以安全模式进入操作系统,检查系统情况,查找原因.

4.对系统进行恢复,根据故障原因,采用删除和重装部分操作系统组件,全新重装系统,覆盖重装系统,用以前备份的可用镜像文件进行恢复. II.服务器:

1.经判断为服务器操作系统层面的故障后,在采取任何措施之前,应该备份故障服务器上所有相关数据,并确定通过备份数据可以至少把服务器恢复到故障发生时的初始状态(即保护现场),在确定任何一步操作有回复的途径之前,不应该进行该操作. 2.情况严重时启用备用服务器以系统服务不中断.

3.查看任务管理器,记录资源使用状况以及各个进程详细情况,以备后续判断.

4.查看事件日志,查看系统日志中的错误信息. 5.根据故障原因可能采取的部分恢复措施有: a.停止或者暂时停止部分系统服务以改善性能. b.Kill死锁的进程,再重新启动这些进程. c.备份注册表后,对注册表进行微调. d.删除部分引起故障的应用. e.在系统空闲时期重新启动服务器.

f.以上措施无效的情况下,考虑使用服务器应急修复盘进行修复操作.

g.最后的措施就是重新安装服务器操作系统.

主数据库故障:

1.视故障严重程度,启用备用服务器,提供应急的数据库服务. 2.查看跟踪日志文件和警告日志文件,详细记录错误号,进一步分析判断.

3.备份所有的数据库文件,重做日志,归档日志等,在确定每步操作可以有回复的途径之前,不宜进行该操作.

4.查看数据库参数文件,调适参数,特别注意客户进程数不能低于100.

5.查看操作系统的系统服务中的与SQL SERVER相关的数据库服务,

监听服务等是否正确启动,并重新启动这些服务. 6.以上措施无效,重新启动数据库.

7.如果为数据库数据文件损坏,则对使用数据库备份文件对数据进行回复操作.

8.以上措施无效,重建数据库,

9.以上措施无效,备份数据库文件,删除数据库,重建数据库,然后导入备份的数据库文件.

硬件故障:

工作站

1. 使用后备机器进行替换,保证日常工作的进行。

2. 使用插换法进行检查,确定故障部件,与供应商联系更换或维修。 服务器

1.马上使用备用服务器,是应用系统能够正常服务。 2.联系供应商进行售后服务。

网络故障:

(特指由于布线系统方面线路断离,接触不良,网络设备等故障而引起的院内局域网中断) 网络单点故障的应急处理:有一定的线路备份,特别是关键部位设置应急线路,必要时启动备份线路

线路断离:

1.更换跳线 2.更换信息点 网络设备故障:

1.更换备用网络设备,保证日常工作的进行。 2.联系供应商更换或维修。

因篇幅问题不能全部显示,请点此查看更多更全内容