IDC机房应急预案手册_idc机房应急预案手册
IDC机房应急预案手册由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“idc机房应急预案手册”。
机房应急预案手册
一、机房事故处理通则
凡系统发生故障时,网管运行监控负责人必须立即组织抢修,不得拖延。
运行监控人员均应熟悉故障紧急处理流程,熟练掌握操作步骤和方法。
运行监控管理人员应如实上报故障情况,故障报告应当做到时间清、原因清、结果清。
重大故障和严重故障要报上级业务主管领导。对已处理的重大故障和严重故障,事后必须做故障分析,查清故障原因,确定故障性质和责任,采取防范措施,避免同类故障再次发生。
故障处理基本原则:先重点后一般;先调通后维修。
1、故障等级
网管系统的故障等级共分三类:
1.1 重大故障
在系统运行期间,关键设备(包括传输或其它专业所属设备)、软件故障造成所有网管业务中断超过24小时。
1.2 严重故障
在系统运行期间,关键设备(包括传输或其它专业所属设备)、软件故障造成下列情况之一的系统故障:
(1)所有网管业务中断超过12小时但不超过24小时;
(2)网管个别业务中断超过24小时;
1.3 一般故障
除重大故障和严重故障外的其他故障。
2、故障通报与通报制度
网管中心应建立相关设备故障处理联系制度,并将联系人和联系方法张贴在醒目位置。
网管中心应建立设备操作手册和故障处理流程,并存放在固定地点。
网管中心应建立设备运行情况统计和登记表,并存放在固定地点。
2.1 故障处理:
2.11、在系统发生故障时,值班人员应对照运行维护手册进行简单的故障处理和准确定位,对无法处理的故障应立即通知系统维护主管工程师,并逐级上报。系统维护主管工程师组织相关人员现场处理,故障处理完毕后,马上通知故障发起点,并进行详细记录。当系统发生故障时,网管中心运行维护负责人必须立即组织抢修,不得拖延。
2.12、在处理故障时,应严格按照故障处理流程进行,整个流程强调闭环管理,按先重点后一般;先调通后维修的原则进行。
2.13、在系统和设备故障处理的过程中,若出现较为严重或一时无法解决的问题,及时通知故障发起点,并立即向主管领导汇报,同时与厂家联系,及时争取技术支持,填写故障报告。
2.14、在系统设备故障处理过程中,若使用了备件单元或备用电路板,应按规定分别详细登记故障发生的工作单元、故障现象或故障代码、换用备件名称、编号,有条件时应附上当时的打印记录,向主管报告,并及时与备件管理人员取得联系,按正确的手续发送返修。
2.15、在相关专业部门或设备供应商进行抢修的过程中,网管中心应负责协调相关专业部门,采取其它措施对网络进行监控。
2.16、在相关专业部门或设备供应商进行抢修的过程中,网管中心应负责协调相关专业部门,采取其它措施对网络相关数据进行保存和统计。
2.17、网管中心在相关故障排除后48小时内提交故障分析报告。报告将视故障级别上报所在公司运行维护部和上级网管中心。
运行维护人员均应熟悉故障紧急处理流程,熟练掌握操作步骤和方法。2.2 故障通报:
当出现值班人员不能解决的故障时,值班人员应立即上报系统维护主管工程师和部门主管。
故障处理完毕一天内,系统主管工程师写出故障报告,上报部门主管,重大故障和严重故障要报上级业务主管部门。
当发生故障时,机房当班人员应将故障发生经过详细填写进《值班日志》。
如果网管系统出现严重故障,在故障发生后应在第一时间向上一级网管中心通报相关情况。
出现故障后,由网管中心指定专人向相关部门通报故障影响范围和处理情况等。
运行维护负责人应如实上报故障情况,故障报告应当做到时间清、原因清、结果清。
二、机房应急动力预案
1、机房停电故障 1.1 准备工作
1.11停电后第一时间电话咨询供电公司(电话号码)询问停电原因及停电时长。
1.12电话通知相关领导停电状况,如果在值班过程中停电需同事共同处理的也及时通知,在停电期间要保持通信畅通有问题及时联系。(领导电话)
1.13准备扳手、六棱起、数字万用表、“+”字“—”字螺丝刀各两把(大、小)等常用电工工具,准备好高压绝缘手套、绝缘鞋、专用扳手。
1.14以上3点工作尽量在最短时间内结束,然后针对故障原因作出相应处理。
1.2停电情况下处理方式
从供电公司确定完停电原因及停电时长后,确定停电时长是否在UPS负荷工作时间范围内:如果在UPS负荷工作范围内,密切观察UPS工作状态,所有设备正常工作;如果超出UPS工作范围内,向领导申请,存储信息,关闭机房设备,防止机房断电丢失数据。
1.3 市电恢复后的操作
1.所有设备恢复市电供电,检查设备的供电运行情况。
2、UPS故障处理
通州工商局机房UPS系统为2台OVERTOP RT30KH UPS 的并机系统.如30KVA UPS系统中一台UPS故障,系统自动将负载倒到另一台UPS上,如何关闭故障的UPS,如何再次开启UPS,如下:
关机
1、先将旁路转换开关打到“ON”的位置:
2、将UPS输出开关打到“OFF”位置
3、关掉UPS的开关,这时UPS停止运行;
4、关掉UPS输入开关,系统关机完毕。
开机
1、首先确认UPS的开关都打到“OFF”位置,配电柜的UPS输出开关也在“OFF”位置。
2、先把旁路转换开关打到“ON”的位置
3、分别将UPS的开关合闸;
4、当UPS面板指示为旁路供电状态时,再把旁路转换开关打到“OFF”位置这时,UPS转到正常工作模式,启动完成。
5、最后合上UPS输出开关,系统供电正常。
当关掉其中一台UPS在启动办法
1、先把旁路转换开关打到“ON”的位置
2、再把已关掉的UPS的开关分别打到“ON”的位置;
3、当两台UPS面板指示为旁路供电状态时,再把旁路转换开关打到“OFF”位置这时,两台UPS转到正常工作模式,启动完成
3、机房空调及局部过热故障的紧急处理方案
发生机房空调故障,会使机房的温度升高,危害设备正常运行。所以发生此类故障后,要积极维修,如果一时无法修复,必须采取应急措施,保障机房环境符合要求。
现在的机房空调一台艾赛尔精密空调,一台大金空调。
1、首先判断机房空调什么故障,如果压缩机故障,送风机工作正常,此时尽量将机房防静电地板掀开.增将出风口.如果是空调的送风机故障,不能正常送风,把邻近空调的送风口的格栅尽量调整,到故障空调前面的区域,这样才能的保障机房温度不至于上升。或者尽量将机房防静电地板掀开,增将出风口,或者拿普通的电风扇在故障空调的影响区域吹风,打开机柜门,冰块局部降温等措施防止局部升温过快。
2、机房局部设备温度上升过快或过热的处理步骤 首先将此设备的机柜门打开,让热空气充分散出,也可以用电风扇对此设备吹风,加快散热速度,购买冰块,放在大盆里,置于局部过热部位,利用冰块融化吸收热量,或者同时放置冰块并用电风扇吹。
三、机房防火预案
一、当发生火灾事故时,抢险工作应遵循如下原则:
1坚持“统一领导、分级负责、严密组织、密切配合、快速反应、保障有力”的原则。
2坚持快速恢复生产、减少经济损失的原则。
3坚持原则性与灵活性相结合的原则,注意讲究策略和方法。
二、消防安全管理基本原则:
1坚持“预防为主,防消结合”的原则。2坚持“谁主管、谁负责”的“两谁”原则。
IDC机房维保预防措施及应急预案IDC数据中心机房的安全无疑是整个计算机信息系统安全的前提,如果数据中心机房存在这样那样的不安全因素,从而导致发生数据中心机房事故,则整个信......
一、机房环境二、空调制冷三、线缆布局四、端口限速与流量监控五、网络安全 一、机房物理安全管理1、人员安全管理2、代维人员安全管理代维人员安全管理制度、交接班制度、......
一、人员出入IDC机房制度① 所有出入IDC机房的人员(包括客户,参观者等)都必须佩戴相关部门发放的机房出入证,无证者,恕不能进入IDC机房,多谢合作!② 进入IDC机房的所有人员必须穿戴......
廊坊电信机房坐落于素有“北京后花园”之称的河北省廊坊市金源道27号(公交车7路、18路均可直达),离北京的东三环仅30多分钟的车程。一、网络资源介绍1、光缆资源: 国家一干光缆......
篇1:idc机房月工作总结1 2011年11月工作总结一、idc的日常工作和巡检的自我总结:在日常巡检的过程中,认真仔细的检查动力机房的空调,ups,油机等数据,并认真做好巡检记录,与之前的巡......
