第一篇:平谷區(qū)教育城域網(wǎng)中心機房市電故障及維護應(yīng)急預(yù)案
平谷區(qū)教育城域網(wǎng)中心機房 市電故障及維護應(yīng)急預(yù)案
一、機房意外停電后,首先確定停電的范圍以及受影響的設(shè)備范圍。
二、確認(rèn)停電的范圍為本樓或片區(qū),應(yīng)立即打電話向后勤管理部門匯報。估算電力可能恢復(fù)的時間,并通知網(wǎng)絡(luò)中心相關(guān)人員及領(lǐng)導(dǎo)。
供電局值班電話:95598
三、操作步驟:
1.如果確認(rèn)停電的時間是在UPS后備時間50%內(nèi)(如后備時間為2小時,停電時間在1小時安全值內(nèi)),可以在UPS正常供電的時間內(nèi),等到電力恢復(fù)。
2.如果不能確認(rèn)在2個小時內(nèi)恢復(fù)供電,立即匯報給機房電源維護負(fù)責(zé)人和中心機房各設(shè)備的負(fù)責(zé)人到達(dá)現(xiàn)場。做好各設(shè)備的電源停電準(zhǔn)備。
(1)使用UPS供電,由于不知市電何時能恢復(fù)供電(或停電時間大于2小時),應(yīng)嚴(yán)格按操作手冊停掉不重要的大屏顯示設(shè)備、監(jiān)控設(shè)備、存儲和各應(yīng)用服務(wù)器的電源,只保證核心交換機和路由器的正常運行。
(2)使用UPS供電達(dá)到2小時,還不知市電何時能恢復(fù)供電,此時需關(guān)閉全部網(wǎng)絡(luò)設(shè)備,再關(guān)閉UPS的輸出。
3.如果配備了發(fā)電機,在UPS供電達(dá)到1小時后,市電還不能 恢復(fù)供電,并且機房服務(wù)器、核心交換機等重要設(shè)備不能斷電情況下,應(yīng)立刻調(diào)配發(fā)電機隨時做供電,切保機房重量設(shè)備正常運行。等待電力恢復(fù),電力恢復(fù)供電后轉(zhuǎn)第七條執(zhí)行。如果確認(rèn)停電的范圍僅在于本機房電源故障,立即匯報給機房電源維護負(fù)責(zé)人。
四、機房維護負(fù)責(zé)人將掉電的電源柜總空開和分空開的狀態(tài)處于下電狀態(tài)。并向主管領(lǐng)導(dǎo)匯報,等待市電重新供電。
五、將掉電的所有的設(shè)備電源狀態(tài)處于下電狀態(tài),以防止電源柜加電對設(shè)備的沖擊。
六、在等待市電供電的時候,相關(guān)機房管理維護人員共同研究商議設(shè)備恢復(fù)時操作步驟及注意的事項,并形成相關(guān)操作文檔。
七、市電恢復(fù)供電后,先不要急于給UPS加電,等待10—20分鐘后,再開始給UPS加電,以防止供電不穩(wěn)或再次掉電。
八、供電正常后,確定設(shè)備處于下電狀態(tài)后,打開電力柜的總開關(guān),并給UPS加電,打開UPS輸出開關(guān)。
九、根據(jù)設(shè)備加電順序,啟動分項空開。
十、設(shè)備加電順序: 1.IP交換機和SAN交換機; 2.交換設(shè)備正常后再給存儲加電;
3.存儲狀態(tài)檢查正常后,啟動主機(以上各設(shè)備務(wù)必按操作手冊的啟動順序上電)。
十一、設(shè)備啟動正常后,開始啟動數(shù)據(jù)庫。
十二、數(shù)據(jù)庫啟動正常后,開始啟動中間件服務(wù)器。
十三、中間件服務(wù)器正常后,啟動應(yīng)用程序。
十四、其它:
1.四、五、六點操作只適應(yīng)于機房沒有重要服務(wù)器、交換機等設(shè)備情況下,如果機房有重要設(shè)備不允許斷電下,第一把UPS后備時間延長,第二給機房配臺發(fā)電機組。
2.UPS主機及電池組要定期檢測保養(yǎng),發(fā)現(xiàn)電池電壓下降情況應(yīng)及時更換。
3.UPS在運行中顯示板由綠燈轉(zhuǎn)為紅燈并且有告警聲響,按下告警消聲鍵后觀察會不會再次出現(xiàn)告警聲,如果未再出現(xiàn)告警聲說明報警為假報警,如果還出現(xiàn)報警聲音要及時通知設(shè)備商處理。附:
一、PCM ONL 33系列不斷電電源供應(yīng)系統(tǒng)(UPS)主要操作
(一)UPS啟動: 1.配電柜送市電;
2.合S1(保險絲輔助開關(guān)); 3.合S3(輸入市電);
4.接上步間隔10秒鐘合S4(保險); 5.合S5(輸出);
6.關(guān)閉S1(保險絲輔助開關(guān));
7.控制面板:開啟UPS,先按下“ON”,再按下“Enter”進(jìn)行確定。
(二)UPS關(guān)閉:
1.關(guān)閉網(wǎng)絡(luò)設(shè)備、服務(wù)器等用電設(shè)備; 2.斷開S3(市電); 3.斷開S5(輸出);
4.斷開S1(保險絲輔助開關(guān)); 5.斷開S4(保險); 6.配電柜斷開市電開關(guān);
7.控制面板:關(guān)閉UPS,先按下“OFF”,再按下“Enter”進(jìn)行確定。8.關(guān)閉時間:
(1)市電停電,不知何供電,需關(guān)閉UPS;
(2)網(wǎng)絡(luò)設(shè)備調(diào)整長時間停用(2小時以上),需關(guān)閉UPS。
(三)UPS放電:
1.斷開S3(市電),使用電池組供電;開始放電電壓DC=392V左右。2.待充電壓DC降到360V再恢復(fù)市電供電; 3.接上步合S3(輸入市電)。4.放電時間:
(1)如果市電停電比較頻繁,可以不進(jìn)行放電操作;
(2)如果市電長時間不停電,則四個月左右進(jìn)入一次放電操作。
(四)客服聯(lián)系方式:
1.北京承乾偉業(yè)電子科技有限公司
2.章方強(***)付玉(***)焦慎連(***)
二.JB-QB_Ld128EN(M)火災(zāi)報警控制器(聯(lián)動型)主要操作
(一)報警主要顯示:
1.報警器上:主電工作(Power)、全局手動(Manual)、消音指示(Quiet)為綠燈;
2.報警器上:公共故障(Common Failure)、備電故障(Battery Failure)為桔黃色燈;
3.打印機輸出:日期、時間及主要故障
4.警鈴聲持續(xù)不斷,直至按下“消間指示”按鈕,可以消除鈴聲。
(二)報警器內(nèi)使用畜電池:
1.畜電池型號:WA-12M14AC(12V14AH/20HR); 2.建議:控制箱內(nèi)的畜電池每月進(jìn)行一次放電操作:
方法是:關(guān)閉市電,啟用電池,使用電池約半小時再重新啟市電,對電池進(jìn)行充電。3.畜電池維護工程師:
林玉春(***)
(三)消防系統(tǒng)安全檢查內(nèi)容:
1.鋼瓶內(nèi)安全氣壓為2.0~4.2(即綠色區(qū)域內(nèi))即為安全可以使用,當(dāng)指針指向紅色區(qū)域時,應(yīng)該重新加氣才可使用。2.鋼瓶氣體噴射有三種控制途徑:
(1)最南邊的手動閥控制,延時30秒,可以按下停止閥以停止噴射;(2)按下中間的控制箱內(nèi)的啟動閥,也可延時30秒,可以按下停止閥以停止噴射,此控制箱有手動、自動兩個鎖,現(xiàn)在置于自動處,沒有鑰匙,林工建議置于手動處;
(3)系統(tǒng)自動控制即右邊的控制箱,現(xiàn)在均設(shè)置為手動狀態(tài),以防止誤報行為的發(fā)生。3.檢查時間要求:
每學(xué)期至少檢查一次,及時更換畜電池以及色帶。
(四)機房換氣系統(tǒng): 1.空調(diào):
(1)空調(diào)均為立式柜機,室外機在南陽臺內(nèi);
(2)主要工作模式-大金、愛默生工業(yè)機房專用空調(diào),可連續(xù)工作;(3)當(dāng)大金、愛默生空調(diào)出現(xiàn)問題時,使用海爾空調(diào),待其修好后,仍使用大金、愛默生工業(yè)機房專用空調(diào) 2.新風(fēng)系統(tǒng):
(1)開關(guān)位于配電柜左側(cè),四聯(lián)開關(guān),分別為開、關(guān)、低、高;(2)新風(fēng)系統(tǒng)出氣窗在南墻上部頂棚內(nèi)。3.消防排汽系統(tǒng):
(1)開關(guān)位于門口左側(cè),與照明開關(guān)并列,左邊是開啟消防排汽系統(tǒng),右邊為關(guān)閉消防排汽系統(tǒng);
(2)消防排汽系統(tǒng)排汽風(fēng)機在南墻靠近消防汽瓶處。4.辦公區(qū)空調(diào):
(1)空調(diào)掛機位于中心機房北部外間西墻;(2)空調(diào)室外機在北樓道內(nèi)。
三、中心機房綜合布線系統(tǒng)簡介:
(一)強電部分:(詳見下面附圖)
1.中心機房設(shè)備用電是市電五線三相380伏接入,自北樓道頂部進(jìn)入中心機房,再經(jīng)墻體內(nèi)下至地面,經(jīng)防靜電地板下的線槽進(jìn)入配電柜;再到UPS系統(tǒng),然后返回配電柜,最終向各機柜供電。每個機柜配兩個地插座,在配電柜內(nèi)用兩個防漏電開關(guān)控制,外間辦公室 也提供兩個地插座。
2.中心機房內(nèi)的空調(diào)供電不經(jīng)過UPS系統(tǒng),由市電直接供電; 3.消防排汽系統(tǒng)風(fēng)楊也由市電直接供電;
(二)弱電部分:
1.1號機柜為城域網(wǎng)核心機房安全監(jiān)測系統(tǒng)設(shè)備(拼接器、視頻錄像機、環(huán)境監(jiān)測主機、保壘機、展示機)。
2.2號機柜上面是北京數(shù)字學(xué)校存放的兩臺服務(wù)器,下面是教委網(wǎng)站服務(wù)器(兩臺)及存儲服務(wù)器。
3.3號機柜六臺服務(wù)器(卡巴斯基、環(huán)境監(jiān)測虛擬機、備用服務(wù)器、FTP服務(wù)器、中學(xué)網(wǎng)絡(luò)電子閱卷服務(wù)器、小學(xué)網(wǎng)絡(luò)電子閱卷服務(wù)器)及一臺存儲服務(wù)器。
4.4號機柜六臺服務(wù)器(VMware服務(wù)器、環(huán)境監(jiān)測服務(wù)主機、備用服務(wù)器、RIIL服務(wù)器、備用服務(wù)器、備用服務(wù)器)及一臺備用存儲服務(wù)器。
5.5號機柜上面是網(wǎng)絡(luò)電子閱卷系統(tǒng)的兩人個網(wǎng)關(guān)及策略交換機(H3C S5500)服務(wù)器匯聚交換機(H3C S7510E),全部服務(wù)器的網(wǎng)線均匯聚到此機柜的配線架。
6.光纖接入在6號機柜,并由此連接網(wǎng)絡(luò)設(shè)備,下面是各室網(wǎng)絡(luò)信息點的配線架。
7.7號機柜上面是北京教育信息網(wǎng)的接入設(shè)備為(CISCO s6506),中間為城域網(wǎng)備份核心交換機(H3C S7506E),最下面為信息中心辦公及多媒體教室的匯聚交換機(H3C s5600)。8.8號機柜內(nèi)為城域網(wǎng)核心交換機(H3C S12508)及安全設(shè)備(流控-RG-EG 2000xe、防火墻-SANGFORAF-6020、負(fù)載均衡-SANGFORAD-6000),及電子巡考系統(tǒng)接入交換機(H3C S5800)。
9.9號機柜備用(為資源平臺系統(tǒng)備用)。
10.10號機柜為教委OA協(xié)同辦公系統(tǒng)服務(wù)器(兩臺)和校產(chǎn)服務(wù)器(一臺)。
11.0號機柜內(nèi)為中國電信接入設(shè)備專用。
12.中心機房內(nèi)全部網(wǎng)絡(luò)設(shè)備的硬件地址均在58.131.66.0/24網(wǎng)段,詳見配線架IP地址使用、分配列表;
13.中心機房外間辦公室地板下有電源插座和信息插座以供使用。
14.拼接屏的電源接在下面防靜電地板下,拿開地板可見。
第二篇:中心機房應(yīng)急預(yù)案
中心機房應(yīng)急預(yù)案
一、系統(tǒng)故障應(yīng)急流程
1.1 系統(tǒng)故障應(yīng)急流程說明
一、故障發(fā)生
值班人員可從以下途徑得知故障的發(fā)生: 1)值班人員通過報警系統(tǒng)告警發(fā)現(xiàn)故障 2)值班人員通過遠(yuǎn)程數(shù)據(jù)監(jiān)測發(fā)現(xiàn)故障 3)值班人員通過維護巡檢發(fā)現(xiàn)故障 4)系統(tǒng)用戶發(fā)現(xiàn)故障,報給呼叫值班人員
二、報障受理
值班人員發(fā)現(xiàn)系統(tǒng)故障發(fā)生后,立即響應(yīng),根據(jù)級別進(jìn)行應(yīng)急處理,并向相關(guān)領(lǐng)導(dǎo)報告系統(tǒng)故障情況。
三、信息研判
值班人員根據(jù)了解到的系統(tǒng)故障情況進(jìn)行分析判斷,以確定采用一般故障處理流程還是立即啟動系統(tǒng)突發(fā)故障應(yīng)急處理預(yù)案。
四、預(yù)案啟動
如需啟動應(yīng)急預(yù)案,則立刻通知相關(guān)領(lǐng)導(dǎo)小組,由相關(guān)領(lǐng)導(dǎo)小組啟動應(yīng)急預(yù)案,對系統(tǒng)突發(fā)故障應(yīng)急事件進(jìn)行全面管控處理。
五、資源確認(rèn)
系統(tǒng)突發(fā)故障應(yīng)急預(yù)案啟動后,首先是根據(jù)現(xiàn)場突發(fā)故障實際狀況、緊急程度、技術(shù)難度、備品備件等情況對相關(guān)資源(主要是參與人員)依據(jù)經(jīng)驗進(jìn)行調(diào)度和確認(rèn),主要有以下資源:
本單位相關(guān)技術(shù)支持人員 授權(quán)第三方公司技術(shù)支持人員; 故障設(shè)備相關(guān)廠家技術(shù)支持人員; 聘請的技術(shù)專家
六、預(yù)案執(zhí)行
按照既定的預(yù)案進(jìn)行突發(fā)事件處理和故障搶修,如遇到問題及時向相關(guān)領(lǐng)導(dǎo)小組匯報。
七、預(yù)案終止
預(yù)案的終止時間由故障現(xiàn)場技術(shù)人員根據(jù)現(xiàn)場的實際進(jìn)展情況,在與用戶單位有關(guān)部門協(xié)調(diào)后相關(guān)領(lǐng)導(dǎo)小組決定。
八、結(jié)果上報
預(yù)案中止后,相關(guān)預(yù)案參與人員將整個事件過程中所有收發(fā)信息、領(lǐng)導(dǎo)批示、事故調(diào)查報告、現(xiàn)場錄像、圖片等材料及時整理歸檔,并總結(jié)事件處理過程中的經(jīng)驗和教訓(xùn),修改、完善事件應(yīng)急預(yù)案。然后集中上報至相關(guān)領(lǐng)導(dǎo)小組。
1.2 系統(tǒng)故障應(yīng)急處理流程圖
機房應(yīng)急預(yù)案
3.1 機房漏水應(yīng)急預(yù)案
(1)發(fā)生機房漏水時,第一目擊者應(yīng)立即檢測漏水影響范圍,并及時報告相關(guān)領(lǐng)導(dǎo)小組。
(2)若空調(diào)系統(tǒng)出現(xiàn)滲漏水,值班人員應(yīng)立即安排停用故障空調(diào),清除機房積水,并及時聯(lián)系設(shè)備供應(yīng)方處理,同時啟動備用空調(diào),必要情況下可其它方式(通風(fēng)、冰塊降溫等)對服務(wù)器進(jìn)行降溫。
(3)若為墻體或窗戶滲漏水,值班人員應(yīng)立即采取有效措施確保機房安全,同時安排通知房屋產(chǎn)權(quán)方,及時清除積水,維修墻體或窗戶,消除 滲漏水隱患。
3.2 設(shè)備發(fā)生被盜或人為損害事件應(yīng)急預(yù)案
(1)發(fā)生設(shè)備被盜或人為損害設(shè)備情況時,使用者或管理者應(yīng)立即報告相關(guān)領(lǐng)導(dǎo)小組,同時保護好現(xiàn)場。
(2)相關(guān)領(lǐng)導(dǎo)小組接報后,通知用戶保衛(wèi)部門、相關(guān)領(lǐng)導(dǎo),一同核實審定現(xiàn)場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。
(3)值班人員應(yīng)當(dāng)積極配合公安部門進(jìn)行調(diào)查,并將有關(guān)情況向相關(guān)領(lǐng)導(dǎo)小組匯報。(4)相關(guān)領(lǐng)導(dǎo)小組安排相關(guān)技術(shù)人員及時恢復(fù)系統(tǒng)正常運行,并對事件進(jìn)行調(diào)查。值班人員應(yīng)在調(diào)查結(jié)束后三日內(nèi)書面報告相關(guān)領(lǐng)導(dǎo)小組。
3.3 機房長時間停電應(yīng)急預(yù)案
(1)接到長時間停電通知后,值班人員應(yīng)及時通過辦公系統(tǒng)、電話等發(fā)布相關(guān)信息,部署應(yīng)對具體措施,要求相關(guān)保障人員在停電前及時就位,檢查業(yè)務(wù)系統(tǒng)、保存數(shù)據(jù)。
(2)停電時間過長的,應(yīng)準(zhǔn)備充足燃油,并準(zhǔn)備租用電力公司發(fā)電車協(xié)助,保證系統(tǒng)正常運轉(zhuǎn)。3.4 通信網(wǎng)絡(luò)故障應(yīng)急預(yù)案
(1)發(fā)生通信線路中斷、路由故障、流量異常、業(yè)務(wù)系統(tǒng)故障后,操作員應(yīng)及時通知本單位相關(guān)系統(tǒng)管理員,經(jīng)初步判斷后及時上報值班人員和相關(guān)領(lǐng)導(dǎo)小組。
(2)值班人員接報告后,應(yīng)及時查清通信網(wǎng)絡(luò)故障位置,隔離故障區(qū)域,并將事態(tài)及時報告相關(guān)領(lǐng)導(dǎo)小組,通知相關(guān)通信網(wǎng)絡(luò)運營商查清原因;同時及時組織相關(guān)技術(shù)人員檢測故障區(qū)域,逐步恢復(fù)故障區(qū)與服務(wù)器的網(wǎng)絡(luò)聯(lián)接,恢復(fù)通信網(wǎng)絡(luò),保證正常運轉(zhuǎn)。
(3)事態(tài)或后果嚴(yán)重的,應(yīng)及時向相關(guān)領(lǐng)導(dǎo)匯報。
(4)應(yīng)急處置結(jié)束后,值班人員應(yīng)將故障分析報告,在調(diào)查結(jié)束后三日內(nèi)書面報告相關(guān)領(lǐng)導(dǎo)小組。
3.5 不良信息和網(wǎng)絡(luò)病毒事件應(yīng)急預(yù)案
(1)發(fā)現(xiàn)不良信息或網(wǎng)絡(luò)病毒時,信息系統(tǒng)管理員應(yīng)立即斷開網(wǎng)線,終止不良信息或網(wǎng)絡(luò)病毒傳播,并報告相關(guān)系統(tǒng)維護人員和相關(guān)領(lǐng)導(dǎo)小組。
(2)值班人員應(yīng)根據(jù)相關(guān)領(lǐng)導(dǎo)小組指令,采取隔離網(wǎng)絡(luò)等措施,及時殺毒或清除不良信息,并追查不良信息來源。
(3)事態(tài)或后果嚴(yán)重的,應(yīng)向總公司相關(guān)領(lǐng)導(dǎo)匯報。
(4)處置結(jié)束后 ,值班人員應(yīng)將事發(fā)經(jīng)過、造成影響、處置結(jié)果在調(diào)查工作結(jié)束后三日內(nèi)書面報告相關(guān)領(lǐng)導(dǎo)小組。
3.6 服務(wù)器軟件系統(tǒng)故障應(yīng)急預(yù)案
(1)發(fā)生服務(wù)器軟件系統(tǒng)故障后,值班人員應(yīng)立即組織啟動備份服務(wù)器系統(tǒng),由備份服務(wù)器接管業(yè)務(wù)應(yīng)用,并及時報告相關(guān)領(lǐng)導(dǎo)小組;同時安排相關(guān)責(zé)任人將故障服務(wù)器脫離網(wǎng)絡(luò),保存系統(tǒng)狀態(tài)不變,取出系統(tǒng)鏡像備份磁盤,保持原始數(shù)據(jù)。
(2)值班人員應(yīng)根據(jù)相關(guān)領(lǐng)導(dǎo)小組的指令,在確認(rèn)安全的情況下,重新啟動故障服務(wù)器系統(tǒng);重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復(fù);若重啟失敗,立即聯(lián)系相關(guān)廠商和上級單位,請求技術(shù)支援,作好技術(shù)處理。(3)事態(tài)或后果嚴(yán)重的,總公司相關(guān)領(lǐng)導(dǎo)匯報。
(4)處置結(jié)束后,值班人員應(yīng)將事發(fā)經(jīng)過、處置結(jié)果等在調(diào)查工作結(jié)束后三日內(nèi)報告相關(guān)領(lǐng)導(dǎo)小組。
3.7 黑客攻擊事件應(yīng)急預(yù)案
(1)當(dāng)發(fā)現(xiàn)網(wǎng)絡(luò)被非法入侵、業(yè)務(wù)內(nèi)容被篡改,應(yīng)用服務(wù)器上的數(shù)據(jù)被非法拷貝、修改、刪除,或通過入侵檢測系統(tǒng)發(fā)現(xiàn)有黑客正在進(jìn)行攻擊時,使用者或管理者應(yīng)斷開網(wǎng)絡(luò),并立即報告相關(guān)領(lǐng)導(dǎo)小組。
(2)接報告后,相關(guān)領(lǐng)導(dǎo)小組應(yīng)立即指令相關(guān)技術(shù)人員核實情況,關(guān)閉服務(wù)器或系統(tǒng),修改防火墻和路由器的過濾規(guī)則,封鎖或刪除被攻破的登陸帳號,阻斷可疑用戶進(jìn)入網(wǎng)絡(luò)的通道。
(3)值班人員應(yīng)及時清理系統(tǒng),恢復(fù)數(shù)據(jù)、程序,恢復(fù)系統(tǒng)和網(wǎng)絡(luò)正常;情況嚴(yán)重的,應(yīng)向總公司相關(guān)領(lǐng)導(dǎo)匯報,并請求支援。
(4)處置結(jié)束后 ,值班人員應(yīng)將事發(fā)經(jīng)過、處置結(jié)果等在調(diào)查工作結(jié)束后三日內(nèi)報告相關(guān)領(lǐng)導(dǎo)小組。
3.8 核心設(shè)備硬件故障應(yīng)急預(yù)案
(1)發(fā)生核心設(shè)備硬件故障后,值班人員應(yīng)及時報告相關(guān)領(lǐng)導(dǎo)小組,并組織查找、確定故障設(shè)備及故障原因,進(jìn)行先期處置。
(2)若故障設(shè)備在短時間內(nèi)無法修復(fù)值班人員應(yīng)啟動備份設(shè)備,保持系統(tǒng)正常運行;將故障設(shè)備脫離網(wǎng)絡(luò),進(jìn)行故障排除工作。
(3)值班人員故障排除后,在網(wǎng)絡(luò)空閑時期,替換備用設(shè)備;若故障仍然存在,立即聯(lián)系相關(guān)廠商,認(rèn)真填寫設(shè)備故障報告單備查。
(4)事態(tài)或后果嚴(yán)重的,應(yīng)向總公司相關(guān)領(lǐng)導(dǎo)匯報。
3.9 業(yè)務(wù)數(shù)據(jù)損壞應(yīng)急預(yù)案
(1)發(fā)生業(yè)務(wù)數(shù)據(jù)損壞時,值班人員應(yīng)及時報告相關(guān)領(lǐng)導(dǎo)小組,檢查、備份業(yè)務(wù)系統(tǒng)當(dāng)前數(shù)據(jù)。(2)值班人員負(fù)責(zé)調(diào)用備份服務(wù)器備份數(shù)據(jù),若備份數(shù)據(jù)損壞,則調(diào)用磁帶機中歷史備份數(shù)據(jù),若磁帶機數(shù)據(jù)仍不可用,則調(diào)用異地備份數(shù)據(jù)。
(3)業(yè)務(wù)數(shù)據(jù)損壞事件超過 X小時后,維護小組應(yīng)及時報告相關(guān)領(lǐng)導(dǎo),及時通知業(yè)務(wù)部門以其它方式開展業(yè)務(wù)。
(4)值班人員應(yīng)待業(yè)務(wù)數(shù)據(jù)系統(tǒng)恢復(fù)后,檢查歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)的差別,由相關(guān)系統(tǒng)業(yè)務(wù)員補錄數(shù)據(jù);重新備份數(shù)據(jù),并寫出故障分析報告,在調(diào)查工作結(jié)束后三日內(nèi)報告相關(guān)領(lǐng)導(dǎo)。
3.10 雷擊事故應(yīng)急預(yù)案
(1)遇雷暴天氣或接上級部門雷暴氣象預(yù)警,值班人員應(yīng)及時報告相關(guān)領(lǐng)導(dǎo),經(jīng)請示同意后關(guān)閉部分服務(wù)器,切斷電源,暫停內(nèi)部計算機部分網(wǎng)絡(luò)工作。
(2)雷暴天氣結(jié)束后,值班人員報經(jīng)相關(guān)領(lǐng)導(dǎo)小組同意,及時開通服務(wù)器,恢復(fù)停用的計算機網(wǎng)絡(luò)工作,對設(shè)備和數(shù)據(jù)進(jìn)行檢查。
(3)因雷擊造成損失的,值班人員應(yīng)會同相關(guān)部門進(jìn)行核實、報損,并在調(diào)查工作結(jié)束后三日內(nèi)書面報告相關(guān)領(lǐng)導(dǎo)小組。必要時,應(yīng)向總公司相關(guān)領(lǐng)導(dǎo)匯報。
四、機房動力系統(tǒng)應(yīng)急處理方案
在機房動力發(fā)生異常情況時,動力系統(tǒng)通??勺詣忧袚Q由備用電池提供機房設(shè)備的動力,在發(fā)生重大事故或自然災(zāi)害而無法短時間內(nèi)正?;謴?fù)機房動力的情況下,啟動機房動力系統(tǒng)應(yīng)急處理流程,采用應(yīng)急油機發(fā)電,確保用戶單位網(wǎng)點通信網(wǎng)絡(luò)能夠安全、高效和可靠地運行。具體流程見下圖: 監(jiān)控到機房動力異常告警 通知維護站赴現(xiàn)場,監(jiān)視動力系統(tǒng)電壓下降情況 停電時間超過備用電池的合適支撐時間? 否 是 通知相關(guān)部門協(xié)助排查動力系統(tǒng)故障 超過蓄電池允許放電電壓,立即啟動油機發(fā)電 動力恢復(fù) 關(guān)閉油機供電開關(guān) 關(guān)閉電源柜油機開關(guān) 關(guān)閉/拆除油機 市電供電/蓄電池充電正常 消障
當(dāng)發(fā)生長時間停電的動力系統(tǒng)故障時,搶修人員在機房現(xiàn)場實時測試記錄備用電池的放電情況,電池放電容量超過40%時,如果動力系統(tǒng)還沒有恢復(fù)正常供電,就用油機發(fā)電為機房提供動力。
動力系統(tǒng)恢復(fù)后立即對電池進(jìn)行均充。一天內(nèi)發(fā)生多次停電,放電容量在50%以下,均充轉(zhuǎn)浮充后,浮充時間不少于24小時。一次停電放電容量在50%~80%時,均充轉(zhuǎn)浮充后,浮充時間不少于48小時。
第三篇:中心機房火災(zāi)應(yīng)急預(yù)案
為規(guī)范本酒店網(wǎng)絡(luò)中心機房設(shè)備管理,提高處理酒店網(wǎng)絡(luò)突發(fā)事件的能力,形成反應(yīng)迅速的應(yīng)急工作機制,確保重要網(wǎng)絡(luò)設(shè)備和服務(wù)器硬件安全以及運行安全和數(shù)據(jù)安全,最大限度地減少突發(fā)事件造成的危害,特制定《網(wǎng)絡(luò)中心機房應(yīng)急預(yù)案及管理辦法》。
篇一:中心機房管理辦法
第一條 機房內(nèi)禁止明火禁止吸煙,機房內(nèi)的所有設(shè)備需要定期維護并做巡檢記錄、根據(jù)機房實際情況進(jìn)行清掃工作。
第二條 機房網(wǎng)絡(luò)設(shè)備維護由網(wǎng)絡(luò)管理員進(jìn)行,如發(fā)現(xiàn)機器故障應(yīng)及時排除故障,在遇到硬件三包范圍內(nèi)的故障時,應(yīng)及時聯(lián)系供應(yīng)公司上門或?qū)C器送供應(yīng)公司維修;
第三條 酒店員工必須嚴(yán)格遵守有關(guān)機房、設(shè)備及系統(tǒng)運行管理規(guī)定,不得在機房內(nèi)從事與系統(tǒng)管理、運行維護、系統(tǒng)安裝和調(diào)試等無關(guān)的工作;
第四條 做好防火、防雨、防濕、防盜工作,注意用電安全;機房內(nèi)的環(huán)境要每周檢查溫度、濕度、電力系統(tǒng)、是否滿足機房相關(guān)的標(biāo)準(zhǔn)要求。
第五條 機房內(nèi)的交換機和服務(wù)器系酒店運營的關(guān)鍵設(shè)備,任何人不得自行配置或更改其系統(tǒng)參數(shù)。
第六條 要做好機房的安全工作,對服務(wù)器的各種帳戶、密碼嚴(yán)格保密。
第七條 應(yīng)及時做好數(shù)據(jù)的備份工作,保證在系統(tǒng)發(fā)生故障時,數(shù)據(jù)能夠快速、安全的恢復(fù)。所有備份數(shù)據(jù)不得更改,并要求做到本地和異地分別備份保存。
第八條 為了確保本酒店網(wǎng)絡(luò)正常運行,每日對機房內(nèi)的設(shè)備進(jìn)行巡視,主要著重于服務(wù)器及網(wǎng)絡(luò)設(shè)備運行正常與否。
1、對機房里的溫度進(jìn)行調(diào)節(jié),如室內(nèi)溫度過高,調(diào)節(jié)空調(diào)對機房進(jìn)行有效的通風(fēng)。
2、查看交換機與防火墻及接入設(shè)備的工作狀態(tài),如發(fā)生異常,對其進(jìn)行及時有效的維護。
3、監(jiān)測網(wǎng)絡(luò)運行狀況。
第九條 除本酒店網(wǎng)絡(luò)管理員外,公司其他人員因工作需要進(jìn)入機房的,需網(wǎng)絡(luò)管理員陪同下進(jìn)入機房。
第十條 嚴(yán)禁帶外單位人員或無關(guān)人員進(jìn)入機房,確因工作需要,如:系統(tǒng)故障診斷和處理,設(shè)備維修維護、系統(tǒng)或設(shè)備安裝等進(jìn)入機房,必須由網(wǎng)絡(luò)管理員陪同進(jìn)入,配合項目的實施。
第十一條 進(jìn)入機房的設(shè)備應(yīng)在進(jìn)入機房前拆除外包裝,以保證機房環(huán)境的清潔和安
第十二條 嚴(yán)禁攜帶易燃、易爆、易腐蝕等危險性物品進(jìn)入機房。
第十三條 機房內(nèi)提供的UPS電源只允許為主機、服務(wù)器、網(wǎng)絡(luò)及存儲等核心設(shè)備供電,嚴(yán)禁安插其他設(shè)備,增加UPS電源供電負(fù)荷。
第十四條 嚴(yán)禁擅自切斷供電系統(tǒng),確因工作需要斷電時,首先應(yīng)做好相應(yīng)準(zhǔn)備工作,經(jīng)部門領(lǐng)導(dǎo)批準(zhǔn),然后給所有部門發(fā)放斷電或斷網(wǎng)通知,最后方可實施。
第十五條 機房內(nèi)安裝用電設(shè)備或有用電需求的項目時,必須經(jīng)過專業(yè)人員或設(shè)備提供商的安裝工程師進(jìn)行現(xiàn)場勘查,經(jīng)確認(rèn)在滿足或符合要求后工程才能實施。
篇二:中心機房突發(fā)事件應(yīng)急預(yù)案
第一條 機房突發(fā)事件包括網(wǎng)絡(luò)設(shè)備或服務(wù)器故障、自然災(zāi)害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。針對突發(fā)事件的預(yù)防措施如下: 建立安全、可靠、穩(wěn)定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統(tǒng);加強防火、防盜意識。
第二條 機房漏水應(yīng)急預(yù)案如下:
1、發(fā)生機房漏水時,第一目擊者應(yīng)立即通知機房管理人員。
2、若空調(diào)系統(tǒng)出現(xiàn)滲漏水,機房管理人員應(yīng)立即安排停用故障空調(diào),清除機房積水,并及時聯(lián)系設(shè)備供應(yīng)方處理,必要情況下可臨時用電扇對服務(wù)器進(jìn)行降溫。
3、若為墻體或窗戶滲漏水,機房管理人員應(yīng)立即采取有效措施確保機房安全,同時安排通知工程人員及時清除積水,維修墻體或窗戶,消除滲漏水隱患。
第三條 機房火災(zāi)應(yīng)急預(yù)案如下:
1、完善機房環(huán)境,確保機房放置滅火器;禁止攜帶易燃易爆物品進(jìn)入機房。
2、機房管理人員應(yīng)熟悉機房內(nèi)部消防安全操作和規(guī)則,了解消防設(shè)備操作原理,掌握消防應(yīng)急處理步驟、措施和要領(lǐng),懂得滅火的方法,會撲救初起火源。
3、一旦發(fā)生火災(zāi),迅速切斷機房電源,避免災(zāi)情的擴散,并迅速和保安部聯(lián)系必要時立即報火警。
第四條 機房停電應(yīng)急預(yù)案如下:
1、接到停電通知后,應(yīng)及時通過辦公系統(tǒng)、電話等發(fā)布相關(guān)信息,部署應(yīng)對具體措施,要求在停電前停止業(yè)務(wù)、保存數(shù)據(jù)。
2、機房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時,UPS電源能自動供應(yīng)服務(wù)器正常工作15分鐘以上,保證員工工作的數(shù)據(jù)及時保存。
第五條 通信網(wǎng)絡(luò)故障應(yīng)急預(yù)案如下:
1、發(fā)生通信線路中斷、流量異常等故障后,發(fā)現(xiàn)狀況的員工或部門領(lǐng)導(dǎo)應(yīng)及時通知網(wǎng)絡(luò)管理員。
2、網(wǎng)絡(luò)管理員了解情況后,迅速組織檢測故障區(qū)域,并作相關(guān)故障處理,逐步恢復(fù)故障區(qū)與服務(wù)器的網(wǎng)絡(luò)聯(lián)接,恢復(fù)通信網(wǎng)絡(luò),保證正常運轉(zhuǎn)。
第六條 服務(wù)器故障應(yīng)急預(yù)案如下:
1、機房管理人員每日檢查機房內(nèi)各服務(wù)器狀態(tài)。
2、定期備份數(shù)據(jù)服務(wù)器數(shù)據(jù)。并將備份資料拷貝到移動設(shè)備。服務(wù)器出現(xiàn)嚴(yán)重硬件故障時啟用備用服務(wù)器以保障正常運轉(zhuǎn)。
第四篇:ACC中央機房空調(diào)故障應(yīng)急預(yù)案
ACC中央機房空調(diào)故障應(yīng)急預(yù)案
一、目的
為有效避免ACC機房因空調(diào)停電造成ACC服務(wù)器非正常關(guān)機,同時降低由于非正常關(guān)機對ACC主數(shù)據(jù)庫的影響,特制定此預(yù)案。
二、適用范圍
本預(yù)案適用于南京地鐵大廈四樓ACC主機房(429房間)發(fā)生空調(diào)停機后,機房溫度超過標(biāo)準(zhǔn)溫度的情況。
三、具體流程 1.先期處置
清分監(jiān)控維護工班發(fā)現(xiàn)ACC主機房空調(diào)故障或ACC主機房的無線溫度報警器報警后,立即采取以下措施:
(1)檢查空調(diào)運行狀況,并對空調(diào)故障進(jìn)行嘗試性修復(fù),并且通知空調(diào)廠家(24小時:***)。(2)打開主機房大門,在主機房內(nèi)放置電風(fēng)扇輔助散熱。(3)在機柜內(nèi)放入溫濕度計,監(jiān)控機柜溫度。(4)電話告知部門領(lǐng)導(dǎo)及相關(guān)工程師。
(5)電話通知ACC承包商趕到現(xiàn)場進(jìn)行技術(shù)援助。2.應(yīng)急響應(yīng)及措施
清分監(jiān)控維護工班在應(yīng)急人員到達(dá)前,注意以下問題:
(1)繼續(xù)嘗試修復(fù)空調(diào)。
(2)關(guān)注機柜內(nèi)溫濕度計的溫度變化。
一小時后,空調(diào)廠家、ACC承包商和部門相關(guān)工程師趕到現(xiàn) 場后立即展開行動:
(1)空調(diào)廠家進(jìn)行空調(diào)故障搶修。
(2)ACC承包商對ACC主機房內(nèi)的設(shè)備進(jìn)行檢查,做好溫度過高需要關(guān)機前的準(zhǔn)備工作。
(3)部門相關(guān)工程師做好現(xiàn)場協(xié)調(diào)和指揮工作。
當(dāng)機房內(nèi)溫度達(dá)到35度時,部門相關(guān)工程師立即電話部門領(lǐng)導(dǎo)申請主機房內(nèi)所有設(shè)備正常進(jìn)行關(guān)機(如溫度在應(yīng)急人員未到位或在發(fā)現(xiàn)機房空調(diào)故障時已達(dá)到35度,由清分監(jiān)控維護工班立即電話部門領(lǐng)導(dǎo)及系統(tǒng)管理工程師申請主機房內(nèi)所有設(shè)備正常進(jìn)行關(guān)機),經(jīng)領(lǐng)導(dǎo)同意后,采取以下措施:
(1)將數(shù)據(jù)接入服務(wù)器上的FTP服務(wù)和實時報文傳輸服務(wù)停止,同時電話告知票務(wù)中心ACC已經(jīng)中斷與所有線路的連接。(2)按以下順序進(jìn)行關(guān)機操作:首先關(guān)閉所有的PC服務(wù)器,然后關(guān)閉所有的磁盤陣列,再關(guān)閉所有的小型機和磁帶庫,最后關(guān)閉所有的網(wǎng)絡(luò)設(shè)備。
3.故障修復(fù)及后期處置
空調(diào)故障修復(fù)后,室內(nèi)溫度降至正常溫度后,清分監(jiān)控維護工班需要完成以下后期工作:
(1)將主機房內(nèi)的溫濕度計和電風(fēng)扇拿出主機房。
(2)電話告知部門領(lǐng)導(dǎo)空調(diào)故障已經(jīng)修復(fù),機房溫度正常,同時向部門領(lǐng)導(dǎo)申請主機房所有設(shè)備開機。ACC承包商需要完成以下工作:(1)做好開機前的檢查工作。
(2)按正常開機順序開機,開機順序為:首先開啟所有的網(wǎng)絡(luò)設(shè)備,然后開啟所有的小型機和磁帶庫,再開啟所有磁盤陣列,最后開啟所有的PC服務(wù)器。
(3)將數(shù)據(jù)接入服務(wù)器上的FTP服務(wù)和實時報文傳輸服務(wù)開啟。
空調(diào)廠家完成最后一次空調(diào)檢查工作。
清分監(jiān)控維護工班對ACC系統(tǒng)的數(shù)據(jù)傳輸情況、客流監(jiān)視、設(shè) 備監(jiān)視等情況進(jìn)行檢查,如有問題,立即交由ACC承包商處理。
最后,清分監(jiān)控維護工班電話電話告知票務(wù)中心ACC已經(jīng)恢復(fù) 與所有線路的連接,然后由清分監(jiān)控維護工班工班長做一份故障分析報告,主要包括事情經(jīng)過、原因分析、應(yīng)急處理過程分析和預(yù)防建議等方面內(nèi)容,于次日交部門領(lǐng)導(dǎo)和部門相關(guān)工程師。
第五篇:IDC中心機房預(yù)防措施及應(yīng)急預(yù)案
IDC機房維保預(yù)防措施及應(yīng)急預(yù)案
IDC數(shù)據(jù)中心機房的安全無疑是整個計算機信息系統(tǒng)安全的前提,如果數(shù)據(jù)中心機房存在這樣那樣的不安全因素,從而導(dǎo)致發(fā)生數(shù)據(jù)中心機房事故,則整個信息系統(tǒng)的安全也就不可能實現(xiàn)。
隨著網(wǎng)絡(luò)信息化建設(shè)的不斷深入,加強機房各類設(shè)備、系統(tǒng)以及信息與網(wǎng)絡(luò)安全等方面應(yīng)對突發(fā)事件的處理能力將是我們目前面臨的一項重要任務(wù)。為確保系統(tǒng)及機房安全與穩(wěn)定,以保證正常運行為宗旨,按照“預(yù)防為主,積極處置”的原則,本著建立一個有效處置突發(fā)事件,建立統(tǒng)一指揮、職責(zé)明確運轉(zhuǎn)有序、反應(yīng)迅速處置有力的機房安全體系的目標(biāo),將正在發(fā)生或已發(fā)生事故的損害程度減輕到最低。
1、維保預(yù)防措施
1、建立健全機房維保技術(shù)人員管理制度
1.1在正常工作日內(nèi),信息技術(shù)人員負(fù)責(zé)對機房進(jìn)行監(jiān)控,主要職責(zé)是:巡視網(wǎng)絡(luò)設(shè)備及系統(tǒng)的運行情況,發(fā)生異常情況及時處理,消除故障隱患。
1.2周末、節(jié)假日及重大會議期間技術(shù)人員輪流值班,負(fù)責(zé)處理有關(guān)異常情況。
2、應(yīng)提高對機房可靠性、可用性、安全性等方面的認(rèn)識,既要重視信息系統(tǒng)安全,又要重視機房的運行維護管理,重視對計算機硬件、軟件及網(wǎng)絡(luò)設(shè)備的維護。要樹立大局意識和憂患意識,對機房設(shè)施安全的重要性給予足夠的重視。
3、應(yīng)重點加強管理制度的執(zhí)行。管理制度包括預(yù)防維護流程和緊急情況處理預(yù)案兩個方面。要制定相應(yīng)的管理制度,包括機房管理崗位制度、機房操作規(guī)程等,以明確崗位職責(zé)。為應(yīng)對機房中可能會發(fā)生的緊急情況,如火災(zāi)、斷電、數(shù)據(jù)丟失、設(shè)備失靈等,應(yīng)按各種緊急情況分列處置措施,還要對預(yù)案進(jìn)行演練。
4、應(yīng)不斷提高機房管理人員的技術(shù)水平。機房設(shè)施非常復(fù)雜,涉及很多專業(yè)和系統(tǒng),維護人員只有通過不斷的總結(jié)以往出現(xiàn)的各種問題進(jìn)行后續(xù)學(xué)習(xí)和培訓(xùn),提高技術(shù)水平,才能避免更多的相同的問題及異常情況甚至事故的發(fā)生。
5.應(yīng)加強供配電、照明等電源子系統(tǒng)的監(jiān)測。同時應(yīng)重點對溫度、濕度、灰塵、有害氣體等進(jìn)行評估和監(jiān)測。還要加強靜電防護、干擾源分析及保護、雷擊
防護、電磁干擾、振動控制,防火、防水等工作。
5、應(yīng)加強對進(jìn)入機房人員的管理。工作人員行為、素質(zhì)等因素均可能對機房安全造成影響,因此,除管理制度約束外,門禁和視頻監(jiān)視等物理安全策略均可有效提高機房安全水平。
7、應(yīng)定期對機房設(shè)施進(jìn)行安全評估。最好每年聘請第三方機構(gòu)進(jìn)行安全評估,專業(yè)評估機構(gòu)擁有專家力量,能夠比較安全地對所有的設(shè)備進(jìn)行操作,不會因為誤操作引起機房故障。
8、機房內(nèi)嚴(yán)格采取防雷、防火、防塵、防靜電等措施以及機房24小時監(jiān)控等措施。
9、認(rèn)真做好數(shù)據(jù)備份工作,定期做一次數(shù)據(jù)庫完全備份,每月檢查服務(wù)器運行和備份情況。
10、對機房的主要網(wǎng)絡(luò)設(shè)備(路由器、主干交換機等)進(jìn)行工作時間內(nèi)全程監(jiān)控,發(fā)現(xiàn)異常情況應(yīng)及時進(jìn)行處理,確保整個網(wǎng)絡(luò)的正常運行。
2、應(yīng)急處置措施
2.1 機房漏水應(yīng)急預(yù)案
(1)發(fā)生機房漏水時,第一目擊者應(yīng)立即通知運維服務(wù)小組,并及時報告監(jiān)控系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。
(2)若空調(diào)系統(tǒng)出現(xiàn)滲漏水,運維服務(wù)小組負(fù)責(zé)人應(yīng)立即安排停用故障空調(diào),清除機房積水,并及時聯(lián)系設(shè)備供應(yīng)方處理,同時啟動備用空調(diào),必要情況下可臨時用備用空調(diào)對服務(wù)器進(jìn)行降溫。
(3)若為墻體或機房門滲漏水,運維服務(wù)小組負(fù)責(zé)人應(yīng)立即采取有效措施確保機房安全,及時清除積水,維修墻體或門窗,消除滲漏水隱患。2.2 設(shè)備發(fā)生被盜或人為損害事件應(yīng)急預(yù)案
(1)發(fā)生設(shè)備被盜或人為損害設(shè)備情況時,使用者或管理者應(yīng)立即報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,同時保護好現(xiàn)場。
(2)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組接報后,通知用戶保衛(wèi)部門、相關(guān)領(lǐng)導(dǎo),一同核實審定現(xiàn)場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。
(3)事發(fā)單位和當(dāng)事人應(yīng)當(dāng)積極配合公安部門進(jìn)行調(diào)查,并將有關(guān)情況向系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組匯報。
(4)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組安排運維服務(wù)小組、事發(fā)單位及時恢復(fù)系統(tǒng)正常運行,并對事件進(jìn)行調(diào)查。運維服務(wù)小組和事發(fā)單位應(yīng)在調(diào)查結(jié)束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。事態(tài)或后果嚴(yán)重的,應(yīng)向相關(guān)領(lǐng)導(dǎo)匯報。2.3 機房長時間停電應(yīng)急預(yù)案
(1)定期檢查機房供電設(shè)備的運行狀況和電路線纜器材情況,當(dāng)發(fā)生下列突發(fā)事件時,按照以下方案進(jìn)行處置:
(2)當(dāng)機房發(fā)生市電供電突然停電或是電源異常時。首先應(yīng)和后勤部門聯(lián)系確認(rèn)正常停電以及預(yù)計停電時間。檢查不間斷電源的電池可供電時間,確保設(shè)備正常運行,如遇到突然斷電,應(yīng)及時將空調(diào)等不在UPS電源供電范圍內(nèi)的設(shè)備及時斷電,預(yù)防突然來電時瞬間電流過大導(dǎo)致設(shè)備損壞等現(xiàn)象。
(3)當(dāng)確定停電時間超出機房UPS承載范圍后,首先確定停電的范圍以及受影響的設(shè)備范圍。并及時通知各部門做好停電應(yīng)急準(zhǔn)備。然后通知機房電源維護人和設(shè)備的負(fù)責(zé)人到達(dá)現(xiàn)場,做好各設(shè)備的電源停電準(zhǔn)備。在UPS供電電量僅剩10%之后,嚴(yán)格按操作手冊停掉各服務(wù)器的電源,最后停核心交換機和路由器,等待電力恢復(fù)。
(4)當(dāng)確定停電原因是在本身供電系統(tǒng)范圍內(nèi),立即匯報給負(fù)責(zé)領(lǐng)導(dǎo),并及時聯(lián)系相關(guān)維護人員達(dá)到現(xiàn)場檢修。對于恢復(fù)時間無法預(yù)計的,要通知后勤部門做好柴油機發(fā)電及移動電源車供電準(zhǔn)備
(5)恢復(fù)供電后,嚴(yán)格按照操作程序逐步恢復(fù)機房設(shè)備和UPS的供電,以防瞬間電流過大造成設(shè)備損壞。
2.4 通信網(wǎng)絡(luò)故障應(yīng)急預(yù)案
(1)發(fā)生通信線路中斷、路由故障、流量異常、域名系統(tǒng)故障后,操作員應(yīng)及時通知本單位信息系統(tǒng)管理員,經(jīng)初步判斷后及時上報運維服務(wù)小組和系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。
(2)運維服務(wù)小組接報告后,應(yīng)及時查清通信網(wǎng)絡(luò)故障位置,隔離故障區(qū)
域,并將事態(tài)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,通知相關(guān)通信網(wǎng)絡(luò)運營商查清原因;同時及時組織相關(guān)技術(shù)人員檢測故障區(qū)域,逐步恢復(fù)故障區(qū)與服務(wù)器的網(wǎng)絡(luò)聯(lián)接,恢復(fù)通信網(wǎng)絡(luò),保證正常運轉(zhuǎn)。
(3)事態(tài)或后果嚴(yán)重的,應(yīng)向應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報。(4)應(yīng)急處置結(jié)束后,運維服務(wù)小組應(yīng)將故障分析報告,在調(diào)查結(jié)束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。2.5網(wǎng)絡(luò)病毒事件應(yīng)急預(yù)案
(1)發(fā)現(xiàn)不良信息或網(wǎng)絡(luò)病毒時,信息系統(tǒng)管理員應(yīng)立即斷開網(wǎng)線,終止不良信息或網(wǎng)絡(luò)病毒傳播,并報告指揮調(diào)度中心運維服務(wù)小組和系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。
(2)運維服務(wù)小組應(yīng)根據(jù)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組指令,采取隔離網(wǎng)絡(luò)等措施,及時殺毒或清除不良信息,并追查不良信息來源。
(3)事態(tài)或后果嚴(yán)重的,應(yīng)向監(jiān)控中心辦公室和相關(guān)領(lǐng)導(dǎo)匯報。(4)處置結(jié)束后 ,運維服務(wù)小組應(yīng)將事發(fā)經(jīng)過、造成影響、處置結(jié)果在調(diào)查工作結(jié)束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。2.6 服務(wù)器軟件系統(tǒng)故障應(yīng)急預(yù)案
(1)發(fā)生服務(wù)器軟件系統(tǒng)故障后,運維服務(wù)小組負(fù)責(zé)人應(yīng)立即組織啟動備份服務(wù)器系統(tǒng),由備份服務(wù)器接管業(yè)務(wù)應(yīng)用,并及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組;同時安排相關(guān)責(zé)任人將故障服務(wù)器脫離網(wǎng)絡(luò),保存系統(tǒng)狀態(tài)不變,取出系統(tǒng)鏡像備份磁盤,保持原始數(shù)據(jù)。
(2)運維服務(wù)小組應(yīng)根據(jù)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組的指令,在確認(rèn)安全的情況下,重新啟動故障服務(wù)器系統(tǒng);重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復(fù);若重啟失敗,立即聯(lián)系相關(guān)廠商和上級單位,請求技術(shù)支援,作好技術(shù)處理。
(3)事態(tài)或后果嚴(yán)重的,應(yīng)向監(jiān)控中心應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報。(4)處置結(jié)束后,運維服務(wù)小組應(yīng)將事發(fā)經(jīng)過、處置結(jié)果等在調(diào)查工作結(jié)束后一日內(nèi)報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。
2.7 黑客攻擊事件應(yīng)急預(yù)案
(1)當(dāng)發(fā)現(xiàn)網(wǎng)絡(luò)被非法入侵、網(wǎng)頁內(nèi)容被篡改,應(yīng)用服務(wù)器上的數(shù)據(jù)被非法拷貝、修改、刪除,或通過入侵檢測系統(tǒng)發(fā)現(xiàn)有黑客正在進(jìn)行攻擊時,使用者或管理者應(yīng)斷開網(wǎng)絡(luò),并立即報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。
(2)接報告后,系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組應(yīng)立即指令運維服務(wù)小組核實情況,關(guān)閉服務(wù)器或系統(tǒng),修改防火墻和路由器的過濾規(guī)則,封鎖或刪除被攻破的登陸帳號,阻斷可疑用戶進(jìn)入網(wǎng)絡(luò)的通道。
(3)運維服務(wù)小組應(yīng)及時清理系統(tǒng),恢復(fù)數(shù)據(jù)、程序,恢復(fù)系統(tǒng)和網(wǎng)絡(luò)正常;情況嚴(yán)重的,應(yīng)向監(jiān)控中心應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報,并請求支援。
(4)處置結(jié)束后 ,運維服務(wù)小組應(yīng)將事發(fā)經(jīng)過、處置結(jié)果等在調(diào)查工作結(jié)束后一日內(nèi)報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。2.8 核心設(shè)備硬件故障應(yīng)急預(yù)案
(1)發(fā)生核心設(shè)備硬件故障后,運維服務(wù)小組應(yīng)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,并組織查找、確定故障設(shè)備及故障原因,進(jìn)行先期處置。
(2)若故障設(shè)備在短時間內(nèi)無法修復(fù)運維服務(wù)小組應(yīng)啟動備份設(shè)備,保持系統(tǒng)正常運行;將故障設(shè)備脫離網(wǎng)絡(luò),進(jìn)行故障排除工作。
(3)運維服務(wù)小組故障排除后,在網(wǎng)絡(luò)空閑時期,替換備用設(shè)備;若故障仍然存在,立即聯(lián)系相關(guān)廠商,認(rèn)真填寫設(shè)備故障報告單備查。
(4)事態(tài)或后果嚴(yán)重的,應(yīng)向監(jiān)控中心應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報。2.9 業(yè)務(wù)數(shù)據(jù)損壞應(yīng)急預(yù)案
(1)發(fā)生業(yè)務(wù)數(shù)據(jù)損壞 時,運維服務(wù)小組應(yīng)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,檢查、備份業(yè)務(wù)系統(tǒng)當(dāng)前數(shù)據(jù)。
(2)運維服務(wù)小組負(fù)責(zé)調(diào)用備份服務(wù)器備份數(shù)據(jù),若備份數(shù)據(jù)損壞,則調(diào)用磁帶機中歷史備份數(shù)據(jù),若磁帶機數(shù)據(jù)仍不可用,則調(diào)用異地備份數(shù)據(jù)。
(3)業(yè)務(wù)數(shù)據(jù)損壞事件超過 2小時后,運維服務(wù)小組應(yīng)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,及時通知業(yè)務(wù)部門以手工方式開展業(yè)務(wù)。
(4)運維服務(wù)小組應(yīng)待業(yè)務(wù)數(shù)據(jù)系統(tǒng)恢復(fù)后,檢查歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)的差別,由相關(guān)系統(tǒng)業(yè)務(wù)員補錄數(shù)據(jù);重新備份數(shù)據(jù),并在工作結(jié)束后一日內(nèi)報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。2.10 雷擊事故應(yīng)急預(yù)案
(1)遇雷暴天氣或接上級部門雷暴氣象預(yù)警,運維服務(wù)小組應(yīng)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,經(jīng)請示同意后關(guān)閉部分服務(wù)器,切斷電源,暫停內(nèi)部計算機部分網(wǎng)絡(luò)工作。
(2)雷暴天氣結(jié)束后,運維服務(wù)小組報經(jīng)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組同意,及時開通服務(wù)器,恢復(fù)內(nèi)部計算機網(wǎng)絡(luò)工作,對設(shè)備和數(shù)據(jù)進(jìn)行檢查。
(3)因雷擊造成損失的,運維服務(wù)小組應(yīng)會同相關(guān)部門進(jìn)行核實、報損,并在調(diào)查工作結(jié)束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。必要時,應(yīng)向監(jiān)控中心應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報。2.11 空調(diào)設(shè)備故障應(yīng)急預(yù)案
若機房專用空調(diào)損壞,應(yīng)第一時間啟用機房備用空調(diào),并通知廠家上門進(jìn)行維修,并及時報告相關(guān)領(lǐng)導(dǎo)請示,獲得授權(quán)后按機房設(shè)備關(guān)閉順序關(guān)閉各類設(shè)備。2.12 火災(zāi)事故應(yīng)急預(yù)案
(1)一旦機房發(fā)生火災(zāi),應(yīng)遵照下列原則:首先確保人員安全;其次保護關(guān)鍵設(shè)備、數(shù)據(jù)安全;三是保護一般設(shè)備安全;
(2)人員疏散的程序是:機房工作人員立即按響火警警報,并通過119電話向公安消防請求支援,所有人員戴上防毒面具,所有不參與滅火的人員按照預(yù)先確定的線路,迅速從機房中撤出;
(3)人員滅火的程序是:首先切斷所有電源,啟動自動噴淋系統(tǒng)或使用滅火器,滅火值班人員戴好防毒面具,從指定位置取出泡沫滅火器進(jìn)行滅火。2.13 電源設(shè)備故障應(yīng)急預(yù)案
機房目前使用UPS系統(tǒng),在緊急情況發(fā)生時,應(yīng)按如下步驟進(jìn)行關(guān)機:(1)確認(rèn)所有負(fù)載均已安全關(guān)機。
(2)關(guān)閉UPS負(fù)載電源。
(3)將UPS的系統(tǒng)啟用開關(guān)切換到off 的狀態(tài)。(4)將電池連接斷路器切換到off的位置。