第一篇:機(jī)房應(yīng)急預(yù)案
主機(jī)運(yùn)維應(yīng)急預(yù)案簡(jiǎn)介
.崔志昂 上海超級(jí)計(jì)算中心 上海 201203 zacui@ssc.net.cn.魏玉琪 上海超級(jí)計(jì)算中心 上海 201203 yqwei@ssc.net.cn 引言:
高性能計(jì)算技術(shù)及應(yīng)用水平已成為顯示綜合國(guó)力的一種標(biāo)志。高性能計(jì)算機(jī)持續(xù)不間斷地 為用戶提供高性能計(jì)算服務(wù),而運(yùn)維應(yīng)急預(yù)案是主機(jī)運(yùn)行中處理突發(fā)事件的依據(jù)和方法,是主
機(jī)系統(tǒng)穩(wěn)定運(yùn)行的保障。本文簡(jiǎn)要介紹上海超級(jí)計(jì)算中心主機(jī)運(yùn)維應(yīng)急預(yù)案,供同行參考。
1.主機(jī)和運(yùn)維管理制度簡(jiǎn)介
超級(jí)計(jì)算機(jī)是功能最強(qiáng)、運(yùn)算速度最快、存
儲(chǔ)容量最大的一類計(jì)算機(jī)。目前只有少數(shù)國(guó)家掌握 研發(fā)技術(shù),系統(tǒng)造價(jià)非常昂貴,多用于國(guó)家高科技 領(lǐng)域和尖端技術(shù)研究,是國(guó)家科技發(fā)展水平和綜合 國(guó)力的重要標(biāo)志。上海超級(jí)計(jì)算中心作為上海信息 港主體工程之一,國(guó)家和上海市政府投資先后引 進(jìn)神威-I超級(jí)計(jì)算機(jī)、神威-64P集群計(jì)算機(jī)、曙光 4000A超級(jí)計(jì)算機(jī)系統(tǒng)并投入商業(yè)化運(yùn)行。
上海超級(jí)計(jì)算中心自2001年正式開(kāi)通至今,這些高性能計(jì)算機(jī)系統(tǒng)已安全、穩(wěn)定運(yùn)行七年多時(shí) 間,上機(jī)用戶取得了豐碩的科研成果和社會(huì)效益。在這七年中,為保障這些高性能計(jì)算機(jī)系統(tǒng)安全、穩(wěn)定、不間斷地運(yùn)行,技術(shù)支持部在中心引進(jìn)第一 臺(tái)高性能計(jì)算機(jī)--神威-I超級(jí)計(jì)算機(jī)系統(tǒng)的同時(shí),建 立了機(jī)房應(yīng)急預(yù)案、運(yùn)行記錄、設(shè)備運(yùn)行參數(shù)等基 礎(chǔ)運(yùn)維制度,在二期引進(jìn)曙光4000A超級(jí)計(jì)算機(jī)系統(tǒng) 過(guò)程中,不斷完善原有運(yùn)維制度,并針對(duì)該主機(jī)系 統(tǒng)特點(diǎn)編寫(xiě)了大量操作方法和應(yīng)急預(yù)案。
中心自2006年獲得ISO27001(BS7799)信息安 全認(rèn)證以來(lái),技術(shù)支持部根據(jù)其要求規(guī)范了文檔體 系建設(shè),形成了機(jī)房管理制度、應(yīng)急預(yù)案、操作方 法、運(yùn)行情況記錄的四大類運(yùn)維文檔。
正是這些運(yùn)維管理制度的不斷完善和有效執(zhí) 行,才確保了資產(chǎn)價(jià)值高、服務(wù)對(duì)象廣、社會(huì)影 響大的中心主機(jī)系統(tǒng)安全、穩(wěn)定運(yùn)行,保障重點(diǎn)項(xiàng) 目、用戶服務(wù)的連續(xù)性。
2.應(yīng)急預(yù)案重要性
上海超級(jí)計(jì)算中心機(jī)房運(yùn)維管理文檔劃分為機(jī) 房管理制度、應(yīng)急預(yù)案、操作方法、運(yùn)行記錄共四 大類(如圖1所示)。
圖1 應(yīng)急預(yù)案分類
應(yīng)急預(yù)案在應(yīng)急系統(tǒng)中起著關(guān)鍵作用,它明確 了在突發(fā)緊急情況發(fā)生之前、發(fā)生過(guò)程中以及剛剛 結(jié)束之后,誰(shuí)負(fù)責(zé)做什么、何時(shí)做,以及相應(yīng)的策 略和資源準(zhǔn)備等。它是針對(duì)可能發(fā)生的重大事故,按照其影響和后果嚴(yán)重程度,在應(yīng)急準(zhǔn)備、響應(yīng)、操作各個(gè)方面預(yù)先做出的詳細(xì)安排,是開(kāi)展及時(shí)、有序和有效事故應(yīng)急工作的行動(dòng)指南。因此,應(yīng)急 預(yù)案在這四類運(yùn)維管理文檔中處于最為重要的地位。
3.應(yīng)急預(yù)案分類
應(yīng)急預(yù)案按重要性和事件種類,可以劃分為消
防預(yù)案、斷電預(yù)案、空調(diào)預(yù)案、其他預(yù)案共4種,預(yù) 案各文檔之間彼此獨(dú)立又互為關(guān)聯(lián),具有非常強(qiáng)的 可操作性。制定預(yù)案的指導(dǎo)原則是盡一切可能,最 大限度地確保向用戶提供的服務(wù)不中斷。在緊急事 件發(fā)生的情況下,保證核心設(shè)備連續(xù)運(yùn)行,避免存 儲(chǔ)數(shù)據(jù)丟失。在事件處置完成后,能快速恢復(fù)高性 能計(jì)算服務(wù)。
3.1 消防預(yù)案
消防預(yù)案是主機(jī)房最重要的應(yīng)急預(yù)案。該類預(yù) 案根據(jù)《上海超級(jí)計(jì)算中心滅火和應(yīng)急疏散預(yù)案》 的原則并結(jié)合主機(jī)房主機(jī)設(shè)備和消防設(shè)備的運(yùn)行特 性而制定。主要由《主機(jī)房消防應(yīng)急預(yù)案》和《主 機(jī)房氣體噴淋消防系統(tǒng)啟動(dòng)撤離及處置應(yīng)急預(yù)案》 2個(gè)文檔組成。
消防應(yīng)急預(yù)案:該預(yù)案著重規(guī)范了火警事件發(fā) 生后,所有主機(jī)維護(hù)人員如何根據(jù)所屬區(qū)域和現(xiàn)場(chǎng) 情況,判斷和選擇正確的處理方法,同時(shí)配合中心 物業(yè)人員處置,降低事件帶來(lái)的影響。
對(duì)于設(shè)備發(fā)生煙霧,主機(jī)維護(hù)人員協(xié)同物業(yè)人 員尋找煙霧點(diǎn)予以切斷相關(guān)區(qū)域電源;當(dāng)設(shè)備發(fā)生 可以控制火情,協(xié)同物業(yè)人員滅火;當(dāng)主機(jī)房發(fā)生 火災(zāi)而無(wú)法控制,應(yīng)采取施救方法等措施。
氣體噴淋預(yù)案:該預(yù)案描述主機(jī)房氣體噴淋系統(tǒng)啟
動(dòng)的響應(yīng)和確認(rèn)并具體規(guī)定了撤離機(jī)房路線、善后處置。
這兩個(gè)預(yù)案中,消防應(yīng)急預(yù)案作為消防預(yù)案 的主體,涉及到如何處理與消防有關(guān)情況的各個(gè)方 面。氣體噴淋預(yù)案是主機(jī)房發(fā)生重大火災(zāi)時(shí)應(yīng)對(duì)的 最終滅火手段和人員撤離引導(dǎo)方法。
3.2 斷電預(yù)案
斷電預(yù)案的重要性僅次于消防預(yù)案。該類預(yù)
案根據(jù)中心供配電系統(tǒng)實(shí)際情況和各種斷電影響范 圍下對(duì)主機(jī)運(yùn)行的最小保障要求而制定的。主要由
《主機(jī)房斷電應(yīng)急預(yù)案》、《曙光4000A超級(jí)計(jì)算機(jī) 系統(tǒng)緊急關(guān)機(jī)操作方法》、《曙光4000A超級(jí)計(jì)算機(jī) 系統(tǒng)雙路斷電關(guān)機(jī)操作方法》等多個(gè)文檔組成。
主機(jī)房斷電應(yīng)急預(yù)案:該預(yù)案用于斷電情況
下,主機(jī)維護(hù)人員如何與中心物業(yè)部門(mén)聯(lián)系控制主 機(jī)房供電情況,并且負(fù)責(zé)對(duì)主機(jī)系統(tǒng)運(yùn)行受斷電影 響程度做出正確判斷。指導(dǎo)維護(hù)人員按影響程度,分別選用預(yù)案中對(duì)應(yīng)的操作方法。本預(yù)案在所有斷 電預(yù)案中起指導(dǎo)思想作用。緊急關(guān)機(jī)操作方法:該預(yù)案制定了主機(jī)系統(tǒng)在 緊急情況下,最快速度關(guān)機(jī)的操作步驟。主要用于 發(fā)生煙霧、明火或消防、斷電預(yù)案需在數(shù)分鐘內(nèi)關(guān) 機(jī)斷電的事件。
雙路斷電關(guān)機(jī)操作方法:該緊急操作預(yù)案主要 用于在外界雙路供電全部中斷情況下的操作。
該預(yù)案的關(guān)機(jī)原則是:根據(jù)實(shí)際電力供應(yīng)考慮 操作步驟,寧慢勿快,在時(shí)間允許的情況下,最大 程度保證存儲(chǔ)節(jié)點(diǎn)、SAN和SCSI存儲(chǔ)設(shè)備、工程用戶 的計(jì)算節(jié)點(diǎn)的運(yùn)行,盡可能減少關(guān)閉范圍,以確保 能在恢復(fù)供電的情況下,主機(jī)盡快恢復(fù)正常運(yùn)行狀 態(tài),減少影響范圍。
3.3 空調(diào)預(yù)案
超級(jí)計(jì)算機(jī)系統(tǒng)在運(yùn)行中消耗大量電能,在
提供高性能的計(jì)算能力同時(shí)產(chǎn)生大量的熱量,必須 采用專用空調(diào)系統(tǒng),以保持主機(jī)系統(tǒng)適當(dāng)?shù)臏亍?度、空氣潔凈度等運(yùn)行環(huán)境需求。因此,專用空調(diào) 系統(tǒng)與主機(jī)系統(tǒng)密切相關(guān),空調(diào)預(yù)案是主機(jī)房必備 的應(yīng)急預(yù)案。
制定該預(yù)案的原因在于,斷電情況下,空調(diào)與 主機(jī)系統(tǒng)存在互相牽制的現(xiàn)狀。主機(jī)和空調(diào)系統(tǒng)均 為外界雙路供電,主機(jī)系統(tǒng)配有UPS不間斷電源系 統(tǒng),而空調(diào)系統(tǒng)無(wú)UPS支持。在雙路停電情況下,主 機(jī)系統(tǒng)可獲得UPS電池組支持運(yùn)行若干分鐘,空調(diào)系 統(tǒng)無(wú)UPS支持只能停機(jī)。由于在無(wú)空調(diào)冷卻情況下,主機(jī)系統(tǒng)會(huì)在短時(shí)間內(nèi)積聚大量熱量導(dǎo)致超過(guò)運(yùn)行 警戒溫度,主機(jī)系統(tǒng)在有可供電余量的情況下,仍 將被迫關(guān)機(jī)。因此,確保空調(diào)中斷情況下的主機(jī)運(yùn) 行環(huán)境是該預(yù)案的制定原則。
預(yù)案根據(jù)各臺(tái)主機(jī)配備的空調(diào)系統(tǒng)特點(diǎn)制定,由《曙光機(jī)房空調(diào)系統(tǒng)故障應(yīng)急預(yù)案》和《神威機(jī) 房空調(diào)系統(tǒng)應(yīng)急預(yù)案》2個(gè)文檔組成,這里僅介紹曙 光機(jī)房空調(diào)系統(tǒng)應(yīng)急預(yù)案。
該預(yù)案的第一步:考慮增強(qiáng)主機(jī)系統(tǒng)散熱效
果,采用打開(kāi)主機(jī)機(jī)柜前后門(mén),和機(jī)房周邊木門(mén),在通風(fēng)道上布置有UPS支持的應(yīng)急風(fēng)扇,形成空氣對(duì) 流,帶走熱空氣,從而增強(qiáng)主機(jī)系統(tǒng)散熱效果,降 低升溫速度。
該預(yù)案的第二步:在采取上述措施并持續(xù)升溫 到一定溫度之上的情況下,考慮緊急關(guān)閉部分或全 部計(jì)算節(jié)點(diǎn),減少熱量生成,確保主機(jī)系統(tǒng)的核心 存儲(chǔ)和網(wǎng)絡(luò)系統(tǒng)不受影響,確保空調(diào)系統(tǒng)修復(fù)后,主機(jī)系統(tǒng)能快速恢復(fù)運(yùn)行。
3.4 其他預(yù)案
除了固定的三類預(yù)案之外,技術(shù)支持部還根據(jù) 主機(jī)系統(tǒng)實(shí)際運(yùn)行中出現(xiàn)的各種意外情況,隨時(shí)制 定具有針對(duì)性的預(yù)案。
如《大樓頂棚坍塌應(yīng)急操作方法》的制定,就
是由于2008年1月連續(xù)發(fā)生雨雪等災(zāi)害性天氣,中心 大樓頂棚大量積雪且難融化,物業(yè)預(yù)計(jì)存在情況繼 續(xù)惡化,有發(fā)生頂棚坍塌事故的可能,一旦發(fā)生將 影響一樓主機(jī)運(yùn)行。
針對(duì)該突發(fā)的隱患,中心技術(shù)支持部制定應(yīng)急 操作方法,對(duì)維護(hù)巡查頻度范圍、漏水可能發(fā)生位 置、如何處理受漏水影響的主機(jī)設(shè)備等操作步驟進(jìn) 行嚴(yán)格界定。即使在最后,中心大樓頂棚經(jīng)受住災(zāi) 害性天氣的考驗(yàn),該預(yù)案并未發(fā)揮作用,這正體現(xiàn) 了應(yīng)急預(yù)案的備而不用的特點(diǎn)。而且通過(guò)各種意外
情況的迅速分析、應(yīng)對(duì)和實(shí)踐操練,不斷鍛煉主機(jī) 維護(hù)隊(duì)伍,使之走向成熟。
4.在實(shí)際案例中,應(yīng)急預(yù)案的作用
在主機(jī)系統(tǒng)年復(fù)一年的運(yùn)行中,我們希望這些 設(shè)備正常穩(wěn)定運(yùn)行,應(yīng)急預(yù)案永遠(yuǎn)不會(huì)被使用,然 而在實(shí)際運(yùn)行中,總免不了因突發(fā)事件執(zhí)行應(yīng)急預(yù) 案。
而每次突發(fā)事件是檢驗(yàn)應(yīng)急預(yù)案制定是否科 學(xué)、有效的最好證明。
4.1 雙路斷電,UPS正常運(yùn)行案例
2006年8月某天,因打雷導(dǎo)致供電一路跳閘自動(dòng) 換至另一路供電,曙光機(jī)房2臺(tái)空調(diào)掉電。
主機(jī)維護(hù)人員立即按應(yīng)急預(yù)案操作,電話通知 物業(yè)人員恢復(fù)空調(diào)運(yùn)行,恢復(fù)過(guò)程中所有空調(diào)相繼 出現(xiàn)高溫報(bào)警,機(jī)柜液晶屏平均溫度35度,開(kāi)啟全 部曙光機(jī)柜前后門(mén),打開(kāi)神威-曙光玻璃門(mén)并調(diào)集應(yīng) 急電扇,于12:45恢復(fù)正常。
12:50再次出現(xiàn)雙路供電中斷,曙光空調(diào)因無(wú)
UPS支撐全部斷電,啟動(dòng)斷電應(yīng)急預(yù)案,開(kāi)啟5、6號(hào) 木門(mén),開(kāi)啟神威機(jī)房全部空調(diào),布置電扇,將冷氣 導(dǎo)入曙光機(jī)房,熱量從6號(hào)木門(mén)的外部通道排出,選 擇性殺除部分作業(yè),至13:05供電恢復(fù),曙光空調(diào)開(kāi) 始工作,13:20環(huán)境恢復(fù)正常。全機(jī)在此過(guò)程中,正 常運(yùn)行未停機(jī),只損失了部分不重要的作業(yè)。
4.2 單路斷電,UPS失效案例
2007年8月某天,因低壓配電柜開(kāi)關(guān)至UPS房間 X-JM柜電纜發(fā)生相對(duì)地短路,造成UPS機(jī)組逆變器 自身保護(hù)動(dòng)作,關(guān)閉UPS機(jī)組,導(dǎo)致曙光主機(jī)系統(tǒng)失 電。
全機(jī)掉電后,主機(jī)維護(hù)人員迅速按應(yīng)急預(yù)案
手 工 關(guān) 閉 所 有 電 源 開(kāi) 關(guān)。1 0 : 3 0恢 復(fù) 供 電,溫濕度恢復(fù)正常后,全機(jī)加電,恢復(fù)過(guò)程中修復(fù)
storage001、005、010三個(gè)盤(pán)陣的9個(gè)用戶文件系統(tǒng),修復(fù)15個(gè)節(jié)點(diǎn)加電故障,除cnode009、anode029電源
環(huán) 境 模塊故障,于當(dāng)日15:10全機(jī)系統(tǒng)恢復(fù)正常。
由于處置及時(shí),主機(jī)受影響范圍很小,在恢復(fù) 供電后數(shù)小時(shí)即成功開(kāi)啟全系統(tǒng)。
5.隨時(shí)保持應(yīng)急預(yù)案的適用性
主機(jī)長(zhǎng)年累月的運(yùn)行,故障和問(wèn)題的發(fā)生,往 往是必然的,也是客觀、無(wú)法回避的。因此,要求 在維護(hù)工作中,預(yù)先考慮到可能的問(wèn)題和故障,制 定完善的應(yīng)急預(yù)案。應(yīng)急預(yù)案不可能包含所有的故 障和問(wèn)題,但應(yīng)根據(jù)維護(hù)經(jīng)驗(yàn),盡可能地設(shè)想各種 危機(jī)情況下的處置措施。做到預(yù)想到各種可能的問(wèn) 題。
而在形成應(yīng)急預(yù)案后,更重要的是持續(xù)地在
運(yùn)行中加以完善、測(cè)試和演練,盡可能模擬實(shí)際情 況,做到即使只有1名維護(hù)人員在場(chǎng),也能在真正發(fā) 生危機(jī)時(shí),以最短時(shí)間獨(dú)立處置故障。
以目前中心的主機(jī)運(yùn)維工作為例,三年內(nèi),僅 斷電預(yù)案就已根據(jù)實(shí)際運(yùn)行情況的變化,制定并更 新了5~6個(gè)版本,針對(duì)夏季突發(fā)斷電也有專用預(yù)案。這樣的措施,直接保障了2006年8月突發(fā)斷電事件中 的主機(jī)連續(xù)運(yùn)行。而2007年8月的突發(fā)斷電事件中,由于預(yù)案在之前剛根據(jù)實(shí)際情況進(jìn)行過(guò)演練和修 改,主機(jī)維護(hù)人員僅用半小時(shí)就完成所有應(yīng)急操作 動(dòng)作,整機(jī)僅有個(gè)別設(shè)備故障,確保了主機(jī)設(shè)備未 因突發(fā)斷電而發(fā)生大范圍損壞現(xiàn)象,恢復(fù)供電后直 接完成開(kāi)機(jī)。
實(shí)踐證明,完善而適用的應(yīng)急預(yù)案能保障向用 戶提供穩(wěn)定的高性能計(jì)算服務(wù)。
6.結(jié)束語(yǔ)
完備而適用的應(yīng)急預(yù)案能有效降低主機(jī)系統(tǒng)因 意外事件發(fā)生帶來(lái)的運(yùn)行風(fēng)險(xiǎn),對(duì)可能發(fā)生的意外 來(lái)說(shuō),是一種事前防范措施。但對(duì)整個(gè)主機(jī)系統(tǒng)產(chǎn) 品而言,是一種事后防范措施。如果主機(jī)系統(tǒng)生產(chǎn) 廠商能把這些防范措施納入整個(gè)系統(tǒng)設(shè)計(jì)過(guò)程中,使操作方法更加簡(jiǎn)便、更趨于人性化,這將幫助主 機(jī)維護(hù)人員更為妥善處理意外事件,用戶得到更為 穩(wěn)定的高性能計(jì)算服務(wù)。我們相信未來(lái)國(guó)產(chǎn)的高性 能計(jì)算機(jī)能做到這一點(diǎn),期待著這一天早日到來(lái)。
(為幫助了解,特在附錄中節(jié)選部分雙路斷電關(guān)機(jī)預(yù)案內(nèi)容)
附錄:《曙光4000A超級(jí)計(jì)算機(jī)系統(tǒng)雙路斷電關(guān)機(jī)操作方法》(省略具體操作步驟)
曙光4000A超級(jí)計(jì)算機(jī)系統(tǒng)雙路斷電關(guān)機(jī)操作方法
注意:
1、本方法專用于主機(jī)房發(fā)生雙路同時(shí)斷電緊急操作使用。(包括單線斷電切換失?。?。
2、本方法作為《曙光-4000A超級(jí)計(jì)算機(jī)系統(tǒng)緊急關(guān)機(jī)操作方法》(SSCS(TS)-XXXX-XXXX-XXXX)的附件。
1.斷電確認(rèn)及操作:
主機(jī)房?jī)?nèi)一旦發(fā)現(xiàn)斷電,并接物業(yè)明確通知為雙路斷電,首先執(zhí)行如下操作(即確保節(jié)點(diǎn)溫度):
1.1 打開(kāi)機(jī)房門(mén)便于散熱,..1.2 機(jī)房通道上布置應(yīng)急風(fēng)扇加強(qiáng)冷熱空氣對(duì)流,夏季:應(yīng)急風(fēng)扇布置..;冬季:應(yīng)急風(fēng)扇布置..,使曙光
機(jī)房的溫度盡量降低。
1.3 打開(kāi)所有機(jī)柜前、后門(mén)。
1.4 密切注意機(jī)房節(jié)點(diǎn)平均溫度(專指各機(jī)柜液晶面板所示之環(huán)境溫度值)。
2.緊急關(guān)機(jī)條件確認(rèn):
在完成上述操作后,密切觀察主機(jī)房環(huán)境。一旦有如下任何一個(gè)條件滿足:
2.1 自斷電發(fā)生起,已達(dá)到XX分鐘仍未恢復(fù)供電;
2.2 采取上述緊急通風(fēng)措施,節(jié)點(diǎn)溫度持續(xù)上升,超過(guò)XX℃;
可認(rèn)定為緊急斷電事件,即刻按下列緊急關(guān)機(jī)操作方法進(jìn)行操作。
3.緊急關(guān)機(jī)操作步驟:
注意事項(xiàng):
3.1..3.2 關(guān)機(jī)操作的全過(guò)程中,注意隨時(shí)保持和物業(yè)的通訊聯(lián)系。除根據(jù)情況隨時(shí)聯(lián)絡(luò)外,應(yīng)嚴(yán)格保證每XX分鐘與物
業(yè)聯(lián)系一次,詢問(wèn)UPS可支撐時(shí)間及恢復(fù)供電可能。(分機(jī)、手機(jī)、對(duì)講機(jī)等)
3.3 應(yīng)理解關(guān)機(jī)原則為:根據(jù)實(shí)際電力供應(yīng)考慮操作步驟,寧慢勿快,在時(shí)間允許的情況下,最大程度保證X排節(jié)
點(diǎn)、存儲(chǔ)節(jié)點(diǎn)、SAN和SCSI存儲(chǔ)設(shè)備的運(yùn)行,盡可能減少關(guān)閉范圍,以確保恢復(fù)。
第一級(jí)操作:(首先執(zhí)行)關(guān)閉主機(jī)系統(tǒng)外圍設(shè)備..第二級(jí)操作:(完成上述操作后,當(dāng)再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點(diǎn)平均溫度超過(guò)XX℃,任一條件滿足,執(zhí)行如下操作)
關(guān)閉非重要用戶計(jì)算節(jié)點(diǎn)(ABC組)..第三級(jí)操作:(完成上述操作后,當(dāng)再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點(diǎn)平均溫度超過(guò)XX℃,任一條件滿足,執(zhí)行如下操作)
關(guān)閉所有用戶計(jì)算節(jié)點(diǎn)(D組)..第四級(jí)操作:(完成上述操作后,當(dāng)再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點(diǎn)平均溫度超過(guò)XX℃,任一條件滿足,執(zhí)行如下操作)
關(guān)閉SAN存儲(chǔ)設(shè)備和LSF數(shù)據(jù)庫(kù)服務(wù)器..第五級(jí)操作:(完成上述操作后,當(dāng)再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點(diǎn)平均溫度超過(guò)XX℃,任一條件滿足,完成關(guān)機(jī)操作)
關(guān)閉SCSI磁盤(pán)陣列和所有存儲(chǔ)節(jié)點(diǎn)..特別關(guān)注:
1.如時(shí)間非常緊急,UPS電池低于XX分鐘:
直接執(zhí)行關(guān)機(jī)腳本:..此腳本可分別將計(jì)算節(jié)點(diǎn)、接入節(jié)點(diǎn)、存儲(chǔ)節(jié)點(diǎn)進(jìn)行關(guān)閉。
2.如時(shí)間極其緊急,UPS電池低于XX分鐘,可按《曙光-4000A超級(jí)計(jì)算機(jī)系統(tǒng)緊急關(guān)機(jī)操作方法》(SSCS(TS)-XXXX-XXXX-XXXX),直接拉閘操作。
(上述二個(gè)方法僅用于突發(fā)情況,非極其必要情況下嚴(yán)禁使用,應(yīng)使用前列方法操作)
3.如遇主機(jī)失電(如關(guān)機(jī)操作不及已掉電或突發(fā)自動(dòng)掉電)應(yīng)關(guān)閉所涉范圍所有設(shè)備電閘開(kāi)關(guān)。..
第二篇:機(jī)房應(yīng)急預(yù)案
應(yīng)急處置方案
第一節(jié) 總 則
1、保證人員和財(cái)產(chǎn)的安全為前提的原則:在由于火災(zāi)或電力問(wèn)題造成的主機(jī)故障,在解決故障前,應(yīng)以保證人員的生命安全和財(cái)產(chǎn)的安全為前提,然后進(jìn)行故障的解決。
2、最快時(shí)間恢復(fù)業(yè)務(wù)的原則:本著先想盡一切方法,盡快恢復(fù)業(yè)務(wù)的原則來(lái)處理故障,如在有備用設(shè)備的情況下,主設(shè)備產(chǎn)生了故障,應(yīng)先盡快將應(yīng)用切換到備用機(jī)上,使業(yè)務(wù)能夠運(yùn)行,再對(duì)故障設(shè)備進(jìn)行診斷和維修。
3、故障應(yīng)急人員高度負(fù)責(zé)的原則:當(dāng)故障應(yīng)急人員在節(jié)假日接到故障通知時(shí),本著高度負(fù)責(zé)的態(tài)度,應(yīng)迅速接手處理障礙,如遠(yuǎn)程無(wú)法處理解決,應(yīng)迅速趕到故障設(shè)備所在地,進(jìn)行現(xiàn)場(chǎng)處理,處理故障的同時(shí)應(yīng)及時(shí)向領(lǐng)導(dǎo)匯報(bào)。應(yīng)急人員不可互相推卸責(zé)任,如因特殊情況,確實(shí)無(wú)法處理障礙,部門(mén)領(lǐng)導(dǎo)必須安排好其他人員處理。
4、盡可能全面的保留故障現(xiàn)場(chǎng)的原則:當(dāng)故障發(fā)生后,應(yīng)急人員應(yīng)盡可能全面的備份出能夠反映故障現(xiàn)象的各種日志、記錄、受損文件等,便于業(yè)務(wù)恢復(fù)后,對(duì)故障的分析、解決,杜絕故障的再次發(fā)生。
應(yīng)急方案的目標(biāo):保證預(yù)付卡運(yùn)營(yíng)系統(tǒng)連續(xù)安全穩(wěn)定地運(yùn)行。
第二節(jié) 應(yīng)急領(lǐng)導(dǎo)小組
應(yīng)急領(lǐng)導(dǎo)小組成員:
組 長(zhǎng): 副組長(zhǎng): 成 員:
第三節(jié) 電源系統(tǒng)故障應(yīng)急處理
定期檢查信息中心機(jī)房電源設(shè)備的運(yùn)行狀況,當(dāng)發(fā)生下列突發(fā)事件時(shí),按以下方案進(jìn)行處置:
當(dāng)中心機(jī)房發(fā)生市電供電突然停電或遠(yuǎn)程報(bào)警電源異常時(shí)。首先確認(rèn)是否為正常停電及預(yù)計(jì)停電時(shí)間。檢查不間斷電源的電池可供電時(shí)間,需在不間斷電源供電時(shí)效內(nèi)關(guān)閉所有服務(wù)器及網(wǎng)絡(luò)設(shè)備。
聯(lián)系工程部查看停電原因,盡快恢復(fù)供電,并將情況報(bào)告相關(guān)領(lǐng)導(dǎo)
工程部聯(lián)系電話:
第四節(jié) 空調(diào)系統(tǒng)故障應(yīng)急處理
定期對(duì)空調(diào)的運(yùn)行情況進(jìn)行檢查,如有報(bào)警信息,應(yīng)及時(shí)查找故障原因,對(duì)于不能自行排除的問(wèn)題,應(yīng)及時(shí)與設(shè)備提供商進(jìn)行聯(lián)系。
當(dāng)中心機(jī)房主空調(diào)因故障無(wú)法制冷,致使機(jī)房?jī)?nèi)環(huán)境溫度超過(guò)攝氏40度時(shí),打開(kāi)機(jī)房房門(mén),并關(guān)閉所有服務(wù)器及網(wǎng)絡(luò)設(shè)備。對(duì)于無(wú)法自行處置的空調(diào)系統(tǒng)異常情況,及時(shí)與設(shè)備提供商聯(lián)系,并報(bào)告公司領(lǐng)導(dǎo)。空調(diào)問(wèn)題聯(lián)系人:
第五節(jié) 中心機(jī)房自動(dòng)消防系統(tǒng)應(yīng)急處理
當(dāng)中心機(jī)房發(fā)生火警時(shí),按以下方案進(jìn)行處置:
1.上班工作時(shí)間發(fā)生火警,聽(tīng)到自動(dòng)消防系統(tǒng)發(fā)出的聲光報(bào)警后,中心機(jī)房附近辦公室人員應(yīng)及時(shí)緊急撤離,避免氣體自動(dòng)消防系統(tǒng)啟動(dòng)后,消防氣體對(duì)附近人員造成人身傷害。確認(rèn)火警后,立刻撥打119報(bào)警,并說(shuō)明盡量使用氣體滅火器進(jìn)行滅火,減少電子設(shè)備的損壞。
2.發(fā)生火警后,信息中心相關(guān)人員應(yīng)馬上趕赴現(xiàn)場(chǎng),并向有關(guān)領(lǐng)導(dǎo)報(bào)告事故情況。同時(shí)立即聯(lián)系聯(lián)通等相關(guān)公司,及時(shí)評(píng)估事故損失情況,研討盡快恢復(fù)信息系統(tǒng)正常運(yùn)行的最佳方案。安保消防中控電話:
第六節(jié) 設(shè)備、網(wǎng)絡(luò)系統(tǒng)故障應(yīng)急處理
設(shè)備、網(wǎng)絡(luò)應(yīng)用系統(tǒng)故障應(yīng)由發(fā)現(xiàn)人通知技術(shù)部,技術(shù)部門(mén)立即檢查故障,進(jìn)行初步故障定位,解決;
1.網(wǎng)絡(luò)設(shè)備、服務(wù)器、儲(chǔ)存設(shè)備均有備份,當(dāng)設(shè)備存在硬件問(wèn)題時(shí),可隨時(shí)把業(yè)務(wù)切換到備份主機(jī)上,保證業(yè)務(wù)正常運(yùn)行; 2.應(yīng)用系統(tǒng)每更新一次則做一次遠(yuǎn)程備份,在遠(yuǎn)程主機(jī)上分別備份舊的應(yīng)用系統(tǒng)和更新后的應(yīng)用系統(tǒng),以當(dāng)天的更新日期命名; 3.對(duì)磁盤(pán)柜上的數(shù)據(jù)庫(kù)文件有定時(shí)任務(wù),每天凌晨4:00會(huì)把數(shù)據(jù)庫(kù)里的數(shù)據(jù)文件倒出到遠(yuǎn)程備份主機(jī)上,以確保磁盤(pán)柜出現(xiàn)硬件故障的時(shí)候,數(shù)據(jù)文件不丟失;對(duì)于網(wǎng)絡(luò)、應(yīng)用系統(tǒng)出現(xiàn)硬件方面的故障,比較嚴(yán)重的問(wèn)題,對(duì)業(yè)務(wù)的正常運(yùn)行造成較大的影響,立即向有關(guān)領(lǐng)導(dǎo)報(bào)告。
4、網(wǎng)絡(luò)中有監(jiān)控服務(wù)器,運(yùn)用Cacti v10最新的版本,監(jiān)控網(wǎng)絡(luò)所有設(shè)備(路由器,防火墻,交換機(jī)以及服務(wù)器設(shè)備);對(duì)設(shè)備本身的硬件檢測(cè)、外部入侵檢測(cè)、外部攻擊等多種對(duì)系統(tǒng)不利因素以發(fā)送mail的形式報(bào)警;相關(guān)人員收到報(bào)警信息,分析收到的log日志以做出相應(yīng)的處理。
5、每周周五對(duì)網(wǎng)絡(luò)設(shè)備進(jìn)行日志及配置文件采集,對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)文件定期下載,和遠(yuǎn)程備份;在本地電腦上保存最近的配置文件,以便在發(fā)生毀滅性的災(zāi)難時(shí),用來(lái)重組。
對(duì)簡(jiǎn)單故障,運(yùn)維人員應(yīng)迅速排除故障,解決問(wèn)題并記錄。如果需要更換設(shè)備,應(yīng)上報(bào)有關(guān)領(lǐng)導(dǎo),經(jīng)批準(zhǔn)后馬上更換故障設(shè)備,盡快恢復(fù)網(wǎng)絡(luò)、應(yīng)用系統(tǒng)運(yùn)行。運(yùn)維部門(mén)判斷無(wú)法及時(shí)修理時(shí),應(yīng)立即通知相關(guān)的系統(tǒng)運(yùn)行服務(wù)提供商,在最短的時(shí)間內(nèi)安排修理或更換系統(tǒng)。
如發(fā)現(xiàn)屬外部線路的問(wèn)題,應(yīng)與線路服務(wù)提供商聯(lián)系,敦促對(duì)方盡快恢復(fù)故障線路。
啟用備份線路、設(shè)備、系統(tǒng),迅速恢復(fù)相關(guān)的應(yīng)用。
聯(lián)通聯(lián)系電話:
第七節(jié) 黑客入侵的應(yīng)急處理
發(fā)現(xiàn)網(wǎng)絡(luò)上有黑客攻擊行為,任何人員都有義務(wù)向技術(shù)部門(mén)報(bào)告。技術(shù)部立即啟動(dòng)應(yīng)急響應(yīng),切斷受攻擊計(jì)算機(jī)與網(wǎng)絡(luò)的連接,停止一切操作、保護(hù)現(xiàn)場(chǎng),并上報(bào)有關(guān)領(lǐng)導(dǎo)。
對(duì)于黑客攻擊,由計(jì)算中心組織應(yīng)急響應(yīng)專家小組查找入侵蹤跡,分析入侵方式和原因。由安全管理員根據(jù)對(duì)入侵事件的分析,組織相關(guān)人員對(duì)內(nèi)部網(wǎng)計(jì)算機(jī)整改,防止黑客用同樣的手段再次入侵其他系統(tǒng)。安全管理員檢查確定無(wú)安全隱患后,才可將受攻擊計(jì)算機(jī)重新連接網(wǎng)絡(luò),或啟用備份計(jì)算機(jī)來(lái)恢復(fù)應(yīng)用。
安全管理員應(yīng)做好記錄,保護(hù)現(xiàn)場(chǎng),進(jìn)行日志收集等工作。如果能追查到攻擊者的相關(guān)信息,可以對(duì)其發(fā)出警告,必要時(shí)可以采取進(jìn)一步的行動(dòng),乃至采取法律手段。根據(jù)破壞程度,經(jīng)有關(guān)領(lǐng)導(dǎo)同意后,上報(bào)公安部門(mén)。
若系統(tǒng)已被黑客破壞,無(wú)法恢復(fù),應(yīng)將受黑客攻擊的計(jì)算機(jī)上的重要數(shù)據(jù)備份到其他存儲(chǔ)介質(zhì),確保計(jì)算機(jī)內(nèi)重要的數(shù)據(jù)不丟失。如果數(shù)據(jù)無(wú)法恢復(fù),經(jīng)有關(guān)領(lǐng)導(dǎo)同意后,可與國(guó)家指定的部門(mén)聯(lián)系,由他們來(lái)協(xié)助恢復(fù),為保證數(shù)據(jù)信息安全,需在安全管理部門(mén)作記錄。
第八節(jié) 生產(chǎn)系統(tǒng)、數(shù)據(jù)庫(kù)故障處理
生產(chǎn)系統(tǒng)出現(xiàn)故障,技術(shù)部做出應(yīng)急處理
1.因軟件設(shè)計(jì)缺陷、設(shè)計(jì)漏洞等引起的故障,通知公司研發(fā)部門(mén)在2小時(shí)內(nèi)查明原因,解決問(wèn)題。
2.數(shù)據(jù)庫(kù)出現(xiàn)故障,運(yùn)維人員應(yīng)在2小時(shí)內(nèi)查清故障原因,其他相關(guān)部門(mén)應(yīng)積極配合,解決問(wèn)題。
3.如出現(xiàn)數(shù)據(jù)丟失情況,確認(rèn)不能自行恢復(fù)后,啟用備份恢復(fù)數(shù)據(jù),24小時(shí)內(nèi)恢復(fù)運(yùn)營(yíng)。
本方案自發(fā)布之日起施行
第三篇:機(jī)房應(yīng)急預(yù)案
中心機(jī)房突發(fā)事件應(yīng)急預(yù)案
第一條
機(jī)房突發(fā)事件包括網(wǎng)絡(luò)設(shè)備或服務(wù)器故障、自然災(zāi)害(水、火、電等)造成的 物理破壞、人為失誤造成的安全事件等等。針對(duì)突發(fā)事件的預(yù)防措施如下:
1.建立安全、可靠、穩(wěn)定運(yùn)行的機(jī)房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵; 建立備份電源系統(tǒng);加強(qiáng)所有人員防火、防盜等基本技能培訓(xùn)。
2.服務(wù)器采用可靠、穩(wěn)定的硬件設(shè)備,落實(shí)數(shù)據(jù)備份機(jī)制,安裝有效的防病毒軟件,及時(shí) 更新升級(jí)掃描引擎;加強(qiáng)對(duì)局域網(wǎng)內(nèi)所有用戶和信息系統(tǒng)管理員的安全技術(shù)培訓(xùn)。
第二條
機(jī)房漏水應(yīng)急預(yù)案如下:
1.發(fā)生機(jī)房漏水時(shí),第一目擊者應(yīng)立即通知機(jī)房管理人員。
2.若空調(diào)系統(tǒng)出現(xiàn)滲漏水,機(jī)房管理人員應(yīng)立即安排停用故障空調(diào),清除機(jī)房積水,并及 時(shí)聯(lián)系設(shè)備供應(yīng)方處理,同時(shí)啟動(dòng)備用空調(diào),必要情況下可臨時(shí)用電扇對(duì)服務(wù)器進(jìn)行降溫。3.若為墻體或窗戶滲漏水,機(jī)房管理人員應(yīng)立即采取有效措施確保機(jī)房安全,同時(shí)安排通 知辦公室,及時(shí)清除積水,維修墻體或窗戶,消除滲漏水隱患。
第三條
機(jī)房火災(zāi)應(yīng)急預(yù)案如下:
1.完善機(jī)房環(huán)境,確保機(jī)房具備二氧化碳滅火器;禁止攜帶易燃易爆物品進(jìn)入機(jī)房。2.機(jī)房管理人員應(yīng)熟悉機(jī)房?jī)?nèi)部消防安全操作和規(guī)則,了解消防設(shè)備操作原理,掌握消防 應(yīng)急處理步驟、措施和要領(lǐng),懂得滅火的方法,會(huì)撲救初起火災(zāi),并定期組織滅火演習(xí)。3.一旦發(fā)生火災(zāi),迅速切斷機(jī)房電源,避免災(zāi)情的擴(kuò)散,并迅速撥打物業(yè)管理和119火警電話。
4.等待消防車到來(lái)期間,應(yīng)組織物業(yè)保安或工作人員在保證安全的前提下滅火,應(yīng)急領(lǐng)導(dǎo)小組應(yīng)在第一時(shí)間內(nèi)集中所有二氧化碳滅火器,抓住時(shí)機(jī),盡可能的把火撲滅。
5.配合消防部門(mén)調(diào)查事故原因,對(duì)造成的損失和起火原因做好記錄,以便進(jìn)行災(zāi)后總結(jié)。
第四條
雷擊事故應(yīng)急預(yù)案如下:
1.遇雷暴天氣,機(jī)房管理人員在下班后應(yīng)及時(shí)關(guān)閉所有服務(wù)器,切斷電源,暫停內(nèi)部計(jì)算 機(jī)網(wǎng)絡(luò)工作。
2.雷暴天氣結(jié)束后,機(jī)房管理人員應(yīng)及時(shí)開(kāi)通服務(wù)器,恢復(fù)內(nèi)部計(jì)算機(jī)網(wǎng)絡(luò)工作,對(duì)設(shè)備 和數(shù)據(jù)進(jìn)行檢查。出現(xiàn)故障的,事發(fā)部門(mén)應(yīng)將故障情況及時(shí)報(bào)告機(jī)房管理人員。
3.因雷擊造成損失的,機(jī)房管理人員應(yīng)會(huì)同相關(guān)部門(mén)進(jìn)行核實(shí)、報(bào)損,并在調(diào)查工作結(jié)束 后一日內(nèi)書(shū)面報(bào)告領(lǐng)導(dǎo)。
第五條
設(shè)備防盜被盜或人為損害應(yīng)急預(yù)案如下:
1.機(jī)房管理人員每日查看、清點(diǎn)設(shè)備并鎖好機(jī)房大門(mén)。
2.機(jī)房管理人員每日檢查錄像監(jiān)控服務(wù)器狀態(tài),確保監(jiān)控畫(huà)面正常,并檢查每日錄像正常性、完整性。
3.發(fā)生設(shè)備被盜或人為損害設(shè)備情況時(shí),使用者或管理者應(yīng)立即報(bào)告相關(guān)負(fù)責(zé)人,同時(shí)保護(hù)好現(xiàn)場(chǎng)。
4.機(jī)房維護(hù)人員接報(bào)后,通知保安及公安部門(mén),一同核實(shí)審定現(xiàn)場(chǎng)情況,清點(diǎn)被盜物資或盤(pán)查人為損害情況,做好必要的影像記錄和文字記錄。
5.事發(fā)單位和當(dāng)事人應(yīng)積極配合公安部門(mén)進(jìn)行調(diào)查,并將有關(guān)情況向機(jī)房管理人員匯報(bào)。
第六條
機(jī)房停電應(yīng)急預(yù)案如下:
1.接到停電通知后,機(jī)房管理人員應(yīng)及時(shí)通過(guò)辦公系統(tǒng)、電話等發(fā)布相關(guān)信息,部署應(yīng)對(duì)具體措施,要求用戶在停電前停止業(yè)務(wù)、保存數(shù)據(jù)。
2.機(jī)房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時(shí),UPS電源能自動(dòng)供應(yīng)服務(wù)器正常工作半個(gè)小時(shí),保證員工工作的數(shù)據(jù)及時(shí)保存。
第七條
通信網(wǎng)絡(luò)故障應(yīng)急預(yù)案如下:
1.發(fā)生通信線路中斷、流量異常等故障后,員工應(yīng)及時(shí)通知機(jī)房管理人員。
2.機(jī)房管理人員在接到報(bào)告后,迅速組織相關(guān)技術(shù)人員檢測(cè)故障區(qū)域,并作相關(guān)故障處理,必要時(shí)通知通信網(wǎng)絡(luò)運(yùn)營(yíng)商查清原因;逐步恢復(fù)故障區(qū)與服務(wù)器的網(wǎng)絡(luò)聯(lián)接,恢復(fù)通信網(wǎng)絡(luò),保證正常運(yùn)轉(zhuǎn)。
3.應(yīng)急處理結(jié)束后,機(jī)房管理人員應(yīng)在一日之內(nèi)提交故障分析報(bào)告,以便備案。
第八條
服務(wù)器故障應(yīng)急預(yù)案如下:
1.機(jī)房管理人員每日檢查服務(wù)器狀態(tài),檢查郵箱服務(wù)器狀態(tài),確保系統(tǒng)運(yùn)行的完善。
2.機(jī)房管理人員定期備份服務(wù)器數(shù)據(jù),并將備份資料刻錄成光盤(pán)或拷貝到移動(dòng)硬盤(pán)。
第九條
1.發(fā)生機(jī)房突發(fā)事件后,機(jī)房管理人員應(yīng)采取有效措施開(kāi)展先期處置,恢復(fù)信息網(wǎng)絡(luò)正常狀態(tài)。應(yīng)急處置工作結(jié)束后,機(jī)房管理人員對(duì)事件發(fā)生原因、性質(zhì)、影響、后果、責(zé)任及應(yīng)急處置能力、恢復(fù)重建等問(wèn)題進(jìn)行全面調(diào)查評(píng)估,根據(jù)應(yīng)急處置中暴露出的管理、協(xié)調(diào)和技術(shù)問(wèn)題,改進(jìn)和完善預(yù)案,實(shí)施針對(duì)性演練,總結(jié)經(jīng)驗(yàn)教訓(xùn),整改存在隱患,組織恢復(fù)正常工作秩序。
第四篇:機(jī)房火災(zāi)事故應(yīng)急預(yù)案
機(jī)房火災(zāi)事故應(yīng)急預(yù)案
1.總則 1.1編制目的
為高效有序地做好機(jī)房火災(zāi)事故的應(yīng)急處置工作,避免或最大程度地減輕火災(zāi)事故造成的損失,保障員工生命和企業(yè)財(cái)產(chǎn)安全,維護(hù)社會(huì)穩(wěn)定。1.2編制依據(jù)
《中華人民共和國(guó)安全生產(chǎn)法》 《江蘇省消防條例》 1.3適用范圍
適用于機(jī)房火災(zāi)事故的現(xiàn)場(chǎng)應(yīng)急處置和應(yīng)急救援工作。2.事件特征
2.1事件類型及危險(xiǎn)性分析
2.1.1電氣線路短路、過(guò)載、接觸電阻過(guò)大,靜電,雷擊等強(qiáng)電侵入,機(jī)房?jī)?nèi)電腦、空調(diào)等用電設(shè)備長(zhǎng)時(shí)間通電過(guò)熱、設(shè)備故障等原因均可能引起計(jì)算機(jī)房的火災(zāi)事故。
2.1.2機(jī)房火災(zāi)事故會(huì)造成計(jì)算機(jī)設(shè)備損壞、系統(tǒng)故障網(wǎng)絡(luò)中斷或癱瘓,影響網(wǎng)絡(luò)的安全運(yùn)行。
2.1.3火災(zāi)產(chǎn)生的有毒煙霧污染機(jī)房的空氣,造成人員中毒、窒息等人身傷亡事故。3.應(yīng)急組織及職責(zé) 3.1火災(zāi)應(yīng)急指揮部
應(yīng)急指揮部總指揮: 機(jī)房火災(zāi)應(yīng)急搶險(xiǎn)指揮: 成員:
3.2指揮部人員的職責(zé)
3.2.1指揮的職責(zé):全面指揮突發(fā)事件應(yīng)急救援工作。
3.2.2高低壓專業(yè)職責(zé):組織、協(xié)調(diào)本部門(mén)人員參加應(yīng)急處置和救援工作,對(duì)發(fā)生險(xiǎn)情機(jī)房切斷電源。
3.2.3智能化專業(yè)職責(zé):監(jiān)控相關(guān)區(qū)域事故情況。
3.2.4空調(diào)專業(yè)職責(zé):發(fā)現(xiàn)異常情況,及時(shí)切斷空調(diào)、通風(fēng)系統(tǒng),做好運(yùn)行方式的調(diào)整和故障設(shè)備的隔離。4應(yīng)急處置
4.1現(xiàn)場(chǎng)應(yīng)急處置程序
4.1.1最早發(fā)現(xiàn)火情者應(yīng)立即向值班長(zhǎng)和機(jī)房負(fù)責(zé)人匯報(bào),機(jī)房負(fù)責(zé)人到現(xiàn)場(chǎng)指揮滅火,同時(shí)報(bào)告公司領(lǐng)導(dǎo),啟動(dòng)本預(yù)案。
4.1.2機(jī)房負(fù)責(zé)人根據(jù)事故狀態(tài)及危害程度做出相應(yīng)的應(yīng)急決定,指揮疏散現(xiàn)場(chǎng)無(wú)關(guān)人員,各應(yīng)急救援隊(duì)立即開(kāi)展救援。
4.1.3事故擴(kuò)大時(shí),撥打119報(bào)警電話請(qǐng)求市消防隊(duì)支援。報(bào)警內(nèi)容:?jiǎn)挝幻Q、地址、著火物質(zhì)、火勢(shì)大小、著火范圍。把自己的電話號(hào)碼和姓名告訴對(duì)方,以便聯(lián)系。同時(shí)還要注意聽(tīng)清對(duì)方提出的問(wèn)題,以便正確回答。打完電話后,要立即到交叉路口等候消防車的到來(lái),以便引導(dǎo)消防車迅速趕到火災(zāi)現(xiàn)場(chǎng)。4.2現(xiàn)場(chǎng)應(yīng)急處置措施
4.2.1機(jī)房負(fù)責(zé)人組織人員迅速查明著火原因。4.2.2發(fā)生火災(zāi)事故后,運(yùn)行值班人員在人身安全不受危害的情況下要堅(jiān)守本職崗位,確保設(shè)備運(yùn)行。
4.2.3火災(zāi)初起階段,值班人員要利用區(qū)域內(nèi)常規(guī)滅火器(干粉或氣體滅火器)進(jìn)行撲救。控制初起火災(zāi),防止火勢(shì)蔓延。根據(jù)火勢(shì)情況立即啟動(dòng)氣體自動(dòng)滅火裝置。
4.2.4被困火場(chǎng)逃生時(shí),應(yīng)用濕毛巾捂住口鼻,背向煙火方向迅速離開(kāi)。逃生通道被切斷、短時(shí)間內(nèi)無(wú)人救援時(shí),應(yīng)關(guān)緊迎火門(mén)窗,用濕毛巾、濕布堵塞門(mén)縫,用水淋透房門(mén),防止煙火侵入。
4.2.5火災(zāi)發(fā)生時(shí)要采取有效措施撲滅身上的火焰,使傷員迅速脫離開(kāi)致傷現(xiàn)場(chǎng)。當(dāng)衣服著火時(shí),應(yīng)采用各種方法盡快地滅火,如水浸、水淋、就地臥倒翻滾等,千萬(wàn)不可直立奔跑或站立呼喊,以免助長(zhǎng)燃燒,引起或加重呼吸道燒傷。滅火后傷員應(yīng)立即將衣服脫去,如衣服和皮膚粘在一起,可在救護(hù)人員的幫助下把未粘的部分剪去,并對(duì)創(chuàng)面進(jìn)行包扎。
4.2.6在火場(chǎng),對(duì)于燒傷創(chuàng)面一般可不做特殊處理,盡量不要弄破水泡,不能涂龍膽紫一類有色的外用藥,以免影響燒傷面深度的判斷。為防止創(chuàng)面繼續(xù)污染,避免加重感染和加深創(chuàng)面,對(duì)創(chuàng)面應(yīng)立即用三角巾、大紗布?jí)K、清潔的衣眼和被單等,給予簡(jiǎn)單而確實(shí)的包扎。手足被燒傷時(shí),應(yīng)將各個(gè)指、趾分開(kāi)包扎,以防粘連。
4.2.7消防隊(duì)到達(dá)火場(chǎng)時(shí),應(yīng)立即與消防隊(duì)負(fù)責(zé)人取得聯(lián)系并交待失火設(shè)備現(xiàn)狀和運(yùn)行設(shè)備狀況,然后協(xié)助消防隊(duì)滅火,并提供技術(shù)支援。4.2.8復(fù)情況,事故應(yīng)急處理全部結(jié)束,才能恢復(fù)生產(chǎn)秩序。4.3火災(zāi)事故報(bào)告流程
4.3.1出現(xiàn)火情后,值班人員除采取有效措施撲滅初期火情外應(yīng)立即想機(jī)房負(fù)責(zé)人匯報(bào);
4.3.2火勢(shì)無(wú)法控制時(shí)由機(jī)房負(fù)責(zé)人決定報(bào)火警請(qǐng)求轄區(qū)消防隊(duì)救援。并在在火災(zāi)事故發(fā)生后1小時(shí)內(nèi)向所云匯報(bào)突發(fā)事件信息。速報(bào)內(nèi)容主要包括事故發(fā)生的時(shí)間、地點(diǎn)、人員傷亡、設(shè)備損壞情況、可能的引發(fā)因素和發(fā)展趨勢(shì)等。4.3.3聯(lián)系方式
消防隊(duì): 119 醫(yī)務(wù)急救:120 4.4注意事項(xiàng)
4.4.1應(yīng)急處置時(shí)注意防止中毒、窒息、觸電、燙傷。
4.4.2危險(xiǎn)區(qū)設(shè)好警戒線,并掛好標(biāo)示牌。無(wú)操作權(quán)限的人員不得亂動(dòng)現(xiàn)場(chǎng)設(shè)備。
4.4.3佩戴個(gè)人防護(hù)器具時(shí)注意檢查防護(hù)用品合格,且在有效檢驗(yàn)期內(nèi);正確佩戴使用正壓式呼吸器、隔熱服、隔熱手套、絕緣靴等安全防護(hù)用具。
4.4.4現(xiàn)場(chǎng)自救和互救時(shí)不熟悉現(xiàn)場(chǎng)情況和滅火方法的人員不得盲目進(jìn)入危險(xiǎn)區(qū)域,救人前先確認(rèn)自己的能力和現(xiàn)場(chǎng)情況是否能夠滿足對(duì)他人施救的需要。
4.4.5應(yīng)急救援結(jié)束后要全面檢查,確認(rèn)現(xiàn)場(chǎng)無(wú)火災(zāi)隱患和建筑物坍塌的隱患。4.4.6加強(qiáng)自身防護(hù),避免救火導(dǎo)致人身傷害。4.5附則
4.5.1機(jī)房應(yīng)急人員的聯(lián)系方式。
第五篇:機(jī)房用電應(yīng)急預(yù)案
1,機(jī)房意外停電后,首先確定停電的范圍以及受影響的設(shè)備范圍。2,確認(rèn)停電的范圍為本樓或本校區(qū),應(yīng)立即打后勤管理處電話匯報(bào)。估算電力可能恢復(fù)的時(shí)間。并通知網(wǎng)絡(luò)中心領(lǐng)導(dǎo)。3,如果確認(rèn)停電的時(shí)間為1個(gè)小時(shí)內(nèi),可以在UPS正常供電的時(shí)間內(nèi),等到電力恢復(fù),如果不能確認(rèn)在2小時(shí)內(nèi)恢復(fù),立即匯報(bào)給機(jī)房電源維護(hù)負(fù)責(zé)人和中心機(jī)房各設(shè)備的負(fù)責(zé)人到達(dá)現(xiàn)場(chǎng)。做好各設(shè)備的電源停電準(zhǔn)備,在UPS供電達(dá)1.5小時(shí)后,嚴(yán)格殷實(shí)操作手冊(cè)停掉存儲(chǔ)和各應(yīng)用服務(wù)器的電源。最后停核心交換機(jī)和路由器,等待電力恢復(fù)。電力恢復(fù)供電后轉(zhuǎn)第七條執(zhí)行。如果確認(rèn)停電的范圍僅在于本機(jī)房電源故障。立即匯報(bào)給機(jī)房電源維護(hù)負(fù)責(zé)人。4,機(jī)房維護(hù)負(fù)責(zé)人將掉電的電源柜總空開(kāi)和分空開(kāi)的狀態(tài)處于下電狀態(tài)。并向主管領(lǐng)導(dǎo)匯報(bào)。馬上聯(lián)系相關(guān)廠家,如有可能請(qǐng)廠家立即到現(xiàn)場(chǎng)支持。5,將掉電的所有設(shè)備電源處于下電狀態(tài)。以防止電源柜加電對(duì)設(shè)備的沖擊。6,等各廠家和相關(guān)人員到齊后,商議設(shè)備恢復(fù)時(shí)間因注意的事項(xiàng)。并形成相關(guān)文檔。7,電力室恢復(fù)供電后,先不要急于給電源柜加電,等待10-20分鐘后,再開(kāi)始給電源柜加電,以防止供電不穩(wěn)定或再次掉電。8,供電正常后,確定設(shè)備處于下電狀態(tài)后,打開(kāi)電力柜的總控開(kāi)。9,根據(jù)設(shè)備加電順序,啟動(dòng)分項(xiàng)空開(kāi)。10,設(shè)備加電順序,IP交換機(jī)和SAN交換機(jī)正常后再給存儲(chǔ)加電,存儲(chǔ)狀態(tài)檢查正常后,啟動(dòng)主機(jī)(以上各設(shè)備務(wù)必按操作手冊(cè)的啟動(dòng)順序上電).11,設(shè)備啟動(dòng)正常后,開(kāi)始啟動(dòng)數(shù)據(jù)庫(kù)。12,數(shù)據(jù)庫(kù)啟動(dòng)正常后,開(kāi)始啟動(dòng)中間件服務(wù)器。13,中間件服務(wù)器正常后,啟動(dòng)應(yīng)用程序。
2,核心機(jī)房電力的保障一直是維護(hù)體系的頭等重要事項(xiàng),通過(guò)實(shí)施應(yīng)急發(fā)電演練,建立了可靠的應(yīng)急預(yù)案機(jī)制,最大限度的降低電源中斷對(duì)網(wǎng)絡(luò)傳輸質(zhì)量的影響。現(xiàn)分享核心機(jī)房電源中斷應(yīng)急預(yù)案,希望分公司盡快建立一套統(tǒng)一指揮、職責(zé)明確、反應(yīng)迅速、處置有力的機(jī)房安全保障機(jī)制。3,組織架構(gòu): 4,責(zé)任領(lǐng)導(dǎo)、工程維護(hù)、網(wǎng)絡(luò)監(jiān)控、網(wǎng)絡(luò)運(yùn)維、質(zhì)量管理等相關(guān)人員。
5,機(jī)房電源系統(tǒng)說(shuō)明: 6,1.機(jī)房電力是兩路三相四線制供電,進(jìn)線線纜規(guī)格為:RVV50*4+16*1銅芯護(hù)套線。
7,2.機(jī)房電源系統(tǒng)采用三級(jí)防雷系統(tǒng),三級(jí)防雷分別位于電源進(jìn)線端、UPS輸入前端。
8,3.機(jī)房現(xiàn)有兩臺(tái)60KVA-UPS電源,均處于正常運(yùn)行狀態(tài)。
9,4.機(jī)房現(xiàn)有設(shè)備機(jī)柜已編號(hào),均通過(guò)UPS電源和市電供電,每個(gè)機(jī)柜有獨(dú)立的20A空氣開(kāi)關(guān)??照{(diào)、墻壁插座開(kāi)關(guān)、應(yīng)急燈、照明等都是單獨(dú)空開(kāi)接市電。
10,5.運(yùn)行中的UPS電源所帶負(fù)荷,在逆變運(yùn)行狀態(tài)下能正常工作約4小時(shí)(已經(jīng)過(guò)UPS放電測(cè)試)。
11,一.核心機(jī)房電源中斷預(yù)案
12,1.在接到停電通知的情況下: 13,1)計(jì)劃性停電通知要確保綜合部、工維機(jī)房管理部對(duì)口人接到通知(提前將對(duì)口聯(lián)系人備案在物業(yè)處),機(jī)房管理員接到計(jì)劃停電通知后,升級(jí)到調(diào)度中心進(jìn)行信息發(fā)送,同步進(jìn)行郵件通知相應(yīng)應(yīng)急小組成員。并與負(fù)責(zé)組長(zhǎng)及責(zé)任領(lǐng)導(dǎo)電話告知,確保已經(jīng)接收到本次停電的時(shí)間及可能發(fā)生的情況。
14,2)維部進(jìn)行發(fā)電應(yīng)急預(yù)案小組成員通知,提前做好機(jī)房發(fā)電預(yù)案要求的準(zhǔn)備工作,將相應(yīng)的發(fā)電機(jī)、連接線、人員安排到位,各司其職,隨時(shí)待命現(xiàn)場(chǎng),做發(fā)電準(zhǔn)備工作。確保停電時(shí)刻的電力安全及機(jī)房用電的保障措施,提前調(diào)度安排好相應(yīng)人員做好保障用電的措施。
15,3)計(jì)劃停電時(shí)間開(kāi)始后,馬上啟動(dòng)應(yīng)急發(fā)電操作,按照機(jī)房發(fā)電操作步驟實(shí)施階梯供電的步驟,恢復(fù)市電保障。并進(jìn)行現(xiàn)場(chǎng)值守及設(shè)備工作確認(rèn),確保全部正常后電話告知調(diào)度中心及維護(hù)體系領(lǐng)導(dǎo)。
16,2.在沒(méi)有接到任何通知,突然發(fā)生停電的情況下:
17,確認(rèn)停電線路,停電時(shí)刻,停電時(shí)間等要素,啟動(dòng)核心機(jī)房發(fā)電應(yīng)急預(yù)案。
18,1)值班網(wǎng)管工作流程:
19,⑴值班網(wǎng)管監(jiān)控到核心機(jī)房停電,第一時(shí)間告知工維部、網(wǎng)絡(luò)部、運(yùn)維部應(yīng)急小組組長(zhǎng)。信息傳達(dá)到工維部機(jī)房管理員(一主一備),告知停電開(kāi)始時(shí)間。
20,要求在停電5分鐘內(nèi)將消息傳達(dá)到調(diào)度中心,各應(yīng)急小組組長(zhǎng)。如無(wú)法聯(lián)系上,進(jìn)行升級(jí)到責(zé)任領(lǐng)導(dǎo)-工維部經(jīng)理經(jīng)理處。21,⑵網(wǎng)管將停電信息電話傳達(dá)后,進(jìn)行調(diào)度派單,確保全部的應(yīng)急小組成員都收到本次故障停電的信息。然后進(jìn)行機(jī)房中設(shè)備的檢查,包括:UPS設(shè)備主機(jī)、各核心設(shè)備、匯聚設(shè)備、服務(wù)器、語(yǔ)音系統(tǒng)等。檢查是否受影響。同時(shí)啟動(dòng)機(jī)房降溫措施(降溫方案:初步為加裝抽排風(fēng)設(shè)備、增加大風(fēng)扇排風(fēng)形成熱量流動(dòng)降溫)22,⑶實(shí)時(shí)監(jiān)控設(shè)備及UPS工作情況,包括:電量下降情況,設(shè)備工作正常情況,每15分鐘通報(bào)一次電量情況。
23,2)運(yùn)維部應(yīng)急工作流程:
24,⑴運(yùn)維應(yīng)急同事接到故障通告后,第一時(shí)間往停電現(xiàn)場(chǎng)趕,到現(xiàn)場(chǎng)配合網(wǎng)管/工維部門(mén)進(jìn)行設(shè)備儀器的檢查、客服語(yǔ)音系統(tǒng)的保障,應(yīng)急發(fā)電的協(xié)助。
25,⑵現(xiàn)場(chǎng)配合進(jìn)行機(jī)房降溫散熱措施實(shí)施,實(shí)時(shí)檢查網(wǎng)絡(luò)設(shè)備的工作情況。
26,3)運(yùn)營(yíng)質(zhì)量管理應(yīng)急工作流程:
27,⑴調(diào)度中心值班人員接到網(wǎng)管監(jiān)控調(diào)度信息后,第一時(shí)間將故障信息記錄并發(fā)故障通告到相關(guān)應(yīng)急成員,并電話通知各應(yīng)急小組組長(zhǎng)是否知悉。
28,⑵進(jìn)行客服調(diào)度系統(tǒng)的設(shè)備工作運(yùn)行系統(tǒng)檢查,特別語(yǔ)音系統(tǒng)級(jí)坐席電腦,是否有問(wèn)題,如發(fā)現(xiàn)工作系統(tǒng)有異常,及時(shí)與運(yùn)維應(yīng)急小組成員溝通,進(jìn)行檢查處理。
29,⑶實(shí)時(shí)關(guān)注故障工單流程進(jìn)度登記,配合應(yīng)急小組進(jìn)行人員調(diào)度通告。30,4)工維部應(yīng)急工作流程:
31,⑴機(jī)房管理員第一時(shí)間往停電現(xiàn)場(chǎng)趕,同時(shí)進(jìn)行電話溝通供電公司、物業(yè)方等,咨詢停電原因,是屬于計(jì)劃性還是突發(fā)性停電,預(yù)計(jì)停電時(shí)長(zhǎng),將咨詢清楚的結(jié)果反饋到應(yīng)急小組成員中,電話聯(lián)系物業(yè)溝通好需要發(fā)電需求申請(qǐng)。
32,⑵工維應(yīng)急小組組長(zhǎng)接到時(shí)間后第一時(shí)間往停電現(xiàn)場(chǎng)趕,同時(shí)進(jìn)行發(fā)電應(yīng)急小組成員調(diào)度,安排第一時(shí)間到場(chǎng)工作開(kāi)展,并升級(jí)通報(bào)告知主管領(lǐng)導(dǎo),對(duì)口集團(tuán)維護(hù)中心上報(bào)信息。
33,⑶工維應(yīng)急小組成員接到停電時(shí)間后第一時(shí)間往停電現(xiàn)場(chǎng)趕,要求30分鐘內(nèi)必須到場(chǎng)(住機(jī)房附近的人員往現(xiàn)場(chǎng)去,較遠(yuǎn)同事可以進(jìn)行打車往現(xiàn)場(chǎng)去),先行到處同事配合網(wǎng)管、運(yùn)維同事啟動(dòng)做好應(yīng)急發(fā)電前的準(zhǔn)備:連接線布放、接續(xù)、發(fā)電機(jī)發(fā)電前檢測(cè)油/電/水路檢查,確保正常。確保一切就緒后,確認(rèn)可以進(jìn)行發(fā)電操作后,按照發(fā)電操作流程進(jìn)行發(fā)電恢復(fù)市電。
34,⑷網(wǎng)管將監(jiān)控到停電的相應(yīng)信息及級(jí)別同步發(fā)送到運(yùn)營(yíng)質(zhì)量管理部調(diào)度崗,由調(diào)度崗將相應(yīng)信息進(jìn)行工維、運(yùn)維、網(wǎng)絡(luò)關(guān)聯(lián)同事進(jìn)行信息告知,同時(shí)報(bào)工維主管領(lǐng)導(dǎo)知悉。
35,5)應(yīng)急機(jī)房發(fā)電操作流程:
36,⑴機(jī)房用電系統(tǒng)包括四方面:空調(diào)制冷、主/備UPS主機(jī)、照明系統(tǒng)、客服調(diào)度系統(tǒng)。37,⑵發(fā)電前考慮4方面系統(tǒng)設(shè)備用電功率情況,為保障發(fā)電機(jī)帶動(dòng)的正常,不能進(jìn)行同步供電,要區(qū)分優(yōu)先恢復(fù)的步驟實(shí)施,確認(rèn)發(fā)電機(jī)的工作正常。在發(fā)電前將需要供電的“空調(diào)制冷、主/備UPS主機(jī)、照明系統(tǒng)、客服調(diào)度系統(tǒng)”的市電輸入主開(kāi)關(guān)關(guān)閉。防止同步啟動(dòng)時(shí)發(fā)電機(jī)的無(wú)法供電保證。
38,⑶啟動(dòng)發(fā)電機(jī),檢測(cè)發(fā)電輸出電流通斷,待發(fā)電機(jī)運(yùn)行穩(wěn)定后。
39,第一步啟動(dòng)空調(diào)制冷系統(tǒng)的市電輸入開(kāi)關(guān),運(yùn)維應(yīng)急小組成員重新啟動(dòng)空調(diào)主機(jī)(空調(diào)因?yàn)槭须娀謴?fù)后需要重新啟動(dòng))觀察空調(diào)制冷工作是否正常。
40,第二步啟動(dòng)主UPS設(shè)備的市電輸入開(kāi)關(guān),觀察發(fā)電機(jī)運(yùn)行穩(wěn)定情況,主UPS主機(jī)工作穩(wěn)定情況,網(wǎng)絡(luò)設(shè)備的工作正常與否。
41,第三步啟動(dòng)客服系統(tǒng)的市電輸入開(kāi)關(guān),包括(客服坐席電腦、UPS設(shè)備、空調(diào)制冷等),觀察發(fā)電機(jī)運(yùn)行穩(wěn)定情況,設(shè)備恢復(fù)工作情況。
42,第四步啟動(dòng)備UPS設(shè)備、市電照明的市電輸入開(kāi)關(guān),觀察發(fā)電機(jī)運(yùn)行穩(wěn)定情況,備UPS主機(jī)工作穩(wěn)定情況,網(wǎng)絡(luò)設(shè)備的工作正常與否。
43,⑷發(fā)電機(jī)啟動(dòng),市電輸入正常后,網(wǎng)管將降溫系統(tǒng)的抽排風(fēng)設(shè)備關(guān)閉,與運(yùn)維同事進(jìn)行所有設(shè)備的運(yùn)行進(jìn)行全面的檢查,確保設(shè)備已經(jīng)是運(yùn)行正常。
44,⑸發(fā)電機(jī)發(fā)起市電正常后,工維應(yīng)急小組安排專人現(xiàn)場(chǎng)值守,及時(shí)關(guān)注發(fā)電機(jī)油量情況,同時(shí)與油品供應(yīng)商確認(rèn)油品配送要求及時(shí)間要求,并實(shí)時(shí)與供電部門(mén)確認(rèn)市電恢復(fù)時(shí)間。
45,6)停電過(guò)程中突發(fā)事項(xiàng)預(yù)防: 46,⑴網(wǎng)管在停電時(shí)進(jìn)行機(jī)房確認(rèn)運(yùn)行中的UPS工作組、設(shè)備組工作狀態(tài)。主/備UPS工作切換是否正常,在市電中斷時(shí)UPS是否已經(jīng)開(kāi)始進(jìn)行供電保護(hù)。
47,⑵值班網(wǎng)管對(duì)機(jī)房中的所有設(shè)備進(jìn)行全面檢查,確保所有的設(shè)備已經(jīng)是有主備供電,市電中斷后UPS已經(jīng)正常保障設(shè)備工作。同時(shí)對(duì)機(jī)房的溫度進(jìn)行觀察,溫度是否突然升高。
48,⑶停電后,UPS處于逆變工作狀態(tài),當(dāng)班人員要每隔15分鐘觀察一次UPS的蓄電池容量、帶負(fù)荷情況、機(jī)房環(huán)境溫度,盡量使蓄電池容量大于60%,帶負(fù)荷小于85%(因?yàn)橐呀?jīng)有自購(gòu)發(fā)電機(jī)應(yīng)急,盡快要求短時(shí)間發(fā)起電,減少UPS的放電過(guò)度)。
49,⑷發(fā)現(xiàn)機(jī)房環(huán)境溫度大于26℃。當(dāng)以上指標(biāo)不能保證時(shí),要及時(shí)向機(jī)房管理員匯報(bào),同時(shí)上報(bào)責(zé)任領(lǐng)導(dǎo)知悉,網(wǎng)管預(yù)案小組成員經(jīng)過(guò)慎重討論,適時(shí)采取關(guān)閉不必要網(wǎng)絡(luò)的網(wǎng)絡(luò)設(shè)備、加強(qiáng)通風(fēng)降溫等措施盡量延長(zhǎng)關(guān)鍵設(shè)備運(yùn)行時(shí)間
50,三.應(yīng)急發(fā)電機(jī)的油品保障措施
51,發(fā)電機(jī)正常啟動(dòng)后,需要做到油品及時(shí)供應(yīng),具體保障措施方案為: 52,1.確認(rèn)多家供應(yīng)商進(jìn)行油品供應(yīng),簽署油品供應(yīng)協(xié)議,確保油品的供應(yīng)充足。
53,2.油品的供應(yīng)以應(yīng)急小組成員通知后開(kāi)始準(zhǔn)備,協(xié)議要求是6小時(shí)內(nèi)送貨到場(chǎng)。54,3.只要進(jìn)行發(fā)電一小時(shí)以上,則必須在停止發(fā)電后補(bǔ)充滿油品,確保發(fā)電機(jī)隨時(shí)都是滿配油品保障中。
55,4.油品的零購(gòu)是屬于公安部門(mén)的監(jiān)管,所以分公司提前將資料向公安部門(mén)報(bào)備,在公司因?yàn)樘厥庠蛴辛阗?gòu)油品需求,在公安部門(mén)已經(jīng)有分公司備案資料下,每次使用零購(gòu)油品進(jìn)行公安部門(mén)蓋章申請(qǐng)??梢噪S時(shí)進(jìn)行購(gòu)買(mǎi)。
56,四.恢復(fù)交流電后的處理措施
57,1.打開(kāi)電力室和網(wǎng)絡(luò)機(jī)房空調(diào)市電開(kāi)關(guān),并將調(diào)節(jié)溫度設(shè)定為20℃。首先恢復(fù)機(jī)房制冷系統(tǒng)的正常工作。
58,2.等供電穩(wěn)定后(一般在恢復(fù)市電10分鐘后),閉合主/備UPS設(shè)備空氣開(kāi)關(guān),恢復(fù)給主/備UPS交流供電。觀察并確認(rèn)UPS轉(zhuǎn)換為交流穩(wěn)壓和浮充狀態(tài)。
59,3.閉合客服系統(tǒng)的主空氣開(kāi)關(guān),恢復(fù)客服系統(tǒng)的交流供電,并觀察設(shè)備工作運(yùn)行情況。
60,4.觀察10分鐘后,確保所有網(wǎng)絡(luò)及設(shè)備、UPS設(shè)備組工作穩(wěn)定后,將發(fā)電機(jī)停止發(fā)電,并將情況報(bào)告給調(diào)度及主管領(lǐng)導(dǎo)。
61,5.應(yīng)急小組將發(fā)電的物資進(jìn)行收拾整理存放好,并進(jìn)行記錄發(fā)電機(jī)的工作時(shí)間及油/水/電路的切斷。機(jī)房的降溫設(shè)備的關(guān)閉確認(rèn)及物資收拾整理存放好。62,6.將處理情況做詳細(xì)書(shū)面記錄,請(qǐng)相關(guān)人員簽字確認(rèn)并報(bào)集團(tuán)公司信息化系統(tǒng)管理平臺(tái)上填寫(xiě)相關(guān)記錄。
63,五.發(fā)電機(jī)的日常維護(hù)措施
64,對(duì)于柴油發(fā)電機(jī)來(lái)說(shuō),由于它不是日常的主要供電設(shè)備,所以日常的維護(hù)保養(yǎng)主要包括以下幾個(gè)方面:
65,1.定期檢查和更換柴油過(guò)濾器和機(jī)油過(guò)濾器
66,2.定期清理檢查進(jìn)氣過(guò)濾器,并在固定的周期進(jìn)行更換(或者根據(jù)現(xiàn)場(chǎng)的工況和進(jìn)氣過(guò)濾器的透氣程度進(jìn)行更換)67,3.定期檢查和清理電池組接線柱,保持接線柱清潔
68,4.定期檢查電池組的充電狀態(tài),保證良好的充電效果
69,5.定期檢查風(fēng)扇皮帶的狀態(tài),確保無(wú)損傷和處于正常的松緊度
70,6.定期檢查冷卻液的狀態(tài),確保滿足要求
71,7.定期檢查或者更換柴油機(jī)機(jī)油,確保油位正常
72,8.冬天寒冷季節(jié)要確保機(jī)組預(yù)熱裝置正常工作,以便在需要啟動(dòng)發(fā)電機(jī)時(shí)能正常啟動(dòng)
1.機(jī)房工作人員應(yīng)具備用電常識(shí),了解機(jī)房供電布局、開(kāi)關(guān)位置、設(shè)備供電來(lái)源等,機(jī)房工作時(shí)間注意用電安全和自身安全。
2.機(jī)房工作人員不得私自更改設(shè)備供電線路,對(duì)自己所管設(shè)備進(jìn)行斷電操作時(shí)不能影響其他設(shè)備供電,新增設(shè)備需要供電應(yīng)由機(jī)房電力管理員統(tǒng)一調(diào)配。
3.機(jī)房禁止使用高溫、熾熱、產(chǎn)生火花的大功率或危險(xiǎn)設(shè)備,確需使用電焊、電鉆等,須在電力管理員指導(dǎo)下用電。
4.工作時(shí)發(fā)現(xiàn)用電安全隱患如漏電、火花、設(shè)備異常發(fā)燒等現(xiàn)象,應(yīng)立即報(bào)告機(jī)房電力管理員,并協(xié)助進(jìn)行處理。
5、機(jī)房停電需要啟用內(nèi)部發(fā)電系統(tǒng)時(shí),設(shè)備管理人須在場(chǎng)及時(shí)檢查自管設(shè)備是否正常供電。
6、機(jī)房電力管理員應(yīng)定期對(duì)機(jī)房供電設(shè)備、線路、電源、開(kāi)關(guān)等相關(guān)設(shè)備進(jìn)行安全檢查,及時(shí)排除用電安全隱患。
1.綜述 為盡量避免機(jī)房?jī)?nèi)電力意外事故,以保障人身安全、防止設(shè)備損壞及影響供電系統(tǒng)等為目的。規(guī)范數(shù)據(jù)中心機(jī)房設(shè)備加電、日常操作的用電安全防護(hù)措施,制定本文檔。
2.范圍 本文檔適用于北京移動(dòng)數(shù)據(jù)中心所有機(jī)房(菜市口、望京、昌平、豐臺(tái)、大白樓)。
3.用電安全措施 機(jī)房日常用電安全的最高準(zhǔn)則為確保人員安全。3.1 設(shè)備用電安全措施 3.1.1設(shè)備上架加電要求
?? 所有進(jìn)入機(jī)房,需使用機(jī)房電源的設(shè)備應(yīng)為正規(guī)品牌且具有3C標(biāo)志(即中國(guó)強(qiáng)制性產(chǎn)品認(rèn)證)中CCC+5安全認(rèn)證標(biāo)志或CCC+S&B安全與電磁兼容認(rèn)證標(biāo)志任意一個(gè)。任何自行組裝(DIY)設(shè)備不得上架加電。? 設(shè)備上架加電前應(yīng)在機(jī)房外,使用非機(jī)房(生產(chǎn)用電)電源進(jìn)行加電、開(kāi)機(jī)測(cè)試,測(cè)試該設(shè)備電源組件為正常運(yùn)行方可上架加電。? 不能在機(jī)房外加電測(cè)試的直流電設(shè)備,進(jìn)入機(jī)房后首次加電需機(jī)房負(fù)責(zé)人,電力維護(hù)人員,中通維護(hù)人員,運(yùn)維人員及客戶同時(shí)在場(chǎng)。? 不能在機(jī)房加電測(cè)試的其他交流電設(shè)備,進(jìn)入機(jī)房后首次加電需機(jī)房負(fù)責(zé)人中通維護(hù)人員,運(yùn)維人員及客戶同時(shí) 在場(chǎng)。? 設(shè)備上架后,加電前,由中通維護(hù)人員對(duì)機(jī)柜電源進(jìn)行通路、電壓測(cè)試,測(cè)試結(jié)果正常后由客戶自行閉合對(duì)應(yīng)的空開(kāi)?!褚陨先我庖稽c(diǎn)不能達(dá)到標(biāo)準(zhǔn),必須由機(jī)房負(fù)責(zé)人書(shū)面(包含郵件)批準(zhǔn)。
3.1.2 設(shè)備日常操作安全措施
? 機(jī)房?jī)?nèi)應(yīng)設(shè)置維護(hù)和測(cè)試用電源插座(地插、強(qiáng)插等),供日常維護(hù)過(guò)程中接插相關(guān)維護(hù)設(shè)備,儀器儀表等。嚴(yán)禁隨意使用機(jī)柜內(nèi)電源接插。? 需要關(guān)閉電源時(shí),不要設(shè)想電源已關(guān)閉,必須仔細(xì)檢查,確認(rèn)。? 為避免靜電對(duì)設(shè)備的電子器件造成損壞,對(duì)設(shè)備進(jìn)行操作時(shí)應(yīng)穿著防靜電服或戴防靜電手套或佩戴防靜電手鐲。? 拿電路板時(shí),應(yīng)拿電路板邊緣,不要接觸元器件和印制電路。? 保持機(jī)柜內(nèi)清潔、無(wú)塵。? 防靜電手鐲的使用方法如下:
1、將手伸進(jìn)防靜電手鐲,戴至手腕處。
2、拉緊鎖扣,確認(rèn)防靜電手鐲與皮膚有良好的接觸。
3、將防靜電手鐲,插入設(shè)備的防靜電手鐲插孔內(nèi),或者是用鱷魚(yú)夾夾在機(jī)柜的接地處。
4、確認(rèn)防靜電手鐲良好接地。3.2.日常維護(hù)人員安全措施:
? 非電工作業(yè)人員、不具有電氣電力專業(yè)資質(zhì)人員嚴(yán)禁進(jìn)行任何電工作業(yè)。電工作業(yè)包括但不限于以下內(nèi)容:對(duì)機(jī)房配供電設(shè)施、裝置進(jìn)行安裝、維護(hù)、檢查、檢修等操作。? 配供電設(shè)施、裝置的絕緣或外殼損壞,可能導(dǎo)致人體接觸及帶電部分時(shí),應(yīng)立即停止使用,并及時(shí)修復(fù)或更換。? 移動(dòng)用電設(shè)備、打開(kāi)用電設(shè)備外殼時(shí)必須拔掉所有電源線和外部電纜。? 確認(rèn)操作區(qū)域內(nèi)地面無(wú)積水、潮濕等。? 為避免出現(xiàn)意外,盡量不要一個(gè)人進(jìn)行帶電維護(hù)。維護(hù)前應(yīng)確認(rèn)設(shè)備的電源開(kāi)關(guān),如發(fā)生意外,第一時(shí)間切斷對(duì)應(yīng)的電源開(kāi)關(guān)。
1.機(jī)房工作人員應(yīng)學(xué)習(xí)常規(guī)的用電安全操作和知識(shí),了解機(jī)房?jī)?nèi)部的供電、用電設(shè)施的操作規(guī)程,注意節(jié)約用電。
2.機(jī)房工作人員應(yīng)經(jīng)常實(shí)習(xí)、掌握機(jī)房用電應(yīng)急處理步驟、措施和要領(lǐng);在真正接通設(shè)備電源之前必須先檢查線路、接頭是否安全連接以及設(shè)備是否已經(jīng)就緒、人員是否已經(jīng)具備安全保護(hù)。
3.機(jī)房管理人員必須定期安排有專業(yè)資質(zhì)的人員檢查供電、用電設(shè)備、設(shè)施;如發(fā)現(xiàn)用電安全隱患,應(yīng)即時(shí)采取措施解決,不能解決的必須及時(shí)向相關(guān)負(fù)責(zé)人員提出解決。
4.機(jī)房不得亂拉亂接電線,應(yīng)選用安全、有保證的供電、用電器材;嚴(yán)禁隨意對(duì)設(shè)備斷電、更改設(shè)備供電線路,嚴(yán)禁隨意串接、并接、搭接各種供電線路。
5.機(jī)房工作人員對(duì)個(gè)人用電安全負(fù)責(zé)。外來(lái)人員需要用電的,必須得到機(jī)房管理人員允許,并使用安全和對(duì)機(jī)房設(shè)備影響最少的供電方式。
6.機(jī)房工作人員需要離開(kāi)當(dāng)前用電工作環(huán)境時(shí),應(yīng)檢查并保證工作環(huán)境的用電安全。
7.最后離開(kāi)機(jī)房的工作人員,應(yīng)檢查所有用電設(shè)備,應(yīng)關(guān)閉長(zhǎng)時(shí)間帶電運(yùn)作可能會(huì)產(chǎn)生嚴(yán)重后果的用電設(shè)備。
8.禁止在無(wú)人看管下在機(jī)房中使用高溫、熾熱、產(chǎn)生火花的用電設(shè)備。
9.在使用功率超過(guò)額定瓦數(shù)的用電設(shè)備前,必須得到上級(jí)主管批準(zhǔn),并在保證線路安全的基礎(chǔ)上使用。
10.在外部供電系統(tǒng)停電時(shí),機(jī)房工作人員應(yīng)全力配合完成停電應(yīng)急工作。