第一篇:IT運(yùn)維工作心得總結(jié)
運(yùn)維工作心得總結(jié)
運(yùn)維工作直接關(guān)系到應(yīng)用系統(tǒng)運(yùn)行的正常穩(wěn)定,但運(yùn)維工作紛繁復(fù)雜,正規(guī)化、系統(tǒng)化相對(duì)比較弱,如何改變這種現(xiàn)狀?從眾多的運(yùn)維工作者的成功失敗中進(jìn)行經(jīng)驗(yàn)總結(jié),并提升為運(yùn)維規(guī)則,是提高運(yùn)維水平,保障應(yīng)用系統(tǒng)正常穩(wěn)定運(yùn)行的有效途徑。
筆者通過(guò)自己的多年運(yùn)維經(jīng)驗(yàn),總結(jié)出以下必須遵守的基本運(yùn)維規(guī)則,可以大大減少缺乏經(jīng)驗(yàn)的運(yùn)維人員因?yàn)樽陨硎д`導(dǎo)致系統(tǒng)出故障的可能性。
一、系統(tǒng)變更、升級(jí)應(yīng)先在同樣的環(huán)境測(cè)試通過(guò),執(zhí)行前應(yīng)有經(jīng)過(guò)驗(yàn)證的回退預(yù)案
運(yùn)維是一門經(jīng)驗(yàn)的學(xué)科、是一門試錯(cuò)的學(xué)科。沒(méi)有做過(guò)的東西、總是會(huì)給你出意想不到的難題,因此變更前,一定要在相同或者相似運(yùn)行環(huán)境下進(jìn)行測(cè)試,通過(guò)后才能在正式環(huán)境下執(zhí)行變更。同時(shí)應(yīng)準(zhǔn)備好變更失敗的回退預(yù)案,比如,做好系統(tǒng)備份、數(shù)據(jù)庫(kù)備份、配置備份,固化變更前的運(yùn)行現(xiàn)場(chǎng),讓變更有回頭的機(jī)會(huì)。
二、對(duì)破壞性的操作要先確認(rèn)符合預(yù)定方案,然后謹(jǐn)慎執(zhí)行
什么是破壞性的操作? 比如:
對(duì)MSSQLServer,執(zhí)行update操作,因?yàn)椴恍枰猚ommit,所以特別容易忽視也特別危險(xiǎn),還有delete、drop等操作更不用說(shuō)。
對(duì) Oracle 而言:truncate table_name、delete table_name、drop table_name,這些語(yǔ)句執(zhí)行起來(lái)輕松簡(jiǎn)單也愜意極了、但記?。〖幢銛?shù)據(jù)可被回滾、代價(jià)也是非常大!
對(duì) Linux 而言,rm-r 所有當(dāng)前及其子目錄的所有數(shù)據(jù)都將被刪除。經(jīng)歷過(guò)這種故障的人、大多會(huì)給 rm 上個(gè)別名 A liasrm='rm-i' 同理、cp 和 mv 也可以有同樣的選項(xiàng):
aliascp='cp-i' alias mv='mv-i' 對(duì)window而言,shift+del文件或者目錄 對(duì)任何系統(tǒng)而言,無(wú)備份直接修改文件等
三、備份并驗(yàn)證備份的有效性
不管是硬件還是軟件總有意外崩潰的時(shí)候,怎么辦?備份!!備份的學(xué)問(wèn)很大、按照不同的維度可以分:冷備和熱備、實(shí)時(shí)和非實(shí)時(shí)、物理和邏輯、全備增量備。
備份有了、可以高忱無(wú)憂了嗎?不行!尚須驗(yàn)證備份的有效性。一個(gè)總有那么幾次、備份無(wú)法保證 100% 恢復(fù),簡(jiǎn)單的驗(yàn)證就是找個(gè)空庫(kù)恢復(fù)出來(lái)。
四、對(duì)生產(chǎn)環(huán)境永保敬畏之心
這是避免應(yīng)用系統(tǒng)發(fā)生故障的一條鐵規(guī),也是被開(kāi)發(fā)、運(yùn)維人員容易忽視的地方。要堅(jiān)決杜絕直接在生產(chǎn)環(huán)境做開(kāi)發(fā)、測(cè)試和bug修復(fù),這些操作只能在開(kāi)發(fā)和測(cè)試環(huán)境做,否則一旦出事,將欲哭無(wú)淚。
五、交接和休假最容易出故障
接手別人的工作要一而再,再而三的確認(rèn)變更方案,請(qǐng)教人并不見(jiàn)得就是能力不行的表現(xiàn);
? 休假前最好各種可以做好的事情,最好能夠準(zhǔn)備一份文檔,指明在什么情況下怎么做和聯(lián)系哪些人;
? 在別人放假的時(shí)候接手工作,“能拖則拖”,實(shí)在需要執(zhí)行:必須不厭其煩的跟原系統(tǒng)管理人員確認(rèn)各個(gè)操作細(xì)節(jié)。? 六、一定要有監(jiān)控手段和報(bào)警措施
運(yùn)維人員賴于生存的工具就是報(bào)警和監(jiān)控。
報(bào)警可以讓你及時(shí)知道系統(tǒng)出現(xiàn)了什么異常、以便及時(shí)跟進(jìn)、把故障扼殺于搖籃;
? 監(jiān)控可以讓你了解系統(tǒng)的歷史性能信息、以歷為鑒、可以知興替、早做優(yōu)化。?
報(bào)警和監(jiān)控是衣寬帶水的好兄弟、相鋪相成、互相促進(jìn)。
七、使用自動(dòng)切換技術(shù)需謹(jǐn)慎
為了保障數(shù)據(jù)庫(kù)安全,往往會(huì)使用HA或者RAC之類的技術(shù),但是這類技術(shù)能否真正在關(guān)鍵時(shí)刻起作用,則是需要經(jīng)過(guò)反復(fù)驗(yàn)證和確認(rèn)的。并不是按照文檔要求做好了就夠的,很多意外因素或者系統(tǒng)因素會(huì)導(dǎo)致自動(dòng)切換技術(shù)并不能如期發(fā)揮作用。如果到事后才發(fā)現(xiàn)這一點(diǎn),將悔之晚矣。
八、要有偏執(zhí)狂的精神,方案要檢查,檢查,再檢查
有這么一個(gè)人: ① 他在做一個(gè)變更的時(shí)候,會(huì)先提前一兩周發(fā)送郵件并電話手機(jī)通知相關(guān)人
② 在測(cè)試機(jī)上寫好腳本,召集大家 review 操作步驟和腳本 ③ 測(cè)試完成以后拷貝到生產(chǎn)環(huán)境
④ 登錄對(duì)應(yīng)機(jī)器,“打開(kāi),關(guān)閉,打開(kāi),關(guān)閉”該腳本
⑤ 跟相關(guān)人員再次確認(rèn)執(zhí)行的操作,順序,時(shí)間點(diǎn),可能的影響和回滾是否都準(zhǔn)備好了
⑥ 執(zhí)行前還要退出這個(gè)機(jī)器,然后再登錄進(jìn)去,“打開(kāi),關(guān)閉”腳本 ⑦ 最后才在后臺(tái)運(yùn)行腳本,同時(shí)在另外一個(gè)窗口登錄著,隨時(shí)ps和查看結(jié)果輸出
期間姿勢(shì)端正,呼吸急促而均勻,眼神凝重。操作的人不覺(jué)得累,倒是一邊觀摩的人很累。
九、簡(jiǎn)單即是美
我們總是面臨各種誘惑:新的系統(tǒng)架構(gòu),新的更智能的命令和工具,最新的硬件平臺(tái),功能更全的HA軟件...你可以在線下安裝,測(cè)試,怎么做都行。但是如果想要在生產(chǎn)環(huán)境下使用起來(lái)、請(qǐng)三思!
能夠使用系統(tǒng)內(nèi)置命令的話,就不用考慮其他要專門下載安裝的軟件了 ? 腳本本身就能完成的功能,就沒(méi)有必要專門找一個(gè)功能豐富的軟件來(lái)做 ? Linux本身自帶的字符界面比那些復(fù)雜的圖形界面要簡(jiǎn)潔方便 ?
如果能做到堅(jiān)持這九條鐵規(guī),你的應(yīng)用系統(tǒng)就能長(zhǎng)久穩(wěn)定運(yùn)行了。
第二篇:IT運(yùn)維心得分享范文
360公司運(yùn)維心得分享
在很多“外人”的眼中,運(yùn)維工程師的工作不過(guò)是搬機(jī)器、調(diào)網(wǎng)絡(luò)、裝軟件、處理故障、7×24小時(shí)值班,簡(jiǎn)單而又枯燥至極。但事實(shí)并非如此,運(yùn)維工作涵蓋很多技術(shù)領(lǐng)域,運(yùn)維工程師要掌握硬件、軟件、操作系統(tǒng)、開(kāi)發(fā)等多方面的知識(shí),核心目標(biāo)是為億萬(wàn)用戶使用的產(chǎn)品保駕護(hù)航。
當(dāng)今互聯(lián)網(wǎng)行業(yè)的發(fā)展日新月異,新技術(shù)層出不窮。為了適應(yīng)發(fā)展趨勢(shì),運(yùn)維工程師只有提升技術(shù)能力才能更好地完成艱巨的運(yùn)維任務(wù),必須要對(duì)傳統(tǒng)運(yùn)維發(fā)出自我挑戰(zhàn)。
在360,運(yùn)維團(tuán)隊(duì)由基礎(chǔ)運(yùn)維團(tuán)隊(duì)、網(wǎng)絡(luò)運(yùn)維團(tuán)隊(duì)和應(yīng)用運(yùn)維團(tuán)隊(duì)三部分組成。我們將運(yùn)維從技術(shù)支持領(lǐng)域升級(jí),進(jìn)行產(chǎn)品化改進(jìn),核心目標(biāo)是為了降低運(yùn)維成本、縮短研發(fā)周期、讓產(chǎn)品試錯(cuò)更廉價(jià)。理想很豐滿,現(xiàn)實(shí)很骨感,從最初服務(wù)少量項(xiàng)目、幾十臺(tái)服務(wù)器,發(fā)展到大量具有數(shù)億用戶的項(xiàng)目,我們也在不斷摸索,在試錯(cuò)中成長(zhǎng)。在這個(gè)過(guò)程中,我們經(jīng)歷了兩次重要的升級(jí)。第一次升級(jí):運(yùn)維工具化
運(yùn)維工作中有很多瑣碎的、重復(fù)的事情,初期我們只有兩個(gè)IDC,服務(wù)器數(shù)量有限,項(xiàng)目數(shù)量也較少,靠純手工勞作還可以應(yīng)付。但隨著時(shí)間的推移,項(xiàng)目暴增,隨之IDC和服務(wù)器的數(shù)量也成倍增長(zhǎng),同時(shí)360各項(xiàng)目都是小團(tuán)隊(duì)在做,開(kāi)發(fā)風(fēng)格不同、習(xí)慣各異,但極致要求響應(yīng)速度,如果運(yùn)維工作按照之前方式進(jìn)行,很難滿足需求。大勢(shì)所趨,我們必須進(jìn)行工具化升級(jí),將重復(fù)的事情自動(dòng)化。
在工具化過(guò)程中,我們秉著低成本、拿來(lái)即用的原則,借鑒業(yè)界成型的方案,同時(shí)將精力用在對(duì)開(kāi)源軟件的研究中,有開(kāi)源工具就絕不自己憑空創(chuàng)造。初期,我們只圍繞開(kāi)源軟件做周邊腳本開(kāi)發(fā),不動(dòng)核心代碼,在實(shí)踐中總結(jié)經(jīng)驗(yàn)。例如,在最基礎(chǔ)的部署軟件環(huán)境中,我們基于YUM搭建了自己的包管理系統(tǒng),將常用軟件打包,同時(shí)根據(jù)項(xiàng)目做成模板,這樣無(wú)論是初始安裝還是擴(kuò)容都能在分分鐘完成。配置文件管理利用Puppet完成,服務(wù)器批量操控依賴SaltStack。就這樣 我們的運(yùn)維兵器譜在不斷地豐富。
另外,運(yùn)維工作離不開(kāi)監(jiān)控報(bào)警,這是一件讓無(wú)數(shù)運(yùn)維人苦不堪言的事情。而會(huì)休息才會(huì)工作,監(jiān)控體系必須優(yōu)化。
我們的監(jiān)控大概分為系統(tǒng)級(jí)、應(yīng)用級(jí)、項(xiàng)目邏輯和用戶體驗(yàn)四部分。系統(tǒng)級(jí)主要監(jiān)控硬件和網(wǎng)絡(luò)等;應(yīng)用級(jí)主要監(jiān)控常用軟件的健康狀況;項(xiàng)目邏輯監(jiān)控主要模擬用戶行為探測(cè)項(xiàng)目功能點(diǎn)是否運(yùn)行正常;用戶體驗(yàn)監(jiān)控主要聯(lián)動(dòng)博睿和基調(diào)等第三方監(jiān)控一起優(yōu)化用戶體驗(yàn)。我們用過(guò)的工具很多,開(kāi)源工具有Nagios、Cacti、Ganglia、Zabbix等,同時(shí)自己也開(kāi)發(fā)了一些針對(duì)項(xiàng)目場(chǎng)景的監(jiān)控工具,但萬(wàn)變不離其宗,都是圍繞上述幾個(gè)維度進(jìn)行監(jiān)控,然后再進(jìn)行分級(jí)預(yù)警和報(bào)警。
為了減少報(bào)警騷擾,我們分級(jí)處理,將報(bào)警分為郵件預(yù)警、短信報(bào)警和瘋狂短信報(bào)警。以磁盤空間監(jiān)控為例:每天下午6點(diǎn),統(tǒng)計(jì) 磁盤使用率超過(guò)80%的機(jī)器,發(fā)出郵件預(yù)警,下班前解決;在預(yù)警的基礎(chǔ)上,超過(guò)85%觸發(fā)短信報(bào)警;超過(guò)90%就要持續(xù)報(bào)警,避免事故的發(fā)生。此外,隨著 服務(wù)器數(shù)量的增多,硬件故障在所難免,架構(gòu)設(shè)計(jì)需要考慮高可用方案,冗余范圍內(nèi)的服務(wù)器故障會(huì)以郵件預(yù)警的方式發(fā)出,避免對(duì)運(yùn)維工程師的騷擾。
有了監(jiān)控工具和分級(jí)機(jī)制,還需要有好的制度。為了大部分人可以安心休息,我們每天有專人負(fù)責(zé)處理常規(guī)報(bào)警,遇到無(wú)法解決的問(wèn)題才要求他人協(xié)助。第二天的負(fù)責(zé) 人要針對(duì)第一天的報(bào)警找出根本原因,并盡力解決,因?yàn)槿绻麩o(wú)法根治,困擾將持續(xù)發(fā)生。所謂線上無(wú)小事,實(shí)際工作中復(fù)雜場(chǎng)景引發(fā)的問(wèn)題數(shù)不勝數(shù),所以可以寬 容第一次錯(cuò)誤,但不能接受同樣問(wèn)題發(fā)生第二次,要不斷地總結(jié)和完善。
工具化是運(yùn)維的必經(jīng)之路,是向更高層發(fā)展的基礎(chǔ),面對(duì)運(yùn)維這樣復(fù)雜的學(xué)科,這樣一個(gè)極其磨煉人意志的工種,運(yùn)維工程師需要用聰明的方式解決復(fù)雜的問(wèn)題,節(jié)省時(shí)間,去做更有意義的事情。
第二次升級(jí):運(yùn)維產(chǎn)品化
我剛提出運(yùn)維產(chǎn)品化時(shí),有朋友開(kāi)玩笑說(shuō),你做后端運(yùn)維吃苦受罪這么多年,看著產(chǎn)品經(jīng)理吃香的喝辣的,羨慕嫉妒也想轉(zhuǎn)行做產(chǎn)品吧。也有人說(shuō),你是在偷換概念,不就是做自動(dòng)化運(yùn)維平臺(tái)嘛。其實(shí)提出這個(gè)概念,一方面是源于有了足夠的工具化積累;另一方面是想換一種思路做運(yùn)維,培養(yǎng)產(chǎn)品觀,站在用戶的角度思考問(wèn)題,讓處于后端的運(yùn)維工程師主動(dòng)挖掘需求,圍繞運(yùn)維做更多的探索,提升團(tuán)隊(duì)技術(shù)能力,解決海量用戶帶來(lái)的問(wèn)題。有了這個(gè)想法,就需要將無(wú)形的技術(shù)轉(zhuǎn)變?yōu)橛行蔚漠a(chǎn)品形態(tài),同時(shí)要賦予它好的寓意。我們的產(chǎn)品取名為HULK——綠巨人,意在讓小伙伴們借助巨人的肩膀成長(zhǎng),輕點(diǎn)鼠標(biāo),運(yùn)籌帷幄。
想到做這個(gè)平臺(tái),源于對(duì)實(shí)際工作需求的觀察。產(chǎn)品經(jīng)理有了創(chuàng)新點(diǎn)之后,開(kāi)發(fā)工程師就想以最快的速度上線,但又會(huì)很痛苦,因?yàn)楫a(chǎn)品就好比寶塔明珠,塔基需要一 層層地蓋。而開(kāi)發(fā)工程師是與運(yùn)維工程師合作最緊密的兄弟,“兄弟有難得拔刀相助”,因此我們明確了開(kāi)發(fā)工程師就是運(yùn)維平臺(tái)的用戶,運(yùn)維工程師在平臺(tái)的建設(shè) 中扮演了多重角色,是建設(shè)者也是使用者,但目標(biāo)是為用戶解決問(wèn)題,讓我們的用戶有極致的用戶體驗(yàn)?;谶@些想法,我們勾畫出了宏偉藍(lán)圖,提供一個(gè)塔基,第一層提供核心基礎(chǔ)服務(wù),如Web、RDB、NoSQL等;第二層提供通用基礎(chǔ)服務(wù),構(gòu)造一個(gè)完美的平臺(tái),讓開(kāi)發(fā)工程師受益。但勾畫的平臺(tái)功 能大而全,需求都是我們替用戶假想的,這樣做的后果就是進(jìn)展緩慢,但做出的功能沒(méi)人用。我們?cè)谑≈蟹此?,意識(shí)到需求還得從日常工作中去挖掘,平臺(tái)上每個(gè)功能模塊都必須解決用戶的痛點(diǎn)?;ヂ?lián)網(wǎng)精神唯快不破,要圍繞“快”找痛點(diǎn)。早期開(kāi)發(fā)和運(yùn)維的合作中,更多的是郵件、IM及當(dāng)面溝通,跨團(tuán)隊(duì)的溝通成本是第 一個(gè)痛點(diǎn)。初期平臺(tái)建設(shè)中,我們從加速流程開(kāi)始進(jìn)行摸索,以“需求任務(wù)流”為核心,將通用需求規(guī)范流程,統(tǒng)一需求提交頁(yè)面,同時(shí)盡量為用戶提供選項(xiàng),而不是隨意填寫,盡量減少溝通成本,同時(shí)為完全自動(dòng)化打好基礎(chǔ)。由于完整的自動(dòng)化流程開(kāi)發(fā)成本比較高,初期我們還“投機(jī)取巧”,用戶提交需求以后,只是把格式 化的郵件發(fā)送給運(yùn)維工程師。運(yùn)維工程師使用半自動(dòng)化工具干活,完成后再通過(guò)平臺(tái)任務(wù)流告知用戶結(jié)果,手工操作的部分是隱藏在平臺(tái)后面的,用戶不得而知。就 用這種方式,我們的平臺(tái)積累了不少用戶和口碑。之后我們將日常需求分層、分類:主機(jī)類包括主機(jī)申請(qǐng)、賬號(hào)授權(quán)、軟件部署等;Web類包括配置文件管理、域名管理等;DB類包括建庫(kù)、建表、SQL審核、授權(quán)等。再攻克技術(shù)難點(diǎn)將一個(gè)個(gè)需求實(shí)現(xiàn)完全自動(dòng)化,點(diǎn)點(diǎn)鼠標(biāo)解決問(wèn)題。
關(guān)于需求任務(wù)流,還有個(gè)小插曲,標(biāo)準(zhǔn)的任務(wù)流由提交、審核、駁回/通過(guò)組成。但這個(gè)流程太死板,例如用戶提交的一個(gè)需求,在審核的過(guò)程中有待商榷,運(yùn)維工程師會(huì)和開(kāi)發(fā)工程師 溝通,最終達(dá)成一致意見(jiàn)即可,而如果按標(biāo)準(zhǔn)流程需要駁回再提交。為了讓用戶少一次操作,我們?cè)黾恿斯芾韱T可編譯功能。有些同事反對(duì)這樣做,覺(jué)得不符合常 理。不過(guò)有時(shí)候常理是需要結(jié)合實(shí)際場(chǎng)景打破的,就為了讓用戶使用更簡(jiǎn)單。
近期為了進(jìn)一步提升項(xiàng)目試錯(cuò)階段的速度,我們?cè)谄脚_(tái)上推出了一個(gè)新功能:“項(xiàng)目孵化器”。以典型的Web業(yè)務(wù)為例,以往,申請(qǐng)Web Server、賬號(hào)、數(shù)據(jù)庫(kù)實(shí)例、負(fù)載均衡等是提給運(yùn)維最基本的需求,每一步都是時(shí)間成本。使用“項(xiàng)目孵化器”可以最大限度解決這個(gè)痛點(diǎn),只需在平臺(tái)上進(jìn) 行兩個(gè)步驟:第一步填寫業(yè)務(wù)名稱,預(yù)估峰值QPS;第二步選用MySQL、MongoDB、Redis等相關(guān)數(shù)據(jù)庫(kù)資源。兩步之后,Web Server、數(shù)據(jù)庫(kù)實(shí)例等所需資源會(huì)瞬間展示在用戶面前,同時(shí)包管理、配置文件管理、代碼發(fā)布系統(tǒng)、監(jiān)控系統(tǒng)等配套輔助功能隨之開(kāi)通。
與之前的模式相比,效率和規(guī)范化都有明顯提高。說(shuō)起來(lái)很神奇,但實(shí)現(xiàn)理念很簡(jiǎn)單,我們提煉日常項(xiàng)目中的通用方案,構(gòu)建資源池,在項(xiàng)目發(fā)展初期最小量匹配資源。在孵化器的設(shè)計(jì)階段,我們聽(tīng)到了很多不同的聲音。例如,讓用戶填信息不夠全面,架構(gòu)太簡(jiǎn)單不滿足全部需求,諸如此類問(wèn)題,讓人頭痛欲裂。經(jīng)過(guò)過(guò)往項(xiàng)目 分析及用戶調(diào)研,發(fā)現(xiàn)項(xiàng)目尚處于試錯(cuò)階段,快速試錯(cuò)是首要需求。至于項(xiàng)目發(fā)展中衍生出來(lái)的需求,可以再用平臺(tái)擴(kuò)展功能去解決。當(dāng)利用孵化器建立一個(gè)試錯(cuò)項(xiàng)目之后,用戶進(jìn)入平臺(tái)想看見(jiàn)什么?展現(xiàn)形式如何?還能做什么?這些問(wèn)題隨之而來(lái)。
眾所周知,項(xiàng)目中的關(guān)聯(lián)關(guān)系是個(gè)復(fù)雜的問(wèn)題,解決不好,就像一盤散沙無(wú)法聯(lián)動(dòng)。為了解決此問(wèn)題,首先我們確定平臺(tái)各功能模塊以項(xiàng)目名為主鍵,將項(xiàng)目的域名、負(fù)載均衡、Web Server、數(shù)據(jù)庫(kù)、通用基礎(chǔ)服務(wù)等相關(guān)聯(lián)。項(xiàng)目后期各功能模塊的擴(kuò)容可以借助關(guān)聯(lián)關(guān)系自動(dòng)化完成。例如增加一臺(tái)Web Server,即可自動(dòng)部署軟件環(huán)境,完成相關(guān)節(jié)點(diǎn)授權(quán)、上傳代碼、測(cè)試上線。
展現(xiàn)形式上我們借鑒社交網(wǎng)站的實(shí)現(xiàn)方案,以“我的項(xiàng)目”為中心,用戶進(jìn)入平臺(tái)以后默認(rèn)頁(yè)展示項(xiàng)目在平臺(tái)中用到的各功能模塊信息,例如域名、主機(jī)數(shù)量、數(shù)據(jù)庫(kù)實(shí)例和監(jiān)控指標(biāo)等。做到信息清晰可見(jiàn),操控簡(jiǎn)單易用。
在平臺(tái)建設(shè)中,我們一直遵循兩個(gè)準(zhǔn)則:第一,把事情由復(fù)雜變簡(jiǎn)單;第二,給用戶極致的用戶體驗(yàn)。所謂極致,就是要超出用戶的預(yù)期,但只有挖掘用戶潛在的需求,才能做出超出預(yù)期的功能。傳統(tǒng)的運(yùn)維模式,大多是開(kāi)發(fā)工程師提需求,運(yùn)維工程師滿足需求,運(yùn)維工程師主動(dòng)推進(jìn)的意識(shí)不夠。360的文化中有很重要的一點(diǎn)是Ownership,一個(gè)項(xiàng)目的成功與失敗,運(yùn)維工程師是有責(zé)任的,因此需要在日常工作中時(shí)刻提醒自己“這個(gè)項(xiàng)目是我的,為了讓項(xiàng)目變得更好,我們需要主動(dòng)思考,為開(kāi)發(fā)工程師提供更多的增值服務(wù)”。例如一個(gè)項(xiàng)目上線前,會(huì)默認(rèn)部署日志收集模塊,收集匯總后進(jìn)行訪問(wèn)日志自動(dòng)化分析,以時(shí)間維度展示訪問(wèn)量走勢(shì),同時(shí)輔以IP地址分析模塊展示地域及運(yùn)營(yíng)商分布。同時(shí)基于訪問(wèn)日志狀態(tài)碼做進(jìn)一步的頁(yè)面分析,然后以日、周、月維度生成一份體檢報(bào)告,以及應(yīng)對(duì)方案推送給開(kāi)發(fā)工程師。這些增值服務(wù)是超出預(yù)期的,拉近了開(kāi)發(fā)工程師和我們的距離,一起去探討、改進(jìn),做出更多有利于項(xiàng)目發(fā)展的功能。結(jié)束語(yǔ)
運(yùn)維工作在一家公司中至關(guān)重要,但傳統(tǒng)的運(yùn)維模式一定程度上限制了運(yùn)維工程師的技術(shù)發(fā)展,更抑制了創(chuàng)新思維,我們需要利用運(yùn)維“寬泛技術(shù)”定位的優(yōu)勢(shì)開(kāi)拓思路。例如運(yùn)維工作需要和很多開(kāi)發(fā)團(tuán)隊(duì)合作,協(xié)助架構(gòu)設(shè)計(jì),在這個(gè)過(guò)程中會(huì)接觸到很多開(kāi)發(fā)團(tuán)隊(duì)的技術(shù)積累,可以把各家之所長(zhǎng)進(jìn)行聚合,將一些基礎(chǔ)服務(wù)進(jìn)行平臺(tái)化改造,資源共享。也可以根據(jù)項(xiàng)目的需要,主動(dòng)做技術(shù)研究,將基礎(chǔ)服務(wù)做成一個(gè)個(gè)小產(chǎn)品,提供給開(kāi)發(fā)團(tuán)隊(duì)使用,幫助項(xiàng)目縮短研發(fā)周期,穩(wěn)定發(fā)展。在當(dāng)今技術(shù)背景下,運(yùn)維工程師應(yīng)該在紅海中尋找藍(lán)海的思維模式,培養(yǎng)產(chǎn)品觀,由外至內(nèi)地思考,突破傳統(tǒng)運(yùn)維的壁壘,開(kāi)拓創(chuàng)新。
第三篇:運(yùn)維主要工作
運(yùn)維主要工作:
(1)運(yùn)維人員每天至少上午,下午現(xiàn)場(chǎng)巡視檢查設(shè)備運(yùn)行狀態(tài)。
(2)每天值班的運(yùn)維人員負(fù)責(zé)接聽(tīng)電話,負(fù)責(zé)每小時(shí)抄寫各種記錄表格一次。
(3)執(zhí)行倆票三制制度。
(4)配合廠家完成檢修任務(wù)。
(5)上級(jí)領(lǐng)導(dǎo)安排的其他工作。
(6)夜間值班,需要睡在主控室,所有設(shè)備報(bào)警聲必須打開(kāi)。
(7)配合站長(zhǎng)進(jìn)行應(yīng)急處理。
(8)清理光伏區(qū)組件,避免因遮擋問(wèn)題而導(dǎo)致發(fā)電量損失,表面因產(chǎn)生熱斑而導(dǎo)致組件損壞與異常發(fā)熱。
(9)每月最少一次在負(fù)荷最高時(shí)用熱成像儀檢查組件是否有熱斑,每周檢查一次電氣設(shè)備是否存在溫度異常升高的現(xiàn)場(chǎng)。
(10)惡劣天氣后進(jìn)行特殊巡檢。站長(zhǎng)的主要職責(zé):
(1)是電站安全運(yùn)行的第一責(zé)任人,對(duì)電站的安全運(yùn)行負(fù)責(zé)。
(2)負(fù)責(zé)審查各種報(bào)表,負(fù)責(zé)檢查兩票。
(3)負(fù)責(zé)監(jiān)督運(yùn)維人員執(zhí)行各項(xiàng)措施。
(4)負(fù)責(zé)對(duì)運(yùn)維人員進(jìn)行考核。
(5)負(fù)責(zé)對(duì)運(yùn)維人員提供技術(shù)培訓(xùn)及技術(shù)支持。
(6)負(fù)責(zé)安排運(yùn)維人員的工作任務(wù)。
(7)完成上級(jí)領(lǐng)導(dǎo)安排的其他工作。
(8)負(fù)責(zé)與電網(wǎng)方面進(jìn)行聯(lián)系,業(yè)務(wù)處理。維持電站與電網(wǎng)之間的關(guān)系。
(9)負(fù)責(zé)擔(dān)任工作票簽發(fā)人,工作負(fù)責(zé)人。
(10)重大操作時(shí)擔(dān)任監(jiān)護(hù)人。需要配置的物品與設(shè)備
錄音電話一臺(tái),并將錄音接入電腦,用于同調(diào)度聯(lián)系。OMS電腦一臺(tái),用于同接收發(fā)送調(diào)度郵件。普通辦公電腦一臺(tái)(向電網(wǎng)咨詢,如不需安裝則不用安裝OMS電腦)。滅火器若干,不能放置于開(kāi)關(guān)柜室,干變室,二次繼保室中,需單獨(dú)配置滅火器箱。二次繼保室必須使用二氧化碳滅火器。接地電阻測(cè)試儀一臺(tái)。熱成像儀一臺(tái)。蓄電池充放電設(shè)備一臺(tái)。各設(shè)備技術(shù)協(xié)議,圖紙需全部配齊,不能缺少。組件配品配件若干,匯流箱內(nèi)空開(kāi)備品備件若干,浪涌保護(hù)器若干。變壓器各種備品備件若干。工具包兩個(gè),內(nèi)配置工具。電筆若干,萬(wàn)能表兩個(gè),鉗形表兩個(gè),10KV驗(yàn)電器兩個(gè),并按照相關(guān)國(guó)家規(guī)定定期進(jìn)行送檢。10KV絕緣手套兩副,絕緣鞋兩雙,并根據(jù)國(guó)家有關(guān)規(guī)定進(jìn)行送檢。滅火器也需根據(jù)國(guó)家規(guī)定定期進(jìn)行送檢,灌裝。工具一套,包括各種型號(hào)的扳手,內(nèi)六角扳手整套,呆扳手整套,梅花扳手整套,螺絲刀一字與十字若干,型號(hào)配全。接地線至少兩組,并根據(jù)國(guó)家有關(guān)規(guī)定進(jìn)行定期送檢。絕緣梯兩個(gè)。逆變器內(nèi)各種小開(kāi)關(guān)至少每臺(tái)配置一個(gè)各種逆變器需要用到的型號(hào)。A4打印紙,A3打印紙。找廠家專門定制表格一份,用于填寫記錄表。軟毛刷若干,可伸縮桿若干。塑料水桶數(shù)個(gè)。打印機(jī)一臺(tái),可打A3與A4紙。安全規(guī)程人手一本,縣調(diào)度規(guī)程一本。公車一輛,必須可以拉貨。五防鑰匙需多要一臺(tái)備品備件。緊急解鎖鑰匙三把,可折疊單人床一張或兩張,人員要求附加原因解釋。每個(gè)光伏區(qū)進(jìn)口都需安裝鐵門,光伏區(qū)周圍加裝安全護(hù)欄,如公司感覺(jué)無(wú)需加裝則可以不加裝鐵門與遮攔。安全標(biāo)識(shí)牌若干,包括“高壓危險(xiǎn)”標(biāo)識(shí)牌數(shù)個(gè),“高壓危險(xiǎn),禁止靠近”標(biāo)識(shí)牌數(shù)個(gè),“禁止合閘,線路有人工作”數(shù)個(gè),“禁止合閘”標(biāo)識(shí)牌數(shù)個(gè),工程負(fù)責(zé)人與我進(jìn)行交接相關(guān)工程圖紙等交接。其他物品等商榷以后進(jìn)行補(bǔ)充。強(qiáng)光可充電式手電數(shù)個(gè)。其他物品需根據(jù)運(yùn)維實(shí)際情況進(jìn)行補(bǔ)充。人員要求
運(yùn)維工作的正常開(kāi)展不算我需要四個(gè)人,盡量全是男的,從事過(guò)電工工作最好,是否是高壓電工都行,普通人員也可,入職前進(jìn)行體檢,確保無(wú)傳染病,在站內(nèi)吃飯,最好是住在站內(nèi),如條件不允許可以就近安排住處,如附近無(wú)住宿條件,夜間值班便需兩個(gè)人,輪流夜間值班可以睡主控室。是不是當(dāng)?shù)氐亩夹?,最好是有一個(gè)工程人員轉(zhuǎn)運(yùn)維人員。
個(gè)人要求
月薪6500,五險(xiǎn)一金,可以按照國(guó)家最低標(biāo)準(zhǔn)交,但必須有,享受法定節(jié)假日三倍工資,每月休班7天,時(shí)間自己安排,有年終獎(jiǎng),工資每年調(diào)整增加一次,具體金額公司視發(fā)電量與電站安全運(yùn)行情況決定,如不需我同電網(wǎng)進(jìn)行關(guān)系維持則月薪6000,如再提供食宿月薪則5500,單獨(dú)提供住宿月薪5700。同時(shí)公司可安排我外出參加各種相關(guān)培訓(xùn),出差費(fèi)用公司報(bào)銷。有本電站運(yùn)維人員的任免權(quán)與考核權(quán)。正值工作任務(wù)
擔(dān)任工作負(fù)責(zé)人,工作許可人,工作班成員,專職監(jiān)護(hù)人,負(fù)責(zé)填寫工作票,并履行相關(guān)手續(xù)。審查副職填寫的操作票并送與站長(zhǎng)審查,填寫工作票并送與站長(zhǎng)審查執(zhí)行巡視檢查制度,監(jiān)盤并按規(guī)定填寫各項(xiàng)表格,站長(zhǎng)不在時(shí)行駛站長(zhǎng)權(quán)利,接聽(tīng)調(diào)度電話,重大操作時(shí)擔(dān)任操作人,非重大操作時(shí)擔(dān)任監(jiān)護(hù)人。打掃全站衛(wèi)生,上級(jí)領(lǐng)導(dǎo)安排的其他工作。副值班員工作任務(wù)
擔(dān)任工作班成員,擔(dān)任專職監(jiān)護(hù)人,負(fù)責(zé)填寫操作票送與正值審查。監(jiān)盤并按相關(guān)規(guī)定進(jìn)行填寫各種表格,執(zhí)行巡視檢查制度,接聽(tīng)調(diào)度電話,在站長(zhǎng)或正值的監(jiān)護(hù)下進(jìn)行倒閘操作。
其他事宜根據(jù)運(yùn)維實(shí)際情況進(jìn)行調(diào)整。
第四篇:變電站運(yùn)維工作個(gè)人總結(jié)
變電站運(yùn)維工作個(gè)人總結(jié)
回顧過(guò)去的一年,在市縣公司工區(qū)領(lǐng)導(dǎo)指導(dǎo)下取得的一些成績(jī),但也有一些不足?,F(xiàn)就運(yùn)行工作總結(jié)如下:
一、努力學(xué)習(xí)新知識(shí),掌握新設(shè)備,提高業(yè)務(wù)技能。
我所工作的單位是一所建設(shè)剛2年的變電站,有著配套齊全的辦公設(shè)施和生活用具,有著慕煞旁人的生活和學(xué)習(xí)的條件。自從2011年4月進(jìn)入110kV變電站工作以來(lái),在市縣工區(qū)領(lǐng)導(dǎo)關(guān)懷指導(dǎo)下努力改變以往工作模式與方法。從一個(gè)干好自己工作為己任,無(wú)關(guān)他人的自我態(tài)度,通過(guò)不斷的學(xué)習(xí)和鍛煉,逐步轉(zhuǎn)變?yōu)榛ハ鄮椭?,共同完成與提高的協(xié)同辦公新模式。記得建站投運(yùn)之始,依然是每天跟班日出而作,日落而棲學(xué)習(xí)設(shè)備的理論和操作方法。終是初步接觸110千伏變電站設(shè)備,在市工區(qū)領(lǐng)導(dǎo)平時(shí)工作擔(dān)心憂郁的語(yǔ)氣中,我常感無(wú)形的工作壓力,正吞噬著我;而這,也正深深的激勵(lì)著我,更加以自覺(jué)學(xué)習(xí)業(yè)務(wù)知識(shí)。
直到去年的某天,在一派新設(shè)備無(wú)故障的思想中,幾乎把尚存腦海的業(yè)務(wù)知識(shí)遺忘殆盡的時(shí),突然接到地調(diào)110kV624線路配合停電檢修的操作指令,在市工區(qū)領(lǐng)導(dǎo)仍然有些擔(dān)心的口吻中,我以正確的事故處理方法及操作步驟面對(duì),在默認(rèn)處理措施后,在長(zhǎng)長(zhǎng)的電話線那邊,似乎看見(jiàn)領(lǐng)導(dǎo)在稍稍放松的神情里,正用贊許的眼光望著我。。
二、立足本崗位,發(fā)揮黨員模范帶頭作用。
作為變電站一名基層黨員,愛(ài)崗敬業(yè)、忠貞不渝,在保持黨的純潔性工作和意識(shí)形態(tài)中,唯有加強(qiáng)變電站平時(shí)安全運(yùn)行意識(shí)的養(yǎng)成和既定制度管理的落實(shí),服務(wù)好人民群眾,促進(jìn)變電運(yùn)維工
作的全面發(fā)展,才是愛(ài)黨、愛(ài)國(guó)家、愛(ài)公司應(yīng)有的體現(xiàn)。我在過(guò)去的一年中主動(dòng)學(xué)習(xí)黨的方針政策,加強(qiáng)黨性修養(yǎng),進(jìn)一步提高自己的政治覺(jué)悟和工作能力,在盡職履責(zé)中發(fā)揮模范帶頭作用。在公司基層變電站里營(yíng)造和諧工作氛圍,勇于擔(dān)當(dāng),充分體現(xiàn)黨員的優(yōu)秀價(jià)值。
新形勢(shì)下,多年的基層變電站工作,讓我深深的知道迎峰度夏的工作中,公司和電網(wǎng)發(fā)展所面臨的任務(wù)。我從本職崗位挑戰(zhàn)出發(fā),時(shí)時(shí)處處以身作則,用實(shí)際行動(dòng)充分體現(xiàn)黨員的執(zhí)行力和實(shí)踐力。在過(guò)去一年的圍繞迎峰度夏保供電工作中,我明確時(shí)段、地段、人員和工作要求,落實(shí)測(cè)溫、特巡等工作,包括設(shè)備過(guò)熱、線路弧垂下降等原因引起的跳閘,全面開(kāi)展變電設(shè)備狀態(tài)巡視和檢測(cè)工作。切實(shí)防止變電設(shè)備巡視維護(hù)不到位而引發(fā)的設(shè)備事件發(fā)生,通過(guò)努力,“迎峰度夏”保供電工作在兩級(jí)工區(qū)領(lǐng)導(dǎo)大力指導(dǎo)下,取得了圓滿成績(jī)和效
果。
三、繼往開(kāi)來(lái),把一腔工作熱情付諸于無(wú)限的為人民服務(wù)中去。
作為電力工作者,我們?nèi)魏螘r(shí)候都應(yīng)以黨和企業(yè)的事業(yè)為重;任何時(shí)候都應(yīng)踐行“誠(chéng)信、責(zé)任、創(chuàng)新、奉獻(xiàn)”的核心價(jià)值觀,高標(biāo)準(zhǔn)履行國(guó)家電網(wǎng)人的職責(zé)。在今年政治性用電“國(guó)慶”、“十八大”保電工作中,嚴(yán)格遵循各項(xiàng)規(guī)章制度,嚴(yán)防死守,密切配合電力調(diào)度,有力的保障了當(dāng)?shù)厝嗣袢罕姀V播電視的正常收聽(tīng),收看。我來(lái)自于基層變電站一名普通的職工,任何時(shí)候都應(yīng)服從整體利益,恪盡職守,在以后的本崗位上,我也將一如既往扎實(shí)干好自身工作,干凈干事,發(fā)揮黨員模范帶頭作用,努力為當(dāng)?shù)亟?jīng)濟(jì)的發(fā)展值好班、站好崗,向組織交上一份“組織放心,群眾滿意”的答卷。
第五篇:運(yùn)維工作周報(bào)
運(yùn)維工作周報(bào)模板
報(bào)告人:XXX 時(shí)間:2012-X-01 ~ 2012-X-07
一、常規(guī)工作
1.2.3.4.5.LVS項(xiàng)目推廣;
發(fā)布系統(tǒng)網(wǎng)絡(luò)調(diào)整配合; 快答系統(tǒng)上線;
制定Q2的5年服務(wù)器替換計(jì)劃; 系統(tǒng)運(yùn)維等常規(guī)工作跟進(jìn);
二、項(xiàng)目跟進(jìn)
1、IT運(yùn)維平臺(tái)
機(jī)架資源功能因等待研發(fā)的進(jìn)度,延遲到下周完成;
二期總結(jié)除bug;
運(yùn)維平臺(tái)的使用推廣,并開(kāi)始完善應(yīng)用關(guān)聯(lián)關(guān)系的資料;
績(jī)效體系積分處理的實(shí)現(xiàn)是第三階段的重點(diǎn),預(yù)計(jì)6月30日完成;
2、分布式文件系統(tǒng)測(cè)試
完成Mogilefs線上測(cè)試,并出具報(bào)告;
整理Mogilefs上線所需的資源和計(jì)劃,下周約開(kāi)發(fā)談具體部署;
搭建Mogilefs的內(nèi)部開(kāi)發(fā)環(huán)境,配合圖片平臺(tái)的開(kāi)發(fā)工作;
總結(jié):經(jīng)過(guò)4個(gè)月的內(nèi)部和外部測(cè)試,Mogilefs的整體測(cè)試已經(jīng)全部完成,從測(cè)試的結(jié)果看,無(wú)論從性能、穩(wěn)定性、擴(kuò)展性、容災(zāi)性等各方面的指標(biāo),Mogilefs都可以符合目前的線上圖片存儲(chǔ)的需求,經(jīng)過(guò)多資源的統(tǒng)計(jì),僅需很小的投入即可完成改造,并能有效的利舊設(shè)備,整個(gè)部署預(yù)計(jì)7月中旬完成。
三、團(tuán)隊(duì)管理
部門規(guī)劃與績(jī)效考核
l 規(guī)劃與IT運(yùn)維平臺(tái)的整合計(jì)劃,預(yù)計(jì)6月30日完成;
其他管理工作
l 審核架構(gòu)的搭建和完善;
l 主備冗余計(jì)劃,完成第一批的主備交接工作;
四、工作難點(diǎn)、問(wèn)題與建議
五、下周計(jì)劃
1.2.3.4.5.6.7.8.9.常規(guī)工作繼續(xù)跟進(jìn);
繼續(xù)跟進(jìn)IT運(yùn)維平臺(tái)的開(kāi)發(fā)和推廣工作; 重點(diǎn)跟進(jìn)分布式文件系統(tǒng)的規(guī)劃和實(shí)施; 重點(diǎn)跟進(jìn)審核架構(gòu)的相關(guān)工作; 重點(diǎn)跟進(jìn)設(shè)備采購(gòu)及部署規(guī)劃工作;
繼續(xù)跟進(jìn)整理運(yùn)維中心的績(jī)效考核體系; 繼續(xù)跟進(jìn)相關(guān)項(xiàng)目的研究工作; 繼續(xù)跟進(jìn)運(yùn)維相關(guān)項(xiàng)目的進(jìn)度; 繼續(xù)跟進(jìn)團(tuán)隊(duì)建設(shè)相關(guān)工作;