第一篇:一個基于ITIL的運維項目介紹總結
IT運維工作是自己工作的一個組成部分,這里就著一個項目的實施經(jīng)驗,談談ITIL是怎么和具體項目結合落地的。
一、項目介紹
這是一個跨地域的數(shù)據(jù)采集、傳輸與處理的運維項目,其特點為:
1、1、跨地域廣。覆蓋全國16個省會城市的數(shù)據(jù)采集點(托管在當?shù)豂DC機房),北京城東、西兩個數(shù)據(jù)處理點,一個位于城中的業(yè)務處理與技術支持中心。
2、2、業(yè)務要求的穩(wěn)定性高,7*24服務,RTO與RPO要求高。
3、3、設備種類多。有視頻信號接入設備,機頂盒(由于屬于民用設備,后期統(tǒng)計看該設備的故障最高),由工控機承擔的采集機,PC機做的預處理機,還有存儲服務器,陣列柜,數(shù)據(jù)庫服務器以及其他網(wǎng)絡設備和傳輸線路等。
4、4、牽扯人員多。包括IDC服務工程師,傳輸服務商,數(shù)據(jù)中心與業(yè)務中心的業(yè)務人員,技術人員和管理人員等。
5、5、溝通渠道復雜。每個環(huán)節(jié)都需要保證暢通的溝通渠道以保證和相關人員溝通信息。二、二、項目目標
在這個項目中本人承擔的角色,對內是IT服務角色,對內部的業(yè)務部門提供IT運維支持,對外承擔管理服務商的角色,按與服務商簽訂的SLA進行跟蹤管理。
項目的目標是:建立一個運維體系和信息化平臺,把所有業(yè)務環(huán)節(jié)、服務流程與人員納入到這個平臺中,有效合理的調配資源,及時發(fā)現(xiàn)處理重要事件,提高運維效率,提高運維質量從而提高IT服務支持能力,提高用戶滿意度。
結合公司實際運維需求與能力,最終把項目的實施范圍鎖定在“服務支持”流程上,包括服務臺功能,事件管理、問題管理、配置管理、變更管理和發(fā)布管理上。不求做的多,但求實用與質量。
三、技術設計
因為是跨地域的使用系統(tǒng),因此采用B/S系統(tǒng)架構,盡管可能再速度上和表現(xiàn)界面上有些缺陷,但對我們這個應用來說這兩點都不是核心需求。在開發(fā)語言上選擇的是.NTE,數(shù)據(jù)庫選擇是SQL Server,這也是和我們目前產(chǎn)品采用一致的技術路線,方便日后的維護和對接。
服務臺
上次在1中說了項目的背景介紹,在這里開始介紹這個項目是如何實施的。
ITIL從哪里下手?聽到不少人是從“服務臺”來做的。如果按我的理想規(guī)劃來說,從“配置管理”做起比較合理,因為配置管理是所有其他模塊的支持核心,它不但對其他模塊的有效執(zhí)行起到信息支持的功能,同時其他模塊也要及時的變更配置庫以保證配置庫的最新有效狀態(tài)。但這個實施的順序是有潛在的適應要求的,對一個從無到有全新的系統(tǒng),這個順序無疑是正確的方式也容易操作,但具體到我這個項目,因為已經(jīng)在運行當中,是邊運營邊建設的特點,假如這個時候再教條的從“配置管理”做起,那我將面對的是花費很大精力建立的“配置庫”無流程可以配合使用,因此也會導致無流程維護其內容有效性的境地,這樣的話,等到最后體系都建立完成,就會發(fā)現(xiàn)以前建立的配置庫信息都失真無效,還要重新來過的情況。同時,在這個項目上,先做“服務臺”也能立刻對外顯示成果,這個成果確實也是領導需要的,當然也是我需要的。因此最后還是確定從“服務臺”開始了這個運營體系的建設。
在ITIL中,服務臺是有別于其他流程的,它被ITIL定義為“職能”而非“流程”,這也就說明了在我們實現(xiàn)該模塊的時候,是要和其他模塊的實現(xiàn)有區(qū)別有不同的。我知道不少人在實際落實上并沒有注意到這點,而是把“服務臺”當成一般流程一樣看待,設計有專門的崗位,人員和流程,這點上我個人有些不同看法?!狈张_”的核心職能是“單點受理用戶事件,提供一般問題的處理支持和跟進事件處理的全過程,及時反饋給用戶”等,這些事情如果照搬普通call center的模式,安排幾個人在接通用戶后,把問題再反饋給后續(xù)人員處理,那這個設置是沒什么意義的,也許他是提高了快速響應,但并沒有達到快速處理的目的。有價值的服務臺是能在最短時間內提供有效的方案解決用戶出現(xiàn)的問題,而這需要有專業(yè)的知識,這不是普通熱線人員能達到的水平。但假如為達到這個水平而設置一群技術人員專職從事這個事物,那必將導致成本的上升,對我們這個公司來說是沒法支持這個模式的。
因此,在我們這個系統(tǒng)體系下,服務臺就是直接由技術維護人員和具有一定技術能力的業(yè)務骨干來充當?shù)?,他們各自分管設備和流程的一部分,這些分工信息對用戶是公開的,因此當各自分管的工作出現(xiàn)問題時,用戶直接可以聯(lián)系到這些人員以得到及時的幫助,這些人對該事件負責,也負責其他服務臺的職責。在這里可以看出,我并沒有拉出一個團隊組建一個“服務臺”這么一個組織,而是規(guī)劃出一個虛擬的“服務臺”團隊,既是一線支持人員也是事件的管理者,當這些人員遇到不能解決的問題時,由他們負責后續(xù)的協(xié)調組織工作,直到事件處理接觸。
所以,在我的這個運營體系中,“服務臺”是被設計成嵌入在“事件管理”的流程中,成為了這個流程的一部分。對“服務臺”的考核不是一天能受理多少客戶電話,而是有多少客戶需求被滿足。只要流程、制度設計的完善,能完成“服務臺”應該有的職責就可以了,而不必要一定建立一個專職的團隊,尤其是在那些人力資源緊張的情況下。
事件管理 這個管理流程是整個系統(tǒng)最重要也是使用最多的,因此對它的嚴謹性,簡潔性和標準性要求也就比較高。
結合實際項目的運營,我們把事件的起源分為兩大類:主動事件和被動事件。主動事件是我們運維人員等通過內部的檢查機制或者預警機制發(fā)現(xiàn)的問題或者發(fā)起的事件。被動事件是由系統(tǒng)使用的用戶在使用過程中發(fā)現(xiàn)的問題事件和咨詢等。這個分類主要是為了分析評估我們的檢查機制和預警機制的功效。
事件類型被分為:“故障”、“咨詢”、“新需求”和“維護通告”,基本上涵蓋了所有重要的事件。而同時又從事件診斷角度對每個事件進行了分類,包括:電力、信號、網(wǎng)絡傳輸、硬件設備、操作系統(tǒng)、應用軟件、數(shù)據(jù)庫和業(yè)務應用等,這樣細分也是為了日后統(tǒng)計分析,有針對性的制定相關問題解決方案,充實知識庫和CMDB。需要指出的是,這里的分類要考慮到與CMDB的同步,這樣便于兩種數(shù)據(jù)的互通。
不是所有的事件都要立馬處理解決的,我們按照業(yè)務重要性(BIA)的特點和SLA的內容,根據(jù)事件的嚴重程度和緊急程度量化事件的嚴重等級。其中嚴重程度參考故障影響范圍(頻道數(shù)和流程數(shù)等),緊急程度參考RTO和RPO的需求。事件的嚴重等級最后確認為5級,并分別對每個級別做了行動預案,規(guī)定了流程、職責和批準關系等。
為了了解事件的實施進展,一個事件的全過程被區(qū)分為以下幾個階段:事件創(chuàng)建、事件等待、處理中、解決完畢,評審完畢,事件關閉。每個階段都記錄責任人,起止時間,用以評估每個環(huán)節(jié)和每個人的工作效率。各個階段的切換必須由一定授權的人員完成,且受時間發(fā)起短的服務臺人員的監(jiān)控下。這里需要特點談一下“評審完畢”的作用,有兩個:一是確認項目當時的分類信息等是否正確,這樣保證以后的統(tǒng)計正確性。二是確認事件是否引發(fā)“變更”流程,不論是知識庫還是CMDB,都需要在這個階段確認。一個事件真正意義的結束關閉不是簡單的問題得到解決,一個完整的事件流程是所有對外問題,對內分類、變更的相關流程都完成結束以后。
問題、變更&發(fā)布管理
[問題管理] 問題管理是事件管理的后續(xù)與推進,這個階段核心目標是把未知名問題轉變?yōu)橹麊栴}。問題管理的管理內容很大程度上是來自于事件的統(tǒng)計分析,問題管理的“關注度”其實就是繼承了事件管理的“影響范圍”和“嚴重程度”的結果。在規(guī)劃問題管理的時候,其“等級度”這個屬性是要和事件管理的相呼應,這樣也是便于由事件管理到問題管理的平滑過度。不是所有的事件都要轉化為問題來處理,到底該管理什么?一般關注的是“嚴重程度高的事件”和經(jīng)過統(tǒng)計后“重復出現(xiàn)的事件”,嚴重程度高意味著嚴重度*影響范圍的指標值就打,重復出現(xiàn)的事情的解決可以大大降低維護成本,減少資源,在這兩類問題上花費資源是事半功倍的,別糾結在那些影響不大,或者偶爾才發(fā)生的事情上。
問題的創(chuàng)建不象事件,它還需要有個“審批”的過程,這也是確保資源的有效使用,避免過度反應。其次問題管理還和SLA、配置庫、知識庫等相關聯(lián),這在設計問題管理流程以及出入接口的時候應該注意的地方。總體來說問題管理不是ITIL的難點,關鍵要在實際中按設計的流程來執(zhí)行。
[變更管理與發(fā)布管理] 盡管在ITIL中這兩個是分開的獨立流程,但在我們的業(yè)務流程中這兩個環(huán)節(jié)是由一個部門先后順序執(zhí)行的,沒有在部門這個角度上再區(qū)分。本來變更管理的核心并不是執(zhí)行變更,而是變更需要在一定的授權和控制直下執(zhí)行。發(fā)布的核心也是在一定授權的情況下實施的,以保證最新制定的變更能及時有效正確的部署到實際流程中,如果僵化的分開執(zhí)行,不但加長了流程部門間的溝通協(xié)調工作,還可能導流程事件的延長,導致標準沒有及時下達到實際生產(chǎn)流程中,形成不一致。因此只要在授權上和控制上設計的合適就沒必要一定要兩個流程來分別處理。但所有的變更都要保留歷史和痕跡,這樣有利于跟蹤和職責管理。
變更管理中最重要的是配置庫相關的變更,同時還有就是發(fā)布的版本控制問題,變更發(fā)布的時間點控制問題,目的是要避免影響正常業(yè)務環(huán)境。
第二篇:IT運維管理與ITIL
IT運維管理與ITIL
IT運維管理的由來
在企業(yè)IT管理的早期,更側重于對網(wǎng)絡、硬件等設備的管理。那時的IT管理就是通過某種方式對網(wǎng)絡進行管理,使網(wǎng)絡能正常高效地運行。早期的這種IT管理是NSM的階段,主要的面向目標就是底層的基礎網(wǎng)絡設備。NSM系統(tǒng)是對網(wǎng)絡中的底層設備進行實時的,統(tǒng)一的監(jiān)控,當網(wǎng)絡中出現(xiàn)了問題或者即將出現(xiàn)問題的時候,NSM向網(wǎng)絡管理者提出故障定位和報警,這樣做無疑大大方便了網(wǎng)絡管理員的工作。但是,NSM系統(tǒng)對于網(wǎng)絡上運行的各種業(yè)務系統(tǒng)以及業(yè)務系統(tǒng)的用戶只能做一些簡單的管理,這個時期的IT管理,可稱之為網(wǎng)絡運維管理階段,這時候的IT管理人員稱之為網(wǎng)絡管理員,簡稱網(wǎng)管。
隨著企業(yè)IT系統(tǒng)的日益成熟和復雜,企業(yè)的關注點已從單點管理到綜合管理角度的轉變,從關注單一網(wǎng)絡到對業(yè)務系統(tǒng)的關注。原因在于,越來越多的企業(yè)意識到,業(yè)務系統(tǒng)涉及環(huán)節(jié)逐漸增多,單一的網(wǎng)絡運維管理已經(jīng)不足以滿足管理需求,需要落實如何保障業(yè)務系統(tǒng)的各個環(huán)節(jié)。在滿足對IT資源進行統(tǒng)一管理,降低運行成本、提高突發(fā)事件應對能力、提高服務質量和效率的基礎上,更需要保障業(yè)務系統(tǒng)的正常運行,才可以保證IT投資的價值體現(xiàn)。同時,在國內IT管理領域,伴隨著用戶IT規(guī)模的擴大、IT技術的發(fā)展和用戶需求的提高,原有的網(wǎng)絡管理系統(tǒng)已經(jīng)遠遠不能滿足當前的用戶需求。
因此,當前國內用戶迫切需要一款能夠對整個IT資源進行統(tǒng)一管理,解決IT資源所面臨的種種困難,同時更要做到對業(yè)務系統(tǒng)有效保障并提出改進意見的平臺。在這樣一個前提下,IT運維管理的概念和產(chǎn)品被國內知名的網(wǎng)絡運維管理廠商率先推出??梢哉f,它的出現(xiàn)就是對當前用戶需求的一種有效詮釋。這個時期的IT管理,被稱之為IT運維管理,這時候的IT管理人員稱之為IT運維人員。ITIL與IT運維管理的關系 ITIL誕生于國外,當時是需要針對部門人數(shù)眾多,對業(yè)務保障要求高的電信、金融等行業(yè)的IT和業(yè)務進行有序化,透明化的管理,所以誕生了ITIL標準。ITIL標準的核心思想是通過將IT管理流程化,提高工作人員的工作效率,提高IT服務質量,更好的讓IT系統(tǒng)為業(yè)務提供服務,從而為業(yè)務系統(tǒng)的穩(wěn)定運行保駕護航。ITIL標準的底層是對IT基礎設施的管理,最上層是對業(yè)務系統(tǒng)的流程化管理。
那么,ITIL和IT運維管理到底有什么關系?
就像文章開始說到的一樣,企業(yè)最初設定IT部門進行IT管理的目的,就是希望通過IT部門能夠發(fā)現(xiàn)和解決各種來自底層基礎設施的問題,從而為保障網(wǎng)絡的正常運轉,為企業(yè)提供優(yōu)質的IT服務。但隨著企業(yè)IT系統(tǒng)和業(yè)務的不斷發(fā)展,企業(yè)用戶發(fā)現(xiàn),單純的通過對底層IT基礎設施管理無法解決底層網(wǎng)絡與上層業(yè)務系統(tǒng)之間的脫節(jié)問題。這也就是ITIL標準當初遇到的問題,最初主要是用來對IT部門的人員進行流程化和規(guī)范化的管理的,但它忽視了對底層平臺的管理及對業(yè)務系統(tǒng)的保障,脫離了用戶實際需要的ITIL,就像是空中樓閣,高不可及。近年來,為了更加貼近IT運維管理部門的工作需要,ITIL開始與企業(yè)的業(yè)務系統(tǒng)保障結合起來,形成了所謂BSM的管理模式,目的是使得ITIL能夠更好的為企業(yè)的IT運維管理提供服務。
但問題在于,無論從哪個角度來講,ITIL標準僅僅是一套方法論,沒有告訴我們具體的流程該怎么做。而實際上這個流程是建立在對日常IT管理過程中,如何發(fā)現(xiàn)問題,如何解決問題的經(jīng)驗積累的基礎上。但企業(yè)要實現(xiàn)ITIL需要的是結果,不會過多的關注這個過程怎么樣。因此,這就需要IT管理的供應商來解決這個問題。那么,怎么發(fā)現(xiàn)問題,又怎么解決問題,這就需要通過IT管理供應商提供的IT運維管理系統(tǒng)來解決。通過IT運維管理系統(tǒng)來發(fā)現(xiàn)和解決各種來自IT系統(tǒng)的問題,保證企業(yè)的網(wǎng)絡和運行在網(wǎng)絡上的業(yè)務系統(tǒng)正常運轉。在這個過程中,進行不斷的經(jīng)驗積累,然后才能在此基礎上實現(xiàn)ITIL的流程化管理。IT運維管理是ITIL標準體系的底層基礎。只有將這個底層基礎搭建完善,才能真正實現(xiàn)在此基礎上流程化管理。當前國內IT運維管理現(xiàn)狀
從IT運維管理的由來和兩者的關系不難看出,當前國內大多數(shù)IT服務廠商強調的IT運維管理概念,其實就是在網(wǎng)絡管理基礎之上的拓展,包涵的范圍不僅限于網(wǎng)絡管理,是對整個IT系統(tǒng)和業(yè)務所涉及到的范圍進行運維管理。但各IT服務供應商的產(chǎn)品對這個概念的體現(xiàn)不盡相同。至少在目前,實際上它還是網(wǎng)絡管理(或者稱之為IT基礎架構管理)外加部分應用服務管理和業(yè)務管理的含義,只是說法不同而已。
國內企業(yè)經(jīng)過多年的基礎設施平臺的搭建和完善,目前對于國內各行業(yè)的用戶來說,首要保證的是業(yè)務系統(tǒng)的穩(wěn)定運行,由業(yè)務的發(fā)展進而推進用戶去進行全面的基于ITIL標準的流程化管理,這是一個循序漸進的過程,是需要分階段分步驟來進行的。
第三篇:基于ITIL的IT運維管理系統(tǒng)概述
基于ITIL的IT運維管理系統(tǒng)概述
基于ITIL的流程框架的IT運維管理系統(tǒng),能夠快速適應企業(yè)業(yè)務流程及業(yè)務發(fā)展變化需求的IT運維管理最佳實踐,能夠幫助企業(yè)從人員、技術和流程三個方面提高IT運維管理能力,本文就來為大家介紹基于ITIL的IT運維管理系統(tǒng)。
基于ITIL的IT運維管理系統(tǒng)可以逐步建立并完善、達到以下目標:
標準化——通過ITIL的流程框架,構建最佳實踐經(jīng)驗的IT運維管理流程。
流程化——把大部分的IT運維管理工作流程化,確保這些工作都可重復,確保這些工作都能有質量完成。
自動化——替企業(yè)有效無誤地完成一些日常工作,比如備份,殺毒等。
基于ITIL的IT運維管理系統(tǒng)為用戶解決了哪些問題:
運行維護管理—重要性
事前管理——通過監(jiān)控系統(tǒng),及時發(fā)現(xiàn)故障隱患,主動的告訴用戶需要關注的資源,以達到防患于未然,事前管理的目的。
迅即的故障報警—全天候自動檢測與及時報警,通過多種告警方式實現(xiàn)網(wǎng)絡的“全天候無人值守”,大大降低管理人員的工作負擔。例:通過短消息告警和遠程客戶端管理的結合,用戶可以在任何地方輕松的管理自己的網(wǎng)絡,解決問題。
ITIL的標榜—IT服務最佳實踐
提供靈活的、流程化的IT服務管理,幫助企業(yè)完成流程定義、流程執(zhí)行、流程監(jiān)控以及流程的優(yōu)化。將日常操作全部流程化,并通過自動化工具對流程執(zhí)行情況進行及時追蹤。
業(yè)務流程化、流程自動化、服務規(guī)范化
通過流程管理來簡化IT部門繁瑣的業(yè)務,把維護人員從救火隊員中解救出來,規(guī)范運營管理。本文敘述的IT運維管理系統(tǒng)以ITIL的流程框架,締造一個流程化,自動化和規(guī)范化的IT運維管理系統(tǒng)。
以CMDB為運維核心,自動發(fā)現(xiàn)資源配置項
CMDB有兩部分重要內容,一是CI,二是CI之間的關系,這兩部分構成了CMDB比較核心的內容,在CMDB初始化方面,很多產(chǎn)品只是提供了手工輸入的方式對CI 的初始化,用戶需要面對大量的需要手工輸入的信息,造成系統(tǒng)使用前的高門檻,而摩卡軟件在這里提供了兩種方式快速進行CMDB的初始化,第一種是自動發(fā)現(xiàn)CI,第二種是從Mocha BSM系統(tǒng)中導入,大大簡化了用戶管理員的工作,快速搭建ITIL最佳實踐平臺。
多種渠道新建故障處理請求 為了提交企業(yè)各部門所遇到的IT故障處理請求,用戶可以通過自助服務臺、電話通知服務臺、監(jiān)控系統(tǒng)自動觸發(fā)等方式發(fā)起故障處理請求。通過自助服務臺用戶可快速新建故障處理請求,并隨時追蹤該故障請求的狀態(tài),如該故障請求是否已經(jīng)在處理當中,或者已經(jīng)轉為變更流程,需要繼續(xù)通過變更管理才能解決故障等。
知識庫與 FAQ 的緊密結合,IT運維管理經(jīng)驗的積累,IT運維管理經(jīng)驗的積累轉入到知識庫中
符合ITIL框架,規(guī)范IT部門管理
用戶實施ITIL的一個重要目的就是要規(guī)范IT 部門的管理,讓日常運維更加規(guī)范化、流程化、自動化,在產(chǎn)品中是通過自動化和流程化來體現(xiàn)管理的規(guī)范化的。
客戶化的IT運維管理流程,滿足不同業(yè)務需求
流程必須客戶化,產(chǎn)品如何做到呢?兩個層面,第一個層面就是可以方便的在用戶所需要的范圍內進行不同版本流程的切換,第二個層面就是用戶可以方便的通過可視化工具對流程進行定制,不需要二次開發(fā)的代碼,只需要簡單的鼠標拖動即可完成流程自定義。
可定制的KPI報表,度量流程執(zhí)行績效
系統(tǒng)中提供了很多和報表,來度量各個流程執(zhí)行的績效,報表是用來做統(tǒng)計用的,一般用來做各類別數(shù)量的統(tǒng)計或者是變化趨勢的統(tǒng)計,KPI 是經(jīng)過計算的,衡量各個模塊執(zhí)行績效的,在首頁上點擊后下面列出的黃色邊框的是報表,而綠色邊框的是KPI。
基于ITIL的IT運維管理系統(tǒng)的相關描述就為大家介紹完了,希望為欲了解此方面信息的讀者提供了參考信息。
第四篇:基于ITIL的醫(yī)院IT運維管理實踐
基于ITIL的醫(yī)院IT運維管理實踐
標簽: itil 運維 it服務管理 信息系統(tǒng) 流程
摘要:
醫(yī)院信息系統(tǒng)的規(guī)模日益龐大,復雜程度也越來越高,傳統(tǒng)的、作坊式的醫(yī)院IT運維模式已不適應時代的發(fā)展。改變原有被動處理問題的工作方式,建立主動服務的管理體系是IT服務組織發(fā)展的必然趨勢。本文結合作者的實際工作經(jīng)歷,圍繞著ITIL實施的核心要素:人員、流程和工具,對傳統(tǒng)醫(yī)院IT運維模式的弊端進行了分析,記述了基于ITIL理念對醫(yī)院IT部門進行改造、建立全新IT服務體系的方法和步驟,最后對實施效果進行了總結。關鍵詞: ITIL、IT運維 正文:
一、前言
隨著醫(yī)院信息化建設逐年深入,醫(yī)院信息系統(tǒng)的規(guī)模日益龐大,復雜程度也越來越高。醫(yī)療業(yè)務在享受信息系統(tǒng)提供便利的同時,對信息系統(tǒng)的依賴度也越來越高。信息系統(tǒng)故障不但可能導致醫(yī)療業(yè)務的中斷,甚至有造成醫(yī)療事故的可能。IT部門在日常運維工作中遇到的問題也越來越多樣化,涵蓋了從軟件到硬件、從服務器到桌面PC機、從網(wǎng)絡管理到機房管理、以及信息系統(tǒng)安全等方方面面。因為故障原因復雜,又缺乏有效地IT運維管理方法,不能及時解決問題,常會引起用戶的不滿。所以如何有效的管理IT資源,保障信息系統(tǒng)的可靠運行,提高用戶的滿意度,是醫(yī)院IT部門必須面對的問題。
二、傳統(tǒng)的醫(yī)院IT運維模式的弊端
傳統(tǒng)的醫(yī)院IT運維模式是在信息系統(tǒng)功能單
一、規(guī)模較小的環(huán)境下形成的,IT部門的員工就像“救火隊員”一樣被動的處理故障,常常存在如下弊端:
1、分工不清
“信息中心的電話沒人愿意接,誰接電話誰倒霉?!边@是一個醫(yī)院IT圈里流傳很廣的段子,也是許多醫(yī)院IT部門的真實寫照。因為電話里多半是這里或那里又有故障報修,無論是硬件故障、網(wǎng)絡不通、還是軟件宕機,對于用戶來說都是“電腦壞了”,故障描述不清,而解決起來也是千頭萬緒,搞不好就要花上半天的時間。大家都忙著做項目,運維工作貌似都要管,其實就是都不管,多一事不如少一事,接電話就成了燙手的山芋。
2、人員短缺
信息中心的工作繁雜且瑣碎,大家除了有新項目要推進,每天處理日常故障還要花上很多時間。IT部門是醫(yī)院的輔助部門,又是成本中心,既非主營業(yè)務,又不直接產(chǎn)生效益,瑣碎的工作無法量化,就很難在人員錄用上得到上級領導的支持。隨著信息系統(tǒng)一個接一個的上線,IT設備也越來越多,但人員還是那幾個。不但工作壓力越來越大,工作價值還得不到認可,人員短缺問題嚴重制約了信息化的持續(xù)發(fā)展。
3、重建設輕運維 由于醫(yī)院信息化建設逐年深入,業(yè)務部門對信息化建設的需求十分迫切,支持新的信息系統(tǒng)上線投用通常是醫(yī)院IT部門工作的重點。而上線后的系統(tǒng)運維工作通常仍由原項目實施人員兼顧。在這種運維模式下,一是解決問題完全依賴工程師個人經(jīng)驗,對問題發(fā)生的原因、處理過程,排查分析都沒有記錄,不但沒有避免同類事件再次發(fā)生的機制,甚至在同類事件再次發(fā)生時,也無法為其他工程師提供解決問題的參照依據(jù);二是沒有監(jiān)督和跟蹤機制,在繁雜的日常工作中,比較困難的問題常常經(jīng)過幾次轉手之后就被束之高閣、不了了之了。
4、系統(tǒng)變更風險大
信息系統(tǒng)運行過程中仍需隨著業(yè)務的變化做出調整與修改,既包括軟件功能的完善,服務器數(shù)據(jù)庫的調優(yōu),也包括新增網(wǎng)點、添置新的IT設備。在缺少配置信息和文檔管理的情況下,規(guī)模較小的系統(tǒng),問題還容易控制和解決。隨著系統(tǒng)越來越復雜,集成度越來越高,任何一點小的調整都可能牽一發(fā)而動全身,造成整個信息系統(tǒng)體系的不穩(wěn)定。工程師們常說“本來改了個小問題,沒想到改出個大毛病”“需求不改是等死,改了就是找死”
5、IT部門沒有IT系統(tǒng)
醫(yī)院的財務部門有收費管理系統(tǒng)、臨床部門有醫(yī)護工作站,檢查檢驗科室有LIS、PACS,然而在IT部門不遺余力的推動醫(yī)院信息化建設的同時,自身卻還停留在“口耳相傳”的作坊時代:IT設備報警靠人工巡檢、運維工作量無法統(tǒng)計、人員能力沒有考核依據(jù)、紙質配置文檔常與實際不符、無法形成有效的知識傳承等,常被醫(yī)院IT部門員工們戲稱為“燈下黑”。
由上可見,傳統(tǒng)的醫(yī)院IT運維模式已無法支持日益龐大的醫(yī)院信息系統(tǒng)。結果就是上線的信息系統(tǒng)越多,出現(xiàn)的問題就越多,解決問題越來越困難,用戶滿意度越來越差。
三、建立基于ITIL理念的IT服務管理體系
ITIL(Information Technology Infrastructure Library,信息技術基礎架構庫)是英國中央計算機和電信局CCTA于80年代中期開發(fā)的一套針對IT行業(yè)的服務管理標準庫[1],其核心是通過服務臺和10大管理流程,支持IT基礎架構和組織業(yè)務的持續(xù)運作,通過主動的IT服務管理,保證IT資源的有效利用和業(yè)務運作的高可用性、高持續(xù)性和高安全性。ITIL是公認的IT服務管理的最佳實踐,在世界范圍內被廣泛應用。
ITIL實施的三要素是人員、流程和工具。10大管理流程包括:事件管理、問題管理、配置管理、變更管理、發(fā)布管理、服務級別管理、持續(xù)性管理、可用性管理、能力管理、財務管理,涵蓋了IT服務中的各種場景。人員不僅僅指IT運維人員,還包括管理層和最終用戶,強調人的能力、意識和執(zhí)行力是決定項目成敗的關鍵。工具是指將ITIL流程落地的軟件系統(tǒng),通過IT服務管理軟件可以使流程的處理步驟更清晰、提高人員的執(zhí)行力;除此之外,該軟件還應包括IT運行監(jiān)控系統(tǒng),將IT設備的運行狀況納入IT服務管理。
圍繞這三個核心要素,根據(jù)院區(qū)實際情況,我們按照以下思路進行了ITIL實施:
1、以甲方為主的IT運維人員外包
由于醫(yī)院是事業(yè)單位,人員錄用受編制限制,人員短缺的問題就只能借助外部力量解決了。人員外包雖然有機制靈活、人員技術能力強的好處,但外包人員只是按甲方要求提供被動的服務,缺少對組織的了解和認同感,還需要甲方進行主動管理。因此,我們確立了以甲方為主的外包策略,制定了“與業(yè)務關系緊密的崗位不外包”、“只外包工作,不外包責任”的方針,要求外包廠商與原有IT部門工程師按AB角配置,即在各個專業(yè)上都有甲乙雙方工程師共同工作:甲方工程師以管理為主,側重方案審核和溝通協(xié)調;乙方以解決具體技術問題為主,若現(xiàn)場工程師不能解決,協(xié)調二線專家解決。按此原則,經(jīng)過公開招標,最終與某知名IT服務廠商簽訂了合同,在網(wǎng)絡、主機和桌面運維方面進行了人員外包。
2、從服務臺開始的ITIL流程實施策略
服務臺是整個IT運維體系的核心節(jié)點,是用戶與IT部門聯(lián)系的統(tǒng)一門戶,所以我們首先設立了統(tǒng)一的IT技術支持電話,在全院范圍內進行了“IT報障打XXXX電話,由服務臺統(tǒng)一跟蹤解決”的宣教,還將IT技術支持電話制作成標簽,貼到每一臺客戶端計算機上,以便用戶撥打。
在工作職責上,要求服務臺人員按照《IT技術支持電話接聽規(guī)范》進行電話應答,首先做“過濾器”,對問題進行初步判斷,并嘗試自己解決問題;再做“路由器”,不能解決的再轉到二線;最后做“司令部”,全體人員均須聽從服務臺指令,服務臺當值人員具有絕對權威,可根據(jù)自己的判斷要求二線工程師優(yōu)先處理運維事件。桌面運維崗位由初級工程師擔任,負責處理現(xiàn)場問題。服務臺崗位與桌面運維崗位不定期輪崗,以保證服務臺人員了解現(xiàn)場情況,并具有解決具體問題的能力。二線崗位由資深工程師擔任,分為應用系統(tǒng)、網(wǎng)絡、主機等不同專業(yè)方向。對于服務臺和桌面工程師不能解決的問題,由二線工程師跟進研究,并給出解決方案。
3、以事件管理和問題管理為流程驅動
在ITIL的10個管理流程中,事件管理和問題管理是與服務臺關系最密切的,所有的用戶故障報修都通過這兩個流程進行處理的。事件管理的目標是幫助用戶快速恢復業(yè)務,為此我們設定了24小時的默認處理時限,若事件不能在規(guī)定的時間內處理完成,就需要升級為問題,重點關注解決。事件處理實行首問負責制,第一個接到用戶報修的人,即使將事件派轉出去了,也必須一直跟進該事件單,直至關閉。
問題管理的目標是找到事件發(fā)生的潛在原因,我們通過每周工作例會的方式,對尚未解決的問題進行多專業(yè)會診,明確責任人和預計解決時間,每周跟進,直到問題處理完畢。對于重點問題,我們還會通過OA系統(tǒng)向相關用戶通報進展,以獲得用戶的理解和支持。
4、以流程的建立和制度的落實來降低風險。
既然信息系統(tǒng)變更是信息系統(tǒng)生命周期中不可避免的環(huán)節(jié),那么通過規(guī)范化IT管理可以將IT運維過程中系統(tǒng)變更的風險降到最低。配置管理是IT運維管理的數(shù)據(jù)基礎。其核心是建立CMDB(Configuration Management Database,配置管理數(shù)據(jù)庫),我們將原來分散在各個項目手中、手工管理的資源,統(tǒng)一錄入了數(shù)據(jù)庫,既方便運維人員查閱,又能保證信息及時更新。
在此基礎上,我們制定了一系列的制度和流程,保證所有的變更操作都在可控范圍內進行。如:所有服務器操作要求“方案先訂、試驗回退、通知用戶、雙人執(zhí)行、操作記錄、檢查應用”,所有軟件升級要求事先提出申請,按照《軟件發(fā)布及變更操作指導書》進行,保證每次軟件升級都經(jīng)過了充分的測試,并當發(fā)生問題時可以回退。
5、通過工具軟件落地流程的執(zhí)行
ITIL的實施不但需要流程的設計,還需要工具軟件來落地,為此我們采購了一套ITSM(IT Services Management,IT服務管理)管理軟件,IT部門也借助信息系統(tǒng)提高了工作效率。
首先實施了IT運行監(jiān)控系統(tǒng),將機房環(huán)境、網(wǎng)絡、服務器、數(shù)據(jù)庫、客戶端都納入了IT運行監(jiān)控體系,既減輕了信息中心運維人員的巡檢壓力,又可實時及時全面的掌握信息系統(tǒng)各個環(huán)節(jié)的運行狀況。然后開始逐步上線IT服務管理系統(tǒng),針對運維團隊規(guī)模較小,緊急事件多的現(xiàn)狀,進行了如下調整:一是在工單填寫項目上進行了精簡,只要描述清楚“什么人、在什么地方、報修什么問題、如何解決”即可,多設置選擇項,少做填空,既提高填寫速度,又便于后期統(tǒng)計分析。二是簡化工單流轉流程,事件執(zhí)行不做事前審批,而在完成后由事件經(jīng)理進行審核;緊急事件可不填寫工單立即處理,但應在24小時內補填工單,記錄事件處理過程。
四、效果與思考
通過以上的工作,我院的IT運維工作正逐步走上正軌。通過統(tǒng)一的技術支持電話,大家從繁雜的日常事務中解放了出來;通過明確的分工,使每個人的專長得到了發(fā)揮;通過有效的工作組織,IT部門不再單兵作戰(zhàn),更多的依靠團隊合作解決問題;更重要的是,通過流程的落實,實現(xiàn)了閉環(huán)管理,從而在制度上保障了信息系統(tǒng)可靠性。然而我們也意識到,ITIL的落實不是一蹴而就的,特別是對于中小規(guī)模的IT組織而言,更不能教條的照搬ITIL的全部流程,而應根據(jù)自己工作中遇到的問題,有選擇的實施某些流程或者流程中的某些部分。比如我們在事件處理流程中就減少了大量的審批環(huán)節(jié),而進行事后審查。這樣既保證了閉環(huán)管理,又提高了工作效率。
在ITIL實施的過程中,改變了大家原有的工作習慣,總會讓人有些不適應,這不但需要實施的技巧,更需要逐步磨合完善;通過一段時間的積累,在ITSM系統(tǒng)中已經(jīng)積累了大量的事件和問題的處理記錄,通過對這些數(shù)據(jù)進行分析,不但可以考核每個運維人員工作量,還可以將個體的經(jīng)驗匯總為知識庫,建立學習型組織,從而實現(xiàn)知識的有效傳承。
通過ITIL的實施,提高了IT部門自身的管理能力,保障了信息系統(tǒng)運行的可靠運行,并提高了用戶的滿意度。但如何量化的評價這些的收益,是深化IT管理的基礎,也是需要進一步思考的問題。
第五篇:基于ITIL的運維管理創(chuàng)新實踐案例
基于ITIL的運維管理創(chuàng)新實踐淺析
——云南電網(wǎng)有限責任公司瑞麗供電局-岳趙君
本期博文主題是關于IT運維管理的實踐應用,博主今天要和大家分享的是云南電網(wǎng)瑞麗供電局的岳趙君發(fā)表在2016年第8期《現(xiàn)代工業(yè)和信息化》雜志的文章《基于ITIL的運維管理創(chuàng)新實踐淺析》(下文為主要文章內容節(jié)選)。
保障系統(tǒng)安全、穩(wěn)定、高效的運行是信息部門的首要責任。隨著電力企業(yè)信息化的發(fā)展和完善,應用系統(tǒng)涵蓋了電力企業(yè)正常運轉的各個方面。業(yè)務系統(tǒng)軟硬件平臺復雜性高、建設及維護周期長、數(shù)據(jù)備份需求日益增長、IT系統(tǒng)信息安全不容忽視,這些問題都成為了電力信息化發(fā)展面前必須解決的問題。因此,創(chuàng)新電力信息化運維管理顯得尤為重要。
一、運維管理現(xiàn)狀
IT系統(tǒng)運維工作一般由技術、人員、流程三個基本元素組成。三個要素之問相互影響、相互制約,共同作用于運維管理工作。目前云南電網(wǎng)有限公司采用集中式的IT運營支撐模式,即:
1)系統(tǒng)集中:隨著CSGII系統(tǒng)已在全省范圍內廣泛使用,實施絕大部分核心IT系統(tǒng)都由省公司CSGII系統(tǒng)來進行建設維護。
2)人員集中:信息部、信息中心負責運維支撐的部門也是公司信息化建設和支撐的核心部門,對全省地市供電局信息化建設提供支撐。
3)流程集中:通過ITSM,IT呼叫中心等系統(tǒng)的實施,建立了全省統(tǒng)一的故障保修、工單審批流程等。
隨著IT集中化運營的發(fā)展,以及企業(yè)運營對IT系統(tǒng)廣泛應用,運維管理的問題也逐步顯露。如:集中技術維護工作量大、技術難度大、響應時問拖長等,從而造成服務質量下降、用戶滿意度下滑,服務人員往往疲于應付各種問題。顯而易見,在IT集中化運營模式中,服務管理流程的變更已成為目前最需要關注和解決的問題。
二、ITIL的創(chuàng)新實踐
ITIL(IT Infrastructure Library, IT基礎架構庫)是以流程作為導向,服務客戶為中心內容,整合IT服務與企業(yè)的業(yè)務為手段,提高企業(yè)的IT服務能力和水平的一種運維管理方法論。
ITIL的服務管理主要分為兩大部分:一是IT服務支持管理。是基礎性的管理流程,涵蓋了日常運營層面的內容,目的是讓用戶可以順利得到相關的IT服務。同時地是本次實踐創(chuàng)新重要研究的部分,主要有:服務臺、突發(fā)實踐管理、問題管理、配置管理、變更與發(fā)布管理。二是IT服務提供管理。主要圍繞IT策略過程,更多體現(xiàn)在ITIL在企業(yè)運營決策層面的 IT部署,是提高性的管理流程。
ITIL管理理論的創(chuàng)建,有效幫助整合了IT運維管理流程和體系,為IT服務管理建立運營框架。根據(jù)ITIL理論,IT服務系統(tǒng)是技術設施、流程和人員等諸多參與因素相互作用的結果。目前我們需要落地理論的關鍵所在是結合企業(yè)運維管理的實際狀況,找出IT集中運維模式所面臨的各類問題,進而改進IT服務的輸出質量和流程績效。
結合公司實際情況,建設了一、二、三線技術支撐維護體系。2.1一線運維工程師職責 結合IT呼叫中心建設,組建一線運維工程師團隊,負責ITIL的幫助臺和突發(fā)事件管理。提供7*24小時服務熱線電話,全年不間斷接收供電局的需求信息。碰到任何問題和疑問時,立即通知專門服務小組項目經(jīng)理,由責任人立即啟動一系列預警反應機制,指導和協(xié)調下一步的處理工作。
2.2二線工程師職責
組建技術能力強、工作經(jīng)驗豐富的二線技術支持工程師團隊,負責ITIL的問題管理、配置管理,由于系統(tǒng)的應用復雜性、設備維護的專業(yè)性,二線支撐團隊按系統(tǒng)組建,負責分析系統(tǒng)參數(shù)、數(shù)據(jù)、信息,必要時現(xiàn)場收集并處理信息,進行優(yōu)化的實質性工作。
2.3二線工程師職責
三線工程師主要負責ITIL的變更/發(fā)布管理,由于技術專業(yè)性要求高,三線的支撐體系主要協(xié)調省公司及系統(tǒng)建設集成商、第三方廠商資源進行支持。在結合ITIL和公司自身情況建立起來的三線服務支持體系,需要在合理的需求分析前提下,響應的問題及時的流轉到響應的工程師,這樣問題的響應時時間大幅減少,同時又能做到專業(yè)對口、能力匹配,事件處理的效率自然就能大幅度提升。
三、基于ITIL組織框架的運維管理實踐 結合公司信息化建設集中化的建設原則,在供電局成立之日起各種專業(yè)的集中式信息系統(tǒng)逐步實施,供電局面臨人員短缺,技術能力跟不上,處理系統(tǒng)事件不及時等問題。
為了解決運維管理中的問題,2013年起供電局在省公司的幫助下開始結合ITIL開始進行運維管理實踐探索,從運維團隊ITIL培訓,三線運維體系建設,ITIL工單化流程梳理等方面進行了深入的探討和全面實施。
2013年初,為了解決事件反映不及時的問題,公司建立了一站式的IT呼叫中心和事件管理流程,安排一線運維工程師7*24小時在線接受問題,并持續(xù)培訓用戶,養(yǎng)成用戶有事件撥打IT呼叫中心幫忙電話,通過這一支撐服務前移的項目,取得了明顯效果: 1)接受流程::建立基于ITIL的一線服務平臺、事件管理流程的IT呼叫中心,確定一站式統(tǒng)一事件管理的目標;
2)梳理流程:對維護資源進行了整合調整,創(chuàng)建基于ITIL的一、二、三線的支撐體系; 3)總結流程:對流程關鍵點進行量化,建立了統(tǒng)一的對外服務標準,以及一、二、三線的內部考核指標;
4)從2013年起,經(jīng)過近2年的實施,已經(jīng)取得明顯的成效,目前供電局系統(tǒng)可用率、客戶滿意率一直保持在99%以上,顯著提升了供電局的運維管理能力。
四、結語
IT集中化運營模式,是未來信息化發(fā)展的趨勢,結合ITIL打造的快速、高效的一、二、三線運維支撐體系是我們?yōu)樽非蟾咝ё吭降倪\維管理的初次探索,我們也將不斷探索、不斷實踐,全面提升公司的信息化運維管理能力。
如果您在閱讀這篇博文之前,還未認識過ITIL,請來電咨詢上海信息化培訓中心,我們有專門的老師詳細為您答疑解惑;
如果您在閱讀這篇博文時候,已經(jīng)了解過ITIL,如果想深入實踐,請來電咨詢上海信息化培訓中心,這里不僅有一系列的ITIL課程,而且可以為公司專門定制個性化課程和團訓;
如果您在閱讀這篇博文的時候,已經(jīng)學習過部分ITIL課程,請來電咨詢上海信息化培訓中心,這里有專門的老師為您解答ITIL高階課程信息!
上海信息化培訓中心(004km.cn)好課ITIL每月定期開班,咨詢021-62126633-6021.還可以關注微信微博了解最新ITIL發(fā)展前沿。
上海信息化培訓中心SITC是中國領先的信息化促進機構,是ITIL的最好殿堂。