欧美色欧美亚洲高清在线观看,国产特黄特色a级在线视频,国产一区视频一区欧美,亚洲成a 人在线观看中文

  1. <ul id="fwlom"></ul>

    <object id="fwlom"></object>

    <span id="fwlom"></span><dfn id="fwlom"></dfn>

      <object id="fwlom"></object>

      智能化運維之IT系統(tǒng)統(tǒng)一監(jiān)控預研報告

      時間:2019-05-14 05:23:41下載本文作者:會員上傳
      簡介:寫寫幫文庫小編為你整理了多篇相關的《智能化運維之IT系統(tǒng)統(tǒng)一監(jiān)控預研報告》,但愿對你工作學習有幫助,當然你在寫寫幫文庫還可以找到更多《智能化運維之IT系統(tǒng)統(tǒng)一監(jiān)控預研報告》。

      第一篇:智能化運維之IT系統(tǒng)統(tǒng)一監(jiān)控預研報告

      IT系統(tǒng)統(tǒng)一監(jiān)控預研報告

      目錄

      IT系統(tǒng)統(tǒng)一監(jiān)控預研報告..........................................................................................1 1 2 2.1 2.2 2.3 3 引言....................................................................................................................3平臺建設的目標..................................................................................................3 建立健全企業(yè)IT運行監(jiān)測指標體系.................................................................3 完善公司業(yè)務監(jiān)測指標體系,保障業(yè)務連續(xù)性.................................................4 管理業(yè)務系統(tǒng)容量...........................................................................................5平臺架構.............................................................................................................5

      3. 1平臺技術架構...............................................................................................5 3.1.1 3.1.2 3.1.3 采集層..........................................................................................................6 處理層..........................................................................................................6 展現(xiàn)層..........................................................................................................6

      3.2平臺功能架構....................................................................................................7 4 對新核心系統(tǒng)建設的要求....................................................................................8

      4.1規(guī)范系統(tǒng)日志輸出.............................................................................................8 4.3 提供服務持續(xù)可用性監(jiān)控方法........................................................................10 5 結論..................................................................................................................11 引言

      隨著信息系統(tǒng)規(guī)模持續(xù)擴大,業(yè)務應用的不斷增加,服務用戶對象的日益增多,IT運維管理人員逐漸面臨著三大難題:

      (1)設備和業(yè)務種類繁多,各類資料信息分散,導致位于一線的IT運維監(jiān)控人員感知故障的速度晚于信息系統(tǒng)的使用用戶,且故障發(fā)生后缺乏對信息系統(tǒng)的整體把控;而后臺管理人員也往往因為信息系統(tǒng)性能數據和故障數據的匱乏而缺少對系統(tǒng)運行健康度的了解。

      (2)核心機房可能分布于多個地點,部署范圍廣泛,設備繁雜,對于大批最網絡設備、主機服務器、應用系統(tǒng)沒有一個統(tǒng)一的監(jiān)控平臺,不能制定統(tǒng)一的故障預警管理策略,故障預警效率低,業(yè)務恢復時間慢;

      (3)對關鍵核心業(yè)務系統(tǒng)的運行健康程度缺乏評估手段和預警措施,只能被動等待問題發(fā)生,無法提前采取技術手段和管理手段規(guī)避問題。

      在此背景下,總分公司一線運維人員數量多但是經驗不足,后臺運維工程師經驗豐富但是數量少,這些矛盾促使我司在新系統(tǒng)建設時需同步建設一套一體化的IT運維監(jiān)控和服務預警平臺,協(xié)助以自動化的手段完成信息系統(tǒng)的監(jiān)測和維護。平臺建設的目標

      2.1 建立健全企業(yè)IT運行監(jiān)測指標體系

      首先,平臺的主要目標是加大對公司內部各遺留及專有監(jiān)控系統(tǒng)的整合力度,提高IT運控中心對公司內其他分支機構IT系統(tǒng)管理、檢測和把控能力,建立并完善IT系統(tǒng)監(jiān)控、IT運行事件響應、IT系統(tǒng)故障處理、IT健康度報告、IT運行問題跟蹤和反饋機制,引人自動化IT運維管理工具,從而在公司內部建立健全運行管理控制能力,實現(xiàn)IT健康度和業(yè)務連續(xù)性治理。

      在此基礎上,進一步優(yōu)化監(jiān)控策略,實現(xiàn)對設備及服務項全面、細粒度的監(jiān)測,預警和管理,主要包含以下方面:

      (1)打造多平臺環(huán)境下安全穩(wěn)定髙效的檢測代理及檢測工具;(2)在實現(xiàn)對各類業(yè)務系統(tǒng)、硬件和網絡設備、機房環(huán)境等實時檢測的基礎上,完善對新核心系統(tǒng)的全流程監(jiān)控,根據性能數據進行預警,并將性能數據和故障數據引入事件管理平臺進行后續(xù)治理,以可視化的方式向運維人員提供一覽式的IT服務健康狀況視圖;

      (3)構建集成監(jiān)控平臺,對平臺的檢測插件、檢測機制、預警算法、視圖展現(xiàn)等監(jiān)控資源進行統(tǒng)一管理,實現(xiàn)大屏集中式告警,便于后臺管理人員直觀地看到系統(tǒng)整體健康程度;通過視圖的靈活組合可以快速定位故障點,結合知識庫縮短處理時間。

      因此,IT運維自動化是一組將靜態(tài)的設備結構轉化為根據IT服務需求動態(tài)彈性響應的策略,目的就是實現(xiàn)IT運維的質量,降低成本。

      2.2 完善公司業(yè)務監(jiān)測指標體系,保障業(yè)務連續(xù)性

      隨著公司信息化的發(fā)展,IT技術已經從業(yè)務支持逐步走向與業(yè)務的融合,并成為公司穩(wěn)健運營和發(fā)展的支柱。公司內部很多業(yè)務流程都已經在IT部門的支持下實現(xiàn)了流程的再造和優(yōu)化,提煉并制定了相應的流程圖、流程文件及流程運作機制。但是目前我們對于公司內部業(yè)務風險的管控尚處在初步階段。各類業(yè)務流程依然面臨著來自內部和外部的各種業(yè)務風險。例如內部業(yè)務風險主要來自于員工和服務商對信息系統(tǒng)的不當應用,如非授權操作或誤操作;外部業(yè)務風險主要來自于外部的不安全事件,如黑客攻擊、機房環(huán)境變化等。對應用系統(tǒng)進行業(yè)務監(jiān)控,能夠及時識別業(yè)務風險,有效進行相應的主動規(guī)避操作,避免造成損失。

      2.3 管理業(yè)務系統(tǒng)容量

      通過業(yè)務監(jiān)控平臺可以密切監(jiān)控業(yè)務系統(tǒng)性能,包括系統(tǒng)的業(yè)務處理量、處理性能、各資源使用狀況等,通過對系統(tǒng)資源瓶頸的分析,可以降低或提高業(yè)務系統(tǒng)容量; 平臺架構

      3. 1平臺技術架構

      運維平臺能夠對各類計算機設備、網絡設備、安全產品、應用系統(tǒng)等IT設備運行狀況和各種網上行為進行集中監(jiān)控,對各類設備進行全面集中的統(tǒng)一管理,及時發(fā)現(xiàn)各類異常情況、快速定位各類事件故障并自動形成“工單”、自動分派,再由調度系統(tǒng)進行分派,由系統(tǒng)按預定流程規(guī)則進行自動化處理或人工處理的運維業(yè)務信息管理系統(tǒng)。使運維工作由被動變主動,由手動處理變成自動處理,并大大降低了運維人員的工作強度,具備良好的延展性,如下圖所示:

      如上圖所示,一體化運維監(jiān)控平臺的系統(tǒng)整體框架由下及上劃分為3層數據采集息(采集層)、數據處理層(處理層)和數據使用層(展現(xiàn)層)。此外,通過平臺的管理控制臺,在各個層面都能夠對平臺進行全方位的配置管理。

      3.1.1 采集層

      采集層主要負責采集信息系統(tǒng)的性能數據和故障數據,通過在信息系統(tǒng)服務器上部署Agent,或者通過SNMP協(xié)議采集等多種方式與外圍系統(tǒng)對接,獲取所述基礎數據。采集層被動地接收平臺服務器發(fā)出的采集指令,執(zhí)行相關的信息采集插件,將采集到的數據放人隊列和數據庫中,便于后續(xù)的分析和數據挖掘。

      3.1.2 處理層

      數據處理層根據不同監(jiān)控對象的自身特點和運維管理需要,靈活定制相應的性能指標集,定義所述性能指標集中每個指標的監(jiān)測范圍、數據來源, 計算方法、預警閾值、測量頻度參數,通過實時和歷史性能圖表,進行監(jiān)測、分析和確定系統(tǒng)性能瓶頸,若超過預警閾值的狀況,自動建立事件,并通知運維人員,由調度系統(tǒng)進行指派,由運維人員手動處理或按照流程規(guī)則由自動化運維工具處理。

      3.1.3 展現(xiàn)層

      展現(xiàn)層分信息系統(tǒng)全局視圖、系統(tǒng)健康度巡檢報表、檢測數據査詢三個部分。全局視圖可以展現(xiàn)實時監(jiān)視告警情況,利用巡檢報表,系統(tǒng)管理員可以分析系統(tǒng)性能狀況,并記錄進事件管理平臺。上述綜合展示通過業(yè)務視圖、邏輯拓撲、重要設備、告警統(tǒng)計各個不同視圖,將運維管理工作所關注的內容有序、實時、全面地呈現(xiàn)出信息系統(tǒng)資源和業(yè)務系統(tǒng)的整體運行狀況。3.2平臺功能架構

      一體化IT運維監(jiān)控模型基于松耦合體系架構,采取靈活模塊化組裝、云計算靈活部署結構,實現(xiàn)“監(jiān)控、管理、管控”三個方面協(xié)同處理過程,其功能架構如下:統(tǒng)一訪問門戶通過一次登錄,即可對所有的平臺功能進行操作,針對不同的登錄用戶,可以提供專門的個人桌面和輔助工具。

      監(jiān)測臺可以定義服務視圖,將性能,流量,報表,拓撲等系統(tǒng)管理所關心的信息在不同樣式的視圖上集中體現(xiàn)出來。

      運行服務平臺以IT管理流程為核心,對運維的主要工作進行規(guī)范化的管理,并實現(xiàn)設備維修、值班的管理。

      統(tǒng)一事件管理平臺能夠提供統(tǒng)一的企業(yè)級網絡事件管理。通過從各種網絡設備和管理平臺收集網絡事件信息,并進行必要的分析和自動化處理工作。

      集成數據網管系統(tǒng),提供數據網管標準接口以供信息交互,完成事件的統(tǒng)一管理,使網絡和系統(tǒng)中的各種資源得到更加高效的利用和綜合管理。

      系統(tǒng)管理提供對服務器、存儲設備、操作系統(tǒng)、數據庫、中間件、綜合管理,實現(xiàn)系統(tǒng)故障告警管理、系統(tǒng)性能管理、拓撲與配置管理。

      接收來自防火墻、人侵檢測、端口掃描等安全系統(tǒng)的告警,并將這些告警實時呈現(xiàn)給信息網絡安全部門,以采取進一步的響應動作,保障網絡系統(tǒng)的正常運行,并對網絡流量進行監(jiān)聽和分析。對新核心系統(tǒng)建設的要求

      4.1規(guī)范系統(tǒng)日志輸出

      目前核心業(yè)務系統(tǒng)的日志輸出沒有統(tǒng)一的規(guī)范,有些日志采用log4j進行輸出,有些直接在系統(tǒng)中采用System.out在nohup.out文件中進行輸出,給運維監(jiān)控分析排查問題帶來較大的困難,建議在新系統(tǒng)的建設過程中,統(tǒng)一規(guī)范日志的輸出:(1)規(guī)范日志信息級別

      日志信息輸出的優(yōu)先級從高到低至少應分為五檔,分別是Fatal、ERROR、WARN、INFO、DEBUG。這些級別用來指定這條日志信息的重要程度。在測試階段可以打開所有級別的日志,系統(tǒng)上線后只允許輸出INFO以上級別(含INFO)。

      各級別的日志信息作用如下:

      致命(Fatal)——嚴重的錯誤,系統(tǒng)無法正常運行,如硬盤空間滿等。這個級別很少被用,常暗含系統(tǒng)或者系統(tǒng)的組件迫近崩潰。

      錯誤(Error)——系統(tǒng)可以繼續(xù)運行,但最好要盡快修復的錯誤。這個級別用的較多,常常伴隨Java異常,錯誤(Error)的環(huán)境不一定會造成系統(tǒng)的崩潰,系統(tǒng)可以繼續(xù)服務接下來的請求。

      警告(Warn)——系統(tǒng)可以正常運行,但需要引起注意的警告信息。這個級別預示較小的問題,由系統(tǒng)外部的因素造成的,比如用戶輸入了不符合條件的參數。

      信息(Info)——系統(tǒng)運行的主要關鍵時點的操作信息,一般用于記錄業(yè)務日志。但同時,也應該有足夠的信息以保證可以記錄再現(xiàn)缺陷的路徑。這個級別記錄了系統(tǒng)日常運轉中有意義的事件。

      調試(Debug)——系統(tǒng)運行中的調試信息,便于開發(fā)人員進行錯誤分析和修正,一般用于程序日志,關心程序操作(細粒度),不太關心業(yè)務操作(粗粒度)。系統(tǒng)出現(xiàn)問題時,必須拋出異常,在處理異常時記錄日志,且日志級別必須是前三個級別(FatalErrorWarning)中的一種。

      (2)日志中除包含錯誤信息外,還需包含如下信息:

      a)

      Web應用系統(tǒng)發(fā)生異常時,日志信息中需包含,系統(tǒng)操作用戶的信息,發(fā)生異常時的業(yè)務數據、系統(tǒng)功能、程序代碼信息及完整的SQL語句; b)接口類服務發(fā)生異常時,日志信息中需包含,接口調用的URL,調用端和被調用端的實地址,交互報文,報文的檢查結果,接口響應時常; c)

      在日志中,記錄關鍵程序和數據庫交易的處理時長,并根據事先預定的閾值,在日志中以醒目的方式完整的顯示超過閾值的程序代碼的方法名或SQL語句,以便運維監(jiān)控人員分析,排查性能隱患。

      4.2 預留應用系統(tǒng)監(jiān)控接口,便于監(jiān)控系統(tǒng)采集相關指標

      在核心的建設過程中,需預留監(jiān)控接口,應用監(jiān)控系統(tǒng)通過調用核心系統(tǒng)的監(jiān)控接口,來采集包括但不限于以下指標:

      a)從web頁面對應用程序功能進行語義監(jiān)控,比如“頁面加載錯誤”、“Error500”、”Error404”;

      b)對用戶訪問質量的監(jiān)控,頁面加載時常;

      c)對程序主邏輯進行監(jiān)控,判斷主邏輯是否正常;

      d)如果主邏輯正常,則對程序自身占用資源的合理性、程序的性能、和程序的分支功能進行判斷;

      e)另外對程序占用的資源情況進行監(jiān)控:CPU資源的占用,內存資源的占用,文件句柄的使用情況,網絡句柄的使用情況,文件狀態(tài)的進程數; f)服務的監(jiān)控指標,數據加載的情況,模塊的處理能力(平均耗時,隊列長度,線程池的使用率),模塊間通訊的狀態(tài)(平均連接時間,讀、寫錯誤數),模塊運行時間;

      g)系統(tǒng)用戶的操作習慣,完成功能模塊操作的時長;

      4.3 提供服務持續(xù)可用性監(jiān)控方法

      服務化是應用系統(tǒng)發(fā)展的方向,但服務的監(jiān)控及問題的排查,一直困擾運維人員,尤其是多層服務之間調用問題的排查是相當困難的(例如:服務調用 A->B->C->D,最終結果依次返回 D->C->B->A,中間任何環(huán)節(jié)出現(xiàn)問題,結果都返回不到A)。建議在新系統(tǒng)的建設過程中考慮提供服務的自測工具和監(jiān)控方法,服務的自測工具以便讓運維人員進行手動的排查問題; 監(jiān)控方法,主要是將系統(tǒng)服務的監(jiān)控納入監(jiān)控管理平臺,由監(jiān)控平臺對系統(tǒng)服務進行7*24小時不間斷的監(jiān)控。

      另外,在服務的設計中,建議考慮服務的配對規(guī)則,以便在服務間調用發(fā)生異常后能快速的通過配對規(guī)則識別出服務的調用方和被調用方,進而快速的定位問題,排查問題,解決問題。結論

      IT系統(tǒng)一體化運維監(jiān)控平臺需包含性能監(jiān)控、故障監(jiān)控、決策分析、數據挖掘以及關鍵業(yè)務流程監(jiān)控等多種功能,在此基礎上通過數據分析技術,建立智能、高效、易用、實用、靈活的面向業(yè)務流程的全方位、多層次的IT運維智能決策支持系統(tǒng),有助于提升信息管理的效率。

      第二篇:IT運維監(jiān)控管理系統(tǒng)招標文件可行性研究報告

      招標要求.......................................................................................3 1.1 1.2 總體設計要求...................................................................3 項目建設目標與原則.......................................................3 IT運維管理平臺功能要求..........................................................6 2.1 網絡監(jiān)控與管理要求.......................................................6

      2.1.1 系統(tǒng)工作模式..............................................................6 2.1.2 網絡安全設備管理.....................................................6 2.1.3 面向網絡的一體化管理.............................................7 2.1.4 網絡拓撲管理..............................................................7 2.1.5 設備管理......................................................................9 2.1.6 性能管理....................................................................10 2.1.7 故障管理....................................................................12 2.1.8 流量管理....................................................................13 2.1.9 報表管理....................................................................16 2.1.10 安全邊界管理............................................................17 2.2 資源監(jiān)測管理.................................................................18

      2.2.1 服務器系統(tǒng)管理........................................................18 2.2.2 數據庫管理................................................................19

      2.2.3 中間件管理................................................................23 2.2.4 基礎應用平臺及通用服務管理...............................24 2.2.5 基礎運行環(huán)境管理...................................................26 2.3 告警監(jiān)控管理.................................................................26

      2.3.1 告警管理....................................................................26 2.3.2 告警通知....................................................................27 2.4 統(tǒng)一監(jiān)控展現(xiàn).................................................................27

      2.4.1 靈活拓撲展現(xiàn)............................................................28 2.4.2 網絡監(jiān)控展現(xiàn)............................................................29 2.4.3 業(yè)務監(jiān)控展現(xiàn)............................................................29 2.4.4 資源監(jiān)測展現(xiàn)............................................................30 2.4.5 節(jié)點監(jiān)測展現(xiàn)............................................................31 2.4.6 告警信息展現(xiàn)............................................................31 2.4.7 靈動可視化平臺........................................................32 2.4.8 擴展展現(xiàn)集成接口...................................................32 2.5 報表管理.........................................................................32 招標要求 1.1 總體設計要求

      (1)系統(tǒng)平臺設計應該符合信息行業(yè)和本行業(yè)的標準,系統(tǒng)內部數據采用標準的格式,系統(tǒng)構架采用標準開放的應用框架和組件結構。

      (2)為保證系統(tǒng)平臺的統(tǒng)一性,要求軟件/模塊必須使用同一品牌,所有軟件/模塊必須擁有完全自主知識產權,不能依托于其他第三方的平臺。支持主流操作系統(tǒng)和ORACLE數據庫,全中文界面,提供友好、直觀、易懂的圖形呈現(xiàn),提供強大的信息交互與管理能力。

      (3)系統(tǒng)要求運行在開放的TCP/IP網絡環(huán)境下,基于J2EE平臺開發(fā),結合C++、CORBA標準和技術,采用B/S + C/S架構,支持IE7,IE8等標準瀏覽器,實現(xiàn)系統(tǒng)界面、業(yè)務邏輯、數據集成等功能,采用標準接口進行系統(tǒng)間的數據交換與數據共享。

      (4)監(jiān)控子系統(tǒng)要求支持遠程監(jiān)控和代理、CLI等多種方式監(jiān)測。支持對Windows、Linux、Unix(HPUX、AIX、Solaris?)平臺系統(tǒng)的監(jiān)測,支持Syslog安全日志的管理;支持多種告警方式,能夠以Email、NetSend、外部命令、Snmp設置、Trap轉發(fā)、Agent執(zhí)行腳本、短信等通知方式進行告警;支持對所

      有監(jiān)控范圍內IT資源的當前和歷史運行情況進行統(tǒng)計,并生成各種分析報表和圖表。

      (5)平臺要求支持統(tǒng)一身份認證的單點登錄、統(tǒng)一權限管理和統(tǒng)一界面展現(xiàn)功能;

      (6)系統(tǒng)平臺要求提供友好的操作管理,能夠根據不同管理層次的管理要求靈活定制不同的管理界面。

      (7)系統(tǒng)要能夠提供良好的集成接口,支持與第三方標準產品的集成部署;

      1.2 項目建設目標與原則

      IT運維管理系統(tǒng)平臺項目建設的總體目標是實現(xiàn)對企業(yè)的網絡、設備、主機、安全系統(tǒng)、數據庫、中間件、應用系統(tǒng)等IT資源的可視、可控、可管理,從根本上提高IT運維管理水平,為企業(yè)核心業(yè)務系統(tǒng)提供有利保障;加強對IT系統(tǒng)及IT資源的監(jiān)控與維護能力、提高維護工作效率、改善維護工作的質量,進而保證各系統(tǒng)維護水平的可持續(xù)性提升。

      IT運維管理平臺的建設應遵循開放性、先進性、安全性、可靠性、易用性等原則:

      1.戰(zhàn)略性原則

      a)提供具有針對性、可行性和可靠性的技術解決方案 2.開放性原則

      a)采用符合國際國內通用的標準協(xié)議

      b)支持主流計算機平臺、操作系統(tǒng)以及數據庫廠商的各類軟硬件產品。3.先進性原則

      a)采用國內外監(jiān)控和服務管理領域先進的技術和解決方案

      b)在方案中要將監(jiān)控和服務有機的結合起來,實現(xiàn)無縫集成。4.安全性原則 a)保證數據安全

      b)不增加現(xiàn)有應用系統(tǒng)的復雜性,更不會降低現(xiàn)有應用系統(tǒng)的穩(wěn)定性。

      c)有嚴格的身份認證,實施對用戶真實身份鑒別 d)采取分級用戶結構,提供用戶權限管理,防止未授權的用戶訪問;

      e)有安全審計功能,配置審計時對生產系統(tǒng)不產生影響; f)日志安全存放,并有格式化的輸出,便于檢索和查詢 5.可靠性原則

      a)管理系統(tǒng)應該在系統(tǒng)結構、設計方案、設備選擇、技術服務等方面綜合考慮,保證系統(tǒng)能夠安全無故障運行

      b)安裝在被監(jiān)控對象上的代理或探測工具占用被監(jiān)控對

      象的資源在5%以內; 6.易用性原則

      a)提供簡潔、方便、有效的管理工具和界面,有完整的系統(tǒng)文檔。

      b)提供可擴充性的接口設計以便于維護人員的日常管理和維護;

      c)采用CS+B/S結構;用戶界面應有容錯能力,所用術語應具有一致性;

      d)用戶進入系統(tǒng)的相應功能模塊后,該模塊所涉及的各項功能盡量在統(tǒng)一的一個界面中顯示和完成,減少新界面的彈出;

      e)系統(tǒng)采用集中、無需代理的方式運行,無需在被監(jiān)測信息系統(tǒng)、服務器上安裝任何代理軟件,只需在一臺網管機上安裝,即可自動對整個信息系統(tǒng)進行監(jiān)測和管理,不改變現(xiàn)有系統(tǒng)的應用配置,對現(xiàn)有系統(tǒng)性能影響甚微,安裝實施、維護使用十分方便。7.知識產權保護原則

      a)要求本項目涉及的所有產品符合國家對軟件產品的有關規(guī)定,并具有相應的產品認證或許可,無版權糾紛。IT運維管理平臺功能要求 2.1 網絡監(jiān)控與管理要求 2.1.1 系統(tǒng)工作模式

      系統(tǒng)采用多層架構、信息總線技術,具備良好的性能和擴展性,系統(tǒng)為用戶提供了C/S和B/S的兩種展現(xiàn)模式,為不同關注層面的用戶服務。以方便管理人員使用C/S對網絡進行專業(yè)管理,運維人員使用B/S對網絡進行值班監(jiān)控。

      系統(tǒng)具有擁有靈活、高效的網絡采集引擎,通過對象識別、采集并發(fā)及針對的廠商擴展腳本,可準確、可靠的提供網絡設備交互服務。系統(tǒng)利用ICMP、ARP、SNMP、NetBIOS、CLI等標準進行網絡探測和信息采集,對發(fā)現(xiàn)的網元對象進行識別、分析、保存,形成統(tǒng)一的網管資源庫,并在此基礎上進行拓撲計算,生成物理、網絡等不同層次的拓撲結構。

      通過主動(ICMP、SNMP、CLI)與被動(Trap、、NetFlow、SFlow、鏡像、NetStream)兩種方式,系統(tǒng)可以從設備上獲得各類性能指標和流量數據,經過長時間數據的跟蹤記錄,最終挖掘分析生成各種報表,展現(xiàn)網管部門需要的網絡流量與負荷信息,以供對網絡狀態(tài)的合理評估與決策。

      在對網絡的不間斷實時監(jiān)測中,系統(tǒng)能夠收集針對網絡、設

      備、終端及鏈路的各種事件,并利用過去在網管過程中學習得到的處理規(guī)則,系統(tǒng)可以對這些事件進行智能分析,并關聯(lián)所有符合故障特征的相關事件,最終在故障發(fā)生前、或故障發(fā)現(xiàn)時發(fā)出正確告警,以便網絡管理人員高效、及時的定位并解決問題。2.1.2 網絡安全設備管理

      全面支持CISCO、華為、中興、北電、Foundry、Extreme、Avaya、H3C、DLink 等各種不同廠商、不同型號的網絡與安全設備,提供各類設備的基本信息、CPU / MEM負載狀況,設備可用狀態(tài)、連續(xù)運行時間、響應延時、端口速率、ICMP連通性等設備屬性與監(jiān)測信息,亦可自定義SNMP監(jiān)測內容。網絡設備監(jiān)測項主要包括:

      ? 設備CPU利用率:監(jiān)測網絡設備的CPU使用率。

      ? 設備內存利用率:監(jiān)測網絡設備的內存使用量、內存使用率。? 端口速率監(jiān)測:監(jiān)測網絡設備中指定端口的入速率、出速率、入丟幀速、出丟幀速、單播入幀速、單播出幀速、非單播入幀速、非單播出幀速、入錯誤幀速、出錯誤幀速。

      ? 端口上下線監(jiān)測:監(jiān)測網絡設備指定的端口的上下線狀態(tài)。? 自定義SNMP監(jiān)測:可監(jiān)測多個SNMP表達式(支持四則運算、時間差值運算等)對應的采集結果。? ICMP連通性監(jiān)測:監(jiān)測與網絡設備的連通性。

      2.1.3 面向網絡的一體化管理

      管理界面友好,能夠提供實時的底層網絡、設備、系統(tǒng)、數據庫和應用服務運行狀態(tài)的有效監(jiān)控和統(tǒng)計、網絡邊界安全保障、告警事件列表及IP資源管理等功能,每個區(qū)域可以把各功能管理項獲取的底層數據按照IT基礎設施內在的關聯(lián)關系,根據運維人員的使用習慣進行了人性化的重新整合呈現(xiàn),改變過去傳統(tǒng)網管生硬的專業(yè)指標分割羅列的風格。

      在支持典型功能外,還可以從管理人員的角度出發(fā),把平時經常關注的設備監(jiān)測視圖進行重新組織顯示,從管理人員的角度進行查看。

      提供web客戶端,管理員在網絡的任何位置,甚至是外網,都可以通過瀏覽器訪問網絡監(jiān)控系統(tǒng)的后臺服務器,實現(xiàn)隨時、隨地統(tǒng)攬全局。2.1.4 網絡拓撲管理

      提供能夠提供準確直觀的 1.發(fā)現(xiàn)的設備種類全面

      系統(tǒng)支持多廠商的網絡設備,可以支持的廠商包括CISCO、Juniper、Huawei華為、ZXR中興、H3C、Enterasys凱創(chuàng)、Extreme、Foundry、Harbour港灣、CDRS神州數碼、AVAYA、Nortel北電、3COM、ARRAY、D-Link、Maipu邁

      普、Red-Giant銳捷、NetScreen、Topsec天融信、Riverstone等。

      2.拓撲發(fā)現(xiàn)技術手段先進

      支持通過SNMP、ICMP、NetBIOS、ARP、Traceroute、Telnet等多種手段自動發(fā)現(xiàn)、識別設備。在支持眾多國內外設備的基礎上,系統(tǒng)還對網絡類型有很好的兼容性,可以很好的發(fā)現(xiàn)VPN、VLAN網絡拓撲,提供拓撲的動態(tài)跟蹤和更新功能,能夠更加有效的反應網絡拓撲現(xiàn)狀。

      提供網絡拓撲動態(tài)發(fā)現(xiàn)和跟蹤技術,可以通過單設備拓撲、多設備拓撲、網段拓撲、種子節(jié)點拓撲等多種方式的拓撲發(fā)現(xiàn)網絡拓撲準確地展現(xiàn)出網絡的當前拓撲情況。3.拓撲顯示視圖多樣

      系統(tǒng)基于Java平臺,支持遠程管理協(xié)議采集,系統(tǒng)對B/S、C/S混合支持。支持大規(guī)模的網絡管理問題,系統(tǒng)支持將大型網絡通過按照地域、部門等劃分成多個相對較小的子網實現(xiàn)分級管理、提供遠程管理工具輔助用戶對大型網絡進行監(jiān)控和管理。用戶可以根據自己的使用習慣選擇合適的拓撲視圖加以監(jiān)控。能夠提供以下拓撲圖:

      ? 物理拓撲——反映被管網絡的實際連接的二層網絡拓撲圖,方便用戶直觀掌控網絡的實際連接情況;

      ? 網絡拓撲——反映被管網絡各個子網之間的連接關系拓撲圖,方便用戶從IP層邏輯組織網絡的管理; ? 子網拓撲——反映同一網段內終端與二、三層設備的連接關系拓撲,方便用戶進行終端設備連接狀態(tài)的監(jiān)控及故障診斷;

      ? Web拓撲——系統(tǒng)支持網絡拓撲圖基于瀏覽器的展現(xiàn),通過瀏覽器的方式監(jiān)測網絡的運行情況,WEB拓撲圖通過3-N級的方式展現(xiàn)網絡拓撲、設備狀態(tài)、端口狀態(tài)。用戶可以通過瀏覽器訪問,通過瀏覽器來查看網絡運行的情況。這種顯示方式的好處是方便用戶穿過防火墻,隨時隨地進行拓撲瀏覽監(jiān)控。

      ? 全屏拓撲——可以提供全屏拓撲,以便可以更為方便的全局瀏覽拓撲,同時也方便進行大屏展現(xiàn)

      4.拓撲顯示信息豐富

      在拓撲圖上可以瀏覽網絡資源的詳細信息,包括: ? 在拓撲圖上集成設備狀態(tài)、鏈路帶寬流量、告警故障的展現(xiàn),使用不同顏色、粗細、圖標表示被管理對象的狀態(tài)信息;

      ? 提供快速查找和定位設備功能,可以通過設備名稱、IP地址、MAC地址等信息,在拓撲圖上準確定位設備,并顯示出此設備的網絡連接信息;

      ? 自動記錄設備的所有活動情況,如接入網絡、設備遷移及上下線信息。

      ? 便捷的浮動信息顯示,浮動顯示各類設備和鏈路的關鍵信息;

      ? 集成豐富的右鍵管理菜單;

      ? 集成一些常用管理工具,如多實例ping、remote ping、traceroute、telnet、MIB瀏覽器

      ? 拓撲圖無級縮放、全屏顯示以及背景圖設置。? 手工修改網絡設備的配置信息 2.1.5 設備管理

      系統(tǒng)設備管理全面及時,能夠提供設備管理的快照,提供管理的設備列表,并能夠提供手、自動可選的設備配置備份功能。

      1.設備管理的快照

      在拓撲中可以輕松點擊被監(jiān)控設備進入設備運行監(jiān)控界面,以Dashboard的方式瀏覽網絡設備狀態(tài)的CPU、內存、鏈路流量等當前運行參數,若設備出現(xiàn)告警事件或閾值告警,則在網絡拓撲圖上相關網絡設備節(jié)點圖標以不同的顏色顯示,提示管理員進行處理。

      2.直觀清晰的設備列表

      設備管理將系統(tǒng)所發(fā)現(xiàn)的所有設備以列表形式展現(xiàn)出來,用戶可以方便的查看到設備的名稱、類型、IP地址、MAC地址。用戶即可以查看所有設備,也可以按類型查看或按子網查看。

      用戶可以查詢所管理的各子網網段內IP地址的分配、使用情況,以及占用該IP地址設備的上聯(lián)設備及端口的詳情等。3.手、自可選的設備配置備份

      系統(tǒng)集成主流廠商思科、華為、華三和神碼等網絡設備的配置備份功能,管理員可以設置備份策略,根據管理員配置的策略,系統(tǒng)自動將網絡設備的配置信息備份到備份服務器上。減少設備出現(xiàn)故障時進行設備配置恢復的時間。

      對于非主流廠商設備,可以通過TCL腳本編寫交互工具的方式獲取相應設備配置備份來實現(xiàn)兼容性的擴展。

      系統(tǒng)提供了手動備份與自動備份兩種備份功能。4.詳細的設備信息分析統(tǒng)計

      系統(tǒng)可以幫助用戶統(tǒng)計網絡設備及終端設備的詳細信息,不僅包括設備名稱、別名、廠商、型號等基本信息,也包括設備端口的類型、端口號、IP地址、MAC地址、端口速率、MTU、端口狀態(tài)以及對端端口的詳細信息,此外還支持SNMP

      設備的端口各類出入棧二層楨傳輸統(tǒng)計情況,如丟包率、錯包率等。

      系統(tǒng)還提供動態(tài)的網管信息展現(xiàn),如端口列表、ARP表、TCP/UDP表、轉發(fā)表、CDP表、STP表、設備部件表等。2.1.6 性能管理

      本系統(tǒng)管理平臺提供了完善的被管理網絡數據采集,分析,統(tǒng)計和報表功能,能夠通過SNMP、ICMP采集方式,對網絡設備的CPU、內存、流量等運行性能指標進行輪詢采集。系統(tǒng)進行實時采集數據分析,并保持對網絡性能和設備性能的跟蹤和趨勢分析。1.監(jiān)測指標豐富

      系統(tǒng)支持網絡性能實時監(jiān)測,能監(jiān)測所有網絡設備的當前運行負荷狀況,包括:當前CPU利用率、當前內存利用率、入流速、出流速、入包速率、出包速率,到網絡設備的端口流量、丟包率、錯包率、Ping延時和丟包等運行參數超過預設閾值時,并能在拓撲圖上根據用戶定義閾值以醒目顏色顯示。同時,系統(tǒng)提供對主機操作系統(tǒng)CPU、內存和硬盤使用情況的實時監(jiān)控。此外,系統(tǒng)還提供對典型Web服務的可用性監(jiān)控,如HTTP/HTTPS、FTP、DNS、DHCP、LDAP等常見應用服務,并且系統(tǒng)同樣支持對主機和Web服務監(jiān)控的閾值告警功能。在實時監(jiān)測的基礎上,系統(tǒng)還提供對歷史性能數

      據進行統(tǒng)計分析功能。

      網管系統(tǒng)提供的實時性能監(jiān)視可以實時監(jiān)控網絡設備的端口流量和丟包率等性能指標,并可以方便的給出這些指標的趨勢、平均值和最大值,為故障的預測提供有力的分析工具。

      通過系統(tǒng)能夠設置性能的采樣周期,能夠以圖形方式顯示性能指標,并可根據用戶的需要定義監(jiān)測的指標。2.多層面性能監(jiān)測

      系統(tǒng)為網絡管理員提供多角度的監(jiān)測。除了提供網絡、物理拓撲顯示的圖形性能提示外、還為網管員提供主動的面向設備的負荷監(jiān)測、面向鏈路的流量監(jiān)測、面向終端的活躍度監(jiān)測等多層面的性能監(jiān)測。? 面向網絡設備的負荷監(jiān)測

      能夠監(jiān)控到網絡設備的CPU和內存使用情況,通過監(jiān)控網絡設備的負荷情況,將被動管理化為主動預警,隨時可發(fā)現(xiàn)網絡的隱患。

      ? 面向鏈路的流量監(jiān)測

      鏈路性能直接體現(xiàn)網絡上數據傳輸質量。網絡上的延遲過長、瓶頸或丟包錯包率增高都將會影響網絡提供服務的質量。在拓撲圖上通過節(jié)點的顏色變化、鏈路的顏色變化、總覽列表的帶寬占比統(tǒng)計,可以讓用戶從集成化界面中全面評估網絡的整體性能狀態(tài),快速定位出網絡的瓶頸和隱患。? 面向終端的活躍度監(jiān)測

      終端活動快照列表記錄了所有終端設備的當前運行狀況,內容包括:設備名稱、設備IP地址、上聯(lián)交換機端口、當前在線狀態(tài)、上次Poll時間、當前流速、當前包速、平均包大小,方便用戶進行故障診斷和病毒分析。此外,還提供終端活躍度歷史統(tǒng)計。3.監(jiān)測配置簡單

      系統(tǒng)配置界面友好、過程簡單,且配置完即可生效。同時,系統(tǒng)具有自動評估監(jiān)測的能力,能夠自動生成配置。另外,性能的閾值可在配置時設定,性能達到或超過閾值可觸發(fā)各種形式的告警,如:郵件、短信、聲音等。2.1.7 故障管理

      通過系統(tǒng)故障管理,系統(tǒng)能夠對故障信息進行搜集、分類、歸并、壓縮及告警通知,幫助網絡管理人員即使定位故障源、故障類型及故障波及范圍等,幫助管理員來解決日常出現(xiàn)的各種故障,從而確保在規(guī)定的時間期限內使網絡重新投入運行。

      系統(tǒng)能夠自動獲得整個IT環(huán)境的各種事件,包括網絡設備的故障,性能的過載,流量的異常,服務器的異常性能,各類應用的故障,各類終端的變更等等。通過系統(tǒng)故障監(jiān)控臺,用戶能

      夠對整個IT環(huán)境的運行情況一目了然。1.統(tǒng)一的故障分析引擎

      系統(tǒng)通過內置的事件分析引擎,對獲取的事件進行實時的壓縮、歸并,建立集中化的以故障為導向的集中告警展現(xiàn)。方便運維人員實時查看網內所產生的故障。

      ? 通過對事件進行過濾、歸并、相關性分析、傳遞等分析處理。將處理過的事件保存在數據庫中。支持對故障持續(xù)時間較長的告警級別自動升級處理,支持用戶自定義故障類型。

      ? 對事件的嚴重級別加以分類,并分別通知相關人員(如:普通故障就只通知網絡管理員,重大故障同時通知主管領導和網絡管理員);不同的用戶可以為自己定義自己的過濾和通知策略。

      ? 故障管理能夠實時監(jiān)視并截獲網絡運行過程中所出現(xiàn)的故障,確定故障位置,以聲音、電子郵件、短消息等多媒體方式通知網絡管理員,并給出故障原因。2.多種告警類型

      系統(tǒng)根據故障來源及故障信息所屬專業(yè)將告警信息分為以下幾類:

      ? 網絡故障告警

      監(jiān)測到鏈路或設備故障時,尤其是骨干鏈路Up-Down、核心設備離線等,發(fā)出故障告警信息。? 網絡性能告警

      監(jiān)測到網絡設備、服務器的端口流量、丟包率、錯包率、Ping延時和丟包、CPU利用率、內存利用率、磁盤利用率等運行參數超過預設閾值時,發(fā)出故障預警信息。? 網絡安全告警

      ? 非法設備接入告警:未經過合法登記的設備接入網絡后,系統(tǒng)自動進行告警,并根據配置采取主動攔截等聯(lián)動處理。

      ? IP地址變更告警:IP/MAC/PORT地址綁定之后,如果出現(xiàn)用戶私自更改IP地址的情況,系統(tǒng)發(fā)現(xiàn)將主動發(fā)送告警。

      ? 主動接收設備Trap信息

      系統(tǒng)能夠主動接收網絡設備、防火墻等設備發(fā)出的Trap故障信息,并在告警臺統(tǒng)一展現(xiàn)給用戶。3.直觀的告警列表

      系統(tǒng)把告警事件按節(jié)點和嚴重級別進行排序,并提供包括來源、描述、發(fā)生時間、告警名稱、告警等級在內的詳細列表。4.靈活的告警通知

      系統(tǒng)提供了豐富的故障通知方法,包括:聲、光、Windows消息、EMAIL、短信等方法,用戶也可自己編寫處理程序進行處理。

      5.集成多種故障診斷工具

      系統(tǒng)提供了各種工具幫助用戶進一步監(jiān)測故障的原因,包括:SNMP工具、Telnet、Ping、Tracert、NetBIOS、RemotePing等等,輔助用戶排除故障。2.1.8 流量管理

      系統(tǒng)為用戶提供了細顆粒度的流量分析管理工具Flowmon,實現(xiàn)從端口到應用的廣泛流量分析和統(tǒng)計。

      通過Flowmon,系統(tǒng)能夠實時監(jiān)控系統(tǒng)流量,而不是歷史數據回放;系統(tǒng)無須配置成本高昂的硬件探針即可實現(xiàn)設備實時流量的采集分析,從而避免在網絡中引入新的故障點。1.支持多種流量采集手段

      系統(tǒng)提供多種流量采集的方式,支持端口鏡像流量、sFlow流量、Netflow流量等,F(xiàn)lowmon可以同時支持多個網卡和多種采集并行的流量分析,并為數據分析提供一致的訪問界面。

      考慮到網絡數據流量分析的數據量十分龐大,系統(tǒng)不會保存所有的原始流量數據信息,而是僅僅保存分析加工后的歸并

      信息,從而降低服務器的存儲要求。2.多維度實時流量分析

      系統(tǒng)支持對流量實時分析,當流量數據采集到Flowmon之后,系統(tǒng)會對流量數據開始進一步的分析,提取有效的數據信息,主要通過以下處理過程:

      ? 數據過濾:可以通過地址、端口、協(xié)議等條件設置數據過濾器,濾去不需要的干擾數據。

      ? 流向分析:對數據包包頭或者xFlow的包信息進行解碼,獲取數據包的流向信息,用于分析數據的來源和目的地,通過分析矩陣獲取每個網絡節(jié)點的流向情況。

      ? 層次分析:系統(tǒng)對數據包進行1-7層的劃分,用于分析全局的數據流量。

      ? 協(xié)議分析:系統(tǒng)會進行協(xié)議級別的數據分析,系統(tǒng)采用了CSPAE分析引擎進行TCP/UDP數據流分析,可以分析大多數的常見TCP/UDP協(xié)議,包括:HTTP、POP3、SMTP、FTP、SNMP、DNS等常見協(xié)議。

      ? 應用分析:系統(tǒng)會對一些動態(tài)協(xié)議進行應用級別的7層包頭分析,從而可以掌握BitTorrent、eDonkey、MSN等P2P和即時通訊協(xié)議的流量情況。3.通過流量分析輔助網絡的異常判斷

      ? 全局統(tǒng)計

      通過對流量的分析,F(xiàn)lowmon可以對采集到的數據進行整體的評估分析,讓用戶了解網絡的整體情況,主要包括:

      ? 全局流量統(tǒng)計:從整體角度對網絡流量的數據包情況進行統(tǒng)計,包括數據包的長度、TTL、總體流量、總體協(xié)議分布、總體TCP/IP協(xié)議分布、TCP/UDP端口分布等。? 終端流量統(tǒng)計:從整體對終端流量的進行統(tǒng)計和排序。? 協(xié)議統(tǒng)計

      系統(tǒng)從協(xié)議角度對網絡數據行為進行分析,并按照終端形成排名,便于管理員掌握網絡中協(xié)議的分布和重點終端的數據行為。通過協(xié)議流量排名分析,可以有效地發(fā)現(xiàn)ARP病毒、蠕蟲異常流量、BT流量、網絡異常流量等行為。

      ? 協(xié)議整體分布:從全局協(xié)議、TCP/IP協(xié)議兩個級別提供協(xié)議的分布。

      ? 全局協(xié)議的排名分析:從終端角度對全局的協(xié)議進行排名分析(按照TCP/UDP/ARP/ICMP/IPX/IGMP/OSPF等分類)

      ? TCP/IP協(xié)議排名分析:從終端角度對TCP/IP協(xié)議的組成進

      (按

      照HTTP/FTP/Mail/Telnet/…/SNMP/BitTorrent/eDonkey/Messenger等進行分類)

      ? 會話統(tǒng)計

      系統(tǒng)通過對流量的流向進行分析,并對TCP會話進行監(jiān)測,從而獲取各個網絡節(jié)點的流量和會話統(tǒng)計信息。主要包括:

      ? 終端流量通訊矩陣:以矩陣的方式展現(xiàn)終端之間的通訊關系和通訊流量。

      ? 終端流向統(tǒng)計:本地網絡和外部網絡,多個VLAN之間各個終端的流量統(tǒng)計排名和總流量。

      ? 終端會話統(tǒng)計:終端TCP建立會話的統(tǒng)計,按照TCP的端口進行展現(xiàn)。? 終端統(tǒng)計

      系統(tǒng)從單個終端節(jié)點的角度,分析單個終端的網絡數據行為,主要包括以下幾個方面:

      ? 終端總體分析:包括活動時間、總的數據流量和包數、基本協(xié)議對比等

      ? 最近24小時的流量統(tǒng)計:每小時的發(fā)送、接收流量的統(tǒng)計

      ? 數據包的統(tǒng)計:從TCP會話、TCP 標志包、異常數據包三個方面對數據包進行統(tǒng)計

      ? 終端協(xié)議分布:終端使用的各種協(xié)議的分布圖

      ? 其他統(tǒng)計:包括ICMP協(xié)議統(tǒng)計、最后一次的數據通訊統(tǒng)計等。

      2.1.9 報表管理

      系統(tǒng)能夠為用戶提供性能、告警、狀態(tài)、資源多個角度的統(tǒng)計和分析報表。

      系統(tǒng)具備報表自定義擴展能力,通過報表設計器,可以定制更符合需求的報表。用戶對相應的系統(tǒng)監(jiān)測數據進行統(tǒng)計后,能夠以報表形式展現(xiàn)分析統(tǒng)計結果。報表包括:網絡運行統(tǒng)計、節(jié)點延時統(tǒng)計、節(jié)點端口流量統(tǒng)計、設備CPU負載統(tǒng)計、設備內存占用統(tǒng)計、主機CPU負載統(tǒng)計、主機內存占用統(tǒng)計、Oracle數據庫運行統(tǒng)計、服務運行統(tǒng)計等 1.端口I/O流量報表

      通過網絡設備的端口對流量進行統(tǒng)計,并以報表的形式進行展現(xiàn)統(tǒng)計結果。2.設備故障日/月報表

      系統(tǒng)平臺提供統(tǒng)一事件管理來解決分割管理的數據融合問題,通過以告警事件為導向,提供了清晰的、集中的事件管理??梢宰尮芾砣藛T對整個IT環(huán)境的各種硬件和軟件系統(tǒng)的實時事件信息收集,對各類事件信息進行過濾、、壓縮、歸并等相關性分析與處理,智能化壓縮處理海量告警事件,分析出真正的問題所在,實時呈現(xiàn)出完整的事件信息,并將

      這些信息分發(fā)給負責服務水平監(jiān)視的操作管理員。

      系統(tǒng)支持以日/月為單位實時呈現(xiàn)所有的網絡、系統(tǒng)、應用、安全、桌面等被關注的資源。3.設備清單報表

      以直觀的方式顯示設備當前的運行狀態(tài)。

      系統(tǒng)能夠根據設定,統(tǒng)計指定的子網內各設備上端口的運行情況。讓管理員能夠直觀的掌握設備上的端口數量以及端口的使用情況,科學有效地分配設備的端口使用,提高網絡環(huán)境的運行效率。4.性能報表

      系統(tǒng)能夠根據不同層次管理員設定的不同監(jiān)測參數組合,自動生成所需的性能分析報告,提供的性能報告能夠針對網絡所有的被管理資源(服務器、數據庫、中間件)的關鍵性能指標(CPU、內存、磁盤、進程使用情況)進行詳細的展現(xiàn),系統(tǒng)還能根據設定自動將歷史報告發(fā)送給相關人員,提高決策效率。5.自定義報表

      系統(tǒng)提供的內置報表,若無法滿足現(xiàn)有需要,可以通過客戶化工作。

      2.1.10 安全邊界管理

      系統(tǒng)提供IP地址資源管理,對網絡邊界的安全和IP地

      址的戶籍進行管理。系統(tǒng)通過內置的設備合法性監(jiān)測引擎,在不額外消耗網絡帶寬的情況下,自動發(fā)現(xiàn)和監(jiān)測網內終端設備的基本屬性(IP地址、MAC地址、主機名、連接的交換機端口等),系統(tǒng)能夠通過IP/MAC/主機/組織/人等信息綁定,建立IP資源信息庫。IP地址使用情況詳細列舉出系統(tǒng)發(fā)現(xiàn)的各子網內IP地址的使用情況,包括IP地址、設備名、端口號、端口名稱、IP狀態(tài)、上聯(lián)設備、上聯(lián)設備IP、上聯(lián)設備端口等。

      邊界按照IP地址的“戶籍表”,監(jiān)控網絡中IP的使用情況,對非法使用的IP地址進行攔截,將非法的IP終端隔離出網絡,確保用戶不能隨意修改IP地址和防止IP地址盜用。

      網絡邊界管理提供了IP地址使用的高級審計功能,方便對IP地址的使用進行歷史審計和追查。

      系統(tǒng)能自動跟蹤終端的變化情況。發(fā)現(xiàn)有未經登記的設備、或違反IP/MAC/交換機端口綁定規(guī)則的終端設備進行告警。

      系統(tǒng)能夠通過IP/MAC/PORT綁定實時發(fā)現(xiàn)是否有非法設備接入局域網絡及是否有用戶私自更改IP地址的行為;根據安全策略配置通過手動或者自動的方法將非法接入設備隔離出網絡,或者將已被攔截的設備重新開通網絡連接。有效保障了網絡的安全。

      ? 攔截與放行設備:手動或者自動(根據安全策略配置)將非法設備隔離出網絡,或者將已被攔截的設備重新開通網絡連接。

      ? IP/MAC/PORT綁定:IP/MAC/PORT地址綁定之后,能夠實時發(fā)現(xiàn)是否有非法設備接入網絡及是否有用戶私自更改IP地址的行為,如果用戶私自更改IP地址,系統(tǒng)主動發(fā)送告警信息。

      ? 終端合法性監(jiān)控:系統(tǒng)通過業(yè)務監(jiān)控系統(tǒng)的合法性監(jiān)測引擎,能在不額外消耗網絡帶寬的情況下,自動監(jiān)測網內終端設備的基本屬性(IP地址、MAC地址、主機名、連接的交換機端口等),對私自變更設備信息進行告警。2.2 資源監(jiān)測管理

      系統(tǒng)集網絡安全設備、應用服務和基礎支撐系統(tǒng)等監(jiān)測管理于一體,支持SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX等遠程監(jiān)控手段和Broadview UniAgent代理監(jiān)測,各類標準應用協(xié)議仿真,擁有了500多種監(jiān)測器,提供對整個業(yè)務網絡的7X24不間斷監(jiān)控。? 強大監(jiān)測插件體系

      無需二次開發(fā),通過監(jiān)測插件,不斷增加監(jiān)測器數量,擴展監(jiān)測范圍與內容。眾多監(jiān)測器工作獨立,互不影響,保證整個監(jiān)

      測體系的穩(wěn)定運行。

      ? 靈活的監(jiān)測時間調度機制和智能化的監(jiān)測閾值模型

      自定義監(jiān)測時間與監(jiān)測閾值,形成多樣化、組合型監(jiān)測策略,滿足復雜環(huán)境下不同的監(jiān)測任務要求。

      ? 主機代理Agent監(jiān)測和遠程無代理監(jiān)測兩種監(jiān)測模式

      多方式、多手段的自由組合,兼顧業(yè)務網絡各部分性能影響,適應不同監(jiān)測條件。2.2.1 服務器系統(tǒng)管理

      系統(tǒng)能夠管理和監(jiān)測Windows、Linux、IBM AIX、AS/400、HP-UX、SUN Solaris、SCO Unix等不同操作系統(tǒng)的服務器或集群的運行狀態(tài)和性能數據,包括服務器的基本信息、CPU負載、內存利用率、應用進程、文件系統(tǒng)、磁盤空間和吞吐、事件與錯誤日志等信息的分析與監(jiān)視。幫助用戶及早發(fā)現(xiàn)服務器系統(tǒng)的性能瓶頸與故障隱患。服務器監(jiān)測項主要包括:

      ? 主機基本信息采集:主機的基本信息,包括:CPU數目、機器型號、系統(tǒng)名稱、系統(tǒng)版本、IP地址、內存大小、總線程數目、磁盤名稱等。

      ? 主機CPU使用率:監(jiān)測主機系統(tǒng)的CPU使用率。

      ? 主機內存使用率:監(jiān)測主機系統(tǒng)的內存使用量、內存使用率。? 主機磁盤使用率:監(jiān)測主機系統(tǒng)的指定磁盤使用率。? 主機磁盤IO監(jiān)測:監(jiān)測主機系統(tǒng)的磁盤TPS數、磁盤寫操作速率等、每秒完成IO讀寫次數、每秒讀寫扇區(qū)數、每秒讀K字節(jié)數、平均I/O隊列長度等。

      ? 應用進程監(jiān)測:監(jiān)測主機系統(tǒng)中指定應用進程的內存使用量、內存使用率、CPU使用率。

      ? 系統(tǒng)服務監(jiān)測:監(jiān)測主機系統(tǒng)中指定服務的運行狀態(tài) ? 主機當前登陸用戶信息:當前登錄用戶登陸的時間、終端IP、終端名稱

      ? 主機端口速率監(jiān)測:監(jiān)測主機系統(tǒng)中指定端口的入速率、出速率、入丟幀速、出丟幀速、單播入幀速、單播出幀速、非單播入幀速、非單播出幀速、入錯誤幀速、出錯誤幀速等。? 主機重要文件監(jiān)測:監(jiān)測主機系統(tǒng)中指定的文件大小。? Job基本信息采集(AS/400):監(jiān)測Job的名稱、CPU使用率、類型、狀態(tài)、所屬用戶等。

      ? ICMP連通性監(jiān)測:監(jiān)測與主機的連通性。

      ? HACMP集群狀態(tài)監(jiān)測:監(jiān)測集群的可用狀態(tài)及子節(jié)點的狀態(tài)。

      ? 自定義指標監(jiān)測:系統(tǒng)提供了通用監(jiān)測器,用戶可以通過編寫shell或者groovy腳本自定義監(jiān)測指標 2.2.2 數據庫管理

      根據預定義的監(jiān)測項目對Oracle、SQL Server、Sybase、DB2、Informix、MySQL等多種數據庫,按照屬性相關性分為數據庫工作狀態(tài)、數據庫表空間的利用情況、數據文件和數據設備的讀寫命中率、數據碎片的情況、數據庫的進程狀態(tài)、數據庫內存利用狀態(tài)等屬性監(jiān)測組,分組監(jiān)測數據庫系統(tǒng)的性能、事務、連接等性能數據。? DB2數據庫監(jiān)測

      ? 基礎監(jiān)測:最后一次備份時間、數據庫狀態(tài)、數據庫激活時間、當前連接數、連接總次數

      ? 緩沖池信息監(jiān)測:各緩沖讀寫次數、命中率 ? 鎖監(jiān)測:死鎖數、鎖等待率、鎖升級率 ? 鎖表信息:鎖狀態(tài)、鎖模式、表空間、Schema ? 排序信息監(jiān)測:應用排序數、排序溢出百分比

      ? 表空間監(jiān)測:已使用頁、表空間類型、頁長、總頁數、表空間狀態(tài)、空閑率、空閑頁、使用率、預取大小、擴展數據塊大小

      ? 表空間容器監(jiān)測:使用率、總頁數、已使用頁、容器類型、表空間名稱 ? Oracle數據庫監(jiān)測

      ? 基礎監(jiān)測:表空間使用率、連接會話數

      ? 高級隊列監(jiān)測:ready消息數、錯誤的消息數、消息平均訪問時間、消息總數

      ? 歸檔目的地監(jiān)測:歸檔目的地類型、歸檔目的地狀態(tài)、歸檔目的地可用空間、歸檔目的地可用空間百分比、歸檔目的地位置

      ? 基本信息采集:使用spfile啟動、只讀模式、歸檔路徑、例程開始時間、限制模式、歸檔模式、例程名、并行狀態(tài)、位長、DB版本、DB名稱、主機名、實例狀態(tài) ? 檢查點監(jiān)測:發(fā)生檢查點數、完成檢查點數

      ? 數據文件監(jiān)測:文件大小、讀次數、寫次數、讀時間、寫文件塊數、讀文件塊數、讀寫文件塊數、寫時間 ? 全表掃描配置: RSRATIO值、LTSCANRATIO值 ? 資源鎖定監(jiān)測:鎖定時長 ? 碎片監(jiān)測: FSFI值

      ? PGA配置:PGA內存及各區(qū)域大小、實例處理性能等

      ? 進程資源消耗監(jiān)測:

      可用PGA百分比、可用PGA、已分配PGA、已使用PGA ? 命中率監(jiān)測:共享區(qū)字典緩存區(qū)命中率、多次解析(重裝)的條目比率、高速緩存區(qū)命中率、共享區(qū)庫緩存區(qū)命中率、磁盤排序與內存排序比率、回退段等待次數與獲取次數比率

      ? 遞歸調用信息監(jiān)測: 遞歸調用百分比、時間間隔的遞歸調用百分比、用戶調用數、遞歸調用數、遞歸-用戶調用比率、遞歸調用速率

      ? Redo日志配置:重做條目的平臺大小、多種請求成功/失敗比率、錯誤次數等

      ? Rman備份監(jiān)測: 增量備份大小、全備份大小

      ? 回滾段:大小命中率、等待率、等待次數、活動事務數、翻轉次數、擴展次數、一致更改率、收縮次數、用戶回滾率

      ? 會話監(jiān)測:會話ID、用戶名、CPU時間、排序次數、緩沖區(qū)命中率、讀次數、寫次數、提交次數、占用游標數、掃描次數

      ? SGA配置:共享庫緩存大小、SQL緩存大小、數據字典緩存大小、共享池大小、重做日志緩沖區(qū)大小、高速緩沖

      區(qū)大小

      ? SQL監(jiān)測:使用內存、執(zhí)行時間、SQL語句、用戶 ? 轉存空間監(jiān)測:轉儲空間使用率

      ? 表空間監(jiān)測:未使用Extent數量讀時間、最大Extent數量、已使用率、已使用量、未使用量、未使用百分率、允許最大空間、是否自動擴展、寫時間、Segment管理方式、表空間類型、當前Extent數量、下一個Extent大小 ? 表狀態(tài)監(jiān)測:增長速度、索引大小、數據大小、表空間、用戶

      ? 撤銷空間監(jiān)測狀態(tài)監(jiān)測:快照太舊錯誤計數、無空間計數 ? 作業(yè)隊列監(jiān)測:破損作業(yè)數量、過期作業(yè)數量、失敗作業(yè)數量

      ? MySQL數據庫監(jiān)測

      ? 基礎監(jiān)測:緩存查詢數、連接數 ? 數據庫大小監(jiān)測:數據庫大小 ? SQL Serve ? 基礎監(jiān)測:連接會話數、CPU使用率、數據文件大小、日志文件大小

      ? 基本信息:阻塞進程數、處理器名稱、Windows版本、處

      理器數目、主機名、內存(MB)、數據庫數目、會話數目、啟動時間

      ? 數據庫大?。簲祿笮?、數據庫大小、未分配大小、未使用大小、索引大小、保留大小

      ? 文件監(jiān)測:路徑、增長方式、容量、文件組、數據庫、大小

      ? 會話監(jiān)測:最后處理時間、命令、數據庫、CPU時間(ms)、內存(KB)、程序、建立時間、用戶、狀態(tài)、主機 ? Informix數據庫監(jiān)測

      ? 基礎監(jiān)測:回滾數、死鎖數、寫緩存命中率、讀緩存命中率、數據庫連接數

      ? 檢查點監(jiān)測:檢查點速率、檢查點等待速率 ? DbSpace監(jiān)測:數據空間使用率

      ? 磁盤讀寫監(jiān)測:頁寫速率、頁讀速率、物理磁盤寫速率、物理磁盤讀速率

      ? 鎖監(jiān)測:鎖請求速率、鎖超時率、鎖等待率、死鎖率 ? 日志讀寫監(jiān)測:物理日志頁面寫速率、物理日志寫速率、邏輯日志頁面寫速率、邏輯日志寫速率、邏輯日志記錄寫速率

      ? 共享內存監(jiān)測:塊寫速率、緩沖區(qū)寫命中率、緩沖刷新到磁盤速率、Foreground寫速、緩沖區(qū)等待速率、LRU寫速率、順序掃描速率、Latch等待速率、緩沖區(qū)讀命中率 ? 排序監(jiān)測:內存排序速率、磁盤排序速率 ? 事務監(jiān)測:事務提交速率、事務回滾速率 ? Sybase數據庫監(jiān)測

      ? 基本信息采集:DBMS名稱、DBMS版本、系統(tǒng)信息、產品版本、主版本號、產品名稱、次版本號

      ? 數據庫監(jiān)測:使用百分比、已使用大小、數據大小、空間大小、索引大小、未使用段大小、數據段大小、段總大小、索引段大小

      ? 會話監(jiān)測:數據庫、命令、已用內存、CPU時間、IO讀寫次數、程序、主機、用戶、狀態(tài)

      ? 事務監(jiān)測:系統(tǒng)事務交易總數、每秒回滾事務數、每秒事務數

      ? 設備監(jiān)測:屬性值

      ? 數據庫:CPU使用率、數據庫空閑表空間、數據庫表空間、連接會話數

      2.2.3 中間件管理

      產品支持對Websphere、WebLogic、MQSeries、Tomcat、Tuxedo、Tibco、Resin、TongWeb、等各類不同中間件,提供包括配置信息、連接池、線程隊列、負載監(jiān)測、通道情況監(jiān)測等多類監(jiān)測組,分析與監(jiān)測中間件的各項運行狀態(tài)參數。中間件監(jiān)測項主要包括:

      ? 系統(tǒng)信息采集:監(jiān)測中間件基本信息,包括:操作系統(tǒng)、操作系統(tǒng)版本、當前可用堆棧及大小、當前目錄、重啟次數、開啟線程數。

      ? JVM使用監(jiān)測:監(jiān)測JVM的堆棧大小和使用率。? JDBC鏈接池監(jiān)測:監(jiān)測指定JDBC連接池資源連接情況。? JTA事務監(jiān)測:監(jiān)測中間件中數據處理事務的活動情況。? 線程池監(jiān)測:監(jiān)測指定線程類的線程平均數、空閑線程平均數以及線程吞吐量。

      ? Servlet監(jiān)測:監(jiān)測指定Servlet執(zhí)行和調用情況。

      ? EJB監(jiān)測:監(jiān)測指定EJB激活次數、鈍化次數、緩存?zhèn)€數、事務提交次數、事務回滾次數、事務超時次數、訪問次數。? WEB應用監(jiān)測:監(jiān)測指定Web應用中Session的當前個數、最大值以及累積個數。

      ? JMS隊列深度監(jiān)測:監(jiān)測中間件中JMS消息隊列活動情況。? MQ通道情況監(jiān)測:監(jiān)測MQ的通道情況,包括:每秒接收字節(jié)、每秒發(fā)送字節(jié)、通道狀態(tài)、發(fā)送間隔、事務數。? MQ隊列深度監(jiān)測:監(jiān)測MQ服務的消息隊列的隊列深度。? Tuxedo負荷監(jiān)測:監(jiān)測Tuxedo的機器狀態(tài)是否被激活、每秒處理的隊列服務數每秒入隊的隊列服務數、當前客戶端數、當前WorkStation客戶端數。

      ? TongWeb數據連接池監(jiān)控:監(jiān)測國產中間件Tongweb數據庫連接信息,如最大、最小連接數,可用、創(chuàng)建、關閉、等待連接數等

      ? TongWeb應用性能監(jiān)控:主要監(jiān)測系統(tǒng)線程情況、請求隊列情況、吞吐量、發(fā)送接收字節(jié)數等信息; 2.2.4 基礎應用平臺及通用服務管理

      狀態(tài)提供對IIS、Apache、-Domino等基礎應用平臺的基礎信息、連接測試、基本負載等重要信息的監(jiān)測。

      有效實時地分析HTTP/HTTPS、DNS、FTP、DHCP、LDAP等常見通用服務的運行狀態(tài)和參數,深入分析服務響應速度變化的技術原因和規(guī)律,從根本上解決服務響應性能的問題。? Domino服務器監(jiān)測

      ? 基礎監(jiān)測:監(jiān)測Domino服務器的內存占用值、指定數據庫的使用率、待發(fā)郵件數、僵死郵件。

      ? 基本信息采集:采集Domino服務器的基本信息,包括:Domino版本、數據庫存放路徑、CPU個數和CPU類型信息。

      ? 負載監(jiān)測:監(jiān)測Domino服務器當前負載情況,包括:每分鐘交易數、每分鐘最大交易數、交易總數、當前用戶數、最大用戶數、當前任務數。

      ? 復制(Replication)監(jiān)測:監(jiān)測Domino服務器復制情況,包括:成功復制次數、失敗復制次數、刪除文檔總數、增加文檔總數、修改文檔總數。

      ? 郵件服務監(jiān)測:監(jiān)測Domino郵件服務情況,包括:死郵件數、路由郵件數、待路由郵件數、已投遞郵件數、待投遞郵件數、平均郵件大小、最大郵件大小。

      ? 緩沖池監(jiān)測:監(jiān)測Domino緩沖池的使用情況,包括:緩沖池大小、緩沖池使用值、緩沖池最大值、擴展管理池使用值、擴展管理池最大值、NSF使用值、NSF最大值。? 擴展管理池監(jiān)測:監(jiān)測Domino擴展管理池的使用值、最大值。

      ? Apache負載監(jiān)測:監(jiān)測服務器是否連接,采集CPU負載、正

      常運行時間、響應時間、累計訪問數、累計訪問數據處理、每秒請求數、每秒處理字節(jié)數、每請求處理字節(jié)、忙作業(yè)數、空閑作業(yè)數等指標。? IIS監(jiān)測主要包括:

      ? 連接監(jiān)測:監(jiān)測IIS服務運行時間、服務運行時間、嘗試登陸/秒、嘗試連接/秒、當前連接數、最大連接數。? 傳輸字節(jié)監(jiān)測: 發(fā)送字節(jié)/秒、接收字節(jié)/秒、傳輸字節(jié)/秒、服務運行時間、接收文件/秒、發(fā)送文件/秒、找不到文件的錯誤數、服務運行時間、傳輸文件/秒。

      ? 用戶監(jiān)測:服務運行時間、最大非匿名用戶數、非匿名用戶/秒、匿名用戶/秒、當前非匿名用戶數、當前匿名用戶數、最大匿名用戶數。

      ? WEB請求監(jiān)測:post請求/秒、head請求/秒、其他請求/秒、服務運行時間、get請求/秒。

      ? WEB服務器可用性監(jiān)測:監(jiān)測http、https和Web Service服務器是否連接以及是否正常運行,可以監(jiān)測指定http的URL路徑是否包含或者不包含指定內容。

      ? 標準郵件服務器監(jiān)測:監(jiān)測pop3、smtp郵件服務器是否連接以及是否正常運行,可以監(jiān)測具體的郵箱的郵件數以及郵箱使用量。

      ? 基礎服務監(jiān)測主要包括:

      ? DNS服務監(jiān)測:監(jiān)測DNS服務器是否連接以及是否正常運行,可以監(jiān)測指定域名是否正確解析。

      ? FTP服務監(jiān)測:監(jiān)測FTP服務器是否連接以及是否正常運行,設定已FTP方式登錄該資源的閾值,監(jiān)測指定文件是否存在。

      ? 通用資源監(jiān)測主要包括:

      ? TCP端口監(jiān)測:可監(jiān)測多個TCP端口,并采集連接時間,可指定端口開啟或者關閉時告警。

      ? 通用SNMP監(jiān)測:可監(jiān)測多個SNMP表達式(支持四則運算、時間差值運算等)對應的采集結果,并可設定告警閾值。2.2.5 基礎運行環(huán)境管理

      對于IT環(huán)境系統(tǒng),系統(tǒng)支持各種智能設備的快速監(jiān)測,同時通過SNMP、數據庫接口等其他接口方式可以實現(xiàn)客戶化的擴展監(jiān)控,監(jiān)測內容包括基礎運行環(huán)境的溫度、濕度、漏水、煙感和電源、UPS、智能空調等。2.3 告警監(jiān)控管理 2.3.1 告警管理 ? 事件分析

      系統(tǒng)具有強大靈活的事件分析功能,能夠智能識別各類不同來源的原始事件。通過內建的智能事件分析引擎,對標準化后的原始事件進行可靠過濾、重復壓縮、對齊歸并與依賴關聯(lián),自動修正告警記錄,最終形成有效告警。? 自定義事件解析規(guī)則

      用戶可自定義編輯和導入解析規(guī)則庫文件,自主制定事件解析規(guī)則,同時支持第三方MIB庫的裝載與自動解析。? 基于iBDM的事件關聯(lián)分析

      事件的產生以及其影響都不是獨立的。基于業(yè)務影響依賴模型iBDM的事件關聯(lián)分析,自動發(fā)現(xiàn)關聯(lián),追溯事件影響、定位問題,發(fā)現(xiàn)問題根源。? 告警臺

      作為告警管理平臺,呈現(xiàn)最新告警信息,并以最近24小時、最近一周、最近一個月等不同區(qū)間統(tǒng)計最近的告警記錄,提供自定義刷新、告警確認與消除等告警管理操作。? 分等級告警

      產生的告警信息分為提醒、警告、次要、重要、緊急五個等級,用戶可以根據告警等級安排告警處理的優(yōu)先次序。? 分類查詢

      借助按資源與按節(jié)點的分類導航,快速搜索分類告警記錄;支持通過告警信息的事件等級、時間、類別、名稱、資源等組合條件進行自定義查詢。? 告警的關聯(lián)特性

      點擊具體告警,會列舉告警關聯(lián)的事件,同時展現(xiàn)事件的詳細信息、問題資源信息和依賴關系圖等,方便分析故障詳情。2.3.2 告警通知 ? 多樣的通知方式

      支持短信、郵件、語音等告警通知手段。

      支持外部命令、UniAgent執(zhí)行腳本、NetSend、Snmp設置、Trap轉發(fā)等告警處理動作。告警處理動作將按預定義,自動在告警發(fā)生后執(zhí)行,先一步嘗試恢復業(yè)務正常運行。? 靈活的通知策略

      根據不同的告警事件來源為它們指定不同的通知和處理方式,組成全面告警通知策略。? 強大的擴展功能 2.4 統(tǒng)一監(jiān)控展現(xiàn)

      通過統(tǒng)一監(jiān)控展現(xiàn)功能,能夠將不同類型的設備、系統(tǒng)、應用等資源的監(jiān)控平臺進行集成,避免使用多個系統(tǒng)進行監(jiān)控管理。通過綜合的展現(xiàn)平臺來同事展示各種監(jiān)控視圖,以便于運維人員在一套系統(tǒng)上統(tǒng)攬全局。

      運維監(jiān)控通過集成底層監(jiān)控產品,能夠提供從資源、節(jié)點、網絡、業(yè)務等多角度、層次化的監(jiān)控信息集中展現(xiàn),并可通過服務臺和個人桌面集成底層監(jiān)控平臺的監(jiān)控界面和數據,以支持上層的運維工作。2.4.1 靈活拓撲展現(xiàn)

      IT運維管理系統(tǒng)中的靈動拓撲展現(xiàn)與靈動可視化平臺實現(xiàn)同步,系統(tǒng)可以根據運維人員在靈動平臺中創(chuàng)建的各類視圖來顯示資源配置、運行狀態(tài)等信息。

      靈動拓撲展現(xiàn)不僅可以展現(xiàn)IT資源的邏輯物理關系,還可以查看視圖中資源的運行狀態(tài)。拓撲圖中的任一設備或者鏈路都會以浮動框的形式顯示其基本信息與運行狀態(tài)。同時,通過點擊節(jié)點,可跳轉至相關聯(lián)的視圖或相關聯(lián)資源的詳細監(jiān)控界面。

      IT運維管理系統(tǒng)作為運維與監(jiān)控平臺,其自身收集與處理了大量IT部門運維所需要的各方面信息,包括:資源配置庫、監(jiān)控性能與狀態(tài)等。這些信息需要通過多種方式進行展現(xiàn),而IT運維管理系統(tǒng)正是通過靈動可視化平臺來提供此能力。

      靈動可視化平臺集模型編輯和模型展現(xiàn)于一體,方便用戶繪制網絡拓撲、業(yè)務拓撲、機房視圖及其他結構圖。其使用最新的Flex富客戶端展現(xiàn)技術實現(xiàn),可以自由的組合數據源提供的信息,以圖形、表格、拓撲等形式,提供于用戶,并支持用戶的操作交互,以進一步挖掘數據。

      2.4.1.1 展現(xiàn)能力

      靈動可視化平臺提供了超過600個基礎模具庫,涵蓋了普通圖形、各種廠商設備圖標、設備面板等各類圖形組件。通過將這些圖形組件組合在一起,并為其關聯(lián)恰當的業(yè)務數據源,按需表現(xiàn)多種邏輯物理環(huán)境。如局域網絡拓撲圖、業(yè)務系統(tǒng)圖、機房布局圖、設備面板圖等。2.4.1.2 交互挖掘

      系統(tǒng)具有基于Flex展現(xiàn)技術,還具有基于WEB的交互能力,在平臺提供的圖中,用戶可以通過鼠標點擊,與圖中的元素(圖形、表格)等進行交互,可以獲取到進一步的資源詳情、挖掘數據與切換觀察視角。

      用戶也可自定義圖表事件,進一步擴展圖形交互,集成其它監(jiān)控系統(tǒng)的頁面功能。2.4.1.3 編輯擴展能力

      由于系統(tǒng)的業(yè)務架構經常會產生變化,因此系統(tǒng)實施時確定的各種拓撲圖也會隨之改變。為了提供現(xiàn)場的編輯能力,系統(tǒng)需提供所見即所得的編輯工具,無須使用各種復雜的配置腳本,而通過WEB上的畫圖工具,完成圖形的編輯與創(chuàng)造。

      2.4.1.4 數據可視化感知

      靈動可視化平臺可展現(xiàn)的信息,通過數據源的支持,可以讓靈動圖形中的各類對象有了靈活生動的展現(xiàn),平臺可以通過數據信息、狀態(tài)的綁定,實現(xiàn)拓撲可視化的動態(tài)展現(xiàn)和交互,靈動平臺支持多數據源提供,默認采用CMDB配置資源庫,根據CMDB配置庫提供的定義信息分類組織數據對象,用戶可直接拖動這些數據對象到圖中,以完成用戶理想的視圖。

      2.4.2 網絡監(jiān)控展現(xiàn)

      IT運維管理系統(tǒng)中的網絡運行監(jiān)測與網絡監(jiān)控平臺實現(xiàn)同步,集成網絡監(jiān)控平臺的相關功能,系統(tǒng)可以將各種網絡監(jiān)控指標進行統(tǒng)計后分類以視圖的方式顯示。? 網絡拓撲

      網絡拓撲不僅可以展現(xiàn)網絡主拓撲圖,還可以遞進式挖掘多級子拓撲,進行逐層嵌套組織顯示。拓撲圖中的任一設備或者鏈路都會以浮動框的形式顯示其基本信息與運行狀態(tài)。同時,通過點擊節(jié)點或資源鏈接,可跳轉至相關對象的詳細監(jiān)控界面。? 網絡監(jiān)控視圖

      網絡監(jiān)控視圖提供了關注網絡整體運行表現(xiàn)的全局視角,網絡的各類指標均在其中得到體現(xiàn),如反映管理對象的系統(tǒng)統(tǒng)計信息、反映端口速率排行前10位、CPU使用率前10位、內存使

      用率前10位、節(jié)點連通延時前10位的列表信息、最新網絡告警事件列表及統(tǒng)計排名等。內容的增減與組織方式可根據用戶的需要與習慣隨意調整。2.4.3 業(yè)務監(jiān)控展現(xiàn)

      IT運維管理系統(tǒng)的業(yè)務監(jiān)測視圖以業(yè)務系統(tǒng)為核心,集成業(yè)務監(jiān)控系統(tǒng)的相關功能,統(tǒng)一展現(xiàn)支持業(yè)務系統(tǒng)的網絡/安全設備、系統(tǒng)、中間件、數據庫、通用服務和基礎應用等各類資源,緊貼用戶思維,由粗線條到細顆粒度地逐層展現(xiàn)業(yè)務系統(tǒng)的運行狀況,滿足企業(yè)或單位以業(yè)務為最終服務目標的IT管理思想。2.4.3.1 業(yè)務應用拓撲

      業(yè)務應用拓撲支持有向關聯(lián),業(yè)務系統(tǒng)各關聯(lián)資源根據業(yè)務影響方向組成業(yè)務支撐網絡。針對業(yè)務網絡的告警事件,依靠基于iBDM的事件關聯(lián)分析,自動分析判斷節(jié)點間依賴關系,快速定位業(yè)務故障根源。2.4.3.2 業(yè)務監(jiān)測視圖

      業(yè)務監(jiān)測視圖提供業(yè)務系統(tǒng)的基本信息、資源組成和運行狀態(tài),并通過平均修復時間(MTTR)和平均無故障時間(MTBF)等SLA綜合指標評估業(yè)務服務水平。通過業(yè)務監(jiān)測視圖,用戶可深入淺出地分析業(yè)務系統(tǒng)當前的運行狀況,大大降低IT系統(tǒng)管理難度。

      2.4.4 資源監(jiān)測展現(xiàn)

      為了便于查找故障,分析故障根本原因,往往需要查看故障產生的具體對象。IT運維管理系統(tǒng)的資源監(jiān)控視圖集成業(yè)務監(jiān)控系統(tǒng)的相關功能,從資源總覽、資源匯總和資源詳情視圖分層分類地細致展現(xiàn)各類資源的性能詳細指標。? 資源總覽

      匯總所有監(jiān)測資源信息,以全局和分類統(tǒng)計其可用狀態(tài)和健康狀態(tài),并列舉當前問題資源。? 資源匯總

      針對具體資源類型,統(tǒng)計展現(xiàn)所有該類資源的運行狀態(tài),包括:該類資源的可用性和健康性、可用資源比率與健康資源比率、當前出現(xiàn)問題的具體資源等常規(guī)指標和該類自有的其他指標。? 資源詳情

      針對業(yè)務應用的具體資源,根據不同的資源分類(如網絡設備、服務器、數據庫、中間件等),詳細展現(xiàn)資源的基本信息、負荷狀況、穩(wěn)定性、響應延時各項關鍵性能指標和健康度與可用度的狀態(tài)分析,輕松掌握資源當前的運行狀況。2.4.5 節(jié)點監(jiān)測展現(xiàn)

      網絡中擁有獨立IP的網絡實體,我們稱之為節(jié)點。單個節(jié)

      點可能部署了多項被監(jiān)測資源,如操作系統(tǒng)、數據庫、中間件等。IT運維管理系統(tǒng)通過集成業(yè)務監(jiān)控系統(tǒng)的相關功能,提供了基于節(jié)點的整體監(jiān)測,匯聚節(jié)點內各資源的監(jiān)測數據,從總覽視圖、詳情視圖(一級、二級視圖),遞進式地展現(xiàn)被監(jiān)測資源的詳細參數。

      ? 節(jié)點總覽視圖

      節(jié)點總覽視圖從總體上統(tǒng)計各個分類節(jié)點的不可用節(jié)點數、節(jié)點總數、及總資源數等,同時以柱圖方式直觀顯示節(jié)點的不可用節(jié)點數占節(jié)點總數的比例。? 一級節(jié)點視圖

      一級節(jié)點視圖集合了同分類的所有節(jié)點,各節(jié)點單獨展現(xiàn)內部資源健康狀態(tài)。? 二級節(jié)點視圖

      二級節(jié)點視圖詳細給出節(jié)點所包括單個資源的詳細運行情況,如圖所示,此

      服務器節(jié)點不僅監(jiān)測了服務器的Windows 操作系統(tǒng)的運行狀態(tài),還包括其網絡設備、DNS服務和POP3 服務的運行情況。2.4.6 告警信息展現(xiàn)

      為了查找發(fā)生故障的原因,往往需要查看一段時間內的告警信息來進行分析。告警管理可以對告警信息按資源、按節(jié)點的進行查詢,并展示了各個時間段的告警信息。2.4.7 靈動可視化平臺 2.4.8 擴展展現(xiàn)集成接口

      擴展展現(xiàn)集成(SSO)通過Portal技術,以B/S方式實現(xiàn)IT運維管理系統(tǒng)與其他監(jiān)控產品的融合,為用戶提供可擴展、多元化的信息匯聚與功能集成。

      借助統(tǒng)一身份登錄和權限驗證,IT運維管理系統(tǒng)可以深度集成其它監(jiān)控系統(tǒng),為不同角色的管理和技術人員提供相應的個性化工作界面,提高IT運維服務效率。2.5 報表管理

      ? 全面的性能與告警報表

      依據對監(jiān)測數據的自動匯聚、抽取、分析,提供基礎架構性能與告警、資源比較、指標排名、指標趨勢等各類層次化統(tǒng)計分析報表。從業(yè)務運行狀態(tài)到微觀性能指標,自定義查詢業(yè)務應用系統(tǒng)及其關聯(lián)資源的當前和歷史運行情況。? 業(yè)務運行報表

      支持按業(yè)務的方式對業(yè)務應用可用性、MTTR和MTBF進行統(tǒng)計。? 節(jié)點報表

      支持按節(jié)點的方式對其監(jiān)測數據的進行匯總分析,提供基礎架構性能指標趨勢等各類層次化統(tǒng)計分析報表,并支持自定義時間段進行查詢。

      ? “所見即所得”的報表

      支持報表收藏功能和訂閱。支持導出為Excel、PDF文件和立即發(fā)送報表到指定Email郵箱,還能夠為不同的用戶訂閱相關報表,自動定時發(fā)送到指定Email郵箱,提供系統(tǒng)優(yōu)化、決策分析和業(yè)務規(guī)劃的量化參考。

      第三篇:杭州正非科技視頻監(jiān)控系統(tǒng)整體運維解決方案

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      杭州正非科技有限公司

      聯(lián)系人:涂經理 手機:***

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      目錄

      目錄

      1、背景............................................................................................................................................4

      2、解決方案概述.............................................................................................................................5

      3、總體架構設計.............................................................................................................................5

      4、功能方案.....................................................................................................................................7

      4.1、數據采集層......................................................................................................................7

      4.1.1、網絡監(jiān)測...............................................................................................................7 4.1.2、應用與存儲監(jiān)測.................................................................................................10 4.1.3、視頻圖像質量診斷.............................................................................................13 4.1.4、傳輸設備監(jiān)測.....................................................................................................14 4.1.5、分布式采集、集中管理.....................................................................................14 4.1.6、統(tǒng)一事件平臺.....................................................................................................15 4.1.7、告警監(jiān)控臺.........................................................................................................16 4.1.8、綜合監(jiān)控展示.....................................................................................................17 4.2、資源數據庫....................................................................................................................19 4.2.1、數據庫建模.........................................................................................................19 4.2.2、配置變更控制.....................................................................................................19 4.2.3、配置可視化瀏覽器.............................................................................................19 4.2.4、分區(qū)化、獨立管理模式支撐.............................................................................20 4.2.5、高性能、大容量系統(tǒng)設計.................................................................................20 4.3、運維服務管理層............................................................................................................20 4.3.1、值班服務臺.........................................................................................................20 4.3.2、事件管理.............................................................................................................21 4.3.3、巡檢管理.............................................................................................................21 4.3.4、值班和值班日志管理.........................................................................................21 4.4、綜合管理層....................................................................................................................22 4.4.1、統(tǒng)一報表管理.....................................................................................................22

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      4.4.2、統(tǒng)一訪問.............................................................................................................22

      5、部署方案...................................................................................................................................22 5.1、部署模式........................................................................................................................22 5.2、運行環(huán)境配置................................................................................................................22

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      1、背景

      隨著IT系統(tǒng)和安防系統(tǒng)日趨龐大和復雜,整體運維管理工作面臨著越來越大的壓力和挑戰(zhàn)。信息技術部門和運維部門總是被動的管理網絡、服務器、硬件,無法快速定位故障,重復維修,運維成本高而效率低下。隨著監(jiān)控系統(tǒng)的加入,加劇了以上這些問題的嚴重性,所以監(jiān)獄/公安/交警部門需要高效、專業(yè)的IT運維管理系統(tǒng)和安防監(jiān)控運維系統(tǒng)相結合的大運維管理系統(tǒng)。

      正非科技多年致力于大運維系統(tǒng)的研究與實踐,自主研發(fā)IT運維系統(tǒng)和安防監(jiān)控運維系統(tǒng)相結合的大運維系統(tǒng),可以有效的幫助監(jiān)獄/公安/交警部門的管理人員對監(jiān)獄/公安/交警部門的設備進行管理和控制,大大提高監(jiān)獄/公安/交警部門的設施的安全性。

      大運維管理平臺主要包括以下四部分內容: 創(chuàng)建資源數據庫,理清資源。

      1、理清資源是實施有效運維的前提。創(chuàng)建資源信息數據庫,實現(xiàn)對外場設備(包括攝像頭、視頻編解碼設備、立桿、取電方式等)、傳輸設備(光纖收發(fā)器/光端機、GPON/EPON等)、內場設備(網絡設備、主機/虛擬機、存儲設備、安全設備、內場維護人員、設備生產廠家和集成商技術支持人員、最終用戶等)、虛擬資源(IP地址、文檔資料等)等的統(tǒng)一管理。

      資源數據庫管理包括從設備登記、設備變更、設備維修、設備報廢的整個過程,以便更好地跟蹤和管理用戶所有的資產。

      2、集中監(jiān)控,實現(xiàn)全網自動化巡檢管理。

      建立集中監(jiān)控,自動巡檢,及時向值班人員報告結果。

      通過集中監(jiān)控,定期對視頻前端設備(攝像頭、卡口、編解碼器),傳輸設備(光纖收發(fā)器、EPON等),內場設備(網絡與安全設備、主機/虛擬機、存儲設備)、機房動力環(huán)境等進行可用性和健康度檢查,及時發(fā)現(xiàn)故障并快速定位故障設備,顯著降低運維人員的工作量,提高管理效率。

      3、建設符合監(jiān)獄/公安/交警部門的特點的運維管理系統(tǒng)的設計,規(guī)范日常值班與維護工作。

      結合監(jiān)獄/公安/交警部門的的業(yè)務特點,根據運維管理體系的設計,規(guī)劃日常值班與巡檢管理、故障修復管理、視頻資源配置管理等運維標準化流程,實現(xiàn)日常運行維護工作的規(guī)

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      范化、標準化,并沉淀運維知識與經驗。

      4、自動考核統(tǒng)計,量化運行維護質量。

      基于運維管理平臺基礎數據進行統(tǒng)計分析,量化前端設備的在線率、量化運維人員的工作量、量化各類設備的綜合可用率等,從宏觀上綜合分析所有監(jiān)測對象的運維狀況,并研判系統(tǒng)運維發(fā)展趨勢,為業(yè)務系統(tǒng)優(yōu)化、運維規(guī)劃提供依據,為領導層進行系統(tǒng)升級、改造、擴容提供更加有效的工具,為業(yè)主單位對承接單位或者維護單位團隊的運維服務考核提供數據支撐。

      2、解決方案概述

      ? 全面解決方案

      產品可按照用戶需求和維護特點進行選配,滿足用戶在不同階段的運維特點。? 開放性接口設計

      產品提供了豐富的API開放接口,可以方便的實現(xiàn)與第三方管理產品的集成和整合,符合國際/國內的標準。

      ? 跨平臺系統(tǒng)部署

      純B/S架構,具有良好的跨系統(tǒng)性。? 組件式平臺搭建

      可以更具自身業(yè)務特點,選擇部署一個或多個系統(tǒng)功能模塊。同時可以根據業(yè)務需求變化,通過部署新模塊的方式對系統(tǒng)功能進行擴展。

      3、總體架構設計

      產品構架分四層:數據采集層、資源數據庫、運維服務管理層、綜合管理層。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      1、總體架構

      ? 數據采集層

      主要實現(xiàn)對生產環(huán)境中I基礎設施的集中監(jiān)控管理,包括了對視頻前段設備、傳輸設備、網絡設備、主機/虛擬機、存儲設備、安全設備、視頻質量等性能采集和時間處理,并利用監(jiān)控可視化平臺提供可視化展現(xiàn),同時支持與第三方系統(tǒng)(如機房動力環(huán)境系統(tǒng)、第三方網管系統(tǒng)等)集成,方式可以是數據集成和界面集成。

      ? 資源數據庫

      幫助用戶建立統(tǒng)一的資源數據庫。通過一系列業(yè)務建模、自動采集、調和、變更控制等手段,保證生產環(huán)境中配置項的完整性和精準性,為上層服務流程提供數據支撐。

      ? 運維服務管理層

      通過規(guī)范服務流程和技術服務工作,建立一套標準的運維服務流程,圍繞值班管理、服務臺、事件管理、巡檢管理等ITIL最佳實踐,進行運維服務的流程化、規(guī)范化管理。通過完善知識庫建設,實現(xiàn)知識庫共享,從而提高信息服務效率,提高用戶的滿意度。

      ? 綜合管理層

      包括了統(tǒng)一運維門戶、報表平臺、全文檢索、權限管理等主要模塊,目的是保證平臺不同角色的運維人員可以通過瀏覽器訪問到跟自身職責對應的功能和視圖,是信息的集中呈現(xiàn)窗口和日常工作的平臺。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      4、功能方案

      4.1、數據采集層

      4.1.1、網絡監(jiān)測

      能夠持續(xù)自動地發(fā)現(xiàn)、識別和跟蹤被管范圍內的網絡設備,自動計算出網絡拓撲連接,采集網絡設備的運行狀態(tài)和性能參數,全面、直觀地反映出網絡設備和線路的整體狀態(tài)。網絡監(jiān)控管理系統(tǒng)功能模塊主要包括網絡故障監(jiān)控模塊、網絡性能監(jiān)控模塊、網絡拓撲管理模塊等。

      網絡故障監(jiān)控

      網絡故障監(jiān)控模塊實現(xiàn)對網絡故障事件的監(jiān)測和定位,實時采集故障信息,實時發(fā)現(xiàn)那些可能導致網絡運行不正常的事件,并通過告警閥值設置、實時告警顯示等,準確預警和定位網絡中的故障。

      網絡故障事件可分為網絡設備故障事件、重要網絡鏈路故障事件、網絡協(xié)議故障事件等。網絡設備故障事件包括網絡設備出現(xiàn)物理宕機(如停電等)、邏輯宕機(如誤操作或負載引起宕機等)、網絡設備硬件故障等事件。

      對網絡設備故障事件的監(jiān)控手段支持主動和被動兩種方式,一種是主動采集方式,使用snmp、ping、rping等協(xié)議采集網絡設備重啟后連續(xù)運行時間、網絡設備可達性等信息,通過設定連續(xù)運行時間、設備響應時間等閥值,在超過閥值后產生網絡故障事件報警;另一種是被動收集方式,通過采集網絡設備syslog/trap發(fā)出的故障日志信息(網絡交換機設備、路由器設備發(fā)出的故障日志、防火墻切換日志等),設定信息告警級別,產生網絡故障事件監(jiān)控報警。

      重要網絡鏈路故障事件包括網絡設備連接重要網絡鏈路的端口物理宕(端口物理故障等)、邏輯宕(誤操作shutdown端口等)、重要網絡物理線路中斷等事件。對重要網絡鏈路故障的監(jiān)控手段主要有兩種,一種是使用ping、rping等協(xié)議測試線路的聯(lián)通情況;另一種是通過采集網絡設備syslog/trap發(fā)出的設備端口故障日志信息,設定信息告警級別,發(fā)出重要網絡鏈路故障的告警。

      網絡協(xié)議故障事件包括網絡協(xié)議運行過程中,產生的運行故障(如ospf協(xié)議運行無法

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      到達full狀態(tài)等),從而可能導致網絡運行不正常的事件。對網絡協(xié)議故障事件的監(jiān)控手段主要是通過采集網絡設備syslog/trap發(fā)出的網絡協(xié)議故障日志信息,設定信息告警級別,發(fā)出重要網絡鏈路故障的告警,或通過其他專門網絡協(xié)議監(jiān)控工具監(jiān)控網絡協(xié)議的運行情況,并通過對網絡協(xié)議監(jiān)控工具告警事件的處理、過濾、整合,將告警事件顯示在統(tǒng)一的網絡監(jiān)控管理系統(tǒng)界面上。

      網絡性能監(jiān)控

      網絡性能監(jiān)控模塊實現(xiàn)對網絡基礎設施環(huán)境性能的監(jiān)控,定時采集網絡性能信息,及時發(fā)現(xiàn)那些可能會導致網絡服務質量出現(xiàn)明顯下降的情況及故障隱患,并通過告警閥值設置、實時顯示告警等,主動預警網絡隱患;通過報表等工具,進行網絡環(huán)境性能統(tǒng)計、性能趨勢分析,為網絡排錯、網絡優(yōu)化、網絡改造等提供依據。

      根據網絡監(jiān)控對象,網絡性能可分為網絡設備性能、重要網絡鏈路性能、網絡協(xié)議性能等,網絡性能主要指網絡設備的CPU利用率、內存利用率、防火墻等網絡安全設備的連接數、網絡負載均衡設備的流量、重要網絡鏈路的帶寬利用率、Drop包率、Error包率、CRC校驗錯誤包率、網絡協(xié)議的運行性能等。

      對網絡設備性能的監(jiān)控手段,主要是通過snmp協(xié)議采集網絡設備性能,設定性能閥值,產生網絡設備性能監(jiān)控報警,對網絡整體運行環(huán)境進行預警。

      網絡拓撲管理

      能夠自動發(fā)現(xiàn)網絡設備間的拓撲連接,并實時跟蹤和更新網絡拓撲變更信息,將網絡拓撲重大變更,以告警事件方式發(fā)送給統(tǒng)一的運維監(jiān)控系統(tǒng)予以展現(xiàn)。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      拓撲發(fā)現(xiàn)

      網絡拓撲管理模塊主要實現(xiàn)如下功能:

      1、發(fā)現(xiàn)網絡拓撲結構中所包含的主要網絡設備的廠商的設備型號;

      2、實時顯示骨干網絡的連通性;

      3、發(fā)現(xiàn)和建立真實的網絡連接關系,使網管系統(tǒng)能夠真實的反映網絡的實際連接狀況,反映設備之間物理及邏輯的連接情況;

      4、具備自動發(fā)現(xiàn)網絡拓撲圖和定制視圖的功能;

      5、支持靈活的拓撲視圖定制功能,能夠根據網絡管理需要,通過過濾條件,靈活建立拓撲的邏輯圖和子圖;

      6、網絡拓撲管理模塊生成的網絡拓撲圖中能夠及時反映網絡設備運行狀態(tài)的變化,將設備產生的告警事件信息展現(xiàn)在網絡拓撲圖中;

      7、自動網絡拓撲的呈現(xiàn)能夠根據用戶的權限進行定制,不同的用戶只能監(jiān)控自己權限范圍內的網絡拓撲圖;

      8、網絡拓撲管理模塊能夠建立網絡資源數據庫,對網絡資源進行統(tǒng)一的管理。協(xié)議分析

      網絡協(xié)議分析模塊實現(xiàn)對網絡流量狀況的監(jiān)控,通過專門的網絡流量管理工具,根據源ip地址、目的ip、協(xié)議號、服務號、自治域號等采集重要網絡鏈路流量、網絡整體流量等信息,從業(yè)務、地域、用戶多角度協(xié)助管理員分析用戶網絡流量行為,為網絡排錯、網絡優(yōu)化、視頻監(jiān)控系統(tǒng)整體運維解決方案

      網絡改造等提供參考依據。

      4.1.2、應用與存儲監(jiān)測

      實現(xiàn)了對主機(虛擬機)、數據庫、中間件、實戰(zhàn)應用、存儲系統(tǒng)的故障監(jiān)控和性能分析。

      操作系統(tǒng)/虛擬機監(jiān)控

      支持廣泛的操作系統(tǒng)類型,如HP-UX、IBM AIX、Solaris、Linux、Windows 2000/2003/2008、AS400等多種系統(tǒng)平臺,同時支持ESX等虛擬化平臺。

      1、Windows和Unix系統(tǒng)的監(jiān)控:

      (1)CPU利用率,顯示系統(tǒng)、用戶、空閑時間的百分比;(2)虛擬內存(Virtual memory)利用率;

      (3)文件系統(tǒng)使用情況,顯示磁盤空間使用情況;

      (4)監(jiān)視文件系統(tǒng)的使用率(空間使用率及I節(jié)點使用率等),當使用率超過特定閾值時向系統(tǒng)管理員報警;

      (5)日志文件的變化情況,可跟蹤操作系統(tǒng)、數據庫及用戶應用系統(tǒng)的日志文件,根據日志中出現(xiàn)的特定信息進行報警或自動執(zhí)行用戶預定義的動作;

      (6)進程的運行情況,如進程多個實例、子進程、進程對CPU/內存的占用情況等等。當重要進程因意外原因終止時,可根據需要自動重啟,并將報警信息寫入事件日志。

      (7)監(jiān)控服務器網卡的運行狀態(tài)和網絡傳輸情況,如網卡是否DISABLE,網絡是否中斷或丟包等。

      (8)可通過開發(fā)接口監(jiān)視業(yè)務系統(tǒng)或指定業(yè)務進程的運行狀態(tài)。

      2、虛擬機系統(tǒng)的監(jiān)控:

      由于服務器虛擬化具有節(jié)省電力、空間、管理成本,并能充分利用服務器計算資源和快速部署新業(yè)務的特點,虛擬化技術已經逐漸成為主流的計算解決方案。

      支持對Vmware ESX/ESXi的深度監(jiān)控。

      (1)系統(tǒng)發(fā)現(xiàn)的物理服務器和虛擬服務器及其相互之間的映射關系;

      (2)監(jiān)控虛擬服務器配置、磁盤、網絡、性能等指標,對可用性進行自動評估;

      (3)對虛擬服務器上部署的VM虛擬進行監(jiān)測。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      針對 Vmware ESX/ESXi的監(jiān)控有以下特點:

      (1)對從統(tǒng)一控制臺即可監(jiān)控虛擬機的所有物理和虛擬組件;(2)保證VMware ESX/ESXi主機服務器以及其中的虛擬機正常運行;(2)在影響到最終用戶前,及時發(fā)現(xiàn)和排除問題;(4)采用無代理監(jiān)控模式,易于配置和管理實現(xiàn)。數據庫系統(tǒng)監(jiān)控

      支持對包括Oracle、DB2、Sybase、Informix、MS SQL Server等在內的業(yè)界主流數據庫。數據庫可用性監(jiān)控:能夠監(jiān)控數據庫引擎的關鍵參數,例如:數據庫系統(tǒng)設計的文件存儲空間、系統(tǒng)資源的使用率、配置情況、數據庫當前的各種鎖資源情況、監(jiān)控數據庫進程的狀態(tài)等。在參數到達門限值時通過事件管理機制發(fā)出警告,通過短信、郵件報告給數據庫管理員,以便及時采取措施。

      數據庫文件系統(tǒng)監(jiān)控:對數據庫設備或其敏感文件所在的文件系統(tǒng)進行監(jiān)控??臻g使用情況:對數據庫中的表空間進行監(jiān)控,包括該表空間的分配空間、已用空間,和表記錄數的情況。

      數據庫死鎖:為避免死鎖的發(fā)生,要求自動監(jiān)控可用的鎖資源,同時也對多個應用企圖修改同一信息引起的鎖沖突進行監(jiān)控。

      數據庫進程的監(jiān)控:監(jiān)控數據庫進程的狀態(tài),在數據庫進程關閉時,給出嚴重警告。

      中間件系統(tǒng)監(jiān)控

      支持對WebSphere、WebLogic等J2EE中間件系統(tǒng)的監(jiān)控。

      監(jiān)控J2EE服務器的運行狀況和資源消耗情況;包括服務器的連接數、服務器連接端口數、客戶端的平均連接時間、客戶端查詢服務器狀態(tài)的平均時間;

      監(jiān)控J2EE各部件(如JSP、Servlet、Java Bean、EJB)的性能和資源消耗情況;包括: Servlet、Java Bean、EJB中每個部件的平均執(zhí)行時間、提交的交易請求情況等; EJB、Servlet的多種統(tǒng)計數據,包括被分配的Beans、在使用的Beans、空閑的Beans、超時的Beans數、等待的Beans、Servlet響應時間;TOP N Servlet和JSP的詳細信息;TOP N EJB的詳細信息;TOP N EJB方法的詳細信息。

      監(jiān)控Java虛擬機的運行情況,如:垃圾回收平均的持續(xù)時間、垃圾回收的次數、垃圾回收的累積時間、JVM堆棧中的可用內存、JVM使用的CPU時間、JVM線程使用的CPU時間、使用最多CPU時間的JVM線程使用的CPU時間等;

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      監(jiān)控JDBC的運行情況,如可用的數據庫連接數、連接上執(zhí)行的SQL語句的效率等; 監(jiān)控JMX的運行情況;

      JMS服務器的狀態(tài)及其詳細信息,如消息大小、發(fā)送消息的數量、成功情況。支持對WebSphere MQ的監(jiān)控。檢查MQ通道運行狀態(tài);

      檢查MQ死信、錯誤隊列深度變化情況;

      隊列的最大字節(jié)數,當前隊列的字節(jié)數,當前隊列的處理速度,隊列管理器狀態(tài),錯誤日志。

      存儲監(jiān)控

      (1)支持的被監(jiān)控的存儲設備類型:

      支持對業(yè)界主流廠家的SAN、磁盤陣列、磁帶庫等存儲對象的監(jiān)控。也支持通過與自帶監(jiān)控軟件的接口進行設備監(jiān)控。

      (2)磁盤陣列監(jiān)控主要功能:

      支持符合SMI-S1.1規(guī)范的主流廠家(IBM、HP、EMC等)的磁盤陣列的集中監(jiān)控和管理; 監(jiān)控物理磁盤及磁盤控制器;

      監(jiān)控環(huán)境參數,如溫度、風扇、電源電壓等; 監(jiān)控內部和外部的光纖連接; 監(jiān)控邏輯磁盤、卷。(3)SAN監(jiān)控主要功能:

      監(jiān)控SAN的環(huán)境參數,如溫度、風扇、電壓電源等;

      監(jiān)控光纖交換機的連接情況,包括端口狀態(tài)、light、連接情況和速率等; 報告每個光纖連接的利用情況,包括每小時或每天的數據流、帶寬利用率等; 監(jiān)控物理磁盤和邏輯磁盤。服務可用性監(jiān)控

      實時監(jiān)控各類實戰(zhàn)應用和網絡基礎服務的可用性(如DNS、HTTP、HTTPS、TCP、FTP等),系統(tǒng)通過實時抽取業(yè)務系統(tǒng)用戶訪問次數,訪問失敗次數,訪問超時次數等訪問信息,支持閥值告警,當各業(yè)務系統(tǒng)的訪問情況超出閥值時,在應用視圖上通過顏色變化進行告警。

      同時對應用系統(tǒng)模擬業(yè)務操作(如WEB模式的應用系統(tǒng),通過模擬用戶進行WEB登錄的方式對系統(tǒng)運行是否正常、能否正常響應等進行測試),進行服務可用性和客戶感受分析。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      4.1.3、視頻圖像質量診斷

      系統(tǒng)支持多種診斷檢測項目,包括:

      ? 清晰度 ? 亮度

      檢測由于鏡頭聚焦不當、鏡頭老化導致的視頻模糊

      ? 色彩

      檢測視頻畫面過暗、過亮

      ?

      對比度

      檢測由于攝像頭故障導致視頻畫面大面積偏色

      ? 噪聲

      檢測視頻對比度異常

      ?

      疊加性干擾

      檢測由于各種干擾引起的噪聲

      ? 強橫紋

      檢測視頻畫面出現(xiàn)疊加線條干擾

      ?

      穩(wěn)定條紋

      檢測視頻畫面出現(xiàn)強橫紋干擾

      ? 視頻編碼

      檢測視頻畫面出現(xiàn)滾動條紋干擾

      ?

      信號丟失

      檢測視頻畫面出現(xiàn)的馬賽克(塊)效應

      檢測由于攝像頭故障、線路故障等引起的視頻 信號丟失

      ?

      抖動 ? 凍結

      檢測視頻畫面出現(xiàn)凍結異常

      檢測由于不穩(wěn)定、外部強烈震動等引起的攝像 頭持續(xù)性抖動

      視頻監(jiān)控系統(tǒng)整體運維解決方案 ? 視頻劇變

      ?

      視頻遮擋

      檢測視頻由于受到強干擾而發(fā)生劇烈變化

      ? PTZ

      檢測畫面被惡意遮擋

      檢測球機的PTZ功能是否正常

      ? 流媒體/網絡狀況 檢測網絡傳輸視頻數據是否正常

      支持全部的全球眼監(jiān)控平臺包括中興,華為,科達、互信互通、中星電子、公眾等。此外也支持主流的監(jiān)控平臺廠商,包括華

      三、中興力維、貝爾、先進視訊、聲迅電子、蛙視、中盛益華等等;

      4.1.4、傳輸設備監(jiān)測

      SBI實現(xiàn)對光纖收發(fā)器、EPON(以太網無源光網絡傳輸設備)設備進行監(jiān)控,實時輪詢和采集設備的在線狀態(tài)和性能指標。

      4.1.5、分布式采集、集中管理

      分布式采集、集中管理技術是相對集中式管理而言的。在分布式管理模式下,集中管理服務器把采集指令下發(fā)到采集探針,完成分管區(qū)域的數據收集處理,有效的分擔了集中管理服務器的負載,尤其適合有物理隔離的大型數據中心或分布在不同地理位置的大型行業(yè)客戶。

      探針自帶了存儲功能,在網絡臨時中斷或服務端臨時關閉的情況下,探針會臨時保存監(jiān)測數據,待網絡和服務端恢復后再向服務端傳輸數據,保證監(jiān)測數據的完整性。探針支持在常見的操作系統(tǒng)下如Windows、類Unix下運行,并以服務方式自動啟動,當采集探針由于某些原因無法正確運行時,探針會自動重啟并迅速執(zhí)行監(jiān)測任務,保證監(jiān)測數據的連續(xù)性。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      分布式采集示意圖

      4.1.6、統(tǒng)一事件平臺

      利用實時數據總線和高速事件處理算法,系統(tǒng)每分鐘能處理幾千條告警事件,事件經過標準化、過濾、歸并、關聯(lián)分析、豐富等過程最后形成準確的告警信息。當網絡發(fā)生故障風暴時,系統(tǒng)提供了隊列機制保證事件處理高效穩(wěn)定,滿足大型網絡的實時告警監(jiān)視的需要。

      對于有一定技術能力的運維技術人員,可利用系統(tǒng)提供的事件規(guī)則處理語言,以實現(xiàn)更靈活的事件處理規(guī)則及擴展。通過告警的規(guī)則定義的可視化界面,幫助技術人員優(yōu)化統(tǒng)一事件平臺告警處理規(guī)則,提高告警的自動化識別和關聯(lián)分析能力。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      事件分析處理原理

      4.1.7、告警監(jiān)控臺

      大量的事件經過處理,形成了最終需用戶關注的告警,直觀的呈現(xiàn)在告警臺上,隨后可對告警進行生命周期管理。在告警臺上,可對告警進行確認、清除、刪除或者派發(fā)工單操作,可查看告警資源當前的性能情況,分析故障根源,并利用CMDB關系對故障影響做初步判斷,還可查看告警資源歷史故障及工單派發(fā)、短信通知情況。獨特的告警導航,可即時顯示當前告警分類是否有新的未處理告警,幫助運維人員運籌帷幄,掌控全局。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      圖1.告警監(jiān)控臺

      系統(tǒng)對企業(yè)IT環(huán)境實施全天候的實時監(jiān)測,一旦發(fā)現(xiàn)運行故障或者監(jiān)測指標超過預定的告警閾值時,系統(tǒng)就會根據預先配置的動作策略內的告警通知方式立即通知運維人員,通知方式包括觸發(fā)緊急事件工單、聲音告警、郵件通知、短信通知等。

      4.1.8、綜合監(jiān)控展示

      系統(tǒng)提供了電信級的數據中心可視化利器——靈動可視化平臺,它具備實時響應、快速設計、所見即所得的特點,可用來直觀展現(xiàn)業(yè)務、網絡、機房、機房環(huán)境等多種視圖,方便管理員實時掌握整體運行情況。此外,還可以利用其獨具特色的幻燈片功能,把各類視圖投影在網絡運營中心大屏上。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      圖2.機房與機柜視圖

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      4.2、資源數據庫

      4.2.1、數據庫建模

      考慮到實施數據庫項目的復雜性,提供最佳實踐模型,可幫助用戶快速落地數據庫建設,有效縮短時間周期。

      采用了面向對象的建模思想,提供配置項的類別、屬性、關系、字典以及表單的繼承和派生,并支持通過建立和應用規(guī)則來觸發(fā)管理動作,擴展管理行為,如某些配置項發(fā)生變更時,可根據規(guī)則定義是否生成新的配置項版本等。數據庫建模過程相當容易,全面操作都是基于可視化的界面,最大限度的適應不斷變化的業(yè)務場景的管理要求。

      4.2.2、配置變更控制

      提供了多樣化的配置變更管理方法,在管理的便捷性和嚴謹性取得平衡。系統(tǒng)支持對配置項的變更審核模式有三種:一種是走配置變更流程的審核方式,一種是簡單審核模式、還

      有一種是通過設定規(guī)則自動審核。三種方式適合不同的場景。

      對于核心業(yè)務的配置項信息,可以選擇走配置變更流程的審核方式,管理員用戶選中變更區(qū)中的待審核配置項記錄后,系統(tǒng)自動生成配置變更工單,工單審批通過后,系統(tǒng)自動執(zhí)行審核操作。

      對于簡單審核模式,就是由具有配置項審核權限的管理員用戶選中變更區(qū)中的待審核配置項記錄后,執(zhí)行配置審核操作。系統(tǒng)自動記錄下配置審核的操作記錄(如審核時間、審核人等)。該種審核方式比較適用于非核心業(yè)務的配置項信息。

      對于設定規(guī)則自動審核模式,適用于變更頻繁但不重要的配置信息,可保證數據準確性和合法性的基礎上,大幅減少了人工審核的工作量。

      4.2.3、配置可視化瀏覽器

      資源配置項的可視化是及其重要的功能,提供了集編輯和展現(xiàn)一體的純web化的CI瀏覽器,獨特的“畫布”功能,不僅能夠幫助用戶全面直觀地查看配置項之間的關系,還能通過連線操作所見即所得的方式維護配置項關系。“畫布”也支持完全的定制化,可通過勾選關系類型、顯示層次數、切換布局模式、隱藏等實用功能過濾不必要的CI,方便得到更精簡

      視頻監(jiān)控系統(tǒng)整體運維解決方案 的視圖。

      4.2.4、分區(qū)化、獨立管理模式支撐

      支持對配置項進行分區(qū)化管理,可對數據庫建立不同的管理域,為地域跨度較大、各分支機構有自治管理訴求的企業(yè)或組織提供了便捷的解決方案。使用一個平臺即可實現(xiàn)資產配置數據大集中,既滿足了上級對下級的管理要求,又不失管理上的變通性。

      4.2.5、高性能、大容量系統(tǒng)設計

      數據庫的設計充分考慮了大容量環(huán)境的管理需求,在功能的全面性、用戶體驗以及性能吞吐、容量方面相比競爭者具備明顯的優(yōu)勢,目前可支持40用戶并發(fā)數情況下管理100萬配置項的能力,單條數據查詢調用達到毫秒級,絕大部分界面操作從發(fā)起到呈現(xiàn)小于3秒。

      4.3、運維服務管理層

      運維服務管理子系統(tǒng)是IT運維工作及對外服務接口的平臺,它遵循ITIL管理框架,提供可視化的BPM流程引擎,實現(xiàn)流程定義、流程相關角色權限和流程跟蹤控制、審計與統(tǒng)計以及流程關聯(lián)等功能。系統(tǒng)基于流程引擎內置了服務臺和事件等常用流程,并涵蓋了巡檢作業(yè)、運行值班、值班日志等實用功能。

      4.3.1、值班服務臺

      值班服務臺主要承擔以下職責: 故障監(jiān)控和接收用戶服務請求; 故障與用戶服務請求的初步支持; 確認故障,并創(chuàng)建和派發(fā)工單;

      跟蹤工單的執(zhí)行,確定故障恢復并關閉工單。

      值班服務臺可支持IT服務水平、能力、效率和質量的提高,改善服務部門和業(yè)務用戶之間的關系。同時值班服務臺能夠制定和執(zhí)行排班計劃以及日常機房、設備巡檢計劃,并通過監(jiān)控視圖對相關設備進行巡檢。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      4.3.2、事件管理

      實現(xiàn)對故障處理的閉環(huán)管理,由事件工單創(chuàng)建、事件工單派發(fā)、事件工單流轉、事件升級和事件工單關閉等環(huán)節(jié)組成。

      4.3.3、巡檢管理

      巡檢計劃主要是對城市視頻監(jiān)控系統(tǒng)的所有對象進行巡檢、常規(guī)檢查等的作業(yè)計劃,使得運行維護人員能夠準確、高效的完成各項日常維護任務。

      1)為使巡檢更加規(guī)范,巡檢管理應建立巡檢項的標準操作要求,并在實際的巡檢過程中嚴格執(zhí)行這些要求。應能在巡檢記錄進入系統(tǒng)時對不規(guī)范的內容進行限制。

      2)為使巡檢更具通用性,巡檢計劃應有較為靈活的模板,并具有自定義功能,自定義功能包括添加、編輯巡檢計劃表,但應控制相關的權限。

      3)系統(tǒng)應提供與巡檢計劃相關的配置項的維護管理功能,提供特定的界面,支持對與巡檢計劃相關的配置項的維護管理功能,并支持相應的增、刪、改、查等操作。

      4)通過集成,實現(xiàn)與各個模塊的互動,并與信息中心的值班制度聯(lián)動,以此作為響應內部用戶和外部用戶需求的統(tǒng)一入口,采用集中聯(lián)系點模式。

      5)提供值班日志功能,便于值班用戶記錄每次值班的事務處理情況。

      4.3.4、值班和值班日志管理

      根據運維習慣,系統(tǒng)提供了日歷化值班表、多班次排班、值班日志管理等多項實用業(yè)務功能,并與自助服務臺、值班服務臺進行充分結合。有效的值班管理可保證服務連續(xù)不間斷,有助于運維團隊人力資源合理配置,做到各項工作權責明晰,有跡可循。

      所有運維人員需要填寫工作日志,描述當班的工作內容,工作日志需要經過相關負責人審核。工作日志包括值班日志和巡檢工作日志等。

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      4.4、綜合管理層

      4.4.1、統(tǒng)一報表管理

      系統(tǒng)內置靈活易用的報表設計器,通過抽取監(jiān)控和維護管理各類數據,只需通過簡單的鼠標拖放,便可利用精巧的數據綁定功能,完成各種樣式報表的量身定制。

      如:核心網絡暢通率、一類(二類)攝像頭在線率、卡口設備可用率、各級聯(lián)網平臺的存活率、各類設備(如根據品牌、型號、地域進行分類)平均無故障時間、外包團隊SLA達成率、租用線路的阻斷時間等。

      4.4.2、統(tǒng)一訪問

      統(tǒng)一訪問為用戶提供了各種小部件構成的集中管理界面。通過與其他子系統(tǒng)的集成,將監(jiān)控、資產和管理流程等信息在門戶中進行統(tǒng)一展示,使各項IT運維服務工作通過統(tǒng)一管理門戶得到有序處理。門戶整合了各子系統(tǒng)單點登陸、權限管理以及訪問日志管理等功能。

      5、部署方案

      5.1、部署模式

      根據各個監(jiān)獄/公安/交警部門的視頻監(jiān)控系統(tǒng)和運維管理現(xiàn)狀,整體運維系統(tǒng)可采用集中部署模式。

      在監(jiān)獄/公安/交警部門的監(jiān)控中心部署整體運維系統(tǒng)。實現(xiàn)分布式采集,集中數據處理,集中運行展現(xiàn)、分區(qū)運維管理。

      5.2、運行環(huán)境配置

      ? 服務器配置

      建議采用高性能服務器作為運行平臺,系統(tǒng)運行所需的標準服務器配置(以1萬個點位規(guī)模計算)包括:

      視頻監(jiān)控系統(tǒng)整體運維解決方案

      ? ? Web+數據庫服務器:1臺 運維服務管理服務器:1至2臺

      運維服務管理服務器的硬件配置:

      CPU:建議Intel Xeon E5-2640或以上 內存:16G或以上 硬盤:1T USB接口:不少于2個;

      操作系統(tǒng):Windows Server 2008或以上版本 Web+數據庫服務器配置:

      CPU:建議Intel Xeon E5-2640或以上 內存:16G或以上 硬盤:1T USB接口:不少于2個;

      操作系統(tǒng):Windows Server 2008或以上版本

      第四篇:用電信息采集系統(tǒng)運維服務報告

      用電信息采集系統(tǒng)運維服務報告

      一、用電信息采集系統(tǒng)(以下簡稱采集系統(tǒng))承擔著用電信息自動采集、高效共享和實時監(jiān)控的重要任務,是.智能用電服務體系的重要基礎和用戶用電信息的重要來源。系統(tǒng)經過近三年建設,已投入大規(guī)模應用,城區(qū)用戶已實現(xiàn)全覆蓋,開始向鄉(xiāng)鎮(zhèn)延伸,抄表率等指標也納入同業(yè)對標考核體系。隨著系統(tǒng)的大規(guī)模建設,系統(tǒng)的運維服務工作將是建設后期的重點。

      二、系統(tǒng)運維現(xiàn)狀及問題

      當前建設的采集系統(tǒng)主要是將智能電能表、集中抄表終端作為系統(tǒng)的底層基礎設施,以低壓電力載波、微功率無線、RS-X185 , GPRS/CDMA、光纖專網等為主要通信載體,結合先進的控制手段和軟件技術,對電力用戶的用電信息進行采集、處理和實時監(jiān)控的系統(tǒng)。初步統(tǒng)計截止目前國家電網28個直屬省公司均已建成用電信息采集系統(tǒng),己安裝智能電能表約1.1億只,在運行集中抄表終端(指集中器和專變終端)約百萬只。如此龐大的系統(tǒng),如何保障它可靠、穩(wěn)定的運行,將是后期工作重點。在當前的運維工作中主要存在如下問題:

      1、缺乏專業(yè)化的維護隊伍

      采集系統(tǒng)由于其資源技術的特有和保密性,在現(xiàn)階段調試和售后維護基本依靠各供應商來完成,運維工作內外部的定位和分工不是很明確,雖有供應商承擔一部分工作,但因為成本和責任的問題易出現(xiàn)內外部維護人員積極性不高、相互推譜、相互依靠的問題。導致服務質量不高,內部人員技術掌握不深入、不全面,而且從人員結構上來說,無相應的崗位設置或相應崗位缺乏專業(yè)人員,缺乏一支具備系統(tǒng)和專業(yè)知識的運維隊伍。

      2、運維工作缺乏系統(tǒng)性

      采集系統(tǒng)屬于集成系統(tǒng),整個系統(tǒng)涉及的供應商多且分散,在進行運維服

      一、前言

      用電信息采集系統(tǒng)(以下簡稱采集系統(tǒng))承擔著用電信息自動采集、高效共享和實時監(jiān)控的重要任務,是.智能用電服務體系的重要基礎和用戶用電信息的重要來源。系統(tǒng)經過近三前言 年建設,已投入大規(guī)模應用,城區(qū)用戶已實現(xiàn)全覆蓋,開始向鄉(xiāng)鎮(zhèn)延伸,抄表率等指標也納入同業(yè)對標考核體系。隨著系統(tǒng)的大規(guī)模建設,系統(tǒng)的運維服務工作將是建設后期的重點。

      二、當前建設的采集系統(tǒng)主要是將智能電能表、集中抄表終端作為系統(tǒng)的底層基礎設施,以低壓電力載波、微功率無線、RS-X185 , }PRSICDA}}A、光纖專網等為主要通信載體,結合先進的控制手段和軟件技術,對電力用戶的用電信息進行采集、處理和實時監(jiān)控的系統(tǒng)。初步統(tǒng)計截止目前國家電網28個直屬省公司均已建成用電信息采集系統(tǒng),己安裝智能電能表約1.1億只,在運行集中抄表終端(指集中器和專變終端)約百萬只。如此龐大的系統(tǒng),如何保障它可靠、穩(wěn)定的運行,將是后期工作重點。在當前的運維工作中主要存在如下問題:

      1、缺乏專業(yè)化的維護隊伍

      采集系統(tǒng)由于其資源技術的特有和保密性,在現(xiàn)階段調試和售后維護基本依靠各供應商來完成,運維工作內外部的定位和分工不是很明確,雖有供應商承擔一部分工作,但因為成本和責任的問題易出現(xiàn)內外部維護人員積極性不高、相互推譜、相互依靠的問題。導致服務質量不高,內部人員技術掌握不深入、不全面,而且從人員結構上來說,無相應的崗位設置或相應崗位缺乏專業(yè)人員,缺乏一支具備系統(tǒng)和專業(yè)知識的運維隊伍。

      2、運維工作缺乏系統(tǒng)性

      采集系統(tǒng)屬于集成系統(tǒng),整個系統(tǒng)涉及的供應商多且分散,在進行運維服務時各自為政,形成馬路警察各管一段的現(xiàn)象,缺乏系統(tǒng)全面的運維思路。如:服務器是生產商,外網是通信運營商,智能電能表是電表供應商,終端設備是終端供應商,本地通信介質是相應的載波微功率芯片供應商。出現(xiàn)問題只是一味的頭痛醫(yī)頭,腳痛醫(yī)腳,不能從整個系統(tǒng)的角度出發(fā)審視和解決問題。

      3、系統(tǒng)運維缺乏持續(xù)性和連貫性

      系統(tǒng)運維現(xiàn)狀及問題 隨著國家電網公司統(tǒng)一招標模式的開展,競爭淘汰機制加劇,部分供應商難以適應此種競爭形勢,被淘汰出局。更多供應商則面臨地域分散、售后服務成本增大等諸多問題,而且很多地區(qū)與供應商簽訂的合同承諾售后服務期限已到,各供應商為降低成本導致售后服務出現(xiàn)斷檔和銜接不上的情況。

      4、系統(tǒng)運維缺乏前瞻性

      當前在采集系統(tǒng)運維中的思路是發(fā)生問題及時解決、處理,以提高抄表率等指標為工作目標。但對于系統(tǒng)運維工作來說不光需要的是能迅速地定位、解決問題,更重要的是在故障發(fā)生前能夠發(fā)現(xiàn)隱患并消除隱患,使系統(tǒng)長期穩(wěn)定地運行。這就要求我們在系統(tǒng)運維過程中,需要有一定的前瞻性,防患于未然。如果運維人員能在故障發(fā)生之前,在例行巡檢之中,及時檢測到故障的先兆,將故障解決在萌芽期,這樣不但可以避免故障發(fā)生后,由于搶修的慌亂、業(yè)務中斷所造成的經濟損失。而且還可以避免故障嚴重化對整個系統(tǒng)所造成的損傷,從而延長系統(tǒng)的使用壽命。而這一切不但要求維護人員有深厚的功底,豐富的維護經驗,還要有洞察秋毫的高度敏感性。

      三、運行維護顧名思義由運行及維護兩部分內容組成。運行維護不僅僅是保證系統(tǒng)正常運行,問題出現(xiàn)時能迅速定位、解決問題。而更重要的是在故障產生前,能夠通過例行的巡檢工作及時發(fā)現(xiàn)故障隱患、消除故障隱患,使設備長期穩(wěn)定地運行。對設備良好、有效的維護,不僅能夠減少系統(tǒng)的故障率,并且可以延長設備的使用壽命?;驹瓌t就是在例行運行維護工作中及時發(fā)現(xiàn)、解決問題,防患于未然。目前常見的兩種運維模式分別是外維和內維。

      1、內維模式

      指通過內部人員來承擔整個系統(tǒng)的運行維護工作。用電信息采集技術是集電能測量技術、計算機技術和網絡通信技術于一體的一門綜合技術。要求維護人員在有電能計量知識和安裝技能之上,還要學習采集系統(tǒng)工作原理,掌握終端應用功能、設置、安裝和故障處理技能,根據崗位要求學習計算機原理、網絡通信、采集通信和電表通信規(guī)約、了解繼電保護等相關專運維解決方案及建議 業(yè)知識。不僅人員和崗位需求量大,而且專業(yè)化程度要求較高,所以此種模式在當前國家電網公司的發(fā)展狀況下,存在很多弊端。

      2、外維模式

      指將系統(tǒng)運維外包給專業(yè)的服務公司,把過程交給專家,自己控制結果,外維服務正成為現(xiàn)代企業(yè)發(fā)展的趨勢。這樣不但可以降低系統(tǒng)運營成本,而且系統(tǒng)運營效率也大為提高。智能電能表、終端和系統(tǒng)主站等并不能夠保證為企業(yè)效益做出貢獻,我們需要的是采集系統(tǒng)對企業(yè)業(yè)務的支持,需要的是運用采集系統(tǒng)的結果。運維服務外維作為專業(yè)服務的一種,具有以下幾點基本特點:

      (1)基于企業(yè)戰(zhàn)略發(fā)展的選擇

      盡管服務外維的出現(xiàn)是源于降低企業(yè)在系統(tǒng)運營維護方面的日常開支,縮減管理成本,但是現(xiàn)在企業(yè)選擇外維服務更多的是出于培育企業(yè)核心競爭力的考慮。企業(yè)將更多的精力和資源投入到自己擅長的核心業(yè)務中,而輔助性的業(yè)務、非核心的業(yè)務則交給外部的專業(yè)人士來承擔,以獲得更高的整體運營效率。服務外維正成為企業(yè)實施長期發(fā)展戰(zhàn)略的重要選擇。

      (2)履行服務的系統(tǒng)性和延續(xù)性

      服務外維可以是一種長期的委托行為,一般合同履行的時間比較長,三年、五年,或者十年、幾十年。有些合同也比較短,在一年以內。許多外維服務合同規(guī)定一段時問的試用期,作為對外維服務商的考察和績效指標體系設計的基礎。

      (3)以采集系統(tǒng)之上的業(yè)務流程為外維對象

      傳統(tǒng)外維服務涉及各個行業(yè),而采集系統(tǒng)外維服務的外維對象則是針對采 集系統(tǒng)或者采集系統(tǒng)之上的業(yè)務流程。隨著外維服務的發(fā)展,特別是業(yè)務流程 外維的發(fā)展,采集系統(tǒng)外維服務包含的內容也會更加廣泛,介入內部管理的層 面更加深入,以第三方的角度審視業(yè)務流程。

      綜上所述,采集系統(tǒng)運維外維模式將會成為其實施長期發(fā)展戰(zhàn)略的明智選 擇,具有重要的意義。

      三、運維組織分析

      用電信息采集系統(tǒng)是集信息通信、計算機網絡、海量數據處理、電力自動化技術及營銷管理于一體的集成系統(tǒng),涉及業(yè)務層知識面廣、技術層知識面深,必須具備足夠技術和業(yè)務水平的公司方能站在系統(tǒng)全面的角度進行運維工作,以其服務的專業(yè)性、前瞻性、持續(xù)性來推動系統(tǒng)的運維工作的良性進行。

      1、組織簡介

      南瑞集團是國家電網公司直屬產業(yè)單位,2012年經過產業(yè)重組整合得到進一步發(fā)展壯大,主要從事電力系統(tǒng)二次設備、信息通信、智能化中低壓電氣設備、自動化設備等的研發(fā)、設計、制造、展與外延式擴張相結合,產業(yè)實力雄厚,銷售及工程服務。集團堅持內涵式發(fā) 下設31個產業(yè)公司,京、武漢、合肥等10多個地區(qū),形成電網自動化及工業(yè)控制、分布在南京、北信息通信、繼電保護及電力電子、智能化電氣設備等優(yōu)勢明顯、業(yè)務突出的產業(yè)群,具有300多個自主知識產權的高新技術產品,初步形成覆蓋智能電網各環(huán)節(jié)的完整產品鏈。

      2、組織結構

      南瑞集團組織結構劃分主要分職能部門、支撐機構、專業(yè)機構、產業(yè)群四大板塊,其中產業(yè)群主要包括:營銷與工程總包、電網自動化及工業(yè)控制、信息通信、繼電保護及柔性輸電、發(fā)電及水利環(huán)保、智能化電氣設備、非晶合金變壓器、電線電纜八大產業(yè)。信息通信板塊涵蓋了智能用電的整個產品鏈,從智能用電硬件設備的研發(fā)、制造、生產及用電信息采集系統(tǒng)軟件的技術開發(fā)、實施,到整個系統(tǒng)的維護與售后服務都有著完備的技術力量支撐,完全具備承擔采集系統(tǒng)整體運維工作的能力和資格。

      四、運維服務內容及費用核算

      從用電信息采集系統(tǒng)的運行性能、穩(wěn)定可靠性、在線狀態(tài)、業(yè)務管理三個方面實現(xiàn)對用電信息采集系統(tǒng)的運維管理,基本服務內容如下:

      l、服務內容

      服務內容的需求是多方面的,從服務能力來區(qū)分,可以分為基礎服務(包括工程服務、維護服務)、專業(yè)服務、運營咨詢服務等多個方面。

      (1)用戶現(xiàn)場技術人員值守

      可根據用戶的需求提供長期的用戶現(xiàn)場技術人員值守服務,保證系統(tǒng)的正常運轉?,F(xiàn)場值守的技術人員每天查看系統(tǒng)運行情況,進行整體系統(tǒng)性能評估,針對運行情況進行優(yōu)化并提出合理化建議。(2)現(xiàn)場巡檢服務

      現(xiàn)場巡檢服務是我公司對客戶的設備及網絡進行全面檢查的服務項目,通過該服務可使客戶獲得設備運行的第一手資料,最大可能地發(fā)現(xiàn)存在的隱患,保障系統(tǒng)穩(wěn)定運行。同時,我公司將有針對性地提出預警及解決建議,使客戶能夠提早預防,最大限度降低運營風險。(3)重要時刻專人值守服務

      我公司深刻知道保證重要時刻設備穩(wěn)定運行對客戶成功尤為關鍵,因此,我公司可對客戶提供重要時刻的專人現(xiàn)場值守支持,包括結算日或客戶認為可能對其業(yè)務運營產生重大影響的時刻。

      (4)系統(tǒng)運行分析與咨詢管理服務

      系統(tǒng)運行分析與咨詢管理服務是指我公司工程師通過對系統(tǒng)運行狀況、系統(tǒng)問題進行周期性檢查、分析后,為客戶提出指導性建議的一種綜合性服務。(5)技術培訓

      不定時對系統(tǒng)的使用進行現(xiàn)場培訓,提高客戶技術實力和專業(yè)水平。

      2、服務流程

      我公司采用的服務方式主要為兩種:一種為技術人員現(xiàn)場值守,另一種是定期巡檢結合故障現(xiàn)場服務。

      技術人員現(xiàn)場值守運行維護服務的基本操作流程如下圖所示:

      定期巡檢結合故障現(xiàn)場運行維護服務的基本操作流程如下圖所示:

      3、費用核算

      按照目前采集系統(tǒng)系統(tǒng)部署、終端類型、運行模式及地點分布,運維費用預算按進行核算,大致核算方式如下:

      第五篇:運維部兼任網管監(jiān)控中心管理崗位述職報告

      運維部兼任網管監(jiān)控中心管理崗位述職報告

      一、個人崗位主要職責

      主要工作職責: 協(xié)助楊主任做好運維部工作,兼任網管監(jiān)控中心管理工作;

      1、負責每日24小時網絡監(jiān)控;

      2、管理網管監(jiān)控中心日常生產工作;

      3、定期分析網絡運行質量及業(yè)務響應工作情況并進行考核;

      4、負責電路調度及考核工作;

      5、網間通信質量管理,協(xié)調處理有關互聯(lián)互通重大、疑難問題;

      6、網間業(yè)務碼號開放管理;

      7、組織落實交換專業(yè)的日常維護工作,制訂維護作業(yè)計劃;

      8、制訂交換專業(yè)應急調度預案,落實各項網絡安全措施,確保交換專業(yè)網絡的穩(wěn)定運行;

      9、負責交換專業(yè)的技術支撐工作,確保網絡安全運行。

      二、個人崗位量化指標

      (一)交換專業(yè)

      主要工作任務:

      1、加強網絡運行分析,合理優(yōu)化網絡,提高網絡運行質量;

      2、組織落實各類數據統(tǒng)計、報表上報工作。管控數據及標準:

      1、合理組織安排交換網絡調度;

      2、落實應急調度預案,降低障礙處理時間,確保S1/2類故障,處理時限應不超過4小時;

      3、省公司考核:交換方面,長途電話網網絡接通率≥97%;本地來話接通率≥98%;本地去話接通率≥97%;

      4、省公司考核:網間信令數據傳送準確率達到(來源于新世紀范本網)95%以上;

      5、報表上報及時率100%。

      (二)互聯(lián)互通

      主要工作: 進一步提高互聯(lián)互通網絡運行質量,協(xié)調處理網間不規(guī)范主叫和異常話務問題。

      1、負責協(xié)調處理本地網網間通信障礙;

      2、負責網間擴容改造協(xié)調(中繼增開、交換

      機擴容等);

      3、網間業(yè)務碼號開放管理。

      管控數據及標準: 根據管理局規(guī)定:要求網間話務傳送每小時不規(guī)范主叫次數不大于50次。

      1、一般障礙處理,處理溝通時限為24小時,如超時未解決或對方沒有對障礙原因進行書面回復時,上報省公司處理;

      2、重大事故后4小時內口頭上報省公司,24小時內做出簡要書面報告,事故處理結束后的5日內做出專題書面報告。

      3、在進行網間擴容改造時應視改造內容提前通知相關運營商,并做好網間應急預案;

      4、網間中繼擴容因符合信產部相關技術標準(公用電信網間互聯(lián)中繼電路擴容技術要求)。

      5、按省公司要求:每月5日前完成報表上報工作。

      6、根據碼號開放文件規(guī)定按時開放碼號。

      (三)網管監(jiān)控

      主要工作:

      1、組織電路故障處理、派發(fā)、指揮調度,收集故障分析報告。

      2、組織電路調度、測試、開通測試報告收集。

      3、根據市場部的要求提供資源滿足情況和投資需求。

      管控數據及標準:

      1、制訂并嚴格貫徹執(zhí)行各類管理制度;

      2、故障處理及時;

      3、分析認真,及時提交報告和報表;

      4、電路調度準確合理,開通及時;

      5、響應大客戶中心的方案和重保需求。

      三、上半年指標完成情況

      1、完成交換專業(yè)各項維護作業(yè)計劃,完成上半年網絡運行質量分析材料匯總上報。

      2、完成各交換設備擴容、局數據修改,日常故障處理工作,完成了省公司上半年的各項考核指標。

      3、定期進行本網固話用戶話務流量,IP電話業(yè)務流量分析,用戶模塊端口占用率分析,動態(tài)對全區(qū)模塊進行資源調度,提高了模塊端口占用率。

      4、分析完成了112用戶故障數據的統(tǒng)計工作,通過詳細的故障用戶數據分析,用戶故障類型統(tǒng)計,強化相關的故障處理流程,有效降低了故障歷時,減少了用戶的投訴數量。

      4、節(jié)前積

      極進行各交換設備巡檢、故障排查工作,消除了節(jié)日期間的故障隱患,定時對各局向話務進行采集分析,對話務量接近門限值的局向作動態(tài)跟蹤,及時通過增開電路來疏通話務。

      5、完成07年交換專業(yè)應急調度預案修訂及本地網互聯(lián)互通應急轉接預案制訂,確保了長途、本地網絡節(jié)日期間高效、穩(wěn)定的運行。

      6、制定實施技術方案5個,累計完成省公司各項報表92份,調單40項,反饋及時率99%。

      7、制訂完成本地網碼號升位方案和工作計劃,完善升位前相關信息的統(tǒng)計與采集分析,順利完成全省升位演練配合工作。

      8、加強了與各運營商的溝通,節(jié)前與其它運營商商討網間話務疏通應急預案,并及時對網間話務進行測算,對高話務量的網間中繼與對方進行積極的協(xié)調與溝通及時增開電路,確保了網間通信正常。

      9、配合完成中興第二關口局建設、本地調測及初驗,完成第二關口局設備交換組網方案制定,配合了網間傳輸第二路由構建協(xié)談。

      10、春節(jié)后對于電信攔截我方碼號的情況進行積極處理,及時加強相關的觀察與信令跟蹤,掌握證據,上報省公司電信封堵碼號情況表并提供撥測表,保持與電信進行不斷的溝通、協(xié)商、處理。

      11、退租了1條高港長江導航處聯(lián)通公司的2M電路,6條廣電2M電路以及1條電信16900互聯(lián)網電路,及時核實了我方資源,減少了租用資源,節(jié)約了公司運維成本。

      四、上半年管理工作主要成績

      協(xié)助主任工作,量化落實運維部思路,使各項管理規(guī)范化、制度化。

      1、在做好日常監(jiān)控管理、網絡優(yōu)化的基礎上,較好的完成了一季度的維護工作。

      2、認真履行中心的工作職責,盡一步完善了中心各項規(guī)章制度。

      3、加強了值班制度、交接班制度、機房管理制度的執(zhí)行,對違規(guī)行為適度進行考核。

      4、制定了機房衛(wèi)生值日制度并下發(fā)執(zhí)行。

      5、對倉庫物品整理歸類,各專業(yè)的備品備件、儀器儀表進行了整

      理,補全了各項臺帳。

      五、目前工作中存在的主要問題

      1、個人技術水平及管理水平有待進一步提高;

      2、中心的凝聚力和創(chuàng)新力還不夠高,急需提高整體隊伍的素質,加強人員的培訓,提高中心人員的維護水平以及障礙處理能力。

      六、下半年工作主要思路

      1、進一步提高語音網絡接通率;

      2、加強24小時網絡監(jiān)控工作;

      3、合理優(yōu)化現(xiàn)有網絡,提高現(xiàn)有網絡質量;

      4、加強網管監(jiān)控人員技術培訓。

      七、近期最重要的工作及工作思路

      1、做好全網號碼升位的準備工作,能順利完成本次升位任務;

      2、盤活資源,合理利用網絡資源;

      3、強化汛期24小時網絡監(jiān)控工作,保障全網網絡安全。

      下載智能化運維之IT系統(tǒng)統(tǒng)一監(jiān)控預研報告word格式文檔
      下載智能化運維之IT系統(tǒng)統(tǒng)一監(jiān)控預研報告.doc
      將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
      點此處下載文檔

      文檔為doc格式


      聲明:本文內容由互聯(lián)網用戶自發(fā)貢獻自行上傳,本網站不擁有所有權,未作人工編輯處理,也不承擔相關法律責任。如果您發(fā)現(xiàn)有涉嫌版權的內容,歡迎發(fā)送郵件至:645879355@qq.com 進行舉報,并提供相關證據,工作人員會在5個工作日內聯(lián)系你,一經查實,本站將立刻刪除涉嫌侵權內容。

      相關范文推薦