第一篇:Datastage學(xué)習(xí)總結(jié)
Datastage學(xué)習(xí)總結(jié) Datastage介紹
1.1 產(chǎn)品概述
DataStage企業(yè)版是Ascential Software公司所有企業(yè)整合系列產(chǎn)品中關(guān)鍵產(chǎn)品。企業(yè)版支持大容量數(shù)據(jù)的收集、整合和轉(zhuǎn)換,數(shù)據(jù)從簡單結(jié)構(gòu)到很復(fù)雜的結(jié)構(gòu)?;诟呖蓴U(kuò)展性的軟件架購,企業(yè)版使得企業(yè)能夠通過高性能來解決大部分業(yè)務(wù)問題,并行處理大容量數(shù)據(jù)。強(qiáng)大的企業(yè)元數(shù)據(jù)管理能力使得可以在數(shù)據(jù)整合生命周期中在所有工具中共享和使用工具。
DataStage企業(yè)版發(fā)布了四個核心功能來成功實(shí)施企業(yè)數(shù)據(jù)整合: 1)先進(jìn)的開發(fā)和簡單化的維護(hù); 2)企業(yè)級別的開發(fā)、監(jiān)測和管理;
3)在吞吐量和性能方面提供了無限制的高擴(kuò)展的體系架構(gòu); 4)端對端的企業(yè)級元數(shù)據(jù)管理。
DataStage企業(yè)版提供了全面的功能去最優(yōu)化用戶在建立、升級和管理數(shù)據(jù)整合架構(gòu)時的速度、靈活性和效率。DataStage企業(yè)版增強(qiáng)的功能減少了學(xué)習(xí)的周期、簡單化了管理和優(yōu)化了開發(fā)資源的使用,減少了數(shù)據(jù)整合應(yīng)用的開發(fā)和維護(hù)周期。結(jié)果,DataStage企業(yè)版使得企業(yè)能夠花更少的時間開發(fā)他們的整合應(yīng)用,更多的時間是不斷的從中受益。
1.2 基礎(chǔ)架構(gòu)
1.3 客戶檔介紹
用戶通過各個客戶端工具訪問DataStage企業(yè)版的開發(fā)、配置和維護(hù)功能。這些工具包括:
Designer:用來建立和編輯DataStage作業(yè)和表的定義。Designer中的“Job Sequencer”控制作業(yè)的執(zhí)行,其他作業(yè)成功完成(或失敗,等)的條件。
Administrator:用來執(zhí)行管理任務(wù),如建立DataStage用戶、建立和刪除工程并且建立清洗標(biāo)準(zhǔn)。
Manager:用來編輯管理用戶工程的DataStage資料庫。
Director:用來驗(yàn)證、時序安排、運(yùn)行和監(jiān)測企業(yè)版作業(yè)。日常操作
2.1 登錄客戶端
2.1.1 登錄Datastage Administrator 客戶機(jī)
點(diǎn)擊圖標(biāo)
選擇需要登錄的服務(wù)器,輸入用戶名,密碼登錄
進(jìn)去后點(diǎn)擊項(xiàng)目,可進(jìn)行項(xiàng)目增加,刪除,設(shè)置項(xiàng)目屬性
2.1.2 登錄DatastageDesigner客戶機(jī)
點(diǎn)擊圖標(biāo)
選擇需要登錄的域,輸入用戶名,密碼,選擇需要登錄的項(xiàng)目
登錄成功:
2.1.3 登錄DatastageDirector客戶機(jī)
點(diǎn)擊圖標(biāo)
選擇需要登錄的域,輸入用戶名,密碼,選擇需要登錄的項(xiàng)目
登錄成功:
2.2 啟停服務(wù)端
以dsadm用戶進(jìn)入,執(zhí)行以下命令:
1)Server啟動命令:$HOMEDIR/uv–admin-start 注意:啟動前,需要查看端口是否被釋放,通過‘netstat–afinet |grep ds’查看,如果有連接,則需要等待操作系統(tǒng)自動釋放后在啟動服務(wù)。
2)Server停止命令:$HOMEDIR/uv–admin /stop 注意:停止前最好確保沒有Client連接,可以通過‘onstat–a |grep ds’查看,是否還存在Client連接,否則要通知相應(yīng)登錄的client端徹底退出。
2.3 Job編譯
登錄Datastage Designer客戶機(jī),參見2.1.2,打開欲編譯的Job,具體Job編譯方法有兩種:
1)選擇菜單欄的【文件】->【編譯(M)】,快捷鍵為F7。2)點(diǎn)擊工具欄的編譯圖標(biāo)。
2.4 Job運(yùn)行
Datastage Job運(yùn)行有兩種方式:一種在Designer中,一種在Director中。1)登錄Designer客戶機(jī),打開欲運(yùn)行的Job,選擇菜單欄的【文件】->【運(yùn)行(R)】,快捷鍵為Ctrl+F5或者點(diǎn)擊工具欄的運(yùn)行圖標(biāo)。
2)登錄Director客戶機(jī),選中欲運(yùn)行的作業(yè),選擇菜單欄的【作業(yè)(J)】->【立即運(yùn)行(N)】,或者點(diǎn)擊工具欄的立即運(yùn)行圖標(biāo)。
2.5 監(jiān)視作業(yè)
登錄Director客戶機(jī),選中欲監(jiān)視的作業(yè),右鍵選擇【監(jiān)視】,可以查看作業(yè)的運(yùn)行情況。如下圖所示:
2.6 查看日志
登錄Director客戶機(jī),選中欲查看日志的作業(yè),右鍵選擇【查看日志】 出現(xiàn):
2.7 作業(yè)解鎖 2.7.1 方法1
如遇到斷網(wǎng)等一些情況可能導(dǎo)致作業(yè)被某一鎖定,從而無法對作業(yè)進(jìn)行修改。解鎖方法:
在瀏覽器輸入Server端IP地址跟端口,如http://128.192.140.5:9080, 出現(xiàn)如下界面:
輸入用戶名,密碼,登錄后選擇
【管理】->【會話管理】->【活動會話】,對那個被鎖定作業(yè)的會話,選擇【斷開鏈接】
2.7.2 方法2 用管理員用戶登錄DataStage Administrator 打開對應(yīng)PROJECT的【命令(M)】 執(zhí)行 LIST.READU 查看Locks 通過最后一列item id找到被鎖的對應(yīng)的作業(yè)名 執(zhí)行下面命令解鎖 UNLOCK USERUserno ALL 其中username 為LIST.READU 所列出的信息中對應(yīng)的Userno。
2.8 Job導(dǎo)入
登錄Designer客戶機(jī),選擇菜單欄的【導(dǎo)入(I)】->【Datastage組件(C)】,選擇所需導(dǎo)入的dsx文件,界面如下:
2.9 Job導(dǎo)出
登錄Designer客戶機(jī),導(dǎo)出Datastage Job有兩種方法:
(1)選擇菜單欄的【導(dǎo)出(X)】->【Datastage組件(C)】,界面如下:
點(diǎn)擊添加按鈕,選擇所需的導(dǎo)出的Datastage Job,在要導(dǎo)出的作業(yè)組件一般選擇“導(dǎo)出不帶可執(zhí)行文件的作業(yè)設(shè)計”,在導(dǎo)出到文件中選擇本地的保存路徑跟文件名。
(2)在所需導(dǎo)出的Job上右鍵單擊,在彈出菜單中選擇【導(dǎo)出(X)】,在如上界面中的導(dǎo)出到文件選擇本地的保存路徑跟文件名。
2.10 數(shù)據(jù)庫表定義導(dǎo)入datastage 登錄Designer客戶機(jī),選擇菜單欄的【導(dǎo)入(I)】->【表定義(T)】->【插件元數(shù)據(jù)定義(M)】
選擇表定義所在的數(shù)據(jù)庫,輸入用戶名,密碼
選擇【導(dǎo)入(I)】 Datastage配置
3.1 常見目錄說明
1)主機(jī)下發(fā)數(shù)據(jù)目錄:/appdata/DATA#DATE 2)Datastage轉(zhuǎn)碼生成公共數(shù)據(jù)集目錄:/appdata/DSDATA/$DATE/ 3)DataStage的配置目錄,/usr/datastage/InformationServer/Configurations,其下有其配置文件,可以設(shè)置運(yùn)行結(jié)點(diǎn)數(shù),Dataset數(shù)據(jù)文件目錄,Dataset日志文件目錄。{ node “node1”
{
fastname “T219N2V3” pools “" resource disk ”/appdata/DSDATA/DATASET“ {pools ”“} resourcescratchdisk ”/appdata/DSDATA/SCRATCH“ {pools ”“}
} node ”node2“
{ fastname ”T219N2V3“ pools ”“ resource disk ”/appdata/DSDATA/DATASET“ {pools ”“} resourcescratchdisk ”/appdata/DSDATA/SCRATCH“ {pools ”“}
} } Dataset數(shù)據(jù)文件目錄:resource disk ”/appdata/DSDATA/DATASET“ Dataset日志文件目錄:resourcescratchdisk ”/appdata/DSDATA/SCRATCH" 4)DataStage的引擎所在目錄,/usr/datastage/InformationServer/DSEngine,其下有bin,lib等,其中include里面有個dsapi.h很有用,定了很多錯誤,遇到錯誤,可以到文件里面找,不過這里只能找到常見錯誤,一些unexpected error無法在里面找到錯誤原因。
3.2 DataStage Administrator配置
登錄Administrator客戶機(jī),選擇【項(xiàng)目】標(biāo)簽,選擇要配置的project,在General->Enviroment?中
1.在General類型下:
? TMPDIR=XXX(將其指向一個相對較大的目錄,不填寫就是指缺省的/tmp目錄,此處需要討論)。
2.在Parallel類型下:
? APT_CONFIG_FILE,配置文件及其運(yùn)行節(jié)點(diǎn)數(shù),其配置文件為:/usr/datastage/InformationServer/Configurations/cissuat.apt,這里需要檢查一下指
向的內(nèi)容是否正確。具體詳見3.1中DataStage的配置目錄。
? APT_STRING_PADCHAR=(缺省值是0x0,我們需要填寫一個空格)3.在Parallel->Operator Specific類型下
? APT_COPY_TRANSFORM_OPERATOR設(shè)置為True,在做多結(jié)點(diǎn)運(yùn)行時需要設(shè)置。
4.在User Defined類型下:
? APT_IMPEXP_ALLOW_ZERO_LENGTH_FIXED_NULL設(shè)置為1。(如果目前數(shù)據(jù)統(tǒng)一為定長無分隔符,或者說不要設(shè)置定長的Null值,就不需要設(shè)置)。常用組件
4.1 Sequential file 功能特點(diǎn):適用于一般順序文件(定長或不定長),可識別文本文件或IBM大機(jī)ebcdic文件。使用要點(diǎn):
? 按照命名規(guī)范命名
? 點(diǎn)住文件,雙擊鼠標(biāo),在general說明此文件內(nèi)容,格式,存儲目錄等
? 修改文件屬性,文件名稱,reject方式等到
? 修改文件格式,比如記錄結(jié)束符是什么,字段分隔符,字符串是用什么區(qū)別等
? 輸入此文件字段內(nèi)容
4.2 Annotation 功能特點(diǎn):一般用于注釋,可利用其背景顏色在job中分顏色區(qū)別不同功能塊 使用要點(diǎn):
4.3 Change Capture Stage ? 功能特點(diǎn):Change Capture Stage有兩個輸入,分別標(biāo)記為before link 及 after link。輸出的數(shù)據(jù)表示before link和after link的區(qū)別,我們稱作change set。Change Capture Stage可以和Change Apply Stage配合使用來計算after set。
? key及value的說明
key值是比較的關(guān)鍵值,value是當(dāng)key值相同是作進(jìn)一步比較用的。? change mode選項(xiàng)說明:
All keys,Explicit Values
需要指定value,其余字段為key Explicit Keys&Values
key及value都需要指定
Explicit Keys,All Values
需要指定key,其余的字段為value ? 輸出策略說明
Drop Output For Copy
False:保留before及afte link中key值相同的行 True:刪除before及afte link中key值相同的行
Drop Output For Delete
False:保留before link中有但是after link中沒有的key
值所在的行
True:刪除before link中有但是afte link中沒有的key值所在的行 Drop Output For Edit
False:保留key值相同,value不同的行
True:刪除key值相同,value不同的行
Drop Output For Insert
False:保留before link中沒有但afte link中有的key值所
在的行
True:刪除before link中沒有但afte link中有的key值所在的行
4.4 Copy Stage ? 功能說明:Copy Stage可以有一個輸入,多個輸出。它可以在輸出時改變字段的順序,但是不能改變字段類型。
注意:當(dāng)只有一個輸入及一個輸出時最好將Force設(shè)置為True,這樣可以在Designer里看到運(yùn)行結(jié)束,否則將無法標(biāo)識運(yùn)行結(jié)束,但不會影響運(yùn)行結(jié)果數(shù)據(jù)。
4.5 Filter Stage ? 功能說明:Filter Stage只有一個輸入,可以有多個輸出。根據(jù)不同的篩選條件,可以將數(shù)據(jù)輸出到不同的output link。
4.6 Funnel Stage ? 功能說明:將多個字段相同的數(shù)據(jù)文件合并為一個單獨(dú)的文件輸出
? 合并策略說明
Continuous Funnel:從每一個input link中循環(huán)取一條記錄
Sort Funnel:按照Key值排序合并輸出
Sequence:先輸出第一個input link的數(shù)據(jù),輸出完畢后再輸出第二個input link的數(shù)據(jù),依此類推,直到結(jié)束。(此時可以通過調(diào)整link Ordering調(diào)整輸出順序)4.7 Tansformer Stage ? 功能說明:一個功能極為強(qiáng)大的Stage。有一個input link,多個output link,可以將字段進(jìn)行轉(zhuǎn)換,也可以通過條件來指定數(shù)據(jù)輸出到那個output link。在開發(fā)過程中可以使用拖拽。
? Constraint及Derivation的區(qū)別
Constraint通過限定條件使符合條件的數(shù)據(jù)輸出到這個output link。Derivation通過定義表達(dá)式來轉(zhuǎn)換字段值。
在Constraint及Derivation中可以使用Job parameters及Stage Variables。
? 注意:Transformer Stage功能強(qiáng)大,但在運(yùn)行過程中是以犧牲速度為代價的。在只有簡單的變換,拷貝等操作時,最好用Modify Stage,Copy Stage,F(xiàn)ilter Stage等來替換Transformer Stage。
4.8 Sort Stage 功能說明:只能有一個輸入及一個輸出,按照指定的Key值進(jìn)行排列??梢赃x擇升序還是降序,是否去除重復(fù)的數(shù)據(jù)等等。
? Option具體說明
Allow Duplicates:是否去除重復(fù)數(shù)據(jù)。為False時,只選取一條數(shù)據(jù),當(dāng)Stable Sort為True時,選取第一條數(shù)據(jù)。當(dāng)Sort Unility為UNIX時此選項(xiàng)無效。
Sort Utility:選擇排序時執(zhí)行應(yīng)用程序,可以選擇DataStage內(nèi)建的命令或者
Unix的Sort命令
Output Statistics:是否輸出排序統(tǒng)計信息到j(luò)ob日志
Stable Sort:是否對數(shù)據(jù)進(jìn)行二次整理
Create Cluster Key Change Column:是否為每條記錄創(chuàng)建一個新的字段:
clusterKeyChange。當(dāng)Sort Key Mode為Don’t Sort(Previously Sorted)或 Don’t Sort(Previously Grouped)時,對于第一條記錄該字段被設(shè)置為1,其余的記錄設(shè)置為0。
Create Key Change Column:是否為每一條記錄創(chuàng)建一個新的字段
KeyChange。
4.9 LookUp Stage ?
功能說明:LookUp Stage把數(shù)據(jù)讀入內(nèi)存執(zhí)行查詢操作,將匹配的字段輸出,或者在在符合條件的記錄中修改或加入新的字段。
4.10 Join Stage ? 功能說明:將多個表連接后輸出
4.11 LookUp Stage 和 Join Stage的區(qū)別
LookUp Stage將數(shù)據(jù)讀入到內(nèi)存中,所以效率很高,但是占用了較多的物理內(nèi)存。所以當(dāng)reference data比較小的時候,我們推薦用LookUp Stage;當(dāng)reference data比較大的時候,我們推薦用Join Stage。
4.12 Merge Stage ? 功能說明:將Merge Key值相同的記錄合并。將其中的一個輸入設(shè)定為Master,其余的為Update。把Update中Merge Key相同的記錄合并入Master。
4.13 Modify Stage ? 功能說明:Modify stage只能有一個輸入及一個輸出,它可以修改表結(jié)構(gòu):刪除,保留一個字段;給字段改名;修改字段的數(shù)據(jù)類型。
? Specification的具體用法:
刪除一個字段:DROP columnname[, columnname] 保留一個字段:
KEEP columnname[, columnname] 改變字段:new_columnname[:new_type] = [explicit_conversion_function]old_columnname
可用的explicit_conversion_function請參看《Parallel Job Developer’s Guide》page 28-7 4.14 Data Set Stage ? Stage類型:File stage
? 功能說明:從data set文件中讀取數(shù)據(jù)或者寫數(shù)據(jù)到data set文件中,一個Date Set Stage只能有一個輸入連接(input link)或者一個輸出連接(output link)。? 具體用法:包括Stage Page,Inputs Page,Outputs Page ? Stage Page通常描述了stage的一般信息,諸如名稱等;
? Inputs Page描述了即要寫入信息的data set文件的詳細(xì)信息; 主要是Properties和Column的定義
Properties中配置了文件的存放路徑和更新策略
Column詳細(xì)定義文件中的各個字段
? Outputs Page描述了讀取信息的data set文件的詳細(xì)信息;操作過程與Inputs Page類似。
4.15 File Set Stage ? Stage類型:File stage ? 功能說明:從file set文件中讀取數(shù)據(jù)或者寫數(shù)據(jù)到file set文件中,一個File Set Stage只能有一個輸入連接(input link)、一個輸出連接(output link)和一個拒絕連接(rejects link)。并且只能在并行模式下執(zhí)行。? 具體用法:
? Stage Page:對Stage的基本定義
? Inputs Page:主要是Properties和Format的配置 Properties的配置:定義文件的存取路徑及其他讀寫的相關(guān)的參數(shù)。特別要說明的是Options下的Reject Mode的選擇,當(dāng)stage有reject link的時候,必須選擇Output;沒有reject link時,可選擇其他兩個選項(xiàng)。
Format的配置:定義了數(shù)據(jù)寫到文件中的格式
? Outputs Page:對stage輸出的數(shù)據(jù)字段的描述,另外,reject link的輸出系統(tǒng)將默認(rèn),不需要用戶自己定義字段。
4.16 LookupFile Set Stage ? Stage類型:File stage ? 功能說明:為執(zhí)行查找操作而創(chuàng)建的參照文件。
作為查找的參照數(shù)據(jù),通常在參照數(shù)據(jù)比較大量或者重復(fù)使用率較高的情況下,將參照數(shù)據(jù)生成專門的Lookup File Set文件,以便提高查找的效率
? 具體用法:
? Stage Page ? Inputs Page:主要定義了查找關(guān)鍵字和存放路徑等主要信息 創(chuàng)建一個Lookup File Set文件:
? Outputs Page:當(dāng)作為參照數(shù)據(jù)進(jìn)行查找操作時,因?yàn)槲募且呀?jīng)生成好的,所以在這里不需要再做詳細(xì)的定義,只要引入即可。
4.17 OracleEnterprise Stage ? Stage類型:Database Stage ? 功能說明:從Oracle數(shù)據(jù)庫中讀取數(shù)據(jù)或者寫數(shù)據(jù)到Oracle數(shù)據(jù)庫中。通常完成的操作:
? ? ? ? ? ? 使用INSERT或UPDATWE命令更新數(shù)據(jù)庫表 裝入數(shù)據(jù)庫表 讀取數(shù)據(jù)庫表
從數(shù)據(jù)庫表中刪除行
在庫表中直接執(zhí)行查詢操作
將庫表裝入內(nèi)存,然后執(zhí)行查詢操作
? 具體用法:
? Inputs Page 向數(shù)據(jù)庫中寫數(shù)據(jù),關(guān)鍵是對Properties的配置
? Outputs Page:與Inputs Page類似,只是完成的是從數(shù)據(jù)庫中讀取數(shù)據(jù)。
4.18 Aggregator Stage ? Stage類型:Processing Stage
? 功能說明:將輸入的數(shù)據(jù)分組,計算各組數(shù)據(jù)的總和或者按組進(jìn)行其他的操作,最后將結(jié)果數(shù)據(jù)輸出到其他的stage。
? 具體用法:
? Stage Page:描述stage的一般信息以及字段的分組信息和選擇分組計算函數(shù)
? Inputs Page:詳細(xì)描述輸入數(shù)據(jù)信息,一般直接反映輸入數(shù)據(jù)字段信息 ? Oupputs Page:詳細(xì)描述輸出數(shù)據(jù)信息,即經(jīng)過分組計算后的數(shù)據(jù)字段信息
4.19 Remove Duplicates Stage ? Stage類型:Processing Stage ? 功能說明:輸入根據(jù)關(guān)鍵字分好類的有序數(shù)據(jù),去除所有記錄中關(guān)鍵字重復(fù)的記錄,通常與sort stage配合使用? 具體用法:
? Stage Page:Properties中的key值與之前sort stage的分類key值相同
? Inputs Page:對輸入數(shù)據(jù)字段的描述 ? Oupputs Page:對輸出數(shù)據(jù)字段的描述
4.20 Compress Stage ? Stage類型:Processing Stage ? 功能說明:將data set文件壓縮成二進(jìn)制文件(與expend datastage相對應(yīng))
? 具體用法:
? Stage Page
運(yùn)行結(jié)果
? Inputs Page:對輸入數(shù)據(jù)字段的描述 ? Oupputs Page:對輸出數(shù)據(jù)字段的描述
4.21 Expand Stage ? Stage類型:Processing Stage ? 功能說明:將壓縮的二進(jìn)制文件解壓縮(解壓縮compress stage生成的壓縮文
件)
? 具體用法:
? Stage Page
運(yùn)行結(jié)果:
? Inputs Page:對輸入數(shù)據(jù)字段的描述 ? Oupputs Page:對輸出數(shù)據(jù)字段的描述
4.22 DifferenceStage ? Stage類型:Processing Stage ? 功能說明:按字段比較兩個文件,找出不同的記錄。(兩個文件before和after,以before為準(zhǔn),與after文件中的記錄進(jìn)行比較,找出before在after文件中沒有或者有的記錄)? 具體用法:
? Stage Page
? 比較策略說明
Drop Output For Copy
False:保留before及afte link中key值相同的行
True:刪除before及afte link中key值相同的行
Drop Output For Delete
False:保留before link中有但是afte link中沒有的key值
所在的行
True:刪除before link中有但是afte link中沒有的key值所在的行 Drop Output For Edit
False:保留key值相同,value不同的行 True:刪除key值相同,value不同的行
Drop Output For Insert
False:保留before link中沒有但afte link中有的key值所
在的行
True:刪除before link中沒有但afte link中有的key值所在的行
調(diào)整before和after的順序:
? Inputs Page:對輸入數(shù)據(jù)字段的描述
? Oupputs Page:對輸出數(shù)據(jù)字段的描述
4.23 CompareStage ? Stage類型:Processing Stage ? 功能說明:按字段對比兩個已經(jīng)分類的有序的文件
? 具體用法:
? Stage Page ? Inputs Page:對輸入數(shù)據(jù)字段的描述 ? Oupputs Page:對輸出數(shù)據(jù)字段的描述
4.24 SwitchStage ? Stage類型:Processing Stage ? 功能說明:將文件按照一定的條件(一般為字段的值)分割成多個子文件。具體是將輸入的每一條記錄按照各自符合的條件(關(guān)鍵字的值)分配到不同的輸出(Switch Stage 有一個input link 和多個output link,一個 reject link,output link最多可達(dá)128個;此功能很類似與C函數(shù)中的switch函數(shù))。
? 具體用法:
? Stage Page 定義分配記錄的關(guān)鍵字及其值
? Inputs Page:對輸入數(shù)據(jù)字段的描述
? Oupputs Page:對輸出數(shù)據(jù)字段的描述,通過Mapping自定義各個輸出文件中的字段
4.25 Column ImportStage ? Stage類型:Restructure Stage ? 功能說明:將一個字段中的數(shù)據(jù)輸出到多個字段中。(也可以用這個stage完成分割單個字段數(shù)據(jù)到多個字段的目的,此時,輸入數(shù)據(jù)應(yīng)為定長或者有可以被識別的可分割的界限,必須是String或者Binary類型的,輸出數(shù)據(jù)可以是任何數(shù)據(jù)類型)
? 具體用法:
? Stage Page:關(guān)鍵是對Properties的配置
? Inputs Page:對輸入數(shù)據(jù)字段的描述
? Oupputs Page:對輸出數(shù)據(jù)字段的描述,在Column自定義輸出字段
? 經(jīng)過stage的前后數(shù)據(jù)的對比
字段分割后:
4.26 Column ExportStage ? Stage類型:Restructure Stage ? 功能說明:與Column ImportStage相反,將多個類型不同的字段合并成一個string或者binary類型的字段。
第二篇:DaTaStage入門學(xué)習(xí)心得
DataStage入門學(xué)習(xí)心得
DataStage是一個ETL的工具,就是對數(shù)據(jù)的抽取,轉(zhuǎn)換,加載。個人通俗的理解就是一個對數(shù)據(jù)進(jìn)行處理,提取的工具,這里面的數(shù)據(jù)大部分是以數(shù)據(jù)庫中表的格式存在著的,所以如果要使用這個工具,首先必須對關(guān)系數(shù)據(jù)庫的一些基本概念要有所了解,比如最基本的字段,鍵,記錄等概念。
DataStage是通過設(shè)計job來實(shí)現(xiàn)ETL的功能的。Job的設(shè)計跟普通的IDE設(shè)計一樣,通過拖拽控件,并填加腳本來完成。這里的控件稱為stage,每一個不同的stage都有不同的數(shù)據(jù)處理的功能,將各個stage通過一定的方式組合起來,設(shè)計成job,對job進(jìn)行編譯,運(yùn)行,就能夠?qū)崿F(xiàn)對數(shù)據(jù)抽取轉(zhuǎn)換加載。
因此,要設(shè)計job的關(guān)鍵,就在于能夠熟悉每個不同的stage并且能夠靈活運(yùn)用。在文檔和指導(dǎo)中有對每個控件的使用方法作了圖文并茂的說明,但是教材語言的一個缺點(diǎn)就是太過形式化,所以有些概念不能夠很好的理解。比如lookup這個stage我在看教材的時候就沒有太了解。所以,我就結(jié)合自己,用自己的語言對一些比較常用的stage說一下自己的理解和一些需要注意的地方。
在這么多的控件當(dāng)中,實(shí)際上平時要用到的只有為數(shù)不多的幾個:
Sequential File Stage:這個控件實(shí)際上是指代主機(jī)上面的一個文件,在它的屬性中可以選定文件的路徑,目錄。一般這些文件都是以類似數(shù)據(jù)庫表的格式存在的。使用這個控件關(guān)鍵的地方在于要設(shè)置好它的格式,包括column和format這兩個標(biāo)簽。Column指的是文件當(dāng)中的列定義,一般可以通過load列定義文件來確定。Format指的是文件當(dāng)中的一些分隔符,日期格式等等,在實(shí)際文件當(dāng)中字段和字段之間可以用逗號,豎線,等符號隔開,每個字段本身也可以選擇是否要用引號來引起來。所有這些,stage要設(shè)置成和文件一致,否則這個stage就無法真實(shí)的指代主機(jī)上面的文件。如果不知道文件的字段格式,可以登錄到unix主機(jī)下面去cat一下文件。一個驗(yàn)證的方法是在這個stage的屬性當(dāng)中選擇顯示數(shù)據(jù)view data,如果數(shù)據(jù)能夠正常顯示出來,那么就表示已經(jīng)設(shè)置成功了。
Transformer stage:這個控件是個功能強(qiáng)大的控件,在開發(fā)的時候最經(jīng)常用到。它有一個輸入,而可以有多個輸出。它最常用的也是最好用的功能就是對單個字段進(jìn)行處理和轉(zhuǎn)換?;旧舷雽蝹€字段做任何的操作都能夠做到。包括拼接,轉(zhuǎn)換,插入等等功能,需要自己在實(shí)際操作中熟悉。需要注意的地方是它的兩個附加的功能,stage的變量和constrait限制條件。正如程序設(shè)計一樣,在這個stage當(dāng)中可以定義一些變量,來實(shí)現(xiàn)一些特定的功能。比如,我們定義某個變量var1,把輸入的某個字段連到這個變量上面,然后,就可以根據(jù)輸入字段來定義該變量的值,再通過判斷該變量的值來設(shè)置輸出字段。而constraint一般都是用來限制輸出的,每個輸出都有一個constraint,一般都是在constraint中限制條件,當(dāng)滿足這個條件時,才進(jìn)行這個輸出。
Join Stage:這個控件顧名思義,其實(shí)就是類似數(shù)據(jù)庫當(dāng)中的連接操作。因此,兩個輸入,一個輸出。在stage屬性里面可以設(shè)置left,right,inner,outer等等。只要對數(shù)據(jù)庫的表連接操作了解,那么這個stage也就相應(yīng)了解了。
Filter Stage:這個控件有點(diǎn)類似數(shù)據(jù)庫sql語言中的where。一個輸入,可以把這個輸入理解為一張大表,在stage的屬性中可以設(shè)置條件字段。多個輸出,每個輸出就是select * from 大表 where 條件所產(chǎn)生的結(jié)果。
LookUp Stage:這個控件最初看文檔的時候,覺得說的不是很清楚。后來經(jīng)過動手實(shí)踐后,才能夠真正理解。這個stage有多個輸入,一個輸出。有一個輸入作為主輸入,其它的的輸入相當(dāng)于是參考輸入。主輸入中的某些字段要來參考輸入查詢,然后再將結(jié)果進(jìn)行輸出。實(shí)際上就是一個“查表”的過程。比如主輸入中有一個字段,如果值是a,到參考輸入表中去查表,發(fā)現(xiàn)參考輸入表中的a所對應(yīng)的值是1,那么輸出對應(yīng)的字段就應(yīng)該填1了。以此類推。這個控件在代碼標(biāo)準(zhǔn)化的時候用到。
Change Capture Stage:這個stage是用來處理全量增量的時候用到的,在目前似乎暫時還沒有用到。這個stage個人感覺是最困難的。其中的before link,after link。Key,value之間的關(guān)系比較混亂,需要在實(shí)踐中逐漸熟悉。
Annotation stage:注釋用的,放一塊方框,用來往里面寫注釋。
關(guān)于reject:剛剛接觸這個概念的時候,是比較難以理解的。因?yàn)檫@個好像是datastage自己所特有的概念。就我自己的理解來講,每個文件都是由若干條記錄組成的,而在這些記錄里面,有一些記錄是不符合規(guī)范的,比如說主鍵為空之類,或者某個字段不符合要求等等。這是時候,可以設(shè)定reject規(guī)則,把這些不符合規(guī)范的記錄挑出來送到一個文件里面。而其他符合要求繼續(xù)往下一步走,繼續(xù)進(jìn)行處理。
第三篇:DataStage(ETL)技術(shù)總結(jié)介紹篇
DataStage(ETL)技術(shù)總結(jié)--介紹篇(轉(zhuǎn)載)
數(shù)據(jù)整合的核心內(nèi)容是從數(shù)據(jù)源中抽取數(shù)據(jù),然后對這些數(shù)據(jù)進(jìn)行轉(zhuǎn)化,最終加載的目標(biāo)數(shù)據(jù)庫或者數(shù)據(jù)倉庫中去,這也就是我們通常所說的 ETL 過程(Extract,Transform, Load)。
IBM WebSphere DataStage(下面簡稱為DataStage)為整個 ETL 過程提供了一個圖形化的開發(fā)環(huán)境,它是一套專門對多種操作數(shù)據(jù)源的數(shù)據(jù)抽取、轉(zhuǎn)換和維護(hù)過程進(jìn)行簡化和自動化,并將其輸入數(shù)據(jù)集或數(shù)據(jù)倉庫的集成工具。
通常數(shù)據(jù)抽取工作分抽取、清洗、轉(zhuǎn)換、裝載幾個步驟:
抽取主要是針對各個業(yè)務(wù)系統(tǒng)及不同網(wǎng)點(diǎn)的分散數(shù)據(jù),充分理解數(shù)據(jù)定義后,規(guī)劃需要的數(shù)據(jù)源及數(shù)據(jù)定義,制定可操作的數(shù)據(jù)源,制定增量抽取的定義。
清洗主要是針對系統(tǒng)的各個環(huán)節(jié)可能出現(xiàn)的數(shù)據(jù)二義性、重復(fù)、不完整、違反業(yè)務(wù)規(guī)則等問題,允許通過試抽取,將有問題的紀(jì)錄先剔除出來,根據(jù)實(shí)際情況調(diào)整相應(yīng)的清洗操作。
轉(zhuǎn)換主要是針對數(shù)據(jù)倉庫建立的模型,通過一系列的轉(zhuǎn)換來實(shí)現(xiàn)將數(shù)據(jù)從業(yè)務(wù)模型到分析模型,通過內(nèi)建的庫函數(shù)、自定義腳本或其他的擴(kuò)展方式,實(shí)現(xiàn)了各種復(fù)雜的轉(zhuǎn)換,并且支持調(diào)試環(huán)境,清楚的監(jiān)控數(shù)據(jù)轉(zhuǎn)換的狀態(tài)。
裝載主要是將經(jīng)過轉(zhuǎn)換的數(shù)據(jù)裝載到數(shù)據(jù)倉庫里面,可以通過數(shù)據(jù)文件直接裝載或直連數(shù)據(jù)庫的方式來進(jìn)行數(shù)據(jù)裝載,可以充分體現(xiàn)高效性。在應(yīng)用的時候可以隨時調(diào)整數(shù)據(jù)抽取工作的運(yùn)行方式,可以靈活的集成到其他管理系統(tǒng)中。
一.?dāng)?shù)據(jù)源連接能力:
數(shù)據(jù)整合工具的數(shù)據(jù)源連接能力是非常重要的,這將直接決定它能夠應(yīng)用的范圍。DataStage 能夠直接連接非常多的數(shù)據(jù)源,包括:
1、文本文件
2、XML 文件
3、企業(yè)應(yīng)用程序,比如 SAP、PeopleSoft、Siebel、Oracle Application
4、幾乎所有的數(shù)據(jù)庫系統(tǒng),比如 DB2、Oracle、SQL Server、Sybase ASE/IQ、Teradata、Informix等以及可通過ODBC連接的數(shù)據(jù)庫
5、Web Services
6、SAS、WebSphere MQ
二.多國語言支持(NLS): DataStage能夠支持幾乎所有編碼,以及多種擴(kuò)展編碼(IBM、NEC、富士通、日立等),可以添加編碼的支持,DataStage內(nèi)部為UTF8編碼。
三.并行運(yùn)行能力: ETL Job的控件大多數(shù)都支持并行運(yùn)行,此外DataStage企業(yè)版還可以在多臺裝有DataStage Server的機(jī)器上并行執(zhí)行,這也是傳統(tǒng)的手工編碼方式難以做到的。這樣,DataStage就可以充分利用硬件資源。而且,當(dāng)你的硬件資源升級的時候也不用修改已經(jīng)開發(fā)好的ETL Job,只需要修改一個描述硬件資源的文件即可。并行執(zhí)行能力是DataStage所能處理數(shù)據(jù)的速度可以得到趨近于線性的擴(kuò)展,輕松處理大量數(shù)據(jù)。
四.便捷的開發(fā)環(huán)境: DataStage 的開發(fā)環(huán)境是基于 C/S 模式的,通過 DataStage Client 連接到DataStage Server 上進(jìn)行開發(fā)。這里有一點(diǎn)需要注意,DataStage Client 只能安裝在 Windows平臺上面(在Win2000/XP上運(yùn)行過)。而 DataStage Server 則支持多種平臺,比如 Windows、Solaris、Redhat Linux、AIX、HP-UNIX。(在WinXP/Solaris8上運(yùn)行過)DataStage Client 有四種客戶端工具。分別是 DataStage Administrator、DataStage Designer、DataStage Manager、DataStage Director。下面介紹這幾種客戶端工具在 DataStage 架構(gòu)中所處的位置以及它們?nèi)绾螀f(xié)同工作來開發(fā) ETL Job 的。(1)DataStage Administrator
DataStage Administrator 的主要功能有以下幾個: 1. 設(shè)置客戶端和服務(wù)器連接的最大時間。
以管理員的身份登陸 DataStage Administrator(默認(rèn)安裝下管理員為dsadm)。你可以設(shè)置客戶端和服務(wù)器的最大連接時間,默認(rèn)的最大連接時間是永不過期。最大連接時間的意思就是如果客戶端和服務(wù)器的連接時間超過了最大連接時間,那么客戶端和服務(wù)器之間的連接將被強(qiáng)行斷開。
2. 添加和刪除項(xiàng)目
在 Projects標(biāo)簽中,可以新建或者刪除項(xiàng)目,以及設(shè)置已有項(xiàng)目的屬性。要用 DataStage 進(jìn)行 ETL 的開發(fā),首先就要用 DataStage Administrator 新建一個項(xiàng)目,然后在這個項(xiàng)目里面進(jìn)行 ETL Job 的開發(fā)。
在Property里,能夠設(shè)置該P(yáng)roject全局設(shè)置、用戶權(quán)限以及License的管理
(2)DataStage Designer DataStage Designer是ETL Job開發(fā)的核心環(huán)境。值得注意的是,登陸DataStage Designer 的時候,不僅要指定DataStage Server 的IP或Server名,而且要指定連接到這個DataStage Server上的哪個項(xiàng)目上面,上面已經(jīng)提到DataStage的項(xiàng)目是由DataStage Administrator 來創(chuàng)建的。
DataStage Designer的主要功能可以概括為以下三個方面: 1. ETL Job的開發(fā)
DataStage Designer里面包含了DataStage為ETL開發(fā)已經(jīng)構(gòu)建好的組件, 主要分為兩種,一種是用來連接數(shù)據(jù)源的組件,另一種是用來做數(shù)據(jù)轉(zhuǎn)換的組件。此外DataStage還提供自定義函數(shù)(Basic),利用這些組件,開發(fā)人員可以通過圖形化的方式進(jìn)行ETL Job的開發(fā),此外ETL Job支持參數(shù)的傳遞。
2. ETL Job的編譯
開發(fā)好ETL Job后,可以直接在DataStage Designer里面進(jìn)行編譯。如果編譯不通過,編譯器會幫助開發(fā)人員定位到出錯的地方。
3. ETL Job的執(zhí)行
編譯成功后,ETL Job就可以執(zhí)行了,在DataStage Designer里面可以運(yùn)行ETL Job。ETL Job的運(yùn)行情況可以在DataStage Director中看到,這方面的內(nèi)容將在介紹DataStage Director的時候提到。
4.ETL Job的DEBUG ETL Job可以在Designer中設(shè)置斷點(diǎn),跟蹤監(jiān)視Job執(zhí)行時的中間變量。
5.ETL Job Report的生成
可以為ETL Job生成文檔報告,該報告非常詳細(xì),只通過該報告,就可以完全了解該Job的結(jié)構(gòu)與處理過程,非常便于分析。
DataStage提供很多實(shí)用的控件,常用的控件有: 1.DB操作控件
主要用于各種DB的連接,連接方式有多種,有面向廠家的Native方式,如Sybase的OpenClient方式,也有通用的ODBC等方式,此外也有些比較特別的DB操作控件,如Sybase的IQ Load、BCP控件,主要用于數(shù)據(jù)的快速導(dǎo)入和導(dǎo)出。
2.文件操作控件
常用的有Sequential File、Hashed File, Sequential File是可指定編碼形式和格式的CSV文件,Hashed File主要是為了加快檢索效率,而替代DB控件的一種比較好的選擇,這兩種控件可用于輸入或輸出。
3.處理控件
主要的處理空間有Transformer、Aggregator, Transformer是負(fù)責(zé)數(shù)據(jù)轉(zhuǎn)換的關(guān)鍵控件,在該控件中可以調(diào)用一些自定義函數(shù),Aggregator是用于統(tǒng)計的控件,非常類似于SQL中的 GROUP BY,也提供Count、Max、Min、Sum的統(tǒng)計操作,還支持如First、Last、Average等操作。
DataStage的ETL Job分類: 1.Server Job 最為常用的Job類型,Job可以組合使用,Server Job是Job的最小單位。
2.Job Sequence Job Sequence主要用于Job間的協(xié)作工作控制,如各Job的實(shí)行流程,出錯處理,文件監(jiān)控等。
3.Job Control Job Control是一種特殊的Server Job,這種Server Job不是通過Designer來設(shè)計的,而是直接通過DataStage內(nèi)嵌支持的Basic語言來開發(fā),因此方式更為靈活,完全可以利用Job Control替代Job Sequence,至少在出錯處理和Log輸出等方面要靈活很多。(我參與開發(fā)的一個項(xiàng)目中完全用Job Control替代了Job Sequence,做出了更為詳細(xì)的Log輸出)
(3)DataStage Manager DataStage Manager主要用來管理項(xiàng)目資源。一個項(xiàng)目可能包含多個ETL Job,可以用DataStage Manager把一個項(xiàng)目里面的ETL Job導(dǎo)出來。然后再用DataStage Manager導(dǎo)入到另外一個項(xiàng)目中去,利用這個功能一方面可以實(shí)現(xiàn)ETL Job的備份,另一方面就是可以在多個項(xiàng)目之間來重復(fù)使用開發(fā)好的ETL Job。在DataStage Manager里面可以把數(shù)據(jù)庫中的表結(jié)構(gòu)直接導(dǎo)入到項(xiàng)目中來,供這個項(xiàng)目中的所有ETL Job使用。DataStage Designer也提供了從數(shù)據(jù)庫中直接導(dǎo)入表結(jié)構(gòu)的功能。
(4)DataStage Director DataStage Director 主要有以下兩個功能: 1. 監(jiān)測ETL Job的運(yùn)行狀態(tài)
ETL Job在DataStage Designer中編譯好后,可以通過DataStage Director來運(yùn)行它。前面在介紹DataStage Designer的時候提到在DataStage Designer中也可以運(yùn)行ETL Job,但是如果要監(jiān)測ETL Job的運(yùn)行情況還是要登陸到DataStage Director中。在這里,你可以看到ETL Job運(yùn)行的詳細(xì)的日志文件,還可以查看一些統(tǒng)計數(shù)據(jù),比如ETL Job每秒所處理的數(shù)據(jù)量。
2. 設(shè)置何時運(yùn)行ETL Job ETL Job開發(fā)完成后,我們可能希望ETL Job在每天的某個時間都運(yùn)行一次。DataStage Director為這種需求提供了解決方案。在DataStage Director中可以設(shè)置在每天、每周或者每月的某個時間運(yùn)行ETL Job。(Windows平臺下需要打開的Task Scheduler服務(wù),此外,在Unix等平臺下,更常用的是用Cron結(jié)合dsjob命令來定時運(yùn)行ETL Job)
五.命令行形式的運(yùn)行: ETL Job支持在DataStage Server側(cè)用命令行形式的調(diào)用,可以用dsadmin命令來管理DataStage的Project,包括Project的新建,刪除以及一些環(huán)境變量的增刪(DataStage 7.5.1下未能通過dsadmin來設(shè)置全局NLS和一些項(xiàng)目屬性)。使用dsjob命令,能夠同步或非同步的運(yùn)行DataStage的Job,并傳遞需要的Job參數(shù),能夠檢查Job運(yùn)行的狀態(tài),并能恢復(fù)Job的運(yùn)行狀態(tài)。
六.DataStage的不足: 以上都是說DataStage優(yōu)點(diǎn),但實(shí)際上DataStage也有不少缺點(diǎn)和不足,這些不足點(diǎn),會直接影響到能否采用DataStage來達(dá)到我們的客戶或設(shè)計要求。下面就談一下,最近利用DataStage7.5.1來開發(fā)一個項(xiàng)目中遇到的問題。1.缺點(diǎn): 存在一個Bug,在利用DB控件的參照功能時,如果指定的SQL文有錯誤的話,那可能會直接造成DataStage出錯,然后客戶端會和服務(wù)端直接斷開,需要關(guān)閉客戶端,重新連接服務(wù)端,并且更為嚴(yán)重的是,DB連接將不會被釋放(可能是服務(wù)器端的執(zhí)行進(jìn)程并沒有停掉的緣故)
DataStage的表定義的使用,可以通過PlugIn的方式導(dǎo)入,但是導(dǎo)入后基本就只起一個模版的作用,當(dāng)表結(jié)構(gòu)發(fā)生改變而需要修改表定義時,使用該表定義的地方并不能同步,需要手動修改,容易出現(xiàn)遺漏。2.不足: 一些高級控件的功能不夠全面,在實(shí)際應(yīng)用時,會出現(xiàn)不能完全利用DataStage提供的控件來滿足要求,如:Sybase的BCP,DataStage的Sybase BCP控件只支持導(dǎo)出,無法支持導(dǎo)入。當(dāng)然這些不足,后來我都使用JAVA API來實(shí)現(xiàn)了Sybase BCP和Sybase IQ Load。錯誤處理功能不夠,DataStage對業(yè)務(wù)錯誤,如:檢索0件等錯誤,很難捕獲和處理。某些應(yīng)用要求無法滿足,如需要對DB某表的某數(shù)據(jù)進(jìn)行狀態(tài)監(jiān)視,這時,由于DataStage只有監(jiān)視文件的功能,DB訪問也只有DB控件才可以,因此該應(yīng)用最后也是用JAVA來實(shí)現(xiàn)。
第四篇:學(xué)習(xí)總結(jié)
學(xué)習(xí)總結(jié)
趙元蓮
“沒有學(xué)不會的學(xué)生,只有不會教的老師?!甭牭竭@句話我很痛心,也對當(dāng)前的教學(xué)方法進(jìn)行了反思,感覺到當(dāng)前的教學(xué)方法已經(jīng)滯后了,已經(jīng)不適應(yīng)當(dāng)代學(xué)生的需要。正愁找不到解決的方法時,有幸參加教育部組織的“國培計劃——農(nóng)村中小學(xué)教師遠(yuǎn)程培訓(xùn)項(xiàng)目”活動的地理學(xué)科的學(xué)習(xí),深感機(jī)會難得,盡自己最大的努力,抽出時間認(rèn)真地聆聽各位專家精彩的講評。通過這段時間的學(xué)習(xí),對我既有觀念上的洗禮,也有理論上的提高;既有知識上的積淀,也有教學(xué)技能的提高。
一、要讓學(xué)生學(xué)得會,就要創(chuàng)設(shè)恰當(dāng)?shù)慕虒W(xué)情景。深入細(xì)致地鉆研教材內(nèi)容、分析教學(xué)目標(biāo)、教點(diǎn),這是探索各種教法、學(xué)法,設(shè)計更合理的教學(xué)流程的前提。只有鉆研透教材;把靜態(tài)的教學(xué)目標(biāo)轉(zhuǎn)化為動態(tài)的教學(xué)目標(biāo);理清楚重點(diǎn)、難點(diǎn),才能選擇恰當(dāng)?shù)慕谭āW(xué)法,才能恰當(dāng)?shù)慕虒W(xué)情境。
二、地理是一門跨地域較廣的學(xué)科,這一特點(diǎn)很多知識比較抽象,學(xué)生學(xué)起來比較困難。用多媒體把相關(guān)的地圖、圖片呈現(xiàn)出來,再配合地理填充圖冊的使用,就可以使抽象知識形象化。另外,基于地理學(xué)科的這一特點(diǎn),還可以把大范圍的知識縮小化,例如:學(xué)習(xí)比例尺、圖例、注記后,讓學(xué)生畫學(xué)校的平面圖,學(xué)校的范圍稍大一些,學(xué)生測量時不太方便,就不認(rèn)真的完成,那么就縮小范圍,讓學(xué)生畫教室的平面圖或者在課桌上放一、二樣?xùn)|西后畫桌面的平面圖。
三、新教材內(nèi)容與舊教材內(nèi)容相比較,設(shè)置了很多的活動,這就要求老師和學(xué)生要動起來。而且是全方位的動包括眼、口、手、腦、身。這個動不僅要出現(xiàn)在課堂上,還要出現(xiàn)在課前準(zhǔn)備和課后的拓展中。尤其是在現(xiàn)實(shí)生活能完成的活動,一定要指導(dǎo)學(xué)生認(rèn)真完成。
四、俗話說“讀萬卷書,不如行千里路?!蔽覀円淖冋熳诮淌依飳W(xué)習(xí)書本知識,要帶領(lǐng)學(xué)生走入大自然中,進(jìn)行實(shí)地考查。
通過這次培訓(xùn),有了一個很好的開端,在今后的工作中,我要不斷地學(xué)習(xí),學(xué)以致用,把學(xué)到的知識方法運(yùn)用到課堂實(shí)踐中,并作到多學(xué)多思多改,不斷提高自己的課堂教學(xué)的理論和實(shí)踐水平。力爭做一名學(xué)生喜歡的地理老師。
第五篇:學(xué)習(xí)總結(jié)
學(xué)習(xí)馬俊欣情況簡要總結(jié)
馬俊欣是郟縣人民檢察院的一名普通檢察官,1987年臨近大學(xué)畢業(yè)時,意外受傷導(dǎo)致頸椎骨折,造成左側(cè)身體癱瘓。25年來,他面對身體的傷痛,克服平常人難以想象的困難,堅守工作崗位,以鍥而不舍的精神追求,兢兢業(yè)業(yè)、恪盡職守,履行了一名共產(chǎn)黨員、一名檢察官應(yīng)盡的職責(zé)。其事跡通過本報和其他媒體報道后,在社會上產(chǎn)生很大反響。
通過學(xué)習(xí)總結(jié)出:郟縣人民檢察院檢察官馬俊欣是個善于思考、善于總結(jié)、善于創(chuàng)新的人。他在檢察院多個部門工作過,各階段都有創(chuàng)新之舉
2007年,在他的建議下,郟縣人民檢察院在我市檢察系統(tǒng)率先成立案件管理中心。在評查案件中,他總結(jié)出檢委會委員評查點(diǎn)評卷宗的做法,創(chuàng)新成立了業(yè)務(wù)咨詢小組。任辦公室主任時,他總結(jié)推行了“周小結(jié)、月講評”制度。
這些創(chuàng)新之舉對規(guī)范執(zhí)法行為、維護(hù)公平和正義起到了積極的推動作用,得到了業(yè)內(nèi)和社會的認(rèn)可。其中,不少舉措被郟縣行政機(jī)關(guān)和全市檢察機(jī)關(guān)借鑒和推廣。
創(chuàng)新,簡言之就是走別人沒有走過的路,其難度不言而喻。
馬俊欣身有殘疾,能完成本職工作已屬不易,何況還要創(chuàng)新,這需要何等的精神和何等的動力。
這動力來源于要“做一個有用的人”的強(qiáng)烈愿望,他要加倍努力,回報社會;這動力來源于勤奮學(xué)習(xí),他喜歡看書,在知識的海洋里開闊了視野;這動力來源于實(shí)踐,他善于發(fā)現(xiàn)工作中存在的問題,然后想方設(shè)法找到解決問題、堵塞漏洞的辦法,以便更有效地推進(jìn)工作。向馬俊欣學(xué)習(xí),就是要學(xué)習(xí)他這種愛崗敬業(yè)、刻苦鉆研的精神,就是要學(xué)習(xí)他這種干一行、愛一行、專一行的品質(zhì),就是要學(xué)習(xí)他立足本職、勇于創(chuàng)新的干勁,在平凡的崗位上作出更大的成績。
在學(xué)習(xí)中,刑事審判庭的干警對馬俊欣的精神給予了很高的評價,并結(jié)合本職工作查找了自己的不足,表示通過學(xué)習(xí)馬俊欣的先進(jìn)事跡,要進(jìn)一步堅定理想信念,胸懷黨的事業(yè),心系百姓冷暖,以純潔的思想、優(yōu)良的作風(fēng)、嚴(yán)明的紀(jì)律,做到公平執(zhí)法,廉潔從檢,執(zhí)法為民,為我市社會穩(wěn)定和經(jīng)濟(jì)建設(shè)履行好審判職能。