第一篇:檔案數(shù)字化的意義與作用
檔案數(shù)字化的意義與作用
檔案數(shù)字化是隨著計算機技術(shù)、掃描技術(shù)、OCR技術(shù)、數(shù)字攝影技術(shù)(錄音、錄像)、數(shù)據(jù)庫技術(shù)、多媒體技術(shù)、存儲技術(shù)的發(fā)展而產(chǎn)生的一種新型檔案信息形態(tài),它把各種載體的檔案資源轉(zhuǎn)化為數(shù)字化的檔案信息,以數(shù)字化的形式存儲,網(wǎng)絡(luò)化的形式互相連接,利用計算機系統(tǒng)進行管理,形成一個有序結(jié)構(gòu)的檔案信息庫,及時提供利用,實現(xiàn)資源共享。
檔案數(shù)字化是數(shù)字檔案建設(shè)最基礎(chǔ)的工作,傳統(tǒng)載體的檔案經(jīng)高科技技術(shù)加工成數(shù)字檔案形式,通過局域網(wǎng)、政務(wù)網(wǎng)、互聯(lián)網(wǎng)進行計算機檢索、閱讀電子檔案,為迎接檔案信息服務(wù)新環(huán)境的挑戰(zhàn),提高管理水平、提高效率,增強檔案業(yè)務(wù)部門的服務(wù)水平,為檔案內(nèi)部管理及面向客戶服務(wù)提供高效率的全面服務(wù)。
檔案工作的數(shù)字化建設(shè)是順應(yīng)潮流、適應(yīng)時代發(fā)展的新舉措、新要求。檔案作為一種原生信息資源,其重要性正日益凸顯出來,逐步掌握信息技術(shù)為檔案工作服務(wù),為社會主義經(jīng)濟建設(shè)服務(wù),為社會主義精神文明建設(shè)服務(wù)。
檔案數(shù)字化較之傳統(tǒng)檔案管理有不可替代的先進性:
一、提高經(jīng)濟效益
過去一直使用粗放型模式即以增加辦公人員和辦公費用為解決這一難題的唯一手段,致使管理成本大幅上漲。而數(shù)字化管理檔案使傳統(tǒng)的以紙質(zhì)為載體的檔案信息對象轉(zhuǎn)為機讀檔案,不僅節(jié)約了保管費用,節(jié)省了占地空間,而且查閱起來極為方便迅速,從而避免了反復印制資料而造成的紙張和人員的浪費。
二、提高辦公效率
數(shù)字化檔案管理使資料能及時歸檔,并盡快提供利用。以組織部門為例,干部的任用、干部的提拔都需要詳細準確的檔案信息。然而檔案數(shù)字化管理變可提供詳細、即時的數(shù)據(jù)信息,為領(lǐng)導決策提供服務(wù)。與此同時,數(shù)字化檔案管理使查詢資料變得非常簡單,真正讓辦公人員做到足不出戶便可知曉天下大事。由于信息的超時空流動,數(shù)字化檔案事實上成為“無墻界檔案”,檔案庫也從文件實體的保管基本變成了提供利用方便的信息控制中心。
三、增強檔案原件保護
將紙制檔案轉(zhuǎn)變?yōu)閿?shù)字化電子檔案后,檔案的使用更加安全。由其對歷史久遠的檔案材料,數(shù)字化處理后無疑是對其更好的保護,另外,通過檔案的數(shù)字化處理后,防止了部分檔案篡改的行為。
第二篇:檔案數(shù)字化的意義
檔案數(shù)字化的意義
檔案信息資源是全球、國家、區(qū)域信息的一個重要組成部分。在當今信息公開程度越來越高的形勢下,檔案的文化性質(zhì)和社會性質(zhì)逐步強化,利用的范圍和對象將逐步擴大。在這個信息時代,只有當檔案信息資源在社會主義現(xiàn)代化建設(shè)中發(fā)揮重要作用時,檔案和檔案工作的意義和價值才能充分地全面地展現(xiàn)出來。因此,我們要按照有關(guān)規(guī)定千方百計將呆滯在庫房中的檔案歷史信息變成現(xiàn)實有用信息。作為管理和擁有檔案信息資源的檔案局,要更好地適應(yīng)形勢發(fā)展的要求,要著眼未來,運用數(shù)字化、信息化技術(shù),對檔案進行數(shù)字化建設(shè),更好地為四個現(xiàn)代化服務(wù)。
一、檔案數(shù)字化的意義
1、檔案數(shù)字化的含義
檔案數(shù)字化是指利用計算機技術(shù)、掃描技術(shù)、OCR技術(shù)、數(shù)字攝影(錄音、錄像)技術(shù)、數(shù)據(jù)庫技術(shù)、多媒體技術(shù)、存儲技術(shù)等高新技術(shù)把各種載體的檔案資源轉(zhuǎn)化為數(shù)字化的檔案信息。其以數(shù)字化的形式存儲、網(wǎng)絡(luò)化的形式互相聯(lián)結(jié),利用計算機系統(tǒng)進行管理,形成一個有序結(jié)構(gòu)的檔案信息庫,及時提供利用,實現(xiàn)資源共享,是檔案信息化建設(shè)的重要組成內(nèi)容。目前,大多數(shù)檔案館保存的檔案信息形態(tài)主要以紙質(zhì)、縮微膠片和底片等載體形式存在,只適應(yīng)于傳統(tǒng)的管理與傳播方式,即實施手工管理和點到點的傳播,即便是經(jīng)過編研等初步加工,編輯印發(fā)檔案資料,實現(xiàn)點到面的傳播,其覆蓋面也還是太小,很難跟上社會化的進程。同時,該檔案信息資源的經(jīng)濟價值和社會價值也難以充分實現(xiàn),更難適應(yīng)當代“數(shù)字化生存”的形勢。檔案原件數(shù)字化,對檔案信息的現(xiàn)代化管理、使用和傳播等都具有十分重要的作用。
2、檔案數(shù)字化的主要內(nèi)容
①檔案目錄信息的數(shù)字化,建立檔案目錄數(shù)據(jù)庫;
②載體檔案的數(shù)字化,如紙質(zhì)檔案、檔案縮微品、照片檔案及錄音錄像檔案等的數(shù)字化,建立檔案影像數(shù)據(jù)庫或多媒體數(shù)據(jù)庫; ③檔案專題信息的采集與建庫。
3、檔案數(shù)字化的主要作用
①檔案數(shù)字化是檔案信息化建設(shè)重要內(nèi)容,而檔案信息化建設(shè)的核心是資源建設(shè)。資源建設(shè)包括兩大任務(wù):一是現(xiàn)有館藏檔案的目錄數(shù)據(jù)庫建設(shè)和館藏重要檔案和照片、錄音、錄像檔案的數(shù)字化;二是電子文件歸檔與電子檔案管理。
②檔案數(shù)字化能有效地保護檔案原件。⑴ 代替原件使用,保護檔案原件;⑵ 數(shù)字化副本異地保存,輸出縮微膠片供永久保存。這樣可使這些檔案資料在出現(xiàn)天災人禍的情況下不致于遭到毀滅性的破壞;⑶ 恢復檔案材料模糊褪變的字跡及對污損殘缺照片檔案的修復。③檔案數(shù)字化能改善檔案的利用方式。⑴不再受“孤本”的限制,一份文件可以同時提供給所有需要它的人共享;⑵數(shù)字影像文件可以通過計算機局域網(wǎng)或者廣域網(wǎng)進行異地傳輸,使異地調(diào)閱利用成為可能。擴大了檔案的利用空間,讓更多的人們來了解檔案,利用檔案;⑶“時間”不再是限制,利用者可以隨時使用自己需要的文件。檔案數(shù)字化以后,將已開放的檔案上網(wǎng),這樣所有利用者就可以在任何時間上網(wǎng)利用檔案信息資源。
④檔案數(shù)字化能充實各檔案館網(wǎng)站的內(nèi)容。對我國大多數(shù)已上網(wǎng)的檔案館網(wǎng)站來說,普遍存在網(wǎng)上信息資源貧乏、簡薄的通病,信息加工深度不夠,指引性信息多,實質(zhì)性信息少。要改變這種尷尬的局面,只有盡快將豐富的館藏信息化和數(shù)字化。
⑤檔案數(shù)字化是傳統(tǒng)檔案館走向數(shù)字檔案館的必經(jīng)之路。數(shù)字檔案館無疑是21世紀各級各類檔案館的發(fā)展方向。盡管當前它的具體組成結(jié)構(gòu)、組織管理模式還處于探索之中,可其“館藏”的數(shù)字化特征是肯定的,傳統(tǒng)檔案的數(shù)字化將是其“館藏”的重要組成部分。
二、對檔案數(shù)字化的思考
將大量的檔案數(shù)字化,這是一個龐大的系統(tǒng)工程。首先要做好館藏情況的調(diào)查,包括檔案的類型、載體形態(tài)與狀態(tài)、館藏數(shù)量、檔案信息利用等基本情況。根據(jù)館藏情況制訂檔案數(shù)字化的科學規(guī)劃,其包括掃描儀等硬件的購置計劃和數(shù)字化處理規(guī)劃。檔案數(shù)字化要經(jīng)過一個較長的過程,硬件的購置不可能一步到位,也不需要一步到位,應(yīng)從實際和長遠打算,保證掃描儀等硬件設(shè)施的成龍配套,使其具有較強的支撐能力和擴展能力。檔案數(shù)字化實施處理規(guī)劃應(yīng)貫徹“突出重點,分步進行”的原則,對館藏重點和利用率高的檔案先行數(shù)字化,早日滿足大多數(shù)利用者的需求。
檔案數(shù)字化必須有所選擇。針對館藏“浩瀚”的檔案資源,不加選擇地全部數(shù)字化是不可能的、也是沒必要的。我們應(yīng)該根據(jù)精煉、存史和利用優(yōu)先原則對館藏檔案進行分類,確定哪些館藏檔案原件應(yīng)該數(shù)字化、哪些不需要數(shù)字化以及哪些優(yōu)先數(shù)字化。在實際工作當中,我們采用“珍貴檔案、重點檔案、特色檔案、利用率高的檔案”優(yōu)先數(shù)字化,力爭使數(shù)字化的檔案信息成為高價值、高利用率、有序、標準、有特色的信息資源。
做好數(shù)字化時掃描參數(shù)的優(yōu)化設(shè)置。掃描系統(tǒng)掃描參數(shù)的選擇和確定對掃描數(shù)字影像質(zhì)量有著較大影響,其中掃描分辨率直接關(guān)系到掃描文件的清晰度和還原效果。掃描分辨率越高得到的掃描文件就越清晰,其相應(yīng)的掃描時間和存儲空間就要增加;而分辨率參數(shù)越低,掃描文件的質(zhì)量就要降低。我們在選擇分辨率時應(yīng)根據(jù)實際需要綜合考慮,包括掃描文件的可閱讀性、存儲空間、輸出打印質(zhì)量等。做好檔案數(shù)字化的全程控制。在檔案數(shù)字化過程中,要注重全面的質(zhì)量檢查,加強數(shù)據(jù)的質(zhì)量控制。質(zhì)量檢查應(yīng)包括以下幾方面:A、數(shù)字化前的檔案整理檢查。要進行數(shù)字化的檔案原件必須完整、排序正確,對折損嚴重影響掃描質(zhì)量的原件應(yīng)預先修整。B、數(shù)字化后的數(shù)據(jù)質(zhì)量、圖像質(zhì)量檢查。掃描后的文件圖像應(yīng)保持檔案的原貌,字跡清楚不失真,幅面擺放正確,亮度適當,既沒丟失信息,又無增加信息,無錯掃、漏掃,對文件圖像質(zhì)量有問題的應(yīng)重新掃描;采集錄入數(shù)據(jù)要豐富、準確。C、數(shù)據(jù)聯(lián)接檢查。通過機讀目錄數(shù)據(jù)庫與已掃描的檔案掃描圖像文件進行聯(lián)接,形成一一對應(yīng)。
三、開展檔案數(shù)字化問題的研究,及時解決數(shù)字化進程中的疑難問題。檔案數(shù)字化是檔案工作中的一項新內(nèi)容,不可避免地會遇到一些新情況、新問題。比如,數(shù)字化檔案信息壓縮及存儲的關(guān)鍵技術(shù)問題;數(shù)字化檔案信息安全、保密技術(shù)問題;數(shù)字化檔案信息的訪問形式與安全控制問題;數(shù)字化檔案信息知識產(chǎn)權(quán)問題;數(shù)字化檔案信息的法律地位問題。針對這些新情況、新問題,應(yīng)在抓檔案原件數(shù)字化工作的同時,組織力量開展檔案數(shù)字化問題的研究,及時解決工作中的一些技術(shù)性問題,同時澄清和統(tǒng)一思想認識,確保檔案數(shù)字化工作的順利開展。
另外,必須加強檔案數(shù)字化和數(shù)字化檔案信息管理人才的培養(yǎng)。檔案數(shù)字化及數(shù)字化檔案信息管理,涉及到計算機軟硬件與掃描技術(shù)、數(shù)字影像處理技術(shù)、存儲技術(shù)和檔案管理的基礎(chǔ)知識,絕不是只懂得計算機技術(shù)或只懂得紙質(zhì)等載體檔案管理知識的人所能勝任的,所以應(yīng)加強這方面技術(shù)人員的培養(yǎng)。
第三篇:檔案數(shù)字化流程與規(guī)范
檔案數(shù)字化流程與規(guī)范
一、檔案接收
檔案接收概述:
檔案接收是數(shù)字化加工流程的第一步。為了保證檔案接收過程中,檔案數(shù)目無誤,檔案實體的安全,接收時要對檔案資料進行詳細登記,建立電子/紙質(zhì)接收登記和入庫登記本,不出現(xiàn)漏登記或重復登記,記錄資料的缺、殘、漏、損、重、頁碼混亂等狀況,對所接收的檔案資料進行兩人以上交叉核對、檢查,與客戶進行書面交接并簽字確認。
實體記錄:檔案的物理位置(庫排架位置)、檔案的數(shù)量,檔案年代、全宗號、案卷號、目錄號、檔號、存放箱號等信息。
針對接收檔案形成檔案管理臺賬,保持檔案的完整性。
準備檔案箱,按批次接收檔案,并填寫記錄清單,雙方簽字確認。質(zhì)量管理措施:根據(jù)用戶的電子或紙質(zhì)的檔案目錄清單與我方的下架接收清單進行比對。如發(fā)現(xiàn)有誤,打印出勘誤表由客戶簽字確認。
接收客戶檔案的電子目錄文件、光盤等。
二、檔案整理
檔案整理概述:
在圖像掃描數(shù)字化加工之前,根據(jù)檔案管理情況,按下述步驟對檔案進行基本整理,包括盒內(nèi)文件排序、標盒流水號、記錄檔案物理狀況、拆除裝訂物,編寫頁碼、做好前期基本整理工作,確保檔案數(shù)字化加工質(zhì)量。
檔案整理流程:
1.對每盒檔案的文件順序按照統(tǒng)一的規(guī)則進行排列,具體的排列順序由本單位客戶提供標準;
2.盒內(nèi)文件順序排列好后,對每頁檔案進行編頁,一盒一個大流水號,采用2B鉛筆統(tǒng)一編在檔案的右上角,背面有字的編在頁面的左上角;
3.檔案拆裝:根據(jù)采購方的檔案分類對檔案進行起訂、去除金屬裝訂物,排序的工作,核對檔案的資料順序和記錄檔案的物理狀況(紙張狀況、照片頁、圖表頁),包括資料的缺、殘、漏、損、重、頁碼混亂等狀況,建立電子/紙質(zhì)檔案資料分類接收清單和出庫登記本,拆訂整理好的檔案用夾子夾起,以防錯亂,裝訂的標準是左對齊、下對齊。
4.檔案修復:有破損的地方在備考表中注明,對于卷邊或邊緣破損嚴重的檔案、過于窄小的文件頁,用宣紙在檔案四周加邊或接邊,并按照裱補原則,先加長邊,后加短邊;對于多份文件粘連得情況,采用干揭法小心揭開;對于粘連嚴重、無法分開的則登記,不在分開。
5.對于裝訂成冊、不便拆裝的文件,可直接采用專業(yè)的PS7000不拆卷掃描儀直接掃描。這樣即可以保證不拆除檔案文件,又可以保證圖像的清晰與完整。
6.對整理完成的文件進行詳細登記,形成“檔案整理記錄清單”,提交客戶,以備查驗。7.檔案整理清單表單(整理人、、盒號、卷數(shù)、件數(shù)、頁數(shù)、破損情況、備注)
三、目錄著錄(案卷目錄、卷內(nèi)目錄)
傳統(tǒng)組卷目錄著錄分為:案卷目錄與卷內(nèi)目錄。簡化組卷目錄著錄分為:卷內(nèi)目錄 案卷目錄與卷內(nèi)目錄簡述:
案卷目錄:要體現(xiàn)出本案卷內(nèi)所有文件的主題,也就是概括本案卷內(nèi)所有文件的中心思想。
卷內(nèi)目錄:與案卷目錄不同,卷內(nèi)目錄要反映的內(nèi)容是每一件的文件
主題。著錄項目: 案卷目錄:、檔號、全宗號、目錄號、案卷題名、起止日期、頁數(shù)、件數(shù)、等字段
卷內(nèi)目錄:、全宗號、目錄號、檔號、件號、文號、文件題名、文件日期、頁數(shù)、等字段
著錄軟件:著錄軟件著錄方式為兩錄一校。(即兩個人著錄同樣的數(shù)據(jù),校對時用軟件對比兩個人的數(shù)據(jù)是否一致)
兩錄一校(著錄軟件): 由于檔案的數(shù)量較多,導致檔案目錄也不斷增加。為了防止在檔案錄入后生成的電子目錄數(shù)據(jù)庫中數(shù)據(jù)出現(xiàn)不必要的錯誤或不規(guī)范,利用我公司兩錄一校目錄錄入質(zhì)量管理軟件,對檔案錄入進行準確性的質(zhì)檢。即兩個人著錄同一內(nèi)容的目錄,由軟件進行自動對比,如有錯誤自動返紅顯示,第三個人與原檔案文件對照進行更改。
四、檔案掃描規(guī)范及分工
(1).操作掃描儀人員:
1.檔案掃描:文書檔案采用200分辨率、照片檔案使用600分辨率進行掃描(分辨率也稱DPI),掃描圖像分為彩色儲格式為:JPEG。
2.圖紙掃描:主要分為工程與基建圖紙,掃描圖紙有兩種方式:
a.利用專業(yè)的寬幅圖紙掃描儀對需要掃描的圖紙進行加工。
b.利用普通掃描儀對需要掃描的圖紙進行多頁掃描,在圖像處理時將多頁圖像拼接,還原為原圖紙樣式。
3.圖像掃描文件夾建立方式從根目錄開始依次為:全宗號-、期限、件號。在件號的文件夾內(nèi)保存該件每一頁的掃描圖像。圖像與件號命名:不足5位前面用0補齊,如圖像:00001.jpg、件號:00001。
注意事項:
1.掃描完成后的圖像應(yīng)避免出現(xiàn)掃缺、漏掃、掃重等情況。2.掃描時要將文件放端正、壓平再掃。
3.掃描時適時掌握掀蓋、放紙、拿紙等流程,防止掀蓋過早造成文件掃缺。
4.掃描尺寸分為A4、A3兩種形式,如特殊紙張超出A4掃描范圍,可用A3尺寸進行掃描。
5.掃描時仔細對應(yīng)文件頁碼編排順序,如發(fā)現(xiàn)編錯頁、編漏頁等情況,及時交給整改人員進行修改。
6.掃描完成后的電子圖像要放在與檔案實體檔號相對應(yīng)的文件夾內(nèi)進行存儲,文件夾內(nèi)的圖像絕不能有“張冠李戴”的現(xiàn)象產(chǎn)生。
(2)圖像處理人員: 圖像處理概述:圖像處理主要是針對掃描完成后的電子圖像進行加工處理,利用圖像處理軟件可對掃描后的電子圖像進行旋轉(zhuǎn)、糾斜、剪邊、裁切、去躁等處理,還具有局部加粗、減淡等功能,處理完成后的圖像要求居中、清晰、端正,無其它干擾信息。
1.圖像處理時要求保留頁面全部內(nèi)容(包括頁面內(nèi)容與頁碼)。2.每一頁圖像都需要旋轉(zhuǎn)為正常閱讀視角。
3.對角度傾斜的圖像進行糾斜,糾正后即可進行下一步操作(不能影響圖像清晰度)。對角度傾斜且需要旋轉(zhuǎn)的圖像進行操作時,要先糾斜后旋轉(zhuǎn)。4.圖像周圍不能有過多的白邊,如果白邊過多影響美觀必須進行裁取為合適的頁面大小,如A4大小就得按A4大小的比例進行裁取。
5.彩色圖像處理時如遇圖像邊緣有字,字比較貼邊,要留出(1~2)毫米白邊(如圖像邊緣無字,則不需留邊)。
6.圖像的大小(像素)要基本一致。
(3)圖像質(zhì)檢人員(可讓掛接人員用時進行)
經(jīng)過掃描、圖像處理后的電子圖像,質(zhì)檢員就可以進行圖像終檢,圖像終檢是圖像掃描與圖像處理最終的一次質(zhì)量檢驗,也是特別精細的一道工序。要做一名優(yōu)秀的質(zhì)檢員必須具備過硬的專業(yè)知識、豐富的實際操作經(jīng)驗、較強的責任心才能把質(zhì)檢工作做好。圖像終檢方法:利用ACDSee 及柯達映像軟件對處理完成的圖像進行逐頁質(zhì)檢,該工序主要針對圖像處理后的數(shù)據(jù)進行核對、質(zhì)檢,終檢主要對圖像處理后的電子圖像進行質(zhì)量檢查,(包括圖像是否清晰、版面是否居中、是否傾斜、是否扭曲、是否完整等),如遇不合格圖像要返回到處理人員手中進行返工處理(并詳細記錄錯誤率),返工完成后質(zhì)檢人員要對返工后的圖像進行再次質(zhì)檢,直到該圖像合格為止。
(4)掛接人員(終檢)掛接:將錄入完成的成品目錄導入到數(shù)據(jù)庫中,通過數(shù)據(jù)掛接軟件或其他工具將其與質(zhì)檢完成的掃描圖像進行掛接,來實現(xiàn)目錄與圖像的一一對應(yīng)關(guān)系。以方便各單位、各部門通過檔案管理系統(tǒng)對加工檔案進行正確、快速的查詢與檢索。
終檢:在掛接的同時核對掃描的頁數(shù)與目錄頁數(shù)與文件的目錄是否一致,如不一致需對與原件進行校對并修改。
五、刻盤
將最終掛入前的掃描圖像的目錄及圖像一起刻入光盤。
第四篇:檔案數(shù)字化方案制定與實施
關(guān)于檔案數(shù)字化的實踐與思考
當前,我國信息化發(fā)展戰(zhàn)略的實施,電子政務(wù)的推進,為我國檔案事業(yè)發(fā)展提供了難得的機遇。加強檔案信息化建設(shè)是檔案事業(yè)適應(yīng)時代和社會發(fā)展的必然選擇,是加速檔案管理現(xiàn)代化的客觀要求,是提高檔案服務(wù)水平的必由之路,勢在必行。對此,作為管理和擁有大量產(chǎn)權(quán)產(chǎn)籍信息資源的房產(chǎn)檔案部門,為更好地適應(yīng)形勢發(fā)展的要求,我們著眼未來,運用數(shù)字化、信息化技術(shù),對檔案數(shù)字化進行了有益的實踐與探索。
一、檔案數(shù)字化的意義
1、檔案數(shù)字化的含義
檔案數(shù)字化是指利用計算機技術(shù)、掃描技術(shù)、數(shù)字成像技術(shù)、數(shù)據(jù)庫技術(shù)、多媒體技術(shù)、存儲技術(shù)等高新技術(shù)把各種載體的檔案資源轉(zhuǎn)化為數(shù)字化的檔案信息,以數(shù)字化的形式存儲、網(wǎng)絡(luò)化的形式互相聯(lián)結(jié),利用計算機系統(tǒng)進行管理,形成一個有序結(jié)構(gòu)的檔案信息庫,及時提供利用,實現(xiàn)資源共享,是檔案信息化建設(shè)的重要內(nèi)容。目前,大多數(shù)檔案館保存的檔案信息形態(tài)主要以紙質(zhì)、縮微膠片和底片等載體形式存在,只適應(yīng)于傳統(tǒng)的管理與傳播方式,即實施手工管理和以點到點的傳播,即便是經(jīng)過編研等初步加工,編輯印發(fā)檔案資料,實現(xiàn)以點到面的傳播,其覆蓋面也還是太小,很難達到社會化程度。檔案信息資源的經(jīng)濟價值和社會價值也難以充分實現(xiàn),更難適應(yīng)當代“數(shù)字化生存”的形勢。檔案原件數(shù)字化,對檔案信息的現(xiàn)代化管理、使用和傳播等都具有很重要的作用。
2、檔案數(shù)字化的主要內(nèi)容
①檔案目錄信息的數(shù)字化,建立檔案目錄數(shù)據(jù)庫。
②載體檔案的數(shù)字化,如紙質(zhì)檔案、照片檔案及錄音錄像檔案等的數(shù)字化,建立檔案影像數(shù)據(jù)庫或多媒體數(shù)據(jù)庫。
3、檔案數(shù)字化的主要作用
①檔案數(shù)字化是檔案信息化建設(shè)重要內(nèi)容。檔案信息化建設(shè)的核心是資源建設(shè)。資源建設(shè)包括兩大方面任務(wù):一是現(xiàn)有館藏檔案的目錄數(shù)據(jù)庫建設(shè)和館藏重要紙質(zhì)檔案和照片、錄音、錄像檔案的數(shù)字化;二是現(xiàn)行電子文件歸檔與電子檔案管理。
②檔案數(shù)字化能有效地保護檔案原件。⑴、代替原件使用,保護檔案原件。⑵、數(shù)字化副本異地保存,輸出磁盤、磁帶供永久保存。這樣可使這些檔案資料在出現(xiàn)天災人禍的情況下不致于遭到毀滅性的破壞。⑶、恢復檔案材料模糊褪變的字跡及對污損殘缺照片檔案的修復。
③檔案數(shù)字化能改善檔案的利用方式。⑴不再受“孤本”的限制,一份文件可以同時提供給所有需要它的人共享。⑵數(shù)字影像文件可以通過計算機局域網(wǎng)或者廣域網(wǎng)進行異地傳輸,使異地調(diào)閱利用成為可能。擴大了檔案的利用空間,讓更多的人們來了解檔案,利用檔案。⑶“時間”不再受限制,利用者可以隨時使用自己需要的文件。檔案數(shù)字化以后,將已開放的檔案上網(wǎng),這樣所有利用者就可以在任何時間上網(wǎng)利用檔案信息資源。④檔案數(shù)字化是傳統(tǒng)檔案館走向數(shù)字檔案館的必經(jīng)之路。數(shù)字檔案館無疑是21世紀各級各類檔案館的發(fā)展方向。盡管當前它的具體組成結(jié)構(gòu)、組織管理模式還處于探索之中,可其“館藏”的數(shù)字化特征是肯定的,傳統(tǒng)檔案的數(shù)字化將是其“館藏”的重要組成部分。
二、檔案數(shù)字化的實踐
1、檔案數(shù)字化工作回顧
為了加快實現(xiàn)檔案的現(xiàn)代化管理,方便檢索和提供利用,我館多年來花大力氣致力于檔案信息庫建設(shè)和檔案的數(shù)字化工作。1993年,我館購置微機,獨立開發(fā)人事檔案管理系統(tǒng),開始檔案數(shù)字化的工作,使得全局職工基本情況在電腦中一覽無遺,工資情況也能被系統(tǒng)所顯示。1998年開發(fā)文書檔案管理軟件,利用電腦管理文書檔案目錄。經(jīng)過這些年的努力工作,我們將館藏所有文書檔案、人事檔案全部錄入電腦,并實現(xiàn)了電腦查詢,極大方便了檔案管理。2002年,我館與市房地產(chǎn)產(chǎn)權(quán)處合并,而產(chǎn)權(quán)處在1995年,開發(fā)出產(chǎn)權(quán)產(chǎn)籍管理軟件,房產(chǎn)交易辦證實現(xiàn)電腦化辦公,并在實踐中不斷完善程序,將絕大部分產(chǎn)權(quán)產(chǎn)籍檔案錄入電腦,為全市房產(chǎn)發(fā)證加快了辦事流程,減少了出現(xiàn)錯誤的幾率。
2、實施檔案數(shù)字化工程的必要性
首先,大力推進國民經(jīng)濟和社會信息化,以信息化帶動工業(yè)化,實現(xiàn)社會生產(chǎn)力的跨越式發(fā)展,是黨中央抓住信息化這一機遇,在黨的十五屆五中全會作出的戰(zhàn)略決策。為了適應(yīng)國家信息化建設(shè)和檔案事業(yè)發(fā)展要求,2002年11月25日,國家檔案局制定下發(fā)了《全國檔案信息化建設(shè)實施綱要》,指出了“十五”期間檔案信息化建設(shè)的指導思想、目標與主要任務(wù)。
其次,隨著城市建設(shè)的快速發(fā)展,老百姓購房辦證數(shù)量的激增,為保障盡可能縮短老百姓辦理權(quán)證時間,不出現(xiàn)發(fā)證錯誤和重復發(fā)證,傳統(tǒng)管理根本不能滿足要求。
最后,2002年10月隨著市房地產(chǎn)檔案館與市產(chǎn)權(quán)監(jiān)督管理處的合并,檔案管理工作出現(xiàn)了新的局面。湘潭市產(chǎn)權(quán)監(jiān)督管理處開始建設(shè)湘潭市首個GIS系統(tǒng)——湘潭市房地產(chǎn)GIS系統(tǒng),該系統(tǒng)最基礎(chǔ)的工作也是最重要的工作是檔案數(shù)字化工作(或稱檔案數(shù)據(jù)導入工作),只有保證檔案數(shù)字化才能保障房地產(chǎn)GIS系統(tǒng)的基礎(chǔ)的牢靠。
3、檔案數(shù)字化工程的定位
產(chǎn)權(quán)產(chǎn)籍檔案數(shù)字化工程是湘潭市房產(chǎn)局房地產(chǎn)GIS系統(tǒng)的子項目,旨在將海量產(chǎn)權(quán)產(chǎn)籍檔案信息化、數(shù)字化,實現(xiàn)房地產(chǎn)GIS系統(tǒng)底層數(shù)據(jù)的全數(shù)字化,并通過建立后的系統(tǒng)實現(xiàn)“以圖管房”,減少辦證錯誤,提高辦證時效,并通過GIS系統(tǒng)數(shù)據(jù)統(tǒng)計,向各職能管理部門和政府宏觀調(diào)控部門提供數(shù)字化的檔案信息及較為精確的統(tǒng)計報告,更好地為城市建設(shè)和房地產(chǎn)市場管理服務(wù)。
4、檔案數(shù)字化工程需求分析 需處理量:A、產(chǎn)權(quán)檔案:館藏產(chǎn)權(quán)檔案共計35萬多卷。B、房產(chǎn)抵押、擔保、司法查封檔案:房產(chǎn)抵押檔案12900余卷,擔保檔案2050余卷,司法查封檔案1500余卷。C、正常業(yè)務(wù):2003年9月1日之后的所有正常業(yè)務(wù)檔案。
處理措施:劃分時間線2003年9月1日,區(qū)分處理方式。時間線之前的檔案將其檔案實體整理與裝訂,各類檔案詳細錄入相關(guān)頁面數(shù)據(jù),檔案原件通過數(shù)字照相技術(shù)掃描;時間線之后的檔案,按照新開發(fā)的正常辦證流程來實現(xiàn)數(shù)字化。
5、檔案數(shù)字化工程的內(nèi)容
將所有各類檔案進行規(guī)范整理,然后,分成檔案鑒定、檔案掃描、檔案導入三個大的環(huán)節(jié),11個小環(huán)節(jié)分類錄入服務(wù)器數(shù)據(jù)庫。不僅僅將檔案原件掃描生成圖片存儲,并將檔案原件上記載的55項相關(guān)重要業(yè)務(wù)數(shù)據(jù)真實、準確的錄入數(shù)據(jù)庫。
6、檔案數(shù)字化工程實施情況
需求分析與設(shè)備考察階段:調(diào)查分析館藏情況,包括檔案的類型、載體形態(tài)與狀態(tài)、館藏數(shù)量等基本情況。根據(jù)館藏情況制訂檔案數(shù)字化的科學規(guī)劃,確定項目需求,根據(jù)需求考察當前各種高速掃描系統(tǒng)的集成解決方案。在設(shè)備考察階段我們特別注意這么幾個問題:A、檔案數(shù)字化設(shè)備配置計劃的成套性。B、檔案數(shù)字化設(shè)備的配套性,也就是文檔掃描儀和數(shù)字照相機優(yōu)缺點對比,通過不斷的實踐,我們覺得數(shù)字照相機更加適應(yīng)我們的工作。C、檔案數(shù)字化項目硬件與軟件的集成性。D、檔案數(shù)字化方案與我館需求的適應(yīng)性??傊?,考慮到檔案信息數(shù)字化要經(jīng)過一個較長的過程,因此我們從實際需要和長遠打算出發(fā),力求確保電腦、照相機、操作人員等設(shè)施人員數(shù)量的成龍配套,使其具有較強的支撐能力和擴展能力。
系統(tǒng)實驗階段:2002年底,項目開始立項。組織業(yè)務(wù)、技術(shù)骨干遠赴深圳、上海、黑龍江佳木斯市等地實踐考察,2003年6月,正式成立房地產(chǎn)GIS系統(tǒng)領(lǐng)導小組、數(shù)據(jù)導入小組,調(diào)集相關(guān)業(yè)務(wù)、技術(shù)精英加入團隊,正式開始實驗階段的工作,新購進了12臺電腦微機,4臺佳能數(shù)碼相機,4臺EPSON激光打印機,一臺工作站服務(wù)器,設(shè)備安裝調(diào)試完畢。通過前期和軟件公司合作,共同開發(fā)我們所需要的軟件。探索檔案數(shù)字化工作在快速系統(tǒng)下,檔案前期整理、檔案掃描、質(zhì)量檢查、掃描文件管理、后期整理等全過程的協(xié)調(diào)配合問題,并探討在高速系統(tǒng)下如何解決某些技術(shù)問題。經(jīng)過近一年的測試,我們對整體系統(tǒng)流程和配套軟件、數(shù)據(jù)庫的性能有更進一步的了解,在項目的運作模式和系統(tǒng)管理等方面積累了一定的經(jīng)驗,同時,也鍛煉了一支技術(shù)過硬的隊伍,為系統(tǒng)的正式運行打下了基礎(chǔ)。
項目實施階段:本項目是一個長期、流程化運作的系統(tǒng),從建立開始就必須確保能長期高速、穩(wěn)定運行。在系統(tǒng)的開發(fā)與研究方面有一個時間周期,現(xiàn)把工作計劃分為以下幾個階段:
①、系統(tǒng)總體方案框架設(shè)計:
2002年12月—2003年6月,完成系統(tǒng)總體框架,生成詳細可行性分析報告,及相關(guān)配套業(yè)務(wù)標準、各類管理制度。②、系統(tǒng)建立:
2003年6月—2003年10月,系統(tǒng)建立,包括:硬件配置及軟件的開發(fā)。③、系統(tǒng)試運行:
2003年10月—2004年2月。④、系統(tǒng)正式運行:
2004年2月起,系統(tǒng)正式運行,同學校簽訂合作框架協(xié)議,調(diào)集員工和學生共100多人,經(jīng)過一段時間的業(yè)務(wù)及技能培訓,參與系統(tǒng)的正式運行,在運行中不斷完善升級。
三、對檔案數(shù)字化的思考
1、提高認識,統(tǒng)籌規(guī)劃
首先必須在思想上充分認識檔案信息資源的重要意義,在當今信息公開程度越來越高的形勢下,檔案的文化性質(zhì)和社會性質(zhì)逐步強化,利用的范圍和對象將逐步擴大。在這個信息時代,只有當檔案信息資源在社會主義現(xiàn)代化建設(shè)中發(fā)揮重要作用時,檔案和檔案工作的意義和價值才能充分地全面地展現(xiàn)出來。
其次,作好統(tǒng)籌規(guī)劃。將大量的檔案數(shù)字化,是一個龐大的系統(tǒng)工程。首先要做好館藏情況的調(diào)查,包括檔案的類型、載體形態(tài)與狀態(tài)、館藏數(shù)量、檔案信息利用等基本情況。根據(jù)館藏情況制訂檔案數(shù)字化的科學規(guī)劃,包括服務(wù)器、電腦、掃描設(shè)備等硬件的購置計劃和數(shù)字化處理規(guī)劃。檔案數(shù)字化實施處理規(guī)劃應(yīng)貫徹“突出重點,分步進行”的原則,對館藏重點和利用率高的檔案先行數(shù)字化,早日滿足大多數(shù)利用者的需求。
最后,檔案數(shù)字化是一項費時較長的工程,在大規(guī)模、流程化的數(shù)字化過程中,所有檔案原件都需從檔案庫房分批大量取出,一定要保障檔案原件的完整,不允許出現(xiàn)損毀和遺失的現(xiàn)象。
2、加強基礎(chǔ)工作,認真做好檔案數(shù)字化
①、檔案數(shù)字化必須有所選擇。針對館藏“浩瀚”的檔案資源,不加選擇地全部數(shù)字化是不可能的、也是不必要的。我們應(yīng)該根據(jù)一定的原則確定哪些館藏檔案原件應(yīng)該數(shù)字化、哪些檔案原件中哪些頁不需要數(shù)字化。
②、做好數(shù)字化時掃描參數(shù)的優(yōu)化設(shè)置。掃描系統(tǒng)掃描參數(shù)的選擇和確定對掃描數(shù)字影像質(zhì)量有著較大影響,其中掃描分辨率直接關(guān)系到掃描文件的清晰度和還原效果。我們在選擇分辨率時應(yīng)根據(jù)實際需要綜合考慮,包括掃描文件的可閱讀性、存儲空間、輸出打印質(zhì)量等。
③、做好檔案數(shù)字化的全程控制。在檔案數(shù)字化過程中,要注重全面的質(zhì)量檢查,加強數(shù)據(jù)的質(zhì)量控制。質(zhì)量檢查應(yīng)包括以下幾方面內(nèi)容:A、數(shù)字化前的檔案整理檢查。要進行數(shù)字化的檔案原件必須完整、排序正確,對折損嚴重影響掃描質(zhì)量的原件應(yīng)預先修整。B、數(shù)字化中的人員業(yè)務(wù)培訓。數(shù)字化工作是需要人來完成的,人員業(yè)務(wù)培訓不過關(guān),直接導致返工,間接導致成本的增加,時間段的延長。C、數(shù)字化后的數(shù)據(jù)質(zhì)量、圖像質(zhì)量檢查。錄入后的檔案信息要做到非常高的正確率,掃描后的文件圖像應(yīng)保持檔案的原貌,字跡清楚不失真,無錯掃、漏掃,對文件圖像質(zhì)量有問題的應(yīng)重新掃描。
3、開展檔案數(shù)字化問題的研究,及時解決數(shù)字化進程中的疑難問題。
檔案數(shù)字化是檔案工作中的一項新內(nèi)容,不可避免地會遇到一些新情況、新問題。比如,數(shù)字化檔案信息壓縮及存儲的關(guān)鍵技術(shù)問題;業(yè)務(wù)形態(tài)于現(xiàn)有技術(shù)手段相抵觸;數(shù)字化檔案信息安全、保密技術(shù)問題;數(shù)字化檔案信息的訪問形式與安全控制問題;數(shù)字化檔案信息知識產(chǎn)權(quán)問題;數(shù)字化檔案信息的法律地位問題。針對這些新情況、新問題,應(yīng)在抓檔案原件數(shù)字化工作的同時,組織力量開展檔案數(shù)字化問題的研究,及時解決工作中的一些業(yè)務(wù)問題和相關(guān)技術(shù)性問題,同時澄清和統(tǒng)一思想認識,確保檔案數(shù)字化工作的順利開展。另外,必須加強檔案數(shù)字化和數(shù)字化檔案信息管理人才的培養(yǎng)。只懂得計算機技術(shù)或只懂得紙質(zhì)等載體檔案管理知識的人無法勝任此項工作,所以應(yīng)加強這方面技術(shù)人員的培養(yǎng)。
第16屆國際檔案大會剛剛閉幕,此次會議的主題是:“檔案、管理與發(fā)展:描述未來社會”。我們應(yīng)不斷學習最先進的檔案管理模式,不斷走出去看看,開拓眼界,才能跟上時代發(fā)展的主旋律。
國土房管檔案館檔案影像管理系統(tǒng)一、需求分析
----國土房管檔案影像管理系統(tǒng),其核心是完成紙面檔案的影像化管理工作,將傳統(tǒng)的紙面文檔管理轉(zhuǎn)變?yōu)閷τ跋裎臋n的管理,將傳統(tǒng)的對紙面文檔的數(shù)據(jù)索引方式轉(zhuǎn)變?yōu)槊鎸τ跋裎臋n進行索引的方式,從而為業(yè)務(wù)的開展提供足夠的、快速的信息保障,進而為提高工作效率打下堅實基礎(chǔ)。
----系統(tǒng)要求:分別成立專職的掃描工作點、索引工作點、查詢工作點。掃描工作點主要進行集中的掃描工作,開展索引前紙面文件的預處理;索引工作點主要完成索引數(shù)據(jù)的錄入,數(shù)據(jù)入庫、生成相關(guān)業(yè)務(wù)報表、建立影像文檔庫等工作;查詢工作點可以是本單位內(nèi)局域網(wǎng)上的任意多個工作站。
----以下對已掌握的需求要點分別進行分析,以及提出解決建議:
1、檔案科目分類
需求:檔案業(yè)務(wù)單式種類較多、分類查詢方式也較多樣 系統(tǒng)要求:軟件在分類、錄入上應(yīng)當實現(xiàn)簡便、快捷。
2、檔案規(guī)格、尺寸
需求:雖然檔案的尺寸、規(guī)格基本相同,但考慮到可能要涉及到的附件紙張規(guī)格有不同規(guī)格和紙張質(zhì)量(薄厚),這對掃描儀應(yīng)當有著較高的要求。系統(tǒng)要求:采用能夠?qū)崿F(xiàn)多種規(guī)格尺寸的檔案、檔案可以實現(xiàn)同時掃描的設(shè)備,不必對規(guī)格、尺寸做任何限制和要求。
3、檔案處理手續(xù)
在處理電子文檔過程中,所有的檔案都要按照類別、順序號排列,但是如有缺漏要立即發(fā)驗,保證文檔的完整。原始檔案和影印件要準確無誤的保存起來。
系統(tǒng)要求:系統(tǒng)工作流程定義時,避免流程的逆轉(zhuǎn),要求圖像掃描和處理時要準確無誤,不能存在糾偏變形、遺失檔案和要素等問題。
4、檔案、檔案要素
需求:檔案的數(shù)量和格式不具有絕對固定性,不定期的會增加一些檔案,檔案的格式也存在變更的可能性。
系統(tǒng)要求:軟件可根據(jù)檔案數(shù)量、種類和要素的變化,可以自定義檔案和要素。
5、檔案紙張
需求:檔案的紙張的質(zhì)量差別雖然不是很大,但要保證原始檔案的完整性;另外,有的手寫體和印刷體字跡不很清晰。
系統(tǒng)要求:不能撕壞紙張;必須能夠?qū)ψ舟E進行增強;掃描是能夠自動識別紙張的薄厚,對于一部分年久的紙面文檔,應(yīng)采用平板掃描的方式進行處理。
6、檔案的信息處理:
系統(tǒng)要求:歷史檔案處理,需要采用兩臺高端的掃描儀、2臺中端自動進紙掃描儀,5臺平板掃描,多臺數(shù)碼照相機,掃描時需人手做前期整理工作,以及后期的檔案歸檔工作。完成所有的歷史檔案的處理需要準備不低于1.3T的存貯空間。
7、掃描方式
需求:檔案的掃描不進行分散掃描,分散掃描會造成各口工作人員的工作效率的極大下降,并且掃描后的文檔較為混亂,不利于后續(xù)的索引工作。
系統(tǒng)要求:在減少硬件投入的情況下,有利于提高工作效率,減少掃描的工作環(huán)節(jié)和更有效地進行質(zhì)量控制,掃描之前應(yīng)對被掃描的檔案進行歸類整理,以方便掃描,掃描過后由QA進行質(zhì)量檢查。
8、正確索引
需求:要求寫入數(shù)據(jù)庫的索引數(shù)據(jù)要確保正確。
系統(tǒng)要求:為了確保索引相關(guān)信息被正確入庫,可靈活采用一次錄入,二次較對,或操作人員兩次錄入的工作方式,系統(tǒng)自動校對。
9、影像文檔及數(shù)據(jù)安全
需求:檔案管理部門所涉及的檔案,對安全性及其保密性有很高的要求。系統(tǒng)要求:可對影像化的檔案資料進行加密。
10、影像文檔的查詢
需求:按一定的權(quán)限要求進行系統(tǒng)設(shè)置,完成查詢的需求。
系統(tǒng)要求:采用安裝客戶端的方式,按一定的權(quán)限要求進行系統(tǒng)設(shè)置,完成查詢的需求。
11、備份歸檔
需求:國土房管檔案影像管理系統(tǒng)要求提供可靠的數(shù)據(jù)存儲與備份。
系統(tǒng)要求:按現(xiàn)有的數(shù)據(jù)量以及計劃中的投資,可以采取大容量存儲設(shè)備磁盤陣列和磁帶機作近線備份的方式保存數(shù)據(jù)。
12、查詢響應(yīng)速度
需求:系統(tǒng)查詢速度需要考慮多用戶、多數(shù)據(jù)時系統(tǒng)要能達到較佳的響應(yīng)速度。
系統(tǒng)要求:影響系統(tǒng)查詢速度的因素主要有三個:網(wǎng)絡(luò)帶寬、影像文件大小及并發(fā)用戶的數(shù)量。所以影像文件的調(diào)閱速度基本上由周邊網(wǎng)絡(luò)設(shè)備設(shè)決定。
二、解決方案
1、目標
----國土房管檔案影像管理系統(tǒng)擔負著檔案的管理的任務(wù),是一個專職處理檔案的職能部門,通過為國土房管檔案影像管理系統(tǒng)建立檔案影像管理系統(tǒng),引入新一代的文件管理技術(shù),為國土房管檔案影像管理系統(tǒng)建立原始檔案的影像檔案庫,以達到加強原始檔案的管理、提高管理效率、降低管理成本、實現(xiàn)資料的快速查詢及共享的目的。
2、概述
----信息行業(yè)作為知識經(jīng)濟時代的核心產(chǎn)業(yè)之一,近年來一直以驚人的速度在不斷發(fā)展,而以紙面文件作為媒介的各種信息資料也呈爆炸性增長。如何有效管理這些信息資料,不斷提高信息的使用效率,已經(jīng)成為一個重要課題。
3、現(xiàn)狀
----國土房管檔案影像管理系統(tǒng)的在日常業(yè)務(wù)中,會產(chǎn)生大量檔案,檔案多以紙面文檔的方式產(chǎn)生,以傳統(tǒng)的數(shù)據(jù)處理方式進行處理,紙面檔案每天都在大量地產(chǎn)生,再加上歷史遺留文檔,數(shù)量是非常驚人的,其中所涉及的信息數(shù)量也非常龐大。對于這些檔案及信息,如何進行分類、保存和歸檔,錄入、高效的查詢,一直是一件非常棘手的事情。在傳統(tǒng)模式下,總是被以下幾個難題所困擾:
● 檢索、查詢和日常管理麻煩,工作效率不高; ● 紙面文檔不好保存,很容易被損壞或弄污; ● 管理效率低下,管理成本居高不下; ● 檔案調(diào)閱及信息利用效率較低;
● 工作低效率、高成本;
----從以上的介紹,不難看僅僅用手工進行紙面檔案的管理有很大局限性,在信息技術(shù)飛速發(fā)展的今天,也越來越不合時宜了。如何利用最新科技,完成紙面檔案的電子化管理工作已經(jīng)成為當務(wù)之急。
4、影像技術(shù)簡介
電子影像是指各類文檔的電子照片。
----影像技術(shù)是指將各種文檔制作成電子照片,使這些文檔的采集、分發(fā)、使用、管理、存儲完全電子化的相關(guān)技術(shù),而傳統(tǒng)的電子化技術(shù)是把文檔上的信息制作成電子數(shù)據(jù),把文檔的流轉(zhuǎn)和處理轉(zhuǎn)化為數(shù)據(jù)的流轉(zhuǎn)和處理。
----影像系統(tǒng)是指對經(jīng)影像化處理的文檔完成數(shù)據(jù)錄入、查詢、調(diào)閱、批改、存儲等功能的一整套解決方案,通過方案的實施能有效的解決傳統(tǒng)手工紙面文檔管理所無法解決的難題,具體有以下幾方面:
● 原始文檔電子影像化備份; ● 可靠安全的數(shù)據(jù)管理;
● 文檔“影像原件”的高效查詢;
● 在減少工作難度的同時,進一步推進管理工作的規(guī)范化。
----文檔影像化作為一種先進的信息管理手段,一經(jīng)采用,必將大大提高紙面文檔及數(shù)據(jù)的管理效率,降低成本,改進服務(wù),提高信息利用率。影像技術(shù)應(yīng)用的可以分不同階段開展 ● 初級階段:影像化存檔: 完成文檔影像化工作及影像文件查詢 不涉及工作流技術(shù)
不涉及業(yè)務(wù)過程
● 深化階段:影像化業(yè)務(wù)處理: 工作流技術(shù)與影像技術(shù)結(jié)合 融入業(yè)務(wù)處理過程 從后臺走向前臺
三、詳細的技術(shù)方案設(shè)計
1、工作流程設(shè)計
注:當有以下情況發(fā)生時,工作流程按以下的規(guī)定進行:
A. 掃描QA時發(fā)現(xiàn)漏掃、誤掃、掃描質(zhì)量太差:重新掃描。B. 索引時發(fā)現(xiàn)漏掃、誤掃、掃描質(zhì)量太差:重新掃描。
C. 自動校對時發(fā)現(xiàn)有誤:取有誤的輸入數(shù)據(jù)對照文件重新修改,計入日志,生成相應(yīng)報表。
接收檔案
對所接收的紙質(zhì)文件,根據(jù)一定的規(guī)則按類別、按份數(shù)完成文檔的第一次整理工作。確立批次
以加入標識紙的方式,對每一份檔案進行分隔;以一定的份數(shù)為一批,系統(tǒng)將自動生成批次號(注:也可以采用條碼自動識別的方式進行分頁及生成流水號,但采用條碼方式需要加大軟、硬件的投入。)
2、掃描 中高速掃描
系統(tǒng)采用PANASONIC 高速掃描儀KV-SS905CCN 2臺、中速掃描儀KV-S7065CCN 2臺,以每個批次為單位,放入掃描儀的自動進紙進行掃描。掃描時,自動生成檔案的分類、分頁。
3、影像處理
掃描質(zhì)檢
檢查掃描的電子影像文件是否有漏掃、誤掃和掃描質(zhì)量欠佳等,以保證掃描輸出高質(zhì)量的電子影像文件。
進行掃描質(zhì)檢時可以采取掃描完后,在掃描工作站上進行掃描的電子影像文件進行質(zhì)檢。掃描補漏
對于有質(zhì)量問題的影像文件建議全批重掃以減少操作復雜性,個別情況下可以用平板掃描儀、數(shù)碼照相機對那些漏掃、誤掃和掃描質(zhì)量欠佳的文件進行追加掃描。
4、原始檔案裝訂入庫
在對掃描后的電子影像文件檢查無誤,將原始檔案采用常用的檔案管理方式裝訂及入庫。
5、索引
在索引時可采用一人兩次錄入,系統(tǒng)自動較對,對系統(tǒng)較對不一致的數(shù)據(jù),進行校驗及錄入。
6、數(shù)據(jù)歸檔 接收數(shù)據(jù)及相應(yīng)的報表,數(shù)據(jù)分別供業(yè)務(wù)數(shù)據(jù)庫使用及影像文檔庫使用。
7、歸檔備份
本系統(tǒng)采用一臺服務(wù)器、一個專用磁盤陣列對索引文件、影像文件進行備份;在進行索引文件備份可以采用定時備份或定容量備份,還可以采用不定時備份,這樣影像文件服務(wù)器遭到災難性破壞,可以直接將所備份的索引文件恢復。
8、檢索、查詢、管理影像文件
在對影像文件進行查詢時,基于本系統(tǒng)的在局域網(wǎng)里的查詢,采用安裝工作站軟件的方式,生成查詢?nèi)罩尽?系統(tǒng)結(jié)構(gòu)及配置
四、系統(tǒng)結(jié)構(gòu)
系統(tǒng)結(jié)構(gòu)如下圖所示:
系統(tǒng)功能
我們設(shè)計的解決方案,由以下幾個子系統(tǒng)功能組成: 高速掃描
由高速掃描軟件提供高速掃描圖像資料的功能,把客戶的原始資料轉(zhuǎn)換為電子影像資料。由高速掃描員使用。把保存的數(shù)據(jù)送到質(zhì)量檢驗工序。質(zhì)量檢驗及數(shù)據(jù)錄入
影像質(zhì)量檢驗與部分索引錄入是把影像質(zhì)量有問題和數(shù)據(jù)不正確的影像資料找出來,由質(zhì)檢員使用。索引的資料將會分別放在影像庫中及數(shù)據(jù)庫之中。系統(tǒng)管理
本系統(tǒng)提供的維護和生產(chǎn)情況查詢功能,由系統(tǒng)管理員使用。
安全管理
本系統(tǒng)分系統(tǒng)管理員、高速掃描員、質(zhì)檢員和查詢客戶。其中系統(tǒng)管理員負責整個系統(tǒng)的管理,擁有系統(tǒng)的所有權(quán)限。高速掃描員、質(zhì)檢員有相對應(yīng)的工序使用權(quán)。而查詢客戶只擁有影像資料的查詢權(quán)。
生產(chǎn)日志查詢
可統(tǒng)計和查詢在各工序間的未處理資料情況; 可統(tǒng)計和查詢資料保存到影像數(shù)據(jù)庫的情況。出錯處理
如果在使用過程中發(fā)現(xiàn)索引信息有誤,系統(tǒng)管理員可以刪除錯誤紀錄,調(diào)出相應(yīng)存放地中的資料重新掃描并建立索引。
影像查詢
本系統(tǒng)提供資料影像查詢功能,使業(yè)務(wù)人員可以通過EZDOC影像管理系統(tǒng)隨時查找需要的影像數(shù)據(jù),查詢相應(yīng)的影像文件;影像文件在查看時可以有放大、縮小、旋轉(zhuǎn)、打印的功能;記錄查詢?nèi)罩尽Pr灩δ?/p>
系統(tǒng)可以與其它系統(tǒng)的有機聯(lián)接,可以自動與業(yè)務(wù)系統(tǒng)提供之數(shù)據(jù)進行對比。數(shù)據(jù)備份
數(shù)據(jù)備份分為兩個部分:影像文件索引信息數(shù)據(jù)庫備份、影像文件備份。對于影像文件索引信息數(shù)據(jù)庫的備份,電子檔案管理系統(tǒng)不再另外提供備份功能,而是直接使用數(shù)據(jù)庫管理系統(tǒng)的備份、恢復功能,保證數(shù)據(jù)庫的完整性、有效性、可恢復性。
有關(guān)影像文件的備份:電子檔案影像索引之后,首先存儲于影像文件服務(wù)器,然后,系統(tǒng)自動完成備分機的備份任務(wù)。5.3.2系統(tǒng)特點
無業(yè)務(wù)流程的逆轉(zhuǎn)
國土房管檔案影像管理系統(tǒng)要求:“準確”、“迅速”、“安全”、“方便”。自然,在業(yè)務(wù)流程中盡可能避免業(yè)務(wù)流程逆轉(zhuǎn),也就是說:在影像掃描的過程中盡可能避免檔案重新掃描、檔案漏掃等問題。流程的逆轉(zhuǎn)會增加數(shù)據(jù)錯誤的可能,流程逆轉(zhuǎn)的環(huán)節(jié)越多錯誤可能性越大。用戶可以自定義檔案分類
檔案種類繁雜,而且檔案種類、檔案要素并不固定,而且可能發(fā)生變化,如果系統(tǒng)將檔案類別做成固定方式,則無法適合業(yè)務(wù)的發(fā)展。于是,我們在系統(tǒng)中為用戶提供了一個開放式接口,可以讓客戶按照自己的方式增加、修改一些檔案分類和檔案要素?!挥镁幊?,全部通過鼠標即可完成。
用戶可選擇當前掃描、輸入的文檔類型
雖然,每天處理的檔案的種類和數(shù)量較大,但并不是每種檔案都有——通常數(shù)量大的主要分布在大業(yè)務(wù)上,有些檔案通常幾天出現(xiàn)一次。如果每天都要建立所有的分類,這將消耗不必要的存儲空間。因此,我們提供了對當前要掃描檔案類別的選擇功能,客戶可以根據(jù)當前業(yè)務(wù)情況進行選擇。
用戶可以自己確定檔案的要素
據(jù)上所述,我們的檔案類別差異很大,而且不定期在發(fā)生著變化,那么,檔案的數(shù)據(jù)要素也在發(fā)生著變化,為了讓客戶更好的適應(yīng)這種變化,我們提供一個開放式檔案要素設(shè)定??梢愿鶕?jù)具體的檔案設(shè)置、更改某些要素。多種安全保護模式
軟件登錄是采用密碼方式。
數(shù)據(jù)庫系統(tǒng)及影像文件也做了加密工作,防止他人修改影像數(shù)據(jù)和數(shù)據(jù)庫數(shù)據(jù)。
質(zhì)量控制
在掃描過程中若出現(xiàn)漏掃、誤掃或影像質(zhì)量不好的問題,通過有效的工作日志的管理,解決以上問題。
檔案數(shù)字化方案研究
課題組
《檔案數(shù)字化方案研究》項目對檔案數(shù)字化優(yōu)化策略與原則、技術(shù)路線與支持、流程重組與再造、操作方法與步驟進行了全面的研究,達到了檔案數(shù)字化全過程優(yōu)化和管理系統(tǒng)整體優(yōu)化的目的,形成了完整的檔案數(shù)字化方案和成功的實踐案例。國家檔案局組織的專家鑒定委員會結(jié)論是:“該項目基于長春市檔案館以檔案利用為導向、漸進性的檔案數(shù)字化實踐,提出了檔案數(shù)字化工作的指導思想、優(yōu)化原則和優(yōu)化策略,符合國情,符合現(xiàn)代管理理念,對全國各檔案館的相關(guān)工作具有較大的參考價值;注重檔案數(shù)字化工作與檔案數(shù)據(jù)庫建設(shè)、檔案信息網(wǎng)絡(luò)開發(fā)的有機銜接,提出了系統(tǒng)優(yōu)化的技術(shù)路線,規(guī)劃設(shè)計了檔案鑒定與數(shù)字化同步、檔案數(shù)字化與上網(wǎng)利用同步、多種檔案數(shù)據(jù)庫建設(shè)同步的流程,并成功地付諸實踐,實現(xiàn)了檔案數(shù)字化與上網(wǎng)利用的低成本、高效率、高效益。同時,運用CA認證、數(shù)字水印、電子簽章等技術(shù),為網(wǎng)上檔案信息資源安全、準確利用提供了技術(shù)保證,也為檔案管理部門提供了很好的實踐模式”。該項目獲國家檔案局2006年優(yōu)秀科技成果二等獎的同時,長春市檔案館被國務(wù)院信息化工作辦公室和國家檔案局確定為傳統(tǒng)載體檔案數(shù)字化試點單位。一.檔案數(shù)字化的指導思想
以優(yōu)化理論為指導,以用戶需求為導向,以利用檔案為目的,充分應(yīng)用計算機軟硬件功能,最大限度地發(fā)揮人力資源和數(shù)字化加工設(shè)備能力,兼顧保護檔案原件的要求,保證數(shù)字化檔案的真實可靠,更好地發(fā)揮檔案信息資源的作用。
二、檔案數(shù)字化的優(yōu)化原則
實用性原則:針對館藏檔案具備重復利用和緊急利用兩大特點,急用、常用檔案優(yōu)先數(shù)字化是檔案數(shù)字化的首選。開放性原則:互聯(lián)網(wǎng)給檔案信息資源共享提供了超越時空的條件,國家民主政治建設(shè)和政府信息公開催促檔案解密和開放,開放檔案及時數(shù)字化是實現(xiàn)其社會共享的前提。價值性原則:重要檔案優(yōu)先數(shù)字化具有檔案利用和檔案保護雙重意義,是網(wǎng)絡(luò)時代更好實現(xiàn)檔案價值的客觀需要。搶救性原則:計算機存儲給檔案搶救開辟了了新的途徑,檔案數(shù)字化是保護瀕危檔案原件最經(jīng)濟和便捷的方法。
時效性原則:檔案數(shù)字化加工與數(shù)字化檔案利用同步實現(xiàn),是充分利用計算機網(wǎng)絡(luò)技術(shù),更好、更快地實現(xiàn)檔案數(shù)字化效益的最佳途徑。
三、檔案數(shù)字化的優(yōu)化策略
需求導向策略:社會需求是制定和調(diào)整檔案數(shù)字化工作策略的“風向標”。匯集多年檔案利用情況統(tǒng)計,把利用頻繁檔案的進行綜合分析,科學地圈定優(yōu)先檔案數(shù)字化的范圍。并建立快速反應(yīng)機制,執(zhí)行常用檔案繼續(xù)做與急用檔案突擊做的計劃,達到數(shù)字化檔案利用即時見效的目的。
本級為主策略:地方檔案館保存的本級永久檔案是數(shù)字化的重點。進入信息時代,館際間重復的上級檔案文件,與其分頭進行數(shù)字化及開放鑒定,不如發(fā)揮中國特色檔案管理體制的優(yōu)勢,由上級檔案行政管理部門組織,向館際共建、共享數(shù)字化、開放鑒定成果的方向發(fā)展,盡量減少檔案館多層的重復勞動。
分步實施策略:館藏檔案數(shù)字化不可能一步到位,而且隨著時間的推移,檔案室進館范圍的檔案將陸續(xù)移交到檔案館,這些檔案采取館室共建、共贏、共享的數(shù)字化策略非常有意義。剔除無用策略:館藏現(xiàn)行檔案是否進館往往由立卷人員決定,加之保管期限表比較籠統(tǒng),館藏不該歸檔、不該進館、重復檔案頗多。特別是建國超過50年以后,市以下檔案館長期保管的檔案逐年超過保管期的上限。因此,開展檔案價值鑒定,剔除無用,以免再造數(shù)字化垃圾,避免資源浪費應(yīng)是長久的策略。
四、技術(shù)路線的優(yōu)化選擇 檔案鑒定與數(shù)字化同步:從利用上講,解決制約檔案信息資源共享的主要瓶頸---檔案開放鑒定問題是當務(wù)之急;從成本上講,檔案價值鑒定是避免失效檔案數(shù)字化的最佳方法。只有這樣,才能控制檔案數(shù)字化投入與產(chǎn)出比例失調(diào)、數(shù)量很大共享很少的問題。
多種檔案數(shù)據(jù)庫建設(shè)同步:一是首先建立文件級目錄數(shù)據(jù)庫。滿足一次檢索需要,建好文件級目錄數(shù)據(jù)庫。目前,絕大多數(shù)檔案館,因沒實現(xiàn)全部檔案的文件級目錄機檢,查檔不快、不準、不全的問題不可避免。所以,把文件級目錄數(shù)據(jù)庫建設(shè)作為基礎(chǔ)性工作,是提高檔案查全率、查準率必經(jīng)之路。二是適時建立專題數(shù)據(jù)庫。隨著社會發(fā)展,對某一專題檔案集中需求時有發(fā)生,突擊建立專題數(shù)據(jù)庫,滿足社會需求是發(fā)揮檔案作用的最佳時機。三是優(yōu)選建設(shè)全文數(shù)據(jù)庫。滿足檔案信息資源開發(fā)利用需要,優(yōu)選建設(shè)全文數(shù)據(jù)庫。按照國家檔案局提出的利用頻繁檔案首先數(shù)字化的要求,遵循“二八”定律(即以20%的努力達到80%的效果),同步開展檔案全文數(shù)據(jù)庫建設(shè)。檔案數(shù)字化與上網(wǎng)利用同步:檔案數(shù)字化的根本目的是充分發(fā)揮其作用。通過計算機網(wǎng)絡(luò)技術(shù),實現(xiàn)檔案數(shù)字化與局域網(wǎng)上利用同步,開放檔案數(shù)字化與互聯(lián)網(wǎng)上利用同步。五.重組和再造的優(yōu)化流程 為發(fā)揮計算機網(wǎng)絡(luò)的優(yōu)勢,重組和再造優(yōu)化流程的實質(zhì),就是對檔案數(shù)字化整個工作流程進行系統(tǒng)分析,不但要打破原有業(yè)務(wù)規(guī)程,還要改變行政管理分工,進行全方位的變革。檔案數(shù)字化的任何一個細節(jié)都會對整體產(chǎn)生影響,輕者降低效率,重者決定成敗。長春市檔案館高度重視每一個細節(jié),再造和優(yōu)化了上百個流程和內(nèi)部標準,保證優(yōu)化技術(shù)路線的順利執(zhí)行。六.檔案數(shù)字化示范案例----長春模式
從2004年開始,長春市檔案館以科研課題為先導,以項目管理為手段,以效益實現(xiàn)為檢驗標準,組建并成功運行檔案數(shù)字化工作組織架構(gòu)、資源配置、數(shù)字化加工、上網(wǎng)利用“一站式”流水作業(yè)線,探索檔案數(shù)字化和網(wǎng)上利用服務(wù)工程優(yōu)化模式,終于闖出一條獨特的檔案數(shù)字化之路。
(一)實施三個工程,建立一個團隊
長春市檔案館把信息化帶動作為首位戰(zhàn)略,視為一把手工程、班子工程、全員工程突出抓,并創(chuàng)新管理機制,打破行政分工,在計算機網(wǎng)絡(luò)環(huán)境下,建立了行政領(lǐng)導、指導專家(技術(shù)業(yè)務(wù)總負責)、專業(yè)人員、外聘技工20人的長期流程團隊,并與現(xiàn)有計算機和掃描設(shè)備進行合理搭配。該團隊由局(館)黨組直接領(lǐng)導,館技術(shù)部門提供支持,管理部門提供檔案,專家提供指導,創(chuàng)立了高效的組織體系,搭建了投入小產(chǎn)出大機制框架。
(二)集中四個環(huán)節(jié),堅持流水作業(yè)
文件級目錄數(shù)據(jù)錄入是檔案數(shù)字化的基礎(chǔ),檔案鑒定是檔案信息資源共享的前提,全文數(shù)字化是提升檔案服務(wù)水平的途徑,整理是檔案文件實體管理主要環(huán)節(jié),把上述四個環(huán)節(jié)集中,是提高工作效率和質(zhì)量的最佳選擇。長春市檔案館四集中流水線上,目錄數(shù)據(jù)錄入崗位安排業(yè)務(wù)和技工7名、檔案鑒定崗位安排5人、檔案數(shù)字化加工4人、檔案實體整理4人,在網(wǎng)絡(luò)環(huán)境下實行集中辦公和流水作業(yè)。
(三)數(shù)字化成本降低,數(shù)字化速度加快
由于采用高效的組織體系和優(yōu)化的技術(shù)路線,已有20萬件檔案走下流水線。
低成本主要體現(xiàn)在:20萬件檔案緩銷剔出占24.7%,留存檔案占75.3%;留存的75.3%檔案,全文數(shù)字化占25.6%,現(xiàn)用現(xiàn)掃占49.7%,比全部掃描節(jié)省費用40%以上。同時,三年時間建成數(shù)據(jù)庫50個,文件級數(shù)據(jù)庫120萬條(包括20萬件全文);專題數(shù)據(jù)庫120萬條;照片數(shù)據(jù)庫2000張;資料數(shù)據(jù)庫5000條,案卷級目錄數(shù)據(jù)庫23萬條;現(xiàn)行文件和政府公開信息1萬余件(條)。局域網(wǎng)運行檔案目錄數(shù)據(jù)260萬余條,20萬件全文;互聯(lián)網(wǎng)運行檔案目錄數(shù)據(jù)120萬條,8萬件全文。完成這樣規(guī)模的數(shù)據(jù)庫建設(shè),全部人工費只有58.4萬元(包括流程團隊檔案干部的工資),經(jīng)濟成本很低,時間成本很少。
高效率主要體現(xiàn)在:價值鑒定、開放鑒定、數(shù)字化篩選、原件掃描、實體整理同步完成,比各項分步做效率高數(shù)倍,同時有現(xiàn)用現(xiàn)掃的方法配套,投入少量設(shè)備,相當于將20萬件(200萬頁)檔案全部掃描的效果。
(四)利用方式變革,社會效益顯著
為充分發(fā)揮網(wǎng)絡(luò)優(yōu)勢,長春市檔案館采取了直接與間接相結(jié)合的方法提供利用。
1、直接提供利用:對數(shù)字化檔案全文,在局域網(wǎng)內(nèi),接待人員利用網(wǎng)絡(luò)檢索后直接打印,為用戶提供數(shù)字化檔案打印件。在互聯(lián)網(wǎng)上提供數(shù)字化檔案全文下載、打印服務(wù)。并通過CA認證、電子簽名等安全技術(shù),對特定的用戶直接提供加蓋電子簽章的數(shù)字化檔案打印件,已有案例。
2.間接提供利用:對目錄數(shù)字化檔案,在局域網(wǎng)內(nèi),接待人員機檢到檔案后通知檔案庫管人員,檔案庫管人員調(diào)出原件全文掃描后,通過網(wǎng)絡(luò)打印機直接傳輸打印件,由接待人員提供給用戶。
目前,長春市檔案館基本實現(xiàn)了三個替代:網(wǎng)絡(luò)檢索替代手工目錄檢索,查看數(shù)字化檔案替代查看紙質(zhì)檔案,網(wǎng)絡(luò)打印替代手工復印。
高效益體現(xiàn)在:檔案全文數(shù)字化占館藏檔案的10%,提供數(shù)字化檔案占利用率的70%。為上萬人提供了檔案證明,公眾成為檔案數(shù)字化的最大受益者。檔案數(shù)字化成果得到社會公眾,上級檔案和信息化部門,當?shù)攸h委、政府,國內(nèi)外同行的普遍贊譽,數(shù)以百計的留言、錦旗、感謝信、獎勵證書、媒體報道就是最好的證明。
檔案數(shù)字化解決方案
檔案數(shù)字化是指采用掃描儀或數(shù)碼相機等數(shù)碼設(shè)備對紙質(zhì)檔案進行數(shù)字加工,將其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上并能被計算機識別的數(shù)字圖像或數(shù)字文本的處理過程。公司裝備多種掃描設(shè)備:高速掃描儀、零邊距掃描儀、寬幅掃描儀、書刊掃描儀,可處理各類紙質(zhì)文檔。可根據(jù)不同文檔的材質(zhì)、幅面大小及內(nèi)容,提供不同的電子化掃描及索引(著錄)解決方案,并可根據(jù)客戶需求量身制定掃描加工方案。
經(jīng)驗豐富的實施生產(chǎn)隊伍
自2002年開展數(shù)字化掃描加工業(yè)務(wù)以來,掌握了較全面的專業(yè)知識及積累了豐富的工作經(jīng)驗。
成熟的管理機制、有效的管理控制手段。
嚴謹?shù)馁|(zhì)量控制手段,可實現(xiàn)掃描加工過程中各個環(huán)節(jié)的質(zhì)量控制和自動化的量化記錄,可確保掃描加工的影像、索引的正確性。
嚴格的客戶財產(chǎn)保全制度及控制手段。可確??蛻粑臋n資料、數(shù)據(jù)在掃描加工服務(wù)中的安全性、保密性。
先進、靈活的掃描加工生產(chǎn)系統(tǒng)
公司自主研發(fā)的掃描加工生產(chǎn)軟件系統(tǒng),基于工作流的任務(wù)機制,實現(xiàn)流水線式的生產(chǎn)模式,可根據(jù)客戶的需求靈活的配置、調(diào)整,以適應(yīng)不同客戶、不同類型文檔的加工任務(wù)。包括:文件、檔案、文獻、資料、報紙、書刊、雜志、合釘本、匯編 掃描模式:黑白二值、灰度、彩色 掃描分辨率:150DPI~2400 DPI 保存格式:TIFF、JPG、CEB、PDF等。
掃描加工生產(chǎn)軟件系統(tǒng)針對文件、檔案管理工作的特點,通過集合圖像處理、OCR等多項自動化智能技術(shù),實現(xiàn)處理掃描圖像自動糾偏、除黑邊、去污等處理,實現(xiàn)掃描文件自動命名與裝訂,生成多頁TIF文件,通過OCR識別技術(shù)實現(xiàn)電子文件元數(shù)據(jù)半自動獲取,在大幅度提高掃描加工的工作效率的同時,可以完成電子文件元數(shù)據(jù)的獲取工作,并在保證掃描圖像文件質(zhì)量前提下,以最低的容量存儲文件。主要功能介紹
①自動掃描與目錄圖象屬性加工設(shè)置;
②自動傾斜校正/去黑邊/去白頁/加粗/A3切割為A4; ③前置處理設(shè)置:去斑、亮度/對比度、顏色通道設(shè)置; ④自動文件命名;
⑤自動裝訂(將多個單頁TIF文件合并為1個多頁TIF文件),支持固定頁分割、白頁分割、標志按鈕分割;
⑥自動JPG輸出質(zhì)量設(shè)置;
⑦自動掃描頁計數(shù)(見主界面掃描計數(shù)器),目錄中文件與頁數(shù)自動統(tǒng)計。
根據(jù)各檔案館(室)在處理歷史檔案問題的經(jīng)驗,結(jié)合我公司圖像處理技術(shù)上的優(yōu)勢,特提出了檔案數(shù)字化制作流程及相應(yīng)的技術(shù)參考。
1、檔案分類整理
檔案分類整理是指將案卷按掃描要求進行分解整理,包括原件的拆卷、起釘、粘貼頁撕開。并按掃描后的電子文件組織形成進行分類,以便掃描時的批次處理。
2、檔案交接
分類整理后的檔案按時間先后或其他分類項順序提出,并按實際卷(頁)數(shù)填寫詳細的檔案交接清單,并由雙方管理人員簽字。
3、標引著錄
標引著錄為了方便查閱與管理,打印制作檔案目錄及檔案封面,對文字錄入的準確性要求較高,但著錄的文本域并不是完全統(tǒng)一的在某一頁面上,一些文本域要在多個文件中選擇,所以錄入時需要相關(guān)檔案管理人員進行指導,制作相應(yīng)的《文字錄入工作說明書》,確保文本域錄入的準確率。
4、檔案的掃描
原件的掃描與存儲格式完全按照國家檔案管理的統(tǒng)一標準要求掃描。掃描圖像使用先進的圖像掃描處理軟件,掃描人員可根據(jù)原稿質(zhì)量,對系統(tǒng)進行定義,如傾斜校正、去污等批處理功能。在由系統(tǒng)自動處理功能的同時,掃描人員根據(jù)原件的實際情況做相應(yīng)的調(diào)整,如超大頁面的處理、紙張顏色深淺及薄厚的處理、掃描時可根據(jù)不同原件的情況,調(diào)整圖像的分辨率、明暗度以及掃描方式和掃描速度,確保在掃描圖像質(zhì)量清晰的情況下,使原件完好無損。圖像的分辨率正常情況下為150dpi,如遇字間距和行間距過密、原件本身是復印件等字跡不清楚的情況,可適當增加掃描的分辨率,但要保證圖像清晰的同時,又不影響遠程查詢和瀏覽的速度。
5、圖像處理
檔案數(shù)字化制作模塊中的圖像處理采用自動化處理和人工處理相結(jié)合的方式,確保圖像質(zhì)量的完美。通過對圖像進行校對,確保圖像順序正確,在校對時,發(fā)現(xiàn)不合格圖像及時返回前一工序進行改正。
1)污漬、黑白、偏斜處理 2)全文字面的掃描密度 3)粘帖頁與表格 4)插頁
5)照片頁的處理
6)存儲格式與面頁空間 分辨率:100-300dpi 圖像格式:TIF、JPG、PDF、CEB 儲存空間:A4,黑白二值,40-50KB/頁
6、質(zhì)量檢驗
對掃描處理完成后的圖像頁進行檢驗,對檔案拆分、掃描、修正、去污、插圖、照片的處理以及文本和圖像頁的匹配等質(zhì)量進行全面檢驗。對文本域錄入與文本錄入域的標引、文件的頁號及頁數(shù)進行對比,對掃描前圖像頁的標引與掃描后的圖像頁的編號與頁數(shù)進行對比,發(fā)現(xiàn)不合格的登記清單并退回上一流程重新處理。
7、掛接
文本域錄入和掃描處理檢驗后的圖像成品,由系統(tǒng)自動進行文字圖像與系統(tǒng)的匹配掛接。掛接到檔案數(shù)據(jù)庫系統(tǒng)中后,進行再次的成品驗收。
8、案卷整理
檔案整理工作嚴格按照國家檔案局規(guī)定的相關(guān)標準和本單位實際情況進行有序的整理,安排專人負責案卷合并與整理。
9、入庫交接
裝訂還原后的檔案按時間先后或其他分類項順序入庫,并按實際卷(頁)數(shù)填寫詳細的檔案交接清單,并由雙方管理人員簽字。
檔案資料是歷史的見證、社會的財富,無論在國內(nèi)還是國外都對其價值與重要性給予了高度的重視。但是,由于傳統(tǒng)的檔案保存方式一直采用紙張保存和目錄式管理,不僅占用了大量庫房空間,管理成本高,保管時易損壞,如紙張易黃、易粘、易脆,而且查閱、利用非常不便;雖然目前有部分單位使用計算機管理,但其多數(shù)是基于目錄級的管理,文檔資料本身仍以紙張形式存在,其管理、查詢與利用仍需要在庫房中進行,因此并沒有解決傳統(tǒng)純粹紙張化文檔資料管理所固有的成本高、效率低、原件容易損毀等問題。
如何安全、有效地管理日益龐大的檔案信息并能滿足快速查詢的需求?建立一套完整的、自動化的、擴展性強的文檔信息管理系統(tǒng)已勢在必行。
一、目前現(xiàn)狀
1.傳統(tǒng)的檔案數(shù)據(jù)庫中分類信息復雜,需靠手工查詢紙張原件,響應(yīng)速度慢。
2.由于檔案量巨大,當需要查詢檔案時,需花費幾個小時甚至一天的時間在檔案室查找。耗時、耗力。
3.由于檔案需長期保存,為提高存儲環(huán)境,避免可能造成文檔紙張受潮、蟲蝕以及火災等災害,每年大量投
入文檔的保管經(jīng)費已在所難免,且因無備份而又為每年不得不有的文檔損失擔憂。
4.由于檔案需反復查閱,不可避免的存在原件受損或遺失,給文檔的保管與利用帶來管理上的困擾。
5.在已認知的低檔平板掃描儀錄入的方式下,大量文檔的電子化進程是不可想象和解決的,且大量電子化文
檔如何管理、查閱、應(yīng)用有待全面解決。
二、解決方案
高速文檔掃描儀:富士通掃描儀 E-DOCscan 文檔自動掃描軟件
MaxAttach NAS 4000存儲器
服務(wù)器:自選
數(shù)據(jù)庫:SQL或Oracle 大型數(shù)據(jù)庫軟件
軟件:數(shù)字化檔案管理軟件
操作系統(tǒng): 服務(wù)器端 Windows2000Server+IIS5.0 以上
客戶端 Windows9X+IE5.0 以上
其它設(shè)備:打印機、條碼打印機等
檔案數(shù)字化方案制定與實施 長春市檔案局 梁 偉 李學廣
館藏傳統(tǒng)載體檔案數(shù)字化的問題,許多地方檔案館進行了實踐,積累了一定的經(jīng)驗,對全國檔案數(shù)字化建設(shè)起到了推動作用。但是,總結(jié)以前我國檔案數(shù)字化建設(shè)的不足和失誤,往往不是信息技術(shù)支持不夠,而是絕大多數(shù)都知道搞數(shù)字化,但檔案數(shù)字化目的是利用的主題不突出,忽略檔案開放鑒定與數(shù)字化檔案利用的邏輯關(guān)系,對先剔除無用檔案后開展數(shù)字化的思路不明確,沒很好研究檔案數(shù)字化的整體效果就大張旗鼓地做起來了。進而出現(xiàn)數(shù)字化目錄數(shù)據(jù)和全文數(shù)據(jù)不對應(yīng)、找不著或不好用等問題不少,檔案數(shù)字化的量雖多,但能上網(wǎng)利用或者說能上互聯(lián)網(wǎng)利用的很少,數(shù)字化返工的現(xiàn)象比較突出,使有限的資金投入并沒有體現(xiàn)在數(shù)字化檔案的利用效益上,這一點已引起檔案系統(tǒng)管理和技術(shù)高層領(lǐng)導的重視,許多實踐工作者已開始進行有益的探索。
面對網(wǎng)絡(luò)時代公眾迫切需要遠程、公開、快捷的檔案信息,面對館藏浩瀚如海的案卷,面對當前我國檔案數(shù)字化需要解決的一系列問題,長春市檔案館與中國人民大學信息資源管理學院共同承擔了國家檔案局科技項目《檔案數(shù)字化方案研究》。該項目經(jīng)過課題研究人員的共同努力,已取得初步研究成果。通過課題研究,對檔案數(shù)字化方案的研究提出了一些觀點和看法,大家交流和討論。
一、確定檔案數(shù)字化指導思想與原則
檔案數(shù)字化指導思想是:以需求為導向,以利用為目的,充分利用計算機軟硬件功能,最大限度發(fā)揮人力資源和數(shù)字化加工設(shè)備能力,保護館藏檔案原件完好,保證數(shù)字化檔案真實準確,更好地發(fā)揮檔案信息資源的作用。
檔案數(shù)字化原則是:遵循重要檔案數(shù)字化的價值性原則、常用檔案數(shù)字化的實用性原則、開放檔案數(shù)字化的開放性原則、褪跡檔案數(shù)字化的搶救性原則,解密檔案數(shù)字化的及時性原則,目錄數(shù)字化與全文數(shù)字化分步的時效性原則,檔案數(shù)字化加工與利用同步的一致性原則。
二、明確檔案數(shù)字化策略
(一)需求導向,急用先上策略
1.需求導向策略
社會需求對檔案利用的影響應(yīng)該是檔案工作者特別關(guān)注的問題。我們用統(tǒng)計數(shù)字加以分析。
(1)隨著編史修志工作納入各地工作規(guī)劃,1986年全國省(區(qū)、市)綜合檔案館接待編史修志查檔卷數(shù)占利用總卷數(shù)的69%。隨著編史修志階段性高潮過去,2003年全國?。▍^(qū)、市)綜合檔案館接待編史修志查檔卷數(shù)占利用總卷數(shù)的28%。下降41個百分點。(此數(shù)據(jù)來自國家檔案局法規(guī)司保存的檔案統(tǒng)計年)(2)隨著社會保障制度的建立和國有企業(yè)改革的深入,長春市檔案館查閱工人調(diào)配檔案卷數(shù)占利用總卷數(shù)的百分比,由2002年的1%增加到2004年的占利用總卷數(shù)的68%。(此數(shù)據(jù)來自長春市檔案館利用統(tǒng)計數(shù)據(jù)庫)由此看出,國家、地方新政策的出臺和工作部署對檔案利用的影響程度。從宏觀上講,檔案利用已實現(xiàn)了兩個轉(zhuǎn)變,服務(wù)重點由政治領(lǐng)域轉(zhuǎn)變?yōu)榻?jīng)濟領(lǐng)域,服務(wù)對象由機關(guān)干部擴展到公眾百姓,特別是為百姓提供憑證案例急劇上升。用動態(tài)觀念研究當前與長遠社會對檔案的需求,并指導檔案數(shù)字化與利用服務(wù)工程實踐應(yīng)該是檔案部門的必然選擇。
2.急用先上策略
地方檔案館館藏檔案數(shù)量眾多。但并不是所有檔案都在現(xiàn)實中利用,有相當大一部分多年不用。2004年全國?。▍^(qū)、市)綜合檔案館檔案平均利用率僅為1.6%。雖然檔案館眾多全宗中當?shù)攸h委、政府全宗利用率高是一般規(guī)律,但其他全宗利用情況往往和政策、時間的變化而變化,影響更大。所以,各級地方檔案館按照近期利用統(tǒng)計情況和發(fā)展趨勢確定數(shù)字化的先后順序是科學的選擇,利用優(yōu)化理論進行檔案數(shù)字化篩選,快速反應(yīng),突擊完成急用檔案數(shù)字化任務(wù),能夠達到更好地發(fā)揮檔案作用的目的,實現(xiàn)即時投入使用的預期。(此數(shù)據(jù)來自國家檔案局法規(guī)司保存的檔案統(tǒng)計年報)(二)本級為主,分步實施策略
(1)本級為主策略
根據(jù)檔案館職能分工和檔案來源原則,各級地方檔案館永久檔案絕大多數(shù)是本級機關(guān)形成的,一般都占50%以上,這部分檔案自然是當?shù)貦n案館數(shù)字化的重點。同時,地方檔案館都保管著大量的上級檔案文件,館際之間上級檔案文件重復是必要的,這些紙質(zhì)文件來源一般都是上級機關(guān)統(tǒng)一印制的。進入信息時代,地方檔案館都面臨著保管的上級檔案文件全文數(shù)字化問題,特別是上級檔案文件的開放鑒定審查問題,與其各地分頭審查上級檔案文件開放和進行數(shù)字化,不如國家檔案局著手進行檔案全文數(shù)字化和開放鑒定分工、協(xié)作,向館際共建、共享已有鑒定和數(shù)字化成果的方向發(fā)展。地方檔案館堅持本級為主的原則,根據(jù)需要和可能適時、適量地進行利用頻繁政策性上級檔案文件的全文數(shù)字化,以滿足當前工作的急需,盡量減少檔案館多層的重復勞動。
(2)分步實施策略
館藏檔案數(shù)字化不可能一步到位,而且檔案室進館范圍檔案陸續(xù)進館,進館范圍檔案實施檔案數(shù)字化館室共建、共贏、共享的策略非常重要。在具體實施過程中,文件級目錄數(shù)據(jù)庫建設(shè)是最基礎(chǔ)性的工作,是第一位需要建全的,但并一定是文件級目錄數(shù)據(jù)庫建成后再建其它數(shù)據(jù)庫。專題數(shù)據(jù)庫建設(shè)是根據(jù)現(xiàn)實需要而適時建立。全文數(shù)據(jù)庫建設(shè)是滿足信息檢索需要而必須加快建設(shè)的數(shù)據(jù)庫。
(三)剔除無用,避免浪費策略
1.剔除無用策略
地方檔案館館藏現(xiàn)行檔案主要來自于機關(guān)各個立檔單位,其檔案文件進館的決定權(quán)掌握在立檔單位文檔人員手里,加之國家檔案保管期限表幾經(jīng)修改和許多條款至今還比較籠統(tǒng),所以,不該歸檔的、不該進館的、文件重復的檔案進館頗多。特別是建國超過50年以后,半數(shù)左右長期保管的檔案逐年超過保管期的最上限,這些檔案實際上絕大多數(shù)已失去保存和利用的價值,但它們?nèi)哉紦?jù)著檔案管理的各種資源。
2.避免浪費策略
面對數(shù)字化方法的選擇,剔除無用,避免浪費應(yīng)該是一種長久策略,把大量失去保存價值的檔案先剔除,避免把無用檔案數(shù)字化,再造數(shù)字化垃圾。
三、優(yōu)選檔案數(shù)字化技術(shù)與業(yè)務(wù)路線
檔案數(shù)字化建設(shè)周期長,信息技術(shù)又處在快速發(fā)展之中,各個檔案館數(shù)字化基礎(chǔ)和條件不同。從本館實際出發(fā),優(yōu)選檔案數(shù)字化技術(shù)與業(yè)務(wù)路線特別重要。
(一)計算機新技術(shù)與檔案數(shù)字化業(yè)務(wù)的有機結(jié)合
信息技術(shù)的發(fā)展給檔案數(shù)字化效率和質(zhì)量的提高帶來深刻的影響,本著技術(shù)為需求服務(wù)的理念,無論是利用哪一種檔案管理系統(tǒng),都要適應(yīng)檔案數(shù)字化流程重組和再造需要,適時進行軟件升級,通過軟件升級固化技術(shù)與流程重組與創(chuàng)新,使檔案數(shù)字化的效果更好。同時,設(shè)計符合國家標準與適應(yīng)自身需要的數(shù)據(jù)庫結(jié)構(gòu),使檔案數(shù)字化的過程優(yōu)化,數(shù)字化檔案的利用快捷。
(二)檔案鑒定與數(shù)字化同步
鑒定與數(shù)字化同步的目的是加快數(shù)字化檔案信息的利用。在計算機網(wǎng)絡(luò)環(huán)境下同步進行檔案鑒定與數(shù)字化工作是發(fā)展趨勢。這種檔案鑒定是以剔除無用檔案為前提,以鑒定檔案開放為主,按需求篩選全文數(shù)字化檔案,為適時提供數(shù)字化檔案信息服務(wù)打基礎(chǔ)的過程。
(三)檔案數(shù)字化與上網(wǎng)利用同步
數(shù)字化檔案分開放與不開放兩種。在計算機網(wǎng)絡(luò)環(huán)境中,在確定檔案開放與不開放的同時,開放檔案即上互聯(lián)網(wǎng)。開放與不開放檔案數(shù)據(jù)在局域網(wǎng)中即時使用。
案字及理程組可
檔數(shù)化管流重不能
一次到位,它一個管理思想不斷地變化的過程,適時把新技術(shù)和新理念納入進去是非常重要的。
四、細化檔案數(shù)字化操作方法
實踐證明,在計算機網(wǎng)絡(luò)環(huán)境下,檔案數(shù)字化和利用服務(wù)工程以建立流水作業(yè)線,提高工作效率和效益為最佳方式。
(一)優(yōu)化配置各種資源
檔案數(shù)字化建設(shè)需要投入,特別是建設(shè)初期軟硬件配置投入較大,建成后也要保持一定的運行成本。地方檔案館在具備一定檔案數(shù)字化條件的基礎(chǔ)上,要按照成本效益最大化理論,根據(jù)不同的情況,進行檔案專業(yè)人員和數(shù)字化技工人員、計算機和掃描設(shè)備的合理搭配,優(yōu)化檔案數(shù)字化各種資源配置,提高檔案數(shù)字化建設(shè)的投入產(chǎn)出比,構(gòu)建檔案數(shù)字化投入小產(chǎn)
是出大的新模式。
1.計算機網(wǎng)絡(luò)環(huán)境下檔案數(shù)字化與利用服務(wù)工程流水線資源配置案例
(二)首先建立文件級目錄數(shù)據(jù)庫
滿足一般檢索和管理的需要,建好檔案文件級目錄數(shù)據(jù)庫。目前,絕大多數(shù)綜合檔案館,由于沒有實現(xiàn)全部檔案的文件級目錄機檢,查找檔案不快、不準、不全的問題普遍存在。另外,檔案的統(tǒng)計單位主要是卷和延長米,而檔案的最小單位是文件的件數(shù),以件為單位的底數(shù)不清是普遍存在的問題。所以,把文件級目錄數(shù)據(jù)庫建設(shè)作為一項基礎(chǔ)性工作,在提高檔案的查全率、查準率的同時,利用計算機實現(xiàn)檔案以件數(shù)為基本單位的管理是非常必要的。
1.高度重視文件級目錄數(shù)據(jù)錄入的前期處理。檔案館的案卷來自各個立檔單位,案卷是由文檔人員在檔案局業(yè)務(wù)人員指導下形成的。但是,由于文檔人員變動頻繁、檔案業(yè)務(wù)指導面多線長,案卷質(zhì)量難以適應(yīng)計算機精確管理的需要,加之個別文件形成時的先天不足,給文件級目錄數(shù)據(jù)庫建設(shè)帶來許多麻煩。實踐證明,進行文件級目錄錄入的前期處理,拋開原有的文件目錄,按卷內(nèi)實有文件一一錄入,把題名不反映主題、目錄與實體不符等一系列問題一并處理是非常必要的。
2.科學合理地設(shè)計數(shù)據(jù)庫結(jié)構(gòu)。文件級目錄數(shù)據(jù)庫結(jié)構(gòu)包含三方面功能為最佳。一是符合國家有關(guān)標準及實際情況,文件題名、責任者等滿足文件檢索需要的字段。二是存毀、開放、掃描等數(shù)字化加工階段利用的字段。三是數(shù)據(jù)錄入、校對、鑒定、審查等標明責任的字段。
3.數(shù)據(jù)質(zhì)量是數(shù)據(jù)庫的生命。建立在計算機環(huán)境下,以上網(wǎng)公開利用為根本目的文件級目錄數(shù)據(jù)庫,與紙質(zhì)文件目錄有本質(zhì)的區(qū)別。紙質(zhì)文件目錄有問題只有檔案館內(nèi)部少數(shù)人知道,利用者并不清楚。但是,文件級目錄數(shù)據(jù)庫進入網(wǎng)絡(luò),特別是向社會公開的部分,對數(shù)據(jù)庫的質(zhì)量要求是相當高的,數(shù)據(jù)質(zhì)量也是當前制約許多數(shù)據(jù)上網(wǎng)利用的瓶頸之一。
(三)適時建立專題數(shù)據(jù)庫
滿足特殊檢索需要,適時建立檔案專題數(shù)據(jù)庫。館藏檔案僅靠文件級目錄數(shù)據(jù)庫是不可能解決全部檢索問題的。隨著客觀需要的變化,對某一專題檔案有集中利用的需求是經(jīng)常發(fā)生的,突擊建立專題數(shù)據(jù)庫,滿足社會需求,是檔案館與時俱進的突破口,也是充分發(fā)揮檔案作用的最佳時機。主要把握三個方面:一是根據(jù)館藏檔案內(nèi)容確定專題數(shù)據(jù)庫的總體布局。二是按需求分期建立專題數(shù)據(jù)庫。三是根據(jù)文件內(nèi)容和檢索需要分別設(shè)立不同的專題數(shù)據(jù)庫結(jié)構(gòu)。
(四)優(yōu)選建立全文數(shù)據(jù)庫
滿足信息檢索的需要,建立檔案全文數(shù)據(jù)庫。按照國家檔案局提出的重點的、利用頻繁的檔案首先實現(xiàn)全文數(shù)字化的要求,按照“二八”定律,即以20%的努力達到80%的效果,通過多年檔案利用統(tǒng)計數(shù)據(jù)分析,優(yōu)先全文數(shù)字化檔案的全宗、年代。在網(wǎng)絡(luò)中、在文件級目錄的基礎(chǔ)上同步進行檔案存毀、開放、數(shù)字化鑒定與篩選,進而形成與文件級目錄一一對應(yīng)的全文數(shù)據(jù)庫,并確保數(shù)字化檔案的真實、準確。
(五)檔案數(shù)據(jù)庫的管理
為了檔案數(shù)字化與利用同步和數(shù)據(jù)安全管理的需要,檔案數(shù)據(jù)庫分在建數(shù)據(jù)庫和成果數(shù)據(jù)庫兩大類。
1.在建數(shù)據(jù)庫的設(shè)立。在建數(shù)據(jù)庫是為了數(shù)字化加工所設(shè)立的動態(tài)庫,是數(shù)據(jù)不斷變化的數(shù)據(jù)庫。例如,設(shè)立文件級目錄數(shù)據(jù)錄入庫,它是每個錄入人員都分配給操作權(quán)限的動態(tài)庫,屬于在建數(shù)據(jù)庫。而完成的文件級目錄數(shù)據(jù)庫則是成果庫。但是,在鑒定及全文數(shù)字化加工過程中它又成為全文數(shù)字化加工在建數(shù)據(jù)庫。
2.成果數(shù)據(jù)庫的使用。成果數(shù)據(jù)庫只分配使用權(quán)限,只有特殊需要時經(jīng)批準才分配數(shù)據(jù)改變的操作權(quán)限。
3.數(shù)據(jù)的管理與監(jiān)督
建立技術(shù)負責人、超級管理員、數(shù)據(jù)管理員連鎖責任制,實行審批者沒有數(shù)據(jù)操作權(quán),超級管理員只允許分配權(quán)限不允許使用數(shù)據(jù)操作權(quán),數(shù)據(jù)管理員只有需要時經(jīng)批準使用數(shù)據(jù)操作權(quán),用后即刻收回。給予單位領(lǐng)導和相關(guān)中層干部全部數(shù)據(jù)的查看權(quán),每天24小時可以時時對數(shù)據(jù)質(zhì)量進行監(jiān)督,形成數(shù)據(jù)管理監(jiān)督新機制。
(六)數(shù)字化檔案利用服務(wù)工程
數(shù)字化檔案利用服務(wù)工程是以搞活數(shù)字化檔案利用的目的,以局域網(wǎng)、政務(wù)網(wǎng)、互聯(lián)網(wǎng)為平臺,通過建立數(shù)據(jù)安全管理制度、網(wǎng)絡(luò)安全運行制度和具有法律責任的網(wǎng)管、數(shù)據(jù)管理員、數(shù)字化加工人員、提供利用人員連鎖責任制,環(huán)環(huán)相扣,從措施上保證數(shù)字化檔案的準確。通過防火墻、CA認證、數(shù)字水印、電子簽章、權(quán)限控制等計算機新技術(shù),從技術(shù)上保證數(shù)據(jù)的安全,利用網(wǎng)絡(luò)實現(xiàn)檔案的法律效力,實現(xiàn)遠程為利用者提供快捷、準確數(shù)字化檔案的目標。
1.在局域網(wǎng)上應(yīng)用
在局域網(wǎng)內(nèi),檔案在建和成果數(shù)據(jù)庫所有接待人員都有檢索權(quán)限,對只進行目錄數(shù)字化的檔案實行現(xiàn)用現(xiàn)掃描全文的方法使之達到已全文數(shù)字化的檔案一樣效果,利用網(wǎng)絡(luò)技術(shù)實現(xiàn)數(shù)字化檔案利用替代檔案原件利用、計算機打印件替代復印機復印件、電子簽章替代手工蓋章、接待人員和利用者不接觸檔案原件的目標。從而起到了運用數(shù)字檔案高效利用、保護原件的作用。并積累了利用者憑加蓋電子簽章的數(shù)字檔案打印件辦理社會保險的成功案例,其數(shù)字化檔案的法律效力得到認可,為檔案館參與電子政務(wù)開辟了新途徑。
2.在互聯(lián)網(wǎng)上應(yīng)用
利用檔案網(wǎng)站,通過CA證書等安全手段,不但實現(xiàn)了領(lǐng)導遠程數(shù)據(jù)上傳的審批,主要是開展開放檔案遠程查詢、下載、打印。特別是把CA證書發(fā)給立檔單位或使用單位檔案室,為CA用戶遠程提供檔案證明和數(shù)字化檔案法律效力的體現(xiàn),減少異地現(xiàn)場查詢的不便,使檔案館參與電子政務(wù)成為現(xiàn)實。
五、加強檔案數(shù)字化工作的行政管理
檔案數(shù)字化涉及檔案館內(nèi)部許多部門,加強組織管理工作顯得十分重要,“三分技術(shù)七分管理”同樣適合檔案數(shù)字化與利用服務(wù)工程。各個檔案館涉及檔案數(shù)字化加工和利用的內(nèi)部組織機構(gòu)設(shè)置不盡相同,但應(yīng)按照效率優(yōu)先的原則,在計算機環(huán)境下,把數(shù)據(jù)錄入、鑒定、數(shù)字化加工、整理、數(shù)字化檔案利用形成一個流水線,打破內(nèi)部行政分工界限是發(fā)展趨勢。無論是采取那種組織形式,優(yōu)化人員組合重新分工在所難免,各個檔案館在組織實施方面有所不同是必然的。
1.加強計劃管理
檔案數(shù)字化建設(shè)是一項復雜的系統(tǒng)工程, 針對實際的調(diào)研和論證,運用科學方法預測,制定科學配置各種資源進行檔案數(shù)字化的總體規(guī)劃和專項計劃,通過計劃謀求管理系統(tǒng)的外部環(huán)境、內(nèi)部條件、決策目標三者在動態(tài)上的平衡,實現(xiàn)管理決策所制定的各項目標。
2.強化組織實施
實施是一個復雜的活動過程,檔案數(shù)字化建設(shè)又是一項全新的工作,技術(shù)含量高,涉及到許多因素,在實施過程中會出現(xiàn)各種各樣的矛盾和困難,會遇到來自各方面的干擾,實施特別強調(diào)解決問題的及時性。通過創(chuàng)新行政管理與技術(shù)管理相互作用的新機制,實施有效的組織、指揮、協(xié)調(diào)、激勵工作,保證檔案數(shù)字化的計劃目標的順利實現(xiàn)。
3.增強管理的技術(shù)含量
檔案數(shù)字化的建設(shè)過程貴在控制,重在管理。利用計算機進行檔案數(shù)字化,任何一個邏輯錯誤,都會給數(shù)據(jù)的管理和使用帶來麻煩或隱患。在互聯(lián)網(wǎng)上公開不真實、不準確的檔案,將在世界范圍內(nèi)產(chǎn)生不良影響。特別是在網(wǎng)絡(luò)環(huán)境下的流水作業(yè),上一道工序一定要為下一道工序負責,各道工序工作量的對等與匹配同樣重要,這必然要求行政、技術(shù)、質(zhì)量管理的網(wǎng)絡(luò)化。實踐證明,建立數(shù)字化進度數(shù)據(jù)庫、數(shù)字化質(zhì)量反饋庫、檔案利用登記數(shù)據(jù)庫,給局館領(lǐng)導和相關(guān)人員分配使用權(quán)限,通過技術(shù)手段將全面質(zhì)量管理思想引入檔案數(shù)字化建設(shè),實現(xiàn)全程管理、適時控制,達到強化數(shù)字化檔案質(zhì)量保證體系的目的。檔案數(shù)字化與利用服務(wù)工程是一項長期的任務(wù),需要從理論上解決的問題很多,需要在實踐中探索的問題也不少,我們將繼續(xù)深化研究與實踐。
檔案數(shù)字化加工服務(wù)
提供紙質(zhì)檔案數(shù)字化加工服務(wù)
所謂數(shù)字化(digitization)是指用計算機技術(shù)將模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程。紙質(zhì)檔案數(shù)字化就是采用掃描儀或數(shù)碼相機等數(shù)碼設(shè)備對紙質(zhì)檔案進行數(shù)字化加工,將其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上并能被計算機識別的數(shù)字圖像或數(shù)字文本的處理過程。紙質(zhì)檔案數(shù)字化的基本原則是使檔案信息資源能準確、方便、快捷地提供利用,使可以公開的檔案信息資源得到共享,以滿足社會或行業(yè)對檔案利用的需求。
1、檔案數(shù)字化加工的基本原則
1)確定數(shù)字化對象應(yīng)當對所要進行數(shù)字化的對象按照一定的原則和方法進行確認,只有符合一定要求的紙質(zhì)檔案文獻才能進行數(shù)字化加工。2)符合國家法律法規(guī)紙質(zhì)檔案的數(shù)字化,必須符合國家檔案開放規(guī)定或本行業(yè)相關(guān)規(guī)定。3)價值性原則屬于歸檔范圍且應(yīng)永久或長期保存的、社會利用價值高的檔案可列入數(shù)字化加工的范圍。
2、數(shù)字化加工流程 紙質(zhì)檔案數(shù)字化加工的基本環(huán)節(jié)主要包括:檔案整理、檔案掃描、圖像處理、圖像存儲、目錄建庫、數(shù)據(jù)掛接、數(shù)據(jù)驗收、數(shù)據(jù)備份、成果管理等。
3、數(shù)字化建設(shè)的目標
數(shù)字化建設(shè)的目標是使檔案館(室)現(xiàn)有的檔案文件資料全部實現(xiàn)數(shù)字化處理,建立健全檔案目錄數(shù)據(jù)庫、現(xiàn)行文件全文數(shù)據(jù)庫和多媒體數(shù)據(jù)庫(照片、音頻、視頻等),通過數(shù)據(jù)接口和政務(wù)辦公系統(tǒng)連通,用先進的數(shù)字化檔案管理系統(tǒng)提供安全、高效的管理和利用,實現(xiàn)真正的資源共享。
4、數(shù)字化的意義
1)提高工作效率,降低檔案利用成本
數(shù)字化加工項目完成后,社會公眾(開放檔案)和單位的各級領(lǐng)導、各部門或下屬單位都能通過數(shù)字化檔案管理系統(tǒng)即時查詢利用所需要的電子文檔數(shù)據(jù)原文(件)信息,避免了傳統(tǒng)檔案利用方法對檔案資料實體的多次輾轉(zhuǎn)所造成的大量時間浪費和重復勞動現(xiàn)象,從而提高工作效率,降低檔案信息利用的成本。2)最大限度保管和保護庫存檔案實體安全
由于傳統(tǒng)的檔案保存方式一直采用紙張保存和目錄管理,不僅占用了大量的庫存空間,而且利用仍需到庫房,管理成本高,檔案易受損,如紙張發(fā)黃、發(fā)粘、發(fā)脆等。因此目錄級檔案管理并不能從根本上解決檔案原件易損壞等問題。實現(xiàn)檔案數(shù)字化管理可以通過權(quán)限控制直接在網(wǎng)上查閱打印,減少了對庫存檔案的調(diào)閱次數(shù)和復印次數(shù),降低了庫存檔案的老化速度,解決了檔案反復借閱利用和檔案保管的矛盾,從而可以最大限度地對庫存檔案進行有效的保管和保護,確保檔案實體安全。3)陽光政務(wù) 提升形象
庫存檔案實現(xiàn)數(shù)字化、電子化管理,既是各級檔案管理部門貫徹科學發(fā)展觀,實施國家檔案事業(yè)“十一五”規(guī)劃的大事,又是促進檔案管理信息化、現(xiàn)代化的具體舉措;既是實際工作的需要,也是亮點工程。是一項利國利民具有重要意義的事情。數(shù)字化項目完成后,不僅檔案管理和利用手段實現(xiàn)了現(xiàn)代化,檔案利用效率大大提高,檔案發(fā)揮的作用顯著,還可以大大提升單位形象,符合政府和企事業(yè)單位各項工作科學化、規(guī)范化、網(wǎng)絡(luò)化、信息化的整體發(fā)展要求。
廣州依貝盛軟件科技有限公司紙質(zhì)檔案數(shù)字化加工中心,擁有先進的掃描加工設(shè)備和專業(yè)的掃描隊伍,面向全國用戶單位提供專業(yè)文檔影像解決方案和快速高效的加工服務(wù)。依靠在檔案資源數(shù)字化建設(shè)方面的獨特優(yōu)勢,以及在文檔數(shù)字化掃描方面積累的豐富的經(jīng)驗,對于文檔資料的整理、掃描和提供利用等掃描加工的各個環(huán)節(jié),均能夠提供給用戶優(yōu)質(zhì)與專業(yè)的方案和服務(wù)。
加工中心將遵照國家相關(guān)的數(shù)字化加工標準,按照用戶的需求,提供對紙質(zhì)文件資料的數(shù)據(jù)錄入、掃描、條目掛接、壓縮、光盤刻錄、生成查詢與瀏覽系統(tǒng)等業(yè)務(wù)。
5、服務(wù)范圍
廣州依貝盛科技檔案數(shù)字化工程事業(yè)部嚴格遵守數(shù)字化行業(yè)標準和保密規(guī)定,開展政府公文檔案、國土檔案、城建房地產(chǎn)檔案、醫(yī)藥衛(wèi)生檔案、銀行金融檔案、企事人事檔案、聲像檔案等整理、掃描和數(shù)字化加工,涵蓋紙質(zhì)檔案、照片檔案、縮微膠片、多媒體聲像檔案等形式,為各級各類政府機關(guān)、檔案館、城建、學校、醫(yī)院、法院、金融、保險、物流等單位提供高品質(zhì)的檔案數(shù)字化服務(wù)。
6、檔案數(shù)字化工程示意圖
淺論房地產(chǎn)權(quán)屬檔案的數(shù)字化管理——德陽市房地產(chǎn)管理處
淺論房地產(chǎn)權(quán)屬檔案的數(shù)字化管理
德陽市房地產(chǎn)管理處
房地產(chǎn)權(quán)屬檔案是城市房地產(chǎn)行政管理部門在房地產(chǎn)權(quán)屬登記、調(diào)查、測繪、權(quán)屬轉(zhuǎn)移、變更等房地產(chǎn)權(quán)屬管理工作中直接形成的有保存價值的文字、圖表、聲像等不同形式的歷史記錄,是城市房地產(chǎn)權(quán)屬登記管理工作的真實記錄和重要依據(jù),是城市建設(shè)檔案的組成部分。
隨著科學技術(shù)的發(fā)展,以計算機技術(shù)為核心的現(xiàn)代信息處理技術(shù)正在深入到房地產(chǎn)檔案管理之中,檔案管理以手工管理為主的傳統(tǒng)手段正在發(fā)生變化,逐漸向采用現(xiàn)代先進技術(shù)手段過渡。通過網(wǎng)絡(luò)為支撐的計算機技術(shù),極大地促進了房地產(chǎn)檔案管理模式的重大改變,實現(xiàn)了房地產(chǎn)檔案信息收集、整理、查詢、利用管理的現(xiàn)代化。檔案數(shù)字化,其手段就是對檔案實現(xiàn)全文存儲,它在檔案信息管理系統(tǒng)中采用目錄進行管理,把全文信息、圖像信息及其例覽功能集成于目錄數(shù)據(jù)中進行管理,以目錄數(shù)據(jù)為檢索人口,從而實現(xiàn)檔案圖文信息的全文檢索,具有查詢速度快、保存期限長、內(nèi)容全面完整,檔案利用不受時間、地點限制的優(yōu)點
數(shù)字化房地產(chǎn)權(quán)屬檔案的建立是對登記發(fā)證所產(chǎn)生的產(chǎn)權(quán)產(chǎn)籍信息庫的重要完善,登記發(fā)證所產(chǎn)生的信息只是數(shù)字化權(quán)屬檔案庫的檢索條目,即電子目錄,通過該檢索條目,可以不接觸檔案而查閱各種原始資料,全面了解房屋的產(chǎn)權(quán)狀況。
一、建立數(shù)字化權(quán)屬檔案的條件已成熟
目前,國內(nèi)幾乎所有城市的房管部門都已采用計算機系統(tǒng)進行登記發(fā)證,并采用局域網(wǎng)、數(shù)據(jù)庫技術(shù)對登記信息進行管理,但真正全面實現(xiàn)了權(quán)屬檔案數(shù)字化的地方并不多,其原因除實現(xiàn)權(quán)屬檔案數(shù)字化還沒有一套完整的標準和規(guī)范外,很重要的一點在于受當時技術(shù)條件的限制,例如沒有成熟的大容量存儲技術(shù)、高速掃描技術(shù)、模糊識別技術(shù)等。隨著科學技術(shù)的日益發(fā)展和計算機應(yīng)用的普及,實現(xiàn)房地產(chǎn)檔案管理現(xiàn)代化的條件已逐步成熟。換成以磁盤、光盤或磁帶為載體的檔案,首先要進行數(shù)字化處理,掃描和數(shù)字照相是最常用的技術(shù)。高速掃描技術(shù)能夠?qū)崿F(xiàn)每分鐘上千頁的雙面掃描,是以前每分鐘只能掃描幾頁的單面掃描技術(shù)無法比擬的。數(shù)碼相機雖也可以實現(xiàn)檔案快速成像,但對操作人員的技術(shù)要求較高,且不易實現(xiàn)程序控制。因此,高速掃描儀的出現(xiàn),為檔案數(shù)字化提供了最現(xiàn)實的手段。
圖像處理技術(shù),要保證數(shù)字化檔案圖像清晰、又不能占用過多的存儲空間,以提高在網(wǎng)絡(luò)應(yīng)用中的傳輸效率,必須對掃描圖像進行分析,在不影響效果的前提下自動采用更高效的存儲、壓縮格式,還要實現(xiàn)對圖像的自動識別分類,提高建庫效率;對要求全文存儲。全文檢索的檔案資料,在掃描建庫時,還需用到漢字識別技術(shù)。
數(shù)字化檔案必須有大容量、高效率的存儲介質(zhì),以前,由于技術(shù)的限制,硬盤存儲容量小、成本高,因而普遍采用容量大、成本低的光盤庫作為介質(zhì)。近年來,硬盤技術(shù)飛速發(fā)展,容量、可靠性均大幅提高,而成本卻下降了許多。目前,專用存儲克服了光盤庫檢索速度慢、機械故障高的缺點。
另外,通過十多年的信息化建設(shè),各地房管部門都培養(yǎng)了一批信息技術(shù)方面的專業(yè)人才,工作人員的計算機使用技能也大幅提高,各級領(lǐng)導也對本單位信息化建設(shè)前所未有地重視,把它作為提高管理服務(wù)水平和效率的重要手段,投入了大量人力、物力進行建設(shè)。
二、房地產(chǎn)數(shù)字化權(quán)屬檔案的內(nèi)容
房地產(chǎn)權(quán)屬檔案數(shù)字化是指將傳統(tǒng)的以紙張、錄音帶、錄像帶為存儲介質(zhì)的各種原始檔案資料,通過掃描(數(shù)碼攝像)、壓縮、轉(zhuǎn)化等手段轉(zhuǎn)換成圖片文件、聲音文件和錄像文件,再運用分級存儲管理技術(shù)將圖片、聲音、錄像等文件和索引字段存儲于磁盤、光盤、磁帶等大容量的存儲介質(zhì)上,并可通過各種方便的查詢手段迅速地檢索出所需要的檔案資料,可以發(fā)布到局域網(wǎng)、廣域網(wǎng)、企業(yè)內(nèi)部網(wǎng)、國際互聯(lián)網(wǎng),最終實現(xiàn)“數(shù)字化檔案館”。
數(shù)字化房地產(chǎn)權(quán)屬檔案管理應(yīng)包括以下內(nèi)容:
1、目錄管理
目錄管理是指房地產(chǎn)權(quán)屬檔案管理機構(gòu)對歸檔的房地產(chǎn)權(quán)屬文件材料進行分類編目,劃分密級,編制檢索工具的工作。由于采用計算機進行登記發(fā)證,各地房地產(chǎn)權(quán)屬檔案的目錄管理已基本實現(xiàn)了從簿式目錄、卡片式目錄向電子目錄的轉(zhuǎn)變,產(chǎn)權(quán)登記中的房屋所有權(quán)人、丘(地)號、房屋坐落(街道名稱、幢號、房號)、房屋平面圖號,他項權(quán)登記中的權(quán)利人,公、檢、法查封登記中的被執(zhí)行人、查封凍結(jié)標的地址,合同備案登記的合同號、買受人、房屋坐落等條目均可自動生成電子目錄,作為查詢檢索條件,只要定義好電子目錄與圖象庫的數(shù)據(jù)庫記錄的連接條件,即可根據(jù)要求檢索到要求的資料。數(shù)字化檔案對目錄管理有特殊的要求:
首先,要提供強大的系統(tǒng)編目功能,工作人員可以根據(jù)應(yīng)用需要生成檔案目錄表,查詢某一件(宗)產(chǎn)權(quán)登記的資料,或查詢某一種類型檔案資料,通過編目,可以簡單快速查閱。其次,要便于系統(tǒng)權(quán)限的設(shè)置,在數(shù)字化檔案系統(tǒng)中,電子目錄是檢索查閱檔案資料的唯一人口,根據(jù)服務(wù)對象的類型,電子目錄應(yīng)能判斷是否允許用戶進入。另外,還要便于檔案統(tǒng)計,檔案統(tǒng)計是對所有檔案的不同類別的詳細情況做出報表。所有這些都有利于檔案管理人員對檔案管理做出及時有效的決策。
2、檔案數(shù)字化
檔案數(shù)字化過程即指房地產(chǎn)權(quán)屬檔案的收集、整理和歸檔。根據(jù)《城市房地產(chǎn)權(quán)屬檔案管理辦法》,屬于建檔范圍內(nèi)的文件材料主要有三類:第一類是房地產(chǎn)權(quán)利人、房地產(chǎn)權(quán)屬登記確權(quán)、房地產(chǎn)權(quán)屬轉(zhuǎn)移及變更、設(shè)定他項權(quán)利等有關(guān)的證明和文件;第二類是房屋及其所占用的土地使用權(quán)權(quán)屬界定位置圖:房地產(chǎn)分幅平面圖、分丘平面圖、分層分戶平面圖等;第三類是房地產(chǎn)產(chǎn)權(quán)登記工作中形成的各種文件材料,包括房產(chǎn)登記申請書、收件收據(jù)存根。權(quán)屬變更登記表、房地產(chǎn)狀況登記表、房地產(chǎn)勘測調(diào)查表、墻界表、房屋面積計算表、房地產(chǎn)登記審批表、房屋滅籍申請表。房地產(chǎn)稅費收據(jù)存根等。這些文件材料頁面大小、紙張厚薄、紙質(zhì)均木一致,掃描建檔中應(yīng)有人工輔助過程,輔助工作融合到實物檔案的人工整理歸檔的過程中;對于超大頁面,可以采用工程掃描儀掃描,或低成本的數(shù)字照相方式;分幅平面圖、分丘平面圖、分層分戶平面圖已實現(xiàn)計算機制圖的,可以直接轉(zhuǎn)換為位圖格式存儲。如直接存儲矢量圖,查閱時還需要安裝專門的工具軟件,不利于檔案的方便利用,并且歸檔后的資料已不能修改,保留矢量圖已無必要。檔案掃描過程與目錄管理實現(xiàn)無縫連接,省去為文件取名、建立對應(yīng)關(guān)系等多余步驟,提高建檔效率。提高建檔效率在檔案數(shù)量龐大的房地產(chǎn)權(quán)屬檔案管理部門具有特別重大的意義,即使每頁的掃描建檔時間只節(jié)約幾秒,最終對整個工作進度的影響可能是幾個月,甚至上年。掃描圖像的存儲有兩種方式:文件方式和數(shù)據(jù)庫方式,文件方式雖然簡單易于實現(xiàn),但在檢索效率和安全性方面都得不到保障,只適合于速度、安全性要求不高的小型檔案庫。即使采用數(shù)據(jù)庫方式,當檔案數(shù)量大時,如幾十萬卷檔案的記錄數(shù)就有幾百萬,方案設(shè)計時應(yīng)注意選擇高性能、大容量的存儲系統(tǒng)。
3、檔案管理網(wǎng)絡(luò)化
網(wǎng)絡(luò)化(包括局域網(wǎng)和互聯(lián)網(wǎng))應(yīng)用是房地產(chǎn)權(quán)屬檔案的利用的主要形式,只有實現(xiàn)檔案管理網(wǎng)絡(luò)化,才能真正體現(xiàn)檔案數(shù)字化的各種優(yōu)勢,及時為房地產(chǎn)權(quán)屬登記、房地產(chǎn)交易、房地產(chǎn)糾紛仲裁、物業(yè)管理、房屋拆遷、住房制度改革、城市規(guī)劃、城市建設(shè)等各項工作提供服務(wù)。實現(xiàn)檔案管理網(wǎng)絡(luò)化解決了以前利用檔案的種種不便,可以使檔案利用不受時間和空間的限制,多人同時查詢檔案,不發(fā)生沖突。這些功能的實現(xiàn),讓使用單位提高工作效率,提高檔案信息的共享程度,優(yōu)化社會資源的配置。
三、數(shù)字化房地產(chǎn)權(quán)屬檔案管理的原則
數(shù)字化檔案作為檔案的一種基本形式既有檔案的基本特征,具有普通檔案不具備的特點,如信息的非人工識別性、對系統(tǒng)設(shè)備的依賴性、信息與載體的可分離性、信息的易改性等,因此,數(shù)字化檔案的管理有其特殊原則。
l、全程管理是數(shù)字化權(quán)屬檔案管理的基礎(chǔ)
全程管理是指必須建立一個完整的管理體系,對數(shù)字化房地產(chǎn)權(quán)屬檔案從產(chǎn)生到永久保存或銷毀的整個生命周期進行全程管理,這是基于信息技術(shù)而建立的數(shù)字化檔案管理理念,包括檔案管理的規(guī)則、方法、質(zhì)量要求,以及檔案從收集、整理、歸檔、利用各階段活動統(tǒng)籌兼顧,以實現(xiàn)整個系統(tǒng)(軟、硬件及信息)資源的最大共享和最大效益。
2、真實性、完整性是數(shù)字化權(quán)屬檔案的根本
真實性是指數(shù)字化檔案的內(nèi)容、結(jié)構(gòu)在經(jīng)過建立、利用后保持不變,與原始狀態(tài)一樣,完整性要求記錄房地產(chǎn)權(quán)屬登記活動的檔案內(nèi)容要件齊全,內(nèi)容。結(jié)構(gòu)及背景信息沒有缺損。真實性、完整性既是一種觀念,又是這種觀念通過技術(shù)手段在管理中的體現(xiàn),需要分別制定真實性、完整性的標準。
3、可讀性是數(shù)字化權(quán)屬檔案存在的意義
可讀性指檔案經(jīng)過存儲、傳統(tǒng)、壓縮。加密等處理后仍然能夠以可識讀、可理解的方式輸出,并保持真實性。如不能保證檔案的準確檢索查閱利用,數(shù)字化檔案也就失去了存在的價值。保障檔案的可讀性措施應(yīng)貫穿于全部管理工作的始終,要統(tǒng)一數(shù)字檔案的存儲格式、軟件環(huán)境,準確保存加密文件的加密、解密方式。
4、安全性是實施數(shù)字化權(quán)屬檔案的保障
安全性指的是系統(tǒng)硬件和軟件免受自然災害和人為破壞的能力,也指防止房地產(chǎn)權(quán)屬檔案的散失、泄密。安全性保障應(yīng)從制度著眼,技術(shù)手段著手,健全安全保密制度,合理設(shè)置用戶權(quán)限,堅持定期數(shù)據(jù)備份。
四、對房產(chǎn)管理部門建立數(shù)字化權(quán)屬檔案的建議
權(quán)屬檔案的數(shù)字化管理是房地產(chǎn)管理現(xiàn)代化的重要組成,當前正處于起步階段,針對有關(guān)實際情況提出幾點建議:
l、房地產(chǎn)權(quán)屬檔案的數(shù)字化應(yīng)當建立統(tǒng)一標準。國家檔案局已就電子文件檔案制定了標準,為全國性電子文件管理提供了普通規(guī)范。房地產(chǎn)權(quán)屬檔案的特性決定了其管理的獨特性,當前已經(jīng)建立了權(quán)屬數(shù)字化檔案的地方由于各種原因,沒有統(tǒng)一的規(guī)范和標準,有的在建設(shè)過程中還走了不少彎路,使用效果也不甚理想,因此,當務(wù)之急是建立一套適合于房地產(chǎn)管理的數(shù)字化檔案標準,規(guī)范和指導各地的權(quán)屬檔案現(xiàn)代化工作。
2、房地產(chǎn)權(quán)屬檔案數(shù)字化管理是一項系統(tǒng)工程,它不可能一蹴而就,必須在總體規(guī)劃的指導下,分階段有步驟地實施。數(shù)字化過程必須充分考慮到房地產(chǎn)檔案管理部門歷史上形成的數(shù)量龐大的存量檔案,以及每年數(shù)量急增的新增檔案,分別規(guī)劃設(shè)計合理的建檔流程。對存量檔案,可以考慮將利用率高、當前有效的權(quán)屬登記資料先行建檔,以保證數(shù)字化檔案庫能在較短的時間內(nèi)產(chǎn)生利用價值;新增檔案的數(shù)字化過程最關(guān)鍵的是不能影響日常正常的登記發(fā)證工作,建檔工作可安排在發(fā)證后,實物歸檔前進行。
3、培養(yǎng)一批既懂房地產(chǎn)業(yè)務(wù),又精通數(shù)字化檔案管理的人才。數(shù)字化檔案管理是一項跨學科、實踐性較強的工作,這種復合性人才是當前檔案管理中迫切需要的,培養(yǎng)這種人才應(yīng)當引起重視。
第五篇:檔案數(shù)字化方案制定與實施
檔案數(shù)字化方案制定與實施
館藏傳統(tǒng)載體檔案數(shù)字化的問題,許多地方檔案館進行了實踐,積累了一定的經(jīng)驗,對全國檔案數(shù)字化建設(shè)起到了推動作用。但是,總結(jié)以前我國檔案數(shù)字化建設(shè)的不足和失誤,往往不是信息技術(shù)支持不夠,而是絕大多數(shù)都知道搞數(shù)字化,但檔案數(shù)字化目的是利用的主題不突出,忽略檔案開放鑒定與數(shù)字化檔案利用的邏輯關(guān)系,對先剔除無用檔案后開展數(shù)字化的思路不明確,沒很好研究檔案數(shù)字化的整體效果就大張旗鼓地做起來了。進而出現(xiàn)數(shù)字化目錄數(shù)據(jù)和全文數(shù)據(jù)不對應(yīng)、找不著或不好用等問題不少,檔案數(shù)字化的量雖多,但能上網(wǎng)利用或者說能上互聯(lián)網(wǎng)利用的很少,數(shù)字化返工的現(xiàn)象比較突出,使有限的資金投入并沒有體現(xiàn)在數(shù)字化檔案的利用效益上,這一點已引起檔案系統(tǒng)管理和技術(shù)高層領(lǐng)導的重視,許多實踐工作者已開始進行有益的探索。
面對網(wǎng)絡(luò)時代公眾迫切需要遠程、公開、快捷的檔案信息,面對館藏浩瀚如海的案卷,面對當前我國檔案數(shù)字化需要解決的一系列問題,長春市檔案館與中國人民大學信息資源管理學院共同承擔了國家檔案局科技項目《檔案數(shù)字化方案研究》。該項目經(jīng)過課題研究人員的共同努力,已取得初步研究成果。通過課題研究,對檔案數(shù)字化方案的研究提出了一些觀點和看法,大家交流和討論。
一、確定檔案數(shù)字化指導思想與原則
檔案數(shù)字化指導思想是:以需求為導向,以利用為目的,充分利用計算機軟硬件功能,最大限度發(fā)揮人力資源和數(shù)字化加工設(shè)備能力,保護館藏檔案原件完好,保證數(shù)字化檔案真實準確,更好地發(fā)揮檔案信息資源的作用。
檔案數(shù)字化原則是:遵循重要檔案數(shù)字化的價值性原則、常用檔案數(shù)字化的實用性原則、開放檔案數(shù)字化的開放性原則、褪跡檔案數(shù)字化的搶救性原則,解密檔案數(shù)字化的及時性原則,目錄數(shù)字化與全文數(shù)字化分步的時效性原則,檔案數(shù)字化加工與利用同步的一致性原則。
二、明確檔案數(shù)字化策略
(一)需求導向,急用先上策略
1.需求導向策略
社會需求對檔案利用的影響應(yīng)該是檔案工作者特別關(guān)注的問題。我們用統(tǒng)計數(shù)字加以分析。
(1)隨著編史修志工作納入各地工作規(guī)劃,1986年全國?。▍^(qū)、市)綜合檔案館接待編史修志查檔卷數(shù)占利用總卷數(shù)的69%。隨著編史修志階段性高潮過去,2003年全國?。▍^(qū)、市)綜合檔案館接待編史修志查檔卷數(shù)占利用總卷數(shù)的28%。下降41個百分點。(此數(shù)據(jù)來自國家檔案局法規(guī)司保存的檔案統(tǒng)計年)(2)隨著社會保障制度的建立和國有企業(yè)改革的深入,長春市檔案館查閱工人調(diào)配檔案卷數(shù)占利用總卷數(shù)的百分比,由2002年的1%增加到2004年的占利用總卷數(shù)的68%。(此數(shù)據(jù)來自長春市檔案館利用統(tǒng)計數(shù)據(jù)庫)由此看出,國家、地方新政策的出臺和工作部署對檔案利用的影響程度。從宏觀上講,檔案利用已實現(xiàn)了兩個轉(zhuǎn)變,服務(wù)重點由政治領(lǐng)域轉(zhuǎn)變?yōu)榻?jīng)濟領(lǐng)域,服務(wù)對象由機關(guān)干部擴展到公眾百姓,特別是為百姓提供憑證案例急劇上升。用動態(tài)觀念研究當前與長遠社會對檔案的需求,并指導檔案數(shù)字化與利用服務(wù)工程實踐應(yīng)該是檔案部門的必然選擇。
2.急用先上策略
地方檔案館館藏檔案數(shù)量眾多。但并不是所有檔案都在現(xiàn)實中利用,有相當大一部分多年不用。2004年全國省(區(qū)、市)綜合檔案館檔案平均利用率僅為1.6%。雖然檔案館眾多全宗中當?shù)攸h委、政府全宗利用率高是一般規(guī)律,但其他全宗利用情況往往和政策、時間的變化而變化,影響更大。所以,各級地方檔案館按照近期利用統(tǒng)計情況和發(fā)展趨勢確定數(shù)字化的先后順序是科學的選擇,利用優(yōu)化理論進行檔案數(shù)字化篩選,快速反應(yīng),突擊完成急用檔案數(shù)字化任務(wù),能夠達到更好地發(fā)揮檔案作用的目的,實現(xiàn)即時投入使用的預期。(此數(shù)據(jù)來自國家檔案局法規(guī)司保存的檔案統(tǒng)計年報)
(二)本級為主,分步實施策略
(1)本級為主策略
根據(jù)檔案館職能分工和檔案來源原則,各級地方檔案館永久檔案絕大多數(shù)是本級機關(guān)形成的,一般都占50%以上,這部分檔案自然是當?shù)貦n案館數(shù)字化的重點。同時,地方檔案館都保管著大量的上級檔案文件,館際之間上級檔案文件重復是必要的,這些紙質(zhì)文件來源一般都是上級機關(guān)統(tǒng)一印制的。進入信息時代,地方檔案館都面臨著保管的上級檔案文件全文數(shù)字化問題,特別是上級檔案文件的開放鑒定審查問題,與其各地分頭審查上級檔案文件開放和進行數(shù)字化,不如國家檔案局著手進行檔案全文數(shù)字化和開放鑒定分工、協(xié)作,向館際共建、共享已有鑒定和數(shù)字化成果的方向發(fā)展。地方檔案館堅持本級為主的原則,根據(jù)需要和可能適時、適量地進行利用頻繁政策性上級檔案文件的全文數(shù)字化,以滿足當前工作的急需,盡量減少檔案館多層的重復勞動。
(2)分步實施策略
館藏檔案數(shù)字化不可能一步到位,而且檔案室進館范圍檔案陸續(xù)進館,進館范圍檔案實施檔案數(shù)字化館室共建、共贏、共享的策略非常重要。在具體實施過程中,文件級目錄數(shù)據(jù)庫建設(shè)是最基礎(chǔ)性的工作,是第一位需要建全的,但并一定是文件級目錄數(shù)據(jù)庫建成后再建其它數(shù)據(jù)庫。專題數(shù)據(jù)庫建設(shè)是根據(jù)現(xiàn)實需要而適時建立。全文數(shù)據(jù)庫建設(shè)是滿足信息檢索需要而必須加快建設(shè)的數(shù)據(jù)庫。
(三)剔除無用,避免浪費策略
1.剔除無用策略
地方檔案館館藏現(xiàn)行檔案主要來自于機關(guān)各個立檔單位,其檔案文件進館的決定權(quán)掌握在立檔單位文檔人員手里,加之國家檔案保管期限表幾經(jīng)修改和許多條款至今還比較籠統(tǒng),所以,不該歸檔的、不該進館的、文件重復的檔案進館頗多。特別是建國超過50年以后,半數(shù)左右長期保管的檔案逐年超過保管期的最上限,這些檔案實際上絕大多數(shù)已失去保存和利用的價值,但它們?nèi)哉紦?jù)著檔案管理的各種資源。
2.避免浪費策略
面對數(shù)字化方法的選擇,剔除無用,避免浪費應(yīng)該是一種長久策略,把大量失去保存價值的檔案先剔除,避免把無用檔案數(shù)字化,再造數(shù)字化垃圾。
三、優(yōu)選檔案數(shù)字化技術(shù)與業(yè)務(wù)路線
檔案數(shù)字化建設(shè)周期長,信息技術(shù)又處在快速發(fā)展之中,各個檔案館數(shù)字化基礎(chǔ)和條件不同。從本館實際出發(fā),優(yōu)選檔案數(shù)字化技術(shù)與業(yè)務(wù)路線特別重要。
(一)計算機新技術(shù)與檔案數(shù)字化業(yè)務(wù)的有機結(jié)合
信息技術(shù)的發(fā)展給檔案數(shù)字化效率和質(zhì)量的提高帶來深刻的影響,本著技術(shù)為需求服務(wù)的理念,無論是利用哪一種檔案管理系統(tǒng),都要適應(yīng)檔案數(shù)字化流程重組和再造需要,適時進行軟件升級,通過軟件升級固化技術(shù)與流程重組與創(chuàng)新,使檔案數(shù)字化的效果更好。同時,設(shè)計符合國家標準與適應(yīng)自身需要的數(shù)據(jù)庫結(jié)構(gòu),使檔案數(shù)字化的過程優(yōu)化,數(shù)字化檔案的利用快捷。
(二)檔案鑒定與數(shù)字化同步
鑒定與數(shù)字化同步的目的是加快數(shù)字化檔案信息的利用。在計算機網(wǎng)絡(luò)環(huán)境下同步進行檔案鑒定與數(shù)字化工作是發(fā)展趨勢。這種檔案鑒定是以剔除無用檔案為前提,以鑒定檔案開放為主,按需求篩選全文數(shù)字化檔案,為適時提供數(shù)字化檔案信息服務(wù)打基礎(chǔ)的過程。
(三)檔案數(shù)字化與上網(wǎng)利用同步
數(shù)字化檔案分開放與不開放兩種。在計算機網(wǎng)絡(luò)環(huán)境中,在確定檔案開放與不開放的同時,開放檔案即上互聯(lián)網(wǎng)。開放與不開放檔案數(shù)據(jù)在局域網(wǎng)中即時使用。
檔案數(shù)字化及管理流程重組不可能一次到位,它是一個管理思想不斷地變化的過程,適時把新技術(shù)和新理念納入進去是非常重要的。
四、細化檔案數(shù)字化操作方法
實踐證明,在計算機網(wǎng)絡(luò)環(huán)境下,檔案數(shù)字化和利用服務(wù)工程以建立流水作業(yè)線,提高工作效率和效益為最佳方式。
(一)優(yōu)化配置各種資源
檔案數(shù)字化建設(shè)需要投入,特別是建設(shè)初期軟硬件配置投入較大,建成后也要保持一定的運行成本。地方檔案館在具備一定檔案數(shù)字化條件的基礎(chǔ)上,要按照成本效益最大化理論,根據(jù)不同的情況,進行檔案專業(yè)人員和數(shù)字化技工人員、計算機和掃描設(shè)備的合理搭配,優(yōu)化檔案數(shù)字化各種資源配置,提高檔案數(shù)字化建設(shè)的投入產(chǎn)出比,構(gòu)建檔案數(shù)字化投入小產(chǎn)出大的新模式。
1.計算機網(wǎng)絡(luò)環(huán)境下檔案數(shù)字化與利用服務(wù)工程流水線資源配置案例
(二)首先建立文件級目錄數(shù)據(jù)庫
滿足一般檢索和管理的需要,建好檔案文件級目錄數(shù)據(jù)庫。目前,絕大多數(shù)綜合檔案館,由于沒有實現(xiàn)全部檔案的文件級目錄機檢,查找檔案不快、不準、不全的問題普遍存在。另外,檔案的統(tǒng)計單位主要是卷和延長米,而檔案的最小單位是文件的件數(shù),以件為單位的底數(shù)不清是普遍存在的問題。所以,把文件級目錄數(shù)據(jù)庫建設(shè)作為一項基礎(chǔ)性工作,在提高檔案的查全率、查準率的同時,利用計算機實現(xiàn)檔案以件數(shù)為基本單位的管理是非常必要的。
1.高度重視文件級目錄數(shù)據(jù)錄入的前期處理。檔案館的案卷來自各個立檔單位,案卷是由文檔人員在檔案局業(yè)務(wù)人員指導下形成的。但是,由于文檔人員變動頻繁、檔案業(yè)務(wù)指導面多線長,案卷質(zhì)量難以適應(yīng)計算機精確管理的需要,加之個別文件形成時的先天不足,給文件級目錄數(shù)據(jù)庫建設(shè)帶來許多麻煩。實踐證明,進行文件級目錄錄入的前期處理,拋開原有的文件目錄,按卷內(nèi)實有文件一一錄入,把題名不反映主題、目錄與實體不符等一系列問題一并處理是非常必要的。
2.科學合理地設(shè)計數(shù)據(jù)庫結(jié)構(gòu)。文件級目錄數(shù)據(jù)庫結(jié)構(gòu)包含三方面功能為最佳。一是符合國家有關(guān)標準及實際情況,文件題名、責任者等滿足文件檢索需要的字段。二是存毀、開放、掃描等數(shù)字化加工階段利用的字段。三是數(shù)據(jù)錄入、校對、鑒定、審查等標明責任的字段。
3.數(shù)據(jù)質(zhì)量是數(shù)據(jù)庫的生命。建立在計算機環(huán)境下,以上網(wǎng)公開利用為根本目的文件級目錄數(shù)據(jù)庫,與紙質(zhì)文件目錄有本質(zhì)的區(qū)別。紙質(zhì)文件目錄有問題只有檔案館內(nèi)部少數(shù)人知道,利用者并不清楚。但是,文件級目錄數(shù)據(jù)庫進入網(wǎng)絡(luò),特別是向社會公開的部分,對數(shù)據(jù)庫的質(zhì)量要求是相當高的,數(shù)據(jù)質(zhì)量也是當前制約許多數(shù)據(jù)上網(wǎng)利用的瓶頸之一。
(三)適時建立專題數(shù)據(jù)庫
滿足特殊檢索需要,適時建立檔案專題數(shù)據(jù)庫。館藏檔案僅靠文件級目錄數(shù)據(jù)庫是不可能解決全部檢索問題的。隨著客觀需要的變化,對某一專題檔案有集中利用的需求是經(jīng)常發(fā)生的,突擊建立專題數(shù)據(jù)庫,滿足社會需求,是檔案館與時俱進的突破口,也是充分發(fā)揮檔案作用的最佳時機。主要把握三個方面:一是根據(jù)館藏檔案內(nèi)容確定專題數(shù)據(jù)庫的總體布局。二是按需求分期建立專題數(shù)據(jù)庫。三是根據(jù)文件內(nèi)容和檢索需要分別設(shè)立不同的專題數(shù)據(jù)庫結(jié)構(gòu)。
(四)優(yōu)選建立全文數(shù)據(jù)庫
滿足信息檢索的需要,建立檔案全文數(shù)據(jù)庫。按照國家檔案局提出的重點的、利用頻繁的檔案首先實現(xiàn)全文數(shù)字化的要求,按照“二八”定律,即以20%的努力達到80%的效果,通過多年檔案利用統(tǒng)計數(shù)據(jù)分析,優(yōu)先全文數(shù)字化檔案的全宗、年代。在網(wǎng)絡(luò)中、在文件級目錄的基礎(chǔ)上同步進行檔案存毀、開放、數(shù)字化鑒定與篩選,進而形成與文件級目錄一一對應(yīng)的全文數(shù)據(jù)庫,并確保數(shù)字化檔案的真實、準確。
(五)檔案數(shù)據(jù)庫的管理
為了檔案數(shù)字化與利用同步和數(shù)據(jù)安全管理的需要,檔案數(shù)據(jù)庫分在建數(shù)據(jù)庫和成果數(shù)據(jù)庫兩大類。
1.在建數(shù)據(jù)庫的設(shè)立。在建數(shù)據(jù)庫是為了數(shù)字化加工所設(shè)立的動態(tài)庫,是數(shù)據(jù)不斷變化的數(shù)據(jù)庫。例如,設(shè)立文件級目錄數(shù)據(jù)錄入庫,它是每個錄入人員都分配給操作權(quán)限的動態(tài)庫,屬于在建數(shù)據(jù)庫。而完成的文件級目錄數(shù)據(jù)庫則是成果庫。但是,在鑒定及全文數(shù)字化加工過程中它又成為全文數(shù)字化加工在建數(shù)據(jù)庫。
2.成果數(shù)據(jù)庫的使用。成果數(shù)據(jù)庫只分配使用權(quán)限,只有特殊需要時經(jīng)批準才分配數(shù)據(jù)改變的操作權(quán)限。
3.數(shù)據(jù)的管理與監(jiān)督
建立技術(shù)負責人、超級管理員、數(shù)據(jù)管理員連鎖責任制,實行審批者沒有數(shù)據(jù)操作權(quán),超級管理員只允許分配權(quán)限不允許使用數(shù)據(jù)操作權(quán),數(shù)據(jù)管理員只有需要時經(jīng)批準使用數(shù)據(jù)操作權(quán),用后即刻收回。給予單位領(lǐng)導和相關(guān)中層干部全部數(shù)據(jù)的查看權(quán),每天24小時可以時時對數(shù)據(jù)質(zhì)量進行監(jiān)督,形成數(shù)據(jù)管理監(jiān)督新機制。
(六)數(shù)字化檔案利用服務(wù)工程
數(shù)字化檔案利用服務(wù)工程是以搞活數(shù)字化檔案利用的目的,以局域網(wǎng)、政務(wù)網(wǎng)、互聯(lián)網(wǎng)為平臺,通過建立數(shù)據(jù)安全管理制度、網(wǎng)絡(luò)安全運行制度和具有法律責任的網(wǎng)管、數(shù)據(jù)管理員、數(shù)字化加工人員、提供利用人員連鎖責任制,環(huán)環(huán)相扣,從措施上保證數(shù)字化檔案的準確。通過防火墻、CA認證、數(shù)字水印、電子簽章、權(quán)限控制等計算機新技術(shù),從技術(shù)上保證數(shù)據(jù)的安全,利用網(wǎng)絡(luò)實現(xiàn)檔案的法律效力,實現(xiàn)遠程為利用者提供快捷、準確數(shù)字化檔案的目標。
1.在局域網(wǎng)上應(yīng)用
在局域網(wǎng)內(nèi),檔案在建和成果數(shù)據(jù)庫所有接待人員都有檢索權(quán)限,對只進行目錄數(shù)字化的檔案實行現(xiàn)用現(xiàn)掃描全文的方法使之達到已全文數(shù)字化的檔案一樣效果,利用網(wǎng)絡(luò)技術(shù)實現(xiàn)數(shù)字化檔案利用替代檔案原件利用、計算機打印件替代復印機復印件、電子簽章替代手工蓋章、接待人員和利用者不接觸檔案原件的目標。從而起到了運用數(shù)字檔案高效利用、保護原件的作用。并積累了利用者憑加蓋電子簽章的數(shù)字檔案打印件辦理社會保險的成功案例,其數(shù)字化檔案的法律效力得到認可,為檔案館參與電子政務(wù)開辟了新途徑。
2.在互聯(lián)網(wǎng)上應(yīng)用
利用檔案網(wǎng)站,通過CA證書等安全手段,不但實現(xiàn)了領(lǐng)導遠程數(shù)據(jù)上傳的審批,主要是開展開放檔案遠程查詢、下載、打印。特別是把CA證書發(fā)給立檔單位或使用單位檔案室,為CA用戶遠程提供檔案證明和數(shù)字化檔案法律效力的體現(xiàn),減少異地現(xiàn)場查詢的不便,使檔案館參與電子政務(wù)成為現(xiàn)實。
五、加強檔案數(shù)字化工作的行政管理
檔案數(shù)字化涉及檔案館內(nèi)部許多部門,加強組織管理工作顯得十分重要,“三分技術(shù)七分管理”同樣適合檔案數(shù)字化與利用服務(wù)工程。各個檔案館涉及檔案數(shù)字化加工和利用的內(nèi)部組織機構(gòu)設(shè)置不盡相同,但應(yīng)按照效率優(yōu)先的原則,在計算機環(huán)境下,把數(shù)據(jù)錄入、鑒定、數(shù)字化加工、整理、數(shù)字化檔案利用形成一個流水線,打破內(nèi)部行政分工界限是發(fā)展趨勢。無論是采取那種組織形式,優(yōu)化人員組合重新分工在所難免,各個檔案館在組織實施方面有所不同是必然的。
1.加強計劃管理
檔案數(shù)字化建設(shè)是一項復雜的系統(tǒng)工程, 針對實際的調(diào)研和論證,運用科學方法預測,制定科學配置各種資源進行檔案數(shù)字化的總體規(guī)劃和專項計劃,通過計劃謀求管理系統(tǒng)的外部環(huán)境、內(nèi)部條件、決策目標三者在動態(tài)上的平衡,實現(xiàn)管理決策所制定的各項目標。
2.強化組織實施
實施是一個復雜的活動過程,檔案數(shù)字化建設(shè)又是一項全新的工作,技術(shù)含量高,涉及到許多因素,在實施過程中會出現(xiàn)各種各樣的矛盾和困難,會遇到來自各方面的干擾,實施特別強調(diào)解決問題的及時性。通過創(chuàng)新行政管理與技術(shù)管理相互作用的新機制,實施有效的組織、指揮、協(xié)調(diào)、激勵工作,保證檔案數(shù)字化的計劃目標的順利實現(xiàn)。
3.增強管理的技術(shù)含量
檔案數(shù)字化的建設(shè)過程貴在控制,重在管理。利用計算機進行檔案數(shù)字化,任何一個邏輯錯誤,都會給數(shù)據(jù)的管理和使用帶來麻煩或隱患。在互聯(lián)網(wǎng)上公開不真實、不準確的檔案,將在世界范圍內(nèi)產(chǎn)生不良影響。特別是在網(wǎng)絡(luò)環(huán)境下的流水作業(yè),上一道工序一定要為下一道工序負責,各道工序工作量的對等與匹配同樣重要,這必然要求行政、技術(shù)、質(zhì)量管理的網(wǎng)絡(luò)化。實踐證明,建立數(shù)字化進度數(shù)據(jù)庫、數(shù)字化質(zhì)量反饋庫、檔案利用登記數(shù)據(jù)庫,給局館領(lǐng)導和相關(guān)人員分配使用權(quán)限,通過技術(shù)手段將全面質(zhì)量管理思想引入檔案數(shù)字化建設(shè),實現(xiàn)全程管理、適時控制,達到強化數(shù)字化檔案質(zhì)量保證體系的目的。檔案數(shù)字化與利用服務(wù)工程是一項長期的任務(wù),需要從理論上解決的問題很多,需要在實踐中探索的問題也不少,我們將繼續(xù)深化研究與實踐。