檔案數(shù)字化技術(shù)與檔案存儲解決方案
2017-09-06 21:50:41 點(diǎn)擊:
信息時(shí)代的來臨,檔案信息資源在社會主義現(xiàn)代化建設(shè)過程中發(fā)揮了非常重要的作用。檔案在人們的生活和工作中具有很大的影響意義,這樣檔案的作用和價(jià)值才能得到更好的體現(xiàn),F(xiàn)在,人們在生活和工作中,要對檔案歷史信息進(jìn)行更好的保護(hù),這樣在進(jìn)行使用的時(shí)候才能更好的保證得到很好的利用。檔案數(shù)字化是檔案信息化建設(shè)過程中非常重要的基礎(chǔ)工作,同時(shí)在進(jìn)行檔案管理過程中要對計(jì)算機(jī)技術(shù)進(jìn)行很好的利用,這樣才能在工作流程方面更加的合理,同時(shí)也能更好的將原始的資料進(jìn)行高效、準(zhǔn)確的進(jìn)行處理,將其轉(zhuǎn)變成為數(shù)字檔案。如何將原始資料變成為數(shù)字檔案也是檔案工作者和技術(shù)開發(fā)人員要進(jìn)行研究的問題。在日常的檔案管理中,已經(jīng)形成了非常規(guī)范的管理方法,同時(shí)對檔案的保護(hù)和保密工作也是非常重視的,這樣能夠更好的提高檔案查詢的效率,同時(shí),在社會發(fā)展過程中也能更好的對檔案資源進(jìn)行使用。為了更好對檔案進(jìn)行管理,實(shí)施檔案數(shù)字化發(fā)展非常重要,建立一套數(shù)字化檔案管理信息系統(tǒng)能夠更好的解決檔案管理過程中數(shù)字化建設(shè)問題。在檔案工作中,對工作經(jīng)驗(yàn)進(jìn)行總結(jié),能夠更好的從檔案業(yè)務(wù)能力方面和技術(shù)方案方面更好的解決檔案數(shù)字化發(fā)展和數(shù)據(jù)存儲方案的解決。
1、檔案數(shù)字化業(yè)務(wù)過程模型
檔案數(shù)字化是一項(xiàng)非常復(fù)雜的系統(tǒng)工程,在進(jìn)行處理的時(shí)候要對電子檔案信息進(jìn)行獲取,同時(shí)在信息處理、信息儲存和信息發(fā)布和利用方面都要進(jìn)行很好的發(fā)展。電子檔案信息在獲取的時(shí)候可以通過很多的渠道來進(jìn)行實(shí)現(xiàn)。在技能型信息獲取的時(shí)候,可以對紙質(zhì)的檔案進(jìn)行掃描加工,也可以對磁帶和磁盤中儲存的檔案進(jìn)行數(shù)字化轉(zhuǎn)換,這樣能夠更好的將采集到的數(shù)據(jù)信息更好的轉(zhuǎn)化成為數(shù)字化形式。無論采取何種形式對技術(shù)參數(shù)進(jìn)行處理都要有專業(yè)的設(shè)備和文件儲存方式,要保證儲存介質(zhì)的安全性,同時(shí)要保證信息能夠更好的進(jìn)行處理。在檔案信息化處理過程中,數(shù)字化解決方案是核心的功能,其中包含著檔案信息的編目、標(biāo)引、圖像文件處理以及圖像識別處理,這樣能夠更好的對檔案目標(biāo)信息進(jìn)行關(guān)聯(lián)。在這個(gè)過程中,系統(tǒng)中每個(gè)功能模塊都要借助軟件開發(fā)平臺進(jìn)行建設(shè),同時(shí)要對用戶的操作環(huán)境的控制。檔案信息儲存的安全非常重要,因此,在整個(gè)系統(tǒng)中一定要保證信息的安全,同時(shí)要保證系統(tǒng)能夠更好的運(yùn)行支撐。在這個(gè)環(huán)節(jié)中,系統(tǒng)的儲存量是有一定的要求,在安全管理方面也有一定的基本要求,同時(shí)也要對訪問的速度進(jìn)行控制,對儲存的設(shè)備也是有一定的要求。各種電子檔案信息在儲存和訪問方式也要進(jìn)行選擇,這樣能夠更好的對檔案信息的儲存方式進(jìn)行決定。在檔案信息利用中,檔案數(shù)字化發(fā)展是必然趨勢,同時(shí)在這個(gè)環(huán)節(jié)中要對查詢和利用的平臺進(jìn)行建設(shè),這樣能夠更好的對網(wǎng)絡(luò)中出現(xiàn)的信息進(jìn)行保證,同時(shí)也能更好的保證人們在生活和工作中對網(wǎng)絡(luò)中存在的信息進(jìn)行使用。網(wǎng)絡(luò)中存在的信息具有很好的共享性,這也是檔案信息的重要價(jià)值和作用。在對檔案進(jìn)行保管的時(shí)候,對其隱私性也有要求,這樣才能更好保證信息的安全。
2檔案數(shù)字化主要技術(shù)指標(biāo)的選擇
紙質(zhì)檔案實(shí)現(xiàn)數(shù)字化的過程要使用數(shù)字化掃描技術(shù)、圖文編輯、圖像格式和圖像儲存技術(shù)進(jìn)行發(fā)展,這樣能夠更好的對相關(guān)的技術(shù)和參數(shù)進(jìn)行選擇。對紙質(zhì)檔案進(jìn)行數(shù)字化能夠更好的實(shí)現(xiàn)掃描加工,同時(shí)也能更好地對信息質(zhì)量進(jìn)行檢查,同時(shí)對出現(xiàn)的污染問題也能進(jìn)行更好的處理,這樣更好的實(shí)現(xiàn)檔案文件的信息關(guān)聯(lián)。
2.1掃描技術(shù)參數(shù)選擇
在對紙質(zhì)檔案進(jìn)行掃描的時(shí)候,要采用標(biāo)準(zhǔn)的編程接口,這樣能夠更好的應(yīng)用編程程序?qū)Ω鞣N掃描儀器進(jìn)行控制,同時(shí)也要實(shí)現(xiàn)自動(dòng)圖像壓縮儲存。在這個(gè)過程中,有不同的掃描方式,可以支持不同的幅面和顏色,也能夠?qū)Σ噬珗D像進(jìn)行處理。在掃描過程中,要對分辨率進(jìn)行必要的設(shè)置,要根據(jù)實(shí)際的業(yè)務(wù)進(jìn)行靈活的設(shè)置,同時(shí),
也要滿足網(wǎng)絡(luò)化的查詢利用,對具體參數(shù)的掃描分析清晰度和質(zhì)量因素進(jìn)行綜合選擇,因此,在進(jìn)行掃描的時(shí)候可以提高掃描分辨率。
2.2OCR識別技術(shù)
OCR技術(shù)可用于檔案標(biāo)引信息識別和全文信息識別。在理想的測試條件下,其主要技術(shù)指標(biāo)如下:識別字體:識別宋體、仿宋、楷體、黑體、魏碑、隸書、圓體、行楷、行書等近百種字體。識別功能:支持印刷文稿、純英文、中英文混排、較工整的手寫文稿等多種類型。對印刷材料的識別率達(dá)98%以上。識別速度:在普通配置的計(jì)算機(jī)上印刷體漢字達(dá)120書秒以上。要求圖像分辨率:一般不低于300DPI。由于大量實(shí)際檔案的紙張、字體和測試樣例往往存在較大差距,因此OCR在實(shí)際應(yīng)用中自動(dòng)識別的準(zhǔn)確度和穩(wěn)定性會有較大的折扣,這使我們不得不遺憾地面臨艱苦而繁瑣的人工校對和補(bǔ)錄工作。
2.3圖像文件密級定義
技術(shù)為了在較細(xì)粒度上實(shí)現(xiàn)對電子檔案圖像信息的安全訪問與控制,可通過采用頁定級或頁內(nèi)區(qū)域定級,即指定某頁或頁內(nèi)某區(qū)域的保密級別。保密級別可分為公開級、國內(nèi)級、內(nèi)部級、秘密級、機(jī)密級、絕密級等等。頁定級與頁內(nèi)區(qū)域定級之后,通過用戶角色授權(quán),便可實(shí)現(xiàn)精細(xì)的數(shù)據(jù)訪問控制和權(quán)限管理。
2.4多媒體音像檔案數(shù)字化技術(shù)參數(shù)
多媒體音像檔案數(shù)字化,就是將錄音、錄像等各種形式的多媒體原文資料通過音頻、視頻轉(zhuǎn)換設(shè)備進(jìn)行轉(zhuǎn)換、識別,壓縮,生成標(biāo)準(zhǔn)格式的電子文件,并編目以及建立標(biāo)引信息的過程。
2.5條碼技術(shù)
文檔數(shù)字化加工的全過程,采用條形碼技術(shù)進(jìn)行跟蹤管理是非常有效的手段之一。通過采用條碼可以實(shí)現(xiàn)下述自動(dòng)化處理:在檔案整理工序中加貼表示不同意義的條碼,可以實(shí)現(xiàn)案卷號、檔案分類等關(guān)鍵標(biāo)引信息的自動(dòng)識別。檔案移交過程中,可利用條碼自動(dòng)進(jìn)行檔案的逐卷核對;檔案盤點(diǎn)時(shí),通過條碼掃描槍或無線數(shù)據(jù)采集器進(jìn)行條碼掃描,可實(shí)現(xiàn)庫房檔案數(shù)量的精確統(tǒng)計(jì),同時(shí)還可以實(shí)現(xiàn)庫房實(shí)物檔案與計(jì)算機(jī)中存儲的檔案信息的核對。在檔案的借閱管理工作中,可應(yīng)用條碼進(jìn)行自動(dòng)化的出入庫管理。
2.6數(shù)字檔案信息的存儲
數(shù)字化后的數(shù)字檔案信息包括檔案目錄信息和圖像原文信息兩大類,為了實(shí)現(xiàn)網(wǎng)絡(luò)化利用,檔案的目錄數(shù)據(jù)庫必須采用支撐網(wǎng)絡(luò)化系統(tǒng)運(yùn)行的數(shù)據(jù)庫,而數(shù)字化后的電子圖像文件的存儲則可以選擇文件存儲方式或數(shù)據(jù)庫存儲方式任何一種存儲方式,如果選用數(shù)據(jù)庫存儲,則要求數(shù)據(jù)庫服務(wù)器的存儲容量足夠大,如果選用文件存儲,則應(yīng)考慮存儲在文件服務(wù)器上文件的存儲規(guī)則和命名規(guī)則,以方便實(shí)現(xiàn)圖像文件與數(shù)據(jù)庫的檢索。
3結(jié)束語
在檔案工作中,檔案數(shù)字化是非常新的一項(xiàng)內(nèi)容,因此,在建設(shè)過程中無法避免的會遇到一些新問題和新情況。數(shù)字化檔案信息在壓縮和儲存關(guān)鍵技術(shù)方面要進(jìn)行更好的發(fā)展,這樣才能更好地保證數(shù)字化檔案信息的安全,同時(shí)在保密技術(shù)方面也要進(jìn)行很好的發(fā)展,這樣才能更好的保證數(shù)字化檔案信息能夠更好的實(shí)現(xiàn)訪問方式和安全控制。數(shù)字化檔案在進(jìn)行建設(shè)的過程中要面臨著很多的問題,對出現(xiàn)的問題進(jìn)行解決才能更好的促進(jìn)檔案工作得到更好的發(fā)展,在檔案管理水平方面得到提高。
1、檔案數(shù)字化業(yè)務(wù)過程模型
檔案數(shù)字化是一項(xiàng)非常復(fù)雜的系統(tǒng)工程,在進(jìn)行處理的時(shí)候要對電子檔案信息進(jìn)行獲取,同時(shí)在信息處理、信息儲存和信息發(fā)布和利用方面都要進(jìn)行很好的發(fā)展。電子檔案信息在獲取的時(shí)候可以通過很多的渠道來進(jìn)行實(shí)現(xiàn)。在技能型信息獲取的時(shí)候,可以對紙質(zhì)的檔案進(jìn)行掃描加工,也可以對磁帶和磁盤中儲存的檔案進(jìn)行數(shù)字化轉(zhuǎn)換,這樣能夠更好的將采集到的數(shù)據(jù)信息更好的轉(zhuǎn)化成為數(shù)字化形式。無論采取何種形式對技術(shù)參數(shù)進(jìn)行處理都要有專業(yè)的設(shè)備和文件儲存方式,要保證儲存介質(zhì)的安全性,同時(shí)要保證信息能夠更好的進(jìn)行處理。在檔案信息化處理過程中,數(shù)字化解決方案是核心的功能,其中包含著檔案信息的編目、標(biāo)引、圖像文件處理以及圖像識別處理,這樣能夠更好的對檔案目標(biāo)信息進(jìn)行關(guān)聯(lián)。在這個(gè)過程中,系統(tǒng)中每個(gè)功能模塊都要借助軟件開發(fā)平臺進(jìn)行建設(shè),同時(shí)要對用戶的操作環(huán)境的控制。檔案信息儲存的安全非常重要,因此,在整個(gè)系統(tǒng)中一定要保證信息的安全,同時(shí)要保證系統(tǒng)能夠更好的運(yùn)行支撐。在這個(gè)環(huán)節(jié)中,系統(tǒng)的儲存量是有一定的要求,在安全管理方面也有一定的基本要求,同時(shí)也要對訪問的速度進(jìn)行控制,對儲存的設(shè)備也是有一定的要求。各種電子檔案信息在儲存和訪問方式也要進(jìn)行選擇,這樣能夠更好的對檔案信息的儲存方式進(jìn)行決定。在檔案信息利用中,檔案數(shù)字化發(fā)展是必然趨勢,同時(shí)在這個(gè)環(huán)節(jié)中要對查詢和利用的平臺進(jìn)行建設(shè),這樣能夠更好的對網(wǎng)絡(luò)中出現(xiàn)的信息進(jìn)行保證,同時(shí)也能更好的保證人們在生活和工作中對網(wǎng)絡(luò)中存在的信息進(jìn)行使用。網(wǎng)絡(luò)中存在的信息具有很好的共享性,這也是檔案信息的重要價(jià)值和作用。在對檔案進(jìn)行保管的時(shí)候,對其隱私性也有要求,這樣才能更好保證信息的安全。
2檔案數(shù)字化主要技術(shù)指標(biāo)的選擇
紙質(zhì)檔案實(shí)現(xiàn)數(shù)字化的過程要使用數(shù)字化掃描技術(shù)、圖文編輯、圖像格式和圖像儲存技術(shù)進(jìn)行發(fā)展,這樣能夠更好的對相關(guān)的技術(shù)和參數(shù)進(jìn)行選擇。對紙質(zhì)檔案進(jìn)行數(shù)字化能夠更好的實(shí)現(xiàn)掃描加工,同時(shí)也能更好地對信息質(zhì)量進(jìn)行檢查,同時(shí)對出現(xiàn)的污染問題也能進(jìn)行更好的處理,這樣更好的實(shí)現(xiàn)檔案文件的信息關(guān)聯(lián)。
2.1掃描技術(shù)參數(shù)選擇
在對紙質(zhì)檔案進(jìn)行掃描的時(shí)候,要采用標(biāo)準(zhǔn)的編程接口,這樣能夠更好的應(yīng)用編程程序?qū)Ω鞣N掃描儀器進(jìn)行控制,同時(shí)也要實(shí)現(xiàn)自動(dòng)圖像壓縮儲存。在這個(gè)過程中,有不同的掃描方式,可以支持不同的幅面和顏色,也能夠?qū)Σ噬珗D像進(jìn)行處理。在掃描過程中,要對分辨率進(jìn)行必要的設(shè)置,要根據(jù)實(shí)際的業(yè)務(wù)進(jìn)行靈活的設(shè)置,同時(shí),
也要滿足網(wǎng)絡(luò)化的查詢利用,對具體參數(shù)的掃描分析清晰度和質(zhì)量因素進(jìn)行綜合選擇,因此,在進(jìn)行掃描的時(shí)候可以提高掃描分辨率。
2.2OCR識別技術(shù)
OCR技術(shù)可用于檔案標(biāo)引信息識別和全文信息識別。在理想的測試條件下,其主要技術(shù)指標(biāo)如下:識別字體:識別宋體、仿宋、楷體、黑體、魏碑、隸書、圓體、行楷、行書等近百種字體。識別功能:支持印刷文稿、純英文、中英文混排、較工整的手寫文稿等多種類型。對印刷材料的識別率達(dá)98%以上。識別速度:在普通配置的計(jì)算機(jī)上印刷體漢字達(dá)120書秒以上。要求圖像分辨率:一般不低于300DPI。由于大量實(shí)際檔案的紙張、字體和測試樣例往往存在較大差距,因此OCR在實(shí)際應(yīng)用中自動(dòng)識別的準(zhǔn)確度和穩(wěn)定性會有較大的折扣,這使我們不得不遺憾地面臨艱苦而繁瑣的人工校對和補(bǔ)錄工作。
2.3圖像文件密級定義
技術(shù)為了在較細(xì)粒度上實(shí)現(xiàn)對電子檔案圖像信息的安全訪問與控制,可通過采用頁定級或頁內(nèi)區(qū)域定級,即指定某頁或頁內(nèi)某區(qū)域的保密級別。保密級別可分為公開級、國內(nèi)級、內(nèi)部級、秘密級、機(jī)密級、絕密級等等。頁定級與頁內(nèi)區(qū)域定級之后,通過用戶角色授權(quán),便可實(shí)現(xiàn)精細(xì)的數(shù)據(jù)訪問控制和權(quán)限管理。
2.4多媒體音像檔案數(shù)字化技術(shù)參數(shù)
多媒體音像檔案數(shù)字化,就是將錄音、錄像等各種形式的多媒體原文資料通過音頻、視頻轉(zhuǎn)換設(shè)備進(jìn)行轉(zhuǎn)換、識別,壓縮,生成標(biāo)準(zhǔn)格式的電子文件,并編目以及建立標(biāo)引信息的過程。
2.5條碼技術(shù)
文檔數(shù)字化加工的全過程,采用條形碼技術(shù)進(jìn)行跟蹤管理是非常有效的手段之一。通過采用條碼可以實(shí)現(xiàn)下述自動(dòng)化處理:在檔案整理工序中加貼表示不同意義的條碼,可以實(shí)現(xiàn)案卷號、檔案分類等關(guān)鍵標(biāo)引信息的自動(dòng)識別。檔案移交過程中,可利用條碼自動(dòng)進(jìn)行檔案的逐卷核對;檔案盤點(diǎn)時(shí),通過條碼掃描槍或無線數(shù)據(jù)采集器進(jìn)行條碼掃描,可實(shí)現(xiàn)庫房檔案數(shù)量的精確統(tǒng)計(jì),同時(shí)還可以實(shí)現(xiàn)庫房實(shí)物檔案與計(jì)算機(jī)中存儲的檔案信息的核對。在檔案的借閱管理工作中,可應(yīng)用條碼進(jìn)行自動(dòng)化的出入庫管理。
2.6數(shù)字檔案信息的存儲
數(shù)字化后的數(shù)字檔案信息包括檔案目錄信息和圖像原文信息兩大類,為了實(shí)現(xiàn)網(wǎng)絡(luò)化利用,檔案的目錄數(shù)據(jù)庫必須采用支撐網(wǎng)絡(luò)化系統(tǒng)運(yùn)行的數(shù)據(jù)庫,而數(shù)字化后的電子圖像文件的存儲則可以選擇文件存儲方式或數(shù)據(jù)庫存儲方式任何一種存儲方式,如果選用數(shù)據(jù)庫存儲,則要求數(shù)據(jù)庫服務(wù)器的存儲容量足夠大,如果選用文件存儲,則應(yīng)考慮存儲在文件服務(wù)器上文件的存儲規(guī)則和命名規(guī)則,以方便實(shí)現(xiàn)圖像文件與數(shù)據(jù)庫的檢索。
3結(jié)束語
在檔案工作中,檔案數(shù)字化是非常新的一項(xiàng)內(nèi)容,因此,在建設(shè)過程中無法避免的會遇到一些新問題和新情況。數(shù)字化檔案信息在壓縮和儲存關(guān)鍵技術(shù)方面要進(jìn)行更好的發(fā)展,這樣才能更好地保證數(shù)字化檔案信息的安全,同時(shí)在保密技術(shù)方面也要進(jìn)行很好的發(fā)展,這樣才能更好的保證數(shù)字化檔案信息能夠更好的實(shí)現(xiàn)訪問方式和安全控制。數(shù)字化檔案在進(jìn)行建設(shè)的過程中要面臨著很多的問題,對出現(xiàn)的問題進(jìn)行解決才能更好的促進(jìn)檔案工作得到更好的發(fā)展,在檔案管理水平方面得到提高。
- 上一篇:煙草檔案信息化建設(shè)解決方案 2017/9/6
- 下一篇:淺談檔案信息化管理存在的問題及解決對策 2017/9/6