-
期刊數(shù)字化加工介紹
隨著全國文化信息資源共享工程與中國數(shù)字圖書館工程的起動,信息化已成為國際潮流,信息資源建設(shè)成為當(dāng)務(wù)之急。信息資源建設(shè)的重點是電子文獻(xiàn)、各類數(shù)據(jù)庫、網(wǎng)絡(luò)資源、電子雜志、電子圖書等新型數(shù)字化信息資源的建設(shè)。在數(shù)字化信息資源建設(shè)中,很大的一個需求是將現(xiàn)有的紙介質(zhì)印刷品數(shù)字化,使之成為能夠用計算機(jī)閱讀、理解、查詢、檢索的電子文件,最終將其應(yīng)用于數(shù)據(jù)庫存儲,或通過CD-ROM、Internet網(wǎng)進(jìn)行出版,或上傳數(shù)字圖書館供用戶使用。
以傳統(tǒng)紙張為載體的保存方式,占據(jù)了大量的空間,需要特殊的環(huán)境,而且不方便查詢,隨著時間的推移,還面臨著腐蝕、老化等問題。而將紙介質(zhì)文件信息進(jìn)行電子化處理,保存到光盤上,具有存儲、管理、共享等功能,還可以減少文件庫房占地,節(jié)省保管設(shè)備和人員方面開支,又方便統(tǒng)計和進(jìn)行遠(yuǎn)程查詢。
因此,將圖書、期刊、報紙、文檔資料等信息資源通過掃描儀,掃描成圖像文件,再通過OCR識別成文字,建立目錄和全文索引,制作成電子文件,然后用軟件進(jìn)行管理使用,已是當(dāng)務(wù)之急。
豆海資料數(shù)字化解決方案,擬在以豆海人多年來在圖書、報紙、期刊、雜志和檔案方面的專業(yè)的數(shù)字化銷售、服務(wù)、實施經(jīng)驗,幫助用戶建立自己的數(shù)字化流水線加工工廠,高效、高質(zhì)量的實現(xiàn)電子資料的加工,或者利用豆海的加工工廠為客戶提供數(shù)字化加工服務(wù)。
-
期刊掃描加工
數(shù)字化正在取代紙質(zhì)本,成為學(xué)術(shù)期刊傳播的主要甚至是唯一渠道。
大型期刊數(shù)據(jù)庫給學(xué)術(shù)傳播帶來的最大變化是讀者(學(xué)者)閱讀學(xué)術(shù)文獻(xiàn)的習(xí)慣發(fā)生了徹底改變:由讀紙本的期刊變?yōu)樽x數(shù)據(jù)庫。 ?
這一變化給以傳統(tǒng)紙本期刊的影響是致命的:社科期刊這一獨立存在的個體已迷失在網(wǎng)絡(luò)的海洋之中。從傳播效果看,讀者樂意為這樣的數(shù)據(jù)庫而改變自己的閱讀方式。
隨著期刊數(shù)據(jù)庫的風(fēng)行,期刊紙本的發(fā)行量直線下降,且無可挽回。
-
與數(shù)字化傳播相對應(yīng),數(shù)字化的期刊體系應(yīng)該具備下列特征:
1)更為開放的公共學(xué)術(shù)平臺。
2)大量學(xué)術(shù)信息的聚合。
3)學(xué)科或問題邊界清晰、更加靈活組合的個性化多樣性形式。
-
期刊數(shù)字化加工流程
1.圖像掃描:
按照客戶要對期刊進(jìn)行掃描。采用高速掃描儀或零邊距平板掃描儀進(jìn)行掃描,生成TIFF、JPG、PDF等圖像文件。
2.圖像處理:
對掃描后的圖像進(jìn)行處理,包括去黑邊、糾偏、去污漬、版心居中、二值化等,有利于提高文字的識別率。
3.文字識別:
豆海采用國際領(lǐng)先的OCR識別技術(shù),既可以識別常見的簡體漢字、繁體漢字、英文,也可以識別日文、韓文、俄文、德文、法文等190多種文字,準(zhǔn)確率99.5%以上。
4.格式轉(zhuǎn)換:
格式轉(zhuǎn)換是將其他格式的文件轉(zhuǎn)換為雙層PDF。文件格式可以是電子文檔,如DOC、S2、S72、PS、WPS等多種文件格式;也可以是經(jīng)過整理順序模塊整理成冊的紙張掃描文件。
5.資源加工:
對文檔的元數(shù)據(jù)進(jìn)行標(biāo)引;制作文檔目錄;在PDF中制作文檔內(nèi)鏈接;對元數(shù)據(jù)標(biāo)引、分類、目錄制作等。
6.數(shù)據(jù)提交:
將制作好的數(shù)據(jù)安全提交給客戶,可刻錄光盤,掛接網(wǎng)絡(luò)等。