-
報紙數(shù)字化加工介紹:
在數(shù)字化信息資源建設中,很大的一個需求是將現(xiàn)有的紙介質(zhì)印刷品數(shù)字化,使之成為能夠用計算機閱讀、理解、查詢、檢索的電子文件,最終將其應用于數(shù)據(jù)庫存儲,或通過CD-ROM、Internet網(wǎng)進行出版,或上傳數(shù)字圖書館供用戶使用。以傳統(tǒng)紙張為載體的保存方式,占據(jù)了大量的空間,需要特殊的環(huán)境,而且不方便查詢,隨著時間的推移,還面臨著腐蝕、老化等問題。而將紙介質(zhì)文件信息進行電子化處理,保存到光盤上,具有存儲、管理、共享等功能,還可以減少文件庫房占地,節(jié)省保管設備和人員方面開支,又方便統(tǒng)計和進行遠程查詢。因此,將圖書、期刊、報紙、文檔資料等信息資源通過掃描儀,掃描成圖像文件,再通過OCR識別成文字,建立目錄和全文索引,制作成電子文件,然后用軟件進行管理使用,已是當務之急。
中國數(shù)字出版進入了快速發(fā)展期;目前每年出版電子圖書50萬種以上,并呈大幅增長趨勢。全國現(xiàn)有1937種報紙的大多數(shù)報紙開展了數(shù)字報業(yè)務,單獨出版的數(shù)字報有700份以上?,F(xiàn)有期刊網(wǎng)站580多家,電子期總量已經(jīng)達到近萬種。數(shù)字出版使中國報紙、期刊借助互聯(lián)網(wǎng)跨出國門,走向世界。
-
報紙、期刊數(shù)字化發(fā)展有未來趨勢:
1、容服務互動化趨勢
2、字媒體移動化趨勢
3、贏利模式多元化趨勢
豆海人多年來在圖書、報紙、期刊、雜志和檔案方面的專業(yè)的數(shù)字化銷售、服務、實施經(jīng)驗,幫助用戶建立自己的數(shù)字化流水線加工工廠,高效、高質(zhì)量的實現(xiàn)電子資料的加工,或者利用豆海的加工工廠為客戶提供數(shù)字化加工服務。將報紙進行數(shù)字化加工,把文本、圖文等各種文檔生成全文檢索光盤,既可以用于單機版發(fā)行,也可以用于網(wǎng)絡供客戶端瀏覽,制作成年度數(shù)據(jù)光盤、專題資料光盤、數(shù)據(jù)全集光盤等多種形式。
-
技術(shù)特色:
1、際通用的PDF格式。PDF格式是國際通用標準,可以完整地保留原來的版式,精確地顯示原貌,添加書簽、鏈接、批注等;
2、好的文件壓縮壓縮比。采用動態(tài)二值化技術(shù),文件體積極大地壓縮,圖像清晰、下載速度快、文字識別率高、占用空間少;
3、層PDF的生成:既然可以對現(xiàn)有的電子文件s2/ps2/ps格式進行轉(zhuǎn)換,也可以將紙質(zhì)資料通過掃描和OCR軟件生成。
4、支持多種檢索方式。支持單字段簡單查詢,也能進行多字段多條件模糊檢索、二次檢索、復合檢索,還可以對圖像內(nèi)容進行全文檢索,檢索結(jié)果定位到文檔所在頁面的具體位置,文件內(nèi)容原版顯示,可自由放大或縮小,大大提高了電子文檔利用深度,為進一步開展電子文檔內(nèi)容分析、挖掘打下基礎。