-
圖書數(shù)字化
我公司和多家大專院校的圖書館有過多次成功的合作。在此基礎(chǔ)上,我們充分理解圖書數(shù)字化對各項圖書建設(shè)的重要意義,同時我們也非常希望能與各單位在信息化建設(shè)方面建立長期的合作關(guān)系。
紙質(zhì)圖書數(shù)字化具有以下優(yōu)點: (1)體積小、存貯密度高、信息量大。如1張光盤可存儲1千兆字節(jié), 相當(dāng)于5億多漢字。(2)傳播范圍廣。數(shù)字化信息可以通過網(wǎng)絡(luò)不受時間和空間限制地進(jìn)行傳播。(3)利用率高。數(shù)字化信息可以長期反復(fù)利用,不存在缺損問題,而且眾多用戶可同時利用相同的信息。(4)檢索方便快捷。數(shù)字化信息資源一般都配有檢索軟件, 用戶可進(jìn)行多途徑檢索, 快速地獲取所需的文獻(xiàn)信息。(5)保存時間長。由于紙質(zhì)文獻(xiàn)難以長久保存。滿足多層次、多樣性的用戶需求,使寶貴的海量數(shù)據(jù)資源最大限度地發(fā)揮效益。適合于圖書館、出版社、期刊雜志、各類企事業(yè)單位以及個人用戶。
-
圖書文獻(xiàn)數(shù)字化的種類 資料數(shù)字化根據(jù)檢索和利用需求,大概分為以下幾個種類:
★第一類 全文圖像化,有簡單的目錄索引
這種類型的資料數(shù)字化,僅僅是將紙質(zhì)的資料利用掃描儀掃描成圖像文件,并進(jìn)行簡單的編目,提供目錄索引,而不做文字的識別。
這種電子資料的好處在于投資小,每單位的價格最便宜;其缺點是沒有全文檢索功能,只能為讀者提供簡單的索引查詢,圖像文件較大導(dǎo)致瀏覽速度較慢。
★第二類 全文文本化,可全文檢索
這種類型的資料數(shù)字化,全部利用人工錄入,建立全文文本化的電子資料,可以提供全文檢索。
其優(yōu)點是占用存儲空間較小,可實現(xiàn)全文檢索,瀏覽傳輸速度快;其缺點是未經(jīng)過格式化,沒有版面信息,讀者閱覽到的是單純文本,單位價格較高。
★第三類 全文圖像文本化,可全文檢索
這種類型的資料數(shù)字化,在提供紙質(zhì)資料的掃描圖像文件后,還進(jìn)行了人工錄入或者OCR識別,為圖書建立了全文文本,因此可以提供全文檢索。
這種類型,實際上是利用雙層文件的形式向讀者展示電子資料的。它分為上下兩層,上面的是圖像層,下面的是文本層,但是這種文本沒有經(jīng)過排版,它是無格式混亂的。讀者看到的是上層的圖像,而全文檢索時,可以使用下層的文本。這種類型的好處在于單位價格較便宜,但是由于在讀者瀏覽時要同時傳輸圖像文件和文本文件,其瀏覽速度最慢。
★第四類 基于原版原樣的,可全文檢索的
這種類型的資料數(shù)字化,利用掃描儀將紙質(zhì)資料掃描加工成圖像文件,再通過OCR工廠,識別成能夠保留原始版面樣式的文本化的文件(如:rtf、pdf格式),它既保留了版面的信息,又是全文文本化的,可以提供全文的檢索。
這種類型的優(yōu)點在于支持全文檢索,占用存儲空間較少,由于是文本格式的文件,電子資料質(zhì)量(放大、縮小是不失真)和瀏覽速度都很好;其缺點是價格較高。