-
期刊掃描加工
數(shù)字化正在取代紙質(zhì)本,成為學(xué)術(shù)期刊傳播的主要甚至是唯一渠道。
大型期刊數(shù)據(jù)庫(kù)給學(xué)術(shù)傳播帶來(lái)的最大變化是讀者(學(xué)者)閱讀學(xué)術(shù)文獻(xiàn)的習(xí)慣發(fā)生了徹底改變:由讀紙本的期刊變?yōu)樽x數(shù)據(jù)庫(kù)。 ?
這一變化給以傳統(tǒng)紙本期刊的影響是致命的:社科期刊這一獨(dú)立存在的個(gè)體已迷失在網(wǎng)絡(luò)的海洋之中。從傳播效果看,讀者樂(lè)意為這樣的數(shù)據(jù)庫(kù)而改變自己的閱讀方式。
隨著期刊數(shù)據(jù)庫(kù)的風(fēng)行,期刊紙本的發(fā)行量直線(xiàn)下降,且無(wú)可挽回。
與數(shù)字化傳播相對(duì)應(yīng),數(shù)字化的期刊體系應(yīng)該具備下列特征:
1)更為開(kāi)放的公共學(xué)術(shù)平臺(tái)。
2)大量學(xué)術(shù)信息的聚合。
3)學(xué)科或問(wèn)題邊界清晰、更加靈活組合的個(gè)性化多樣性形式。
1.圖像掃描:
按照客戶(hù)要對(duì)期刊進(jìn)行掃描。采用高速掃描儀或零邊距平板掃描儀進(jìn)行掃描,生成TIFF、JPG、PDF等圖像文件。
2.圖像處理:
對(duì)掃描后的圖像進(jìn)行處理,包括去黑邊、糾偏、去污漬、版心居中、二值化等,有利于提高文字的識(shí)別率。
3.文字識(shí)別:
豆海采用國(guó)際領(lǐng)先的OCR識(shí)別技術(shù),既可以識(shí)別常見(jiàn)的簡(jiǎn)體漢字、繁體漢字、英文,也可以識(shí)別日文、韓文、俄文、德文、法文等190多種文字,準(zhǔn)確率99.5%以上。
4.格式轉(zhuǎn)換:
格式轉(zhuǎn)換是將其他格式的文件轉(zhuǎn)換為雙層PDF。文件格式可以是電子文檔,如DOC、S2、S72、PS、WPS等多種文件格式;也可以是經(jīng)過(guò)整理順序模塊整理成冊(cè)的紙張掃描文件。
5.資源加工:
對(duì)文檔的元數(shù)據(jù)進(jìn)行標(biāo)引;制作文檔目錄;在PDF中制作文檔內(nèi)鏈接;對(duì)元數(shù)據(jù)標(biāo)引、分類(lèi)、目錄制作等。
6.數(shù)據(jù)提交:
將制作好的數(shù)據(jù)安全提交給客戶(hù),可刻錄光盤(pán),掛接網(wǎng)絡(luò)等。