一、古籍數字化加工要求
1.數字化加工設備規格
(1)掃描:掃描設備選擇非接觸式掃描儀。設備A3幅面的光學分辨率600dpi以上,CCD感光元件不低于5000像素點,色彩位數24bit。掃描設備應是無紫外線的同步冷光源。
(2)拍照:數碼拍照相機的有效像素不低于5000萬像素,裁切后圖像短邊像素換算分辨率不得低于同規格掃描分辨率,感光元件尺寸不低于全畫幅(36×24 mm),采用1:1微距鏡頭。
備注:每日設備使用前進行色彩校正,以使文獻色彩還原度高,真實。
2.其它輔件要求
(1)托稿臺:為文獻數碼拍照的平臺。托稿臺材質應選用經過脫酸處理的,書籍托架應穩定牢固。
(2)掃描儀的自動評測被拍攝物重量,通過液壓調節拍攝物與上下壓平裝置的空間和力度,控制拍攝物位置和平整度。
(3)照明:無紫外線或紅外線的排放,冷光源LED照明系統。
(4)避光:日光燈、太陽光線
(5)地板:穩固,靜電處理
(6)掃描方式:國圖標準色卡校對,手動對焦。
(7)背景布置:中灰色紙板,即18%灰板。
3.圖像采集前的準備工作要求
(1)預熱。掃描儀預熱5至10分鐘,使機器內的燈管達到均勻發光狀態,這樣可以確保光線平均照到稿件每一處。
(2)色彩校驗。顯示器、掃描儀的色彩校準。
(3)預掃,是保證掃描效果的第一道關卡。有兩方面的好處,一是確定所需要掃描的區域,以減少掃描后對圖像的處理工序;二是可通過觀察預掃后的圖像色彩、效果等,對掃描參數重新進行設定、調整之后再進行掃描。
(4)保持清潔,掃描儀外部構件如果有灰塵、斑點,要用干凈的抹布蘸無水酒精擦拭干凈,以免影響掃描效果。
4.圖像采集要求
(1)文獻掃描前根據國際色彩協會(International Color Consortium,簡稱ICC)標準,做加工設備的基本色彩校正,及針對各類型文獻進行色彩校正。
(2)每冊書在數字化前單獨掃描色卡并放入冊文件夾,命名為seka.tif。IT8標準色彩導表(帶尺寸標尺)與原件的距離為0.1~1厘米,色標放置于首頁畫面左側。應注意保證色卡的整潔,不能有磨損或污漬,色卡的掃描方式應該有統一規定。
(3)避免透光,要求掃描圖像清晰,不透字。掃描后的圖像文件葉碼連續,沒有重葉、缺葉,錯葉、折葉等情況(原書缺葉、錯葉除外)。補掃缺葉圖像要與同冊圖像文件的大小一致,顏色接近。
(4)按1:1比例掃描,葉面外圍要求留白,寬度不超過1厘米;書葉間距不超過0.1厘米。
(5)以原書的上邊沿為基準,以中縫為中心線,保持原文獻的天頭、地腳的尺寸不變,左右兩邊的尺寸基本不變。頁面與標尺平行,圖像傾斜角度不大于0.2度。
(6)原件有粘貼物,先將粘貼物掀開,掃描文獻;然后將粘貼物復原,將粘貼物(即粘貼物覆蓋于文獻)逐片與原件一起掃描。這樣,就獲得2個或2個以上圖像。
(7)原件透背葉字跡,有蟲蛀、漏洞時,需墊上古籍適用的襯紙后掃描。
(8)分畫幅掃描時,各掃描區域邊緣必須有3厘米(含)以上的重復掃描區,如有特殊情況,視情況另行規定。
(9)數字圖像文件用專業圖像軟件放大至100%檢查,不失真,清晰不虛焦。
(10)工作人員可根據掃描制式(即雙半葉和半葉)和文獻規格的不同,正確選擇掃描分辨率和拍照像素,以保證采集質量。
5.數字圖像制作規格
(1)古籍典藏級
位深:24位
掃描分辨率:文獻小于等于10X12.5cm,用800DPI以上
文獻大于10X12.5cm ,小于等于A3,用600 DPI 以上,
文獻大于A3:400DPI以上,
拍照像素:5000萬像素
文件格式:TIFF(LZW)
RAW(sRAW)封裝格式
色標卡:處理方式首頁加載
(2)復制加工級
位深:24位
掃描分辨率:檔案典藏級分辨率
拍照像素:檔案典藏級拍照像素
文件格式:JPEG2000無損壓縮
(3)發布服務級
位深:24位
文件格式: PDF或JPEG2000。成冊文獻格式類型為PDF,其它類型為JPEG2000。JPEG2000根據圖像尺寸、顏色、數據存儲量,進行有損壓縮,壓縮因子適度動態調整,單頁圖像文件大小不超過500KB/頁。PDF文件以發布級JPEG2000文件標準進行封裝,帶水印和不帶水印各一套。
6.數字圖像文件處理
(1) 糾偏處理。對出現偏斜的圖像進行糾偏處理,圖像歪斜度不可以超過1°,對方向不正確的圖像進行旋轉還原,以符合閱讀習慣。
(2) 去污處理。對圖像頁面中出現的影響圖像質量的雜質如黑邊等進行去污處理;歷史文獻為展示原版原貌可不進行去污處理。
(3) 圖像拼接。若原文獻幅面較大,無法整體采集的,可將原件分畫幅采集。分畫幅采集圖像,保存級文件(Tiff格式文件)無需進行拼接,但需有說明性文件;服務級文件需進行拼接處理,合并為一個完整的圖像,以保證數字文件的整體性(合并信息應在readme.txt進行說明)。A2幅面以上可拼接處理。圖像拼接后不得有明顯的拼接痕跡。每種同一規格書籍掃描后每葉影像尺寸大小相同。
(4) 圖像剪裁。拍攝物外邊緣裁至0.5~0.75厘米。
不能進行銳化或者圖像增強處理,不能更改圖像的顏色,盡量減少對圖像文件的后期處理。
二、對象數據命名規則
掃描存儲文件(TIFF格式)、復制加工級文件(JPEG2000格式)、發布服務文件(PDF格式或JPEG2000)命名規則相同,這里僅以TIFF格式文件為例。
加工編號命名規則
加工編號是數字化加工過程中一種唯一標識號,由14位流水號組成,第一至四位為館藏單位代碼1701,第五至六位為類別代碼,第七至十位為年份,第十一至十四位為加工序號例如17010120190026。一般情況下,每種古籍的目錄結構分2層,書文件夾和冊文件夾,書文件夾用14位數字表示,葉(筒子頁)文件保存在冊文件夾下:
例如:0120190026 —— 0001 —— 0001.tif
……
—— 0076.tif
—— 0002 —— 0001.tif
……
—— 0079.tif
……
—— 0106 —— 0001.tif
……
—— 0127.tif
(三)文件名命名規則
1.一個冊文件夾下包含若干圖像文件,按四位加工流水號命名:XXXX.tif,從0001.tif開始連續命名。
2.特殊處理
(1)原件有粘貼物的命名規則
不帶粘貼物的圖像文件名為:4位數字
帶粘貼物的圖像文件命名為:4位數字+小寫字母。
其中,4位數字為原件內容的順序流水號;小寫字母,從a開始,順序命名。
例如:原件第8葉有2個重疊粘貼的簽條,先將粘貼物掀開掃描,然后逐一復原粘貼物與原書一起掃描。三個圖像文件分別命名為:0008.tif、0008a.tif、0008b.tif。
(2)一頁普通古籍過大,分多畫幅拍攝
保存級文件名為:4位數字_2位數字(4位數字為原件內容的順序流水號,2位數字為該圖多畫幅順序號,從01開始連續命名。)
例如:0002_01.tif 0002_02.tif
服務級文件需將多畫幅進行拼接,拼接生成一個文件,命名規則為:4位數字(4位數字為原件內容的順序流水號)例如:附加:0002.jpegg
3.特殊情況說明
有拼接、分多畫幅采集等特殊情況需在當前文件夾下,建立readme.txt進行說明。
三、古籍元數據著錄
1.著錄規范
管理元數據部分,元數據應符合《國家圖書館元數據應用規范》和《國家圖書館專門元數據設計規范》,如有特別需要,可遵循《國家圖書館專門元數據設計規范》中的擴展規則進行本地擴展。
2.著錄內容
按甲方提供內容著錄。
3 著錄要求
(1)在甲方指定平臺進行著錄。
(2)使用字符集為Unicode 5.0 UTF-8;對字符集中沒有的文字,采用普查平臺中的著錄方式(描述字體結構)。
(3)著錄信息應嚴格按照文獻實際內容進行描述,標引詞與標引對象文件應正確鏈接。著錄文字處理錯誤率不超過0.3‰。
四、數字化過程中的數據保存、備份以及圖像處理和檢驗中標方須自備設備
五、數字化成品數據提交要求
格式 | 份數 | 載體 | 用途 |
RAW格式 | 2 | 硬盤 | 原始圖像 |
TIFF格式 | 2 | 硬盤 | 存儲格式長期保存備份 |
JPEGEG2000格式 | 3 | 硬盤 | 復制加工格式長期保存備份 |
PDF格式 | 3 | 硬盤 | 帶水印和不帶水印 提交發布 |
數據庫文件 | 2 | 硬盤 | 提交發布 |
數據說明文件 | 2 | 硬盤 | 存檔 |
元數據 | 2 | 硬盤 | 存檔 |
六、驗收
(1)送檢數據與《古籍數字資源提交單》的內容一致,各種格式數據和數據說明文件一一對應,不可夾雜無關文件。
(2)各種標引、說明文件的文字、符號、版式、位置和名稱準確,其綜合錯誤率不超過0.3‰。
(3)圖像數據掃描方式、掃描規格、文件格式、文件命名、圖像處理、壓縮方式等符合要求,其綜合錯誤率不超過1‰。
(4)數字化成品提交硬盤一式兩份,成品數據數量、保存介質命名、數據存放方式、數據內容符合規范要求,且各類型保存介質內無壞死文件、不準攜帶病毒,錯誤率為0。
(5)本館派遣人員現場監督中標公司數字化加工,負責現場數據安全、質量檢查等工作。
(6)達到驗收標準的數據視為合格,在規定錯誤率范圍內檢查出的數據問題由加工單位進行修正;超出錯誤率、未達到驗收標準的數據由加工單位對全部提交數據進行整改、重新數字化等返工處理。
(7)形成相應的過程記錄檔案,項目完成后進行歸檔。