您現在的位置是:首頁 > 攝影首頁攝影

古籍掃描器如何掃描破舊古籍及步驟

由 BOBO哥說檔案 發表于 攝影2023-01-19
簡介登記時確認每本古籍的總頁數,與管理人員進行交接2、古籍整理:將領出古籍進行平整處理,確保古籍無粘連、折邊、部分缺失等情況,確認處理好後開始利用書刊掃描器進行數字化掃描

掃描器怎麼掃描負片

一一

古籍,是傳承人類文明的不可多得的珍貴載體。每一件古籍都富含文字、非文字的資訊。而每一點資訊,都是歷史的遺蹟。記錄修復前的相關資訊,可彌補古籍實體資訊的損失。

一一

我國搶救修復的古籍檔案數量巨大,而古籍檔案修復工作主要是修復檔案中的文獻資料,這些資料能夠為多方面的科學研究提供依據。古籍檔案修復經驗的積累、理論知識與先進工藝的研究突破,能促使行業整體修復能力的提升。完備且科學的古籍檔案修復資料則是一座巨大的寶庫,蘊含著古籍文獻的大量資訊資源,對圖書館文獻的典藏管理、對文獻研究、對先進修復原則和技術的推廣普及都有著重要意義。

那麼

現代的古籍掃描器如何對這類古籍進行掃描?

一一

珍貴的古籍是需要及時的保護修復在歷史的長河中古籍保護勢在必行。首先古籍掃描器是專門針對古籍進行掃描的裝置,不會對古籍自身造成損壞,源於非接觸式不與古籍接觸就可以掃描完成。

古籍掃描器如何掃描破舊古籍及步驟

一一

其次要開啟要掃描的古籍善本,不需要拆書直接放到掃描區域就可以進行掃描。、古籍掃描景深可以達到15釐米不僅可以,還可以掃描立體的書籍比如古代的歷史竹卷等等。

一一

因為古籍掃描器的解析度很高光學解析度在400dpi-800dpi會把影象呈現還原的特別的清晰,我們可以看到掃描完成的自己還有色彩還原度都是可以的。

一一

在網路時代,任何知識資訊得到充分利用的前提,是看其能否轉化為數字化資訊。古籍文獻有很高的學術價值,東方明德採用計算機技術,對古籍文獻進行全文數字化加工處理,製作成古籍文獻書目資料庫和古籍全文資料庫,不僅有效保護古籍,而且能更好地傳播利用古籍,提高古籍文獻的使用率。

模化、流水線式的數字化加工

一一

公司避於手工業作坊式的生產方式,建立了數字化加工工廠。並創立了從資料整理去汙→掃描→影象處理(糾偏、消藍、影象增強、去雜)→OCR識別(版面分析、識別、橫向校對、縱向校對、匯出檔案)→建立索引→燒錄光碟(可全文檢索、二次檢索、模糊檢索)等全過程的流水線式加工方式,大大提高了加工效率和效果。規範了加工流程、專案管理方法和制度,合理的分配人員到各個流水線節點,建立了可最佳化的專案質量保證體系,使得每一次新的加工專案都能夠繼承原有專案的優秀經驗,並使得在這次新的專案中產生的經驗,能夠有效的被下一個專案繼承和發揚。

一一

規模化的生產、流水線式的作業,使得加工工人能夠從事自己最擅長和最熟練的工作,導致了專案質量的不斷提高和單位成本的穩定下降。

成熟的軟體產品

一一

東方明德本著以廣闊的胸襟,容納各種優秀的人才和產品。由於經濟的全球化帶來的人才和競爭方面的壓力,使得任何一個公司都不可能完全依賴於自己而立足於市場不敗,要想在競爭中獲得生存,就必須和其他人合作。

一一

我們引進TH-OCR錄入工廠,並與清華紫光建立了合作伙伴關係,在數字化領域進行多方面產品與服務合作。

流程管理和質量控制:

一一

流程管理貫穿於整個錄入工廠的生產流程中,伺服器端控制整個流程,它將資料打包、分發給各個客戶端;客戶端接收資料包,完成流程當中的某個或某幾個工序,完成後將資料打包發回給伺服器。質量控制功能是檢驗最終文字錯誤率的有效工具,它透過獨特的方法檢驗橫向校對、縱向校對和綜合校對之後的文字差錯率以確保最終文字的差錯率在一定範圍之內。流程管理和質量控制是大批次資料高效、高質錄入的必不可少的環節。

東方明德資料數字化解決方案以OCR錄入工廠為核心產品,並輔助影象淨化處理系統、圖文校驗工具,在整個的過程中融入東方明德多年的資料數字化領域的管理與製作經驗,確保為使用者提供優秀的產品和服務。

數字化流程

1、古籍領出登記:將珍貴古籍從館裡領出進行數字化掃描,做到每一本領出古籍都要嚴格登記,避免遺漏。登記時確認每本古籍的總頁數,與管理人員進行交接

2、古籍整理:將領出古籍進行平整處理,確保古籍無粘連、折邊、部分缺失等情況,確認處理好後開始利用書刊掃描器進行數字化掃描。 如無頁碼的需進行人工編頁碼防止掃描是順序錯亂以及丟頁。

3、古籍掃描:進行掃描時,根據每本古籍的不同情況做相應的處理。如古籍情況較好,則可以採用玻璃壓稿臺對古籍進行壓平掃描;如古籍紙張較薄,則需用空白A4紙張進行插墊,確保獲得的影像不會有背透而影響觀賞效果;如古籍本身情況不理想,則不必使用玻璃壓稿臺進行壓平,由書刊掃描器自帶PerfectBook 功能進行掃描處理。

4、影象修圖處理:掃描後的影象進行糾偏、去黑邊、分頁、拼圖等處理,更高的還原原影象。

5、影象質檢:處理後的影象統一質檢,質檢視具體情況而言分為一次質檢和二次質檢。主要是檢查影象的質量,和有無漏頁、重複掃描等情況。 發現問題及時改正補掃等等。

6、識別錄入:利用OCR對影象進行版面分析,比如文字的橫向縱向、圖片與表格等進行進行區分處理。

7、將分析好的影象OCR進行智慧識別並進行人工校對(可先進行縱校再橫校),保證質量減少錯誤率。

8、經過人工的一二三校,將資料按客戶要求的格式輸出並根據不同要求排版處理等。

9、格式轉換— 雙層PDF圖文格式: 用掃描方式製成TIFF影象,然後利用OCR技術將影象形式全部識別為可檢索的漢字,並將文字和影象進行對應,製作成影象在上、文字在下的雙層PDF格式檔案。既便於使用者快速準確地查詢到所需內容,又能使使用者古籍的原始面貌。雙層PDF特別適合於古籍數字化,異寫、通假、避諱等造成的眾多漢字無法完全識別,使用者透過影象即可對照。

8、資料儲存:據及壓縮轉換後的資料進行儲存,透過網路傳輸到磁碟陣列中進行儲存。