雙層PDF格式文件是一種具有多層結(jié)構(gòu)的PDF格式文件,是PDF文件衍生的一種文件,其特點是:文件既可以是文本型的(比如由word生成的文件),也可以是圖像型的,既可以100%保留原始版面效果,又便于建立索引數(shù)據(jù)庫,進行科學(xué)的管理。
很多時候我們發(fā)現(xiàn),明明PDF文件是掃描版的,卻可以復(fù)制其中的文字(偶爾會有錯字),這是怎么回事呢?原來這是PDF制作的一種技術(shù),叫“雙層PDF”。
雙層PDF格式文件是一種具有多層結(jié)構(gòu)的PDF格式文件,是PDF文件衍生的一種文件,文件既可以是文本型的(比如由word生成的文件),也可以是圖像型的(比如由掃描生成的文件,包含圖像層),且其位置上下一一對應(yīng)。制作過程中,資料通過掃描儀快速錄入后,經(jīng)過去污、糾偏和OCR識別,上層是原始圖像,下層是識別結(jié)果,然后可以直接生成可以檢索的PDF文件。這樣既可以100%保留原始版面效果,又便于建立索引數(shù)據(jù)庫,進行科學(xué)的管理。