一、pdf概述
pdf(portable document format)是一種結(jié)構(gòu)化的文檔格式。它由美國(guó)著名排版與圖像處理軟件adobe公司于1993年首次發(fā)布(1.0版),并于同年推出了其相應(yīng)的支持軟件產(chǎn)品系列adobeacrobat1.0版;隨后adobe公司又對(duì)它進(jìn)行修訂和升級(jí),于1994年發(fā)布了1.1版,并推出了支持軟件產(chǎn)品系列adobe acrobat2.0及2.1版。隨后的pdf1.2版又于1996年11月27日發(fā)布,相應(yīng)的支持軟件產(chǎn)品系列adobe acrobat也升級(jí)到3.0版。至1997年底,國(guó)際標(biāo)準(zhǔn)化組織已經(jīng)開(kāi)始醞釀將pdf接納為國(guó)際標(biāo)準(zhǔn)。
1.pdf與ps的比較
ps語(yǔ)言(postscript語(yǔ)言,即頁(yè)面描述語(yǔ)言),也是由adobe公司擁有的一項(xiàng)事實(shí)上的印刷工業(yè)標(biāo)準(zhǔn),它能描述精美的版面,在目前的印刷領(lǐng)域中占據(jù)著統(tǒng)治地位。pdf是從ps發(fā)展而來(lái),在對(duì)頁(yè)面的描述方面它們有著幾乎相同的能力和相似的描述方法。pdf采用了與ps相同的著色模型(imaging model)來(lái)表現(xiàn)文字和圖形,與ps語(yǔ)言一樣,pdf的頁(yè)面描述指令也是通過(guò)將選定的區(qū)域著色來(lái)繪制頁(yè)面的。著色的區(qū)域可以是字母等的輪廓、直線和曲線定義的區(qū)域以及位圖,著色的顏色可以是任意的,頁(yè)面上的任何圖形都可以被裁剪成其他形狀。頁(yè)面開(kāi)始時(shí)是全空的,各種指令將不同的圖形繪制到頁(yè)面上,并且新的圖形是不透明的,它可以覆蓋舊的圖形。
雖然如此,pdf與ps相比,還是有很大的不同。這主要表現(xiàn)在以下幾個(gè)方面:①pdf文件中可以包含交互對(duì)象,如超鏈接、交互表單等,而ps則沒(méi)有。②pdf是一種文件結(jié)構(gòu),而ps則是一種編程語(yǔ)言,因此,pdf具有比ps更高的處理效率。③pdf的嚴(yán)格結(jié)構(gòu)定義允許應(yīng)用程度對(duì)其中的某個(gè)對(duì)象進(jìn)行隨機(jī)存取,而ps則只能對(duì)整體進(jìn)行順序存取。例如要訪問(wèn)一個(gè)ps文件中的第100頁(yè),那么就必須在先順序解釋了其前99頁(yè)之后,才能找到第100頁(yè),而在pdf中對(duì)每一頁(yè)的存取則都是一樣快的。④pdf中還包含有字庫(kù)的規(guī)格尺寸等字庫(kù)描述信息,以便在字庫(kù)不存在之時(shí),可以進(jìn)行字庫(kù)仿真(并非簡(jiǎn)單的字庫(kù)替代),保證文檔顯示的一致性。
2.pdf的特點(diǎn)
pdf的特點(diǎn)可以歸納如下:①可傳遞性。pdf文件支持7位ascⅱ碼和二進(jìn)制碼這兩種編碼方式,可以正確地在各種網(wǎng)絡(luò)環(huán)境下進(jìn)行傳輸。②支持交互操作。pdf包含了交互表單和超鏈接等交互對(duì)象。③支持聲音、動(dòng)畫。④支持對(duì)頁(yè)面內(nèi)容的隨機(jī)存取,提高了頁(yè)面的各種操作速度。⑤支持不斷追加的修改方式,以便于少量修改和提高效率。⑥支持多種壓縮編碼方式,文件結(jié)構(gòu)更加緊湊。⑦字體無(wú)關(guān)性。pdf文件中可以自帶字庫(kù)描述信息,以便于在用戶系統(tǒng)缺乏所需字體的情況下,仍然能夠保證文檔的正確顯示。⑧平臺(tái)無(wú)關(guān)性。pdf文件具有軟、硬件的平臺(tái)獨(dú)立性。這個(gè)特點(diǎn)非常適合于網(wǎng)絡(luò)傳遞中的信息交換,以免除亂碼的苦惱。⑨安全性控制。pdf文件支持各種不同級(jí)別的安全性控制,這種安全性控制對(duì)于保護(hù)電子出版物的版權(quán)是非常重要的,我們可根據(jù)各種不同電子出版物的安全性要求來(lái)進(jìn)行不同級(jí)別的安全設(shè)置。
二、pdf原理結(jié)構(gòu)
1.pdf文件結(jié)構(gòu)
pdf的文件結(jié)構(gòu)(即物理結(jié)構(gòu))包括四個(gè)部分:文件頭、文件體、交叉引用表和文件尾,可參見(jiàn)圖一。
文件頭指明了該文件所遵從的pdf規(guī)范的版本號(hào),它出現(xiàn)在pdf文件的第一行。
文件體由一系列的pdf間接對(duì)象(indirectobject)組成。
交叉引用表則是為了能對(duì)間接對(duì)象進(jìn)行隨機(jī)存取而設(shè)立的一個(gè)間接對(duì)象的地址索引表。
文件尾聲明了交叉引用表的地址,即指明了文件體的根對(duì)象(catalog),還保存了加密等安全信息。
2.pdf文檔結(jié)構(gòu)
pdf的文檔結(jié)構(gòu)即是pdf文件內(nèi)容的邏輯組織結(jié)構(gòu),它反映了文件體中各間接對(duì)象間的等級(jí)層次關(guān)系。pdf的文檔結(jié)構(gòu)是一種樹(shù)型結(jié)構(gòu),如圖二所示。樹(shù)的根節(jié)點(diǎn)也就是pdf文件的根對(duì)象,根節(jié)點(diǎn)下面有四個(gè)子樹(shù):頁(yè)面樹(shù)(pages tree)、書簽樹(shù)(outline tree)、線索樹(shù)(articlethreads)和名字樹(shù)(nameddestination)。
其中,在頁(yè)面樹(shù)中,所有頁(yè)面對(duì)象都是該樹(shù)的葉子節(jié)點(diǎn),它們將繼承父節(jié)點(diǎn)的各屬性值來(lái)作為其相應(yīng)屬性的缺省值。書簽樹(shù)則是按照樹(shù)型層次的等級(jí)關(guān)系來(lái)將書簽(book mark)組織起來(lái)的,書簽建立了某個(gè)書簽名與一個(gè)具體頁(yè)面的位置關(guān)聯(lián),它使得用戶可以按照書簽名來(lái)訪問(wèn)文檔的內(nèi)容。線索樹(shù)則將文章線索以及線索下的各文章塊(article bead),按照樹(shù)型的結(jié)構(gòu)組織起來(lái)進(jìn)行管理。至于名字樹(shù),它則是建立了一種字符串(即名字)和頁(yè)面區(qū)域的對(duì)應(yīng)關(guān)系,樹(shù)中的各葉子節(jié)點(diǎn)保存著字符串及其相應(yīng)的頁(yè)面區(qū)域,而非葉子節(jié)點(diǎn)則只是一種索引,以便讓應(yīng)用程序能夠?qū)θ~子節(jié)點(diǎn)進(jìn)行快速存取。名字樹(shù)的作用就是讓pdf文件中的其它對(duì)象也能夠用字符串名字來(lái)代表其某一個(gè)頁(yè)面區(qū)域。
3.pdf中的資源
pdf中的頁(yè)面內(nèi)容(如文字、圖形、圖像等)都保存在頁(yè)對(duì)象的contents關(guān)鍵字所對(duì)應(yīng)的流對(duì)象(以下簡(jiǎn)稱內(nèi)容流)中。內(nèi)容流中用到了很多基本對(duì)象(如數(shù)字、字符串等),這些都是利用直接對(duì)象來(lái)表示的。但還有其它一些對(duì)象(如字體等),它們本身就是用字典對(duì)象(dictionary)或流對(duì)象(stream)來(lái)表示的,無(wú)法用直接對(duì)象來(lái)表示,而內(nèi)容流中又不能出現(xiàn)有任何的間接對(duì)象(否則就無(wú)法與內(nèi)容本身的數(shù)據(jù)區(qū)分),于是就將這些對(duì)象另外命名,并在內(nèi)容流中用相應(yīng)的名字來(lái)表示它們。這些用名字來(lái)表示的對(duì)象就稱作命名資源(named resources)。
在頁(yè)面對(duì)象中有一個(gè)資源項(xiàng)(resources key),該項(xiàng)列出了內(nèi)容流中用到的所有資源,并且建立了一個(gè)資源名字與資源對(duì)象之間的映射表。pdf中的命名資源有:指令集(proc set)、字體(font)、色彩空間(color space)、外部對(duì)象〔x object(包括image、form和ps segment)等〕、擴(kuò)展的圖形狀態(tài)(extended graphics state)、底紋(pattern)和用戶擴(kuò)展標(biāo)記列表(property list)等。
非命名資源有:enc oding、font de s c-riptor、halftone、function和c map等。由于非命名資源都是被隱含使用的,因此就沒(méi)有命名的需要。
4.pdf頁(yè)面描述指令
pdf中共有60個(gè)頁(yè)面描述指令,這60個(gè)頁(yè)面描述指令描述了頁(yè)面上的一系列的圖形對(duì)象。這些圖形對(duì)象大致可以分為四類,即路徑對(duì)象(path object)、文本對(duì)象(text object)、圖像對(duì)象(image object)和外部對(duì)象。它們是構(gòu)成所有頁(yè)面的基本元素。
三、pdf文件生成
目前pdf文件的生成有兩種途徑:
1. 通過(guò)打印的方式生成pdf。也就是說(shuō)通過(guò)一個(gè)虛擬的pdf打印機(jī)將應(yīng)用程序的文字和圖形等指令(如windows下的gdi指令、mac下的quick-draw指令等)轉(zhuǎn)換為pdf指令,并將其保存在相應(yīng)的pdf文件中,如圖三所示。在安裝了adobeacrobat pdfwriter之后,從理論上來(lái)說(shuō),所有的只要具有打印功能的應(yīng)用程序,都應(yīng)該能夠?qū)⒋蛴〉膬?nèi)容貯存到pdf文件中。但是,目前生成中文的pdf文件尚有很多問(wèn)題。
2.由ps轉(zhuǎn)換到pdf。這是另一種生成pdf的方法,它是由應(yīng)用程序先將待打印的內(nèi)容發(fā)排到ps文件中,然后再由adobe acrobatdistiller將ps文件轉(zhuǎn)換成pdf文件,可參見(jiàn)圖四。
兩種生成pdf的方法各有利弊。通過(guò)打印的方式生成pdf的優(yōu)點(diǎn)就是,它和應(yīng)用程序能夠緊密地結(jié)合,在用戶看來(lái)它是從應(yīng)用程序中直接生成pdf的,但缺點(diǎn)是由于gdi指令集和quick-draw指令集本身的局限,難以生成高精度的pdf。然而從ps轉(zhuǎn)換到pdf雖然多了一道工序,但是由于ps本身具有高精度的描述能力,因此生成的pdf可以達(dá)到印刷級(jí)的質(zhì)量和精度。在生成了pdf文件之后,用戶就可以用acrobatreader來(lái)進(jìn)行閱讀和打印,而且還可以具體地使用acrobatexchange來(lái)給pdf文件增加如頁(yè)面縮略圖、超鏈接、書簽(或目錄)、注釋等一系列的交互屬性。在采用adobe提供的工具來(lái)生成pdf之時(shí),目前都存在著中文支持方面的問(wèn)題,如不支持中文字庫(kù)的下載、中文顯示依賴操作系統(tǒng)等等。
人口的增長(zhǎng)將會(huì)影響英國(guó)紙與紙板的市場(chǎng)需求量連跌14周的瓦楞紙,背后原因有點(diǎn)復(fù)雜各大龍頭企業(yè)為智能包裝砸數(shù)十億巨資輕松解決印花分色“五宗罪”標(biāo)簽種類全接觸你是否對(duì)網(wǎng)絡(luò)印刷有這樣的誤解?彩色全息制版常用光源及其選擇
上一篇:激光等新型技術(shù)將在中國(guó)印刷領(lǐng)域得到更為廣泛的應(yīng)用!
下一篇:案例:異常聲音辨別印機(jī)故障