亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用Acrobat軟件生成文本型PDF文件

        2013-12-31 00:00:00馬云彤
        今傳媒 2013年12期

        摘 要:我國(guó)網(wǎng)絡(luò)期刊文獻(xiàn)大都采用PDF格式,且以文本型(矢量模式)為主,但也有部分為圖片型(光柵模式)PDF文獻(xiàn)。圖片型PDF文獻(xiàn)無(wú)法復(fù)制、搜索、取詞,也不支持在線實(shí)時(shí)檢索、學(xué)術(shù)不端檢測(cè)等功能。利用Adobe Acrobat Professional 10.0可對(duì)掃描或其他方式生成的圖片型PDF文獻(xiàn)進(jìn)行頁(yè)面裁剪、OCR文本識(shí)別及頁(yè)面校正,從而可以獲得頁(yè)面整潔、端正的文本型PDF文獻(xiàn)。

        關(guān)鍵詞:Adobe Acrobat Professional 10.0;OCR文本識(shí)別;文本型;圖片型

        中圖分類號(hào):TP391.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-8122(2013)12-0105-02

        我國(guó)網(wǎng)絡(luò)期刊出版采用的文件格式主要有CAJ、PDF和HTML三種[1],其中大多數(shù)為PDF格式[2]。PDF是世界上期刊網(wǎng)絡(luò)版通用格式[3],我國(guó)的中國(guó)知網(wǎng)(CNKI)和國(guó)家科技圖書文獻(xiàn)中心(NSTL)也都提供PDF格式的期刊文獻(xiàn)。生成PDF文檔的常用方法包括通過(guò)其他軟件中轉(zhuǎn)和通過(guò)虛擬打印機(jī)。目前期刊編輯部廣泛使用北大方正書版排版軟件,可以直接或間接生成文本型PDF文獻(xiàn),其文字為矢量模式,可以進(jìn)行選擇復(fù)制、搜索查找、金山詞霸取詞等操作。但在缺少原始電子文件時(shí),則需以掃描樣刊的方式生成圖片型PDF文獻(xiàn)。圖片型PDF文件整個(gè)頁(yè)面為一個(gè)光柵圖像,其中的文字不能被選中 [4-5],不僅無(wú)法復(fù)制、搜索、取詞,也不支持在線實(shí)時(shí)檢索、學(xué)術(shù)不端檢測(cè)等功能,也常會(huì)出現(xiàn)邊緣有多余文字以及頁(yè)面不正等情況,從而影響到讀者對(duì)文獻(xiàn)的閱讀利用和數(shù)據(jù)庫(kù)系統(tǒng)的正常運(yùn)行。本文利用Adobe Acrobat Professional 10.0,以自國(guó)家科技圖書文獻(xiàn)中心(NSTL)下載的英文文獻(xiàn)“Relative measure index: a metric to measure the quality of journals”作為示例,對(duì)掃描(也可以是其他方式轉(zhuǎn)換)生成的圖片型(光柵模式)PDF文獻(xiàn)進(jìn)行裁剪,通過(guò)OCR文本識(shí)別轉(zhuǎn)換為文本型(矢量模式),并同步對(duì)頁(yè)面進(jìn)行校正。

        一、PDF文件頁(yè)面裁剪

        用Adobe Acrobat Professional 10.0打開(kāi)所處理文獻(xiàn),首先對(duì)頁(yè)面進(jìn)行裁剪,裁剪需要逐頁(yè)進(jìn)行,而對(duì)于文本識(shí)別、啟動(dòng)注釋等,可以整篇同時(shí)完成。

        圖1為所處理文獻(xiàn)的首頁(yè),該文獻(xiàn)為掃描生成的圖片型PDF文件,無(wú)法進(jìn)行文字選中、復(fù)制、搜索(查找)、翻譯取詞等操作,整篇文獻(xiàn)頁(yè)面橫置,頁(yè)面邊緣有多余文字。

        點(diǎn)擊右上角“工具”按鈕,打開(kāi)“工具”窗格,選擇“頁(yè)面”→“裁剪”路徑(如圖2所示)。用出現(xiàn)的十字形光標(biāo)選擇裁剪區(qū)域(如圖3所示),在選擇區(qū)域內(nèi)雙擊鼠標(biāo)右鍵,出現(xiàn)“設(shè)置頁(yè)面框”對(duì)話框(如圖4所示),確定即可完成裁剪;這一步也可以單擊鼠標(biāo)右鍵,點(diǎn)擊“設(shè)置頁(yè)面框”命令,這時(shí)即直接將裁減框外的頁(yè)面裁剪掉。

        圖1 所處理的掃描生成PDF文獻(xiàn)(首頁(yè))

        圖2 工具—頁(yè)面—裁剪 圖3 選擇裁減區(qū)域

        工具窗格也可以通過(guò)菜單欄中的“視圖”→“工具”路徑打開(kāi),但不如通過(guò)工具窗格打開(kāi)操作便捷、界面友好。

        圖4 “設(shè)置頁(yè)面框”對(duì)話框

        二、將圖片型PDF文件轉(zhuǎn)換成文本型PDF文件

        打開(kāi)“工具”窗格,通過(guò)“識(shí)別文本”→“在本文件中”路徑(如圖5所示),打開(kāi)“識(shí)別文本”對(duì)話框(如圖6所示),點(diǎn)擊“編輯”按鈕,出現(xiàn)“識(shí)別文本-一般設(shè)置”對(duì)話框(如圖7所示),設(shè)置OCR識(shí)別的主要語(yǔ)言,根據(jù)筆者觀察選擇中文或英文對(duì)識(shí)別效果沒(méi)有影響,識(shí)別準(zhǔn)確率都很高,但對(duì)生成的文本型PDF進(jìn)行復(fù)制、粘貼操作中,如果設(shè)置語(yǔ)言與轉(zhuǎn)換語(yǔ)言不一致,則可能出現(xiàn)亂碼。分辨率選擇300dpi,設(shè)置完成后確定,即可將圖片型轉(zhuǎn)換為文本型,并同步進(jìn)行頁(yè)面校正,將傾斜的頁(yè)面轉(zhuǎn)正,也可將橫置頁(yè)面轉(zhuǎn)換為豎立;通過(guò)菜單“文件”→“另存為”→“PDF”,設(shè)置路徑、重命名后加以保存。

        圖5 工具窗格—識(shí)別文本 圖6 “識(shí)別文本”對(duì)話框

        圖7 “識(shí)別文本-一般設(shè)置”對(duì)話框

        將圖片型PDF文件轉(zhuǎn)換生成文本型PDF文件還可以通過(guò) “工具”→“文檔處理”→“優(yōu)化掃描的PDF”路徑實(shí)現(xiàn),并可進(jìn)行應(yīng)用自適應(yīng)壓縮、小文件/高質(zhì)量、濾鏡、OCR識(shí)別等各項(xiàng)設(shè)置(如圖8所示)。經(jīng)嘗試,利用默認(rèn)設(shè)置即可取得良好效果,與采用“文本識(shí)別”方法基本等效,而采用多種不同設(shè)置生成的文本型PDF顯示效果差別也不明顯。

        圖8 “優(yōu)化掃描的PDF”對(duì)話框

        圖9顯示新生成的文獻(xiàn)首頁(yè)的完整頁(yè)面,頁(yè)面端正、整潔,可進(jìn)行文字選中、復(fù)制等操作(如圖10所示),也可用金山詞霸取詞(如圖11所示)。

        圖9 新生成的文本型PDF文獻(xiàn)頁(yè)面

        圖10 選中和復(fù)制

        圖11 金山詞霸屏幕取詞

        三、結(jié) 語(yǔ)

        通過(guò)大型網(wǎng)絡(luò)數(shù)據(jù)庫(kù)下載已成為讀者獲得所需文獻(xiàn)的主要途徑。網(wǎng)絡(luò)期刊文獻(xiàn)大多采用PDF格式,以文本型為主,但仍有部分為圖片型PDF文件。圖片型PDF文件不支持以文字屬性為運(yùn)行基礎(chǔ)的功能,例如復(fù)制、搜索、取詞以及文獻(xiàn)檢索、學(xué)術(shù)不斷檢測(cè),等等。采用Adobe Acrobat Professional 10.0將圖片型PDF文件轉(zhuǎn)換為文本型PDF文件,對(duì)于讀者充分利用文獻(xiàn)資源和數(shù)據(jù)庫(kù)良好運(yùn)行具有一定的實(shí)用意義。

        筆者在閱讀PDF格式英文文獻(xiàn)時(shí),習(xí)慣于采用金山詞霸屏幕取詞和翻查字典結(jié)合的方式,但是從網(wǎng)上獲得的PDF文獻(xiàn),常為光柵模式無(wú)法取詞;將PDF文件由圖片型轉(zhuǎn)換為文本型,可以有效解決這一問(wèn)題。

        參考文獻(xiàn):

        方寶花.期刊網(wǎng)絡(luò)出版中的文件格式比較[J].情報(bào)技術(shù),2005(2).

        周雪瑩.采用雙層 PDF 形式將方正書版文件制作為可檢索式 PDF 文件[J].編輯學(xué)報(bào),2012(6).

        陳莊.網(wǎng)絡(luò)科技期刊插圖圖像質(zhì)量調(diào)查與分析[J].科技與出版,2011(6).

        李宗紅.利用Adobe Acrobat Professional 8.0軟件實(shí)現(xiàn)圖片型PDF文件到文本型PDF文件的轉(zhuǎn)換[J].中國(guó)科技期刊研究,2010 (l).

        周雪瑩.對(duì)“利用Adobe Acrobat Professional 8.0軟件實(shí)現(xiàn)圖片PDF文件到文本型PDF文件的轉(zhuǎn)換”一文的質(zhì)疑——與李宗紅老師商榷[J].中國(guó)科技期刊研究,2011(6).

        大陆老熟女自拍自偷露脸| 亚洲欧美日韩中文天堂| 青青在线精品2022国产| 成年女人18毛片毛片免费| 在线成人影院国产av| 亚州国产av一区二区三区伊在| 午夜精品久久久久成人| 国产精品久久久久尤物| 国产一区二区在线视频| 国产AV无码专区久久精品网站| 国产高清女人对白av在在线| 一二三四在线观看视频韩国| 7777色鬼xxxx欧美色妇| 亚洲精品无码高潮喷水在线 | 91久久综合精品国产丝袜长腿| 亚洲一区二区情侣| 中文字幕亚洲五月综合婷久狠狠| 亚洲日韩精品一区二区三区无码| 亚洲∧v久久久无码精品| 无码人妻丝袜在线视频| 精品人妻久久av中文字幕| 国产自拍成人免费视频| 无码专区一ⅴa亚洲v天堂| 毛片内射久久久一区| 国产999精品久久久久久| 天天中文字幕av天天爽| 麻豆成人久久精品一区| 欧美国产综合欧美视频| japanese无码中文字幕| 亚洲精品一区二区在线播放| 精品国产一区二区三区18p| 欧美裸体xxxx极品少妇| 亚洲情a成黄在线观看动漫尤物| 最新亚洲视频一区二区| 亚洲av午夜成人片精品电影| 国产又色又爽无遮挡免费| 无码91 亚洲| 国产av在线观看一区二区三区| 又黄又硬又湿又刺激视频免费 | 国产成人av综合色| 蜜桃传媒网站在线观看|