一、 針對做成PDF格式文件的原文檔是文字的的話:
1、直接用Adobe Reader 7.0等 或者 Adobe Acrobat 8 Professional 軟件直接打開PDF文件,進行復制。(這個是最簡單的PDF文件了)
2、使用PDF2Word漢化版軟件將PDF轉化為word,再在word里面進行操作,常用軟件為:
e-PDF To Word Converter v2.5。
二、 針對做成PDF格式文件的原文檔是掃描或其它圖片的,那就只能使用OCR(光學識別了)
1、先用QQ截屏工具或其它工具截取下你要轉換成WORD文檔的那部分文字,再另存成TIF格式的圖片。
2、可以借助于Microsoft office的一個工具Microsoft office Document Imaging這個功能,就可以實現把圖片轉換成WORD文檔,我們那么打開Microsoft office Document Imaging這個工具。
開始——程序——Microsoft office——Microsoft office工具——Microsoft office Document Imaging。打開工具“Microsoft office Document Imaging” 如下圖:
打開要轉換的TIF格式圖片文件。點擊菜單上的“工具”——“使用OCR識別文本”(開始進行光學OCR識別文本),識別完成后“確定”。
再點擊菜單上的“工具”——“將文本發送到wold”。出現保存路徑的話框,選擇保存路徑及文件名,確定。如下圖:
三、簡化版的wold2003等都沒有“OCR識別文本”工具,可使用其他軟件,如”mini ocr”、“尚書七號OCR”等。
“尚書七號OCR”:功能齊全,帶有掃描功能,識別后可直接保存為word格式文件。如下圖:
“mini ocr”:僅為文字識別,識別后僅保存為txt格式,操作簡單,且為綠色軟件。
下面是“mini ocr”的應用方法:
一、軟件初始面板
二、點擊打開圖像文件導入圖片文件(可以是jpg、bmp、gif等格式的圖片)
三、點擊文字識別進行OCR識別
四、點擊保存結果,(選擇保存路徑)保存(僅為txt格式)
五、完成后的文件,如需存為WORD格式,自己Ctrl+C、Ctrl+V一下就OK了。
需說明的是:不論哪款軟件識別出來的結果都不會與原件一模一樣,都有部分亂碼,這與原稿的清晰度、亮度、對比度等都有很大的關系。如原件質量差,可先PS一下再進行識別要好些。最后結果能得到70%~90%左右就算不錯了。剩下的當然就自己慢慢改了