使用pdfbox，為什么可以提取文本，但不能提取圖像-魔扣目錄

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

使用pdfbox，為什么可以提取文本，但不能提取圖像

發布時間：2024-03-09 00:32:47 作者：網友整理

本文介紹了使用pdfbox，為什么可以提取文本，但不能提取圖像的處理方法，對大家解決問題具有一定的參考價值，需要的朋友們下面隨著小編來一起學習吧！

我正在使用pdfbox從pdf中提取圖像和文本。我有以下提取文本的代碼：

 PDFTextStripper p = new PDFTextStripper();
 String thistext=p.getText(document);

，它正確地提取文本。然而，當我嘗試使用ExtractImages類從同一個pdf中提取圖像時，生成的圖像是pdf的所有頁面，而不是實際的圖像。這是因為pdf可能是掃描的副本嗎？如果這是真的，為什么提取文本？

我認為它被掃描這一事實是您的問題。雖然我見過掃描的PDF檢測文本(并使其可突出顯示)，但它仍然是一幅圖像。要檢驗這一假設，我會嘗試使用已知良好的PDF，例如this one。

這篇關于使用pdfbox，為什么可以提取文本，但不能提取圖像的文章就介紹到這了，希望我們推薦的答案對大家有所幫助，

分享到：

標簽：pdfbox 圖像提取文本

網友整理

注冊時間：

網站：5 個小程序：0 個文章：12 篇

文章分類

熱門網站

數獨一種數學游戲，玩家需要根據9

您可以通過答題星輕松地創建試卷

各種考試題，題庫，初中，高中，大學四六

記錄運動步數，積累氧氣值。還可偷

每日養生,天天健康

通用課目體育訓練成績評定