日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網(wǎng)為廣大站長提供免費收錄網(wǎng)站服務，提交前請做好本站友鏈：【網(wǎng)站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

網(wǎng)站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > IT業(yè)界 >正文

3行代碼，即可用Python從圖片中提取文本！第一步：設置Python庫第二步：準備工作第三步：編寫Python代碼總結(jié)

發(fā)布時間：2023-07-03 14:03:49 作者：網(wǎng)友整理

在這篇短文中，將向你展示如何使用Python的強大功能從圖像中提取文本。這種技術的應用是無止境的。這個技術可以用到以下例子中：

機器學習項目的數(shù)據(jù)挖掘

拍攝收據(jù)并閱讀處理內(nèi)容

第一步：設置Python庫

為了解決這個問題，我們將使用一個名為Python Tesseract的庫。從圖書館網(wǎng)站：

Python tesseract是Python的一個光學字符識別（OCR）工具。也就是說，它將識別并“讀取”嵌入圖像中的文本。

Python tesseract是google tesseract OCR引擎的包裝器。它還可用作tesseract的獨立調(diào)用腳本，因為它可以讀取Pillow和Leptonica圖像庫支持的所有圖像類型，包括jpeg、png、gif、bmp、tiff等。此外，如果用作腳本，Python tesseract將打印識別的文本，而不是將其寫入文件。

第二步：準備工作

在設置要使用的Python庫時，通常是一個單步過程。然而，對于PyTesseract，我們需要做兩件事：

安裝Python庫

安裝Tesseract應用程序

首先，要安裝Python庫，只需打開命令行窗口并鍵入：

pip install pytesseract

然后，可通過Github項目地址：
https://github.com/UB-Mannheim/tesseract/wiki，下載并安裝Tesseract OCR可執(zhí)行文件。

在撰寫本文時，我使用的是在2020-03-28年編譯的64位Alpha Build v5.0.0。

我們需要知道在哪里安裝，因為我們需要讓你的python腳本知道。

如果你完成了上面的步驟，你就可以開始了。

第三步：編寫Python代碼

正如所開頭說的那樣，使用3行代碼，您將能夠從圖片中讀取文本：

import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:Program FilesTesseract-OCRtesseract'
print(pytesseract.image_to_string(r'D:examplepdf2image.png'))