日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

處理圖像不是一項簡單的任務。 對你來說,作為一個人,很容易看著某樣東西然后馬上知道你在看什么。 但電腦不是這樣工作的。

對你來說太難的任務,比如復雜的算術,或者一般意義上的數學,是計算機毫不費力就能完成的。 但在這里, 情況正好相反 ——對你來說很瑣碎的任務,比如識別圖像中的貓或狗,對電腦來說真的很難。 在某種程度上,我們是天造地設的一對。 至少現在是這樣。

雖然圖像分類和涉及到一定程度計算機視覺的任務可能需要大量的代碼和扎實的理解,但是從格式良好的圖像中讀取文本在Python中卻是簡單的,并且可以應用于許多現實生活中的問題。私信小編01 領取完整項目代碼~

在今天的帖子中,我想證明這一點。 雖然會安裝一些庫,但不會花很多時間。 這些是你需要的庫:

  • OpenCV
  • PyTesseract

OpenCV

現在,這個庫將只用于加載圖像,實際上你不需要事先對它有太多了解(盡管它可能有幫助,你將看到為什么)。

根據官方文件:

OpenCV(開源計算機視覺庫)是一個開源的計算機視覺和機器學習軟件庫。 OpenCV的目的是為計算機視覺應用提供一個通用的基礎結構,并加速機器感知在商業產品中的使用。 OpenCV是bsd許可的產品,OpenCV使企業可以輕松地使用和修改代碼

簡而言之,你可以使用OpenCV來做任何類型的 圖像轉換 ,這是一個相當簡單的庫。

如果你還沒有安裝它,那么它將只是終端中的一行:

pip install opencv-python

差不多就是這樣。 在此之前,一切都很簡單,但這種情況即將改變。

PyTesseract

這個庫到底是什么東西?根據維基百科:

Tesseract是用于各種操作系統的光學字符識別引擎。它是免費軟件,根據Apache許可2.0版發布,自2006年以來由google贊助開發。

我敢肯定,現在有更多復雜的庫可用,但是我發現這個庫運行良好。 根據我自己的經驗,該庫應該能夠從任何圖像中讀取文本,但前提是該字體不會使你連連看都看不懂。

如果無法從你的圖像中讀取文字,花更多的時間使用OpenCV,應用各種過濾器使文本高亮。

現在安裝在底部有些麻煩。 如果你使用的是linux,則全部歸結為幾個 sudo-apt get 命令:

sudo apt-get update
sudo apt-get install tesseract-ocr
sudo apt-get install libtesseract-dev

我用的是windows系統,所以這個過程有點乏味。

首先,打開這個URL:

https://github.com/UB-Mannheim/tesseract/wiki

下載32位或64位的安裝程序:

使用一行Python代碼從圖像讀取文本

 

安裝本身很簡單,只需單擊幾次Next。 是的,你還需要做一個 pip安裝 :

pip install pytesseract

接下來要需要告訴Python Tesseract安裝在何處。 在Linux機器上,我不需要這樣做,但在Windows上是必需的。 默認情況下,它安裝 Program Files 。

如果你做的一切正確,執行這些代碼應該不會產生任何錯誤:

使用一行Python代碼從圖像讀取文本

 

獲取文本

讓我們從一個簡單的開始。 我找到了一些免版稅的圖片,里面有一些文字,第一個是這樣的:

使用一行Python代碼從圖像讀取文本

 

它應該是簡單的一個,有可能Tesseract會讀那些藍色的“對象”作為括號。 讓我們看看會發生什么:

使用一行Python代碼從圖像讀取文本

 

我的猜測是正確的。 不過,這不是一個問題,你可以使用一些Python技巧輕松地解決這些問題。

下一個可能更棘手:

使用一行Python代碼從圖像讀取文本

 

我希望它不會檢測到硬幣上的“B”:

使用一行Python代碼從圖像讀取文本

 

看起來效果很好。

現在輪到你把它應用到你自己的問題上了。 如果文本與背景混合,OpenCV技能在這里可能是至關重要的。

在你離開之前

對計算機來說,從圖像中讀取文本是一項相當困難的任務。 想想看,電腦不知道字母是什么,它只對數字有效。 在引擎蓋后面發生的事情一開始可能看起來像一個黑盒子,但我鼓勵你進一步研究,如果這是你感興趣的領域。

我并不是說PyTesseract每次都能很好地工作,但是我發現即使在一些比較復雜的圖像上它也足夠好。 但不是所有情況都很好,有時候需要一些圖像處理需要使文本高亮讓其相對于背景更加突出。

分享到:
標簽:代碼 Python
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定