日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

OCR是什么?

有一款軟件叫掃描全能王,想必一些小伙伴聽過,這是一個OCR集成軟件,可以將圖像內容掃描成文字。

所以說,OCR作用是對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息。

OCR的全稱叫作“Optical Character Recognition”,即光學字符識別。

這算是生活里最常見、最有用的AI應用技術之一。

這款Python 庫 4行代碼提取圖片中的文字

 

細心觀察便可發現,身邊到處都是OCR的身影,文檔掃描、車牌識別、證件識別、銀行卡識別、票據識別等等。

OCR本質是圖像識別,其包含兩大關鍵技術:文本檢測和文字識別。

先將圖像中的特征的提取并檢測目標區域,之后對目標區域的的字符進行分割和分類。

這款Python 庫 4行代碼提取圖片中的文字

 

關于EasyOCR

Python/ target=_blank class=infotextkey>Python中有一個不錯的OCR庫-EasyOCR,在GitHub已有9700star。它可以在python中調用,用來識別圖像中的文字,并輸出為文本。

?

https://github.com/JaidedAI/EasyOCR

?

這款Python 庫 4行代碼提取圖片中的文字

 

EasyOCR支持超過80種語言的識別,包括英語、中文(簡繁)、阿拉伯文、日文等,并且該庫在不斷更新中,未來會支持更多的語言。

這款Python 庫 4行代碼提取圖片中的文字

 


圖片

安裝EasyOCR

安裝過程比較簡單,使用pip或者conda安裝。

pip install easyocr

如果用的PyPl源,安裝起來可能會耽誤些時間,建議大家用清華源安裝,幾十秒就能安裝好。

使用方法

EasyOCR的用法非常簡單,分為三步:

  • 1.創建識別對象;
  • 2.讀取并識別圖像;
  • 3.導出文本。

我們先來舉個簡單的例子。

 

找一張路標圖片,保存到電腦:

這款Python 庫 4行代碼提取圖片中的文字

 

接著擼代碼:

# 導入easyocrimport easyocr# 創建reader對象reader = easyocr.Reader(['ch_sim','en']) # 讀取圖像result = reader.readtext('test.jpg')# 結果result

 

輸出結果:

這款Python 庫 4行代碼提取圖片中的文字

 

可以看到路標上的三個路名以及拼音都識別出來了!

識別的結果包含在元組里,元組由三部分組成:邊框坐標、文本、識別概率。

「關于語言:」

這段代碼有一段參數['ch_sim','en'],這是要識別的語言列表,因為路牌里有中文和英文,所以列表里添加了ch_sim(簡體中文)、en(英文)。

可以一次傳遞多種語言,但并非所有語言都可以一起使用。英語與每種語言兼容,共享公共字符的語言通常相互兼容。

前文我們給出了EasyOCR支持的語言列表,并附有參數代號。

「關于圖像文件:」

上面傳入了相對路徑'test.jpg',還可以傳遞OpenCV圖像對象(numpy數組)、圖像字節文件、圖像URL。

 

再讀取一張文字較多的新聞稿圖片:

這款Python 庫 4行代碼提取圖片中的文字

 

# 導入easyocrimport easyocr# 創建reader對象reader = easyocr.Reader(['ch_sim','en']) # 讀取圖像result = reader.readtext('test1.jpg')# 結果result
這款Python 庫 4行代碼提取圖片中的文字

 

識別文字的準確率還是很高的,接下來對文字部分進行抽取。

for i in result:    word = i[1]    print(word)

 

輸出:

這款Python 庫 4行代碼提取圖片中的文字

 

小結

該開源庫是作者研究了幾篇論文,復現出來的成果,真是一位實干家。

檢測部分使用了CRAFT算法,識別模型為CRNN,它由3個主要組件組成:特征提取,序列標記(LSTM)和解碼(CTC)。整個深度學習過程基于Pytorch實現。

作者一直在完善EasyOCR,后續計劃一方面擴展支持更多的語言,爭取覆蓋全球80%~90%的人口;另一方面支持手寫識別,并提高處理速度。

分享到:
標簽:Python
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定