譯者 | 布加迪
20世紀50年代的計算機視覺首批用例可以分析鍵入文本和手寫文本。早期的商業應用程序致力于單個圖像,包括光學字符識別、圖像分割和對象檢測。人臉識別方面的開創性工作始于20世紀60年代,科技巨頭們在2010年左右開始推出相關功能。
計算機視覺市場規模在2022年估計為140億美元,預計從2023年到2030年將以19.6%的年復合增長率增長。雖然有許多新的計算機視覺突破和初創公司,但與其他人工智能技術相比,市場規模還是很小。比如說,到2032年,生成式人工智能的市場規模估計將達到1.3萬億美元。
計算機視覺的新興用例
如今無論您走到哪里,攝像頭都可能在掃描您,計算機視覺算法執行實時分析。計算機視覺的主要用例包括文檔掃描、視頻監控、醫療成像和交通流量檢測。實時計算機視覺方面的突破促進了自動駕駛汽車的發展,并推動了無收銀員商店和庫存管理等零售用例的發展。
您可能碰到過或讀到過諸如此類的面向消費者的用例,特別是汽車和消費者市場中的計算機視覺主要應用。
您可能不太了解制造業、建筑業及其他工業企業在如何使用計算機視覺技術。這些行業的企業通常遲遲不愿投入于技術,但制造、數字建筑和智能農業等行業的工業4.0計劃正在幫助行業領導者更好地了解新興技術帶來的機遇。
減少制造過程中的浪費
計算機視覺在制造業帶來了重大的機會,計算機視覺算法達到了99%的準確率。考慮到只有10%的公司使用這項技術,這方面的潛力尤其驚人。工業領域正在醞釀一場數字革命,還是這些企業在采用計算機視覺技術方面繼續落后?
IndustrialML首席執行官Arjun Chandar表示,在制造業中,識別動態材料的產品質量是主要的用例。“借助高幀率的相機和逐幀運用機器學習模型,就可以快速識別生產線上的瑕疵。”
全球制造商每年浪費高達8萬億美元,計算機視覺可以幫助監控設備、制造部件和環境因素,從而幫助制造商減少這些損失。
Chandar表示,許多制造業用例的底層技術是主流技術。“這些主要使用2D相機,不過擁有高分辨率和每秒20幀或更高的幀率,還使用卷積神經網絡(CNN)。”
為了提高準確性,制造商需要一種策略來充實這些數據。Chandar補充道:“要像在典型的制造環境中那樣增強訓練能力,具有良好產品質量的圖像數量需遠遠超過瑕疵。”
消除這個缺口的一種方法是使用合成數據,這是開發團隊用來增加測試數據多樣性的一種方法。
Syntax數據管理和創新合伙人Jens Beck表示,制造商可以從基本的視覺檢查步驟入手,隨后尋求更大的自動化機會。他說:“我們看到計算機視覺和人工智能結合用于視覺檢查,比如在汽車上檢查膠水痕跡。對客戶來說,商業價值不僅僅在于通過自動化手動步驟來提高整體設備有效性(OEE),還在于將檢查記入文檔,然后將計算機視覺集成到制造執行系統(MES)中,最終集成到企業資源規劃系統(ERP)中。”
提高工廠車間的安全性
除了質量和效率外,計算機視覺還有助于提高工人的安全性,減少工廠車間及其他工作場所的事故。據美國勞工統計局聲稱,2021年制造業有近40萬人受傷和患病。
Synthesis AI的首席執行官兼創始人Yashar Behzadi說:“計算機視覺可以比人員監管體系更快速更高效地不斷識別員工面臨的潛在風險和威脅,從而提高工人的安全性。計算機視覺要準確可靠地做到這點,機器學習模型就要使用大量的數據進行訓練;在這些特定的用例中,非結構化數據常常以原始、未標記的形式出現在機器學習工程師的面前。”
使用合成數據對于安全相關的用例也很重要,因為制造商不太可能有著重顯示潛在安全因素的圖像。Behzadi補充道:“合成數據等技術通過提供準確標記的高質量數據,減輕了機器學習工程師的壓力。這些數據可以解釋極端情況,從而節省時間和金錢,并避免不準確的數據導致的棘手問題。”
Gramener的物流和供應鏈SBU負責人Sunil Kardam表示:“計算機視覺的好處包括實時分析、提高效率和改進決策。”Kardam分享了另外幾個典型的用例:
- 跟蹤物料移動、識別產品和包裝的瑕疵以及減少浪費
- 通過監視未授權人員的行為來落實協議
- 簡化文檔處理、優化庫存、幫助保險索賠,并實現高效的物流管理
Kardam認為,計算機視覺依賴攝像頭和先進的算法,比如YOLO、Faster R-CNN和OpenCV。他表示,計算機視覺的機器學習模型“可以在邊緣設備或云端處理,智能攝像頭和基于云的API提供了強大的功能。”
監測電網
大多數制造都在室內進行,工程師對環境有一定的控制,包括在哪里放置攝像頭以及何時添加照明設施。需要使用安裝的相機、無人機、飛機和衛星分析室外區域和景觀時,計算機視覺用例會比較復雜。
Buzz Solutions的首席技術官、首席運營官兼聯合創始人Vik Chaudry分享了一個使用無人機的例子。他說:“計算機視覺被用來監測和識別電網、公用事業公司和變電站的故障,以確保美國各地有可靠互聯的電網。依靠從美國各地眾多公用事業公司收集的數千個圖像,計算機視覺可以準確識別威脅、故障和異常情況。”
電力線火災是一個值得關注的重要領域。據美國國家跨部門消防中心聲稱,從1992年到2020年,美國各地發生了3.2萬多起電線引燃的野火,加州的第二大野火是由電線太靠近一棵樹引起的。公用事業公司現正在評估人工智能的機會,以優化維修,盡量降低風險。
Chaudry說:“由于該軟件使用來自現有公用事業公司的真實數據和圖像,因此它極其準確,可以識別來自天氣、維護不良的基礎設施和氣溫上升的一系列威脅。這項技術可以實現快速高效的維護,同時防止大面積停電和電網引發的災難。”
腦機接口
展望未來,AAVAA的首席技術官Naeem Komeilipoor透露了計算機視覺和新興技術設備的新前沿。他說:“在工業環境中使用的腦機接口(BCI)技術可以作為某些工業計算機視覺用例的補充方法,特別是在低能見度、極端溫度或攝像頭使用受限制的危險環境中。”
在危險條件下完成維修是一種用例,但更常見的用例是當建筑施工、煉油廠工作或其他現場工作需要使用雙手來檢查或操控機械設備時。
“以工地上進行維修為例。智能眼鏡中使用的BCI技術提供了一種替代方法,無需外部攝像頭即可跟蹤眼球運動,因此工人在艱苦的條件下仍可以正常工作,”Komeilipoor說。“BCI不依賴攝像頭,而是通過解讀大腦和眼電圖(EOG)等生物信號來監測眼球運動。這項技術需要先進的信號處理和機器學習算法,以分析通過專門傳感器捕獲的眼球運動。”
原文標題:Computer vision's next breakthrough,作者:Isaac Sacolick