作者:Arm 高級副總裁兼物聯網事業部總經理 Paul Williamson
當前,開發者正在利用安全且性能增強的技術實現小型低功耗嵌入式系統的開發,賦能過往無法想象的語音、視覺和振動等 AI 應用,而這些應用正在改變著世界。
嵌入式領域正經歷一場深刻的變革。連接設備正逐漸演變為可根據所收集的數據自行做出決策的系統。相較于在物聯網網關或云端進行數據處理而言,在更接近采集源之處完成數據處理的方式,將有望加快決策速度、減少延遲、解決數據隱私問題、降低成本并提高能效。
很多應用領域都在推升邊緣計算在性能和功能方面的需求,諸如工業自動化、機器人、智慧城市和家居自動化等。在過去,這類系統中的傳感器要簡單得多且互不相連,然而,現在人工智能 (AI) 和機器學習 (ML) 提升了本地智能化水平,在端側即可完成決策的制定,這在過去使用的簡單控制算法是無法實現的。
AI 時代通用處理器的演進
多年以前,開發者專注于把邏輯和控制算法作為軟件開發的核心,然而,隨著數字信號處理 (DSP) 算法的出現,為諸多功能增強的語音、視覺和音頻應用提供了支持。
這種應用開發的轉變進入到了全新時代,且正在影響計算架構的設計。我們現已發展到以推理作為算法開發的主要核心,這一階段帶來了對計算性能、能效、延遲、實時處理和可擴展性等方面新的或更高的要求。
行業的需求不僅在新處理器加速器方面,也包括通用處理能力的提升,以便能為開發者提供必要的平衡,并支持直播視頻中的特征檢查或人物檢測等應用。
幾年前,開發者在創建噪聲消除應用時還只能依賴基于頻率的濾波器。而如今,開發者可以通過將濾波與 ML/AI 模型和推理相結合來提高應用的性能和功能。為了使這些開發任務更加高效,并盡可能無縫地為用戶服務,對處理器和工具的需求也與日俱增。
促進邊緣側和端側設備的智能化
這項演進與革新是由 ML 所驅動,但同時也面臨著諸多技術的挑戰。經過多年的嘗試,試圖打造一套普適于物聯網及嵌入式設備的開發方法,已促使著行業轉變物聯網開發的方式,以釋放規模化擴展的無限可能性。
當前,開發者正在利用安全且性能增強的技術實現小型低功耗嵌入式系統的開發,賦能過往無法想象的語音、視覺和振動等應用,而這些應用正在改變著世界。各種版本的編程語言和 Transformer 模型將很快在具有全新計算功能的物聯網邊緣設備中占據一席之地。這無疑為開發者帶來夢寐以求的更多可能性。
在開發演進與革新的過程中,為了滿足開發者對硬件的需求,幾年前 Arm 在 Armv8.1-M 架構中引入了Arm? Helium? 矢量處理技術。Helium 為小型低功耗嵌入式設備的 ML 和 DSP 應用帶來了顯著的性能提升。此外,它還提供單指令多數據 (SIMD) 功能,由此將 Arm Cortex?-M 設備的性能提升到全新水平,并支持預測性維護和環境監控等應用。
Helium 提高了 DSP 和 ML 性能,加快了信號調節(例如濾波、噪聲消除和回聲消除)和特征提取(音頻或像素數據)的速度,繼而能將之傳輸到采用神經網絡處理器的分類中。
實現智能邊緣側的功能
我們可以看到,很多 Arm 的合作伙伴都在他們最新的產品中引入了 Helium 技術,由此助力開發者在網絡最遠端的受限設備上發揮 ML 功能的優勢。2020 年二月,Arm 推出了采用 Helium 技術的Cortex-M55 處理器,Alif Semiconductor 于 2021 年九月推出了首款基于 Cortex-M55 的芯片,并在其 Ensemble 和 Crescendo 產品系列中部署了搭載 Helium 的 Cortex-M55 處理器。此外,奇景光電 (Himax) 也采用了配備 Helium 的 Cortex-M55 于其下一代 WE2 AI 處理器,并以由電池供電的物聯網設備中的計算機視覺系統為目標應用領域。
2022 年四月, Arm 推出了第二款支持 Helium 的 CPU——Arm Cortex-M85。瑞薩電子在 embedded world 2022 和 embedded world 2023 上曾就 Cortex-M85 進行過技術演示。演示中,Plumerai 通過瑞薩電子 RA MCU 技術大大加快了其推理引擎速度。作為一家開發基于攝像頭實現人物檢測的完整軟件解決方案的公司,Plumerai 相信,性能的提升將確保該公司的客戶可充分利用更龐大、更準確的 Plumerai 人物檢測 AI 版本,同時提供更多的產品功能并延長電池續航時間。2023 年十一月,Arm 推出了第三款采用 Helium 技術的 CPU——Cortex-M52,這是一款專為人工智能物聯網 (AIoT) 應用而設計的處理器,可為小型低功耗嵌入式設備的 DSP 和 ML 應用帶來顯著的性能提升,無需專用 NPU 即可在端點中部署更多計算密集型ML 推理算法。
隨著硬件的發展,開發者所面臨的軟件復雜性也日益增加,因而需要新的開發流程來創建結合高效設備驅動程序的優化ML 模型。為生態系統提供的軟件開發平臺和工具也必須緊跟硬件而演進,這一點至關重要。
如今由 Arm 和第三方提供的多種工具可用于支持終端用戶創建 AI 算法。數據科學家在離線環境中創建好模型后,即可使用相應的工具來優化模型,以便在基于Arm Ethos?-U 的 NPU 上運行模型,或在基于 Cortex-M 的處理器上使用 Helium 指令。
Qeexo 是第一家為邊緣設備實現端到端 ML 自動化的公司,其 AutoML 平臺提供了直觀的用戶界面 (UI),允許用戶對傳感器數據進行收集、清理和可視化呈現,并使用不同的算法來自動構建 ML 模型。Keil 微控制器開發套件 (Keil MDK) 等傳統嵌入式工具是對 MLOps 工具的有益補充,并有助于建立用于驗證復雜軟件工作負載的 DevOps 流程。由此,嵌入式、物聯網和 AI 應用程序最終匯聚于軟件開發者都熟知的單一開發流程中。
邊緣的潛能正在逐步被發掘。當前對提升微控制器性能的需求還在不斷增長,特別是諸如聲控門鎖、人物檢測識別、帶有預測性維護的聯網電機控制,以及數不勝數的其他高端 AI 和 ML 應用等任務。
我們相信,在正確技術的加持下,開發者可以重新構想邊緣和端側設備,并在性能、成本、能效與隱私等這些受限設備中的關鍵要素之間取得適當平衡,讓未來的嵌入式開發實現 AI 計算的應用。