【ITBEAR】近年來,隨著人工智能技術的迅猛發展,AI計算需求呈現出爆炸式增長。為滿足這一需求,眾多公司和研究機構紛紛投身于專用處理器的研發之中,其中,神經網絡處理單元(NPU)因其出色的深度學習任務處理能力而備受矚目。
然而,盡管NPU在某些任務中表現出色,但其獨立發展的前景卻備受質疑。近期,剛獲得巨額投資的Imagination決定放棄獨立開發三代NPU IP,轉而將類似功能整合進其GPU產品中。這一決定反映了NPU獨立發展的局限性。
Imagination新任創新和工程主管Tim Mamtora坦言,盡管公司看到了NPU的潛力,但在實際開發過程中遭遇了諸多挑戰,如配套軟件堆棧的構建、客戶和開發人員的展示等。他認為,AI軟件堆棧方面的挑戰是導致Imagination放棄NPU獨立開發的主要原因。
NPU作為一種專為神經網絡計算設計的處理器,具有高并行度和低功耗的特點。然而,其獨立工作時也暴露出一些問題。NPU主要針對深度學習任務進行優化,在處理其他類型的計算任務時顯得力不從心,這限制了其在多樣化應用場景中的適用性。NPU的生態系統相對較小,開發者面臨的工具和框架選擇有限,這也阻礙了NPU的推廣和應用。
相比之下,國內IP供應商芯原股份在NPU技術的發展上走出了一條不同的道路。芯原的NPU IP已被廣泛應用于多款人工智能類芯片中,并在全球范圍內實現了大規模出貨。芯原通過開發GPU+GPGPU+NPU的可擴展AI計算平臺,實現了不同計算資源的有機結合,彌補了彼此的短板。
在這種平臺中,NPU專注于執行深度學習模型中的特定運算,而GPU或GPGPU則負責處理圖形渲染和其他計算任務。這種資源互補使得系統能夠在多任務環境中表現更佳,提高了整體效率。同時,芯原還實現了NPU、GPGPU和GPU在指令級的融合,使得三者在硬件層面上能夠共享指令集,實現了更高效的協同工作。
芯原的成功經驗表明,NPU的發展需要與其他處理器協同工作,方能實現最佳的性能和效率。通過構建一個包含多種計算資源的可擴展AI計算平臺,芯原不僅提升了AI計算的整體性能,還為客戶提供了更大的靈活性和可擴展性。
面對未來,隨著人工智能應用的普及和數據隱私、實時處理需求的增加,邊緣計算將成為重要的發展趨勢。NPU可以在邊緣設備上提供高效的AI計算能力,滿足這些需求。同時,NPU還可以為特定的AI工作負載提供定制化的硬件加速,這對于執行特定任務的邊緣設備來說是一個重要的優勢。
因此,NPU在未來的發展中需要更加注重生態系統的建設。這意味著不僅要在硬件上進行創新,還要在軟件工具、開發框架和支持服務上進行投入。通過構建一個健康、開放的生態系統,NPU技術才能更好地融入各種應用場景,滿足不同客戶的需求。
總之,NPU作為AI計算領域的重要參與者,其未來發展將更加依賴于與其他處理器的協同和生態系統的完善。只有在硬件、軟件和生態系統上實現全面優化,NPU才能在AI計算的浪潮中脫穎而出。