【ITBEAR科技資訊】3月5日消息,微軟近日宣布在其ONNX Runtime Web中整合了WebGPU技術,這一舉措有望顯著提升復雜機器學習模型在網絡瀏覽器中的運行性能。目前,Chrome和Edge瀏覽器已初步支持這項技術,盡管它仍處于早期階段。
ONNX Runtime Web是微軟推出的一個Javascript庫,旨在幫助網絡開發人員直接在網絡瀏覽器中部署機器學習模型,并提供基于硬件加速的多個后端支持。而WebGPU則是一種新興的網絡應用程序接口(API),它能夠為機器學習模型提供硬件加速,從而在網絡瀏覽器中實現更高效的運行。
此前,由于網絡瀏覽器的計算能力有限,復雜的機器學習模型,特別是大型生成模型,在網絡瀏覽器中的運行效率一直受到限制。然而,隨著WebGPU技術的引入,這一問題有望得到解決。WebGPU能夠釋放設備GPU的能力,使得這些復雜的機器學習模型能夠在網絡瀏覽器中高效運行,從而顯著提升性能。
據ITBEAR科技資訊了解,微軟表示,WebGPU借助計算著色器等先進功能,能夠以更高效的方式處理復雜的機器學習工作負載。此外,WebGPU對半精度(FP16)的支持也降低了GPU內存的使用率和帶寬要求,進一步加快了運算速度。通過這些優化,WebGPU有望在網絡瀏覽器中直接推斷出更高效、可擴展的機器學習應用。
目前,適用于Mac、Windows、ChromeOS的Chrome 113和Edge 113以及適用于Android的Chrome 121已默認包含WebGPU支持。這意味著開發者們可以嘗試通過ONNX Runtime Web調用WebGPU加速資源,以提升其機器學習模型在網絡瀏覽器中的運行性能。隨著這項技術的不斷發展和完善,我們有望在未來看到更多高效、便捷的機器學習應用在網絡瀏覽器中得以實現。