來源:雷鋒網
驍龍 888 帶著 CPU、GPU 和 AI 性能的顯著提升,和小米 11 一起拉開了小米新十年的序幕
"
作者 | 量衡
新 SoC 的發布節點,直接左右旗艦手機的發布周期。剛在 12 月發布的驍龍 888,不但打破了歷史規律,還帶著 CPU、GPU 和 AI 性能的顯著提升,和小米 11 一起拉開了小米新十年的序幕。
小米 11 首批 35 萬臺之后,已多次連續放量,不少人已經體驗到 2021 年的新旗艦。" 一人內測,全民公測 " 的酷安上,小米 11 的關鍵詞已霸榜許久。
驍龍 888 注定會是 2021 年旗艦手機的標配,在它的身上可以觀測到高通對未來的構想,也能預測未來一年移動端的趨勢。
1
暴漲的 GPU 和單核性能
高通今年從臺積電 7nm N7P 工藝切換到三星 5nm LPE 工藝。對比三星上一代的 7LPP,三星承諾同性能下的功耗降低 20%,同功耗下性能提高 10%,面積減少 20%。
構架方面,驍龍 888 更新到 Kryo 680,超大核是 2.84GHz Cortex-X1 構架,配備了 1MB 的 L2 緩存;大核是 3 個 2.24GHz 類 A78 核心,每核 L2 緩存翻倍到 512KB;而小核仍然是 4 顆 1.8GHz 的類 A55 構架。
Cortex-X1 是安卓陣營迎來的第一個公版超大核:6 條整數流水線,5 解碼 8 發射的前端,有真 •PC 級的四條帶 FMA 的 NEON,是移動端浮點堆料的極致。相應的,X1 的芯片面積是 A78 的 2.3 倍,峰值性能是 A77 的 1.3 倍,機器學習性能提升 2 倍。
和 X1 同代的御用搭檔 A78,IPC 比 A77 提升 7%,主要負責 " 提升能效比、節省芯片面積 ",以達到更好的面積和功耗均衡。CPU 集群維持 4MB 的 L3 緩存,高通官方解釋,這是難度和緩存配置之間的平衡。此外,驍龍 888 支持最高支持 4*16bit 3200MHz 的滿血 LPDDR5 內存。
我們通過對比小米 11(驍龍 888)和小米 10 Ultra(驍龍 865),可以看到驍龍 888 在 GeekBench 和 RAR 的單核測試上,給出了安卓陣營多年沒出現過的 25% 單核性能提升。高通更在乎持續輸出,所以在頻率設定上相對保守,多核提升在 11%-18% 之間。
在安卓陣營,單核性能一直沒有得到應有的重視。但實際上,在當今的情況下,提升單核性能的效果和 " 性價比 " 都明顯更高,會更加影響應用加載、切換、超大型游戲的體驗。
對比需要深度優化的多核性能,單核性能的影響簡單直接。在應對很多(其實是大部分)多線程優化不佳的日常 APP 和游戲時,單核性能的提升效果遠高于多核性能。游戲中大量的游戲畫面元素、移動、NPC 動作等,都需要 CPU 運算后再交給 GPU。而《原神》等跨平臺的大型游戲的出現,讓移動端的 CPU 壓力空前絕后。
強大的單核性能,除了降低開發人員的壓力,還無需額外優化就能直接提升大部分應用的基礎使用體驗。但在功耗敏感的移動端,無法像 PC 端那樣提升頻率,所以超大核的出現是必然的。
反映到這一代旗艦手機的基礎體驗,驍龍 888 單核 25% 的提升,即便是出廠 MIUI 12.0 系統,依然讓小米 11 的系統操作出奇地流暢。監控頻率可以看到發現,驍龍 888 的 X1 調度比較積極。
小米 11 在微博、貼吧、淘寶這些傳統 " 巨型 "APP 的流暢度都上了一個臺階。應用開啟、應用多開、切換等多種場景的感知,都出乎預料地明顯。這時候再回來看,2.3 倍的芯片面積,仿佛又顯得有 " 性價比 " 了。
GPU 方面,高通 Adreno 系列在安卓陣營獨孤求敗了很多年,在驍龍 888 上又帶來了高通 GPU 史上最大的性能提升。840MHz 的 Adreno 660,性能提升 35%,能效比提升 20%,且性能和能效比的提升能同時實現。
同樣使用小米 11(驍龍 888)和小米 10 Ultra(驍龍 865)對比參考,低壓力場景的提升在 27% 到 35% 左右,提升最大的是 3D Mark 的 Wild Life 大壓力測試,幅度達到 53%,Vulkan 模式下的 GFXBench Aztec 場景也有 43% 的提升。
而驍龍 865 的 Adreno 650,就算超頻到 905MHz,GFX 曼哈頓場景也 " 只有 "110fps(默頻驍龍 865 是 90fps)。但驍龍 888 的 Adreno 660,在 840MHz 就已經有 118fps,部分用戶都跑到 125fps 以上了。驍龍 888 GPU 的同頻性能,依然比超頻到 905MHz Adreno 650 高 15% 以上。
性能之外,驍龍 888 還有隱藏技能。Adreno 660 是首個在移動端引入可變速率陰影(VRS)技術的 GPU。VRS 是桌面平臺剛上的新增特性,能在 VR/XR 等場景中,降低非注視區域的著色精度,大大降低 GPU 的壓力。在 VR/AR 還在構建發展的階段,看到高通積極地提供相關特性,無論是游戲廠商還是用戶,大家都是非常歡迎的。
2
第六代 AI 引擎:60% 的算力提升
和其他芯片廠商不同,在 CPU、GPU 和調制解調器之外,高通每年都會 " 花很多筆墨 " 聊 Hexagon DSP。而高通的 AI 構架,也是各個廠商中最特殊的。從 AI 部分的提升,能看到高通在方向和策略上的考量,以及未來一年移動 AI 的發展趨勢。
遙想 2017 年,主流旗艦只有 0.6TFOPS 的 AI 算力,獨立的 NPU 也才 2TFOPS 不到。但后來從驍龍 855 的 7TOPS,到驍龍 865 的 15TOPS,再到驍龍 888 的 26FTOPS,移動端對 AI 算力的渴求依然見不到盡頭。
和常見的獨立 NPU 不同,高通是 CPU+GPU+DSP 等多部件的異構 AI,宣稱可以比獨立的 DSP+ 機器學習推理引擎方案,提供更高的性能和靈活性。而當中的 Hexagon 780,其實是驍龍 888 上提升最大的部分。
以前 Hexagon 600 系列中的標量,張量(Hexagon Tensor Accelerator,HTA)和向量(Hexagon Vector eXtensions,HVX)功能,在 Hexagon 780 被融合在一起,成為一個整體式 IP。
融合后,不同執行引擎間的工作負載切換時間也更短,性能和能效都提升巨大,標量執行能力提高了 50%,張量執行吞吐量直接翻倍翻。SRAM 增加 16 倍后,狂漲的內存池,能運行更大的機器學習推理模型。
幾乎推倒重構的構架,配合 X1 超大核 2 倍的機器學習性能和暴漲的浮點性能、AI 性能提升 43%的 Adreno 660,每瓦性能提升 3 倍的 Hexagon 780,讓驍龍 888 可以提供遠高于前代的 26 TOPS 算力。
驍龍 888 官方測試成績
在機器學習基準測試 MLPerf 中,驍龍 888 的性能最高提升 4 倍,遠超 IP 塊在執行單元的理論計算吞吐量改進(新內存體系的優勢?)
夸張的 AI 性能,有什么用呢?高通技術公司產品管理副總裁 Ziad Asghar 提到,AI 性能大幅提升的主要來自客戶的需求。現在移動 AI 一大部分應用場景都是圖像處理,是近年來手機拍照水平突飛猛進的重要原因之一。
雖然被吹得很玄學,但移動 AI 可籠統理解為 " 為各種 AI 算法設計的硬件加速器 "。而這些 AI 算法,早就應用到拍照(成像處理、拍照輔助、圖像識別等)、語音通話降噪、語音識別、翻譯、人臉解鎖、手寫識別、游戲和 XR 體驗支持等大量領域。
高通的異構 AI 設定,是高通移動平臺 " 關注均衡和功耗的設計思路 " 的產物。在驍龍 865 首次集成的傳感器中樞,也已經升級到第二代,并集成性能提升 5 倍,但功耗不到 1 毫安的專用低功耗 AI 處理器。后者可以提供低功耗的全天候 AI 待命能力,并分擔 Hexagon 780 80% 的工作負載。
其在 "Ok,Google" 偵測算法上,可以降低 38% 的負載,并為陀螺儀、麥克風等需要全天候實時收集數據的傳感器,提供更多的可能性(已被用在汽笛聲、嬰兒哭聲的低功耗監測等場景上)。
3
計算攝影:AI+ 拍照
AI 是 " 計算攝影 " 的基礎,小米 11 發布會重點說的夜景視頻拍攝和眾多拍照提升,背后是驍龍 888 全新的三 ISP 和 Hexagon 780。
在小米 11 上,除了驍龍 865 時代就有的 AI 換天功能,現在夜景模式也能用來拍攝視頻,大幅提升夜景視頻的畫面亮度和降噪表現。夜景視頻可理解為每秒拍攝超過 24 張超級夜景照片,是 ISP 和 AI 算力暴力提升的直接效果。
在拍照過程中,AI 也負責提供非常基礎的 HDR+ 硬件加速能力,能進行畫面降噪、重新著色、自動校色(讓色彩表現更加真實或更加吸引眼球)等操作。像把單攝玩出花的 Google,就已經依靠 AI,提供了背景虛化、全景、Motion 動圖(類似 iOS 平臺的 Live Photo)、AR 實時追蹤貼圖、超分辨率放大、超級夜景等多種功能。
驍龍 888 融合 AI 3A 算法的快速對焦
虹軟 " 傻瓜相機 "
除了效果提升,也有很多是關于拍照易用性和趣味性的提升。例如驍龍 888 融合 AI 的 3A 算法,能提高對焦速度。虹軟基于 Spectra 580 和第六代高通 AI 引擎推出 " 傻瓜相機 " 功能,可以自動跟蹤人物,自動進行畫面縮放變焦等。
4K 30FPS 的實時背景摳圖
在高通 AI Engine 的支持下,驍龍 888 可以做到 4K 30FPS 的實時背景摳圖,CV-ISP 硬件計算視覺加速器也能提供 60fps 實時景深識別的人像、背景分割和替換,人體追蹤、物體識別 / 追蹤的效果。
一億像素樣張,細節放大對比
夜景樣張,細節放大對比
而相同 CMOS、同樣是 MIUI 的小米 11 和小米 10 Pro,是非常適合用來對比 ISP 和 AI 對拍照影響的樣本。得益于驍龍 888 的 ISP 和 AI 性能,小米 11,不論取景框預覽畫面、1 億像素模式、HDR、夜景等多幀合成場景,畫面的高光壓制、鬼影、偽像、顏色還原等部分,都有明顯提升。
4
總結:安卓陣營大跨越的一年
這是小米多年來,首次在 1 年內發布兩臺數字系列旗艦,驍龍 888 機型的量產時間遠比以前早,為下一代產品留下了充足的準備時間,不禁讓人猜想,高通是不是在憋著什么大招。
高通做的是 SoC 移動平臺,在他們眼中,除了絕對性能,均衡也是核心指標。驍龍 888 在 CPU 單核性能和 GPU 性能上的提升,直接抬升了安卓旗艦日常操作的流暢度,以及應對跨平臺大型游戲的能力。而 AI 和 DSP 的倍數級提升、傳感器中樞上的低功耗 AI 處理器,則成了高通新的護城河。