浙商證券指出,多家科技巨頭“盯上”各類端側(cè)AI應(yīng)用,已競相布局,AI PC已接近產(chǎn)業(yè)落地的轉(zhuǎn)折點(diǎn),到2027年60%的PC將具備人工智能功能。AI手機(jī)有望成為個(gè)人智能助理,為手機(jī)行業(yè)帶來創(chuàng)新。
當(dāng)AI逐步滲透到生活的方方面面,AI正持續(xù)向端側(cè)靠近,從手機(jī)都電腦再到汽車等產(chǎn)業(yè)都將迎來轉(zhuǎn)折。
浙商證券在研報(bào)中指出,生成式AI發(fā)展之初,由于計(jì)算規(guī)模巨大,運(yùn)算處理基本都匯集在云端進(jìn)行,如今為了提升用戶的體驗(yàn),AI能力需要落地到數(shù)十億終端設(shè)備,成本必將大幅提升,因此,AI處理重心正不斷向邊緣轉(zhuǎn)移,混合AI成大勢所趨,多家科技巨頭“盯上”各類端側(cè)AI應(yīng)用,已競相布局。
浙商證券稱,AI不止于云,端側(cè)是模型應(yīng)用不容忽視的重要場景,從概念來看,云側(cè)AI是指,在數(shù)據(jù)云端匯集訓(xùn)練,模型通用性強(qiáng)。從終端采集和感知到的聲音、視頻等數(shù)據(jù)都通過網(wǎng)絡(luò)傳輸?shù)皆浦行膫?cè)進(jìn)行后續(xù)處理。
而端側(cè)AI則是終端設(shè)備上進(jìn)行的輕型模型運(yùn)用。更多AI計(jì)算和推理工作負(fù)載在手機(jī)、筆記本電腦、XR 頭顯、汽車和其他邊緣終端上運(yùn)行。隨著用戶對生成式AI應(yīng)用需求日益增長,端側(cè)AI的隱私和安全、低延時(shí)、可靠性、低成本等技術(shù)優(yōu)勢凸顯。
那么,當(dāng)前端側(cè)AI已發(fā)展到哪一步了,未來又會(huì)有哪些進(jìn)展?
AI PC:產(chǎn)業(yè)落地轉(zhuǎn)折點(diǎn)漸行漸近
浙商證券指出,由于PC已經(jīng)有成熟的消費(fèi)市場,AI PC已接近產(chǎn)業(yè)落地的轉(zhuǎn)折點(diǎn)。支持人工智能的PC市場有望在2025年和2026年大幅擴(kuò)張。根據(jù)Canalys預(yù)測,到2027年60%的PC將具備人工智能功能。
浙商證券認(rèn)為,AI PC為各領(lǐng)域提供創(chuàng)新解決方案:
1)高速AI處理:AI PC能快速處理圖像識(shí)別、語音識(shí)別、自然語言處理等AI任務(wù),提高生產(chǎn)力和娛樂體驗(yàn);
2)增加AI應(yīng)用:ISV有望提供NPU應(yīng)用程序,將AI功能整合到現(xiàn)有應(yīng)用程序中;
3)新用例開發(fā):AI PC推動(dòng)新的業(yè)務(wù)用例和服務(wù),包括醫(yī)療診斷、自動(dòng)駕駛等多領(lǐng)域;
4)提升用戶體驗(yàn):通過語音、手勢互動(dòng)、AI個(gè)性化支持和高級安全功能改善用戶體驗(yàn)。
從AI PC進(jìn)展來看,“英特爾on技術(shù)創(chuàng)新大會(huì)2023”官宣將在今年12月14日正式發(fā)布面向下一代的AI PC的英特爾酷睿Ultra處理器Meteor Lake,以加速“AI PC”時(shí)代的到來。
此外,英特爾提出“AI PC加速計(jì)劃”,宣布將為軟件合作伙伴提供工程軟件和資源,以在2025年前實(shí)現(xiàn)為超過1億臺(tái)PC實(shí)現(xiàn)人工智能特性:
首次引入了針對人工智能加速的NPU:NPU能與所有計(jì)算引擎的內(nèi)置AI功能結(jié)合實(shí)現(xiàn)更高能效的AI計(jì)算,通過NPU降低CPU和GPU的AI工作負(fù)載,帶來高能低耗的表現(xiàn)。
通過GPU、NPU、CPU不同層級的AI算力網(wǎng)絡(luò),Meteor Lake能很好的將AI從云端引入到客戶端PC和企業(yè)邊緣PC。
“AI PC加速計(jì)劃”,旨在為軟件合作伙伴提供工程軟件和資源。酷睿Ultra處理器“Meteor Lake”將于12月14日正式發(fā)售。
10月24日,聯(lián)想舉行了主題為“AI for All”的“2023聯(lián)想Tech World創(chuàng)新科技大會(huì)”,重點(diǎn)展示了聯(lián)想在端側(cè)大模型方面的能力,以及聯(lián)想的首款AI PC產(chǎn)品:
個(gè)性化優(yōu)勢凸顯:相比云端公用大模型,聯(lián)想PC級大模型Lenovo AI Now在面對“去斯德哥爾摩的音樂節(jié)的行程規(guī)劃”問題時(shí)表現(xiàn)出更加個(gè)性化,能夠?qū)⒓彝サ刂贰⒕频昶玫瓤紤]進(jìn)去。
AI PC預(yù)計(jì)2024年9月后上市,未來還將進(jìn)入車端。楊元慶會(huì)后表示,搭載端側(cè)大模型的PC要明年9月以后才上市,按照規(guī)律前期將占有10%的市場份額,日后會(huì)成為主流。此外,聯(lián)想表示未來端側(cè)大模型還將進(jìn)入車端。
推出針對企業(yè)用戶的混合人工智能計(jì)劃,旨在保護(hù)數(shù)據(jù)安全。通用訓(xùn)練后大模型可通過企業(yè)的特定數(shù)據(jù)進(jìn)行額外的訓(xùn)練和微調(diào);在端側(cè)再加入企業(yè)知識(shí)矢量數(shù)據(jù)庫中的特定知識(shí),最后鏈接舊有ERP系統(tǒng)、CRM系統(tǒng)、MES系統(tǒng)等供應(yīng)商數(shù)據(jù)庫,得到混合AI系統(tǒng)。
AI 手機(jī):產(chǎn)業(yè)爆發(fā)前夜
浙商證券認(rèn)為,AI手機(jī)有望成為個(gè)人智能助理,為手機(jī)行業(yè)帶來創(chuàng)新,對比蘋果2011年推出的手機(jī)助手Siri:Siri采用一問一答的形式,而AI手機(jī)具有人格化、記憶、感知和管理能力,觸發(fā)主動(dòng)服務(wù),具體來看:
1)智能化和便利的服務(wù)體驗(yàn):手機(jī)作為使用頻率最高,使用時(shí)間最長的電子產(chǎn)品,也是鏈接智能汽車、PC、耳機(jī)以及其他智能終端的中樞,植入AI大模型后能成為真正的個(gè)人智能助理。
例如語音助手能提供更自然的交互與更精準(zhǔn)的意圖識(shí)別服務(wù),圖像識(shí)別和處理功能可以為手機(jī)帶來更出色的拍照和圖像處理能力,文本生成能力可用于快速撰寫購物評價(jià)、生成發(fā)言稿等場景。
2)數(shù)據(jù)更加安全精確:AI手機(jī)需要的數(shù)據(jù)保存在端側(cè)更安全,較云有隱私優(yōu)勢,手機(jī)用戶自己生成的數(shù)據(jù)對于智能助理的訓(xùn)練更加精確。
3)從單個(gè)AI應(yīng)用到統(tǒng)一AI生態(tài):融入手機(jī)系統(tǒng)中的大模型,可以打破各App之間的壁壘,比如郵件、備忘錄、日歷的互相調(diào)用,在某一工
作節(jié)點(diǎn)發(fā)送特定郵件。
AI手機(jī)進(jìn)展:
1.高通成功將AI布局在Android/ target=_blank class=infotextkey>安卓手機(jī),2023年2月23日,高通技術(shù)公司成功在搭載了驍龍芯片的安卓手機(jī)上運(yùn)行了Stable Diffusion,作為一款現(xiàn)象級應(yīng)用,Stable Diffusion可以基于大模型從文本生成圖片,神奇的背后是復(fù)雜的模型和巨大的運(yùn)算量,其模型參數(shù)超過10億個(gè)。
2.谷歌發(fā)布全新Pixel 8系列手機(jī),搭載谷歌自研Tensor G3處理器和Titan M2安全芯片,在手機(jī)上首次應(yīng)用AI智能大模型。谷歌還發(fā)布了新版安卓系統(tǒng)Android 14,以及生成式AI加持的谷歌助手Assistant with Bard。
3.華為/小米/OPPO/VIVO
華為發(fā)布HarmonyOS 4 :通過盤古大模型的底層能力加持,華為將為用戶帶來智慧終端交互、高階生產(chǎn)力效率、個(gè)性化服務(wù)的全新AI體驗(yàn)變革。
小米澎湃OS:自研端側(cè)大模型MiLM,輕量化語言模型(13億參數(shù)),手機(jī)端側(cè)大模型部分場景效果媲美云端,進(jìn)一步實(shí)現(xiàn)“人/車/家全生態(tài)”智能化。
OPPO Andes GPT模型:Andes GPT作為OPPO自主訓(xùn)練的生成式專屬大模型,以端云協(xié)同為基礎(chǔ)架構(gòu)設(shè)計(jì)思路,推出從10億至千億多種不同參數(shù)規(guī)模的模型規(guī)格。10月11日,聯(lián)發(fā)科宣布攜手 OPPO 、 ColorOS , 合作共建輕量化大模型端側(cè)部署方案,共同推動(dòng)大模型能力在端側(cè)逐步落地。
VIVOOriginOS 4:聯(lián)發(fā)科與VIVO在AI領(lǐng)域展開深度合作,率先實(shí)現(xiàn)了10億和70億參數(shù)AI大語言模型、10億參數(shù)AI視覺大模型在手機(jī)端側(cè)的地。
端側(cè)AI需要強(qiáng)大芯片硬件支持
考慮到硬件配套、隱私安全、用戶體驗(yàn)等,“云側(cè)+端側(cè)”的協(xié)同設(shè)計(jì)思路成為手機(jī)行業(yè)共識(shí)。
模型訓(xùn)練需要巨大的算力,一定都會(huì)在云端進(jìn)行,與云端大模型不同,手機(jī)無法支撐通用大模型百萬億甚至千億級別的參數(shù),在此類消費(fèi)級終端需要做適配處理,提升用戶體驗(yàn):
1.明確云側(cè)和端側(cè)的特點(diǎn)和功能,各取所長,協(xié)同工作。云側(cè)→大模型訓(xùn)練;端側(cè)→推理。
2.需要對手機(jī)SoC芯片做一定的升級,增加大模型所需的GPU、NPU、APU等單元。
3.精簡參數(shù),降低內(nèi)存占用,以適配手機(jī)硬件。減小參數(shù)量、量化技術(shù)調(diào)整、有爭對的精調(diào)模型等,使模型能夠在端側(cè)流暢應(yīng)用。e.g.高通使用AI模型增效工具包(AIMET)將模型從FP32縮小到INT8。
本文觀點(diǎn)主要來自于浙商證券研報(bào):《2024 ·AI“下凡”——端側(cè)AI深度跟蹤報(bào)告》分析師蔣高振,華爾街見聞略有刪節(jié)