MLOps:源于軟件工程領(lǐng)域促進提質(zhì)增效的管理方法論DevOps,由機器學(xué)習(xí)(Machine Learning)、研發(fā)(Development)和運營(Operations)三種概念構(gòu)成,旨在讓AI模型的開發(fā)也能兼具效率和質(zhì)量,實現(xiàn)規(guī)模化應(yīng)用。
近期,土豆數(shù)據(jù)科技集團董事長霍向琦在第一財經(jīng)主辦的《AI大模型——揭秘人工智能生產(chǎn)力的加速器MLOps》研討會上,結(jié)合土豆數(shù)據(jù)弗雷時空大模型的建設(shè)思路,講述在大模型時代,MLOps理念的價值以及實現(xiàn)的路徑。
MLOps理念的價值在哪里?
由中國信息通信研究院、人工智能關(guān)鍵技術(shù)和應(yīng)用評測工業(yè)和信息化部重點實驗室在聯(lián)合發(fā)布的《人工智能研發(fā)運營體系(MLOps)實踐指南(2023年)》指出,AI模型的開發(fā)以及應(yīng)用,當(dāng)前著面臨著跨團隊協(xié)作難度大、過程和資產(chǎn)管理欠缺、生產(chǎn)和交付周期長等問題。
對此,霍向琦表示,面向人工智能領(lǐng)域AI模型及AI應(yīng)用的開發(fā),MLOps的意義和價值,在于建立團隊協(xié)作機制,實現(xiàn)敏捷交付過程,在構(gòu)建全面鏈路反饋閉環(huán)的過程中,實現(xiàn)對AI資產(chǎn)進行統(tǒng)一管理。
實際上,早在“小模型”階段,MLOps理念已經(jīng)助力AI模型開發(fā)、訓(xùn)練、部署和應(yīng)用全流程開發(fā)的降本增效。而隨著大模型時代的到來,MLOps作為一體化AI工程化方法,亦將促進通用人工智能技術(shù)轉(zhuǎn)化為能夠解決行業(yè)實際痛點的真實生產(chǎn)力。
在霍向琦看來,平臺化,以及深度融入MaaS體系,是MLOps在大模型發(fā)展的浪潮之中,從一種工程方法轉(zhuǎn)變?yōu)榛A(chǔ)設(shè)施和平臺工具的重要趨勢。MLOps所強調(diào)的跨部門協(xié)作、敏捷開發(fā)、高效運維等理念,將落地成為圍繞數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范、模型開發(fā)訓(xùn)練、部署應(yīng)用等相關(guān)的平臺工具集,來支撐通用大模型和行業(yè)大模型產(chǎn)品的構(gòu)建。
這意味著,得益于MLOps理念向工具的轉(zhuǎn)化,上至專業(yè)AI企業(yè),下至獨立開發(fā)者或非研發(fā)方向的業(yè)務(wù)人員,都將得輕松上手模型產(chǎn)品開發(fā)和部署應(yīng)用的整套流程。
土豆數(shù)據(jù)面向時空產(chǎn)業(yè)所構(gòu)建的弗雷時空大模型,正是基于MLOps理念串聯(lián)時空信息采集、建模、治理、分析、應(yīng)用及流通等全鏈路,滿足各垂直細分領(lǐng)域有關(guān)行業(yè)知識問答,內(nèi)容創(chuàng)作,業(yè)務(wù)自動化處理,以及細分領(lǐng)域行業(yè)大模型微調(diào)構(gòu)建等需求,在降低專業(yè)操作門檻、減少勞動密集作業(yè)的同時,本質(zhì)上更讓各環(huán)節(jié)上的技術(shù)人員、行業(yè)專家和終端用戶能夠高效協(xié)同,將大模型能力、行業(yè)知識、想象力和創(chuàng)造力轉(zhuǎn)化為真實生產(chǎn)力,賦能千行百業(yè)釋放價值。
大模型時代下,MLOps理念如何實現(xiàn)
當(dāng)下,以ChatGPT為典型的大模型產(chǎn)品展示了令人震撼的內(nèi)容生成能力,然而,潛在的一些問題使得行業(yè)用戶對大模型應(yīng)用的實踐持謹(jǐn)慎態(tài)度。
根據(jù)市場研究機構(gòu)Gartner的調(diào)查數(shù)據(jù)表明,成功將AI模型應(yīng)用到實際生產(chǎn)環(huán)境中的轉(zhuǎn)化率僅略高于50%。
那么,在利用MLOps提高大模型實際生產(chǎn)轉(zhuǎn)化率的過程中,面臨著哪些問題?
對此,霍向琦在活動中指出:
第一,AI大模型處于IT應(yīng)用的前沿,應(yīng)用場景并不明晰且缺乏安全監(jiān)管,而國內(nèi)很多行業(yè)尚處于數(shù)字化轉(zhuǎn)型的建設(shè)初期,其中最典型的問題,要屬數(shù)據(jù)資源普遍以不同的行業(yè)標(biāo)準(zhǔn)和不同的文件格式分散在跨單位、跨部門的服務(wù)器或電腦端中,未能經(jīng)過統(tǒng)籌治理形成標(biāo)準(zhǔn)統(tǒng)一的數(shù)據(jù)資產(chǎn)。“數(shù)據(jù)底座”即數(shù)據(jù)要素的缺失,難以為行業(yè)大模型的訓(xùn)練提供可靠、高質(zhì)量的數(shù)據(jù)支撐。
其次,相比小模型針對特定應(yīng)用場景的輕量化開發(fā)訓(xùn)練和部署應(yīng)用,大模型將更偏向于建設(shè)一個系統(tǒng)級工程,基于MLOps理念和相關(guān)工具,必須做好數(shù)據(jù)工程和模型工程的基礎(chǔ),并需要完成與終端用戶的業(yè)務(wù)系統(tǒng)的配套改造和對接,從而響應(yīng)行業(yè)大模型持續(xù)訓(xùn)練和場景搭建封裝等關(guān)鍵任務(wù)需求。
而對于如何MLOps理念如何實現(xiàn),霍向琦也發(fā)表了自己的觀點:
霍向琦認為,人才,在打造MLOps完善的工程化能力,推進大模型的落地應(yīng)用的過程中,扮演著至關(guān)重要的角色。
在大模型時代,產(chǎn)品經(jīng)理崗位將是具備“終極思維”的稀缺人才,其通過豐富的行業(yè)知識與認知,面向整個產(chǎn)業(yè),針對其痛點和發(fā)展趨勢,在產(chǎn)品設(shè)計上給予更精準(zhǔn)地預(yù)判。
而數(shù)據(jù)工程師、解決方案工程師等崗位,也都將立足于大模型的核心能力,廣泛觸達各行各業(yè)的共性需求,消除行業(yè)間的壁壘,助力以數(shù)據(jù)為關(guān)鍵要素的業(yè)務(wù)管理和決策。