南方財經全媒體記者梅道鳳 廣州報道
《頭號玩家》是一部由史蒂文·斯皮爾伯格執導的科幻冒險電影,講述了在虛擬現實游戲中尋找巨額財富和控制權的故事。
電影中的算法師是那些擁有高超計算機技術和編程能力的玩家,與虛擬現實游戲中的其他玩家一同競爭和探尋彩蛋,尋找隱藏在其中的財富和控制權。算法師不僅能夠迅速解開各種密碼和難題,還能夠在游戲中用自己的技術和智謀穿梭于虛擬世界和現實世界之間。
在那個由人工智能主宰的未來世界中,算法師是最受尊敬的職業之一。他們不但可以開發出智能系統,還能夠用精密的數據分析和模型優化解決各種實際問題。
去年,全國首批“琶洲領軍算法師”誕生了。“琶洲領軍算法師”中,博士學位有3人,碩士學位有5人,學士學位有2人。首批算法師畢業于北京大學、中國科技大學、浙江大學、武漢大學、新加坡南洋理工大學、美國伊利諾伊大學等國內外知名高校。2人任CEO職務,8人任技術高管。兼任高校校外專業導師有3人。擁有發明專利的有5人。2人曾獲得國際獎項榮譽,4人獲國家獎項榮譽,1人獲省級獎項榮譽。
這些算法師,不斷攻堅技術難題,他們深知自己所處的信息領域變化快速,每天都有新技術誕生,而要保持在領先地位,必須不斷更加深入的學習和思考,算法師不僅需要擁有過硬的技術能力,更要有創新思維和不懈探索的精神。
在第二屆廣州·琶洲算法大賽啟動之際,我們邀請了6大算法師,聆聽作為“頭號玩家”的他們與算法的故事,以及他們對當下風靡全球的ChatGPT的看法。
01 唯品會算法總監 嚴曉華
借助AI,人類可以做有創造力和更有價值的事情
我來自唯品會,是一家總部在廣州的互聯網公司,主打的是“精選品牌+深度折扣+限時搶購”的特賣模式。我的團隊主要研究的是電商搜索業務中相關的算法問題。
簡單來說,每當用戶在唯品會網站或者App 通過“搜索”功能尋找他們想買的商品時,我們通過算法來給予用戶良好的導購體驗,并確保搜索的結果是符合用戶搜索意圖以及個人偏好的。
從技術層面來說,這些算法通常是基于一些“神經網絡模型”。因為在當今海量數據的時代,這類模型具備的優秀的數據擬合能力以及通用性,讓它們能夠在各個業務場景發揮巨大的作用。尤其是在電商場景中,神經網絡模型是實現“千人千面”的商品搜索與推薦的關鍵所在。
以電商搜索這個場景為例,每一次用戶的搜索都會經歷多個算法模塊:搜索詞自動補全 suggest模型、Query理解、召回模型、相關性模型和排序模型。拿“Query 理解”模塊舉例,用戶發起搜索后,通常我們需要理解相應的搜索詞,才能更好地返回合理的結果。這里就涉及到如何通過“自然語言處理”相關算法去理解搜索詞背后的語義。例如,當用戶搜索“新款蘋果”時,我們需要理解這里“蘋果”的含義更有可能是“蘋果手機”,而不是一種水果。“自然語言處理”相關的算法,原理上與現在很火的ChatGPT也是相通的。
我個人對ChatGPT以及背后的生成式AI技術持比較樂觀的態度。首先從技術層面來說,ChatGPT 給我的沖擊非常大,因為我(甚至包括很多人工智能專業的博士)曾經認為我們距離ChatGPT這樣高水平的能夠基于自然語言交互的AI系統仍然很遙遠。ChatGPT是一種技術層面的躍進式發展,也是OpenAI長期堅持的“大模型”發展路線的理想主義式的勝利。從社會發展與應用層面來說,我認為ChatGPT可能將提前數十年讓AI真正開始深刻地滲透進所有人的日常生活之中,并在未來持續為社會帶來各種變革。具體來說,短期它將作為一個強大的生產力工具,將人類從很多機械性的重復工作中解放出來。想象一下,你將擁有一個AI助手,它了解世界上的所有通用知識,也能夠針對具體的細分任務適應性地學習并掌握任務所需的技能。你能夠向它發送自然語言的指令,讓其幫助你完成各種各樣的任務,比如知識的搜索與問答、內容(文本、圖片、視頻、代碼、甚至音樂)的生成與制作等等。對于人類來說,我們需要做的可能是盡快去適應它和學習使用它,讓這個工具真正為個人與社會創造的巨大的價值。
當然,很多人也會擔心他們的工作會被 ChatGPT 取代。我認為在有限的范圍內確實是有可能的,因為最終使用AI高質量地完成某些特定工作的成本可能會被降得很低。但從積極的方面來看,AI 也將能夠解放人類去追求更有創造力和更有價值的事情。舉個例子,當自動取款機被發明的時候,人們說這是銀行柜員的終結,但實際上并沒有。現在銀行柜員可以使用各種工具處理更復雜的事情,甚至有時候需要自己編寫一些代碼,而他們的工作效率可能是過去的10倍。
從另外一方面來說,ChatGPT確實給人類帶來了巨大法律和倫理道德方面的挑戰。它來得太快了,目前政府或者說相關法規基本上沒有做好準備,因此如果無法確保 ChatGPT以及類似技術的安全性(例如,它們可能會成為壞人作惡的工具),那么我們確實會承擔很大的技術給社會帶來傷害的風險。
02 創優科技算法高級工程師 喬世吉
面對市場波動,要不要用模型解決值得商榷
琶洲算法大賽作為具有影響力的賽事,吸引了來自各地的優秀算法人才。非常期待看到各地的優秀人才能在同一舞臺上展示自己的算法能力,交流經驗和技術,探討未來科技的發展方向。
名創優品作為一家新消費企業,一直非常重視供應鏈領域的技術發展以及應用。我所在的算法組深度參與其中的部分環節。
在此我要分享的故事與其中的銷量預測有關。
在門店運營中,商品尤其是暢銷商品是否齊全是影響消費者購物的核心因素之一,庫存的數量又是影響門店成本的因素之一,而銷量預測與補貨剛好是連通商品是否齊全與庫存數量控制的關鍵環節。舉個簡單的例子,預測商品銷量偏小,那么很有可能造成門店商品缺貨,導致消費者無法買到想要的商品;反之如果預測偏大,則會造成補貨過多庫存積壓,運行成本增加且無法及時更新庫存。因此,做好銷量預測是優化供應鏈的關鍵點之一。
在算法領域,類似銷量預測這類問題我們通常叫做時間序列問題,這類問題涉及多領域,比較難預測。為了更好地解決時間序列問題,各個領域的公司都投入了大量的人力物力去研究這類問題,一些知名的企業還為此設置大量的獎金舉辦比賽征集優秀的時間序列問題解決方案。
美國房地產信息查詢網站zillow和俄羅斯聯邦儲蓄銀行Sberbank在幾年前舉辦過房價預測的比賽,二者比賽的具體場景、獎金設置、數據處理、評分方式等方面不同。場景方面,zillow是美國房地產市場,Sberbank是俄羅斯房地產市場;獎金分別是100萬美元vs2.5萬美元;數據處理方面,zillow按照時間嚴格劃分建模使用的訓練數據與測試數據,Sberbank則隨機劃分數據(導致數據泄露);評分方式上,zillow的得分依據對未來預測的準確性,Sberbank則是測試數據的準確性。兩者對比,zillow更加科學的設置了比賽細節,并且嚴格避免了選手利用數據漏洞投機取巧。然而結果卻令人意外,Sberbank從比賽中得出結論:房地產市場波動難以用模型預測,但卻在2021年賺了140億美金;反觀zillow,從比賽中得到了“好的模型”,并以此為基礎建立純模型決策的房地產公司,結果在2021年虧損120億美金。
類似問題在工作中經常遇到,在實際應用中某個問題是不是可以預測?要不要用模型解決?需要反復思考和實驗。琶洲算法大賽恰好為廣大從業人員以及在校師生提供了真實的應用場景,也為來自各地的優秀人才提供了展示的舞臺。
03 技象科技總工程師 溫文坤
ChatGPT加持下,算法師更具創造力而非取代
我覺得算法設計是一種創造性工作,對問題的理解越深刻,越能設計出更優化的算法。所以算法至少需要兩種深刻經驗和一種創造力。
兩種經驗分別是對算法工具本身的深刻經驗和對問題本身的深刻理解。兩種深刻的經驗加上算法師創造性的設計,就能創造出優秀的算法。
幾乎每一個算法師都經歷過對問題從表象到本質逐步深入探究的過程。這個過程一般很漫長,不是每個人都能堅持下去,但越能堅持到后面的,越能成為優秀的算法師。從我國移動通信的崛起過程也可以看到這個規律:從開始的百家爭鳴,到現在鶴立雞群。這過程中很多工程師只能去做山寨機,也有些最終成長為國際上具有競爭力的算法師。
ChatGPT的出現,把對問題的深刻理解的要求轉化成對問題本質的洞見的要求。因此,很多人擔憂,算法師是否會被AI替代。我認為在ChatGPT的加持下,算法師將會有更大的創造力,而不是被取代。
因為人和AI最大的區別在于,我們有“心”、有創造力——至少目前還沒有被證明AI有著同樣的能力。AI能夠輕松具備兩項深刻的經驗——工具和問題的理解,但缺少創造力。創造力是對問題而言,而問題是針對人類社會的問題。現在物聯網行業就處于這個問題深入的過程——從10年前認為把物連起來就行,到現在發掘物之“靈”,我們不僅僅把物連起來,還在改變這物的應用方法。比如,以前水電表只是作為資源使用計費的計量器,現在還可以作為用戶行為及生產能力的計量器。因此,我們在發掘問題解決方法的同時,也在發掘問題自身的價值。
廣州技象科技有限公司成立于2018年,是中國電子科技集團有限公司科技成果轉化和混合所有制改革的科技企業。
技象科技聚焦物聯網底層關鍵技術,研發100%自主知識產權的TPUNB物聯專網,是從物理層做到應用層的全棧式針對物聯網應用場景的通信系統,系統架構包括物聯網芯片“象芯 1 號”、通信模組、基站及網關,支持定制開發,靈活部署,和國外主流技術相比有著性能更優、自主可控、安全可靠的優勢。可完全替代低功耗廣域網絡(LPWAN)領域的國外壟斷的技術。
公司進行前瞻性“數字新基建”戰略部署,上下游產業生態不斷完善,為智慧城市、智慧能源、工業物聯網、節能環保等民生重點領域,提供自主可控、安全可信的窄帶物聯網智能感知技術,已在全國十幾個省市落地應用,客戶包括政府、電網、世界 500 強企業,為諸多國民經濟支柱性行業數字轉型提供支撐性技術,促進各行業高質量發展。
04 云蝶科技CTO 余瀾
大數據將賦能普通用戶,實現技術平權
廣州云蝶科技是碧桂園集團在數字科技領域的重要布局,打造了以大數據和人工智能驅動的OMO教學平臺等軟硬件產品,在基礎教育和職業教育領域形成了各備特色的解決方案。云蝶科技研究的算法主要涵蓋分類、聚類、關聯分析、協同過濾、強化學習及遷移學習等,主要聚焦核心教學、教研數據的價值挖掘和應用。
在算法研究和產品研發過程中,發生了不少有趣的事情。某個教育大數據項目校優秀學生高考后的一次產品訪談的回答,尤其讓我們印象深刻。當我們研發團隊問到,“在多年的學習經歷中,讓你感到收獲最大的是什么?”學生的回答并不是在學校學習的知識點,而是提到教育大數據產品讓他第一次能夠量化回溯了每次考試,從中透視了自己的思維過程,比如說自己對于考試時間的策略分配是否合理、陷阱題中該有的審題動作是否完備、復雜題解題思路從哪一步開始走偏。并不是純粹地刷題和變成考試機器,而是能更高效、準確地去挖掘自己的學習和思維過程。同樣來自教育技術國內專家的評價:這可能是這一二十年內,第一次做到真正的教育大數據。
對于最近風靡全球的ChatGPT, 我個人是非常興奮和期待的。接觸機器學習和人工智能以來,雖然在很多領域有不錯的應用效果,但是就像教授Andrew Ng說的那樣,感覺像是“tricks of math”。當深度學習誕生和應用之后,尤其是當年Alpha GO在圍棋上實現的突破,第一次感覺好像我們隱隱約約看到了真正的AI。這一輪的ChatGPT觸及的是人類智慧的載體:語言信息和知識邏輯,波及面將涉及幾乎各個行業,因為每個行業都脫離不開語言——人類智慧發展過程中與動物最大的區別。而這次大語言模型突破智力天花板的方式之一就是簡單暴力地堆參數,這和人腦神經元之間簡單高效的連接方式不謀而合,誰知道意識和真智慧會不會出現“硅基世界”呢。這也是通往探索世界三大問題“我們是誰”的一條路,即使過程可能需要有監管和規范,但是無法阻擋這一波AI浪潮的來襲。未來的AI世界,如果形象比喻的話,在資金和技術實力雄厚的寡頭技術公司推動下,會誕生一個個全知全能的“大賢者”,從文本、圖像到音樂創作,以賦能普通用戶的形式實現技術平權。那在各個細分領域或者專有數據就會出現一個個“大賢者”的分身,對這些具體領域會更加熟悉,更高效、準確地和用戶交流溝通。這也是眾多創業者和中小企業更容易發力的地方。總之,未來的世界會很有趣,也很有幸能生活在這樣快速變化的時代。
05 探途網絡技術總監 劉建平
算法助于提能增效,避免繞圈
廣州探途網絡最近一年主要在研究智能短視頻廣告投放算法、AI模特算法兩個方面的算法。
智能短視頻廣告投放算法是基于B端用戶投放的歷史數據訓練深度學習模型,對B端用戶的短視頻投放計劃做智能推薦,智能復投,虧損預警,算法已沉淀到“巨好投”SAAS產品,該產品已應用于公司內部所有的短視頻投放場景和十余家B端客戶的短視頻投放,為客戶節約大量投放資金成本和時間成本;
AI模特算法是基于Stable Diffusion訓練Lora模型,為服裝類商品智能生成AI數字人模特穿搭的效果,節約行業成本,已應用于孵化和合作的新消費品牌,展示于各大電商平臺的商品列表和詳情頁,節約了模特拍攝、后期處理的時間和金錢成本,讓產品在電商平臺的上架時間從一個月縮短為兩周。
在我看起來,算法是一個工具,作用對象是數據。在經濟社會中,算法有助于提能增效,之前需要繞圈多次收集數據,現在只需要轉一圈,后臺數據就出來了,優化的方案也推出來了。除此之外,算法也能幫忙做好未來的統籌規劃,比如探途網絡的選品和組貨,之前只能靠運營的經驗完成,現在只需童工算法對運營數據做分析,就可以做到自動智能組貨和選品,形成智能采購計劃。
06 藥師幫技術部算法組組長 黃俊鈞
算法是一種實現多贏的工具和手段
我個人入職藥師幫后,主導多個推薦算法項目、優化項目,并且建立和完善了各個維度的畫像數據。
我認為,對用戶來說,算法可以幫用戶更快地找到心儀的商品;對于供應商來說,算法是提升工作效率的利器;對于公司來說,算法能夠加強加快用戶觸達,從而帶來更多GMV( 即商品交易總額) 的提升;算法能夠幫助不同的主體達成目標。
數據、算法、算力是數字經濟和人工智能產業的核心要素。數據是一座待挖掘的礦,算力是“挖多少”的速度問題,算法解決“怎么挖”的方式問題。這三個要素是相輔相成的,現在國家大力發展“東數西算”,背后看也是基于三者的內在邏輯。算法產業的升級迭代將會推動數字經濟和人工智能的發展,起到加速器的作用。
算法是助推器,算法是一種實現多贏的工具和手段。將來,算法會逐漸成為我們工作生活中不可或缺的角色,幫我們更好地提升和實現自身的價值。
(作者:梅道鳳)