【ITBEAR】Lepton AI創始人兼CEO賈揚清
作者|鄭松毅
編輯|楊錦
近日,由聲網聯合主辦的RTE2024第十屆實時互聯網大會在北京開幕。
大會開始前,Lepton AI創始人兼CEO賈揚清早早就坐在了嘉賓席。藍色襯衫、牛仔褲,熟悉的那般“碼農”形象再現。
他還是習慣性地把微笑掛在嘴邊,和聊了聊最近美國硅谷發生的變化,以及對AI發展現狀和未來趨勢的一些看法。
這是他今年第二次回國,在大會開始前一晚剛到北京,但整個人看不出來絲毫倦意。
AI如何落地應用?國內外都在忙著找答案
“這次回來能明顯感受到大家對于AI應用積極探索的熱鬧氛圍,硅谷也正如此。”賈揚清說。
“相較于AI熱潮初期的硅谷,現在的硅谷‘冷靜’了許多,關注點更偏向于應用。大多數企業會選擇在現有模型基礎上加速功能迭代和研發。幾乎沒人還在比誰的模型更大、參數更多。”
他補充道,“同等質量的模型,規模會變得越來越小,計算效率會越來越高,模型架構會變得更加開放和標準,這是我觀察到的未來趨勢。”
如果說前兩年的AI是在“卷”技術,那今年無疑都轉向了“卷”應用。
在賈揚清看來,今天是做應用最好的年代,AI呈現出來的智能能力讓做應用變得更簡單,同時能夠帶給用戶更好的交互體驗。
以前人們常認為,芯片短缺是阻礙AI發展最大的“絆腳石”。但在賈揚清看來,“芯片供應鏈問題已經有了非常好的解決方案,因GPU短缺造成的算力問題不再會是瓶頸。關鍵是看如何找到AI應用路徑,與垂直領域深度結合,真正把AI用起來。”
“就像當年‘電’剛被發明出來時,很多人不知道它有什么用,直到冰箱、電視、手機的出現,才讓電的價值得以體現。”
但想讓AI真正用起來,成本是一個不得不考慮的問題。
有人提出,“如今AI技術難廣泛落地應用,問題是出在了高額成本上。從客服行業來看,標桿是5元每小時,這是菲律賓和印度的人工價格。要是AI使用成本比人還貴,就沒必要了。”
對此,賈揚清比之前更加樂觀。他認為,“成本不是核心問題,Token的推理成本可能在接下去的一年還會再降低十倍,甚至更多。公司更應該關注的是用戶體驗。讓AI使用成本降低到人工成本以下,可能就是一兩年的時間。”
他表示,“核心的大語言模型其實都差不多,但企業如何管理數據、怎么打通權限、用戶搜索時是想找到文檔還是想要內容總結?這些長遠深度的思考遠比模型本身更重要。”
GPU價格是個“偽命題”
除了應用,當前AI競技場的另一關注點在于AI基礎設施。
搞云計算出身的賈揚清,認為現在迎來了“云”的第三次浪潮,而AI正是這場革命的催化劑。
他介紹,“云”的前兩次浪潮分別是2000年代的“Web云”,以及2010年代的“數據云”,而這次興起的是“AI云”。
與前兩朵“云”不同的是,“AI云”是在”傳統云“的基礎上增加了AI算法,利用神經網絡等技術,可以滿足更大規模的數據處理和計算需求。
“今天所有的AI應用都對大模型有非常高的需求,無論是AI圖像生成還是AI視頻生成,都會調用軟件框架,最后落到云基礎架構和GPU上面。”賈揚清說。
誰都不想錯過“風口”的機會,“AI云”也正是賈揚清在辭任阿里巴巴技術副總裁后,看準的創業方向。
賈揚清說,“擠大模型賽道不是最想干的事,更看重AI發展背后生出的機會點,即對高性能計算的需求,以及AI市場會越來越需要好的云服務,這是團隊最擅長的。”
Lepton AI和很多硅谷創業公司一樣,團隊規模并不大,大多是程序員和產品經理。
公司名字的由來也很有意思,在物理學中,“Lepton”指的是輕子,是一種基本粒子。
這和賈揚清所期望的一樣,用最簡單的方式和低廉的成本幫助其他公司解決行業痛點問題。
“他們需要更快的GPU、更好的供應鏈、更高的性價比、更加專業的服務...這一切都是我們正在做的事。”
具體來說,Lepton AI提供的是大模型推理引擎,建立了云平臺供用戶找到性價比最高的GPU資源。
賈揚清認為,“GPU價格在一定程度上是個‘偽命題’,因為Buy is better than build(購買AI云服務會比自建算力設施更劃算)。”
他提到,“很多有前瞻性的CEO已經放棄糾結一塊GPU到底需要多少錢,而是選擇了這樣的方式,把更多的精力和資源放在應用開發上。”
對話最后,請賈揚清談了談如何才能在技術創新的道路上找到自己的方向。
他想了片刻說,“創新沒有捷徑一說,興趣是最好的驅動力,因為誰也猜不到未知技術領域會帶來怎樣的驚喜,能做的就是追隨興趣堅持走下去。”