1.Google I/O 2024開(kāi)發(fā)者大會(huì)發(fā)布多款A(yù)I模型
Google在I/O 2024開(kāi)發(fā)者大會(huì)上發(fā)布了近10款A(yù)I模型,包括上下文窗口擴(kuò)展到200萬(wàn)tokens的Gemini 1.5 Pro,以及輕量級(jí)模型Gemini 1.5 Flash。此外,還推出了視頻生成模型Veo、文本到圖像模型Imagen 3,和全新的架構(gòu)Gemma 2.0。Android操作系統(tǒng)也通過(guò)集成Gemini模型進(jìn)行了重大更新,提供了更多AI功能。
2.OpenAI發(fā)布GPT-4o模型,精準(zhǔn)狙擊谷歌
谷歌I/O 2024開(kāi)發(fā)者大會(huì)前一天,OpenAI發(fā)布了GPT-4的重大升級(jí)版本——GPT-4o,標(biāo)志著人機(jī)交互進(jìn)入了新時(shí)代。GPT-4o能夠利用語(yǔ)音、文字、圖像進(jìn)行推理和交互,具備強(qiáng)大的多模態(tài)能力和情感感知,實(shí)現(xiàn)了接近人類(lèi)的交互體驗(yàn)。該模型在文本、推理、編碼智能方面達(dá)到了GPT-4 Turbo級(jí)別的性能,并在多語(yǔ)言、音頻和視覺(jué)功能上取得突破。GPT-4o的發(fā)布,使得OpenAI在AI行業(yè)繼續(xù)保持技術(shù)與產(chǎn)品化的領(lǐng)先地位,為AIGC生產(chǎn)力工具帶來(lái)顯著提升。此外,GPT-4現(xiàn)在向所有用戶(hù)免費(fèi)開(kāi)放,而GPT-4o API的性能是GPT 4-Turbo的兩倍,價(jià)格僅為一半。
3.字節(jié)跳動(dòng)推出“豆包大模型家族”
字節(jié)跳動(dòng)在2024年春季火山引擎Force原動(dòng)力大會(huì)上發(fā)布了自研的豆包大模型,該模型包含多種功能,如通用模型、角色扮演、語(yǔ)音合成等,能日均處理1200億Tokens文本和生成3000萬(wàn)張圖片。豆包大模型已廣泛應(yīng)用于字節(jié)跳動(dòng)的多個(gè)業(yè)務(wù)中,如抖音和飛書(shū),以提升效率和產(chǎn)品體驗(yàn)。此外,火山引擎與多家智能終端廠商成立大模型聯(lián)盟,推動(dòng)大模型服務(wù)的接入。豆包大模型的定價(jià)遠(yuǎn)低于行業(yè)標(biāo)準(zhǔn),企業(yè)市場(chǎng)定價(jià)為0.0008元/千Tokens,比行業(yè)便宜99.3%,旨在通過(guò)降低成本加速企業(yè)業(yè)務(wù)創(chuàng)新。豆包App已成為AIGC類(lèi)應(yīng)用下載量第一名,月度活躍用戶(hù)達(dá)2600萬(wàn)。
4.萬(wàn)興“天幕”賦能《歌手》片頭制作
5月10日晚,時(shí)隔4年回歸的《歌手2024》煥新開(kāi)唱,并迅速火爆全網(wǎng)。當(dāng)天,《歌手2024》片頭同步震撼亮相,該片頭部分視頻畫(huà)面由AIGC軟件A股上市公司萬(wàn)興科技(300624.SZ)旗下萬(wàn)興“天幕”支持生成。
萬(wàn)興“天幕”大模型是國(guó)內(nèi)首個(gè)音視頻多媒體大模型,依托15億用戶(hù)行為數(shù)據(jù)和百億本土化音視頻數(shù)據(jù),采用先進(jìn)的音視頻生成式AI技術(shù),可為全球創(chuàng)作者提供從模型到應(yīng)用場(chǎng)景的全鏈路創(chuàng)作支持。該大模型具備近百項(xiàng)音視頻原子能力,其中文生視頻能力實(shí)現(xiàn)不同風(fēng)格、豐富場(chǎng)景及主題的連貫性,一鍵生成時(shí)長(zhǎng)率先支持60秒+。萬(wàn)興“天幕”已于4月28日率先在業(yè)內(nèi)公測(cè),后續(xù)將逐步向企業(yè)和開(kāi)發(fā)者開(kāi)放API接口。
5.OpenAI人員動(dòng)蕩加劇
OpenAI聯(lián)合創(chuàng)始人兼首席科學(xué)家Ilya Sutskever發(fā)文宣布離職,結(jié)束了數(shù)月的猜疑。曾擔(dān)任OpenAI研究總監(jiān)的Jakub Pachocki將成為其繼任者。與Ilya一同離職的還有Jan Leike,二者此前共同領(lǐng)導(dǎo)OpenAI的超級(jí)對(duì)齊(Superalignment)項(xiàng)目。項(xiàng)目旨在確保AI模型的行為方式符合開(kāi)發(fā)者價(jià)值觀。同時(shí),OpenAI聯(lián)合創(chuàng)始人、科學(xué)家John Schulman將接替負(fù)責(zé)相應(yīng)工作。
Ilya的離職也標(biāo)志著與CEO Sam Altman之間的分歧得到解決,后者在經(jīng)歷被Ilya等人短暫逼迫下臺(tái)后,重新確立了在OpenAI的領(lǐng)導(dǎo)地位。
6.聯(lián)發(fā)科與英偉達(dá)合作開(kāi)發(fā)AI PC處理器
聯(lián)發(fā)科計(jì)劃與英偉達(dá)合作開(kāi)發(fā)基于ARM架構(gòu)的AI PC處理器,預(yù)計(jì)于2024年第三季度完成設(shè)計(jì),第四季度進(jìn)行驗(yàn)證。聯(lián)發(fā)科在高效能低功耗處理器設(shè)計(jì)及成本控制方面具有優(yōu)勢(shì),而英偉達(dá)則在GPU和AI計(jì)算能力方面領(lǐng)先。合作有望使聯(lián)發(fā)科利用英偉達(dá)的技術(shù)優(yōu)勢(shì),推廣AI PC產(chǎn)品。盡管聯(lián)發(fā)科在高端AI市場(chǎng)面臨挑戰(zhàn),但合作可能助其在中低端市場(chǎng)取得突破,逐步建立品牌信譽(yù)并擴(kuò)展市場(chǎng)份額。
7.微信讀書(shū)上線“AI問(wèn)書(shū)”功能
微信讀書(shū)推出“AI問(wèn)書(shū)”功能,通過(guò)人工智能技術(shù)輔助用戶(hù)閱讀。用戶(hù)遇到疑問(wèn)時(shí),選中文字并選擇“AI問(wèn)書(shū)”,系統(tǒng)即提供相關(guān)解釋或背景信息,答案來(lái)自平臺(tái)內(nèi)書(shū)籍,支持即時(shí)跳轉(zhuǎn)深入閱讀。