歡迎來到的[每周AI大事件],這里記錄了過去一周值得關注的AI領域熱點內容,幫助大家更好地了解人工智能領域的動態和發展風向。
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
PART1動態
[國內要聞]
1.百度、字節等8家公司大模型產品正式上線
8月31日,百度(文心一言)、字節(云雀大模型)、商湯(日日新大模型)、中科院旗下紫東太初大模型、百川智能(百川大模型)、智譜AI(GLM大模型)、MiniMax(ABAB大模型)、上海人工智能實驗室(書生通用大模型)8個企業/機構的大模型位列第一批名單,可正式上線面向公眾提供服務。
廣東省2家和其他省市1家也將陸續開放。廣東地區獲批公司分別為華為、騰訊,科大訊飛系其他地區獲批產品。阿里通義千問、360智腦不在首批獲批名單中。
2.百家云發布一站式 AIGC 場景化平臺「百問大模型」
百家云在戰略發布會上發布了一站式 AIGC 場景化平臺「百問大模型」。該平臺基于百家云的技術積淀和研發實力,保證企業數據安全的同時,能夠低成本接入各類 AIGC 服務,解決企業應用模型技術的困難。該平臺提供多種數據安全審計方式,支持零代碼快速生成應用,集中管控企業知識庫,滿足信創要求,并支持私有化部署自主可控。百家云還展示了該平臺在智能大模型 AI 客服、公文寫作、個人 AI 助理、數字人互動直播和營銷文案輔助等場景的應用案例。
3.360:“360智腦” 大模型已創造近2000萬元相關業務收入
360發布2023年半年報,總營收45.03億元,其中安全業務實現營收9.08億元。360安全大模型已在360內部及自有產品落地應用,并創造近2000萬元相關業務收入。360安全大模型是360自研的認知型通用人工智能大模型,具備多項核心能力,已推出企業級 AI 大模型解決方案,并與合作伙伴推出行業大模型,推動大模型產業發展。
4.微博推出明星 AI 情感伴聊助手功能
近期微博推出了一項名為 “明星 AI 情感伴聊” 的功能,用戶向明星發送私信并授權使用該功能后,專屬的 AI 助手將模仿明星的聊天方式和風格進行自動回復,以此提升用戶的情感體驗。目前該功能僅支持用戶發送文本類型消息,但未來將能夠識別并發送非文本格式的消息。
5.科大訊飛:訊飛星火大模型已首批順利完成備案
科大訊飛表示,已首批順利完成備案。首批通過備案的企業名單,預計將在1周內陸續由各地方相關管理部門通知大家。廣東地區獲批公司分別為華為、騰訊,科大訊飛系其他地區獲批。
6.嘉楠科技 Canaan 開源通用大語言模型 Toucan
嘉楠科技發布了參數量為70億的通用大語言模型 Toucan-7B 及 INT4量化版本 Toucan-7B-4bit。Toucan-7B 能夠實現文案寫作、代碼解析、信息抽取等多種自然語言處理任務,并在測試中表現優于 ChatGLM-6B。Toucan-7B-4bit 使用了最新的 INT4量化技術,顯存占用量更低,與 Toucan-7B-fp16模型相比,具有較好的推理效果。
7.阿里 “通義千問” 已完成備案工作 待正式上線
阿里旗下的 “通義千問” 大模型已完成備案工作,預計將在1周內獲得各地相關管理部門的通過。該模型是阿里云推出的一個超大規模的語言模型,具備多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等功能。首批通過備案的企業名單即將公布,模型將于2023年4月7日開始邀請測試。
8.華為盤古大模型版小藝開啟眾測招募
華為開始招募全新小藝眾測體驗官。首批支持眾測的機型包括 Mate60/P60系列。全新小藝能夠更好地理解用戶并提供更精準的反饋,包括本機數字內容搜索、對話識別屏幕內容、幫助用戶快速摘要、文案內容輔助、圖片二次創作等功能。用戶可在8月31日至9月15日期間通過會員中心體驗官用戶調研完成提交問卷、報名,眾測時間暫定為9-10月。
9.百度營銷推出 “品牌 BOT” 對話式廣告產品
百度營銷推出了一款名為 “品牌 BOT” 的對話式廣告新產品,旨在幫助企業與用戶建立更深層次和貼心的雙向交流通路,提升用戶信任感和粘性。品牌 BOT 具有識別用戶意圖并提供相應回復的能力,能夠提高營銷效率,降低用戶決策成本。
10.百度智能云:9月5日千帆大模型平臺將迎來大版本升級
百度智能云宣布將在9月5日舉行的2023百度云智大會上,對千帆大模型平臺進行大版本升級。此前,百度智能云已向企業客戶全面開放文心一言服務,并與300多個合作伙伴在400多個場景中取得了不錯的測試效果。
11.昆侖萬維:多模態大模型已進入實驗性訓練階段
昆侖萬維表示,“天工” 大模型自發布后一直以 “周” 為單位進行迭代,訓練集群保持高負荷的運行。今年7月,手機端天工 AI 助手正式上線,進入內測階段,蘋果和安卓用戶均可下載。目前,“天工” 大模型已經具備強大的自然語言處理和智能交互能力,并展現出更高級的自主學習和智能涌現能力。。
12.智譜 AI 上線首款生成式 AI 助手「智譜清言」
智譜 AI 宣布上線首款生成式 AI 助手「智譜清言」。該助手基于智譜 AI 自主研發的中英雙語對話模型 ChatGLM2,經過萬億字符的文本與代碼預訓練,并采用有監督微調技術。「智譜清言」作為智能助手,可解答各類問題、完成各種任務,具備豐富的能力。用戶可通過應用商店或微信小程序下載體驗。
13.美圖推出 AI 數字人生成工具 DreamAvatar
文章核心內容:美圖公司推出 AI 數字人生成工具 DreamAvatar,首期推出了 “AI 演員” 數字人服務。用戶只需要將拍攝好的視頻素材導入,AI 會進行人體檢測、跟蹤、擦除、替換等處理,將真人替換成數字人。通過3D 人體姿態估計和驅動算法,DreamAvatar 的 AI 演員能夠與真人動作完美同步。
14.生成式人工智能服務內容標識方法公布 AI 生成內容應標注 “AI 生成” 等信息
根據《生成式人工智能服務管理暫行辦法》,信安標委發布了《網絡安全標準實踐指南 —— 生成式人工智能服務內容標識方法》。該指南給出了針對文本、圖片、音頻和視頻四類生成內容的標識方法,要求在內容中添加標識,并在元數據中添加擴展字段。指南還要求在生成內容的顯示區域中持續顯示提示文字,或在背景中添加顯式水印標識。
15.同方知網與華為云簽約共建華知大模型
同方知網數字出版技術股份有限公司與華為云計算技術有限公司在華為云盤古大模型主題論壇上簽署了合作協議,共同建立中華知識大模型及人工智能聯合創新實驗室。雙方將以華為云盤古大模型為基礎,打造知識服務行業的 AI 大模型,推動知識服務行業的智能化發展和數字化轉型。
16.阿里魔搭社區開源 AIGC 圖生圖產品 “相似圖像生成模型”
阿里魔搭社區最近推出了相似圖像生成模型,可以根據輸入的原始圖像生成多張風格相似但不完全相同的圖像。該模型適用于藝術創作和產品設計等領域,能夠提供多樣化的效果,并節約時間和成本。模型鏈接和體驗鏈接也在文章中提供。
17.面壁智能發布千億多模態大模型 “Luca” 面壁露卡 Luca2.0開啟公測
面壁智能發布了最新大模型成果 Luca,其語言模型能力已與 ChatGPT 相當。Luca2.0具備強大的多模態處理能力,圖片理解能力達到中文全網最強。Luca2.0已開啟公測申請,是國內首個開源免費商用基座模型。
18.商湯集團:上半年生成式 AI 相關收入取得670.4% 強勁增長
商湯集團在2023年上半年加快了生成式人工智能(Generative AI)業務的推進,其中包括大語言模型及文生圖模型的研發。他們聯合多家國內頂尖科研機構發布了預訓練大語言模型 InternLM,并在其基礎上推出了生成式 AI 產品系列。這些舉措使得生成式 AI 相關收入增長了670.4%,占集團總收入的比例也提升至20.3%。
19.馬上消費發布 “天鏡” 零售金融大模型
馬上消費金融發布了首個零售金融大模型 “天鏡”。通過構建 “三縱三橫” 的大模型發展技術布局,馬上消費聚焦六個核心領域,推動金融數字化轉型。該模型已運行近3個月,意圖理解準確率達91%,客戶參與率61%。
20.阿里發布夸克掃描王 APP 搭載 AI 大模型技術
阿里智能信息事業群發布了夸克掃描王 APP,這是一款手機掃描產品,搭載了 AI 大模型技術。夸克掃描王 APP 可以高效地解決文件整理問題,無論是在工作、學習還是生活中,它都可以幫助你掃描文件、提取資料、拍攝證件照、進行文件格式轉換和智能消除不需要的內容。
21.美圖公司:上半年 AIGC 推動凈利潤同比增長320.4%
美圖公司發布2023上半年財報,顯示總收入12.61億元,同比增長29.8%。經調整后歸屬于母公司權益持有人的凈利潤1.51億元,同比增長320.4%。AIGC 的推動下,美圖公司的 VIP 會員數超過720萬,創歷史新高。影像與設計產品業務收入、美業解決方案業務收入、廣告業務收入都呈現增長趨勢。
22.昆侖萬維自研 AI 游戲平臺 Club Koala 亮相 預計年末正式發行
昆侖萬維旗下游戲工作室 PlayforFun 自研的國內首款 AI 游戲 Club Koala 在德國科隆展亮相。該游戲通過 AI 賦能 UGC 游戲開發,提供全新的游戲體驗和創造力,引領游戲行業變革。
23.智己汽車發布 “智己生成式大模型 Beta 版” 預計10月上線
智己汽車發布了 “智己生成式大模型 Beta 版”,該模型具備自然語言處理和機器學習能力,融合了千億級參數,可以自動編排和自學習。預計該模型將于10月與智己 LS6車型一起交付并上線。該大模型可以通過多重意圖識別,精準理解用戶的需求和指令,并根據歷史交流偏好和習慣為用戶提供個性化、專屬的出行體驗。
24.螞蟻集團:將在外灘大會披露自研大模型落地進展
螞蟻集團將在外灘大會上發布自研大模型的最新落地進展,從模型層到應用層都會有展示。螞蟻集團副總裁陳文光透露,螞蟻貞儀大模型目前尚未對外公布,但他強調螞蟻在大模型技術方面的研發已持續數月,并正在探索和深化對大模型技術的理解和應用。螞蟻認為自己在業務場景和數據方面具有獨特優勢,可以在大模型的應用方面取得成果。
25.安恒信息發布 “恒腦” 安全垂域大模型
安恒信息發布了名為 “恒腦”安全垂域大模型的安全解決方案。該大模型包含惡意代碼檢測、威脅情報分析、自動化安全編排響應和安全教育等多項能力,旨在降低安全運營門檻、提高效率,并幫助解決安全專家短缺問題。該模型將為安恒信息的數據安全戰略、MSS 戰略和人才戰略提供發展源動力。
26.國產百億大模型再增一員!400億參數孟子 GPT 發布
國內 AI 公司瀾舟科技發布了新的大型模型孟子 GPT-40B,該模型擁有400億參數,相較于之前的7B 版本,性能提升了10-15%。孟子 GPT-40B 在中文和多語言能力、寫作、多輪對話等方面表現出色,并接近 ChatGPT-3.5的水平。
[國際要聞]
1.三星推出人工智能驅動的食譜應用程序「Food」
三星電子推出了一款名為「Food」的人工智能驅動的食譜應用程序,其中包含160,000個菜譜供用戶使用。該應用程序基于三星在2019年收購的 Whisk 食品數據庫開發而來。這款應用程序將在104個國家發布,有8種語言版本,可以掌控用戶的烹飪設備、制定膳食計劃并提供新的食譜。
2.谷歌計劃將在印度和日本推廣人工智能搜索
谷歌計劃在印度和日本市場推廣其人工智能驅動的搜索生成體驗(SGE)計劃,該功能目前仍處于邀請加入的階段。SGE 旨在為用戶提供策劃的答案,而不是傳統的網頁列表。谷歌的系統與微軟的不同之處在于,它將人工智能直接整合到現有的搜索欄中。該功能將提供多語言版本和語音輸入功能,并在搜索結果頁面上繼續顯示廣告。
3.Meta 可能正開發 Llama3,據稱比 GPT-4強大、免費開源!
據報道,Meta 可能正在開發一款比 GPT-4更強大的 AI 大模型 Llama3,并計劃保持其開源免費的特性。目前尚未有官方確認,但該消息來自 OpenAI 工程師 Jason Wei。Llama2在某些應用中達到了 GPT-3.5的水平,但與 GPT-4等模型相比仍有差距。
4.《使命召喚》將使用 AI 功能監控玩家語音聊天內容
游戲公司 Activision 宣布將在其旗艦射擊游戲《使命召喚》系列中引入人工智能語音聊天審查系統。該系統由人工智能公司 Modulate 研發,名為 ToxMod。ToxMod 系統可以實時識別仇恨言論等違規內容,但最終審核仍由人工客服執行。系統首先在北美試運行,11月全球發布。通過語音轉錄和情感分析等技術,ToxMod 可以更準確地判斷語音中的惡意程度,避免 AI 作出錯誤判斷。
5.通用汽車與谷歌云合作 旗下汽車將引入對話式 AI
通用汽車與谷歌云計劃合作,將對話式人工智能技術引入數百萬輛通用汽車。通用汽車旗下的安吉星互動虛擬助手將由谷歌云的對話式人工智能技術提供支持,可以回答基本問題和提供路線幫助。此外,通用汽車還將利用谷歌云的 Dialogflow 技術部署聊天機器人,解答關于通用汽車和產品功能的問題。
6.OpenAI 預計在未來12個月內有望實現10億美元營收
OpenAI 預計在未來12個月內實現10億美元的營收,超出了之前的預期。這家由微軟支持的公司今年早些時候估值為270億美元。公司的月營收超過8000萬美元,較去年的2800萬美元有了顯著增長,主要歸功于其聊天機器人 ChatGPT 的收費。
7.美國版權局公開征求意見,研究處理 AI 版權問題
美國版權局將于8月30日開始公眾意見征詢期,以研究如何處理人工智能和版權的問題。版權局希望回答三個主要問題:人工智能模型應如何在訓練中使用受版權保護的數據;即使沒有人類參與,人工智能生成的材料是否也可以獲得版權;以及版權責任如何與人工智能發揮作用。
8.超大福利!Runway 啟動創意合作伙伴計劃:為精選用戶提供百萬積分獎勵
AI 初創公司 Runway 啟動了創意合作伙伴計劃,為選定的一組用戶提供訪問新功能和 AI 模型的優先權限、免費的無限計劃和100萬積分。該計劃類似于 YouTube 的創作者伙伴計劃,旨在培育和支持優秀的內容創作者。用戶可以通過填寫申請表格參與計劃,申請者無需擁有付費賬戶即可加入。
9.谷歌 DeepMind 推水印工具 SynthID,隱形標記和識別 AI 圖像
谷歌 DeepMind 推出名為 SynthID 的工具,可以為 AI 生成的圖像添加隱形數字水印,從而可靠地識別 AI 生成的圖像。SynthID 使用兩種深度學習模型,一種用于生成隱形水印,一種用于檢測水印。該水印可以抵御常見的圖像處理操作,如裁剪和變色。DeepMind 計劃首先在 Google Imagen 圖像 AI 上使用 SynthID,并有可能將其推廣到其他系統上。
10.谷歌開始向大型企業收取 Duet AI 每月30美元費用
谷歌計劃向大型企業收取每個用戶每月30美元的費用,以使用其為 Gmail 和其他生產力應用程序添加的人工智能增強功能。谷歌的 Duet AI 功能被宣傳為谷歌應用程序中的有用協作者,并將與微軟的365Copilot 功能采用相同的定價模型。這些費用是除了公司已經支付的生產力套件訂閱費用外的額外費用。谷歌表示,目前尚未確定規模較小的組織和個人用戶的定價。
11.谷歌云 AIGC 大提升!Vertex AI 提供 Claude2等第三方模型,PaLM2升級
在谷歌云 Next'23大會上,谷歌推出了多款新品和更新,其中生成式 AI 成為核心主題。谷歌云擴展了云 AI 產品,提供第三方模型,如 Meta 的 Llama2和 Anthropic 的 Claude2。谷歌還宣布 PaLM2升級,支持38種語言和32K 上下文窗口,并擴展了 AI 模型的自定義服務,如 PaLM2支持微調和 Imagen 支持 “風格調優”。
12.谷歌下一代大模型 Gemini,算力已達 GPT-4的5倍!
谷歌的下一代大模型 Gemini 的訓練算力已達 GPT-4的5倍。Gemini 初代版本可能是在 TPUv4上訓練,使用14個 pod,訓練 FLOPS 達1e26,而 GPT-4的 FLOPS 僅2e25左右。谷歌擁有大量自主研發的 TPU 芯片,其中 TPUv5的數量已經超過了 OpenAI、Meta、CoreWeave 等公司總 GPU 數量。Gemini 一直在 TPU 上快速迭代,先是 TPUv4,現已升級到 TPUv5,性能表現也優于 GPT-4。
13.Stability AI 開源聊天機器人 Stable Chat 采用新的「解釋微調」技術
Stability AI 最近推出了開放訪問的語言模型 Stable Beluga 的基于 Web 的聊天界面 Stable Chat,該模型是 HuggingFace 排行榜上表現最好的開放大型語言模型。Stable Beluga 模型使用了一種名為 "解釋微調" 的技術,它利用教師生成的示例輸入和期望模型輸出的數據集進行微調。Stability AI 創建了自己的解釋微調數據集,并訓練了兩個版本的 Stable Beluga 模型。
14.微軟 Bing Chat 正式支持谷歌桌面版瀏覽器 Google Chrome
微軟正式為 Google Chrome 添加了對 Bing AI 的支持。Bing AI 在六個月前發布時僅限于 Microsoft 的 Edge 瀏覽器,但現在已經擴展到了 Google Chrome。微軟表示將來會支持其他瀏覽器。此外,微軟還在 SwiftKey 中擴展了對 Bing AI 的支持,用戶現在可以每天使用最多30次 AI 功能而無需登錄賬戶。
15.英偉達推出全新的 AI 模型 NVIDIA DLSS3.5大幅提升光影效果
英偉達推出全新的 AI 模型 NVIDIA DLSS3.5,采用光線重建技術,為密集型光追游戲和應用程序提供更高質量的光追圖像。該模型實現了三大突破,通過 AI 學習生成更高質量的光線追蹤圖像,不依賴硬件且支持新老顯卡,訓練數據增加5倍以保留更多細節。光線重建使用 AI 模型替代多個手動降噪器,能更準確生成光照效果,并與 DLSS 的超分辨率和幀生成技術相結合,大幅提升光追游戲的性能和圖像質量。
16.雅虎郵箱要打 “翻身仗”? 新增購物助手等人工智能功能
雅虎宣布在其郵箱服務中測試多項人工智能新功能,包括名為 "Shopping Saver" 的購物功能,可以在用戶的收件箱中檢索被遺忘的禮品卡、優惠碼和商店積分,并提醒用戶使用這些優惠。除了購物功能,雅虎還改進了搜索和撰寫助手等其他人工智能功能,幫助用戶更方便地搜索舊郵件和選擇合適的語氣。雅虎利用人工智能提升產品價值,這一策略可能有助于挽救雅虎郵箱用戶流失。
17.美國外賣平臺 DoorDash 推 AI 語音點餐服務
美國外賣平臺 DoorDash 推出了語音訂餐服務,利用人工智能系統接聽餐廳的電話訂餐,幫助餐廳處理線上外賣訂單。該服務可以全天候接聽餐廳電話,讓餐廳員工專注處理店內顧客和外賣訂單。人工智能系統可以根據用戶數據做個性化推薦,并提供多種語言支持。服務目前僅面向部分餐廳開放,根據餐廳需求進行調整。
18.重磅!OpenAI 發布最強 ChatGPT—— 企業版 ChatGPT
OpenAI 發布了最強的 ChatGPT 版本 —— 企業版 ChatGPT。該版本提供企業級安全和數據隱私保護,支持無限速的 GPT-4訪問權限,能夠處理32K 上下文輸入,具有高級數據分析功能和自定義選項等高級功能。
19.報道稱三星自研生成式 AI 工具將于9月發布 或命名為 Simply Chat
三星計劃在9月12日的 RealSummit2023上發布自家研發的生成式 AI 工具,可能命名為 "Simply Chat"。該工具主要面向三星內部員工使用,旨在提高工作效率,提供編程支持、郵件幫助、文檔摘要等功能。預計在10月開始內部測試,如果測試順利,將在2023年底或2024年初面向所有員工開放使用。
PART2 熱門產品
1. Stability AI發布開源大語言模型Stable Beluga
Stability AI發布開源大語言模型Stable Beluga,并基于它開發Stable Chat聊天機器人,采用解釋微調技術進行優化,允許用戶通過網頁界面使用并反饋,以改進模型性能。
體驗地址:https://research.stability.ai/chat
2.學術黨狂喜,Meta 推出 OCR 神器,PDF、數學公式都能轉
Meta AI 推出了 OCR 神器 Nougat,可以將 PDF 文檔轉換為 MultiMarkdown,并且能較為準確地轉換復雜的數學公式和表格。Nougat 基于 Transformer 模型構建,不需要 OCR 相關輸入或模塊,能隱式識別文本。為了提高泛化能力,研究團隊使用數據增強技術模擬掃描文件的不完美和多變性。
3.AI 制作高質量超萌貓片,Pika Labs 一句話就能生成
Pika Labs 是一款強大的文本轉視頻 AI 平臺,用戶只需輸入一個文字提示,就能由 AI 生成劇情連貫、畫面精美的視頻。Pika Labs 大大降低了用戶的操作門檻,用戶無需學習專業知識就能制作高質量視頻。
4.全球首個大模型 Agent 產品爆款出場!動動嘴讓 PC 成為打工人
實在智能推出了基于大模型的 Agent 產品 TARS-RPA-Agent,也叫 ChatRPA。該產品能理解人類意圖,操作所有桌面軟件,包括復雜的 CS 架構軟件和不開放接口的軟件。通過 CV 大模型 ISSUT 的加持,TARS-RPA-Agent 可以像戴上了屏幕洞察眼鏡一樣,秒懂屏幕上的一切。
5.不要9塊9「寫真」零元購,妙鴨挑戰者出現,可白嫖25張
妙鴨相機帶爆了 AIGC 藝術照賽道,又有新產品探頭,名為木目 AI。這款工具可以免費試用,白嫖25張寫真照片。用戶需要先訓練一個 AI 模型,然后可以通過文本輸入或上傳參考圖片生成藝術照。用戶反饋顯示,生成的效果還不錯,但也有一些手繪圖的問題。
6.Runway 競爭對手來了,一鍵生成短視頻,限時免費開放使用
創業公司 Morph Studio 將眼光放到了視頻生成上,推出了一款可以一鍵生成短視頻的 AI 工具。使用該工具,用戶只需提供幾個提示詞或一段形容的語句,就可以生成出符合要求的視頻內容,毫無創作門檻。目前該工具正在免費測試階段,并且其生成的高質量視頻內容接近 AI 畫圖的水平。
7.視覺語言模型 BLIVA: 讓 AI 更擅長閱讀圖像中的文本 懂得看路牌和食品包裝
BLIVA 是一種視覺語言模型,擅長讀取圖像中的文本。BLIVA 結合了 InstructBLIP 的學習查詢嵌入和 LLaVA 的編碼修補嵌入。BLIVA 在多個數據集上表現優異,可用于識別路牌、食品包裝等場景。該模型的雙重方法允許同時利用針對文本定制的精煉查詢嵌入和更豐富的編碼修補,提高了視覺理解的能力。
8.Bored Humans 提供 Midjourney 等100多款主流 AI 工具的免費平替版本
Bored Humans 是一個擁有100多種免費 AI 工具的網站,可替代許多付費工具。網站包含有趣的 AI 小工具,但生成的圖像質量通常不如 Midjourney 等更復雜的模型。該網站由美國域名投資者 Eric Borgos 創立,提供了許多有趣且新穎的免費 AI 小工具,但仍有改進空間。
9.文生圖 prompt 不再又臭又長!LLM 增強擴散模型,簡單句就能生成高質量圖像
中山大學 HCP 實驗室的研究人員提出了一種參數高效的微調方法 SUR-adapter,可以增強 text-to-image 擴散模型理解關鍵詞的能力。實驗結果表明,該方法能夠有效地使擴散模型理解和推理簡潔的自然語言描述,并且不會降低圖像質量。
10.一句話搞定3D 模型紋理貼圖,全程只需30秒
港大、港中文和 TCL 的研究人員開發了一種 AI 設計3D 模型紋理的方法,通過擴散模型,只需輸入一句話描述,即可生成逼真的紋理貼圖。該方法包括粗設計和精加工兩個模塊,利用擴散模型生成粗糙紋理圖像,并進一步生成更加精細的紋理。
11.Code Llama 代碼能力突飛猛進,微調版 HumanEval 得分超 GPT-4
Meta 開源了 Code Llama 代碼生成模型,該模型在多種編程語言中具有出色的代碼能力。Code Llama 的不同版本在 HumanEval 和 MBPP 數據集上的一次生成通過率超過了 GPT-3.5。研究者利用微調的 Code Llama-34B 模型,在 HumanEval 評估中擊敗了 GPT-4。
PART3 觀點
1.LeCun :只會看書的語言模型永遠無法實現「類人智能」
紐約大學教授 Yann LeCun 及其團隊認為,大型語言模型的智能提升受限于語言本身的局限性。盡管語言模型在常識推理測試中表現出色,但其理解能力仍然膚淺,無法達到類人智能的水平。他們指出,語言模型只能通過學習背景知識和上下文來理解語言,但對于復雜的對話技巧和非語言的知識,模型的記憶力和注意力有限。因此,多模態的學習和非語言的理解能力將是實現真正智能的關鍵。
2.2023年上半年美國人工智能創業占投資份額四分之一
根據 Crunchbase 數據統計,2023年上半年美國創業投資市場中,超過四分之一的資金流入了人工智能領域的初創企業,環比增長一倍以上。人工智能正成為資本追捧的新寵,其在融資榜上脫穎而出的關鍵在于其可廣泛應用于各個行業,抵御了其他垂直領域的融資縮水。
3.Worldcoin 創始人:AGI 將于2030年到來
Worldcoin 公司的創始人 Saturnin Pugnet 預計,到2030年,人工智能通用人工智能(AGI)和核聚變能源將實現。他的預測與 OpenAI 創始人 Sam Altman 的觀點相似。Pugnet 還提到了他發起的 Worldcoin 項目,旨在通過提供全民基本收入來應對 AGI 可能帶來的就業減少。
4.微軟總裁:人工智能需要「人類控制」以避免被「武器化」
微軟總裁兼副主席 Brad Smith 在接受采訪時表示,人工智能可以被武器化,并需要人類加以控制。他強調,每一項技術發明都有成為工具和武器的潛力,因此我們必須確保人工智能仍然受到人類控制。全球科技領袖也對人工智能的風險發出了警告,并強調減輕這些風險的必要性。此外,人工智能的爆炸性增長也引發了工人對工作被取代的擔憂。
5.研究:AI 模型仍不擅長生成干凈代碼 GPT-4的 API 誤用率達62%
計算機科學家對幾個大型語言模型在 StackOverflow 的 Java 編碼問題上的回答進行了評估,結果發現這些模型的代碼質量仍然不盡如人意。研究發現,GPT-4的 API 誤用率達到了62.09%。
6.Salesforce 調查顯示:近50% 的人不信任企業會合乎道德地使用 AI
Salesforce 最近對來自25個國家的1.4萬名企業買家和消費者進行了調查,發現企業在采用人工智能技術的 “競賽” 中,可能以客戶信任為代價。調查顯示,雖然客戶普遍對 AI 應用持開放態度,但近50% 的受訪者不信任企業會合乎道德地使用 AI。調查建議企業提高 AI 使用透明度和結果驗證,49% 的受訪者希望獲得更多選擇權,決定 AI 在接觸中的應用方式。
7.人工智能 “淘金熱” 提振硅谷
生成式 AI 的興起讓硅谷重新煥發活力,吸引大量投資。根據數據顯示,今年美國生成式 AI 的風險投資交易總額已達146億美元,遠超過過去兩年總和。專家認為生成式 AI 是最具變革性的技術趨勢之一。
8.卡巴斯基 CEO:ChatGPT 仍無法于人類智能相媲美
卡巴斯基公司首席執行官尤金?卡巴斯基在亞太網絡安全峰會上表示,ChatGPT 目前可能能夠回答一些較為直接和簡單的問題,但與人類智能仍存在差距。卡巴斯基的研究團隊正在利用 ChatGPT 改進工作流程,但不完全信任其生成的結果。
9.皮尤研究中心:ChatGPT 使用率仍很低 只有18% 的美國人使用過
根據皮尤研究中心的調查,只有18% 的美國人使用過 ChatGPT,實際使用率仍然很低。調查還發現,47% 的人表示對人工智能感到擔憂而不是興奮。ChatGPT 主要用于娛樂和自我教育,而不是工作相關。調查還顯示,了解 ChatGPT 的工作人員認為它對他們的工作影響不大。
10.郭明錤:ChatGPT 流量下滑不利于 AI 供應鏈整體股價表現
郭明錤是天風國際的分析師,他表示,ChatGPT 流量的下降對于 AI 供應鏈的整體股價表現不利。他認為,ChatGPT 的流量下降以及缺乏證明可持續盈利的 AI 服務商業模式,可能會影響到 AI 股票的表現。此外,他還指出,英偉達發布的 L40S 可能會使投資人將對 AI 投資的關注重點轉移到 AI 邊緣運算上。
11.分析稱:比特幣能源浪費教訓給 AI 未來提供了經驗
隨著對人工智能系統的興趣激增,全球電網可能會面臨與比特幣相當的巨大能源消耗壓力。幸運的是,比特幣已經展示了如何減輕能源消耗的方法,為 AI 行業提供了經驗。生成式 AI 不具備能源浪費的問題,相比比特幣,AI 能夠給世界帶來更多的價值。目前,AI 訓練和部署所消耗的能源還不算巨大,但隨著生成式 AI 的發展,能源消耗可能會逐漸增加。
12.ChatGPT 在32門大學課程中有9門的成績或優于學生
最近的研究發現,ChatGPT 在32門大學課程的測試中,有9門的表現可與學生相比或甚至優于學生。ChatGPT 在數據結構、公共政策概論、定量合成生物學等科目中的表現與人類學生一樣好,甚至更好。然而,在數學和經濟學任務中,學生的表現優于 ChatGPT。
PART4 深度
1.圖靈測試已死!ChatGPT 通過人類考試也不算,超強 AI 評估新秀「邏輯謎題」
ChatGPT 是世界上最強大的 AI 之一,可以通過各種考試,并且在某些情況下輸出的回答難以辨別真假。然而,在解決簡單的視覺邏輯難題方面,ChatGPT 還存在著局限性。一項研究發現,ChatGPT 在某些圖案測試中的正確率僅為1/3或3%,這引發了研究人員對如何評估 AI 系統能力的思考。為了提供更好的評價標準,研究人員設計了一系列邏輯謎題,旨在測試 AI 系統的抽象推理能力。然而,目前的結果顯示,ChatGPT 在邏輯謎題方面仍然無法接近人類的水平。
2.沸沸揚揚的搜索 AI,能顛覆傳統搜索引擎嗎?
文章總結:現階段的搜索 AI 暫時還無法取代傳統搜索引擎。雖然一些搜索 AI 產品如天工 AI 搜索在國內引起了轟動,但在實際表現中仍存在幻覺和理解能力的限制。傳統搜索引擎在可靠性方面更具優勢,而搜索 AI 則注重對晦澀、復雜內容的解讀。未來的搜索引擎可能會結合傳統搜索和 AI 搜索的優勢,通過智能處理和提煉信息,為用戶提供有價值的思路和建議。
3.年收入超10億美金?OpenAI 的 “賺錢戲法”
OpenAI 預計在未來12個月內,通過銷售人工智能軟件及其計算能力,將獲得超過10億美元的收入。OpenAI 已經開始商業化,并推出了 ChatGPT 的訂閱收費模式和企業版,以提高用戶付費比例。然而,OpenAI 的高成本仍然是一個挑戰,包括人才成本、訓練成本、推理運營成本等。與此同時,OpenAI 與微軟之間的關系也變得復雜,微軟在 OpenAI 投資了100億美元,但兩者在商業化進程中的利益沖突也開始顯現。
4.如何識別出由 AI 生成的的圖像?這幾個辦法了解下
隨著人工智能圖像技術的進步,辨別真實圖片和 AI 生成圖片變得越來越困難。文章介紹了幾種方法來評估圖像,提高識別 AI 生成內容的能力。首先是反向圖像搜索,查看圖片的來源是否可信;其次是放大檢查圖像,查看像素、輪廓等細節問題;然后是檢查人物是否過于完美,缺乏真實的皮膚紋理;還有比較不同區域,檢查是否存在不一致之處;最后是檢查背景是否模糊、缺少細節。
5.30秒出圖,成本直省2萬元,這類 AI 工具成電商領域 “顯眼包”
AI 工具在電商領域中的應用越來越顯眼,能夠幫助商家快速、低成本地生成商品圖。這類 AI 工具通過簡單的操作,可以快速生成多種風格的商品場景圖,效率大大提高。不需要設計經驗的商家也能通過 AI 工具獲得符合需求的商品圖。AI 生成的商品圖更像是圍繞一件商品提供的完整場景融合方案。
6. 拐點時刻?AIGC 時代的新聞業
AIGC(生成式人工智能)正在對新聞業產生重大影響。傳統新聞業面臨流量邏輯變遷、短視頻沖擊、線上廣告收入萎縮等挑戰,而 AIGC 的出現給新聞業帶來了新的可能。AIGC 技術的發展與大模型技術密切相關,大模型作為 AIGC 的基石,為新聞生產提供了更高效、多樣化的方式。AIGC 的應用范圍涵蓋自動化報道、輿情分析、內容優化等多個環節,并具備多模態內容生成能力。
7. AI 數字人,先卷死二流帶貨主播
數字人的技術逐漸成熟并普及,首先在電商領域造成沖擊,二流帶貨主播面臨失業。虛擬數字人的出現解決了小商家帶貨主播穩定性差、直播成本高的問題。數字人可以根據預設的文案自動生成帶貨視頻,成為小商家的心頭好。然而,數字人行業發展不平衡,服務質量參差不齊,存在版權歸屬問題和虛假信息傳播風險。同時,數字人的出現也引發了關于人工智能生成內容的平臺規范和版權爭議。
8.AI 攻入客服
智能客服是 AIGC 在電商領域落地的重要場景之一,它可以幫助電商平臺提高人效,提供 24 小時響應客服的體驗,以及低成本生成全渠道內容等。然而,智能客服在面對電商場景的強交互、重決策和弱鏈接特點時仍面臨困境。雖然大模型的加入可以提升智能客服的人效,但在數據清洗和同步方面仍存在問題。此外,智能客服賽道的競爭也在不斷演變,智能客服廠商需要加碼技術迭代和創新商業模式以拓寬生存空間。
9.內容平臺下半場:用AI爭奪創作者
文章概述了抖音、快手、小紅書、B站四大內容平臺在人工智能領域的探索與布局。抖音借AI繪畫效果走紅,推出剪映AI輔助視頻剪輯。快手研發大模型快意,在App上新增AI對話功能。小紅書開發AI繪畫工具,后又推出一鍵生成筆記配圖的此刻功能。B站正在內測搜索AI助手,可智能歸納視頻內容。內容平臺均在利用AI來輔助內容創作,提供更多玩法,以吸引更多創作者。
10.大模型「沖向」三四線城市年輕人
大模型 AI 工具如 ChatGPT 和文心一言在三四線城市年輕人中的應用逐漸增加。一些年輕人通過使用 AI 工具進行創作和工作,如設計師使用 AI 繪畫工具制作產品效果圖,商家使用 AI 繪畫工具制作宣傳圖和廣告圖片,學生使用 AI 工具寫郵件和論文,等等。然而,AI 工具在學術研究領域存在一些問題,需要辨別利用。無論如何,大模型 AI 工具已經成為年輕人工作和創作的輔助工具,為他們提供了更多的便利和創作可能性。
11.如果人工智能擁有了自主意識,科學家怎樣才能發現?
科學家團隊提出了評估人工智能是否具有自主意識的標準清單,通過匹配系統功能來判斷是否具有意識。該清單還可應用于現有人工智能系統。然而,目前還沒有任何證據表明現有的人工智能系統具有意識。科學家呼吁人工智能公司更加重視意識評估,并制定相應計劃。
12.英偉達護城河深不見底!一文梳理老黃如何成為 AI 賽道的無冕之王
英偉達通過成為從芯片、軟件到其他服務的一站式人工智能開發商,確立了自己的主導地位。他們生產能夠執行復雜 AI 任務的芯片,并開發了關鍵的軟件,從而在 AI 芯片制造領域取得領先地位。英偉達還為客戶提供專業計算機、計算服務和其他工具,成為人工智能開發的一站式供應商。目前,英偉達占據了人工智能芯片銷售額的70% 以上,并在訓練生成式人工智能模型方面占據更大的市場份額。