【ITBEAR科技資訊】7月5日消息,在近日舉辦的2024世界人工智能大會(WAIC 2024)上,嗶哩嗶哩(簡稱“B站”)向全球展示了其自主研發的多項AI技術成果與AIGC多元創意。這些創新涵蓋最新定制的AI語音聲庫、自研的音視頻大模型必剪Studio,以及獨特的AI動態漫技術,彰顯了B站在AI領域的深厚實力。
尤為引人注目的是,B站首次公開了其自研的大語言模型系列,這包括兩款開源模型:Index-1.9B chat和Index-1.9B character。這兩款模型在GitHub上于6月已經開源,并受到了廣泛關注。Index-1.9B系列模型的設計精巧,包含基座、對照組、對話和角色扮演四種類型,各具特色且功能強大。
據ITBEAR科技資訊了解,Index-1.9B base作為基座模型,擁有19億非詞嵌入參數量,并在2.8T中英文為主的語料庫上進行了預訓練,性能在多個評測基準上領先同級模型。而Index-1.9B pure作為對照組,與基座模型具有相同的參數和訓練策略,但過濾了所有指令相關數據,以驗證指令對性能的影響。此外,Index-1.9B chat是對話模型,基于基座模型通過SFT和DPO技術對齊;Index-1.9B character則在SFT和DPO基礎上引入RAG技術,實現快速角色扮演定制。
在B站15周年慶典上,董事長兼CEO陳睿透露,2023年B站AI相關內容的日均視頻播放量同比增長超過80%,內容涵蓋科普資訊、AI技術應用、數字人及創意應用等熱門領域。數據顯示,目前有超過8000萬用戶每月在B站觀看AI相關視頻,其中60%為00后用戶。