【ITBEAR】在近日落幕的2024國際多媒體會議(ACM MM 2024)上,中國人民大學高瓴人工智能學院與值得買科技聯合研究團隊展露鋒芒。團隊代表王希華發表了關于多模態領域最新研究成果《TiVA:時序同步的視頻到音頻生成》的口頭報告,揭示了解決視頻到音頻同步生成技術難題的新路徑。
TiVA框架通過創新的音頻布局使用,不僅提升了AIGC內容生成的速度與質量,更在語義匹配和時間同步精度上實現了突破,獲得國家發明專利授權,成為多媒體領域的一大亮點。
該研究團隊還展示了另外兩項成果:面向電商領域的共享基座檢索增強架構(BSharedRAG)與多模態知識增強的視覺信息查詢架構(MuKA)。其中,BSharedRAG架構已被國際頂尖會議EMNLP2024錄用,彰顯了其在自然語言處理與人工智能領域的領先地位。
值得買科技CTO王云峰表示,這些研究成果不僅推動了公司業務的提質增效,更為整個電商行業的智能化升級貢獻了力量。通過與人大高瓴的深入合作,值得買科技正逐步構建起強大的AI技術壁壘,并致力于將科技成果與行業經驗開放共享,推動行業的持續繁榮。
BSharedRAG架構的開源評測集更是為行業提供了一個統一的基準,助力研究者在不同研究工作之間進行效果對比,推動了電商領域AI技術的標準化與透明化發展。
隨著全面AI戰略的深入實施,值得買科技將繼續攜手合作伙伴,在產學研用一體化進程中不斷探索AI技術的更多可能性,為消費者帶來更加智能、高效的購物體驗。