【ITBEAR】在RTE2024第十屆實時互聯網大會的舞臺上,聲網的首席科學家兼CTO鐘聲帶來了一場引人深思的演講。他深入探討了AI基礎設施的進化趨勢,以及AI應用在未來社會的廣泛前景。
鐘聲指出,隨著技術的進步,AI分身和AI助手將成為可能,它們能夠極大地緩解人們時間上的稀缺性,并提升生活的整體體驗。他特別強調了分布式端邊云結合的AI系統,這種系統將計算和傳輸在各節點進行合理配置,智能地根據任務需求進行編排,從而降低成本,提高效率。
在探討信息傳播與消費的歷史演變時,鐘聲提到了印刷技術如何改變人類歷史的走向,以及互聯網如何進一步提升了信息傳播的效率和范圍。他認為,現在我們正處于一個新時代,生成式AI的快速發展正打破內容生成的瓶頸,為用戶帶來更加個性化和沉浸式的體驗。
鐘聲也坦誠地談到了當前AI大模型面臨的挑戰,包括高昂的成本、隱私保護的問題以及用戶體驗的局限性。他提出,分布式端邊云結合的AI系統正是解決這些問題的關鍵。這種系統不僅能有效降低成本,還能在技術機制層面為隱私數據提供更好的保護,并優化用戶體驗。
在演講中,鐘聲還現場演示了一個由STT、LLM、TTS、RTC四個模塊組成的端邊結合實時對話AI智能體。這個智能體在復雜的噪聲環境下表現出了出色的對話能力,展示了實時AI對話技術的巨大潛力。
鐘聲還探討了未來AI基礎設施的要素,包括允許多云策略、深度異構計算模型的優化,以及生成式視頻模型的新思路。他強調,這些技術的發展將極大地拓展AI的應用范圍,并提升用戶體驗。
最后,鐘聲以meta最新推出的AR眼鏡Orin為例,展望了未來端設備的多樣化和能力提升將如何推動AI技術的普及和應用。他相信,隨著AI技術的不斷發展和優化,我們將能夠利用AI分身和AI助手更有效地服務和幫助人們,從而創造更加美好的未來。