在 QCon 全球軟件開發大會 2022·上海站上,一場特殊的專題吸引了與會者的目光。與其他以個人身份參與的出品人不同,《融合通信技術探索與 AI 技術商業化實戰》這一專場的出品人是一個略顯神秘的“技術俱樂部”——網易智企技術委員會。
設立 7 大分委會,專注前沿技術的協同式創新
網易智企技術委員會是由網易智企內部各個事業部研發代表組成的全公司技術工作的保障機構和技術標準審議機構。委員會為提升網易智企研發組織效能而生,專注于前沿技術的協同式探索,以提升企業自我創新能力和產品開發能力為宗旨,促進公司技術進步,下設有音視頻、大前端、服務端、大數據、AI、QA 和效能七大分委會,是推動網易智企整體技術實力增長的重要驅動力量。
網易智企技術委員會自成立以來,已取得了一系列成果。以開源協同為例,網易智企于今年推出了一項“易+”開源計劃,并先后開源了網易會議組件、低延時直播方案、GameSentry 工具。其中,網易會議組件能幫助各行各業用戶快速構建穩定可靠、高清易用的專屬會議系統;低延時直播方案成為業界首個開源的低延時直播方案,推動著直播行業的整體發展;GameSentry 則是游戲安全戰場的“哨兵”,守護游戲安全的第一道防線。
這是網易智企技術委員會協同共創的一個縮影,將內部技術和經驗轉化為外部生產力,促進內部研發效能提升,推動業務快速發展。在 QCon 上海站,網易智企技術委員會首次化身為專題出品人,暢談融合通信技術與 AI 商業化最佳實踐。
暢談融合通信技術與 AI 商業化最佳實踐
云通信技術創新與人工智能技術實踐是網易智企長期深耕的重要技術領域,也是業內高度關注的技術熱點。本次專題由網易智企技術委員會與 InfoQ 聯合打造,圍繞融合通信技術的落地實踐與 AI 技術商業化實踐兩大主題,邀請了來自網易智企的四位專家,分別分享 AI 生產增效、新型 IM 系統建設與優化、4K/8K RTC 技術、AI 賦能 SaaS 場景等主題,贏得了現場觀眾的熱情參與互動和廣泛好評。
AI 服務效率升級,在智能數字內容風控中實踐 AI 生產增效
音視頻等感知類人工智能算法在實際業務應用過程中,標注數據的收集與積累、模型的訓練與調優、線上服務部署與管理等生產過程的效率仍待提升。隨著應用的深入與規模的擴大,生產效率已經成為人工智能商業化過程中的關鍵因素。本場專題論壇上,網易智企算法專家李雨珂博士帶來了題為《AI 服務效率升級,在智能數字內容風控中實踐 AI 生產增效》的演講,分享網易易盾如何通過技術驅動效率升級來生產出更普惠的人工智能服務能力。
李雨珂博士表示,基于 AI 的數字內容風控技術發展歷經坎坷。網易易盾經過長期算法調優和技術沉淀,逐漸積累了很好的數據收集渠道、硬件部署能力、算法定制方案等資源,如今已經達到了出色的實用效果。最近,團隊將工作重心更多轉移到了 AI 生產效率優化方面,并在數據獲取、算法方案與服務部署三大層面積累了充足的經驗。
在數據獲取方面,網易易盾升級了數據流程,在流程前期通過學習方式的改進尋找更有效的標注方法,之后通過多模態融合和跨模態檢索等方式提升數據的收集效率,最后基于這些數據的特點設計更優異的訓練方法。在數據生成方向,網易易盾還會同其他圖文生成方向的團隊做聯動研究。
算法方案部分,團隊區分了簡單案例和復雜案例,分別采取對應的處理方案,例如復雜案例會進入更深層次的網絡做更精細的判斷。團隊還發展了一體化的解決方案,引入了弱監督方法與二次識別判斷。訓練方法也做了對應設計,通過聯合訓練保障了較好的學習連續性。
服務部署層面,團隊通過動態輸入與多實例操作大幅提升了整體計算性能,再結合 GPU 計算優化等手段控制了硬件投入成本。總結而言,網易易盾基于動態和細粒度的思想來做了數據收集整理、網絡推理和服務調度,實現了生產增效的目標。
未來,網易易盾會繼續改進服務加速框架,改善多模態方案,并提升知識融合能力,希望能在面對新的業務需求時快速發展對應的生產能力,并將這些技術成果反饋給社區和更多用戶。
新型 IM 系統建設和呼叫場景優化的探索和實踐
在業務出海熱潮背景下,行業對通信技術的深度融合與優化提出了更高要求。與此同時,IM 即時通訊業務也產生了新的形態,需要通信云廠商發展對應的解決方案。本專題論壇上,網易云信服務器開發專家曹佳俊發表了題為《新型 IM 系統建設和呼叫場景優化的探索和實踐》的分享,介紹網易云信在呼叫場景優化、類 Discord 系統建設等方面的技術探索和落地實踐。
曹佳俊介紹,呼叫是融合通信的典型應用場景之一,涉及業務非常廣泛,非常值得進行深入優化。呼叫能力的優化痛點主要有提升呼叫的到達率/接通率,以及降低呼叫的延遲/首屏時長。
針對前者,網易云信通過在線實時通知、離線推送、自定義通道和運營商線路四板斧,全面提升了呼叫到達率;
針對后者,通過分析呼叫的流程和各流程的特點和耗時分布情況,針對呼叫信令服務器、RTC調度服務器和 RTC媒體服務器分別采取了不同的優化策略,從而降低了呼叫延遲,提升了首屏速度。
與此同時,面向跨國/出海場景,網易云信還通過對呼叫信令服務器進行技術架構升級,通過服務下沉和邊緣直連等多種技術手段,優化了出海場景的呼叫信令服務器的呼叫延遲。
網易云信還探索開發了類 Discord 的 IM 圈組產品的 PaaS 能力。團隊設計的圈組產品與 Discord 類似,使客戶能夠很簡單快速地接入服務。
曹佳俊認為,圈組系統不同于傳統的群組和聊天室,他已經不僅僅是一個簡單的新型 IM 系統,更是一個復雜的社群系統;在技術上,同樣也有一些新的挑戰,包括以下關鍵系統的建設:成員關系系統、消息系統、身份組權限系統等。
圈組和 RTC 的融合也是圈組系統建設中的重要一環,兩者的融合不僅僅是業務上的融合,更需要底層技術的打通。網易云信通過 QChatMedia 這樣的插件化的模塊來引入 RTC 能力,用戶可以按需選擇;此外,通過底層打通賬戶系統、關系鏈、權限系統、房間/信令等,從而避免業務方在上層進行復雜的業務邏輯封裝。
曹佳俊最后表示,融合通信是一個很廣泛的概念,今天只是選取了呼叫和圈組兩個點進行了介紹,網易云信未來將不斷打磨技術,努力提供更優質的通訊服務,伴隨客戶一同成長。
4K/8K RTC 技術探索及實踐
隨著通信技術發展成熟,4K/8K 超高清實時音視頻通信技術業已成熟,行業需求紛至沓來。云游戲、遠程協作、遠程醫療等業務都需要低延時、高流暢的 4K/8K RTC 技術支持。專題論壇上,網易云信音視頻引擎開發專家朱明亮在題為《4K/8K RTC 技術探索及實踐》的分享中總結了網易云信視頻引擎在這一領域的成果經驗。
目前,行業對 4K/8K 超高清通信技術的需求主要集中在云游戲、遠程醫療、遠程協作幾個方面。網易云信針對行業需求開發了新一代音視頻 SDK 架構,而 4K/8K 主要涉及上行 Pipeline 的改造,優化點集中在桌面捕捉、攝像頭采集、前處理、編碼、VQC 幾個層面。
4K RTC 在桌面端針對 Windows 和 Mac 平臺落地。網易云信設計了兩大平臺的硬件編解碼實現,優化了桌面捕捉流程。具體的優化層面包括屏幕共享模塊、視頻前處理、 大小流(Simulcast)機制、視頻質量控制(VQC)策略、網絡和服務端等。經過優化,桌面端 4K 60 幀捕捉的 CPU 消耗降到 15%,GPU 編碼消耗約 73%,可實現穩定 的 60fps 采集、編碼和發送。
網易云信還應客戶要求,進一步探索和實現了 8K RTC 攝像頭采集流程。團隊優化了攝像頭捕捉模塊和常規的實現方案,優化后在 Intel 集顯平臺上達到了 8K@20 fps 的實際編碼發送能力。進一步提出新方案,攝像頭直接發送原始碼流,同時充當采集和編碼模塊,可提升8K RTC的流暢度,且能自適應網絡。VQC 模塊直接作用到 Camera 模塊,可控制攝像頭的分辨率、幀率、碼率等參數,還加入了關鍵的 IDR request 功能,使實時會議中新加入的用戶無需等待即可看到畫面。
網易云信與新華三共同打造的“醫科通”產品,已落地到了多家三甲醫院,滿足了多科室遠程會診、跨院遠程診療等業務需求。朱明亮最后表示,網易云信的 4K RTC 技術已經可以滿足客戶對 4K@ 60 fps 的業務需求,而 8K RTC 技術未來將同合作伙伴共同開拓更多極致高清商業場景。
AI 技術如何賦能服務營銷一體化 SaaS 場景
近兩年,AI 普遍應用于企業與消費者溝通的場景,但在利用 AI 輔助營銷和服務客戶的過程中,看到成效的并不多。本專題論壇的最后,網易云商自然語言處理專家馮旻偉帶來了題為《AI 技術如何賦能服務營銷一體化 SaaS 場景》的分享,聚焦于智能服務和營銷行業面臨的挑戰,以及 AI 技術賦能企業變革和業務創新的路徑。
馮旻偉認為,AI技術在SaaS行業中的落地在當前形勢下正面臨瓶頸,需要更加關注客戶自身痛點和需求。總結而言,客戶主要面臨AI技術不夠成熟、建設成本高、應用門檻高這三大問題。網易云商給出的對應解決方案就是通過 AI 降本增效、拓展行業邊界和加快業務出海速度。
AI 技術可以替代人類完成很多重復簡單任務,并協助人類執行復雜任務。例如智能客服機器人可以提取人工客服對話關鍵信息,構建知識庫,擴展機器人的自動回答能力,從而實現降本增效目的。AI 技術還可以利用數據分析挖掘海量信息的價值,協助客服部門從成本中心向利潤中心轉型。
在出海場景,網易云商通過 AI 技術提供了多語種處理能力,并協助客戶解決了海外智能客服場景接入的問題。
馮旻偉接下來總結了大模型技術和生成式 AI 兩大前沿 AI 技術為企業帶來的機遇。網易云商認為,由于大模型技術構建成本較高,中小企業難以負擔,因此 SaaS 場景中主要需要關注大模型的平民化和必要性。生成式 AI 是最近熱度非常高的另一大前沿技術。生成式 AI 可以應用在圖像生成、文本和語音生成等場景,對內容創作甚至整個 AI 產業都會產生深刻影響。例如,未來 AI 從業人員可以使用生成模型來生成大多數訓練數據。大幅減少數據的采集與購買成本。
總結來看,SaaS 行業正在面臨非常激烈的競爭,AI 技術要落地就需要證明自身能夠提供清晰的價值。馮旻偉認為,SaaS 服務方可通過上述三大發力點探索 AI 落地,并持續關注大模型技術和生成式 AI 技術的發展。
盡管 QCon 上海站《融合通信技術探索與 AI 技術商業化實戰》專場現場已落幕,網易智企會將本次專場的內容干貨更全面地分享給大家,歡迎持續關注。