當元宇宙、AIGC 等新技術、新概念推出后,也催生出實時互動場景更多創新的玩法和可能性。實時互動開發者在搭建新場景時,除了音視頻 API 以外,還需要視頻特效、實時變聲、語音轉文字、實時翻譯、內容審核等擴展能力的開發和集成,才能搭建最佳體驗感的場景玩法。而這些功能開發完成上線至少要耗時幾個月,會造成項目周期長、研發資源投入大,也可能會錯失產品的最佳市場驗證時間。
如何縮短研發路徑,幫助開發者高效集成場景所需實時互動能力?聲網云市場一直在致力于解決開發者的難題,打造了“實時互動開發者的 API 商店”,讓開發者在使用聲網 RTC 的同時,可以快速集成音視頻擴展能力,比如美顏、變聲、語音轉文字、實時翻譯、視頻審核、語音審核等等,讓開發者專注在業務邏輯和用戶體驗上,免去了音視頻集成模塊的諸多煩惱,加速搭建產品和商業化的全流程。
高效集成和豐富功能插件的背后,是聲網云市場全球頂尖合作伙伴的支撐。目前聲網云市場優選的實時互動領域伙伴包括相芯、商湯、火山引擎、依圖、圖普、科大訊飛、微軟、喜馬拉雅、大餅引擎、Voicemod、Banuba、DeepAR 等,提供插件覆蓋能力包括視頻特效、音頻特效、語音轉文字、內容審核等,開發者可以自主選擇不同品牌、不同場景以及不同客戶端平臺的插件,來滿足各種業務場景的需求。
以往,音視頻開發者需要花費大量的時間選型、比價、測試、集成音視頻能力,導致應用的整體開發周期較長。現在,開發者可以在聲網云市場上一站式進行選型、比價、測試、集成各類音視頻插件,通過 3 個標準 API, 快速集成音視頻擴展能力,之前可能需要 120 個小時開發的項目能縮短至 2.5 個小時,節省了 95% 的集成時間,輕松構建豐富多樣的音視頻場景,讓開發者更加專注于業務邏輯和用戶體驗。
不僅如此,實時互動應用開發過程中,往往會遇到一系列的音視頻體驗問題,比如:音畫不同步、黑屏、卡頓、機型適配、性能、模塊接入難、線程調度繁瑣、回聲、嘯叫、雙通道多通道等技術難點。聲網作為國內領先的實時互動 API 服務商,把 RTE 擴展能力集成的最佳工程實踐提供了出來,一次性地為開發者解決了以上所有這些問題。“聲網云市場的愿景就是將聲網提供的實時互動技術服務與行業更多的技術能力做更緊密的整合,把開發一個實時互動應用要做的 N 件事盡可能的變成 1 件事,我們也希望聲網的實時互動能力就像一顆大樹的樹根,以聲網為基礎設施,我們會源源不斷地為實時互動領域提供營養和水分,為開發者提供無窮無盡的實時互動能力。讓下一個現象級的實時互動應用,可以在這個生態里不斷萌發。”聲網云市場負責人柏聞表示。
客戶證言:
——某泛娛樂電競陪玩客戶,需要連麥場景下,準確檢測音頻違規風險、以及定制化的審核方案,使用依圖音頻審核插件:
“幾經比較,我們選擇了在聲網云市場接入數美語音審核插件。相比自行對接各種功能,插件集成的方式減輕了一部分研發負擔,集成快,降低了新功能的開發成本。”
——某出海社交客戶,需要準確的識別頻道內多語種的音頻進行轉寫,并準確、迅速的翻譯,使用微軟轉寫&翻譯插件:
“我們使用了聲網云市場上的微軟實時轉寫&翻譯插件,幾天內就完成了插件集成,讓 App 迅速在越南、土耳其、西班牙等 21 個國家的 App 上線運營。開發過程中,插件很易用,統一跟聲網結算也省去了我們很多煩惱。”
——某海外社交客戶,需要在直播常間加入美膚、美型、美妝、手勢表情識別、濾鏡貼紙等需求,使用相芯美顏插件:
“實際集成的時間少于一周。如果我們不升級聲網 SDK 4.0.0,用裸數據的方式去集成,可能需要花費幾個月的時間。”