前言:實(shí)時(shí)音視頻 RTC(Real-Time Communication),是新冠疫情黑天鵝事件中快速普及并崛起的技術(shù)與行業(yè)。資本加碼,爆款應(yīng)用,讓實(shí)時(shí)音視頻的想象空間被放大。安全可靠的全球互聯(lián)網(wǎng)通信云廠商融云CTO任杰近期接受了媒體采訪,對(duì)于RTC技術(shù)關(guān)鍵點(diǎn)、創(chuàng)新的使用場(chǎng)景有哪些,未來RTC將引爆什么行業(yè),開發(fā)者的機(jī)會(huì)又在哪里,闡述了自己的看法。
融云CTO 任杰
RTC的新挑戰(zhàn)
在RTC普及之前,高大上的視頻會(huì)議和電視電話會(huì)議,需要用到專網(wǎng)和專有硬件。大概在2012年前后,隨著3G、4G網(wǎng)絡(luò)的建設(shè)和WiFi普及,RTC技術(shù)開始進(jìn)入互聯(lián)網(wǎng)。不過,任杰提到,各種手機(jī)、PC等設(shè)備都開始進(jìn)入了互聯(lián)網(wǎng)的視頻通信領(lǐng)域,設(shè)備變得不可控。另外,從專有網(wǎng)絡(luò)變成了廣域網(wǎng)和互聯(lián)網(wǎng)以及無線網(wǎng)絡(luò)、4G網(wǎng)絡(luò),網(wǎng)絡(luò)也變得不可控。
“PC不是為了通信這個(gè)場(chǎng)景進(jìn)行的設(shè)計(jì),所以在回聲消除、降噪、視頻采集編碼層面都有不同的處理,有很多設(shè)備適配、算法的重新適配,大量細(xì)碎的功能要去做;手機(jī)在無線網(wǎng)絡(luò)下,丟包和帶寬會(huì)有瞬時(shí)變化,這些是新場(chǎng)景下面臨的新問題,我們要重新去解決它,用新算法、新模式去處理它。”任杰說。
2021年初,W3C(萬維網(wǎng)聯(lián)盟)和IETF(互聯(lián)網(wǎng)工程任務(wù)組)宣布WebRTC成為官方標(biāo)準(zhǔn),任杰認(rèn)為WebRTC被標(biāo)準(zhǔn)化組織接納認(rèn)可,但并不代表著RTC的技術(shù)已經(jīng)成熟。“一個(gè)行業(yè)如果在持續(xù)爆發(fā)和持續(xù)高發(fā)展階段,我們很難說它的技術(shù)是成熟的,因?yàn)閳?chǎng)景越來越多,運(yùn)用的設(shè)備技術(shù)也越來越多。音視頻編碼在不斷變化,新場(chǎng)景下的網(wǎng)絡(luò)對(duì)抗、機(jī)器學(xué)習(xí)、降噪技術(shù),都在持續(xù)井噴的發(fā)展過程中。”任杰如是說。
新的技術(shù)、場(chǎng)景,也帶來了新的挑戰(zhàn)。任杰總結(jié)了四個(gè)融云在現(xiàn)階段面臨的RTC挑戰(zhàn):
1、高清視頻:隨著WiFi和5G等基礎(chǔ)設(shè)施的升級(jí),用戶對(duì)音視頻質(zhì)量要求更高,融云會(huì)跟隨新的編碼標(biāo)準(zhǔn)去提供高質(zhì)量、高碼率、高幀率的視頻體驗(yàn)。
2、語音還原度:傳統(tǒng)算法已經(jīng)不能滿足現(xiàn)有高質(zhì)量、高還原度的使用體驗(yàn)與要求,RTC將與AI結(jié)合,研發(fā)降噪、提升智能分辨率、提高整體視覺清晰度的技術(shù),這是融云RTC技術(shù)研發(fā)的一大方向。
3、大量智能設(shè)備適配:除了安卓,將有大量實(shí)時(shí)操作系統(tǒng)RTOS設(shè)備進(jìn)入RTC領(lǐng)域,而這些設(shè)備有些配置較低,標(biāo)準(zhǔn)參差不齊,都需要RTC廠商做好適配,保證交互體驗(yàn)。
4、全球節(jié)點(diǎn)部署,服務(wù)出海開發(fā)者:互聯(lián)網(wǎng)市場(chǎng)的人口紅利在逐漸消失,出海開發(fā)者的音視頻業(yè)務(wù)需求量很大,融云在做全球節(jié)點(diǎn)的部署,以及更好的調(diào)度算法,確保全球任何一個(gè)地方、任何一種方式接入,都有優(yōu)越的音視頻體驗(yàn)。
RTC的三大創(chuàng)新場(chǎng)景
雖然疫情讓RTC極大普及,但是任杰認(rèn)為,疫情本身并未創(chuàng)造新的RTC場(chǎng)景,而是推動(dòng)了音視頻在各類場(chǎng)景和行業(yè)落地,加速了RTC發(fā)展進(jìn)程。
他舉例說明,在線教育毫無疑問是疫情中被推動(dòng)與廣泛落地的RTC場(chǎng)景。除了k12(kindergarten through twelfth grade,學(xué)前教育至高中教育的縮寫,代指基礎(chǔ)教育)的在線課程外,現(xiàn)在素質(zhì)教育也在向線上遷移。不過與基礎(chǔ)教育不同的是,素質(zhì)教育涉及經(jīng)驗(yàn)的傳遞和指導(dǎo),是更加個(gè)人化的過程,例如音樂、繪畫,過程要求比較高。RTC技術(shù)與使用體驗(yàn)感的提升,將有助于素質(zhì)教育的在線化進(jìn)程。
教育的另一個(gè)創(chuàng)新場(chǎng)景是在線考試,考試一直是嚴(yán)肅的事,過程控制更加嚴(yán)格。而因?yàn)橐咔橛绊懀荚囈查_始線上化,例如考場(chǎng)設(shè)前置攝像頭、后置攝像頭,并全程錄像,方便監(jiān)督和考試后抽查。
除了教育,任杰提到第二個(gè)RTC創(chuàng)新場(chǎng)景將是強(qiáng)互動(dòng)型與娛樂應(yīng)用。電商直播、共享電影、線上拍賣、3D虛擬形象的語音社交、在線合唱等等,這些強(qiáng)互動(dòng)型應(yīng)用將會(huì)越來越多,值得開發(fā)者從產(chǎn)品層面發(fā)揮想象力。
第三個(gè)創(chuàng)新場(chǎng)景在行業(yè)應(yīng)用中,疫情之后需要“無接觸服務(wù)”各個(gè)行業(yè),包括政府辦事、金融、保險(xiǎn)、交通、海關(guān)等等領(lǐng)域,都在將辦事、審批服務(wù)過程轉(zhuǎn)向線上,這些也是RTC非常重要的新場(chǎng)景。
當(dāng)AI遇見RTC
對(duì)于RTC和AI、5G等新技術(shù)的融合趨勢(shì),任杰分別介紹了AI技術(shù)對(duì)音視頻領(lǐng)域四類問題的解決辦法。
AI智能降噪。比如在線教育場(chǎng)景下,(老師/學(xué)生)敲擊鍵盤、倒水、咳嗽的聲音,過去的算法對(duì)這些非穩(wěn)態(tài)噪音無能為力,而AI技術(shù)可以分辨的場(chǎng)景和分辨的噪聲更多,將幫助RTC在降噪方面有較大提升;
AI超分處理。在相同帶寬下傳輸?shù)囊曨l圖像,利用AI技術(shù)可以使其在解碼還原后較之前更加清晰;
利用AI技術(shù)把不同的視頻場(chǎng)景或者音頻場(chǎng)景分辨與分開。對(duì)于靜態(tài)場(chǎng)景編碼、清晰度和幀率的控制,對(duì)于動(dòng)態(tài)場(chǎng)景下編碼和幀率的控制,用AI技術(shù)都可以將其區(qū)分開,做不同的處理;以及用AI技術(shù)重構(gòu)帶寬估計(jì)的算法。
對(duì)于更遠(yuǎn)的未來,在全真互聯(lián)網(wǎng)時(shí)代,任杰表示,音視頻從采集到編碼、傳輸、解碼、渲染、互動(dòng)的整個(gè)過程,將是全真互聯(lián)網(wǎng)必須具備的一大塊能力,而RTC有望成為全真互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施。