今年以來,疫情讓互動(dòng)課堂、線上會(huì)議、連麥等實(shí)時(shí)互動(dòng)的場(chǎng)景迅速升溫,數(shù)千萬(wàn)、數(shù)億人的同時(shí)在線本來對(duì)網(wǎng)絡(luò)就是一場(chǎng)巨大的考驗(yàn),低延遲直播更對(duì)算力和網(wǎng)絡(luò)提出前所未有的挑戰(zhàn)。
作為在視頻云領(lǐng)域一流的技術(shù)服務(wù)提供商,金山云不斷在低延遲算法上進(jìn)行探索優(yōu)化,讓碼率帶寬更加節(jié)省。
低延遲深度算法優(yōu)化 帶寬壓縮12%~17%
眾所周知,低延遲直播需要具備較為苛刻的限制條件:1.帶寬受限且面臨弱網(wǎng)壓力;2.對(duì)延遲的要求高;3.視頻畫面中變化并不豐富。用戶對(duì)于編碼、分發(fā)、渲染的延遲和畫質(zhì)損失的感知越低體驗(yàn)越好,就需要結(jié)合著三個(gè)客觀條件進(jìn)行針對(duì)性的優(yōu)化。本文主要圍繞第三點(diǎn)來講述金山云低延遲直播的視頻編碼引擎算法優(yōu)化。
人眼具有視覺掩蔽效應(yīng),對(duì)于不同平坦度、紋理、運(yùn)動(dòng)速度的畫面內(nèi)容,人眼敏感度不同。在損失相同的信息量的條件下,相對(duì)平坦或者靜止區(qū)域的信息損失往往更容易被人眼察覺,而相對(duì)的紋理復(fù)雜或者更動(dòng)態(tài)區(qū)域的畫質(zhì)損失則更易被人忽視。這成為金山云低延遲直播編碼器優(yōu)化的理論依據(jù),有基于此,金山云從編碼器上對(duì)算法進(jìn)行了深度的優(yōu)化。
在碼率控制層面,很多編碼器都會(huì)在量化階段根據(jù)圖像的復(fù)雜度來進(jìn)行塊級(jí)別QP(Quant Param,量化參數(shù))值的調(diào)整,與它們不同的是,金山云則進(jìn)一步在像素級(jí)進(jìn)行QP的優(yōu)化。簡(jiǎn)單地講,在變換編碼階段之前根據(jù)人眼主觀在各像素的最大損失容忍度模型,調(diào)整像素殘差以減小圖像頻譜中的高頻分量值。優(yōu)勢(shì)在于能夠精細(xì)地保留像素級(jí)細(xì)節(jié),同時(shí)所生成的特征圖較為直觀且具備可解釋性,有利于后續(xù)調(diào)參,也使得其在編碼器層面變得可控。
在GOP(Group of Pictures,圖片組)層面,由于在同一個(gè)GOP序列內(nèi)的不同幀畫面具備不同的level(層級(jí)),level較高的幀會(huì)被其它level較低的幀所頻繁參考,這就意味著一旦高level的幀畫質(zhì)產(chǎn)生損失,就會(huì)造成漣漪效應(yīng),使得參考幀產(chǎn)生不同程度的畫質(zhì)損失(如圖2所示),但卻不會(huì)影響其碼率。
基于此,金山云將一個(gè)GOP內(nèi)的所有幀的畫質(zhì)損失表示成率失真優(yōu)化問題,以幀間依賴關(guān)系作為中間變量,將幀間依賴系數(shù)轉(zhuǎn)化為失真系數(shù),在一定的參數(shù)空間內(nèi)尋找最合理的量化參數(shù),從而保證在一定的碼率約束條件下得到最優(yōu)的編碼參數(shù)以獲得更好的畫質(zhì)。
經(jīng)過在碼率控制和GOP層面一系列的編碼算法優(yōu)化后,金山云低延遲視頻編碼引擎在獲得相同主觀畫質(zhì)感受的前提下,能夠?qū)拤嚎s12%~17%。
下一代編解碼+集智高清加速低延遲直播體驗(yàn)升級(jí)
不僅如此,在編解碼方面,金山云是業(yè)內(nèi)為數(shù)不多的覆蓋從編碼、轉(zhuǎn)碼到解碼全鏈路支持x265的服務(wù)廠商。經(jīng)過五年時(shí)間打磨,金山云KSC265產(chǎn)品除了支持手機(jī)移動(dòng)端、PC全機(jī)型,還獨(dú)家支持Web端播放。在碼率控制、碼率分配、自適應(yīng)量化上,KSC265可實(shí)現(xiàn)30%-50%帶寬成本節(jié)省。今年4月份,金山云正式上線的直播AI集智高清產(chǎn)品,在同等畫質(zhì)下壓縮率最高可達(dá)50.65%。
此外,金山云投入大量的人力、物力,不斷地進(jìn)行著基于AV1標(biāo)準(zhǔn)的下一代編碼器--KAV1的研發(fā)。相較于KSC265的基線水平,KAV1能夠繼續(xù)增加10%以上的壓縮率,并將于近期發(fā)布可商用版本。
目前,金山云擁有兩個(gè)大型轉(zhuǎn)碼中心,支持10萬(wàn)路直播轉(zhuǎn)碼并發(fā)及百萬(wàn)級(jí)點(diǎn)播轉(zhuǎn)碼并發(fā),可隨時(shí)開啟KSC265和集智高清服務(wù),以完善的轉(zhuǎn)碼基礎(chǔ)架構(gòu)和高效率的轉(zhuǎn)碼技術(shù),為客戶業(yè)務(wù)提供保障。
當(dāng)然,對(duì)于帶寬受限、弱網(wǎng)等環(huán)境,金山云也提供QUIC、CMAF等技術(shù)支撐。金山云擁有遍布全球多個(gè)國(guó)家的CDN分布節(jié)點(diǎn),是業(yè)內(nèi)較早在CDN節(jié)點(diǎn)實(shí)現(xiàn)RTMP、 HTTP+FLV、 HLS支持H.265的云服務(wù)企業(yè),并全面實(shí)現(xiàn)over QUIC推流和拉流的CDN廠商。同時(shí),金山云CDN還支持直播多流擇優(yōu)方案,提供穩(wěn)定的性能、透明的數(shù)據(jù)服務(wù)體制。
未來,隨著在低延遲直播編解碼技術(shù)上的不斷提升優(yōu)化,金山云將致力于為用戶打造高品質(zhì)的直播互動(dòng)體驗(yàn),并和業(yè)界同仁一起推動(dòng)視頻產(chǎn)業(yè)的快速發(fā)展。