來(lái)源:中國(guó)電商物流網(wǎng) 發(fā)布時(shí)間:2019-5-23 8:34
5月21日—23日,2019騰訊全球數(shù)字生態(tài)大會(huì)在昆明召開(kāi),來(lái)自騰訊音視頻實(shí)驗(yàn)室的專家研究員商世東帶來(lái)了題為《面向產(chǎn)業(yè)互聯(lián)網(wǎng)的音視頻技術(shù)發(fā)展展望》的主題演講,從音視頻國(guó)際標(biāo)準(zhǔn)、客觀和主觀質(zhì)量評(píng)估、音視頻體驗(yàn)深度優(yōu)化、以及音視頻技術(shù)與5G和人工智能展望等四個(gè)方面,分享了產(chǎn)業(yè)互聯(lián)網(wǎng)大背景下,騰訊音視頻實(shí)驗(yàn)室對(duì)音視頻技術(shù)發(fā)展的思考與探索。
“5G的推出和AI的突破性進(jìn)展促進(jìn)音視頻體驗(yàn)的極大提升”,商世東介紹,在移動(dòng)互聯(lián)網(wǎng)比重逐漸提升的今天,實(shí)驗(yàn)室持續(xù)深耕音視頻技術(shù),以個(gè)性化用戶訴求為核心,帶來(lái)音視頻技術(shù)的深度優(yōu)化和沉浸式體驗(yàn)。
(騰訊音視頻實(shí)驗(yàn)室高級(jí)總監(jiān)、資深專家研究員 商世東)
產(chǎn)業(yè)互聯(lián)網(wǎng)時(shí)代,騰訊音視頻實(shí)驗(yàn)室逐漸清晰的國(guó)際標(biāo)準(zhǔn)化研究與制定
以往,提到音視頻技術(shù)標(biāo)準(zhǔn)時(shí),高通、三星、愛(ài)立信、諾基亞、LG、華為、聯(lián)發(fā)科這些起步較早的企業(yè)總會(huì)第一時(shí)間被行業(yè)所提及,但在2016年11月,騰訊音視頻技術(shù)中心正式升級(jí)為騰訊音視頻實(shí)驗(yàn)室后,騰訊也成為了音視頻標(biāo)準(zhǔn)領(lǐng)域舉足輕重的玩家。
據(jù)商世東介紹,在音視頻標(biāo)準(zhǔn)領(lǐng)域的重大國(guó)際會(huì)議中,騰訊音視頻實(shí)驗(yàn)室的提案總數(shù)位居前列。去年4月份,在美國(guó)圣迭戈召開(kāi)的國(guó)際多媒體標(biāo)準(zhǔn)盛會(huì)MPEG 122上,騰訊音視頻實(shí)驗(yàn)室代表騰訊公司正式亮相視頻編解碼國(guó)際標(biāo)準(zhǔn)會(huì)議并展示成果,并深度參與到標(biāo)準(zhǔn)的制定過(guò)程中。
隨著騰訊公司整體戰(zhàn)略升級(jí),為積極響應(yīng)扎根消費(fèi)互聯(lián)網(wǎng),擁抱產(chǎn)業(yè)互聯(lián)網(wǎng)的號(hào)召,音視頻實(shí)驗(yàn)室在多媒體領(lǐng)域之外,致力于各項(xiàng)行業(yè)標(biāo)準(zhǔn)的制定。目前,騰訊音視頻實(shí)驗(yàn)室不僅已經(jīng)有近30項(xiàng)提案被下一代視頻編碼標(biāo)準(zhǔn)VVC/H.266采納,在DASH(Dynamic Adaptive Streaming over HTTP)、OMAF(Omnidirectional Media Format)、PCC(Point Cloud Compression)、CMAF (Common Media Application Format)、NBMP (Network-Based Media Processing)等相關(guān)多媒體標(biāo)準(zhǔn)中也取得多項(xiàng)標(biāo)準(zhǔn)核心專利,并擔(dān)任包括主席在內(nèi)的重要席位。而針對(duì)國(guó)家標(biāo)準(zhǔn)AVS2,騰訊也進(jìn)行了相關(guān)布局。值得一提的是,王者榮耀也被正式納入視頻編解碼標(biāo)準(zhǔn)測(cè)試序列級(jí)。音視頻實(shí)驗(yàn)室已成為國(guó)際行業(yè)標(biāo)準(zhǔn)不可忽視的影響者和領(lǐng)導(dǎo)者。
面向未來(lái),騰訊音視頻實(shí)驗(yàn)室將繼續(xù)深耕視頻相關(guān)標(biāo)準(zhǔn)制定和商業(yè)化以及基于對(duì)象的音頻標(biāo)準(zhǔn)和商業(yè)化。同時(shí),在點(diǎn)云壓縮以及360VR壓縮和傳輸上,也有著清晰而周到的布局。
個(gè)性化用戶訴求下,騰訊音視頻實(shí)驗(yàn)室?guī)?lái)音視頻體驗(yàn)的深度優(yōu)化
隨著移動(dòng)互聯(lián)網(wǎng)比重不斷提升,4G網(wǎng)絡(luò)也即將展開(kāi)向5G高速迭代的變革,用戶對(duì)高質(zhì)量音視頻內(nèi)容的追求,對(duì)音視頻處理技術(shù)提出了更為嚴(yán)苛的要求。
“以往,我們對(duì)于音視頻內(nèi)容質(zhì)量的評(píng)價(jià)的方式,大體上‘各花入各眼’,而客觀評(píng)價(jià)也只能從技術(shù)指標(biāo)入手,并不能與人眼的評(píng)判標(biāo)準(zhǔn)進(jìn)行統(tǒng)一。”商世東演講的第二個(gè)重點(diǎn),則是AI的突破性進(jìn)展下,音視頻內(nèi)容客觀到主觀質(zhì)量評(píng)估的轉(zhuǎn)變。騰訊音視頻實(shí)驗(yàn)室通過(guò)對(duì)AI技術(shù)的合理運(yùn)用,實(shí)現(xiàn)了視頻的端到端所有環(huán)節(jié)統(tǒng)一對(duì)標(biāo)人眼評(píng)價(jià)整體目標(biāo)的技術(shù),能夠完成基于人眼評(píng)價(jià)的客觀無(wú)參考評(píng)估標(biāo)準(zhǔn),以及模擬人耳主觀體驗(yàn)的全面評(píng)測(cè)系統(tǒng),能夠在音頻的聲學(xué)指標(biāo)、網(wǎng)絡(luò)指標(biāo)及物理環(huán)境下對(duì)信號(hào)的客觀和主觀質(zhì)量進(jìn)行全面詳細(xì)的評(píng)估,這在整個(gè)音視頻行業(yè)里也是首開(kāi)先河。
(騰訊音視頻實(shí)驗(yàn)室基于主觀感受的音視頻體驗(yàn)的深度優(yōu)化)
商世東指出,移動(dòng)互聯(lián)網(wǎng)時(shí)代,娛樂(lè)、教育、即時(shí)通信等不斷細(xì)分的垂直領(lǐng)域帶來(lái)了多元化的音視頻場(chǎng)景,用戶所使用的軟硬件環(huán)境愈發(fā)復(fù)雜,催生了更加個(gè)性化的用戶訴求。為了滿足不同用戶的個(gè)性化訴求,騰訊音視頻實(shí)驗(yàn)室通過(guò)智能的用戶調(diào)度策略、高質(zhì)量鏈路的傳輸以及靈活的流控政策,從用戶角度出發(fā),實(shí)現(xiàn)了基于主觀感受的音視頻體驗(yàn)的深度優(yōu)化。
直面5G時(shí)代,技術(shù)創(chuàng)新打造沉浸式音視頻體驗(yàn)
在演講的最后,商世東表示,面向即將到來(lái)的5G時(shí)代“大容量、高速率、低延遲”的網(wǎng)絡(luò)特性,騰訊音視頻實(shí)驗(yàn)室也做好了充分的準(zhǔn)備,通過(guò)大數(shù)據(jù)、智能網(wǎng)絡(luò)結(jié)構(gòu)以及調(diào)度和資源優(yōu)化,為用戶帶來(lái)極具5G時(shí)代色彩的沉浸式音視頻體驗(yàn);同時(shí),騰訊將音頻通信與機(jī)器學(xué)習(xí)進(jìn)行了深度融合,實(shí)現(xiàn)了網(wǎng)絡(luò)/硬件的自動(dòng)分析與適配、內(nèi)容的情緒識(shí)別/合成與轉(zhuǎn)換以及降噪/增強(qiáng)和3D空間渲染的功能。
(5G時(shí)代的音視頻通信技術(shù)展望)
自成立以來(lái),騰訊音視頻實(shí)驗(yàn)室專注于音視頻通信技術(shù)的前瞻性研究,包括全球?qū)崟r(shí)音視頻網(wǎng)絡(luò)優(yōu)化、音視頻編解碼前沿算法研究、音視頻國(guó)際標(biāo)準(zhǔn)、計(jì)算機(jī)視覺(jué)圖像處理、基于AI的音頻語(yǔ)音增強(qiáng)、聲音美化及音視頻質(zhì)量評(píng)測(cè)等。在服務(wù)于騰訊社交體系下的海量用戶同時(shí),在實(shí)時(shí)音視頻通信、圖像處理和音視頻處理等技術(shù)領(lǐng)域積累了十幾年的研究經(jīng)驗(yàn),擁有行業(yè)領(lǐng)先的技術(shù)水平。
在互聯(lián)網(wǎng)全球化的浪潮之下,兼具研發(fā)實(shí)力以及對(duì)用戶需求深入探尋的騰訊音視頻實(shí)驗(yàn)室,將努力打造更多具備國(guó)際影響力的標(biāo)準(zhǔn)技術(shù),進(jìn)一步提升“中國(guó)智造”在全球市場(chǎng)的話語(yǔ)權(quán)。