來源:中國電子報 發(fā)布時間:2021-11-17 9:28
編者按:10月19日至20日,由工業(yè)和信息化部、江西省人民政府共同主辦的2021世界VR產(chǎn)業(yè)大會云峰會在南昌召開。作為16個主題論壇之一的標準化主題論壇同期舉辦。該主題論壇由中國電子技術(shù)標準化研究院承辦,與會專家和企業(yè)家就虛擬現(xiàn)實標準化工作面臨的新發(fā)展格局,以及如何加強頂層設計,推進重點標準研制,引導產(chǎn)學研用單位聚焦標準研制進行了探討。為了讓讀者進一步了解本次論壇,本報特摘編嘉賓演講內(nèi)容,敬請關(guān)注。
全國音頻、視頻及多媒體系統(tǒng)與設備標準化技術(shù)委員會副秘書長趙曉鶯:
推動中國VR方案走向國際
過去幾年,我國在虛擬現(xiàn)實領域的標準化方面,首先構(gòu)建了綜合標準化的標準體系,制定了《加快推進虛擬現(xiàn)實產(chǎn)業(yè)發(fā)展》的指導意見,同時發(fā)布了虛擬現(xiàn)實白皮書。標準體系里涵蓋的主要內(nèi)容,包括VR領域相關(guān)的基礎通用標準、內(nèi)容制作標準、產(chǎn)品規(guī)范、接口協(xié)議、健康和舒適度評價、分發(fā)平臺安全與監(jiān)管,以及行業(yè)應用標準。我們在標準體系指導下,已經(jīng)完成14項國家標準和行業(yè)標準的發(fā)布,在研標準有7項,基本覆蓋從基礎到產(chǎn)品、接口、應用的需求。未來標準接口會變得越來越長,我們的標準工作還會動態(tài)持續(xù)下去。
未來我們的工作,一要提高標準研制水平,持續(xù)優(yōu)化完善標準體系,保持體系的先進性和科學性。加快組織制定急需緊缺標準,提高在研標準編制速度和技術(shù)水平;密切跟蹤國際標準化動態(tài),加大國際標準參與度,推動中國方案走向國際。二要提升公共服務能力,持續(xù)健全評測能力,開展行業(yè)測試驗證服務。開展VR產(chǎn)品全面摸底檢測和風險監(jiān)測,保證行業(yè)良性發(fā)展,保證用戶權(quán)益。定期發(fā)布VR產(chǎn)品質(zhì)量分析報告及相關(guān)技術(shù)報告。三要推動產(chǎn)業(yè)升級,加強標準落地實施。圍繞產(chǎn)業(yè)發(fā)展趨勢,助力構(gòu)建國內(nèi)產(chǎn)業(yè)生態(tài)。引導產(chǎn)業(yè)技術(shù)基礎能力提升,積極發(fā)展新技術(shù),開發(fā)新產(chǎn)品。
ISO/IEC JTC1/SC 24信息技術(shù)-計算機圖形圖像處理及環(huán)境數(shù)據(jù)表示分委會主席李明元:
開發(fā)更多有價值的虛擬現(xiàn)實領域標準
SC24是ISO/IEC標準化組織中,從事“計算機圖形、圖像處理和環(huán)境數(shù)據(jù)表示”的分技術(shù)委員會,伴隨著圖形計算系統(tǒng)問世和發(fā)展,成立至今已有30多年的歷史。自成立以來,SC24始終致力于開發(fā)與計算機圖形、圖像處理,環(huán)境數(shù)據(jù)表示,信息實現(xiàn)及交互的標準。
WG6是SC24歷史最悠久的工作組,已經(jīng)開發(fā)了許多標準,包括GKS(圖形內(nèi)核系統(tǒng))、HIGS(程序員的分層交互圖形系統(tǒng))、RPEMO(多媒體對象的表示環(huán)境)、X3D(可擴展3D)、ARC等。目前,許多與3D圖形、建模和動畫相關(guān)的工作仍在持續(xù)開展。近幾年,在3D和VR領域,X3D格式、HAnim人形動畫等技術(shù),同其他新技術(shù)一樣,也在不斷發(fā)展和成熟。
JTC1 AG13咨詢組的工作范圍,主要是研制基于AR/VR/MR的ICTC系統(tǒng)集成標準。在JTC1下經(jīng)過兩年多的籌備協(xié)調(diào),這個咨詢組于2019年成立。AG13一直嘗試提出關(guān)于AR/VR/MR的ICTC系統(tǒng)集成的提案,為了實現(xiàn)ICTC系統(tǒng)集成與其他技術(shù)領域的融合,我們需要與其他標準組織合作。
隨著VR/AR/MR產(chǎn)業(yè)逐漸擴大,標準比以往任何時候都顯得更為重要。我們希望SC24和AG13在VR/AR/MR領域開發(fā)更多有價值的標準。
華為無線5.5G領域總經(jīng)理高全中:
5G全面提升物聯(lián)和XR能力
縱觀移動通信過去40年的歷史,分為三個階段。第一個階段,語音和文字處理的時代,稱之為1D移動通信。第二個階段,以iPhone為主的視頻時代,通信網(wǎng)絡主要解決大帶寬的問題,F(xiàn)在開始進入第三個時代。
未來20年是3D通信對移動通信進行重構(gòu)的時代。3D通信會在很多方面產(chǎn)生很大很深遠的影響,主要影響是實時渲染能力。以前的通信不需要這么強的實時渲染能力,視頻可以緩存下來再看,將來VR和AR只靠原來的緩存是不夠的。未來,人們會在物理世界構(gòu)建虛擬的鏡像世界。對移動通信網(wǎng)絡來說,運營商和設備商要解決大帶寬、低時延、可靠性,保證VR/AR有比較好的消費體驗。
過去兩年,5G網(wǎng)絡得到前所未有的快速發(fā)展,5G體驗已經(jīng)大幅度提升。以前VR/AR只能支持雙眼2K,現(xiàn)在可以支持4K,還有更好的視頻,比如360°自由視角視頻。
華為去年11月在上海發(fā)布5.5G概念,5.5G能更好地支持XR業(yè)務的應用。未來20年,整個業(yè)務場景會發(fā)生非常大的變化,物聯(lián)不僅僅是低速率海量的物聯(lián),將來也會有高速率、大帶寬的物聯(lián)應用,也會承載在5G網(wǎng)絡上。
過去20年是從物理世界長出數(shù)字經(jīng)濟,未來20年物理世界將與數(shù)字世界融合。如果物理世界和數(shù)字世界融合,再產(chǎn)生虛擬經(jīng)濟,未來最大的風口有可能出現(xiàn)在虛擬經(jīng)濟。人們在虛擬世界中娛樂、工作、生活、投資,XR將深刻而廣泛地改變社會。
深圳創(chuàng)維新世界科技有限公司總經(jīng)理李文權(quán):
VR/AR是下一代消費級計算機科技產(chǎn)品
VR/AR將開啟第二次計算機科技浪潮,新一代技術(shù)將驅(qū)動生產(chǎn)力全方位提升。第一次計算機科技浪潮帶來的顛覆性革命將在VR/AR時代重演,VR/AR將是繼 PC電腦、智能手機之后的下一代消費級計算機科技產(chǎn)品,其產(chǎn)品形態(tài)將遵循類似從 PC電腦(VR/AR頭戴式顯示器,簡稱頭顯)到智能手機(智能VR/AR眼鏡)的發(fā)展路線。
VR行業(yè)經(jīng)過2014年至2016年的熱潮期、2017年至2019年的冷靜期,2020年后進入復蘇期,產(chǎn)業(yè)逐漸成熟,用戶規(guī)模突破1000萬,產(chǎn)品主要以quest2為代表。
多年來,對于VR設備的體驗,很多用戶反饋戴著頭暈。VAC(輻輳調(diào)節(jié)沖突)是造成現(xiàn)階段虛擬現(xiàn)實技術(shù)使用時有眩暈感的主要原因。用戶在使用時,焦距一直固定在虛擬屏幕上,不能根據(jù)圖像顯示距離調(diào)節(jié)焦距。由于雙目視差和聚焦模糊所呈現(xiàn)的距離不同,會引起人腦對位置或距離判斷偏差,引起視覺疲勞,造成眩暈和眼睛不舒服,從而導致不能長時間使用VR設備。
真正解決頭暈、眩暈的問題,需要采用變焦技術(shù)。所謂變焦,就是看某一個場景,屏幕也會隨之發(fā)生一些變化。終極解決方案是通過改變光長的顯示方案,顯示不同的場景、不同的景深,把光源顯示到不同的位置上,從而徹底解決眩暈問題。
深圳威爾視覺技術(shù)有限公司董事長兼CEO茅曉東:
云VR是VR的發(fā)展趨勢
VR設備如何做得更輕、更小、更方便?如何把計算功能放到云上?如何把顯示部分做得更好?5G給了一個機會,我們可以通過5G網(wǎng)絡,實現(xiàn)當年沒有辦法實現(xiàn)的事情。VR除了設備,還有內(nèi)容,需要非常復雜的3D計算。把計算放到云上,通過5G網(wǎng)絡實現(xiàn),這就是所謂的實時云渲染。
我們早期做云渲染時,網(wǎng)絡太糟糕。當時我們對眩暈、時延理解不深刻,嘗試很久才知道與網(wǎng)絡有關(guān)。我們之前用LCD屏、3G網(wǎng)絡,時延非常大,發(fā)現(xiàn)沒有辦法把VR放到云上。但我個人一直堅定認為,5G起來以后,一定會解決VR的基本問題。
我們有很多客戶,包括政企客戶、運營商客戶,都會用到云VR。我們的VR系統(tǒng)支持統(tǒng)一集成,包括視頻、直播、點播、游戲,以及各種各樣的VR游戲、VR交互、工程交互。
云VR是VR的發(fā)展趨勢。云VR設備更加輕量化、自由度高,有很大發(fā)展?jié)摿,是VR硬件的發(fā)展趨勢。
解決VR的低時延、流暢性,僅靠大帶寬還解決不了,大帶寬只是基礎。在實際應用中,還要解決大帶寬下的“馬力”問題,即傳輸能力達到4K、120幀,這是相當大的挑戰(zhàn)。我們公司在業(yè)界第一個提出FE算法,根據(jù)人眼視覺特征,基于關(guān)注的區(qū)域做編碼,已經(jīng)成為一項專利。
海信電子信息集團研發(fā)中心虛擬現(xiàn)實事業(yè)部總經(jīng)理李斌:
XR五年內(nèi)迎來發(fā)展黃金期
我們預測到2025年是XR發(fā)展的黃金期。隨著各大軟件公司介入,5G網(wǎng)絡發(fā)展,以及屏幕技術(shù)、芯片技術(shù)等各方面的發(fā)展,我相信再過四五年,XR產(chǎn)品就能夠走進人們的生活,無論對工作、娛樂,還是對社交,都會有很大幫助。
XR硬件分為五大塊——近眼顯示、XR計算平臺、人機工程、感知與交互入口、硬件平臺。在硬件上,我們認為近眼顯示比較重要。軟件就是算法,未來可以通過AI實現(xiàn),AI讓算法更優(yōu)化。
海信在XR方面有四大路線,即近眼顯示、渲染處理、感知交互、內(nèi)容制作。關(guān)于內(nèi)容制作,并不是海信制作內(nèi)容,我們要給內(nèi)容制作的開發(fā)者提供便利條件,讓他們一年之內(nèi)能夠搭建好平臺。
近眼顯示是各家企業(yè)都在做的熱點,而且是大力投入的部分。我們認為,一年之內(nèi)OLED屏幕會出現(xiàn)在AR領域。1年到5年內(nèi),屏幕會向Micro LED發(fā)展。10年以后,技術(shù)重點是全息顯示和智能隱形眼鏡。在渲染處理方面,未來2年到3年可能是深度學習渲染,還有混合云渲染。感知交互也是我們的重點,我們在手勢識別和CV 6DoF兩方面儲備了很多專利。VR/AR系統(tǒng)非常復雜,我們沒有辦法全部都做,只能做一部分,其余的是跟外部合作。
海信虛擬現(xiàn)實業(yè)務的核心技術(shù)載體是MR眼鏡,它支撐與現(xiàn)實世界進行實時交互和信息獲取。實現(xiàn)虛擬與現(xiàn)實的無縫融合是MR平臺的使命,感知交互等核心技術(shù)的效果將在MR眼鏡中得到最大化呈現(xiàn)。
海信既有元器件技術(shù),又有算法技術(shù),還有光學技術(shù)和激光電視技術(shù)。海信在各個方向的技術(shù)布局都比較深,我相信未來會出現(xiàn)一款比較驚艷的產(chǎn)品。
視辰信息科技(上海)有限公司副總裁江淑紅:
用AR云“點擊”顯示世界
“元宇宙”是最近很火的一個概念,它來源于1992年的科幻小說《雪崩》。元宇宙屬于交互技術(shù),提供給用戶沉浸式的虛擬世界。AR云將地理位置和計算機視覺結(jié)合,與真實世界的坐標結(jié)合,使現(xiàn)實世界可以“點擊”。
我們公司成立于2012年,2015年打破國外技術(shù)壟斷,2019年幫助汽車之家打造全球最大的AR車展。2020年因為疫情,世界人工智能大會搬到網(wǎng)上,我們公司是世界人工智能大會云展會的技術(shù)支持方。此外,我們還落地了張聞天故居的AR游小程序。
AR云底層是空間數(shù)據(jù),上面一層是技術(shù)服務,最上面是各行各業(yè)的具體應用。AR云可以為企業(yè)帶來什么?
在工業(yè)領域,從生產(chǎn)、服務、管理到產(chǎn)品,都可以有AR云介入。提到AR說明書,以前買一輛汽車,說明書是紙質(zhì)的,這幾年AR說明書應用于汽車領域。買一款新車,可以用AR的方式,比如用手機在控制面板上掃一掃,購買者根據(jù)提示往下操作,形成交互,這點非常方便。以后大家出國旅游更方便了,我們在海外租車,汽車型號不是我們熟悉的,說明書也是全英文的,如果有AR說明書,所見即所得,非常方便。
我們公司在AR營銷方面做得非常好,全國前20大銀行,我們做了15家,工農(nóng)商建與我們都有合作!癆R助理”以AR的形式呈現(xiàn)財報;AR紅包游戲用AR的方式呈現(xiàn)動畫,吸引小朋友,給小朋友發(fā)壓歲錢。我們之前做過AR動畫“孫悟空大鬧天宮”,幫助銀行提升貴金屬銷量。
北京凌宇智控科技有限公司首席技術(shù)官張佳寧:
跨平臺統(tǒng)一SDK勢在必行
所謂的XR互通機制到底是什么?簡單理解,它是一個軟件接口的標準,一方面,能提供面向硬件的接口,適配各個硬件廠商開發(fā)出來的硬件產(chǎn)品;另外一方面,它能提供上層接口規(guī)范,給應用開發(fā)者提供一個標準接口,讓大家基于這套規(guī)范開發(fā)出來的軟件和硬件,在各家平臺上運行起來,從而實現(xiàn)真正的互通,而不是各家割據(jù)。
為什么會提出這個概念呢?以手柄形態(tài)硬件為例,每一家廠商的手柄按鍵定義不一樣,有的是搖桿式,有的是觸摸桿;手柄形態(tài)也多種多樣,有的是簡單的手把,有的是帶定位追蹤功能的大圓環(huán),各家都有自己的SDK(軟件開發(fā)工具包)。對于開發(fā)者來說,做一款應用需要適配各家的SDK,工作量非常大。安卓手機為什么能發(fā)展很好?原因在于谷歌定義了安卓的SDK,以及對應的應用商店,所有開發(fā)都可以在安卓手機上運行。
對于內(nèi)容開發(fā)者來說,互通軟件主要做了幾方面的工作。一方面,內(nèi)容適配,把底層有效隔離出來。對內(nèi)容廠商來說,只需要適配一個SDK,就可以適應各家的硬件。在游戲建權(quán)方面,互通軟件做了相關(guān)的建權(quán),確保開發(fā)出來的游戲在分發(fā)過程中不被其他渠道破解。
對于用戶來說,互通軟件能夠解決兩個問題。一個是應用體驗愛好的設置,由于支持不同交互方式,用戶可以根據(jù)自己喜好設置不同的交互類型;另一個是在內(nèi)容跨平臺方面,開發(fā)出來的內(nèi)容適配多個平臺,用戶可以響應到的內(nèi)容會更多。
中山大學中山眼科中心副主任袁進:
虛擬現(xiàn)實在眼科有天然應用場景
我們很早關(guān)注到虛擬現(xiàn)實在醫(yī)學的應用。眼病是影響人類生存質(zhì)量的三大疾病之一,主要表示為視力、視功能、視覺質(zhì)量的改變。虛擬現(xiàn)實作為一個以視覺輸入為主的技術(shù),在眼科有著天然的應用場景,現(xiàn)在已經(jīng)可以運用VR技術(shù)做視功能篩查、視力輔助重建和視功能訓練。
我們眼科中心和合作團隊很早就開始虛擬現(xiàn)實的應用,通過指向背光和單眼定向投射原理,構(gòu)建了首個裸眼3D技術(shù)顯示系統(tǒng),并且根據(jù)軟件的設計,利用裸眼3D進行不同的多級視功能的篩查和評估。事實證明,裸眼3D篩查技術(shù)具有更高的準確性、更好的接受度,以及更高的篩查效率。
我們還對VR/AR形成的對視覺中樞的影響進行評估,這樣有助于利用VR技術(shù)進行視功能的重建和輔助訓練。我們開發(fā)基于腦電技術(shù)評估的VR視覺訓練系統(tǒng),以及智能化的全天候視力輔助增強系統(tǒng),用于低視力人群的視覺輔助。
我們在充分享受虛擬現(xiàn)實技術(shù)給醫(yī)學帶來全新應用場景的同時,也關(guān)注到在使用虛擬現(xiàn)實過程中會出現(xiàn)視覺疲勞、眩暈,以及虛擬現(xiàn)實的高度仿真帶來的過度沉浸,引起腦力的認知負荷和視疲勞程度增加等現(xiàn)象。
在視覺質(zhì)量影響因素當中,虛擬現(xiàn)實的物理光電技術(shù)參數(shù)與視覺質(zhì)量有很大的關(guān)聯(lián),包括屏幕的分辨率、延遲、屏幕的亮度、刷新率、多焦顯示等。目前我們對于虛擬現(xiàn)實視覺質(zhì)量評價的瓶頸在于,視覺健康的評價指標是碎片化的,沒有和虛擬現(xiàn)實光電物理參數(shù),以及使用虛擬現(xiàn)實的規(guī)律進行聯(lián)動研究;對于中樞視覺疲勞或者視覺異常,缺乏有效的評價體系。
目前我們提出國家首個虛擬現(xiàn)實視覺健康團體標準,標準主要對虛擬現(xiàn)實產(chǎn)品視覺健康評價方法、評價流程,以及和視覺健康相關(guān)的關(guān)鍵指標,給出了明確的建議。這個標準正在全國團體標準信息平臺上進一步廣泛征求意見,在標準里,我們對虛擬現(xiàn)實產(chǎn)品視覺健康評價流程給出了明確的推薦方案。
騰訊多媒體實驗室負責人劉杉:
2025年沉浸式媒體市場規(guī)模超1600億美元
沉浸式媒體通過實現(xiàn)物理世界和虛擬世界的融合共生,被認為是改變未來生活和工作方式的顛覆性趨勢之一。沉浸式應用場景正在從面向個人娛樂的消費類市場,深化發(fā)展到企業(yè)級市場的垂直行業(yè)應用領域。
未來5G的大規(guī)模普及、沉浸式媒體硬件及技術(shù)的進一步突破、制作成本的下降,以及更多優(yōu)質(zhì)內(nèi)容的開發(fā),將推動沉浸式媒體產(chǎn)品和服務被主流群體采納。
近年來,隨著沉浸式媒體應用的興起,國際和國內(nèi)標準組織也相應制定了一系列技術(shù)標準,以便更好地支持相關(guān)領域的應用和產(chǎn)業(yè)發(fā)展。
以VR為代表的沉浸式媒體視頻內(nèi)容近幾年顯著增加,滲透到文旅、教育、娛樂、醫(yī)療和制造等行業(yè)。預計到2025年,沉浸式媒體市場規(guī)模將超過1600億美元,更多公司和廠家也在加大沉浸式媒體技術(shù)研發(fā)和生產(chǎn)的投入。
騰訊積極參與沉浸式媒體標準的制定,為沉浸式媒體技術(shù)標準化工作作出一定貢獻。同時,騰訊也積極推動沉浸式媒體的生態(tài)建設和技術(shù)應用落地。
圍繞三維空間重建與三維物體重建兩個方向,我們進一步完善三維可視化技術(shù),并結(jié)合傳統(tǒng)幾何算法和深度學習方法。相比單純深度學習方法,三維可視化方法降低了對大量訓練數(shù)據(jù)的依賴,保持了空間結(jié)構(gòu)準確性。在物體重建方面,我們結(jié)合基于幾何關(guān)系和深度學習的方法,降低訓練數(shù)據(jù)量,提升重建準確率。我們利用這個方法,幫助敦煌研究院完成了一些文物重建工作,為文物保護和文化傳承作出了一定貢獻。