關(guān)于VR直播解決方案的實(shí)踐與探討
本文針對VR視頻直播新技術(shù),提出了解決方案,將采集、處理、分發(fā)、播放等集成一體的解決方案。
一、引言
目前,虛擬現(xiàn)實(shí)技術(shù)VR和VR直播這兩塊發(fā)展火爆,特別是VR直播成為2017年VR行業(yè)的熱點(diǎn)。VR技術(shù)催生了全新的用戶體驗(yàn)與商業(yè)模式。移動直播的強(qiáng)“自媒體”屬性,與VR全景技術(shù)帶來的真實(shí)臨場感,使得移動VR直播在體驗(yàn)上遠(yuǎn)遠(yuǎn)超過任何一種直播模式。移動VR直播將顛覆互聯(lián)網(wǎng)社交模式,無論是草根網(wǎng)紅的個人秀場,還是大牌明星的實(shí)景互動,都不可避免成為新互聯(lián)網(wǎng)時代的巨型流量入口。
二、解決方案
直播被定義為視頻行業(yè)從單向傳輸?shù)綄?shí)時互動的一場革命,在1.0時代,PC/平板、手機(jī)是重要的載體,用戶參與互動方式主要通過禮物、打字獲得短暫的和主播互動的機(jī)會,臨場感的缺乏和交互方式的單一是其最大的不足。而VR直播所帶來的沉浸式的體驗(yàn)直接把直播從1.0時代推向了2.0時代。
一個完整的VR直播解決方案一般需要采集端設(shè)備、視頻編輯、推送高水平、直播管理后臺、網(wǎng)絡(luò)分發(fā)以及播放端多個環(huán)節(jié),這些環(huán)節(jié)環(huán)環(huán)相扣,我們基于云端資源和現(xiàn)有的設(shè)備資源,探索了采集、處理與分發(fā)三大架構(gòu),從采集端,到云端和用戶端的業(yè)務(wù)流程,實(shí)踐了VR直播一整套的解決方案。
(一)VR采集端
采集主要包括視頻拍攝,數(shù)據(jù)采集與輸出
采集設(shè)備一般分為電影級和廣播級。信號源可以是多種,VR直播一般由4-16個攝像信號構(gòu)成,全方位360全景信號。采用高清信號輸出,構(gòu)建成4k信號。虛擬的信號設(shè)備可以使用HDMI、SDI、AV、VGA、File、IP流等信號。
1.電影級采集設(shè)備
電影級采集設(shè)備目前主要有HeadcaseVR、HypeVR、NextVR、J2VR等。
HeadcaseVR:2016年正式亮相了全新移動VR拍攝方案的HeadcaseVR團(tuán)隊。采用2/3英寸的CCD傳感器,單分辨率1920×1080。60FPS的幀率表現(xiàn)。其中J2V是中國的團(tuán)隊,是國內(nèi)最早進(jìn)入全景視覺領(lǐng)域發(fā)展的創(chuàng)新型公司。J2VR也是經(jīng)過幾代更新的電影及VR解決方案。采用4臺RedDragon分別對四個方向進(jìn)行拍攝采集。最終達(dá)到24K錄制100FPS的標(biāo)準(zhǔn)。
2.廣播級采集設(shè)備
XONE一體化全景攝像機(jī):支持機(jī)內(nèi)實(shí)時拼接,支持雙組360度全景視頻同步拍攝,采用SONY 1/1.8英寸CMOS,全景錄制6K/全景直播4K。支持通過RTMP協(xié)議進(jìn)行串流推送、支持支持通過PC客戶端或APP客戶端進(jìn)行預(yù)覽、編碼支持H264/.H265 HEVC高壓縮比編碼、幀率:1-30fps。
3.民用級
國內(nèi)民用級的全景攝像機(jī)較多,例暴風(fēng)魔眼、Insta 360、Theta、Wipet、360fly等,在拼接畸變、流暢性、色彩還原、矯正等多個方面不會很成熟,適合自拍旅游等場景使用。
4.核心算法
VR直播采集設(shè)備完成的不止是采集內(nèi)容這一步。設(shè)備里面一般會配套搭載的軟件和算法才是核心技術(shù)。在VR直播中,所有的拼接都是直接即刻完成的,例如縫合、映射、美顏、編碼、特效)白平衡,曝光等)。即將多鏡頭拍攝的畫面進(jìn)行亮度色彩調(diào)整、對齊、畸變矯正、投影到球面等一系列處理后,基于圖像特征control points控制點(diǎn),合成為一幅完整畫面的過程。
核心圖像處理算法,直接影響系統(tǒng)資源占有率,直接影響碼流、帶寬和存儲。核心算法的好壞直接影像圖像邊緣彎曲的矯正,場景的分割,虛擬PTZ、轉(zhuǎn)動、放大,這些都是由核心算法帶動的。
現(xiàn)在業(yè)內(nèi)的產(chǎn)品,針對圖像矯正,有兩種處理方式,一種是前端攝像機(jī)內(nèi)置軟件處理,另外一種是后端軟件處理,其都是對圖像邊緣像素和水平展開進(jìn)行矯正,圖像矯正的關(guān)鍵在于圖像邊緣像素的還原完整度如何。前種方法節(jié)省了后端和網(wǎng)絡(luò)資源,避免了帶寬和存儲的壓力,即在前端就完成了對圖像進(jìn)行矯正處理壓縮,最終將一個水平展開的圖像傳輸?shù)胶蠖似脚_,使用者可根據(jù)需求選擇全景畫面或四畫面顯示,圖像很具實(shí)時性。而后一種將圖像矯正做到后端電腦上,其優(yōu)勢是借助電腦硬件快速的處理能力和軟件的完備性,其能很完美地實(shí)現(xiàn)全景圖像展開和四畫面顯示,從處理能力來說無疑后端機(jī)更具突出表現(xiàn),效果或更要好一些,但也缺實(shí)時性。
圖像校正算法被嵌入到攝像機(jī)內(nèi)是當(dāng)前技術(shù)市場的主流,其更符合用戶即插即用的使用習(xí)慣,借助PC機(jī)的產(chǎn)品功能雖會很完美但未必會被用戶接受。
(二)VR云端處理
VR云端處理包括視頻數(shù)據(jù)處理、實(shí)時同步、視頻編輯、合成、數(shù)據(jù)推送、云存儲與云端轉(zhuǎn)碼等,我們利用了現(xiàn)有的推流設(shè)備、利用了阿里視頻云資源實(shí)現(xiàn)了上述功能。
1.推流
從VR采集的視頻流,我們使用了NSCaster推送至云端服務(wù)器,NSCaster整機(jī)采用便攜化設(shè)計,設(shè)備高度集成化,內(nèi)置主機(jī)、17.3寸全高清顯示屏、PC鍵盤、鼠標(biāo)觸摸板、導(dǎo)播操作鍵盤、攝像機(jī)云臺操作桿、視頻輸入輸出接口封裝、專業(yè)音頻輸入輸出、調(diào)音臺、藍(lán)牙無線通話、TALLY輸出、熱插拔數(shù)據(jù)硬盤、DVD刻錄機(jī)等。支持總共12路輸入,其中四路SDI/HD-SDI/3G-SDI攝像機(jī)輸入、一路全接口(SDI/HDMI/DVI/VGA/分量)輸入,一路網(wǎng)絡(luò)輸入、兩路DDR(視頻素材)輸入、四路虛擬場景輸入。
網(wǎng)絡(luò)輸入可用于通過網(wǎng)絡(luò)接入電腦桌面、Android設(shè)備、iOS設(shè)備;也可以接入網(wǎng)絡(luò)流信號,支持RTMP/ RTSP/MMS/VJVGA/VJTeacher/HTTP TS/UDP TS協(xié)議,支持IP攝像機(jī)輸入;也可以用于遠(yuǎn)程訪談連線。
兩路DDR,用于播放本地視音頻和圖片素材,支持絕大部分常用視音頻和圖片文件;支持單文件播放和列表播放,支持循環(huán)播放;支持播放進(jìn)度調(diào)整,支持播放倍率調(diào)整,支持播放時間倒數(shù);支持與切換配合自動播放。支持MMS推流/拉流、FLASH/RTMP推流、UDP TS單播/組播網(wǎng)絡(luò)直播。
2.視頻云處理平臺比較
具備快速部署視頻服務(wù)、順暢運(yùn)營、集成方便、開發(fā)快速上線,并且運(yùn)維簡單等產(chǎn)品特性,重點(diǎn)對國內(nèi)主要的四家視頻云服務(wù)商進(jìn)行了比較和分析)詳見表2-1)。
表2-1 關(guān)于視頻云平臺整體比較
項目 | 騰訊云視頻 | 網(wǎng)易視頻云 | 七牛直播云 | 金山視頻云 |
服務(wù) | 直播、點(diǎn)播、互動直播 | 直播、點(diǎn)播、互動直播 | 直播 | 直播、點(diǎn)播 |
推流sdk | Android、iOS及OBS(第三方) | Window、Web、Android、iOS及OBS(第三) | Android、iOS及OBS(第三方) | Android、iOS及OBS(第三方) |
播放器sdk | iOS、Android, Web | Window、iOS、Android、Web | iOS、Android、 H5、PC | iOS、Android、H5、PC |
轉(zhuǎn)碼 | 10,000+分布式轉(zhuǎn)碼集群,2000并發(fā)轉(zhuǎn)發(fā) | 10,000+分布式轉(zhuǎn)碼集群 | 無點(diǎn)播產(chǎn)品形態(tài) | 分布式轉(zhuǎn)碼,采用軟硬件混合轉(zhuǎn)碼技術(shù),支持H264,H265編碼 |
CDN | 全球400+ | 全球500+ | 全球300+ | 進(jìn)千個節(jié)點(diǎn) |
直播錄制 | 支持 | 支持 | 支持 | 不詳 |
安全 | 防盜鏈、黑白名單 | 防盜鏈、回源鑒權(quán) | 防盜鏈、播放地址加密、黑白名單 | DRM、防盜鏈 |
美顏 | 美顏+美白 | 濾鏡+美顏 | 美顏 | 不詳 |
鑒黃 | 內(nèi)測 | 支持 | 支持 | 未知 |
并發(fā)量 | 千萬級 | 千萬級 | 百萬級 | 千萬級 |
騰訊云視頻互動直播方案比較成熟,與騰訊云通信(IM)結(jié)合緊密,業(yè)務(wù)集成度較高,目前臺內(nèi)新麥?zhǔn)呛芎玫陌咐?。七牛直播云沿襲七牛云的精品路線,側(cè)重于直播,開放云端 API 實(shí)現(xiàn)透明播控管理,CDN節(jié)點(diǎn)相對要少一些。金山視頻云提供了點(diǎn)播數(shù)據(jù)挖掘、H.265編碼其特色(當(dāng)然H.265需要視頻源高清而且終端性能強(qiáng)勁才有明顯效果),客戶端SDK集中在移動端,直播還支持OTT播放盒、超級電視等多屏播放,在VR直播方面已經(jīng)在GITHUB開放了部分SDK。網(wǎng)易視頻云功能相對完善,同時支持實(shí)時互動直播,而且具有各種場景的完整解決方案,擁有千萬級并發(fā)量,SDK也非常全面。接入方便,新手也只需一天就可以為APP接入音視頻功能。
(1)穩(wěn)定性比較
近期云計算的宕機(jī)現(xiàn)象再次發(fā)生,云服務(wù)的穩(wěn)定性變成了影響用戶抉擇的重要因素之一。當(dāng)然,對于視頻云服務(wù)來說,穩(wěn)定性不止于數(shù)據(jù)中心層,更需要考慮視頻流鏈路的穩(wěn)定,包括對弱網(wǎng)環(huán)境的處理,對卡頓、延遲現(xiàn)象有極地的容忍度。
表2-2 關(guān)于視頻云平臺穩(wěn)定性比較
騰訊云視頻 | 網(wǎng)易視頻云 | 七牛直播云 | 金山視頻云 | |
機(jī)房 | 自建機(jī)房 異地多機(jī)房 多機(jī)房架構(gòu)設(shè)計 | 自建機(jī)房 異地多機(jī)房 多機(jī)房架構(gòu)設(shè)計 | 托管云機(jī)房 | 有自建機(jī)房 |
傳輸 | 傳輸加密 存儲加密 | 傳輸加密 存儲加密 | 傳輸加密 存儲加密 | 傳輸加密 存儲未知 |
Qos | 未提及 | 有 | 無 | 無 |
從一定程度上說,自建機(jī)房意味著具備專業(yè)的運(yùn)維團(tuán)隊、更強(qiáng)的突發(fā)事件應(yīng)對能力、更高效的突發(fā)事件響應(yīng)速度,而這些因素恰恰是提供穩(wěn)定服務(wù)的關(guān)鍵。此外,傳輸機(jī)制保證了數(shù)據(jù)的安全性,網(wǎng)絡(luò)QoS策略則能夠保障復(fù)雜網(wǎng)絡(luò)下的流暢直播體驗(yàn)。而服務(wù)模式?jīng)Q定了是否能夠快速響應(yīng)客戶的技術(shù)、服務(wù)訴求。
(2)技術(shù)服務(wù)
企業(yè)級云服務(wù)和消費(fèi)級產(chǎn)品最大的不同,就是對技術(shù)服務(wù)的需求更甚于對資費(fèi)的敏感,剛剛發(fā)展起來的云服務(wù)尤其如此。對于視頻云服務(wù),因?yàn)閺?fù)雜的場景、冗長的鏈路背后是復(fù)雜的技術(shù),而視頻服務(wù)商還需要快速為自己的用戶解決問題,讓這些最終用戶滿意,所以技術(shù)支持必不可少。
表2-3 關(guān)于視頻云平臺技術(shù)服務(wù)比較
騰訊云視頻 | 網(wǎng)易視頻云 | 七牛直播云 | 金山視頻云 | |
開發(fā)文檔/ 技術(shù)課程 | 簡單的開發(fā)文檔 | 詳細(xì)完整的開發(fā)文檔 | 詳細(xì)完整的開發(fā)文檔 | 官網(wǎng)產(chǎn)品文檔和API文檔均尚未找到視頻云資料 |
技術(shù)支持 | 7x24小時服務(wù)、QQ大群討論、1V1大客戶服務(wù) | 7x24小時服務(wù)、 1V1專家支持 | 1對1 QQ群支持 | 不詳、官網(wǎng)沒提到 |
故障承諾 | 100倍故障賠償、5天無理由退款 | 100倍故障賠償 | 100倍故障賠償 | 不詳、官網(wǎng)沒提到 |
3.金山云的優(yōu)勢
云平臺VR具體技術(shù)參數(shù)與一般的視頻并無區(qū)別,比較大的亮點(diǎn),就是各家H.265的技術(shù)。例如金山公司的H.265生態(tài)鏈打通后,H.265和VR結(jié)合具備了畫質(zhì)和帶寬的優(yōu)勢。
限制VR直播的問題在于碼流。因?yàn)閂R視頻內(nèi)容在映射后,肉眼可視的分辨率會下降很多。所以對原始視頻的畫質(zhì)要求就比較高,一般都要求在4K或者8K,4K分辨率下,碼流接近20M。如果H.265能夠在采集端得到大范圍的推廣,可以大幅降低此處的帶寬壓力。華為公司擁有最多的核心專利,是標(biāo)準(zhǔn)的主導(dǎo)者,但是H.265受限于專利費(fèi),目前看來大幅應(yīng)用于采集端還有很長的路要走。
具體優(yōu)勢體現(xiàn)在上行碼率自適應(yīng),窄帶高清轉(zhuǎn)碼,截圖,錄制,時移等功能和服務(wù);具備較低帶寬直播時延,能保證直播的實(shí)時交互;千萬級直播并發(fā)能力,可動態(tài)擴(kuò)展的直播技術(shù)架構(gòu)。提供URL加密,視頻加密、防盜鏈多種安全防護(hù),減少盜播,錄播風(fēng)險。
(三)用戶端開發(fā)
用戶端主要包括全平臺播放器部署、同時支持PC、手機(jī)、VR頭顯方式呈現(xiàn)。
全平臺播放器部署采用了KSYMediaPlayer SDK的SDK包進(jìn)行開發(fā),重點(diǎn)實(shí)踐了APP端的體驗(yàn)。KSYMediaPlayer SDK是金山云播放內(nèi)核官方推出的iOS和Android平臺上使用的軟件開發(fā)工具包(SDK),為iOS和Android開發(fā)者提供簡單、快捷的接口,幫助開發(fā)者實(shí)現(xiàn)iOS和Android平臺上的多媒體播放應(yīng)用。
1.KSYMediaPlayer SDK的快速集成
金山云播放內(nèi)核涵蓋Android、iOS、Flash和瀏覽器插件四個平臺,基于FFmpeg自主研發(fā)音視頻媒體播放內(nèi)核,作為一款全平臺兼容的軟件播放方案,金山云播放內(nèi)核提供了跨終端平臺的播放器SDK,以及開放的音視頻播放、控制接口和完整的開源調(diào)用示例,不僅極大降低開發(fā)門檻,同時支持客戶快速在多個平臺發(fā)布產(chǎn)品。
(1)KSYMediaPlayer SDK 功能
與系統(tǒng)播放器MPMoviePlayerController接口一致,可以無縫快速切換至KSYMediaPlayer;
本地全媒體格式支持, 并對主流的媒體格式(mp4, avi, wmv, flv, mkv, mov, rmvb 等 )進(jìn)行優(yōu)化;
支持廣泛的流式視頻格式, HLS, RTMP, HTTP Rseudo-Streaming 等;
低延時直播體驗(yàn),配合金山云推流sdk,可以達(dá)到全程直播穩(wěn)定的4秒內(nèi)延時;
實(shí)現(xiàn)快速滿屏播放,為用戶帶來更快捷優(yōu)質(zhì)的播放體驗(yàn);
支持畫面旋轉(zhuǎn),音量調(diào)節(jié)等各種功能;
版本適配支持iOS 7.0以上版本;
業(yè)內(nèi)一流的H.265解碼;
2M大小的超輕量級直播sdk;
支持bitcode
提供了支持直播和點(diǎn)播兩個靜態(tài)庫,相比直播,點(diǎn)播支持了更豐富的封裝格式和音視頻編解碼格式,二者支持的具體功能如下:
表3-1 點(diǎn)播和直播支持協(xié)議
直播 | 點(diǎn)播 | |
流協(xié)議 | HLS, RTMP, HTTP, FILE | HLS, RTMP, HTTP, FILE, RTSP, HTTPS |
封裝格式 | FLV, TS, MPEG, MOV, M4V, MP3, GIF | FLV, TS, MPEG, MOV, M4V, MP3, GIF, AVI, ASF, MKV, WAV, WEBM, RM |
視頻編碼格式 | H264, H265, MPEG4, MJPEG | H263, H264, H265, MPEG2, MPEG4, MJPEG, VC-1, WMV, RV40 |
音頻編碼格式 | AAC, MP3, NELLYMOSER | AAC, MP3, AC3, AMR, APE, DTS, EAC3, FLAC, PCM, OGG, WMA, COOK, NELLYMOSER |
(2)運(yùn)行環(huán)境
KSY MediaPlayer iOS SDK可運(yùn)行于 iPhone/iPod Touch/iPad,支持 iOS 7.0 及以上版本; 支持 armv7/arm64以及虛擬機(jī)運(yùn)行。
(3)快速集成
Step1 集成framework
將金山云SDK解壓后,將framework目錄下KSYMediaPlayer.framework復(fù)制到項目下,選擇需要集成的target,在target->Build Phases->Link Binary With Libraries下,將KSYMediaPlayer.framework添加進(jìn)去,然后添加另外四個系統(tǒng)庫:
l VideoToolbox.framework
l libstdc++.6.tbd 或者libstdc++.6.dylib
l libbz2.tbd 或者 libbz2.dylib
l libz.tbd 或者 libz.dylib
Step2調(diào)用
打開需要集成播放視頻功能的視圖源碼,把如下代碼復(fù)制并粘貼到你將播放視頻的位置,例如到播放/停止按鈕的方法中。
1.導(dǎo)入頭文件
#import <KSYMediaPlayer/KSYMediaPlayer.h>
2.初始化player
l 準(zhǔn)備需要視頻播放的UIView;
l 新建player;
l 設(shè)置url;
l 調(diào)用prepareToPlay開始播放。由于已經(jīng)設(shè)置shouldAutoplay為TRUE,則prepare完成后立即開始播放。
三、結(jié)束語
通過上述的采集、處理、分發(fā)、播放等集成一體的VR直播解決方案,達(dá)到了穩(wěn)定輸出的效果,可以在APP和VR眼鏡進(jìn)行觀看直播。
隨著直播的不斷演化發(fā)展,直播對于各行各業(yè)的影響也在逐漸深入,并逐漸開始從個人走向企業(yè),已經(jīng)成了一個標(biāo)配,成為大家傳遞信息的一種新方式。VR將是信息傳遞的下一個方式。VR直播將扮演非常重要的一個角色。它會深入到生活的方方面面,深入到各個行業(yè)里面去,也會慢慢成為標(biāo)配,未來3到5年,VR直播行業(yè)將會有大發(fā)展,會成為大家日常生活當(dāng)中獲取知識并與親朋好友交流的一種標(biāo)準(zhǔn)方式。
欄目分類
- 為什么發(fā)表論文都不開雜志社的發(fā)票呢?
- 2021-2022年CSCD中國科學(xué)引文數(shù)據(jù)庫來源期刊列表-理科南大核心目錄完整版
- CSCD中國科學(xué)引文數(shù)據(jù)庫來源期刊列表(2023-2024年度)南大核心目錄
- 融媒體環(huán)境下地方新聞網(wǎng)站媒體的發(fā)展路徑
- 創(chuàng)新與繼承:70周年獻(xiàn)禮片“三杰”研究
- 人本導(dǎo)向下的城市更新規(guī)劃思路探索——以上海松江區(qū)中山街道老城區(qū)為例
- 預(yù)制裝配式地鐵車站施工技術(shù)
- 從框架理論看“中國學(xué)習(xí)的人”
- 互聯(lián)網(wǎng)環(huán)境下古都洛陽城市形象建構(gòu)與傳播探析
- 價值工程在房地產(chǎn)開發(fā)管理分工中應(yīng)用
- 官方認(rèn)定!CSSCI南大核心首批191家“青年學(xué)者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點(diǎn)分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級黨報?是否有什么說據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報?