完美摳圖王冰冰字節實習生開發的AI實現4K60幀視頻實時摳圖

2021-08-30 15:37 • 熱點資訊

看這一頭蓬鬆的秀髮，加上帥氣的動作，你以為是在綠幕前拍大片？No、No、No……這其實是AI拿來視頻實時摳圖后的效果。沒想到吧，實時視頻摳圖，現在能精細到 每一根髮絲。

換到alpha通道再看一眼，不用多說，德芙打錢吧（手動狗頭）。

這就是來自字節跳動實習生小哥的最新研究：實時高分辨率視頻摳圖大法。

無需任何輔助輸入，把視頻丟給這個名為 RVM的AI，它分分鐘就能幫你把人像高精度摳出，將背景替換成可以任意二次加工的綠幕。

不信有這麼絲滑？我們用線上Demo親自嘗試了一波。

相比之下，現在在線會議軟件里的摳圖，一旦頭髮遮住臉，人就會消失……

頭髮絲更是明顯糊了。

難怪看得網友直言：

不敢想象你們把這隻AI塞進手機里的樣子。

不敢想象你們把這隻AI塞進手機里的樣子。

目前，這篇論文已經入選WACV 2022。

你也可以上手一試

目前，RVM已經在GitHub上開源，並給出了兩種試玩途徑：

於是我們也趕緊上手試了試。

先來看看效果：

首先來點難度低的。

對於這種人物在畫面中基本不移動的情況，RVM可以說是表現的非常好，和人工摳圖幾乎無差別。

現在，王冰冰進入動森都毫不違和了。

於是開腦洞，也變得簡單了許多……

咳咳，言歸正傳。人物動作幅度加大會怎樣呢？

對於多人舞蹈視頻而言，RVM的表現也很nice。

即便動來動去、頭髮亂甩，也沒有影響它的摳圖效果。

只有在人物出現遮擋的情況下，才會出現瑕疵。

對比前輩方法MODNet，確實有不小的進步。

不過我們也發現，如果視頻的背景較暗，就會影響RVM的發揮。

比如在這種背景光線昏暗的情況下，摳圖的效果就非常不盡人意了。

可以看到，博主老哥的頭髮完全糊了。

而且身體的邊界線也不夠清晰。

所以，如果你想自己拍視頻試玩，就一定要選擇光線充足的場景。

利用時間信息

那麼這樣的“魔法”，具體又是如何實現的？

照例，我們先來扒一扒論文~

實際上，有關視頻摳圖的算法如今已不鮮見，其中大多數採用的是將視頻中的每一幀作為獨立圖像來實現摳圖的方法。

不同與此，在這篇論文中，研究人員構建了一個循環架構，利用上了視頻的時間信息，在 時間一致性和 摳圖質量上取得了明顯改進。

從上圖中可以看出，RVM的網絡架構包括3個部分：

特徵提取編碼器，用來提取單幀特徵；

循環解碼器，用於匯總時間信息；

深度引導濾波（DGF）模塊，用於高分辨率上採樣。

其中，循環機制的引入使得AI能夠在連續的視頻流中自我學習，從而了解到哪些信息需要保留，哪些信息可以遺忘掉。

具體而言，循環解碼器採用了多尺度ConvGRU來聚合時間信息。其定義如下：

在這個編碼器-解碼器網絡中，AI會完成對高分辨率視頻的下採樣，然後再使用DGF對結果進行上採樣。

除此之外，研究人員還提出了一種新的訓練策略：同時使用摳圖和語義分割目標數據集來訓練網絡。

這樣做到好處在於：

首先，人像摳圖與人像分割任務密切相關，AI必須學會從語義上理解場景，才能在定位人物主體方面具備魯棒性。

其次，現有的大部分摳圖數據集只提供真實的alpha通道和前景信息，所以必須對背景圖像進行合成。但前景和背景的光照往往不同，這就影響了合成的效果。語義分割數據集的引入可以有效防止過擬合。

最後，語義分割數據集擁有更為豐富的訓練數據。

首先，人像摳圖與人像分割任務密切相關，AI必須學會從語義上理解場景，才能在定位人物主體方面具備魯棒性。

其次，現有的大部分摳圖數據集只提供真實的alpha通道和前景信息，所以必須對背景圖像進行合成。但前景和背景的光照往往不同，這就影響了合成的效果。語義分割數據集的引入可以有效防止過擬合。

最後，語義分割數據集擁有更為豐富的訓練數據。

經過這一番調教之後，RVM和前輩們比起來，有怎樣的改進？

從效果對比中就可以明顯感受到了：

另外，與MODNet相比，RVM 更輕更快。

從下面這張表格中可以看出，在1080p視頻上RVM的處理速度是最快的，在512×288上比BGMv2略慢，在4K視頻上則比帶FGF的MODNet慢一點。研究人員分析，這是因為RVM除了alpha通道外還預判了前景。

更直觀的數據是，在英偉達GTX 1080Ti上，RVM能以76FPS的速度處理4K視頻，以104FPS的速度處理HD視頻。

一作字節跳動實習生

這篇論文是一作 林山川在字節跳動實習期間完成的。

他本科、碩士均畢業於華盛頓大學，曾先後在Adobe、Facebook等大廠實習。

2021年3月-6月，林山川在字節跳動實習。8月剛剛入職微軟。

事實上，林山川此前就曾憑藉AI摳圖大法拿下 CVPR 2021最佳學生論文榮譽獎。

他以一作身份發表論文《Real-Time High-Resolution Background Matting》，提出了Background Matting V2方法。

這一方法能夠以30FPS的速度處理4K視頻，以60FPS的速度處理HD視頻。

值得一提的是，Background Matting這一系列方法不止一次中了CVPR。此前，第一代Background Matting就被CVPR 2020收錄。

兩次論文的通訊作者都是華盛頓大學副教授Ira Kemelmacher-Shlizerman，她的研究方向為計算機視覺、計算機圖形、AR/VR等。

此外，本次論文的二作為 Linjie Yang，他是字節跳動的研究科學家。本科畢業於清華大學，在香港中文大學獲得博士學位。

對了，除了能在Colab上試用之外，你也可以在網頁版上實時感受一下這隻AI的效果，地址拿好：

https://peterl1n.github.io/RobustVideoMatting/#/demo

GitHub地址：

https://github.com/PeterL1n/RobustVideoMatting

論文地址：

https://arxiv.org/abs/2108.11515

參考鏈接：

[R] Robust High-Resolution Video Matting with Temporal Guidance from MachineLearning

ai 實時視頻

赞 (0)

20歲女生長期熬夜誘發癲癇醫生：癲癇患者一半以上都是年輕人

上一篇 2021-08-30 15:36

廈門小米之家被盜監控曝光：不到30秒全店手機一掃而光

下一篇 2021-08-30 15:37

熱點資訊

大媽為給主播打賞，騙了親友280餘萬元並逼女兒賣房

60多歲的蔣某，5年間，瘋狂坑騙身邊好友280餘萬元，還偽造文書坑害弟弟，欺騙女兒賣掉了唯一的房產……這一切，都是為了滿足自己的開銷，包括無節制地給K歌平台的主播打賞。近日，杭州…

2022-03-24
熱點資訊

B站員工過年加班猝死？回應：事發前一周內未加班將配合警方和家屬處理後續事宜

2月7日消息，有微博用戶稱，“據多名網友爆料，b站武漢ai審核組組長，因過年期間被要求加班，在晚上9點到早上9點的工作強度下，初五凌晨腦出血猝死”。對此，B站今日發布“內容安全中心…

2022-02-07
熱點資訊

傳聞：迪士尼或在今年12月公開《星球大戰》新作

迪斯尼和盧卡斯電影公司表示在今年年底每周二會公開《星球大戰》產品，或將包含《星球大戰》遊戲新作。正如官網上一篇博文表示，從現在至12月底，每周都會進行《星球大戰》收藏品、玩具、書籍…

2021-10-13
熱點資訊

快手電商：永久清退朵唯 9倍補償相關消費者

快手電商針對快手主播“驢嫂平榮”直播間售賣的“朵唯12Pro”手機事件發布了最終處理結果。針對朵唯，快手電商永久清退朵唯所有產品，涉事企業永不合作。面對消費者，快手電商在此前退款不…

2021-05-28
熱點資訊

三星SK海力士和美光去年在全球DRAM市場份額高達94%

在全球芯片領域，無論是高端芯片的供應，還是晶圓代工，技術領先的少數幾家廠商往往佔據絕大部分的市場份額，部分領域甚至被少數幾家廠商完全佔據。從研究機構最新的報告來看，在DRAM方面，…

2022-05-25
熱點資訊

緊隨T-Mobile：AT&T確認正在開發基於衛星的通訊覆蓋服務

在 T-Mobile 攜手 SpaceX 官宣了基於星鏈衛星的通訊合作之後，美國運營商 AT&T 現也確認正在開發自己的衛星覆蓋服務。不同的是，AT&T 沒有選擇 …

2022-10-08
熱點資訊

售價妥妥超過百萬奔馳旗艦純電EQS SUV曝光

近日，網絡上曝光了奔馳旗艦純電車型EQS SUV無偽裝實車圖片，作為奔馳EQ家族的新成員，定位於大型豪華純電SUV的奔馳EQS SUV將於4月19日全球首發。不過實車照片曝光后，引…

2022-04-11
熱點資訊

科學家在巴西亞馬遜河流域發現狨猴新物種

據外媒報道，一組科學家在巴西亞馬遜地區發現了一種新的狨猴物種。相關研究發表在最新一期的《Scientific Reports》上。據悉，這一發現是由Rodrigo Costa Ar…

2021-08-23
熱點資訊

你關注的數碼爆料，背後摻雜了多少水分？

再過一個月，iPhone 13 就要和大家見面了，按照前幾年的慣例，發布會前滿天飛的爆料就能讓你對新品了如指掌，甚至是價格也會有人做出分析，但今年有點不一樣，相比過往，iPhone…

2021-08-24
熱點資訊

特斯拉預期五月中旬恢復產能：“對中國充滿信心，疫情只是短暫挑戰”

5月7日，上海浦東新區副區長吳強在上海疫情防控新聞發布會上介紹稱，特斯拉自4月19日復工復產以來，截至4月30日，已經下線了1萬輛整車。第一財經記者從特斯拉方面了解到，目前特斯拉臨…

2022-05-07