虛擬人行業深度研究報告:乘元宇宙之風,虛擬人產業發展加速

來源:中銀證券

作者:盧翌

點擊查看PDF原文

以下內容轉自行業研究報告‌

導語

在元宇宙概念中,未來每個用戶都將依託虛擬人為化身進入虛擬世界中探索,虛擬人技術將成為元宇宙時代的基礎技術之一。

1 元宇宙基石,多行業滲透 虛擬

人指具有數字化外形的虛擬人物。,虛擬數字人具備三大特徵:1)擁有人的外觀及性格特徵;2)擁有通過語言、表情或肢體動作表達的能力;3)擁有識別外界環境、與人交流互動的能力。在元宇宙概念中,未來每個用戶都將依託虛擬人為化身進入虛擬世界中探索,虛擬人技術將成為元宇宙時代的基礎技術之一。

最早的虛擬人出現於 20 世紀 80 年代,受限於技術,當時的虛擬人製作以手繪為主。21 世紀初,隨着動捕、渲染等技術的逐步發展,虛擬人相關技術開始在影視領域逐漸普及,用於呈現超現實角色和場景。2007 年初音未來的誕生標誌着虛擬偶像行業進入蓬勃發展的階段。近些年來,隨着 AI 和深度學習算法的出現,虛擬人的製作環節被大大簡化,同時虛擬人的功能性也日漸凸顯:數字員工、智能主持人等新業態被開發。目前國內各大相關公司均已開始虛擬人相關的布局和變現,預期其在娛樂、電商、教育、文旅等諸多行業的應用將逐步落地。

虛擬人產業已經發展出了由技術層、平台層、應用層組成的產業鏈結構。虛擬人的基礎技術層為虛 擬人的生產製作提供技術支持,主要可分為硬件部分和軟件部分。硬件包括所有虛擬人呈現及交互 所需的硬件,如顯示設備、芯片和交互所用的光學器件、傳感器等;以及製作虛擬人時需要承載算力的計算設備、動作捕捉所用的各類光學器件以及動作傳感器等。軟件端除了呈現和交互軟件外,在製作環節還需要建模軟件和渲染引擎,如 Unity Technologies 的 Unity 3D、Epic Games 的 Unreal Engine 等。

虛擬人平台層是將技術層中各獨立技術進行串聯,應用在具體的項目設計中,主要包括建模、動捕、渲染等製作環節。平台層公司目前在高速發展中,競爭壁壘主要在如何結合技術能力和文化設計能力,為下游應用層提供整合的虛擬人解決方案。隨着 AI、算法、5G 網絡等技術發展,製作環節成本仍有下降空間。

虛擬人應用層將虛擬人應用於各行業領域。虛擬人相關技術首先在影視、傳媒和遊戲領域有了多年應用的積累,隨着技術進一步成熟正逐步呈現出新的賦能方式。目前在金融、文旅等領域,虛擬人憑藉其與 AI 技術的結合,以及成本、表現力優勢逐步開始提供數字員工、虛擬導遊等服務。

2 製作技術逐步成熟,降本普及未來可期

製作流程:三大流程為主,技術促進流程簡化

虛擬人的製作流程涵蓋了諸多技術,製作方式仍在逐步進化中,存在某些步驟互相融合的趨勢,但尚沒有完全定型的整套解決流程。虛擬人製作流程中最為核心、最具挑戰的是建模、驅動、渲染三 大流程。

具體的製作步驟是:1)以真人為模型或設計人物為虛擬人建立基本的 3D 模型。2)通過真人動作捕捉等形式確定虛擬人的基本動作,也即驅動環節。3)根據在設計環節中確定的虛擬人最終呈現效果 和應用場景等外界要素,將模型與其運動進行渲染以呈現最佳效果。

建模:靜態掃描廣泛應用,動態光場指引未來

目前的建模方式主要可以分為三種:1)手工建模,這是最初的建模手段,目前仍廣泛應用,但人工製作周期較長。2)圖像採集模型,通過幾張照片還原人臉 3D 結構,但其精度仍不足以建立高質量模型。3)儀器採集模型,目前發展的重點,精度可達 0.1 毫米,但目前成本較高。

儀器採集模型方面,目前仍以靜態掃描模型為主,可具體細分為結構光掃描重建與相機陣列掃描重建。結構光掃描重建系統由投影儀與攝像頭構成,其原理是投影儀投射特定光、攝像頭採集信息,最後以圖像處理和視覺模型復原整個三維模型,iPhone X 所使用的人臉識別技術便是基於此原理。該技術為早期靜態建模技術主流方案,精度可達 0.1 毫米,設備要求相對較低,是一種比較經濟的掃描方案。不過由於其掃描時間長達一秒至幾分鐘,難以滿足人體等運動目標重建需求,因此多用於工業、檢測領域。

另一種靜態掃描技術:相機陣列掃描重建正替代結構光成為主流的人物建模方式,其原理是通過相機陣列拍攝的圖片間的相同特徵點進行匹配、校準以重建人物模型,該技術在國際上已成功商業化 並被應用於電影、遊戲製作中。

動態光場重建技術是目前重點發展的方向,這類技術在搭建精細幾何模型之外,還可獲得動態數據,高品質呈現光影效果。動態光場的原理是使用成系統的、獨立的編程模塊控制光源的亮度、顏色,與相機協同,模擬各種光照環境,獲得不同光照下準確的模型。業界具有代表性的產品 Light Stage 5 被應用於《本傑明·巴頓奇事》、《阿凡達》等好萊塢大片 製作中。這項技術的開創者 Paul Debvec 也因此獲得了 Oscar SciTech Award。該技術由於成本較高、難以運輸、組裝難度高且尚未出現商業化的通用解決方案等原因,尚未在國內得到普及,國內的清華大學、商湯科技等已推進相關研究。

驅動:動捕技術側重明顯,逐步形成互補體系

虛擬人驅動部分按照基本邏輯可拆分為面部動作和肢體動作部分。面部動作部分最具挑戰的是嘴部動作,其基本邏輯為:以文本為起點,製作相關語音與動畫,並通過大量模型訓練,最終達到任意文本可驅動的模型。具體驅動方式有視頻算法訓練,即使用大量與文本綁定的語音嘴型視頻進行機器訓練;接着將語音與動作相綁定,從而達成文本輸入到特定動作的實現;最後通過相關設備採集點,將真人的面部動作還原到模型當中。在嘴型以外,其他面部動作目前多採用隨機策略,或某腳本策略循環播放預先錄製動畫,文本與動作間的匹配主要通過手動配臵,未來將在 AI 技術下實現自動化。

目前數字人肢體動作主要的生成方式是動作捕捉,具體實現方式是光學式、慣性式、電磁式及基於計算機視覺的動作捕捉。

虛擬人行業深度研究報告:乘元宇宙之風,虛擬人產業發展加速

1)光學式動作捕捉

光學動作捕捉的原理是首先跟蹤、識別並命名目標身上各反光標記點,得出目標的基本骨架,再通過空間中多個鏡頭對標記點位臵進行持續跟蹤,完成對運動的記錄。光學動作捕捉精度較高,但需通過相機的位臵角度建立三維空間坐標,對環境要求高,軟硬件造價高昂。

2)慣性式動作捕捉

慣性動作捕捉主要使用裝備於人體各主要骨骼節點上的慣性傳感器,來完成數據採集,最後通過處理建立運動的三維模型。慣性傳感器組成部分有集成加速度計、陀螺儀和磁力計等,可收集運動目標的各部位速度、姿態、方位等數據。慣性動作捕捉技術高度適應不同的環境,成本相對較低,使用便捷,能在某種程度上彌補光學動作捕捉的缺點,但精度較低、連續使用易產生累積誤差。

3)基於計算機視覺的動作捕捉

基於計算機視覺的動作捕捉技術使用多個不同角度的高速相機對目標進行拍攝,計算機視覺基於拍攝到的二維圖像、三維形狀特徵還原各關節點運動信息。該類動捕技術主要使用光學高速相機,動捕對象通常不需穿着設備,精確度高,成本相對低廉,近些年興起后獲得青睞並在不同的應用端逐步推廣;但計算量龐大、受環境影響大。

渲染:核心環節決定呈現效果,技術發展引領行業變革

渲染指對三維物體或虛擬場景加入幾何、視點、紋理、照明和陰影等信息從而達成從模型到圖像的轉變,渲染決定了最終作品的質量與風格。渲染技術的升級是綜合實力的體現,每一次技術提升對數字人皮膚紋理、3D 效果、質感和細節等方面提升巨大,目前常用的 3D 渲染引擎包括 UnrealEngine 4, CryEngine 3, Unity 3D 5,都具備豐富的應用經驗。

渲染技術分為兩類,離線渲染技術(預渲染技術)和實時渲染技術,其本質區別是在目前發展狀況各項局限下,對時效性和圖形質量間的取捨。離線渲染技術不關心完成速度,這類渲染技術主要應 用於影視動畫等方面,其對真實度、精細度有較高要求,可使用更多的計算資源。實時渲染技術重 點關注交互性與時效性,適用於用戶交互頻繁的場景,如遊戲、虛擬客服、虛擬主播等,此類場景要求快速創建圖像。目前圖形生產硬件和可用信息的預編譯等提高了實時渲染的性能,但其質量仍然受限於渲染時長以及計算資源。隨着硬件與算法的提升,實時渲染技術已具備較強的綜合表現實力,預計將逐步普及。

克服恐怖谷效應,迎接虛擬人時代

虛擬人製作如何克服恐怖谷效應是繞不開的話題。恐怖谷效應在 1970 年提出,指人們對機器人的正 面情感隨着其類人程度增加而增高,但當達到一個較高的臨界點時,其殘存的非類人特徵會變得十分顯眼,引起人們強烈的不適感。目前被廣泛接受的解釋是失敗的虛擬角色作品往往過於偏重最終效果的立體感,而忽視了渲染后皮膚材質的怪異,同時 CG 技術的不成熟導致角色失去微表情、眼神較為死板等不好的表現,引起觀眾負面聯想。

隨着技術的逐步發展,PBR、重光照等渲染技術克服了擬人角色的質感問題,同時更為先進的動作捕捉技術也有能力捕捉如眼球運動等細微的動作,Light Stage 為代表的新型建模技術更是能從初始環 節建模就幾乎做到以假亂真的程度。目前市面上的超現實虛擬人已證明尖端虛擬人製作技術已有能力克服恐怖谷效應,具備甚至超過現實角色的吸引力,預計隨着技術的進一步發展以及成本的降低。更多更精緻的虛擬人將服務人們的生活,並成為習以為常的一部分。

虛擬人行業深度研究報告:乘元宇宙之風,虛擬人產業發展加速

與,AI、算法的開發和建模數據積累還需要時間,尚難以實現高效率地生產高質量虛擬人。因此從製作成本上看,一個標準化的功能型虛擬人項目(客服、導遊等)基本需要投入十幾萬-幾十萬區間的成本,具體數額取決於建模精細度、渲染實時性、交互深度等技術細節。而虛擬偶像、虛擬 KOL 等製作成本則要更高,例如“鄧麗君”虛擬人、柳夜熙等,成本高達上百萬,如要在舞台現場表演 呈現更好的效果,則成本更高。

我們預計未來虛擬人成本有很大的降低空間,主要依賴於技術進步。雲計算可以幫助降低建模和渲 染階段的算力成本,5G 通信技術降低網絡傳輸成本,再加上 AI、算法、機器訓練、大數據的配合。未來或將出現綜合的虛擬人製作引擎,有效地將各類技術串聯應用,大幅度降低虛擬人製作門檻。目前已有部分平台層公司致力於發展虛擬人製作引擎,提供更有效率的製作平台服務。

3 應用邊際不斷延伸,商業空間拓展可期

功能型+身份型,各類虛擬人應用熱潮湧動

應用場景與虛擬人類型密不可分,功能型與身份型是當前虛擬人應用中最根本的兩個類別。功能型虛擬人作為現實職能的替代,應用於標準化內容生產中。根據內容生產的靈活性,又有非實時交互與實時交互之分。功能型虛擬人主要以替代人工生產,提高效率為目的。身份型虛擬人則是超越“替代”,擁有獨立身份,被賦予個性的人格特徵,參與現實生活中的娛樂和社交,以創造經濟收益。其又可細分為虛擬偶像類、虛擬角色類、虛擬化身類三種。量子位研究預測到 2030 年,功能型(服務型)虛擬人的市場規模將達到 955.4 億人民幣,占虛擬人整體市場規模的 35.4%。

虛擬人行業深度研究報告:乘元宇宙之風,虛擬人產業發展加速

身份型虛擬人:虛擬偶像打開應用先河,虛擬 KOL 欣欣向榮

虛擬偶像是身份型虛擬數字人的重要類別,也是主要的變現方式之一。1982 年,以手繪技術作支撐 的世界第一位虛擬歌姬林明美誕生,虛擬人首次被引入現實世界,其發布的音樂專輯取得驕人的成 績,證明了虛擬人利用高質量內容變現的商業模式的可行性。隨後職業偶像始終作為虛擬偶像發展主流,海外及中國均不斷推出歌唱類或唱跳類虛擬偶像,包括以初音未來為代表的日本虛擬歌姬,和以洛天依為代表的中國虛擬偶像,走出了較為成功的商業變現之路。

2016 年以後,虛擬角色興起,虛擬主播、虛擬 KOL、虛擬品牌形象頻頻出世,相較於職業偶像,虛 擬角色更垂直,在直播、電商、品牌營銷等細分場景參演。至今身份型的虛擬人應用領域中形成了 職業虛擬偶像與虛擬角色繁榮共生的局面。

虛擬偶像可以由原有 IP 衍生,也可以進行全新的 IP 創造:

1)依託原有 IP 打造虛擬偶像主要是通過已經存在的動漫、遊戲、電影、小說等,將其中的人物角色 在不改變其原本背景和人設的情況下,衍生出一個虛擬偶像,參與現實活動。被選擇虛擬化的人物 角色本來就擁有 IP,甚至是具有強粉絲效應的,因此該類虛擬偶像在前期的人設打磨與後期 IP 培育 上的成本投入相對較少,能更為快速地投入應用。

目前國內主要在遊戲及小說 IP 上進行虛擬偶像孵化。2019 年騰訊遊戲旗下《王者榮耀》IP 的偶像男團“無限王者團”正式出道,其成員由全玩家票選出的得票數最高的五位英雄組成。該虛擬偶像團 體開通微博、選拔粉絲製作人、登陸選秀綜藝,打造出沉浸式的破次元追星體驗。依託《王者榮耀》 這一款極具國民影響力的遊戲 IP,無限王者團擁有大量粉絲群體,持續推出專輯或單曲,演唱電視劇主題曲,與明星合作唱跳舞台,又反向拓寬了王者榮耀的 IP 邊際。

閱文集團旗下電競小說《全職高手》男主角葉修一經虛擬化出道,依靠原小說賦予其的榮耀網游全 職精通人設,就收穫網文 IP 的大批粉絲群體,其生日直播間人氣爆棚,迅速承接跨界代言,涵蓋食品、快消,甚至金融等領域,2019 年身價超 10 億。

2)創造新 IP 即虛擬人的人物背景、人物形象、人物設定等均由公司根據後期的商業化方向自行創作。偶像出世后再進行 IP 的培育以實現商業循環。這種線路下的虛擬偶像沒有先天的流量基礎,前期人物設計需要策劃上的創意,賦予其故事性和情感表達,3D 或超寫實虛擬人也需要持續的技術實力投入,後期為佔領市場贏得用戶在孕育 IP 中更離不開多元的資源渠道開闢。虛擬角色類因為面向 更為垂直的領域,多採用此方式以有針對性地打造更具個性的虛擬人物。

國內兼具虛擬人製作的核心技術、應用技術及內容運營一體的綜合性公司比較少,原創虛擬 IP 通常由內容運營較強的公司打造,技術進行外包。天矢禾念、魔塔時空、世悅星承等均已孵化出較為成 功的原創虛擬偶像,形成自己的特色虛擬人 IP。

虛擬偶像和 KOL 的迅速發展由供給和需求端雙方推動

從需求角度看,文化潮流和“宜家效應”是最重要的推動因素。艾瑞諮詢數據顯示 92.3%的虛擬偶像 愛好者年齡在 19-30 歲之間,Z 世代構成其主要消費群體。Z 世代出自美國社會對世代劃分的用語, 指 1995-2009 年間出生的人,即互聯網世代,又稱網生代。Z 世代在網絡、動漫等元素濃厚的世代成長,他們習慣於接觸並接納新興事物,二次元、偶像文化等要素已經成為了 Z 時代群體的標誌。

虛擬偶像所在的二次元、遊戲電競和偶像文化圈層正是 Z 世代最感興趣的熱點圈層,因此對於他們而言,虛擬人形式的產品更容易被接納並認同,更有機會引起自發的傳播。我們認為 Z 時代的身份意識、不斷增強的個性化需求、對小眾圈層文化的熱情將為虛擬偶像市場注入源源不斷的需求。

此外,虛擬偶像能利用“宜家效應”心理使其具備獨特的優勢。“宜家效應”指消費者傾向於將自 己投入勞動、情感而創造的物品價值高估的價值判斷偏差現象。傳統偶像經濟中,真實的偶像其作品人設等都通過其自身以及公司所打造,粉絲單方面接受其輸出的產品。而虛擬偶像具備高參與度的特性,其作品不僅限於官方發布的內容,粉絲可以有極高的二創自由度。例如虛擬歌姬洛天依,其擁有的上萬首原創歌曲中,有 90%的曲目都來自於同人創作,其中誕生了《權御天下》《普通 Disco》 《達拉崩吧》等多首高熱神曲。

低門檻且高自由度的二創不僅使虛擬偶像能無成本獲得大量優質作品,而且使參與的廣大粉絲們對偶像認同感、親切感更高,更能建立更長期、更深厚的情感連接。

從偶像產業供給的角度看,虛擬偶像 1)生命周期長,可以不斷迭代;2)純 AI 驅動下操控性強,延 展空間大,可以在任意時間使用;3)人設穩定無負面新聞。這些特點都使得其具有比真人偶像更高 的價值。

虛擬偶像的打造省略了藝人選拔與培訓環節,但在形象策劃與製作環節因為目前虛擬人技術門檻還較高、不具有規模效應,因此企業面臨較為高昂的製作成本。同時,前期對人設打造創意也提出較高要求,這與後續 IP 運營的開展息息相關。創造完成之後,在運營環節,為提高曝廣度,運營方需 要在渠道平台持續投放圖文或短視頻,這將帶來比真人偶像更高的運營費用,因為虛擬偶像製作一條短視頻內容成本可達數萬元。但在虛擬偶像價值的變現階段,其較真人偶像的優勢凸顯:虛擬偶 像生命周期長,可以不斷迭代,根據粉絲審美變遷可以不斷擴展內容;純 AI 驅動下操控性強,延展空間大,可以在任意時間使用。因此運營公司也有動力研發虛擬人,促使其應用的推廣。

另外,人設穩定不塌房也是虛擬偶像相比真人具有的巨大優勢。根據頭豹的調研,在以 95 後為調查 對象的問卷中,62.6%的受訪者喜愛虛擬偶像是因為永遠不會有負面新聞,永遠保持完美人設;其次是喜愛二次元文化,佔比為 49.6%,其餘如緩解現實中的焦慮、社恐等負面情緒也是原因之一。

偶像文化的心理基於粉絲將自身最為真實的情感寄托在其身上,從而深度綁定粉絲並影響粉絲從情緒到消費等行為。對真人偶像進行情感綁定的風險相對更高,而虛擬偶像產生醜聞或意外狀況的可能性微乎其微,更穩定可控,在娛樂圈醜聞頻出的當下,粉絲具備更高的安全感從而產生更毫無保留的情感寄託。

功能型虛擬人:已應用於多領域,是未來元宇宙的必要基礎設施

功能型虛擬人指替代部分人工職能,用於標準化內容生產的虛擬人,也可以稱為服務型虛擬人。虛 擬人技術與 AI 融合使很多公司可以在提供線上服務或產品時不僅能以更具親和力的方式提供原有服務提高用戶滿意度,而且能在每一筆交易中通過蘊含公司文化的虛擬形象更深入地向用戶種草並佔領用戶心智。

從早期無形態的語音機器人,到可以簡單交互的虛擬助手,如今更是向更具真人模態的實時交互虛 擬人發展,功能型虛擬人至今已經被應用於多種領域。隨着技術的成熟,其應用深度和廣度都將被進一步開拓,在未來元宇宙中,功能型虛擬人更是必要的基礎設施,擔任虛擬世界 NPC 角色。

傳媒領域:乘政策利好東風,虛擬主持人加速走進大眾視野。2021 年 10 月,廣電總局發布《廣播電 視和網絡視聽“十四五”科技發展規劃》,明確提出推動虛擬主播廣泛應用於新聞播報、天氣預報、綜 藝科教等節目生產,創新節目形態,提高制播效率和智能化水平。功能型虛擬人在這一政策利好下 將通過傳媒領域加速滲透。

早在 2004 年,央視電影頻道就推出了第一位虛擬主持人小龍,但由於當 時國內虛擬人技術不成熟,小龍的智能水平低,只是曇花一現。如今虛擬新聞主播和虛擬主持人已 經走向高擬人化和高智能化,在其 AI 系統支持下,不僅能通過文本輸入實現聲音加畫面的同步輸 出,大大提高內容產出效率和準確性,而且形象超寫實,可根據不同場景選擇姿態、動作、服裝等, 帶給觀眾良好的審美體驗。甚至在實時渲染技術加持下虛擬主持人能參與進節目錄製或直播中,完 成實時互動:2019 年小小撒亮相央視春晚直播,與撒貝寧互動;2022 年湖南衛視虛擬主持人小漾參與綜藝《你好星期六》錄製,與真人主持團互動。

金融領域:銀行引領虛擬人應用場景落地。功能型虛擬人在金融領域的應用較晚,2018 年才初具規 模,但隨着行業對金融科技投入的持續加大,虛擬人應用在金融領域迅速崛起。從金融市場細分結 構來看,虛擬人應用目前主要集中在銀行業,以虛擬客服或虛擬經理形態參與線上和線下銀行網點 工作,因為包括證券、保險、基金等金融機構開展的業務對個性定製化的要求較高,就目前虛擬人 技術而言,應對此類高靈活性工作尚且不足。

降本增效是虛擬人加速在金融業滲透的主要原因,以銀行為例,平均每個營業網點需配臵 1-2 個客服人員,人力成本高,並且無法提供 7*24 小時的服務,同時服務質量參差不齊;而虛擬人作為數字產 能,一經研製便能多地、多場景、多次且持續地使用,拋除支持虛擬人的硬件設備成本,應用的邊 際成本幾乎為零,且智能化服務能達到標準的統一。

其他:虛擬人在文旅、教育、醫療領域的應用已有嘗試。就文旅而言,與互聯網旅遊、智慧旅遊、 虛擬旅遊等有強聯動性的數字文旅產業經過疫情的催化正蓬勃發展,以虛擬講解員、虛擬導遊為代 表的功能性虛擬人將成為未來數字文旅的重要一環。商湯科技在 2020 年世界人工智能大會上展示的虛擬人小糖,是現“AI 上海·應用場景”現場展台的專屬講解員,可依託於展台前的滑動屏幕,講述預先設定好的講解內容,呈現出了文旅虛擬人應用的可預見性;醫療場景下虛擬導診員可以提供醫院導覽、導診,虛擬醫生助手可以針對病患情況作出基礎疾病的診斷,而多模態的 AI 虛擬醫生則可以充當家庭健康顧問,甚至對存在心理問題的病人提供關懷與陪伴。

本文鏈接:https://www.8btc.com/article/6740532

轉載請註明文章出處

(0)
上一篇 2022-04-02 22:40
下一篇 2022-04-02 23:38

相关推荐