觀點:數字人被百度玩明白了

作者 | 郭照川 編輯 | 麻吉

來源:霞光社

一直以來,數字人被認為是元宇宙的入口。

7月6日,在2022百度世界大會的預溝通會上,一位紅髮少女率先登場,以兼具“科技感”和“專業度”的虛擬形象,在此次會議全程擔任了關鍵的串詞、控場、提問和嘉賓介紹工作。

實用型虛擬數字人正在走進大眾視野,百度旗下數字人度曉曉就是其中之一。雖然她的“主業”是百度App的虛擬AI助手,但度曉曉同時又被賦予了實用性的“多重身份”:

她既是參加過國內頂尖藝術院校畢業展的“AI畫家”,又是成功挑戰過高考命題作文的“AI作家”,還是創作過歌曲、接過廣告、發行過MV的“AI偶像”。

作畫、譜曲、做主持、寫作文、陪聊天……百度硬核技術支持下的數字人特有的創造性和交互性,讓人不得不相信現實世界與“元宇宙”的邊界正在被打破,數字人則將成為與日常生活密切聯結的有力輔助。

擁有個性化交互能力的數字人,真的存在嗎?元宇宙發展到現在,最先進的數字人又被賦予了哪些意想不到的能力?

觀點:數字人被百度玩明白了

圖源:2022百度世界大會預溝通會

從二次元到“N次元”

談到虛擬人物,難離“二次元”。

從初代虛擬偶像初音未來,到許多傳統行業的數字代言人形象,基本上都是由二次元人物設計脫胎而來。

對於“二次元”來說,創造是最難的。雖然這些數字人外觀設計得十分完美,但應用路徑也非常單一,哪怕是超寫實數字人形象,都脫離不了無法實現交互、本身無法創造的局限。

而在今年的西安美術學院的本科畢業展上,有一系列命名為“無界”的畫作,打破了傳統數字人的創造“結界”。

這一系列作品的創作者,是百度數字人度曉曉。雖然畫面由AI數字人所繪,但也被美院教授認證為 “已經達到了本科美術生的基本要求”。其商業價值同樣不可小覷,這些繪畫數字藏品其中的四幅,在獲展出之前就已經賣出了超過17萬元的高價。

今年6月7日高考結束后,度曉曉又以全國新高考Ⅰ卷作文《本手、妙手、俗手》為題,在40秒的時間內完成了審題、邏輯、創作等步驟,創作出了40多篇不同的高考作文,還被高考研究專家申怡老師,評判為可以打出48分的“高分作文”。

不久前,“#國內首個可交互虛擬偶像度曉曉”還登上了熱搜。她作為百度數字人作詞、編曲了歌曲《每分 每秒 每天》,還和龔俊數字人一起舉辦了新歌發布會直播。知名樂評人耳帝也認為,度曉曉背後的人工智能創造內容確實可以“提高創作效率、降低門檻、輔助創作”。

在AI內容創作能涉及的領域內,度曉曉幾乎無處不在,於是她也被大家笑稱為元宇宙時代“最卷數字人”。除了能寫會畫的“數字才女”度曉曉,百度旗下另一位數字人希加加,也吸引了不少關注目光。

希加加一度被稱為“第一個吃到漢堡的數字人”。在成都和大連的繁華街頭,希加加成為數字人新品推薦官,從麥當勞門店上方的巨大屏幕中閃身而出,抓住了一隻大漢堡,一瞬間虛擬與現實的連接讓人過目難忘。

觀點:數字人被百度玩明白了

圖源:麥當勞

她不僅成為了“00號太空數字乘客”,登上了我國第一艘數字載人飛船,還接下了和Qee熊、FE賽車一起合作設計的許多任務,儼然像一個賽博朋克的新員工了。

目前數字人真正落地后,展示出來的實際使用價值,已經超出了我們想象中的認知邊界——從被動的二次元單薄形象,演變為能備實理解能力,能實現創意作品的自動生成的數字人物,給世界帶來越來越多的驚喜。

從被設定問答程序的單一“二次元”,到富有創意、適用場景更多元的“N次元”,度曉曉和希加加等百度“AI數字人家族”的出場,讓數字人賽道的前景變得更加驚艷。

告別“虛火”,鋪開實際應用價值

隨着“元宇宙”和“Web 3.0”概念崛起,數字人成為當下最熱的風口之一。

根據艾媒諮詢數據,2021年中國數字人產業市場規模和核心市場規模分別達到1074.9億元和62.2億元,預計2025年將達到6402.7億元和480.6億元。光是2021年全年,虛擬數字人相關投資就有16筆。

2022年第一個月,虛擬人領域百起融資金額累計已經超過了4億元人民幣。曾經推出知名虛擬IP“翎”的魔琺科技,也在今年4月剛剛完成了B輪和C輪共計1.3億美元的融資。

伴隨着市場對數字人的極高期望,也出現了很多質疑聲音。

許多人認為目前元宇宙以及數字人尚處在非常早期的階段,反而是風颳得太猛,導致只剩下“概念橫行”“一把虛火”。此類看法並非空穴來風,當下依然存在着許多行業隱憂,例如數字人AI驅動技術不達標、實際應用場景不足、製作成本太高等等。

然而,隨着數字人的應用場景和技術提升,此次百度數字人也展示出了其特殊性:

度曉曉和希加加與市面的上其他數字人的不同,她們最大的突破點就在於已經實現了“可交互”——無論是度曉曉還是希加加,都可以在多樣化的實際應用場景中高度擬真,實現像真人一樣互動。

度曉曉已經具備了對話能力。閑來無事,用戶可以像真人一樣隨時和她聊天,或者讓她唱歌來聽,獨特的情感交互系統讓她像一個隨時在身邊的虛擬助手,又像一個真實存在的可靠夥伴。

觀點:數字人被百度玩明白了

圖源:百度APP

甚至面對不同的人的交互方式,個人性格和愛好,度曉曉也會呈現出不一樣的理解和反饋。也就是說,在你身邊的數字助理度曉曉,無時無刻都和你共同處於向更優秀的自己的進化之中。

除了對話,度曉曉還能真正做到“理解”用戶,區分閑聊與搜索意圖,滿足用戶提出的更多生活需求。例如當你告訴度曉曉“想要看電影”時,她會像朋友一樣給你推薦影片。而如果你的需求是“想要喝咖啡”,她甚至能自動跳轉到咖啡小程序,方便你下單一杯咖啡外賣。

虛擬朋友穿插進整個生命過程的陪伴,滿足能交互、有回應、滿足多種功能需求,才是理想中數字人的“最終形態”。

數字人之戰:大廠實力圖鑑

各家互聯網大廠,紛紛在數字人領域瘋狂加碼。

不久前,字節跳動收購了虛擬社交公司“波粒子科技”,也是看上了其擁有的虛擬人物形象自定義核心技術,意在為元宇宙再添一張牌。近年來專註於智能語音和AI技術的科大訊飛,也在去年年底上線虛擬人交互系統1.0,試圖拓寬人工智能生態。

事實上,百度在很早之前喊出了“All in AI”的口號,2020年就已經籌備上線的度曉曉,誕生於元宇宙浪潮發端之初,一開始就具備了AI驅動下的視覺識別和語音識別能力,背後百度又有AIGC(AI generated content,人工智能創造內容)內容技術的支持。

百度旗下的虛擬人家族,在互聯網大廠的元宇宙賽道競爭中的優勢也很明顯。

根據第三方機構發布的榜單,百度憑藉多年以來語音、視覺等AI能力的積累,在數字人綜合實力方面排名第一,尤其在數字人大規模落地領域,有着強大領先實力。

一方面,百度數字人背後擁有知識增強大模型“文心大模型”。

度曉曉、希加加都是具備AIGC能力的數字人,度曉曉創作的AI畫製成的數字藏品,在百度上線24小時內就賣出了8700多份。而這種平均每幅畫用時只需要數十秒的數字人創作,完全顛覆了當下已知的內容生產模式。

這樣令人驚異的AIGC高效輸出能力,則是依託於百度文心大模型。數字人的繪畫創作技能,靠的就是文心大模型-跨模態圖文生成模型ERNIE-ViLG。

另一方面,百度AI算法得到突破,使得數字人的製作成本極大收縮,降低了批量生產數字人的門檻。

百度集團副總裁袁佛玉,在2022百度世界大會的預溝通會上也表示,“隨着百度AI算法的突破,能讓數字人製作成本十倍、百倍地下降,還能讓數字人生產周期,從動輒幾個月,縮短到小時級別。”

這一切,都讓數字人大規模應用落地,甚至讓實現“人均一個數字人小助手”的元宇宙未來理想成為可能。這也正是今年百度世界大會的主題“AI深耕,萬物生長”所闡釋的,在出行、產業、生活等領域,人工智能都將發揮前所未有的作用。

7月21日,度曉曉、希加加等百度AI數字人家族成員,都將深度參與到百度2022世界大會之中。

今年的百度世界大會,更像是一場對於尖端人工智能技術的一次創新式全民科普。擁有強大創造實力,具備陪伴和交互能力,且能實現可控成本批量複製的數字人,已經為我們打開了元宇宙的大門。

本文鏈接:https://www.8btc.com/article/6763524

轉載請註明文章出處

(0)
上一篇 2022-07-08 17:30
下一篇 2022-07-08 18:09

相关推荐