科普 | 關於AIGC的十問十答

科普 | 關於AIGC的十問十答

圖片來源:由無界版圖AI工具生成

關於AIGC的十問十答

1、AIGC是什麼?

AIGC(Artificial Inteligence Generated Content),指的是通過人工智能技術自動生成內容的生產方式。

2、AIGC能生成什麼?

AIGC目前的範圍包括繪畫、文字、音頻、視頻。主要的創作內容形式都可由AI生成,更長遠來看包括虛擬人行為與思維、遊戲劇情與NPC交互等數字世界的絕大部分內容都可由AI生成,我們把AIGC看做面向Web3時代的生產力工具。

3、AIGC如何實現?

AIGC領域的技術包含了:生成對抗網絡(GAN)、變微分自動編碼器(VAE)、標準化流模型(NFs)、自回歸模型(AR)、能量模型和擴散模型(Diffusion Model)。總體趨勢來看,大模型、大數據、大算力是未來的發展方向。

目前兩個常用的模型是【生成對抗網絡GAN】和【擴散模型Diffusion Model】,算法模型的突破是近年來AIGC得以快速突破的催化劑。這兩種模型的實現原理如下:

1)對抗式生成網絡GAN

GAN,是一種深度神經網絡架構,由一個生成網絡和一個判別網絡組成。生成網絡產生“假”數據,並試圖欺騙判別網絡;判別網絡對生成數據進行真偽鑒別,試圖正確識別所有“假”數據。在訓練迭代的過程中,兩個網絡持續地進化和對抗,直到達到平衡狀態,判別網絡無法再識別“假”數據,訓練結束。

GAN模型的生成基於生成期和判別期的,這會導致也是可以做這個創作,但創作之後不確定性非常強,可能生成了一張圖,但是不是你想要的就很難說。另外,更多是在一個生成,一個判別,是對原始圖的模仿做的,這一塊會導致生成的圖像質量分別率比較差的。因此主要用於AI實驗室,而更常見於商業應用的擴散模型。

2)擴散模型Diffusion Model

擴散模型的生成邏輯相比其他的模型更接近人的思維模式,也是為什麼近期 AIGC擁有了開放性的創造力。本質上,擴散模型的工作原理是通過連續添加高斯噪聲來破壞訓練數據,然後通過反轉這個噪聲過程來學習恢複數據。訓練后,我們可以通過簡單地將隨機採樣的噪聲傳遞給學習的去噪過程來生成數據。

從更技術的角度來看,擴散模型是一個潛在變量(latentvariable)模型,通過馬爾科夫鏈映射到潛在空間。馬爾可夫鏈是狀態空間中經過從一個狀態到另一個狀態的轉換的隨機過程,下一狀態的概率分佈只由當前狀態決定。在這一過程中逐步添加高斯噪聲來獲得近似的后驗概率q(𝑥 ! |𝑥!"#),其中𝑥 # ……𝑥 ! 均是潛在變量,並且它們的維度與原圖𝑥$ 一致。

科普 | 關於AIGC的十問十答

擴散模型中添加的高斯噪聲是一種概率密度函數符合正態分佈的函數,當 AIGC 運用擴散模型來生成內容的時候,是通過在一副純白的畫布(隨機白噪聲)上逐步去噪來生成最終的目標畫作。即用戶給出的文本描述形容詞,來從一個模糊的概念逐步具象。我們可以簡化為多個正態分佈函數的疊加,模型選擇其中重疊的區間輸出,這也是一個逐步縮小範圍的過程。這與人類的思維模式很類似。

簡言之,在 AI 訓練階段,我們將數據集中上億組圖文對進行訓練,提取特徵值;生產過程中,通過添加文字描述,引入不同的特徵值進行去噪,從而生產一副 AI 理解下的內容 作品。例如,在當我們在腦海中想象一個畫面的時候,比如:一隻柯基通過一個小號玩火焰。我們的思維模式也是先有一隻柯基,再去想象小號和火焰,最後將這些元素疊加在柯基身上。

科普 | 關於AIGC的十問十答

4、AIGC目前的效果如何?

以下截圖來自我們親自體驗AIGC項目。

無界版圖(https://www.wujiebantu.com/ai

輸入:一名女分析師正坐在辦公室寫關於AIGC的報告,透過窗子可以看到外灘的夜景

輸出:

科普 | 關於AIGC的十問十答

Mid-journey(https://www.midjourney.com/)

輸入:a female analyst is sitting in the office and writing a report about AI generated content, through the office windows there is a night view of the Bund in Shanghai

輸出:

科普 | 關於AIGC的十問十答

Jasper生成的報告(https://www.jasper.ai/)

輸入:write a article about AI generated content, should include the definition, history, usages, current development and opinions about future, with details and example。(大意:寫一篇AIGC文章,須包含定義、歷史、用途、目前的發展和未來的觀點,需要有細節和案例)

輸出:

科普 | 關於AIGC的十問十答

5、AIGC的效果取決於什麼?

模型、數據、算力

算法模型:

首先取決於算法模型,相比於其他模型,擴散模型的優勢在於生成的圖像質量更高,且無需通過對抗性訓練,這使得其訓練的效率有所提升。同時,擴散模型還具有可擴展性和并行性。目前大部分公司採用開源的生成模型,例如stable diffusion、disco,但也有的平台基於自己整體的模型實現AIGC,如mid journey。開源模型類似於安卓這類開源系統,不同的公司還可在其上實現定製開發,以適應不同風格和需求。

而通過相同擴散模型實現的AIGC,其效果取決於數據集與模型訓練。前者需要大數據,後者需要大算力。

數據集:用於訓練的圖文對的數量和質量都會影響到生成效果。目前主流的文本編碼器是來自於OpenAI的Clip模型,其通過4億組文字-圖片對進行訓練,但由於圖文對絕大部分時英文內容,對中文的支持較弱。因此,高質量的圖文對訓練素材庫也是AIGC的核心競爭力。

模型訓練:在用圖文對實現模型訓練的過程中,需要龐大的算力支持,算力決定了訓練的數據量從而決定了訓練效果。

6、AIGC有什麼應用場景?

就目前而言,內容產業中的許多內容生成都已經有AIGC的影子。

媒體配圖

巴比特全面擁抱AIGC,採用AI生成圖片為頭條文章配圖

科普 | 關於AIGC的十問十答

文案編寫

Jasper已經開始為谷歌、臉書等知名公司提供文案AIGC的商業服務。

科普 | 關於AIGC的十問十答

代碼生成

GitHub Copilot是一個GitHub和OpenAI合作產生的AI代碼生成工具,可根據命名或者正在編輯的代碼上下文為開發者提供代碼建議。官方介紹其已經接受了來自 GitHub 上公開可用存儲庫的數十億行代碼的訓練,支持大多數編程語言。

科普 | 關於AIGC的十問十答

音頻剪輯

AIGC生成音頻早被應用於我們的日常生活當中。我們常用的手機導航,可以切換不同明星甚至於卡通人物的語音提示。這是通過提前請明星或卡通人物的配音朗讀完成一個語音庫,再通過反覆的訓練學習使得可以用指定的聲音說出任何話。我們自己也可以通過高德地圖錄製自己的語音導航包。而更深層次的應用將會是虛擬人領域,AIGC不僅可以生成虛擬人的聲音,並可以創造出說的內容。虛擬人在未來有望和我們一樣表達自己的想法,靈魂逐步顯現。

7、AIGC的版權屬於誰?

AIGC屬於前沿領域,目前處於大眾使用的初期,對於版權歸屬問題行業尚無定論。主要有兩種看法,一類認為內容由素材庫訓練生成,本身來自於素材庫,需要對相關的素材作者提供版權付費。另一類認為整個AIGC產生內容的過程是一個完全隨機且創新內容的過程,不存在版權問題,版權歸屬於AIGC的用戶或者平台(視平台的具體規定而定)。目前的實踐中,第二種為主流情況,但乾淨且合規的訓練數據集對長期商業合規性仍有幫助。

8、AIGC的商業化落地?

AIGC的商業模式類似於Saas服務,對B端和C端收取訂閱費用。以jasper為例,成立還不滿兩年的獨角獸企業Jasper在最新一輪的融資里獲得了1.25億美元資金,目前估值為15億美元。用戶可以通過文字描述讓Jasper幫助完成文章的創作、創建廣告話術,而不會存在抄襲的嫌疑。目前,Jasper擁有7萬多名客戶,包括Airbnb、Ibm等企業。僅2021年一年便創造了4000萬美元的收入,今年預估收入為9000萬美元。

這個領域非常新,商業模式的探索有很大潛力。例如圖庫型的收益方式,AIGC圖片平台會積累出龐大的無版權問題的原創圖片,配合圖庫搜索能夠媲美現有的圖庫服務。AIGC社交網絡的結合也是值得關注的方向,相較於現有UGC平台,AIGC進一步降低了創作門檻,讓更多用戶參與到內容的創作分享中。在未來的一兩三年裡可能以工具收費為主流,但長期來看會像當今互聯網一樣有五花八門的各種各樣的應用。

AIGC的成本主要在於需要龐大的算力,以無界版圖為例,目前拿的都是比較高端的A40這種,整個訓練的長度都是百張以上的高端顯卡做的。另外一種像C端整體我們做畫的時候基本上使用的V100、A100,以及剛才提到的相對高端的卡做,目前雲計算的整體算力支持比較通用的。在每天創作量大幾十萬時,數百張卡同時支撐才能支持這麼大的創作量。

9、如何看待AIGC與元宇宙未來發展?

從主題投資的角度看,區塊鏈、元宇宙、Web3均描述了數字經濟時代中宏大的應用場景,而去年被資本市場關注的虛擬人、NFT等只是其中的具體應用之一。我們認為,AIGC將是推動數字經濟從Web2向Web3升級的重要生產力工具:一方面,其對現有的殺手級應用——短視頻、遊戲等具有顛覆式影響,或進一步擴大內容量、提高成癮性,同時對社交和廣告提供新的工具;另一方面,Web3開放、共建的價值觀下,UGC、AIGC的內容會更具吸引力,二次創作、開放想象的浪潮將來臨。目前AIGC已成為硅谷最新熱門方向,國內一級市場、互聯網大廠等對AIGC應用關注度也在快速提升中。

科普 | 關於AIGC的十問十答

10、AIGC的投資標的有哪些?

科普 | 關於AIGC的十問十答

本文節選自國盛證券研究所已於2022年11月13日發布的報告《國盛區塊鏈 | AIGC__Web3時代的生產力工具》,具體內容請詳見相關報告。

本文鏈接:https://www.8btc.com/article/6788538

轉載請註明文章出處

(0)
上一篇 2022-11-17 10:33
下一篇 2022-11-17 11:04

相关推荐