2022，AIGC元年？

文：刺蝟公社，作者：世昕，編輯：石燦
本文轉自鈦媒體

圖片來源：由無界版圖AI工具生成

2022年12月16日，Science雜誌發布了2022年度科學十大突破，韋伯望遠鏡當選為年度最大科學突破，可謂實至名歸。而在其他入選的科學突破中，AIGC也赫然在列。

這或許是當下最炙手可熱的概念了。無論是火遍全網的AI繪畫，還是震驚世人的ChatGPT，都屬於AIGC這一概念，即生成式AI。憑藉著諸多明星技術、產品的問世，誰也沒有想到，在元宇宙、web3等概念叱吒風雲的2022年裡，AI憑藉“創作”強勢崛起了。

有人認為，AIGC將會改變內容領域的生產方式，帶來整個行業的變革，也有人認為AIGC將會取代大多數創作者，帶來災難性的影響。在各種言論甚囂塵上之時，一個共識似乎悄然達成了，從2022年開始，AIGC將迎來完全不同的發展時期。

2022年，真的是AIGC的元年嗎？

AIGC編年史

首先明確一個定義，何為AIGC？

跟PGC、UGC、PUGC等概念一樣，AIGC即是指利用人工智能技術生成內容，也就是說內容的製作者從實打實的人或機構變成了AI。

AI繪畫最早要追溯2014年，GAN（生成式對抗網絡）的誕生。據說人工智能專家Ian Goodfellow在一次酒後想到了這一深度模型概念，基於CNN（深度卷積神經網絡），GAN創造性地將兩個神經網絡進行對抗，即生成器與鑒別器。生成器用於生成“造假數據”，鑒別器用於判斷數據的真偽，在兩者的對抗中，逐漸演化出強大的“造假能力”，而這種造假能力則用於圖像的合成。

GAN被稱為21世紀最強大的算法模型之一，Ian Goodfellow也一躍成為AI領域最知名的專家之一。2015年開始，GAN開始被投入實際運用中，相關的論文也爆髮式增長，也成為AI生成圖像、處理圖像任務里最常見的存在。

在GAN大放異彩的2015年，一家公司在美國硅谷成立，其背後站着“鋼鐵俠”埃隆·馬斯克、Y Combinator總裁阿爾特曼、天使投資人彼得·泰爾等一眾硅谷大佬，這家公司就是ChatGPT的締造者——OpenAI。

OpenAI創立的初衷是預防人工智能帶來的災難性影響，推動人工智能發揮積極作用，雖為公司，但OpenAI是一家非營利機構，是馬斯克等大佬用愛發電的產物，在創立之初，大佬們投入了10億美元用於AI的開發。2016年，OpenAI進一步明確了自己的目標，即向AGI（通用人工智能）研究發力，致力於讓AI成為改變人類生活的新技術。

OpenAI最大的特點即是“Open”，即開放AI能力，全球研發者都可以通過其提供的開發與研究框架投入AI開發中，共同促進AI技術的發展。也是從2016年開始，OpenAI推出了自己的AI平台Universe。故事轟轟烈烈地開始了。

時間來到2018年，Transformer 架構的發展改變了NLP（自然語言處理）技術的發展，預訓練模型的引入改變了一切。GPT系列正是OpenAI在NLP（自然語言處理）領域打造的模型，其第一款產品GPT-1也是在2018年正式推出。GPT-1的獨特之處在於“半監督”，在此前的NLP模型中，AI需要基於特定任務對大規模數據集進行學習，而這些數據是需要“監督”的，即人為地對數據進行標註。

GPT-1則可以在開始進行無監督學習的預訓練，通過對數據的學習增強語言能力，最後進行部分有監督的微調。簡單來說，GPT-1可以用更少的資源和數據進行更具效率的學習，但GPT-1仍舊是青澀的，一方面礙於訓練數據的有限，AI的“世界觀”很有限，另一方面其性能仍舊不夠好，遠遠達不到對話的能力。

自2018年開始NLP領域迎來了飛速發展，也從某種程度上改變了AI生成圖像的未來，也就是AI繪畫。

2020年是翻天覆地的一年。彼時，OpenAI推出了GPT-3，相比前兩代，這一次GPT實現了進化，GPT-3的參數超過1750億個，是人腦神經連結的十分之一，與此同時GPT-3的性能也更強，它能夠識別更深層次的文本含義，並進行反饋。GPT-3的推出是一場革新。

與此同時，在圖像生成領域，一場革命也在發生。儘管GAN已經能生成較高質量的圖片及內容，但相較來說，其效率較低，同時生成的圖像始終難以令人滿意。而Transformer架構的出現改變了一切，自此開始，圖像合成領域告別了GAN時代，NLP與計算機視覺技術搭配的新時代來臨了。

隨後便是我們熟知的故事了。2022年9月，AI繪畫爆火，11月30日，ChatGPT橫空出世，正式讓全世界看到了AIGC的“強大”。

AIGC國內玩家

在OpenAI等行業巨頭的帶領下，海外AIGC產業正處於一個高速發展時期，那麼在國內，AIGC發展到哪一步了？

首先我們需要認識到一個現實，相較於美國，國內AIGC領域的發展是相對滯后的，但近幾年來，阿里巴巴、百度、騰訊等互聯網巨頭都注意到了AIGC這一未來的產業富礦。

國內AI領域，繞不開的一家公司即是百度。

在五個月前的百度世界大會上，百度CEO李彥宏就着重強調了AIGC，他認為，AIGC不僅能夠提升內容生產小籠包，還能創造出有獨特價值的獨立視角的內容。在世界大會上，百度AI也展示出了自己的實力：在十分鐘內復原了《富春山居圖》的殘卷，其背後依賴的深度學習模型，即是百度的當家模型——文心大模型。

文心大模型起源於2019年，是百度深耕預訓練模型的產物，其核心特色在於“知識增強”，能夠對海量數據進行深度學習，並為多種AIGC應用提供支持。目前為止文心大模型已經發布了超過十多個大模型，形成了一個大模型家族。

在世界大會兩個月後的萬象大會上，百度還發布了AI助理，根本上是多種AIGC應用的集合，包括文本生成、圖片生成，圖片轉換視頻等多種功能，最值得關注的一點是，其直接面向用戶與內容創作者，也就是說，AIGC技術的C端應用化正在實現。

AIGC也不止圖像生成、文本生成等領域，AI創作同樣是多元的，音樂、編程等領域同樣在飛速發展。

就在不久前，崑崙萬維高調宣布入局AIGC領域，併發布了“崑崙天工”模型。這一成立於2008年的公司早期以遊戲代理起家，自2016年起，崑崙萬維在海外建立起龐大業務，成為國內知名的出海巨頭之一，近年來，崑崙萬維更是發力元宇宙社交等領域，而這一進軍AIGC，也是早有準備。

自2020年起，崑崙萬維便組建了超過200人的AIGC團隊，訓練集群200張卡，投入數千萬元，並在2021年4月研發出了百億參數的中文GPT-3模型。值得關注的是，在很多人忽略的音樂領域，崑崙萬維也取得了不錯的進展，於2022年1月啟動的SkyMusic已經可以實現生成商用級別的音樂。

值得注意的是，崑崙天工選擇開源，與百度一樣，崑崙萬維堅信開源能夠給AIGC帶來更長效的發展力，並致力於降低AIGC技術的使用門檻，讓AI能夠幫助更多內容創作者。

除了以上提到的這兩家公司外，在國內AIGC領域，垂直賽道的初創公司也勢頭正勁，覆蓋AI音樂、虛擬人、AI音頻語音、AI遊戲等領域。

但另一個事實也同時存在，相較於OpenAI等海外巨頭，國內AIGC領域公司仍存在較大的差距，一方面在組織架構方面，國內基本都基於公司自身的科研團隊，而OpenAI等組織更類似一個研究院，能夠通過開放共享的模式吸納全球頂尖科研人才。

另一方面，國內AIGC相關公司面對的營收壓力客觀存在，很難像OpenAI等平台不計成本的進行投入。但伴隨着AIGC逐漸成熟的商業化以及更廣泛的應用，或許國內AIGC領域即將迎來春天。

為何元年？

回到最開始的那個問題，2022年為何會被看作AIGC的元年？

其實深入了解AI繪畫與ChatGPT就能理解這一說法：

2022年8月，人工智能公司Stability AI推出了AI文生圖模型Stable Diffusion（擴散模型），將AI圖像生成的效率與精度提升到了前所未有的量級，在最基礎的終端設備上，只需輸入關鍵詞，就能生成高質量的AI圖像，幾乎讓整個世界為之瘋狂。AI繪畫的爆髮式發展也第一次讓C端感受到了AIGC的強大魅力。

而ChatGPT的到來更令人震驚。作為基於GPT-3.5的對話式AI，ChatGPT最大的特點即是能夠“理解”對話者的語義，能夠進行更有效的反饋，並進行連續對話。基於對超大規模數據的深度學習，ChatGPT在文本生成領域幾乎能“以假亂真”，讓你認為其真的擁有了意識。此外，ChatGPT不僅能答疑解惑，還能寫故事、作詩，甚至編程，生成內容的能力空前提高。

AIGC元年的秘密就藏在這兩個模型里。

第一，在性能上，AI已經實現了“進化。相比以前的GAN圖像生成模型，Stable Diffusion最大的特點就在於精準，只要輸入對關鍵詞，其就能產生較為接近的圖像結果，這是此前的圖像生成很難做到的。ChatGPT也同樣是高性能的，有人幾乎把它當做了谷歌一樣的搜索引擎，正是在於其對於文本的深度分析並能夠生成較為精確的反饋。而各種生成內容則進一步顯示了其性能的強大。

第二則在於“理解”。這點在ChatGPT上體現的更加明顯，相比此前的對話AI，人們驚奇的發現，ChatGPT似乎能夠理解文本更深層次的含義，無論是連續流暢的對話，還是對於錯誤想法的糾正，都讓人感覺到對面的AI似乎是有思想的，儘管其只是類似“中文屋”的深度學習的產物，但強化學習模型的加入會讓其不斷進化，對話任務也完成的更加出色。

最後則在於更大範圍的應用。相比於此前的“圈內狂歡”，2022年的AIGC真正做到了全民關注，這是技術飛速發展下的產物，以Stable Diffusion為例，其最大的特點即是低門檻，不需要多強大的顯卡與服務器，最普通的PC就能完成任務。同時平台的封裝也讓AIGC更加“平易近人”，AI繪畫僅需要輸入關鍵詞，ChatGPT也只需要網頁和提問欄就能實現對話，這讓普通人接觸AIGC的機會大大增加了。

AIGC在2022年的火爆，是技術積累與發展策略雙重變革的產物，從某種角度來看，稱之為元年也並不為過，只不過2022年更應該是AIGC的“應用元年”。

AIGC也還有很長的路要走。一方面，在“創造”這一概念面前，基於深度學習的AI的創作是否真正是創造還難以定論，另一方面知識產權問題也像一把達摩克利斯之劍始終懸在AIGC頭上，如何解決AI學習背後的倫理問題也是一大難題。

但在AI技術的發展問題面前，以上問題可能都是細枝末節了。正如OpenAI等平台所期望的那樣，AIGC並不是最終目的，真正實現通用人工智能才是最核心的目標。

本文鏈接：https://www.8btc.com/article/6794164

轉載請註明文章出處