科技企業怎麼都開始卷AIGC了?

作者:陳彬

來源:飯統戴老闆

科技企業怎麼都開始卷AIGC了?

一場始於藝術的“風暴”,已經席捲到了一級市場。8月,由AI創作而成的繪畫《太空歌劇院》在一場藝術大賽中獲得頭獎,一時間全球嘩然。當人們討論“畫師會不會因此失業”時,VC卻嗅到了機會。

科技企業怎麼都開始卷AIGC了?

《太空歌劇院》

9月,紅杉發表了一篇題為《Generative AI: A Creative New World》的文章,盛讚“生成式AI”巨大的商業應用潛力,且很快會出現“殺手級應用”。而該文的署名作者GPT-3,正是個生成式AI。

生成式AI的主要功能是創作內容,包括繪畫、文章、音樂等等,走的是文藝青年路線。而過去人們所熟知的多是分析式AI,擅長各類數據分析工作,是一個木得感情的運算機器。AI從“工具人”搖身一變,開始大搞藝術,催生了一個全新的領域——AIGC,即AI內容創作,眼下極具話題度的AI繪畫正是其中一個賽道。

隨着紅杉等頭部VC對AIGC愈發關注,原本曲高和寡的AI產業也熱鬧了起來。這些翻天覆地變化的背後,AI產業到底經歷了些什麼?

進化:AI的革新

AI繪畫之外,更多其他類型的AIGC產品也在走入日常生活。前些日子,著名AI實驗室OpenAI推出的AI聊天機器人ChatGPT爆紅,上線五天已有100萬用戶。它是開頭提到那位AI寫手GPT-3的升級版,內容風格更適配聊天場景。從寫作、繪畫,再到聊天,AIGC迎來了井噴期。

當下種種繁榮,是AI產業近十年積累產生質變的結果——更強大的工具、更優秀的模型,以及更豐富的數據,三者缺一不可。

在工具端,隨着AI產業逐漸挖掘出GPU的潛力,AI研究成本得以大幅下降,成功擺脫了“只燒錢不賺錢”的瓶頸。

此前AI產業主要使用的工具是CPU——特長是複雜的運算,但單個CPU效率不高。所以2012年AI科學家吳恩達搞研究時,需要同時用上16000個CPU,約等於四五十個網吧的規模,花掉了足足100萬美元成本。但研究者們後來發現,AI運算實際相當簡單,用“高智商”的CPU實在屈才。

科技企業怎麼都開始卷AIGC了?

用上16000台CPU后,AI終於能識別出貓的樣子

相比之下,GPU雖運算能力弱,堪比“三年級小學生”,但在AI領域完全夠用;更重要的是,GPU的效率極其拔尖。吳恩達後來算了筆賬:如果把當年實驗的工具換成GPU,只需要12個,成本驟降。

此前,AI產業曾兩度步入黃金時期,又兩度陷入停滯——第一次遇到的問題是算力不足,第二次是成本過高。但GPU的出現,堪稱一石二鳥:不僅成本更低,且算力仍能保持周期性提升,這構成了新一輪AI黃金時代的基石,也替AI模型快速迭代提供了基礎條件。

AI模型是各種應用構建的地基。近十年,AI模型屢屢迎來技術性突破,成功讓AIGC從科幻小說照進現實。例如2015年,谷歌在一篇革命性的論文中,介紹了全新發明的transformers神經網絡架構——而這正是GPT-3和ChatGPT的基礎。至於討論最多的AI繪畫,其模型更迭速度更快:

2014年,吳恩達的學生Ian Goodfellow有了重大突破——他設計出了生成式對抗網絡GAN。其原理簡單來說,是給負責創作的AI增加一個“審核員”,讓創作者和審核員互相內卷,以此生成更高質量的繪畫。這套模型後來被廣泛使用並不斷改良,其作品後來更通過了著名的圖靈測試——這意味着AI已經初步具備人類智能。

2021年,OpenAI實驗室又更進一步,開源了全新的深度學習模型CLIP——其顛覆性在於,AI變得能夠將圖片和文字,這兩個不同維度的數據關聯在一起。

CLIP的意義相當重大:過去種種AI繪畫模型,多是依靠輸入海量圖片數據來生成繪畫作品;CLIP的出現,意味着人們可以通過輸入關鍵詞來生成對應圖片——而這正是如今席捲全球的AI繪畫應用的地基。

科技企業怎麼都開始卷AIGC了?

崑崙天工AI繪畫作品

CLIP模型的“魔力”,是經由40億個具有文字標籤的圖片數據反覆訓練的結果——這些數據全部搜刮自互聯網的各個角落。日益浩瀚的互聯網數據海,構成了AI產業快速發展的第三個條件。

上述三重Buff加持之下,AI行業一腳油門駛上了高速公路,闖入了公眾視野。但對整個AI產業而言,技術突破只是解決了第一道障礙;除此之外,AI產業還有另一個長期困擾的難題。

突破:商業與價值

2020年初,著名工程與機器人設計公司波士頓動力正面臨第三次“賣身”,買家將會是韓國現代汽車集團。短短8年時間,該公司已從谷歌、軟銀再到現代汽車“三易其主”,頗有種燙手山芋的既視感。

可單論技術實力,波士頓動力其實是業內標杆:收購前,光機器人相關的專利文獻就有至少70篇,堪稱美國國防部的親兒子,從其手中獲得了大量訂單。波士頓動力曾替美軍研發了運送物資用的LS3機器人、跳躍式軍事偵察機器人Sand Flea,以及軍用人形機器人ATLAS等等。

波士頓動力的機器人產品內,AI是“靈魂”所在:它能夠使機器人保持“學習”,不斷優化其運行效率。

AI雖能讓各種多足機器人的腳法日漸出神入化,卻沒法讓波士頓動力賺錢。2019年,波士頓動力發布了首款商用產品——工業用四足機器人Spot,希望能有工廠買單。可等到第二年業績一出,外界發現該公司又凈虧損了1.03億美元,幅度還較往年擴大了六成。

科技企業怎麼都開始卷AIGC了?

Spot:跳舞救不了波士頓動力

波士頓動力過去的困境,也是AI產業的真實寫照:空有一身功夫,卻沒有太多的用武之地。

一項技術只有從實驗室走向商場貨架,其社會、商業價值才能最大化。軍事需求或許能帶來短暫繁榮,但終歸支撐不起一個行業,類似的故事曾在半導體產業上演過:消費電子時代的起點,向來不是五角大樓內的超級計算機,而是售價僅有19000日元的索尼TR-55晶體管收音機。

過去,AI產業能造的“收音機”僅停留在人臉識別等少數領域;但隨着生成式AI大規模湧現,一個全新的超級應用場景正呼之欲出。

日常生活的一些角落,AIGC已悄悄發力。隨便打開一個影視解說視頻,大概率會聽到一句“注意看,眼前的男人叫小帥”“眼前的女人叫小美”。這些格式整齊劃一的流水線視頻,正是AI配音的產物。

而眼下大火的AI繪畫,也已被包括遊戲在內的諸多內容行業所採納。靈游坊CEO梁其偉曾在微博上提到,很多同行已經開始使用AI繪畫,例如美術會將一些枯燥重複的圖像處理工作交由AI,以提升工作效率。但在他看來,AI繪畫的長期價值,在於加深了遊戲創作的工業化程度。

如今一款電子遊戲最大的成本,通常是美術——玩家對畫面日漸挑剔是一大原因,但各種無效開銷也居高不下。

因為遊戲製作人並非都是美術出身,難免會出現需求表達不準確的時候,更何況每個人對美的理解也都不盡相同。這就導致美術天天加班連軸轉,但最後交出去的成品,製作人怎麼看怎麼“不對味兒”,只能不斷打回重畫。

但隨着AI繪畫不斷進步,未來遊戲製作人可以更低成本地試錯,甚至能大膽嘗試一些截然不同的美術風格,這讓很多積極創新的遊戲公司深感如獲至寶。

科技企業怎麼都開始卷AIGC了?

AI繪製的“克蘇魯+武俠”題材作品

而在音樂領域,AI甚至成功彌補了音樂史上的一大遺憾。2021年底,貝多芬管弦樂團首次演奏了“完整版”的《第十交響曲》。這部曲子曾是貝多芬的遺作,他在生前只寫完了第一樂章;AI在學習了它過往所有作品的數據后,續寫了這部曲子。

至於前些日子方才走紅的ChatGPT,已然有不少聲音認為,它或將成為新一代搜索引擎。

毫無疑問,AIGC具有龐大的應用與商業潛力。只是它本身所具有的顛覆性,也引起了許多普通人的不安。事實上,人們對AI的不信任由來已久。

21世紀初,加州大學的音樂學教授David Cope曾做過一場實驗:彼時,聖克魯茲音樂節上演奏了一連串原創曲目,現場觀眾一度掌聲雷動,心潮澎湃;可當他揭露出真相時,掌聲瞬間變成了憤怒的謾罵。因為所有原創曲目均由是他設計的一款AI,模仿巴赫創作出來的。沒有心靈的AI創作出的藝術品,怎麼能和人類情感共鳴呢?

AIGC出圈后,社會輿論關注最多的議題,依舊是AI對藝術的顛覆性,卻忽視了背後的潛力。

僅從當下的廣泛應用已能夠明顯看出,AIGC明顯能夠輔助生產力更高質、高效地創作內容。從長期來看,AIGC或許能夠極大地解放生產力和創造力,在內容創作以及更多領域掀起一場進化與變革。

搶灘:定義新時代

新時代幕布拉開前夜,準備搶灘登陸的大廠已早早開始了內卷。國內互聯網企業向來以應用創新見長,迅速製作出了多款AI繪畫應用。

但AIGC不同於過去的移動互聯網,僅靠應用層面的競爭顯然有些不太夠。從該AI產業的歷史能夠能夠明顯看出,AI模型的迭代進步,才是AIGC爆發的直接原因。毫不誇張地說,誰掌握了更先進的AI模型,誰就擁有了開啟新時代的鑰匙。而在AI模型這一細分領域,實際也有中國企業的身影,而崑崙萬維就是其中之一。

這家公司對國內用戶來說或許略顯陌生,但它在海外市場擁有相當可觀的市場成績。

崑崙萬維旗下的招牌之一StarMaker,靠着“K歌+社交”的玩法,成為海外最大的在K歌類產品,擁有2.4億名註冊用戶和2萬名以上的認證歌手。該應用曾有一個衍生產品StarX MusicX Lab,正是崑崙萬維的AI音樂模型,也是國內第一款商用級作曲AI模型。

如果仔細觀察,會發現崑崙萬維在AIGC的其他領域也有深入布局,其AI模型水準也不遜色於國外科技公司:

首先是圖像領域:Stable Diffusion是當今AI繪畫模型的天花板,但其適用的關鍵詞僅限英文。而崑崙萬維設計的分支模型不僅保留了原有功能,同時集合了海量中文數據,其收錄的關鍵詞甚至包括了古詩詞。

除此之外,崑崙萬維也在AI編程領域有所探索。這是全球第一款多語言開源編程大模型,每秒輸出百字代碼以上。

還有文字領域:實驗室通過200張顯卡訓練了4周,打造出一個擁有百億級參數的GPT-3生成AI,擁有續寫,對話,中英翻譯,內容風格生成,推理,詩詞對聯等功能。

科技企業怎麼都開始卷AIGC了?

崑崙天工AI繪畫作品

對於一家公司來說,押注一個尚未成熟的新興領域,既需要魄力,也需要技術儲備,還得有多元化的業務作為生態支撐。AI模型是整個產業的基礎,以此為地基才能催生出各種超級應用。結合崑崙萬維的業務結構,這種基礎設施也能和它已有業務產生奇妙的化學反應:

崑崙萬維的Opera瀏覽器如今已是全球下載次數最多的獨立瀏覽器,坐擁3億多月活。在規劃中,崑崙萬維能夠以此為中樞,將各式各樣的新聞等內容產品提供給用戶。

如果AIGC賽道繼續保持增長,崑崙萬維還有機會再拿到一張“供給”牌,因為AIGC供給的內容有無可替代的優勢:相比於專業創作者生產的PGC,AIGC的效率更勝一籌;至於普通人創作的UGC內容,其內容質量和創作效率又很難和AIGC匹敵。

由此可見,AIGC能夠帶來高質、高量的內容供給,與Opera瀏覽器互相賦能,是一個典型的第二曲線增長路徑。在如今消費電子需求萎靡,互聯網增長見頂的環境下,一個能夠落地的增長空間,既是行業需要的,也是資本市場苦苦尋覓的。

科技企業怎麼都開始卷AIGC了?

崑崙天工AI繪畫作品

而且從眼下發展趨勢來看,這個高速增長的未來並非“畫大餅”,而是已然肉眼可見:

Gartner曾在一份報告中預測,2023年產出的內容產品中,約有20%會來自生成式AI;而到了2025年,生成式AI產生的數據將提升至整個互聯網的10%。

而在某些具體領域中,變革將更加明顯:如今AI生成的新聞初稿,已經接近人類記者寫作30分鐘的水準。科技公司Narrative Science的創始人大膽預測,到2030年時,9成以上的新聞寫作將由AI輔助完成。

在《Generative AI: A Creative New World》這篇文章的最後,紅杉認為今天的AI產業,與十年前智能手機剛剛興起那會兒頗為相似:智能手機曾憑藉GPS、相機和移動網絡等新功能,催生了諸多超級應用並創造了全新的市場;如今,逐漸走向技術成熟的生成式AI,也會重演一遍智能手機的歷史——定義下一個時代的競賽已經開始了。

科技企業怎麼都開始卷AIGC了?

參考資料

[1] Generative AI: A Creative New World

[2] AIGC深度產業報告,量子位

[3] AI繪畫何以突飛猛進? 從歷史到技術突破, 一文讀懂火爆的AI繪畫發展史,Web3天空之城

[4] 未來簡史,尤瓦爾-赫拉利

[5] 靈游坊CEO梁其偉:不用AI繪圖,可能是老闆太傲慢,遊戲葡萄

[6] 2021年預測:人工智能對人類和社會的影響,Gartner

作者:陳彬

本文鏈接:https://www.8btc.com/article/6794636

轉載請註明文章出處

(0)
上一篇 2023-03-22 13:24
下一篇 2023-03-22 13:24

相关推荐