通用智能面臨巨大掣肘,國產AIGC還在尋找光明

來源:“數科星球”(ID:digital-planet),作者:苑晶

通用智能面臨巨大掣肘,國產AIGC還在尋找光明

圖片來源:由無界版圖AI工具生成

AIGC背後充滿了故事,在一家家企業手握巨額融資之時,人們耳邊再次響起了警鐘。誠然,在新的浪潮之下,符合商業規律的企業才能笑到最後。在國外競品大踏步前行之際,國內的通用智能企業境遇如何?

前景很樂觀,但當下似乎並沒那麼好過。

來自OpenAI的壓力

似乎OpenAI的進步更快。

“我覺得我們和OpenAI的差距越來越大了”,一位AIGC從業者對數科星球(ID:digital-planet)這樣表述。前些日子,在ChatGPT推出后,不僅是英文對話,在中文領域,該系統的用戶體驗也超越了國內的眾多產品。以至於,一時間,人們的朋友圈被ChatGPT的對話刷屏。

“最早,我測試過一些特殊的中文語境,ChatGPT表現不好,不過最近我在測試的時候發現它進步很快”,這位技術人員曾以諸如“關公戰秦瓊”等有中文歷史背景的話術測試機器人,他發現,最近這款產品在中文適配方面有了明顯進步。

赤裸裸的對照實驗結果出現后,技術派的內心是焦慮且複雜的。一些國內企業對我們表示,以目前的進度來看,光是追上OpenAI,就感覺“很吃力”。

雖然,目前OpenAI的終端產品由於眾所周知的問題未在國內市場全面鋪開,但對於具有技術理想的相關企業來說,這種滋味是十分難受的。有人將這種情況描述為北斗未出現時的導航行業,“從信創的角度考慮,中國的AIGC是肯定要有的,但技術差距也是不可忽視的”,一位投資人評價道。

客觀來說,造成國內AIGC落後於同行的原因是多方面的:有A100顯卡的獲得受到制約、國內人才隊伍發展較慢等諸多原因。其中,在硬件方面,大模型訓練過於依賴進口GPU顯卡,雖行業間出現了便宜的國產替代品,但以目前的技術水平,還不能給出滿意的性能支持;而在人才隊伍方面,一些行業人士稱“算法工程師多,但會大模型的鳳毛麟角”。

全局來看,當下,似乎僅有百度公司、清北高校等團隊立志於全身心投入於此。大模型所談者甚多,但行業“孤勇者”數量寥寥。

國產AIGC的進擊障礙

擺在通用智能或大模型發展之路的另一個障礙是小模型。

我們在文章中所提到的“大模型”概念是一個術語。之所以稱之為大模型,因其在訓練數據過程中引入多模態等數據,讓數據標註的數量大規模增加,使之展現可打破行業藩籬的普適性。相對於小模型而言,具有通用性好、邊際成本低、效率高等特點。

後來,OpenAI再次點燃人們對通用智能的期待。在一些具有前瞻思維的技術派眼裡,大模型對於各行各業的影響將是摧枯拉朽式的,他們一致認為大模型是“當之無愧”的未來發展方向。也就是說,技術上,大模型的發展上限更高,其會在未來某個時間點達到各種小模型的用戶體驗閾值。

由於大模型的橫空出世,小模型統治AI的格局被打破。應該說,就本質而言,兩種技術路線背後代表着不同的利益。以至於,互聯網上,網友對兩種技術路線的討論十分熱烈:一會有人指責大模型是“大鍊鋼鐵”,一會又有人攻訐小模型是“亞當斯密小作坊”式的抱殘守缺。

客觀來說,小模型在當今的市場競爭中仍然具有重大影響:從業者們通過算法微調、反覆訓練數據等措施下,一些產品收到了不錯的效果,對於客戶而言,甚至在一些領域內的結果要好於大模型產品。

其次,國內通用智能的AIGC缺少數據訓練場景。

類似ChatGPT的訓練場景尤為缺乏。在上文提到過的,這款產品之所以短時間之內進步神速,因大量用戶為其充當了免費的數據標註員。不過,已目前情況來看,可與ChatGPT相較的數據訓練場景在國內還鮮有見到。

另外,產業界對大模型有着濃烈的觀望情緒。

在對談多家相關企業后,數科星球(ID:digital-planet)發現了產業界對AIGC持觀望態度的主要原因。概括來說,業界普遍存在這樣的憂慮:目前大模型應用不成熟,驟而上馬將會對原有業務造成衝擊。

以電商售後和銀行電話客服場景為例,目前行業內仍採用主流智能客服公司推出的QA問答庫技術。客戶企業希冀大模型產品能夠解決QA庫無法承擔的長尾問題,覆蓋到檢索式問答路徑無法涉足的領域,但金融行業的語料庫等數據又不對外開放,讓大模型企業不得不重頭開始。

這都延遲了大模型進軍具體行業的時間表。

目前,一些從業者透露,金融科技公司願意為大模型企業提供“必要但不致命”的應用場景。在這些場景中,客戶企業可以承受一定程度的容錯,也願意投入時間和資源支持大模型的進一步發展。“我們的主要客戶來源於金融機構的創新部門,因為他們支持一些通用智能的事情”,一位銷售人員對數科星球(ID:digital-planet)這樣說。

“死馬當活馬醫,反正沒辦法解決長尾,不如讓大模型試試”,這是金融行業業內給出的真實看法。甘願“冒風險試一試”的場景有公文寫作、情感理解等。

總結而言,通用智能企業需要客單價高、數據訓練場景豐富的派單需求,但這個問題又與企業的現實考量和預算投入相互矛盾。

沒得數據用來訓練、沒得大錢(投資除外)養活產品,是擺在現實的兩大難題。

國內AIGC的擴散難

元宇宙爆火,燃遍各行各業。它能否成為助力通用型AIGC擴散的有力平台?

這是一個有趣的想象。答案是,可以,但很難。

目前,AIGC和元宇宙的發展雖然存在相關性,不過就目前的情況來看,二者還未完全合流,處在“你做你的、我做我的”的階段。

舉例來說,在一些社群中,我們曾討論這樣的使用場景:在在線繪畫App中嵌入AIGC功能,使用戶在提交繪畫作品后自動生成AIGC圖片。面對這個問題,某些供應商對數科星球(ID:digital-planet)分享:“實際上,在第三方App中嵌入AIGC難度很大,要有能力處理高併發,要低延時,從而不影響用戶體驗”,在他的想法中,甲方的需求可以滿足,但如若在實時在線的基礎上,成本頗高。

退而求其次,供應商給出了離線生成或自建圖庫的方式滿足需求(自建圖庫是預先在系統保存大量已經生成的圖片,用戶有需求時直接調用)。但很明顯,這種折中的方式違背了AIGC設計的初衷。時間長了,對於訓練大模型更是無從談起。

在同樣爆火的數字人中,AIGC的應用場景也不算多。目前,市面上絕大多數數字人均屬“服務型數字人”。它們被廣泛應用在虛擬的辦事大廳、博物館、手語電視台的手語節目等場景之中。

剖開數字人產業鏈可以看得更加直觀:在這個產業鏈中,底層為算法層,負責驅動面部表情和手勢動作;中層為渲染層;上層為構成層,負責建立數字人圖像。但除了底層“數字腦”領域,其他層面與通用智能結合較少。

在某知名投資機構投資人看來,“未來的數字人會相當多”,他認為,人們會擁有具有服務和陪伴屬性的虛擬分身。但在技術上,想讓人工智能具備情感陪伴功能還尚需時日,“至少目前技術是達不到的”,一位技術人員補充說。

整體來看,目前的數字人大多承擔著IP形象功能,能說話的數字人還比較少。在一些先進的數字人中,“中之人”又是必不可缺的因素(其承擔動作捕捉、虛擬拍攝、表情抓取和後期合成、渲染精修等工作的真人)。表面上,這種數字人比較高端,但其背後通常有大量人員為其服務,製作成本雖有所降低,但整體製作成本也並不低廉。

以上原因都阻止了AIGC或通用智能擴散至尋常百姓家。

結尾:企業顯然不會坐以待斃。他們給出的策略大體分為三塊:對外投資以擴充數據訓練場景、夯實客戶關係以獲取現金流、堆人堆設備砸錢砸出大模型。

以上基本盤是投資機構給出的巨額投資。

“這好比把高科技做成了勞動密集型企業”,一個業內人士哂笑。不過,在當下的時間點,這是沒辦法的辦法。技術上,只要機器足夠、標註正確,哪怕是“堆”,也可達到預期目的。

錢的方面,高科技企業已下定決心“內卷”數字經濟同行,有銷售人員將其稱之為“關係是第一生產力”。不過這種思路面臨一個問題,就是大模型和通用智能的認知度要高。

“我們拜訪了很多客戶,但很多人其實根本不理解大模型”,一位業內人士對數科星球(ID:digital-planet)表述。在他的眼裡,傳統數字經濟在新技術面前有巨大的提升空間。

舉例來說,比如政務大屏。

“之前為調取一個地方數據,大屏只能靠下拉、下拉、再下拉的方式調用,而現在對語音助手說‘我要今年的生產情況’,就能自動生成”,這位業內人士解答,在他眼裡,東西是好東西,但在買家面前變成了另外一個景色:“如果一個領導想做,他只需要1個理由去做,如果他不想做,他會找出100個理由不做”。

AIGC熱潮高企,但一線銷售人員往往會頻頻碰灰。在高科技浪潮風起雲湧的當下,很多人承擔著不能言說的苦衷。

本文鏈接:https://www.8btc.com/article/6799100

轉載請註明文章出處

(0)
上一篇 2023-03-24 20:47
下一篇 2023-03-24 20:48

相关推荐