商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

來源:量子位

國產ChatGPT之戰,已然是大步邁進白熱化階段。

就在剛剛,商湯正式發布自研類ChatGPT產品,名曰商量(SenseChat)。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

單單是這個名字,便值得說道一番。

商量的“商”,不僅體現了它是商湯自家“商字輩兒”的產品;從整體來看,更是具有商討、交換意見的味道。

畢竟我們在使用類ChatGPT產品過程中,恰巧就是一種人機協同的過程:不應是一味的問與答,而是通過引導等方式讓輸出結果趨於理想。

在商量的背後,所依託的是商湯自研的千億參數自然語言處理模型。

而在此模型的背後,則是商湯最新推出的日日新(SenseNova)大模型體系。

也正是因為這種的能力,商湯的發布還不同於此前國產類ChatGPT玩家,它一口氣還發布了:

  • 秒畫:AI內容創作社區平台。
  • 如影:AI數字人視頻生成平台。
  • 瓊宇格物:3D內容生成平台。
商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

更重要的一點是,根據商湯CEO徐立在現場的描述,上述這些AIGC產品所要發力之處,將是諸如醫療、短視頻、教育、營銷以及開發等產業領域。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

但不得不說,這一波科技之戰,着實是愈演愈烈了。

“商量”的體驗實錄

那麼商湯的AIGC產品,效果又是如何?

我們在前方現場也體驗了一下。

先來看下商量這款產品,是否真的能做到商量。

多輪對話能力展示

既要多輪對話,又要人機共創,那麼和它商量着創作一個故事,便是很好例子:

我們來一起創作兒童故事吧。規則是我先說一句,你再說一句,交替進行。直到我說故事編完了就結束。你明白了么?

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

在我們下達指示之後,“商量”表示了理解,然後就開始了“你一句我一句”人機共創故事的之旅:

人類:小花是一隻小貓咪,他很喜歡釣魚。
商量:小花在河邊釣魚,他釣到了一條大魚。
人類:大魚對小花說,請你放我回去吧,我家裡還有小魚在等着我呢。
商量:小花心地善良,他同意了大魚的請求,把大魚放回了河裡。大魚感激地遊走了,小花也繼續享受着的釣魚的樂趣。

從這個過程中不難看出,“商量”是可以理解用戶的語義,了解故事中的角色和關係,並且能夠get用戶的思路,基於此以多輪對話形式來完成故事的創作。

(要是讓小朋友們跟“商量”一起創作故事,怕是能玩上一整天吧。)

不僅如此,在體驗過程中,我們還發現“商量”是具備一定共情能力的。

例如當我們處於迷茫之際,可以向它提問:

如何提高自我認識,更好地了解自己?

此時的“商量”彷彿可以抓住問題背後人類內心真正的需求,回答中的“學會愛自己”、“學會自我肯定和鼓勵”,顯得格外暖心。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

當然,多輪對話僅僅是對話機器人能力展示的一隅。

接下來,我們就要拿網友們經常調侃AI的諸多問題,來開啟更高難度的挑戰了!

只認事實,不認“老婆說的都對”

當然,創作能力是聊天機器人能力的一面,但對於事實的尊重也是非常重要的一點。

對於此前被網友們玩壞的“老婆說的都對”,“商量”又會如何應對?

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

嗯,老婆在事實面前是真的不好使了。

我們再來一個更天馬行空的胡謅:

請告訴我以下陳述是否包含時代錯誤:在盟軍轟炸硫磺島海灘期間,拉爾夫大聲地對着自己的iPhone說話。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

“商量”面對這麼一句胡謅,直接指出了iPhone與二戰的時代背景不符,可見其不僅能理解句子的意思,還能通過嘗試判斷句子的合理性。

那麼對於非常繞的邏輯問題,“商量”是否也能輕鬆應對?

請聽題目:

假設False與True是False,則True與not False是?

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

講真,人類都得思忖半天的“繞彎問題”,“商量”不僅能夠秒出結果,還能把推理過程一併給出。

超長文本也能hold住

正如我們剛才提到的,“商量”是一個To B的產品,那麼它定然需要解決的問題不是“片段性”的。

為此,商湯在現場還演示了基於“商量”背後的大模型,開發了幫助用戶進行新知識獲取和理解的助手工具,是可以輕鬆hold住超長文本的那種。

例如把一本《專利法》投餵給它,我們就可以向它諮詢很多專業性的問題了:

什麼樣的東西可以申請專利?

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

從結果上來看,這個工具並不是直接從《專利法》中copy對應的結果,而是模型理解了問題之後,生成並總結了答案。

基於這樣的能力,以後我們在工作上的效率提高程度,可見一斑。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

不僅如此,剛才我們投喂的《專利法》是2020年的版本,而今年國家知識產權局就專利申請是提出過新的要求的。

從我們提問“今年規定有沒有新的變化”的回答中不難看出,模型確實融合了最新的資訊,並給出了合理的答案。

再如同樣是基於大語言模型,商湯麵向開發者所打造的AI代碼助手,可以提供代碼補全、註釋生成代碼、測試代碼生成、代碼翻譯、代碼修正、代碼重構、複雜度分析等功能。

據了解,AI代碼助手可以同時支持中英文及多種編程語言,並且可以快速適應開發者的個性化編碼風格。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

從根據商湯內部測試的結果來看,在使用“AI代碼助手”后,代碼編寫效率可以提升62%,Humaneval測試集一次通過率可以達到40.2%。

馬斯克中國遊記,2秒鐘就能搞定

除了對話機器人之外,商湯AI作畫產品“秒畫”也是本次發布的一大亮點。

話不多說,直接上效果。

我們同樣是先來看看被網友們玩兒壞了的一個Prompt:

中國80年代,馬斯克在河南的農村,穿着當時年代的中國服裝。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

嗯,是有那個味道了。

而且更為關鍵的是,生成512K圖片僅需2秒鐘!

不僅如此,商湯在現場演示的過程中,還展示了逼真效果版的港風美女。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

同樣是2秒出圖,引得現場觀眾“哇”聲一片:

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

那麼除了這種趣味性的以文生圖,“秒畫”的作品是否能夠達到在產業中的應用水平?

我們繼續試驗:

明亮的場面,鳥瞰圖,中國古代城市,水晶,魔幻,幻想,華麗的光作用,透明度,鏡面反射,華麗的光,錯綜複雜的細節,精細的紋理,超現實,單反攝影,廣角鏡頭,照片,現實,鋒利的焦點,超鋒利。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

不得不說,如此恢宏壯麗的景象,是把想象拉進現實的那種了。

若是想生成與太空探索主題相關的高清大海報,這個也可以有,只需把這句話投喂進去:

一艘閃閃發光的飛船繞着一顆巨大的氣態巨行星的月球旋轉,在天空中盤旋着雲,飛船在月球前氣態巨行星前,美麗的科幻藝術,超現實的白日夢。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

不難看出,“秒畫”是經得住考驗的那種AI了。

除了以文生圖之外,我們再來看下AI數字人生成平台。

據了解,商湯的“如影”僅需要5分鐘真人視頻素材,就可以生成出聲音及動作自然、口型準確、多語種精通的數字人分身。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

再如“瓊宇”和“格物”,基於神經輻射場技術(NeRF),可以高效低成本生成大規模三維場景和精細化的物件,為元宇宙、虛實融合應用打開新的想象空間。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

由此可見,商湯的AIGC能力已然是做到了全面覆蓋,並且水平也是肉眼可見的達到了可以“上崗”的水平。

那麼接下來的一個問題是:

怎麼煉成的?

背後的日日新大模型,便是煉成“商量”、“秒畫”等一眾AIGC產品的殺手鐧。

日日新,顧名思義,是指模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI更多可能。

(取自《禮記·大學》中湯之盤銘曰“苟日新、日日新、又日新”)

從現場展現的能力來看,日日新大模型能夠提供的能力,主要集中在了自然語言處理、圖片生成、自動化數據標註、自定義模型訓練等。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

但日日新大模型並非是趁着這一波AIGC大熱潮,一蹴而就出現的那種。

其實早在五年前,商湯便已經在大模型領域着手研發。

並且在2019年,商湯便使用上千張GPU進行單任務訓練,推出了10億參數規模的視覺模型,並實現了當時業界最好的算法效果。

後來在2021年到2022年期間,商湯訓練並開源了30億參數的多模態大模型——書生。 

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

就目前來看,商湯已經成功研發了320億參數量的全球最大的通用視覺模型;並且已經打造了CV、NLP和AIGC相關大模型。

因此,不難看出商湯此次發布的超大模型體系,其實是早有所準備,通過五年來的各項“小作業”,融會貫通並提交了一項“大作業”。

值得一提的是,在此次發布會中,商湯表示“日日新”將提供多種靈活的API接口和服務,包括圖片生成,自然語言生成,視覺感知通用任務與標註服務!

……

但有一說一,多模態和決策智能大模型,並非是商湯通往通用人工智能(AGI)的唯一殺手鐧。

大模型時代,大算力更為重要

沒錯,商湯自己的超強算力,正是另一項更為關鍵的因素。

它便是於2022年1月交付使用,首付56億元,一舉成為亞洲最大的AI超算中心之一的人工智能計算中心(AIDC)。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

一年之前,商湯AIDC的總算力便已經是3740 Petaflops,如此算力之下,已經可以完整訓練萬億參數規模的大模型。

時隔一年,現如今,這個算力數字已然是翻了個小翻,達到了5000 Petaflops!

它可以以最大4000卡規模集群進行單任務訓練,並可做到七天以上不間斷的穩定訓練。

商湯版ChatGPT「商量」來了!開放API,基於千億參數大模型,體驗實錄在此

商湯科技AIDC展廳中的裸眼3D展示

但了解商湯的朋友都知道,這個AIDC還僅是商湯AI大裝置SenseCore的一部分。

除了AIDC這個算力層之外,加之數據層和模型層兩大維度,便構成了“三位一體”的AI大裝置。

因此,綜合來看,商湯在通往AGI道路上的範式,便是“大模型+大算力”。

而如此布局的背後,在今天的發布會中,商湯對此的邏輯思考也逐步浮出水面,AGI時代之下,數據、算法和算力三要素有了新的需求:

計算量(GPU數量 x 運行時間 x 并行效率 )= 模型參數量 x 處理數據量。

怎麼理解?

模型參數量要足夠多,才能實現AI智慧的湧現,而這也帶來了對算力的劇增,需要更高的并行效率,才能有效支持大參數模型訓練。

數據方面,高質量自然語言數據逐漸稀缺,而視覺數據相較自然語言在數量、質量、容納信息等方面有多種優勢,能夠使得AI更好地理解世界。

由此,就不難理解商湯如此布局的原因了。

……

總而言之,有大數據、有大模型、有大算力,商湯在國產AIGC的亮相,一點也不意外。

是值得期待一波了。

本文鏈接:https://www.8btc.com/article/6813108

轉載請註明文章出處

(0)
上一篇 2023-05-06 00:40
下一篇 2023-05-07 18:55

相关推荐