商湯版ChatGPT「商量」來了！開放API，基於千億參數大模型，體驗實錄在此

來源：量子位

國產ChatGPT之戰，已然是大步邁進白熱化階段。

就在剛剛，商湯正式發布自研類ChatGPT產品，名曰商量（SenseChat）。

單單是這個名字，便值得說道一番。

商量的“商”，不僅體現了它是商湯自家“商字輩兒”的產品；從整體來看，更是具有商討、交換意見的味道。

畢竟我們在使用類ChatGPT產品過程中，恰巧就是一種人機協同的過程：不應是一味的問與答，而是通過引導等方式讓輸出結果趨於理想。

在商量的背後，所依託的是商湯自研的千億參數自然語言處理模型。

而在此模型的背後，則是商湯最新推出的日日新（SenseNova）大模型體系。

也正是因為這種的能力，商湯的發布還不同於此前國產類ChatGPT玩家，它一口氣還發布了：

秒畫：AI內容創作社區平台。
如影：AI數字人視頻生成平台。
瓊宇、格物：3D內容生成平台。

更重要的一點是，根據商湯CEO徐立在現場的描述，上述這些AIGC產品所要發力之處，將是諸如醫療、短視頻、教育、營銷以及開發等產業領域。

但不得不說，這一波科技之戰，着實是愈演愈烈了。

“商量”的體驗實錄

那麼商湯的AIGC產品，效果又是如何？

我們在前方現場也體驗了一下。

先來看下商量這款產品，是否真的能做到商量。

多輪對話能力展示

既要多輪對話，又要人機共創，那麼和它商量着創作一個故事，便是很好例子：

我們來一起創作兒童故事吧。規則是我先說一句，你再說一句，交替進行。直到我說故事編完了就結束。你明白了么？

在我們下達指示之後，“商量”表示了理解，然後就開始了“你一句我一句”人機共創故事的之旅：

人類：小花是一隻小貓咪，他很喜歡釣魚。
商量：小花在河邊釣魚，他釣到了一條大魚。
人類：大魚對小花說，請你放我回去吧，我家裡還有小魚在等着我呢。
商量：小花心地善良，他同意了大魚的請求，把大魚放回了河裡。大魚感激地遊走了，小花也繼續享受着的釣魚的樂趣。

從這個過程中不難看出，“商量”是可以理解用戶的語義，了解故事中的角色和關係，並且能夠get用戶的思路，基於此以多輪對話形式來完成故事的創作。

（要是讓小朋友們跟“商量”一起創作故事，怕是能玩上一整天吧。）

不僅如此，在體驗過程中，我們還發現“商量”是具備一定共情能力的。

例如當我們處於迷茫之際，可以向它提問：

如何提高自我認識，更好地了解自己？

此時的“商量”彷彿可以抓住問題背後人類內心真正的需求，回答中的“學會愛自己”、“學會自我肯定和鼓勵”，顯得格外暖心。

當然，多輪對話僅僅是對話機器人能力展示的一隅。

接下來，我們就要拿網友們經常調侃AI的諸多問題，來開啟更高難度的挑戰了！

只認事實，不認“老婆說的都對”

當然，創作能力是聊天機器人能力的一面，但對於事實的尊重也是非常重要的一點。

對於此前被網友們玩壞的“老婆說的都對”，“商量”又會如何應對？

嗯，老婆在事實面前是真的不好使了。

我們再來一個更天馬行空的胡謅：

請告訴我以下陳述是否包含時代錯誤：在盟軍轟炸硫磺島海灘期間，拉爾夫大聲地對着自己的iPhone說話。

“商量”面對這麼一句胡謅，直接指出了iPhone與二戰的時代背景不符，可見其不僅能理解句子的意思，還能通過嘗試判斷句子的合理性。

那麼對於非常繞的邏輯問題，“商量”是否也能輕鬆應對？

請聽題目：

假設False與True是False，則True與not False是？

講真，人類都得思忖半天的“繞彎問題”，“商量”不僅能夠秒出結果，還能把推理過程一併給出。

超長文本也能hold住

正如我們剛才提到的，“商量”是一個To B的產品，那麼它定然需要解決的問題不是“片段性”的。

為此，商湯在現場還演示了基於“商量”背後的大模型，開發了幫助用戶進行新知識獲取和理解的助手工具，是可以輕鬆hold住超長文本的那種。

例如把一本《專利法》投餵給它，我們就可以向它諮詢很多專業性的問題了：

什麼樣的東西可以申請專利？

從結果上來看，這個工具並不是直接從《專利法》中copy對應的結果，而是模型理解了問題之後，生成並總結了答案。

基於這樣的能力，以後我們在工作上的效率提高程度，可見一斑。

不僅如此，剛才我們投喂的《專利法》是2020年的版本，而今年國家知識產權局就專利申請是提出過新的要求的。

從我們提問“今年規定有沒有新的變化”的回答中不難看出，模型確實融合了最新的資訊，並給出了合理的答案。

再如同樣是基於大語言模型，商湯麵向開發者所打造的AI代碼助手，可以提供代碼補全、註釋生成代碼、測試代碼生成、代碼翻譯、代碼修正、代碼重構、複雜度分析等功能。

據了解，AI代碼助手可以同時支持中英文及多種編程語言，並且可以快速適應開發者的個性化編碼風格。

從根據商湯內部測試的結果來看，在使用“AI代碼助手”后，代碼編寫效率可以提升62%，Humaneval測試集一次通過率可以達到40.2%。

馬斯克中國遊記，2秒鐘就能搞定

除了對話機器人之外，商湯AI作畫產品“秒畫”也是本次發布的一大亮點。

話不多說，直接上效果。

我們同樣是先來看看被網友們玩兒壞了的一個Prompt：

中國80年代，馬斯克在河南的農村，穿着當時年代的中國服裝。

嗯，是有那個味道了。

而且更為關鍵的是，生成512K圖片僅需2秒鐘！

不僅如此，商湯在現場演示的過程中，還展示了逼真效果版的港風美女。

同樣是2秒出圖，引得現場觀眾“哇”聲一片：

那麼除了這種趣味性的以文生圖，“秒畫”的作品是否能夠達到在產業中的應用水平？

我們繼續試驗：

明亮的場面，鳥瞰圖，中國古代城市，水晶，魔幻，幻想，華麗的光作用，透明度，鏡面反射，華麗的光，錯綜複雜的細節，精細的紋理，超現實，單反攝影，廣角鏡頭，照片，現實，鋒利的焦點，超鋒利。

不得不說，如此恢宏壯麗的景象，是把想象拉進現實的那種了。

若是想生成與太空探索主題相關的高清大海報，這個也可以有，只需把這句話投喂進去：

一艘閃閃發光的飛船繞着一顆巨大的氣態巨行星的月球旋轉，在天空中盤旋着雲，飛船在月球前氣態巨行星前，美麗的科幻藝術，超現實的白日夢。

不難看出，“秒畫”是經得住考驗的那種AI了。

除了以文生圖之外，我們再來看下AI數字人生成平台。

據了解，商湯的“如影”僅需要5分鐘真人視頻素材，就可以生成出聲音及動作自然、口型準確、多語種精通的數字人分身。

再如“瓊宇”和“格物”，基於神經輻射場技術（NeRF），可以高效低成本生成大規模三維場景和精細化的物件，為元宇宙、虛實融合應用打開新的想象空間。

由此可見，商湯的AIGC能力已然是做到了全面覆蓋，並且水平也是肉眼可見的達到了可以“上崗”的水平。

那麼接下來的一個問題是：

怎麼煉成的？

背後的日日新大模型，便是煉成“商量”、“秒畫”等一眾AIGC產品的殺手鐧。

日日新，顧名思義，是指模型的迭代速度及處理問題的能力上可以日日更新，不斷解鎖AGI更多可能。

（取自《禮記·大學》中湯之盤銘曰“苟日新、日日新、又日新”）

從現場展現的能力來看，日日新大模型能夠提供的能力，主要集中在了自然語言處理、圖片生成、自動化數據標註、自定義模型訓練等。

但日日新大模型並非是趁着這一波AIGC大熱潮，一蹴而就出現的那種。

其實早在五年前，商湯便已經在大模型領域着手研發。

並且在2019年，商湯便使用上千張GPU進行單任務訓練，推出了10億參數規模的視覺模型，並實現了當時業界最好的算法效果。

後來在2021年到2022年期間，商湯訓練並開源了30億參數的多模態大模型——書生。

就目前來看，商湯已經成功研發了320億參數量的全球最大的通用視覺模型；並且已經打造了CV、NLP和AIGC相關大模型。

因此，不難看出商湯此次發布的超大模型體系，其實是早有所準備，通過五年來的各項“小作業”，融會貫通並提交了一項“大作業”。

值得一提的是，在此次發布會中，商湯表示“日日新”將提供多種靈活的API接口和服務，包括圖片生成，自然語言生成，視覺感知通用任務與標註服務！

……

但有一說一，多模態和決策智能大模型，並非是商湯通往通用人工智能（AGI）的唯一殺手鐧。

大模型時代，大算力更為重要

沒錯，商湯自己的超強算力，正是另一項更為關鍵的因素。

它便是於2022年1月交付使用，首付56億元，一舉成為亞洲最大的AI超算中心之一的人工智能計算中心（AIDC）。

一年之前，商湯AIDC的總算力便已經是3740 Petaflops，如此算力之下，已經可以完整訓練萬億參數規模的大模型。

時隔一年，現如今，這個算力數字已然是翻了個小翻，達到了5000 Petaflops！

它可以以最大4000卡規模集群進行單任務訓練，並可做到七天以上不間斷的穩定訓練。

△商湯科技AIDC展廳中的裸眼3D展示

但了解商湯的朋友都知道，這個AIDC還僅是商湯AI大裝置SenseCore的一部分。

除了AIDC這個算力層之外，加之數據層和模型層兩大維度，便構成了“三位一體”的AI大裝置。

因此，綜合來看，商湯在通往AGI道路上的範式，便是“大模型+大算力”。

而如此布局的背後，在今天的發布會中，商湯對此的邏輯思考也逐步浮出水面，AGI時代之下，數據、算法和算力三要素有了新的需求：

計算量（GPU數量 x 運行時間 x 并行效率）= 模型參數量 x 處理數據量。

怎麼理解？

模型參數量要足夠多，才能實現AI智慧的湧現，而這也帶來了對算力的劇增，需要更高的并行效率，才能有效支持大參數模型訓練。

數據方面，高質量自然語言數據逐漸稀缺，而視覺數據相較自然語言在數量、質量、容納信息等方面有多種優勢，能夠使得AI更好地理解世界。

由此，就不難理解商湯如此布局的原因了。

……

總而言之，有大數據、有大模型、有大算力，商湯在國產AIGC的亮相，一點也不意外。

是值得期待一波了。

本文鏈接：https://www.8btc.com/article/6813108

轉載請註明文章出處