ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

2023-04-07 02:00 • 數字貨幣

編輯：桃子 Britta

來源：新智元

ChatGPT引爆的AI熱潮也「燒到了」金融圈。

近來，彭博社的研究人員也開發了一個金融領域的GPT——Bloomberg GPT，有500億參數。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

GPT-4的橫空出世，讓許多人淺嘗到了大型語言模型的強大能力。

然而，OpenAI不open。業界許多人紛紛開始做GPT的克隆，而且許多ChatGPT平替的模型都是基於已經開源的模型上構建，尤其是Meta開源的LLMa模型。

比如，斯坦福的草泥馬（Alpaca）、斯坦福聯手CMU、UC伯克利駱馬（Vicuna），初創公司Databricks的Dolly等等。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

針對不同任務和應用構建的各種類ChatGPT的大型語言模型，在整個領域呈現出百家爭鳴之勢。

那麼問題來了，研究者如何選擇合適的模型，甚至是多個模型，去完成一項複雜的任務呢？

近日，微軟亞洲研究院聯手浙江大學的研究團隊，發布了一個大模型協作系統HuggingGPT。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

論文地址：https://arxiv.org/pdf/2303.17580.pdf

HuggingGPT利用ChatGPT作為控制器，連接HuggingFace社區中的各種AI模型，來完成多模態複雜任務。

這意味着，你將擁有一種超魔法，通過HuggingGPT，便可擁有多模態能力，文生圖、文生視頻、語音全能拿捏了。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

HuggingGPT搭橋

研究者指出解決大型語言模型（LLMs）當前的問題，可能是邁向AGI的第一步，也是關鍵的一步。

因為當前大型語言模型的技術仍然存在着一些缺陷，因此在構建 AGI 系統的道路上面臨著一些緊迫的挑戰。

– 受限於文本生成的輸入和輸出形式，當前LLMs缺乏處理複雜信息（如視覺和語音）的能力；

– 在實際應用場景中，一些複雜任務通常由多個子任務組成，因此需要多個模型的調度和協作，這也超出了語言模型的能力範圍；

– 對於一些具有挑戰性的任務，LLMs在零樣本或少樣本設置下表現出優異的結果，但它們仍然比一些專家弱（如微調模型）。

為了處理複雜的人工智能任務，LLMs應該能夠與外部模型協調，以利用它們的能力。因此，關鍵點在於如何選擇合適的中間件來橋接LLMs和AI模型。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

研究者發現，每個AI模型都可以通過總結其模型功能表示為一種語言形式。

由此，便引入了一個概念，「語言是LLMs，即ChatGPT，連接人工智能模型的通用接口」。

通過將AI模型描述納入提示中，ChatGPT可以被視為管理人工智能模型的大腦。因此，這一方法可以讓ChatGPT能夠調用外部模型，來解決實際任務。

簡單來講，HuggingGPT是一個協作系統，並非是大模型。

它的作用就是連接ChatGPT和HuggingFace，進而處理不同模態的輸入，並解決眾多複雜的人工智能任務。

所以，HuggingFace社區中的每個AI模型，在HuggingGPT庫中都有相應的模型描述，並將其融合到提示中以建立與ChatGPT的連接。

隨後，HuggingGPT將ChatGPT作為大腦來確定問題的答案。

到目前為止，HuggingGPT已經圍繞ChatGPT在HuggingFace上集成了數百個模型，涵蓋了文本分類、目標檢測、語義分割、圖像生成、問答、文本到語音、文本到視頻等24個任務。

實驗結果證明，HuggingGPT擁有處理多模態信息和複雜人工智能任務的能力。

四步工作流程

HuggingGPT整個工作流程可以分為如下四個階段：

– 任務規劃：ChatGPT解析用戶請求，將其分解為多個任務，並根據其知識規劃任務順序和依賴關係

– 模型選擇：LLM根據HuggingFace中的模型描述將解析后的任務分配給專家模型

– 任務執行：專家模型在推理端點上執行分配的任務，並將執行信息和推理結果記錄到LLM中

– 響應生成：LLM總結執行過程日誌和推理結果，並將摘要返回給用戶

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

多模態能力，有了

實驗設置

實驗中，研究者採用了gpt-3.5-turbo和text-davinci-003這兩種GPT模型的變體作為大型語言模型（LLMs），這些模型可以通過OpenAI API公開訪問。

為了使LLM的輸出更加穩定，我們將解碼溫度設置為0。

同時，為了調整LLM的輸出以使其符合預期格式，我們在格式約束上設置了logit_bias為0.1。

研究人員在如下表格中提供了為任務規劃、模型選擇和反應生成階段而設計的詳細提示，其中{{variable}}表示在提示被輸入LLM之前，需要用相應的文本填充域值。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

研究人員在廣泛的多模態任務上測試了HuggingGPT。

在ChatGP和專家模型的配合下，HuggingGPT可以解決語言、圖像、音頻和視頻等多種模式的任務，包含了檢測、生成、分類和問題回答等多種形式的任務。

雖然這些任務看起來很簡單，但掌握HuggingGPT的基本能力是解決複雜任務的前提條件。

比如，視覺問答任務：

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

文本生成：

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

文生圖：

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

HuggingGPT可以整合多個輸入的內容來進行簡單的推理。可以發現，即使有多個任務資源，HuggingGPT也能將主要任務分解成多個基本任務，最後整合多個模型的推理結果，得到正確答案。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

此外，研究人員通過測試評估了HuggingGPT在複雜任務情況下的有效性。

就HuggingGPT處理多項複雜任務的能力進行了展示。

當處理多個請求的時候，可能包含多個隱含任務或者需要等多方面的信息，這時依靠一個專家模型來解決是不夠的。

而HuggingGPT可以通過任務規劃組織多個模型的協作。

一個用戶請求中可能明確包含多個任務：

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

下圖展示了HuggingGPT在多輪對話場景下應對複雜任務的能力。

用戶將一個複雜的請求分成幾個步驟，通過多輪請求達到最終目標。結果發現，HuggingGPT可以通過任務規劃階段的對話情境管理來跟蹤用戶請求的情境狀態，並且可以很好地解決用戶提到的請求資源以及任務規劃。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

「賈維斯」開源

目前，這一項目已經在GitHub上開源，但是代碼並沒有完全公布。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

有趣的是，研究者給這個項目命名為《鋼鐵俠》中的賈維斯，無敵AI這就來了。

JARVIS：一個連接LLMs和ML社區的系統

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

順便提一句，HuggingGPT需要有了OpenAI的API才可以使用。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

網友：研究的未來

JARVIS / HuggingGPT就像此前Meta提出的Toolformer一樣，都在充當著連接器的作用。

甚至，包括ChatGPT plugins也是如此。

網友稱，「我強烈懷疑第一個人工通用智能（AGI）的出現將比預期更早。它將依靠「膠水」人工智能，能夠智能地將一系列狹義人工智能和實用工具粘合在一起。

我獲得了訪問ChatGPT的Wolfram插件的權限，這使它一夜之間從數學菜雞變成了數學天才。當然，這只是一個小步驟，但卻預示着未來的發展趨勢。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

我預測，在接下來的一年左右，我們將看到一種人工智能助手，它與數十個大型語言模型（LLMs）及類似工具相連，而終端用戶只需向其助手發出指令，讓其為他們完成任務。這個科幻般的時刻即將到來。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

還有網友稱，這就是未來的研究方法。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

GPT在一大堆工具面前，知道如何使用它們了。

ChatGPT 自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT 項目已開源

參考資料：

HuggingGPT

-Human requests something
-ChatGPT
1 Plans tasks
2 Selects AI models based on HuggingFace descriptions
3 Manages cooperation of expert models to execute subtasks
4 Summarizes results

Covers many sophisticated tasks across modalities & domainshttps://t.co/ukUzlJttaL pic.twitter.com/8XuplkNAey

— John Nay (@johnjnay) March 31, 2023

https://news.ycombinator.com/item?id=35390153

本文鏈接：https://www.8btc.com/article/6811774

轉載請註明文章出處

chatgpt gpt 模型

赞 (0)

名人、企業採用首選？盤點在 Polygon 上構建的 80 個現實世界用例

上一篇 2023-04-06 03:52

2023香港Web3嘉年華頂配元宇宙論壇，嘉賓陣容星光璀璨！

下一篇 2023-04-07 02:00

北京第一個元宇宙母基金要來了

來源：投資界作者：劉福娟如果沒有意外，這也將是國內第一支元宇宙基金。千呼萬喚始出來，北京第一支元宇宙母基金要來了。投資界—解碼LP從北京市通州區金融辦平台獲悉，經區政府同意…

數字貨幣 2022-03-14
數字貨幣

參考消息網 | 將數據變成財富！港媒：中國正探索設立虛擬資產交易場所

核心提示：香港證券商協會主席陳柏楠說，最新發布的這一公告很可能與推廣使用數字人民幣有關。從中可以看出國家推動數字貨幣的決心。來源：參考消息網 12月14日報道香港《南華早報》…

2021-12-15
數字貨幣

一文概覽《財富》眼裡的50位NFT大咖

原文來源：Fortune 編譯：0x13，律動BlockBeats 2021 年，NFT 以前所未有的方式出圈了，從 NBA Top Shot 到 Beeple，再到 Axie I…

2021-08-08
數字貨幣

【Mint Ventures深度研報】Liquity穩定幣市場的後起之秀

研究機構：Mint Ventures 研究員：李雨軒第一節研報要點 —— LUSD具有超額抵押穩定幣里最優秀的機制，雖然上線時間不足3個月，但是其機制的有效性已經完全得到驗證，…

2021-07-10
數字貨幣

從全球和國內兩個視角，盤點2021年全球區塊鏈發展的七大現狀

作者| 陳麗姍編審 | 於百程排版 | 王紀瓏琰原標題：《2021年全球區塊鏈產業發展七大現狀》作為新興的信息技術，區塊鏈在2021年繼續深入發展，在監管政策和應用上均…

2021-12-27
數字藏品正在告別“野蠻生長”

來源：中國青年報作者：中青報·中青網記者趙麗梅　數字藏品市場將迎來一個“冷靜期”，但這並不意味着數字藏品市場的“凜冬將至”，而是一個新拐點正在到來，這個市場將逐漸走上規範化的…

數字貨幣 2022-09-06
區塊鏈周報 | 成都將打造2個萬億級產業集群，重點探索布局區塊鏈；長沙經開區發布推進區塊鏈產業政策，企業最高獎勵1200萬元

一、區塊鏈政策要聞 1、成都將打造2個萬億級產業集群，重點探索布局區塊鏈近日，市經信局局長王凱在新聞發布會上介紹，成都將通過錨定世界級，形成強支撐，打造電子信息、裝備製造2個萬…

數字貨幣 2021-08-02
天橋資本首席投資官：黃金雖好，但我們更看好比特幣

本文來自彭博社原文作者：Ranjeetha Pakiam Odaily 星球日報譯者 | 念銀思唐一家 75 億美元的對沖基金表示，明年金價將飆升至新高，但隨着全球債務膨脹，尋…

數字貨幣 2021-06-07
如何解決DAO 中的富豪統治問題？鏈下聲譽是精英管理的關鍵

原標題：《DAO 中的富豪統治問題》鏈下聲譽是精英管理的關鍵 DAO 或去中心化自治組織類似於企業，它通過代幣化治理進行投票。如果你想加入一個 DAO，在公開市場上購買某些代幣通…

數字貨幣 2021-09-26
數字貨幣

一文了解LayerZero如何將IBC帶入以太坊EVM世界

註：原文作者是LayerZero Labs 首席技術官 Ryan Zarick以及總工程師Isaac Zhang。今天，龐大的Cosmos 生態系統已通過Cosmos的區塊鏈間通…

2021-12-09