微信版大語言模型：論文、API接口、在線試玩網站……一應俱全

2022-10-13 14:39 • 熱點資訊

大規模語言模型，微信版，來了！並且甫一登場，就沒藏着掖着：論文、API接口、在線試玩網站……一條龍全都齊備。續寫文本、閱讀理解等常規任務就不說了，這個名叫 WeLM的AI，竟然直接讓我和李白跨時空聊起了杜甫：

原標題：微信版大語言模型來了：跨時空對話李白、教你高情商說話，API在線試玩全都有

魚羊夢晨發自凹非寺

我：現在有一首關於你的歌，其中一句歌詞是“要是能重來，我要選李白”，請問你自己有什麼看法？

李白：我要選杜甫。

我：現在有一首關於你的歌，其中一句歌詞是“要是能重來，我要選李白”，請問你自己有什麼看法？

李白：我要選杜甫。

這還不算完，WeLM甚至還治好了我不會聊天的毛病，分分鐘教會我如何高情商說話。

這麼一個AI，參數量不算大，目前處於百億水平。

但值得關注的是，實驗結果顯示，它在18個中文語言任務里， 效果堪比參數量是其25倍的模型。

是不是有點手癢想上手一試了？先奉上鏈接，咱們再仔細說說，這波微信是怎麼做到的。

體驗鏈接：https://welm.weixin.qq.com/docs/playground/

API接口：https://welm.weixin.qq.com/docs/api/

論文地址：https://arxiv.org/abs/2209.10372

體驗鏈接：https://welm.weixin.qq.com/docs/playground/

API接口：https://welm.weixin.qq.com/docs/api/

論文地址：https://arxiv.org/abs/2209.10372

微信語言大模型WeLM，全名Well-Read Language Model，也就是 “學富五車的語言模型”。

在翻譯任務上，WeLM不光可以做到基本的，甚至 三語夾雜也難不倒它。

在文本續寫任務上， 只需給出開頭就能生成適應不同風格的文本。

這種多語言、多任務能力是怎麼做到的？

其實WeLM與著名的GPT-3是同類，都是自回歸解碼器結構，微信團隊選擇這種結構就是看中其 在海量數據中掌握無窮範式的能力。

在具體實現方法上，WeLM還有兩項特色。

一是採用RoPE相對位置編碼，與傳統的固定位置編碼相比能更好處理長文本，比如理解整篇文章甚至整本書。

二是使用62k個token的SentencePiece並保留其中的空格和Tab，這樣更有利於下游任務。

使用這些方法，WeLM總共設計了從13億到100億參數的三個版本，可按需調用。

其中100億參數的滿血版WeLM在14項中文任務中整體表現超過同大小的模型，甚至在零樣本任務上超過比它大25倍的模型。

這其中最大的秘訣就是精心準備的高質量訓練數據上充分訓練，也就是“學富五車”的含義所在。

高質量訓練數據包括從Common Crawl下載的近兩年中文網頁、大量書籍、新聞、論壇數據和學術論文。

收集到的數據總量超過10TB，其中包含750G英文數據，中文中夾雜的英日韓語為了語義連貫也全部保留。

不過這還不算完，需要經過清洗、去重等一系列步驟才能算得上是高質量數據。

首先是去除噪聲和臟數據，結合使用規則和模型檢測后，超過87%的數據被過濾。

再利用SimHash算法去重，進一步過濾掉40%的數據。

接下來要去除一切和測評相關的數據，保證公平性，以 17-gram 為檢測重複粒度再次過濾了0.15%的數據。

一系列處理后留下的數據量為 262B tokens，最後再對這些數據進行不同比重的採樣，使數據平滑分佈在各個話題上。

對於預訓練，團隊認為當今多數大模型的訓練都不夠充分，WeLM 100億參數版的訓練量基本與1750億的GPT-3相當（300B tokens），在128張A100上訓練用了大概24天時間。

為了保證訓練效率，WeLM在訓練過程中還使用了完全可原地復現的形式，不管發生任何問題都能從最近的checkpoint恢復。

自1750億參數的GPT-3之後，語言模型規模越來越大，到今年Google的PaLM已經達到5400億，中文大模型同樣有這個趨勢。

可以看出微信團隊選擇了另一條路線，以高質量訓練數據和高效訓練做到 “四兩撥千斤”的效果。

到這一步WeLM已經有了不錯的表現，不過接下來這個步驟再次將其零樣本泛化能力提到新的高度。

研究團隊針對76個數據集各人工撰寫10-20個Prompt，將原任務中的文本關係的標籤和輸入信息轉化成流暢通順的自然語言形式，更符合自回歸語言模型的訓練形式。

使用這些Prompt對模型微調后，相當於讓模型學會了面對多樣的Prompt該做什麼。如果遇到相似Prompt形式的全新任務，也可以有更穩定的表現。

實驗證明，在全量數據上微調后的模型在新的NLP任務上具備更優秀的 零樣本遷移能力，同時也使得微調變為一項 一勞永逸的工作。

最後，研究團隊還測試了WeLM的三個額外能力。

通過提供示例，WeLM可以 對自己的決策作出解釋，不過這種能力不太穩定，還需要進一步探索。

通過簡單提問，WeLM可以對結果進行 自我糾正和檢查能力，為後續提高性能提供了可能方向。

WeLM還表現出一定的 記憶能力，如果輸入內容完美匹配前文，即使內容很長、出現頻次很低，模型依然可以準確的生成剩下的部分。

最後再來總結一下，WeLM精通中文的同時掌握英日韓等多種外語、可以通過少樣本或零樣本學習執行全新任務，同時以合理尺寸做到與25倍參數量的模型相媲美使用成本較低，總之就是奔着 實用性和 大規模落地去的。

同步開放在線體驗與API，也是希望有想法的開發者能方便的用起來，讓WeLM大模型真正實用的工具。

WeLM怎麼用

具體來說，WeLM線上Demo目前釋出的功能包括：對話-採訪、閱讀理解、翻譯、改寫、續寫以及自由任務。

在正式開始跟WeLM玩耍之前，記得要先給模型扔一段簡單的“範文”，也就是“prompt”。

在線網站會給出一些默認的prompt，你也可以自行修改設計。需要遵循的設計原則是：

第一，描述清楚；第二，例子具備代表性（多個例子更好）。

第一，描述清楚；第二，例子具備代表性（多個例子更好）。

以文本分類任務為例，prompt應該長這樣：

其中的技巧包括，首先，把分類任務用 自然語言清晰地表達出來，在上面這個示例中，“微博”即為輸入，“類別”即為輸出。

其次，在第一句的指令型描述中，需要把可能的分類結果都列出來。

最後，如果效果不佳，可以嘗試加入更多例子，讓WeLM更清楚你到底想要做怎樣的任務。

另外，正如前文所說，WeLM擁有零樣本學習能力。

所以直接把它當作問答搜索引擎來用，也不是不行（手動狗頭）。

如果你還想得到更多樣化的生成結果，token數量、temperature等參數均可調整。

更重要的一點是，WeLM已 開放API接口。也就是說，如果身為開發者的你想在自己的App里用上這個大模型，填寫調查問卷註冊即可。

One More Thing

說起來，這樣的大模型要是真的落地應用了，媽媽豈不是再也不用擔心我因為不會聊天而母胎solo？

比如說……

你還有什麼有趣的腦洞？大膽招呼起來~

我要李白語言

赞 (0)

索尼與本田汽車合資公司將於2025年開始銷售電動汽車

上一篇 2022-10-13 14:39

SpaceX Crew-4離開空間站時間因天氣原因推遲

下一篇 2022-10-13 14:39

熱點資訊

IBM的ModelMesh走向開源使開發者能夠大規模部署AI模型

模型服務是AI用例的一個關鍵組成部分。它涉及從人工智能模型中提供推論，以響應用戶的請求。那些涉足企業級機器學習應用的人知道，通常不是一個模型提供推論，而是實際上有數百甚至數千個模型…

2021-10-13
熱點資訊

哈勃新圖像展示神秘的“超級泡泡”星雲洞

星雲是我們在太空中看到的一些最令人驚嘆的特徵。N44–這個由氣體和塵埃組成的幽靈般的結構之一–是一個特別奇怪的星雲。它有一個“超級泡泡”，這是一個巨大的、黑…

2021-11-03
熱點資訊

中國神秘女富豪5.6億買下歐洲豪宅：現金全款一次付清

中國富豪在海外大動作不罕見，不過近日，一位神秘的中國女富豪，震撼了歐洲豪華房地產市場。據意大利媒體報道，今年4月8日，一位名叫“Nani Wang”的中國女性，在意大利撒丁島買了一…

2022-06-23
熱點資訊

微軟Edge有望超越Safari成為第二大桌面瀏覽器

微軟正在縮小Edge與蘋果的Safari之間的差距，使其成為世界上使用量第二大的桌面瀏覽器，其地位可能在幾個月內發生變化。目前的網絡瀏覽軟件市場由Google瀏覽器主導，它以巨大優…

2022-02-22
熱點資訊

2022年上半年美國移動設備遊戲市場下跌近10%

2022年上半年，大多數移動平台遊戲類型的供應量和下載量都有所下降，移動遊戲市場總額同比下降9.6%。根據Sensor Tower GameIntelligence的新數據，202…

2022-08-05
熱點資訊

Craig Federighi：在“隱私利用的創新”中蘋果將繼續保護我們的客戶

WWDC開幕之後，蘋果公司軟件工程高級副總裁Craig Federighi表示，蘋果公司將在應對隱私剝削的 “創新”中繼續保護其客戶，蘋果公司相信它&#82…

2021-06-08
熱點資訊

研究：口罩可能幫助消滅了兩種流感病毒

據外媒報道，美國的口罩要求正在迅速放鬆，但許多人表示，他們計劃在某些情況下繼續佩戴口罩–包括在花粉季節以減少在生病時過敏的出現。大流行安全措施包括保持社交距離、佩戴口罩…

2021-06-04
熱點資訊

曝榮耀50系列已入網：對標華為P50 支持100W超快充

近段時間，關於榮耀50系列旗艦機型的相關爆料層出不窮，有博主稱該機將會在6月份真是登場，這是榮耀獨立之後的第一款頂級旗艦系列，令許多用戶十分期待。根據知名爆料博主@數碼閑聊站的消息…

2021-05-14
熱點資訊

Visa與亞馬遜就支付手續費達成協議

支付巨頭周三晚間表示：作為全球協議的一部分，世界各地的 Amazon.com 網站和商店，都將能夠接受 Visa 卡片的支付。去年 11 月，亞馬遜方面曾因支付處理上收取高額交易費…

2022-02-17
熱點資訊

“天宮課堂”第一課正式開講太空授課得用多高的配置？

2021年12月9日，“天宮課堂”第一課正式開講，“太空教師”翟志剛、王亞平、葉光富在中國空間站為廣大青少年帶來了一場精彩的太空科普課。由於天地相隔，本次“天宮課堂”是用“上網課”…

2021-12-10