阿里M6大模型前帶頭人楊紅霞加盟字節跳動,參與語言生成大模型研發

文 | 周鑫雨 鄧詠儀

編輯 | 楊軒 蘇建勛

36氪從多處獨立信源獲悉,阿里M6大模型的前帶頭人楊紅霞已加入字節AI Lab(人工智能實驗室),參與語言生成大模型的研發。

一名知情人士對36氪表示,楊紅霞在語言生成大模型團隊中處於領導地位,直接向字節跳動副總裁楊震原彙報。36氪就上述消息向字節跳動求證,截至發稿前暫未收到回復。

楊紅霞曾是阿里達摩院超大規模多模態預訓練模型M6的技術負責人,畢業於南開大學、杜克大學統計科學系,師從著名統計學家David Dunson。她在人工智能領域國際會議、頂級期刊有近百篇頂級論文。

2022年9月初,楊紅霞因個人家庭原因從阿里巴巴達摩院離職。

M6是阿里巴巴達摩院研發的超大規模多模態預訓練模型,而大模型是本輪AI浪潮中的競爭核心。

楊紅霞曾帶領M6大模型從百億級進化到千億、再到萬億的參數量,並且主導認知智能技術的發展和場景落地。2021年3月,M6大模型首次發布,到2021年底,阿里雲發布M6最新進展時,其參數已至10萬億,成為當時全球最大的AI預訓練模型。

而達摩院在大模型的落地上,也走在業界前列。2022年底,阿里雲魔搭社區開源超過300個AI大模型,包括M6、通義大模型等等,為開發者提供基礎AI模型資源。

不過,由於達摩院AI大模型離實際業務落地還是較遠,加上大廠降本增效的背景,業務無法落地也無法得到更多支持,這也導致包括楊紅霞在內的多位頂級人才離職,如智能研究領域負責人金榕、城市大腦實驗室負責人華先勝。

從前美團聯合創始人王慧文、出門問問CEO李志飛、前京東技術掌門人周伯文相繼發布英雄帖尋找研發人才,再到“投人”的邏輯將不少技術大拿的AI創業項目估值拉上億元美金,國內AI界的人才大戰已經爆發。

對大模型的研發而言,人才在一定程度上決定了算法能力的上限。不少從業者都表示,資金、數據、算力等難題至少有解法可循,但算法這一必定需要人參與的環節,對人的能力提出了很高的要求。“好的算法能夠在提高執行效果和效率同時,還能盡量縮減存儲量。”一名AI從業者告訴36氪。

楊紅霞的加盟,也意味着字節在大模型上發力的決心。此前,36氪獨家報道了字節跳動大模型的研發進展:語言大模型團隊由字節搜索部門牽頭,目前團隊規模在十數人左右;圖片大模型團隊則由產品研發與工程架構部下屬的智能創作團隊牽頭。

多名知情者告訴36氪,目前圖像生成大模型的進展較為順利,將與抖音、剪映等產品進行結合。但語言生成大模型由於起步晚、基礎薄弱等原因,目前效果尚未達到團隊預期。字節跳動相關技術負責人也對此做出了回應:技術中台在這些領域有探索,還很初期,不成熟。

百度已用文心一言在大模型角逐中棋先一招,逐漸組建人才團隊的字節跳動能否後來居上,還有待時間驗證。

延伸閱讀:

Long China 50獨家 | 字節加入“大模型之戰”:朱文佳帶隊,搜索、智創兩部門牽頭

本文鏈接:https://www.8btc.com/article/6810492

轉載請註明文章出處

(0)
上一篇 2023-03-28 03:37
下一篇 2023-03-28 03:37

相关推荐