專訪王小川:開啟大模型創業,年底追上 ChatGPT-3.5

作者丨葉蓁 編輯丨康曉

出品丨深網・騰訊新聞小滿工作室

專訪王小川:開啟大模型創業,年底追上 ChatGPT-3.5

圖片來源:由無界 AI工具生成

4 月 10 日,搜狐網絡大廈二層,搜狗創始人王小川正式對外宣布開啟人工智能大模型領域創業。王小川與前搜狗 COO 茹立雲聯合成立人工智能公司百川智能,旨在打造中國版的 OpenAI 基礎大模型及顛覆性上層應用。

百川智能早前已獲得 5000 萬美元啟動資金,來自王小川與其業內好友的個人支持。

此前,王小川已經淡出公眾視野一年半時間。2021 年 10 月 20 日,王小川卸任搜狗 CEO,這一年王小川 43 歲。從大學畢業進入搜狐,王小川一待就是 21 年。

在中國互聯網圈,王小川有着獨特的標籤,他同時擁有深厚技術背景和遊走斡旋大廠之間的管理經驗。王小川崇尚“技術理想主義”,在搜狗期間參與共建了清華大學天工智能計算研究院,擔任聯席院長,推動搜狗和清華大學等學術機構合作。

離開搜狗的這一年半時間,王小川主要在思考用數學模型研究生命科學的難題。

“我在讀研究生期間,做的課題就是跟基因測序拼接算法相關的。生命的複雜性遠超物理世界,牛頓把物理問題變成了數學問題,但生命科學領域至今做不到。”王小川在接受騰訊新聞《深網》專訪時表示。

2021 年,DeepMind 發布了 AlphaFold 蛋白質結構數據庫(AlphaFold DB),王小川認為,“生命科學領域這個突破只是解決了一小段問題的數學化。”

ChatGPT 的橫空出世為王小川打開了另一個路徑。難掩興奮感的王小川告訴《深網》,“當我發現語言可以變成數學問題,這個模型未來也能承接對生命的探索,會成為突破生命科學的一個支點,這也是我這次下場創業的原因。”

因此,對於王小川來說,這次在 AI 領域的創業是順勢而為,源自他長期對生命科學奧秘的興趣和探索。

ChatGPT 讓王小川看到了一個更廣闊的未來。王小川告訴《深網》:“阿爾法狗證明用深度學習方法可以讓機器產生一定的智能,但它的做法是讓機器忘掉人的智慧,然後超越人;OpenAI 的做法是讓機器大量學習人,這個突破,我們稱為大模型或大語言模型的突破,核心的關鍵詞是語言 AI。”

“NLP 自然語言處理是人工智能皇冠上的明珠,語言包含的內容要去理解它是個特別大的難題。ChatGPT 巧妙的是找到了新方法,這個模型掌握了人類的語言,讓機器向人類已有的文明學習。我 2016 年談到過,當機器掌握語言之後,強人工智能可能就到來了。”王小川進一步解釋。

大模型研究,首先比拼的是專業人才。現在的王小川,懂技術,有資金,也有人脈。“你現在所經歷的,將在你的生命中串聯起來”,喬布斯如此感慨他的人生,王小川喜歡這句話,現在看來,王小川的人生亦是如此。

今年 1 月份開始,一些投資人和朋友,陸陸續續找到王小川,問他要不要開啟創業。

“搜索是距離大模型特別近的業務,我們已經有了一個 500 億的參數的模型在訓練了,目前評價和進展效果都非常好。同事們都很興奮。”王小川透露。

據品玩報道,搜狗曾建立包含 1.3 億原始網頁的 SogouT 開放數據庫,以免費形式對科研機構開放,成為很多 NLP 研究者和從業者最常用的數據庫之一。

“百川智能以前搜狗團隊為基礎,快速融合來自知名科技公司的核心團隊。當然,我還需要吸引更多的人才,包括國外頂尖人才、國內的領軍人物、優秀的管理人等等。”王小川告訴《深網》,預計在 4 月底公司將打造一隻 50 人規模的 AI 團隊,有信心在年底做出中國最好的大語言模型。

百川智能發布的官方信息顯示,公司也得到清華相關院系及多位院士和教授的支持,建立合作突破通用人工智能基礎科學問題,並吸引清華人才加入。

ChatGPT 是目前全球科技產業最大的風口,毋庸置疑,當下美國是領先的。今年二月份,王小川在微博上說中國需要自己的 OpenAI,也相信中國能誕生自己的 OpenAI。

在王小川看來,中國需要迎頭趕上,現在也不算太晚。

“追上 ChatGPT 3.5 水平,我覺得今年內可能就能夠實現,但對於 ChatGPT-4 或者 ChatGPT-5,我認為可能需要 3 年左右的時間,應該不會低於兩年。”王小川對《深網》表示。

王小川表示,百川智能將藉助語言 AI 的突破,構建中國最好的大模型底座,並在搜索、多模態、教育、醫療等方面增強,幫助大眾輕鬆、普惠的獲取世界知識和專業服務。

和搜索緊密結合、提供知識服務是新產品的幾個關鍵詞。王小川透露,6 月份可能會公布一個對標 ChatGPT-3.5 的更大規模模型,同時在今年內對於搜索增強,在幾個垂直領域裡面,讓用戶體驗到新的知識服務。

附:王小川公開信全文:

今天我正式宣布,創建“百川智能”,一家研發並提供通用人工智能服務的中國公司。

生活在二十一世紀初是如此幸運,波瀾壯闊的互聯網革命還沒有謝幕,通用人工智能時代又呼嘯而來。多年前我曾斷言,機器掌握語言,通用人工智能時代就來了;我也有暢想,搜索的未來是問答。ChatGPT 的騰空出世,地動山搖,這一切都開始成為現實。ChatGPT 發布到今天,僅僅 131 天,每天都有撲面而來的新進展、新突破。131 天恍如隔世!

大半個世紀以來,科學家們前赴後繼,努力創造通用智能機器。這一天終於到來,我們找到了一條巧妙的路徑,用 AI 成功將語言轉化成了數學模型。語言是知識、思考、溝通和文化的載體。維特根斯坦說,語言的邊界就是世界的邊界。當 AI 掌握了語言后,就開始認知世界,成為有知識、能思考、善表達、會學習的智能體。我把這樣的智能體稱為“語言 AI”。

人類個體總有消亡的一天,但能夠將畢生的知識通過語言記錄下來供新生命學習、繼承,文明因此延續。人類協作也需要個體之間通過語言溝通。掌握了溝通和世界知識的語言 AI 不再只是人類的“工具”,而將成為我們的夥伴和超級助理,成為人類文明的一部分。

智能時代會改寫互聯網時代的範式。‘連接’會被‘陪伴’取代,‘信息服務’會被‘知識服務’取代,‘免費與廣告’會被‘付費與高品質’取代。

智能時代也會改寫自工業時代以來的範式。曾經是專業化社會分工帶來規模效應與效率提升,而未來會是逆專業化分工:之前需要很多公司協作完成的工作,會因為 AI 的賦能‘端到端’的完成。

智能時代將再一次開啟“文藝復興”。每個人都會因為 AI 的助力而變得更加強大。用好 AI,一個人就可能做一個公司,解決之前難以解決的難題,也更容易成為自己想成為的人。社會也會更加扁平,以前少數人才能享有的智力服務,也能更普惠。

告別搜狗后,我已開啟新的遠征:立志往後二十年,為生命科學和醫學的發展盡一份力,為大眾健康做出一點貢獻,核心路徑是構建生命健康數學模型,並已經付諸行動。ChatGPT 的出現,也將成為新遠征的重要助力。

不僅如此,ChatGPT 是我過往經歷的延續和升華。2019 年我將搜狗的使命升級為“讓表達和獲取知識更簡單”,願景定義為“幫助每個人輕鬆地對話和書寫。便捷地獲得知識和服務,提升工作效率和生活品質”。

搜狗輸入法和搜狗搜索的數據製備和產品形態,也與 ChatGPT 接近。它們都是把互聯網上的全部語言數據收集、清洗,壓縮成數據庫並構建超級產品。隨着深度學習的發展,這些產品都多次迭代升級,全面用上了 Transformer/Bert 等技術。輸入法猜你想說什麼,搜索猜你想要什麼。而 ChatGPT 把這些能力推到了一個全新的高度,是輸入法、搜索之外,第三個把全網數據轉化成語言服務的超級產品。搜狗未盡的使命在機器掌握了語言后終於可以實現。

很多朋友認可我的技術理想主義和技術驅動的創業經驗,鼓勵和支持我做中國的 OpenAI。也有很多搜狗和非搜狗的技術大拿,得知我有做大模型的想法,主動申請參與組隊,甚至“帶資入組”。

我最動心的是,能和一群有理想的人,用極致的技術驅動創造出顛覆性的智能產品。這一次,百川智能將藉助語言 AI 的突破,構建中國最好的大模型底座,並在搜索、多模態、教育、醫療等方面增強,幫助大眾輕鬆、普惠的獲取世界知識和專業服務。

籌建百川智能不到兩個月,已有多位技術合伙人和領軍人物的加入。到這個月底將會有近 50 人規模的精英團隊。大模型的訓練也已經啟動,進展順利。按照現在的進度,爭取年內發布國內最好的大模型和顛覆性的產品。

我們是中國公司,但我們並不希望只是“中國的 OpenAI”,而是能建立世界級的視野和技術品質,讓中國享有世界級的產品,產生有世界影響力的技術的突破,進而服務海外。百川本意是眾多的河流匯集奔赴海洋,象徵著眾多數據、行業知識匯聚成為一個強大的智能體系,生生不息。百川也象徵著集百家智慧,更多人與我一道共赴山海。我們呼喚中國的領軍人物、行業產品經理和遠在美國的同仁的加入。

通用人工智能時代剛剛開啟,我們作為第一批跨入新時代的人類,帶着焦慮和好奇去擁抱它,思考和探索“我是誰?”我們還可以把自己的智慧注入它,做新時代的開創者,讓後代們有一個更美好的未來,繁榮和延續人類文明。

百川智能 CEO 王小川
2023 年 4 月 10 日

本文鏈接:https://www.8btc.com/article/6812886

轉載請註明文章出處

(0)
上一篇 2023-05-05 01:30
下一篇 2023-05-05 01:30

相关推荐