吳軍:ChatGPT 不算新技術革命,帶不來什麼新機會

來源:響鈴說

原文標題:《吳軍:ChatGPT 七問七答》

吳軍:ChatGPT 不算新技術革命,帶不來什麼新機會

圖片來源:由無界 AI工具生成

從野蠻社會到人工智能,計算機科學家吳軍為你講解 ChatGDP 的來龍去脈。

4 月 3 日晚上,得到直播間邀請到了計算機科學家,自然語言模型專家吳軍,就人工智能和 ChatGPT 等當下熱議的話題展開了一次直播。

Q1:ChatGPT 的出現,為什麼會引起恐慌?

我知道,最近 ChatGPT 這事兒在中國很火,很多人在討論。但很有意思的是,其實這件事在美國,已經沒有太多人去談論這個話題了。其實不光是 ChatGPT,往前看十年,當時很多新技術出現的時候,我就發現在中國媒體上討論的熱度要遠遠高於美國。雖然那個技術其實主要出現在美國,但是中國人老百姓對此更關心。我認為這是一件好事,但也是一件壞事。

這個“壞”在於,這些技術實際上是被過度的炒作了,在這個過程中,有很多渾水摸魚的人從中賺錢。就比如說區塊鏈,當時炒得那麼熱,但如今這個事已經很少有人討論了,對吧?這是第一個。第二個就是元宇宙,目前美國只有 Facebook 一家還在堅持做。那到了中國,很多人就在討論說,我們是不是將來會生活在一個完全虛擬的世界。最後,大概去年底到今年初,Facebook 在這個領域幾百億美元投下去,一個響也沒聽着,最後開始了大規模的裁員。到了現在,被熱炒的一個話題就是 ChatGPT,有的人興奮,有的人恐懼,還有我現在也看到在中國還有很多人在渾水摸魚,試圖再割大家一次韭菜。

在講 ChatGPT 是什麼以前,我先給大家講一個歷史故事,這歷史故事你聽起來你就會發笑,但是你回頭看,今天是很多人的表現也是如此。

1503 年,哥倫布的兒子記下來的這麼一件事兒,哥倫布往西航行,去往新大陸,結果航行到中途,到了牙買加這個地方,船上就沒吃的了。於是,哥倫布和船員只能寄希望於當地人來提供飲食。但是,提供了幾天以後,船員就跟當地人發生了矛盾——有些船員偷了當地人的東西,所以當地人就斷了飲食的供應。

為了擺脫這個困境,哥倫布想到了一個妙招。哥倫布當時隨身帶着一本萬年曆,在日曆上標着說某年月日會出現日食、月食等等所有這些信息。哥倫布當時就把當地的部落首領找來,說你們不給我提供食物,已經得罪了上帝,上帝會發怒,月亮就會變紅,然後上帝就會把月亮收走。

當然,我們現在基本上都知道,在月全食發生的時候,也就是地球還沒有完全擋住月亮的時候,月亮確實是紅的,就是我們所謂的“血月”。但是,當時的牙買加人並不知道。結果,到了晚上,牙買加人就發現,月亮果然變紅了,然後慢慢地就一點點消失了。當地人就陷入了恐慌,大家紛紛說,上帝要懲罰他們了。

這個部落首領慌忙去求哥倫布,承諾答應哥倫布的所有條件。哥倫布就說,好,我去帳篷里向上帝禱告,讓他不懲罰你們,但是我需要一點時間,然後哥倫布就走進了帳篷。其實,進了帳篷之後,哥倫布就是拿着一個沙漏,在看那個計時。

今天咱們有天文學知識,肯定知道月全食的時間,大概也就會維持大概 48 分鐘,到時候月亮就會重新出現。但是,這些牙買加人不知道。他們看到的就是,哥倫布從帳篷里出來,月亮也就出來了。然後哥倫布說,這是上帝已經聽了我的勸解,答應寬恕你們,但是你們必須要給我們好好的提供食物。所以,當地人千恩萬謝,給他們不斷提供食物。

這個故事說明什麼呢?月全食這件事,它的發生背後自有其原因,但是在人們不知道這個原因的時候,往往只能把這個自然現象歸結為一個神的作用。而這個神,本身又是人創造出來的。也就是說,人自己創造一個神以後,然後趴在神的腳下,成為了他的奴僕。

這就是我為什麼講要給大家開《世界文明史》的課程。

其實這個文明的發展過程,就是人類不斷認識自然規律的過程。我們一點點的進步,為的就是讓現在的我們不再像當地的土著人那樣,盲目地相信一個人向上帝禱告真的可以阻止月亮消失。我們現在知道,在日食月食的背後,實際上是開普勒行星的三定律在起作用,然後在開普勒行星三定律背後是牛頓的萬有引力定律。人類搞清楚這個原因以後,對自然就不再僅僅是畏懼了,我們可以利用自然規律做很多很多事情。

Q2:ChatGPT 的技術基礎是什麼?

從歷史回到現在,其實 ChatGPT 的情況也差不多,背後是一個叫做語言模型的一個數學模型在發揮作用。換句話說,ChatGPT 的背後是一個數學模型。在今天,這項技術顯得很強大的原因主要是三個:

第一,它用到的計算量很大;

第二,它的數據量很大;

第三,今天訓練語言模型的方法比以前要好很多。

那麼,語言模型是什麼呢?或者說它是一個什麼時代的產物?

它是 1972 年,由我的導師賈里尼克(Fred Jelinek)帶領團隊研發的一項技術。具體地講,是他當時在 IBM 帶着人來完成的一項技術,是用來衡量一句話或者一個語言現象有多麼的可能產生。那它有什麼用?它最初的用處是做的語音識別,後來是做機器翻譯,再後來是做計算機問答,也就是我們今天熟悉的回答問題。

當時它就可以做摘要,比如說舉一個例子,有一篇一萬字的文章,那麼你怎麼摘要出十句話能概括這一篇文章的內容。這對於做這個自然語言處理的人來講,就是一個數學問題。也就是說,你的條件是什麼?條件是這一萬個字,然後你想得到的結果是什麼?結果可能就是十句話,一百個字,然後這裡頭有很多種組合,你可以隨便挑幾個句子,也可以把有的句子拆成兩段,把後面那些不太重要的修飾或者形容的部分去掉。然後,你也可以把兩個句子合成一個句子,那麼你在合成一段文本的時候,這個計算機就會計算一個概率,哪些句子合成在一起的概率比較大,它會按照概率幫你合成。

而我們今天看到的 ChatGPT,就是這個大的語言模型,它就是會挑一個概率最大的、最有可能發生的這樣一個文本來來給你看。所以總體來講,ChatGPT 生成結果的過程,是一個用大量的計算資源來計算的過程。它需要非常龐大的數據量來支撐,有很多很多的 GPU(電腦處理器)。沒有這些東西的話,ChatGPT 是做不起來的。

而且今天這個 ChatGTP,其實不光是技術,還有很多人工在背後。他們還雇了一家公司,專門負責審核 ChatGPT 產生的結果。比如說,ChatGPT 產生了一百篇摘要,都挺好,我已經分辨不出來了,那麼這些人就負責幫我分辨一下,到底哪一篇更像是準確的摘要。

那實際上,你可以看到,Chat GPT 背後就是一個語言模型,而這一語言模型的技術是 1972 年就已經有了的。到現在,經過了五十年,現在行業內,其實大家並不覺得它是一個什麼了不得的東西。在此以前,這個語言模型其實已經做了很多的事情。

提到語言模型,這個詞,最初是由我的導師賈里尼克提出來的。他大概在 1993 年的時候到了約翰霍普金斯大學,我是 1996 年到這個大學,然後成為他學生。那麼這個詞的中文,也就是你看到的“語言模型”這四個字,則是我在 20 世紀 90 年代的時候發表論文時候創造出來的。那時,只有我們這些圈內的人知道它能做很多事,但是你不會想到說,哎?這個事後來會被熱炒。

你可以這樣理解,“語言模型”之於 ChatGPT,就相當於開普勒的這個行星三定律之於月食。

Q3:“語言模型”誕生之初是什麼情況?

那麼在發明的當時,語言模型是一個什麼情況?

其實,在 20 世紀 90 年代的時候,用簡單統計方法得到的模型就已經很不準確了。這就相當於,我打個比方,你觀察行星,但用的是托勒密的地心說來預測,是很不準確的。所以,那時候我們開始引入了語法、主題、語義的很多信息。然後,這個語言模型就變得很複雜了。複雜之後就又帶來了一個很大的問題。

什麼問題?

比如,我當時做過一個很複雜的語言模型,這個語言模型當時有多少參數?600 萬個參數,就是說,這歌語言模型大小基本上按以這個參數來定。我那時候做的已經是那個時代能做的最大、最複雜的語言模型了。我當時是用的還不是 PC 機,而是 20 台超級服務器,然後大概算了 3 個月才訓練出這樣一個語言模型。所以你看,它的計算量是非常大的。那麼,第一版 ChatGPT,它用的語言模型參數是多少呢?大概是 2000 億個參數,大家可以看到這些年的變化。

所以,今天很多人問,ChatGPT 在美國出現了,中國研究機構什麼時候能做 ChatGPT?其實,中國的大部分研究機構是做不了的,不是說研究水平的問題,而是因為 Chat GPT 太耗資源。今天的 ChatGPT,可能光硬件的成本就要差不多 10 億美元,這還沒算電錢,所以成本和耗資是非常巨大的。所以,如果開完玩笑,問 ChatGPT 的最大貢獻是什麼,我倒覺得它對全球變暖是有很大貢獻的。

所以,我想說的是,ChatGPT 這件事,它的原理很簡單,但是在工程上要想做到,其實是蠻困難的一件事。

Q4: 計算機擅長回答什麼問題?

到了大概 2010 年前後,也就是 13 年前,語言模型能做到什麼程度?我給大家看兩個例子。這兩個例子都是我在 2014 年離開 Google 以前做的。當時我負責的是 Google 的自動問答系統,就是讓計算機回答問題。不過因為這個產品是英文的,所以在中文世界基本上沒有太露臉。

我給你看一下谷歌回答的一個問題,為什麼天是藍色的?

吳軍:ChatGPT 不算新技術革命,帶不來什麼新機會

你可以認看一下這個,它的回答是這樣的:太陽光透過大氣層到達地球時會發生折射,空氣中的氣體會讓不同顏色的光散射到各個地方,藍光波長短,比其他顏色折射率高,所以看上去天是藍色的。這是當時計算機產生的一個答案。公平地講,這個答案比我自己寫一段答案寫得要更好,因為要解釋這現象,你要知道不少物理學知識,而且這個句子看上去也挺合情合理的。而今天人們使用 ChatGPT 的一個目的,就是讓他回答問題。

這裡面,我給大家做個拆分。

其實,我們問計算機的問題可以分為兩類,第一類叫做簡單問題,第二類叫做複雜問題。簡單問題就是關於事實的問題,比如某某明星是哪兒人,哪一年生的,這都是一些容易的問題。因為它是事實,有明確答案。

第二類是複雜問題,這也是大家覺得 ChatGPT 非常驚艷的地方。它能整合信息,回答天為什麼是藍色的,好像它自己有邏輯一樣。再有一個,就是問過程的問題,比如說我怎麼烤蛋糕,你能不把一步步寫下來?今天我們問 ChatGPT 怎麼烤蛋的高,它可以把這個過程給你寫得很詳細,多少杯水,加多少幾個雞蛋,加多少麵粉等等,它都可以告訴你。然後你根據它提供的答案,就真能烤出蛋糕,而且烤的可能還挺不錯。這是大家覺得很了不得的地方。

但是你要知道,這件事,在 2014 年其實計算機已經做到了,而且做得很好。所以,這項技術本身並沒有太多神秘的地方。

Q5:計算機和人,誰更擅長寫作?

現在,大家熱議 ChatGPT,還有一個原因就是覺得它能寫作。比如說寫一個工作簡報,這是今天美國人用 ChatGPT 用得最多的地方。我這周幹了 1234567,這七件事,哎?你看我就不用自己費勁地寫了,我讓 ChatGPT 生成一個,然後再編輯一下子就可以了。

但是,計算機寫作這件事,其實你說難也難,說容易也容易,我可以給你舉個例子。

在 2014 年我離開 Google 之後,當時不太做編程了,不過那時候我還有一些計算資源,所以我自己在空閑時間會寫一些程序,做着玩。當時呢,我就讓計算機寫了兩首詩,大家可以讀一下這兩首詩。

吳軍:ChatGPT 不算新技術革命,帶不來什麼新機會

第一首詩是個五言詩,這是用我的話說,叫做李白風格的一首詩,大家可以讀一下。這首詩就是計算機自己寫的。實際上,你如果讀一讀,這個詩里還真有一些李白的這個特點。

那第二首詩,我也把圖片放在下面了,你可以看一下。

吳軍:ChatGPT 不算新技術革命,帶不來什麼新機會

先說一下,因為古詩都有平仄一說,但是我們現在的讀音當時的讀音不一樣,所以我們也沒去管這個平仄到底合不合古,但是這個我們單從它的內容意境來講,你讀的會覺得很順暢。

好,那麼話說回來。

第一首詩怎麼做的?其實再簡單不過了,你就把李白的詩放到計算機里。李白詩一共 1000 多首,也就一萬來句話,這個對計算機來講太簡單了。它寫的時候,就是把句子分拆開來,拆成兩個字、三個字一組,比如“空愁”這是一組,“憶長安”這三個字一組。然後它就去拼剛才我講的語言模型,算概率,哪個概率最大?拆完了以後,我就跟他提一個要求,說要寫一首憶長安的詩,它就排列組合,生成出這個《憶長安》,實際上就是這麼拼湊出來的。第二首詩稍微複雜一點。

但你知道這兩個程序我寫了多長時間?兩天。這說明什麼呢?說明你讓計算機寫出一些還挺像樣的東西,其實不是一件很困難的事情,它沒有你想得這麼神秘,或者說計算機寫作本身沒有這你想得這麼神秘。

那為什麼這兩首詩看起來特別好?因為這是唐詩,唐詩的格式是固定的。同樣的道理,為什麼用 ChatGPT 寫周報寫得好?因為周報的格式基本上是拉清單,那也是個固定的格式。包括,如果你讀《華爾街日報》中文版,這裡頭我跟你講,90% 的內容都是計算機寫的,只是你不知道。寫完了以後人當然要給他一個主題,然後給它寫的第一段話寫個引子,然後給一個總結,起個標題,這是人要做的。為什麼寫財經文章比較好?因為它有好多的事實在裡頭,格式也是固定的,所以這件事它做起來就很好。

我花這麼長時間來講 ChatGPT 的背景,實際上就是想說它並不神秘,不是一個什麼很高深的機器在背後。一方面,ChatGPT 依靠的是一個數學模型,而這個數學模型 1972 年就有了,只是今天它的計算能力非常強,靠蠻力計算。那麼,ChatGPT 訓練一次要耗多少電?大概可能是 3000 輛特斯拉的電動汽車,每輛跑到 20 萬英里,把它跑死,這麼大的耗電量,才夠訓練一次,這個非常花錢的一件事。

Q6: ChatGPT 對我們到底有什麼影響?

那麼接下來講講,ChatGPT 對人有什麼影響。

這就要回到歷史上來看了,每一次這技術革命,其實它對人都會有一些影響。不過,ChatGPT 它不算是一項新的技術革命,因為這我剛才講了,這個過程很長從 20 世紀 70 年代到 90 年代,我們做了很多事,90 年代到現在又有很多人做了很多事。這裡頭最大進步其實不是這個語言模型本身,實際上是後來 2000 年左右產生的深度學習,使得訓練語言模型能比以前準確了,不是簡單的做統計。

今天訓練語言模型早已經不是簡單做統計了,這才是 ChatGP T 能產生比較好的結果的一個原因。至於說 ChatGPT 對人能產生什麼樣影響?

這個問題我先不直接回答你,我先問你,剛才給大家看這兩首唐詩,你有沒有發現一個什麼特點?對了,這兩首詩寫得不錯,但是你原來對唐朝了解,不會因為多了這兩首詩會有更新的了解。因為,ChatGPT 它某種程度上有點像鸚鵡學舌,你先要說一段話,它才能跟着學。它說出來的聲音可能很好聽,但是它並不提供更多的信息。

今天互聯網上 90% 的內容都屬於這一類——不提供更多的新信息,也不是原創內容,也不是自己的感悟,無非是東抄抄,西湊湊。目前,抖音、快手這類短視頻,我覺得 99% 的內容都屬於這一類,沒有營養,你讀完以後可能覺得挺有意思,但實際上你在上面讀了再多,其實對你沒有任何幫助。

如果說 ChatGPT 真的威脅到了誰,我覺得威脅到的就是這一類人的工作,就是說這個抖音上頭那個做短視頻的,或者發布一些內容的,ChatGPT 會做的比他們好很多。你就想這樣一件事兒,假設說,有一群人天天把那唐詩三百首裡頭的句子翻來覆去的捯飭,也能捯飭出一些詩,那麼 ChatGPT 捯飭起來肯定比人快得多,所以這項技術會對這一批人會有影響。

那麼,什麼人不會受到影響?就是內容創造的人不會受影響。

為什麼我會這麼講?還記得剛才我說的“為什麼是天是藍色的?”這個問題嗎?Google 為什麼能回答這個問題?

因為在 Google 進行回答的時候,它大概把當時英語幾乎所有的像樣的句子都做了分析,大概有 1000 億句英語句子。那麼實際上你會發現,在一些大學的網站上和那 NASA 的網站上,它就有這個答案,只是我們把它拼拼湊湊,刪刪減減,就把它挑出來了。但是最早的物理學家做這項研究,把這個道理搞清楚,這個工作是有意義的,也是 ChatCPT 取代不了的。

所以,Chat GPT 的工作相當於什麼呢?舉例子,托勒密創造出這個模型以後,那麼每過一段時間,他們歐洲就會編一個大概幾十年的一個日曆,然後上面標上哪天有日食,哪天行星會怎麼運動等等。那麼人們根據這些規律,印好多本這個書,這個 ChatGPT 就相當於有好多本書,你拿着以後一看,說,誒,某年月日會發生月食,答案就會很清楚。但是,背後真正有意義的工作不是印這個書,而做托勒密的那個研究。

所以我認為,從歷史上看 ChatGPT 其實不算是一次技術革命,它影響到的都是那個比較懶的人,懶得動腦筋,創造新東西的人。真正探索人類知識奧秘的人,是不會被取代的。

Q7: ChatGPT 能帶來什麼新的機會?

很多人問說,ChatGPT 有什麼新機會?坦率來講,你沒機會,因為太耗資源了,你耗不起。那麼什麼人能夠受益?那就是賣資源的這些人。

我可以打個比方,就是說在這個加州淘金熱的時候,很多人蜂擁而至,去淘金,單我們到今天為止還不知道哪一個淘金者真的掙得着錢,沒一個人把名字留下來。但是最後誰掙着錢了?是賣水的人和賣牛仔褲的人。ChatGPT 也是一樣的道理。大家跟着一起去淘金,其實你是掙不着錢的,但是在過程中,你還不斷地要買水喝,買牛仔褲穿,最後就是這兩撥人掙到錢了。李維斯,就是那時候產生的這麼一個公司,它就是做牛仔褲的。

那麼最後你可能是給幾家大的做雲計算的公司在交錢,這可能是一個結果。

好了,講完了這個 ChatGPT 的歷史,我給你做一個簡單的總結。

第一,不要恐懼。

今天是很多人恐懼 ChatGPT,就如同不要像當年哥倫布遇到的牙買加土著人恐懼月食,一樣的道理。

第二,不要勉強去找所謂的機會,該怎麼工作就是怎麼工作。

我看有同學問我,說蘋果為什麼這個不做 ChatGPT,我說這就對了!這就是為什麼蘋果是世界上最有錢的公司,利潤最高,市值最多。目前,很多所謂做這種人工智能的公司到現在都在虧錢。所以,這也是為什麼很多同學,有時候問關心很多太不着調的問題的時候,我就開玩笑地問他說,你的房貸還清了嗎?你要沒還清,你就好好回去工作,把工作做好,這才是對大家最有意義的事情,從歷史上看也是如此。

第三,你要識破這些所謂的陰謀家或者想割你韭菜的人的那些把戲。

就是說,如果再來一個人假裝哥倫布說他是神的代表,然後他能祈禱上天能讓這月亮出來,你不要信。所以你需要了解 ChatGPT 背後的一些科學原理。最簡單的一些原理,像今天我講的這些,你還是需要有所了解。

本文鏈接:https://www.8btc.com/article/6812834

轉載請註明文章出處

(0)
上一篇 2023-04-29 14:35
下一篇 2023-04-29 14:35

相关推荐