Stability AI 首席信息官:真正開放AI的轉折點是現在

真正開源的人工智能才是未來,但是有些人試圖將其扼殺在搖籃里,因為他們暗地裡想把所有的力量都保留在自己手中。

來源:Future History

作者:Daniel Jeffries

Stability AI 首席信息官:真正開放AI的轉折點是現在

編者按:本文作者Daniel Jeffries,是Stability AI(研發Stable Diffusion的公司) 的首席信息官。

我們正處於一個轉折點。

在幾十年的承諾從未兌現之後,人工智能終於從研究實驗室中呼嘯而出,進入了現實世界。它能預測每一種已知蛋白質的形狀並革命性改變了藥物發現方式。它在圍棋和DOTA 2中獲勝。在蘋果手錶上,人工智能可以發現潛在的心臟病發作風險,這樣人們就可以在捂着胸口暈倒之前更早的去看醫生。它在中國繁忙的公路和鄉村道路上行駛,在舊金山,很快也會在其他地方行駛。

但即使有了所有這些突破,大多數最大和最重要的模型仍然是嚴格保密的,不惜一切代價被鎖在緊閉的門后。我們可以讀到關於最新、最大的超級模型和其驚人結果的論文,但我們自己不能使用完全的訓練好的模型,無法下載它們的權重(weights)。我們最多只能使用受限的API,這些API幾乎不暴露其功能,並極大地限制了我們可以使用它們做的事情。

但隨着Stable Diffusion的發行,這一切都改變了,這是一款AI藝術生成引擎,在互聯網上掀起了風暴。這是第一個以開源形式發布的真正先進的模型,該模型在超級計算機上使用4000個A100s芯片進行訓練。

它標誌着人工智能的下一個轉折點:開放基礎模型(foundation models)的時代。

現在,我們不再把這些強大的模型藏在少數強大的組織的牆後面,而是把最先進的模型交到每個人手中。它已經釋放了前所未有的新創造力的爆發,幾乎每天都有新工具問世。有如此多的工具和新的商業想法,幾乎不可能跟上所有這些,還有大量潛在的商業應用程序,如可以推動醫學研究的合成大腦掃描圖像原型,按需的室內設計,令人難以置信的強大好萊塢風格的電影效果,視頻遊戲的無縫紋理,新型快速動畫,可以推動大量新的流媒體內容,動態動畫視頻和書籍,概念藝術,應用於Figma和Photoshop的插件,以及更多。這一切都發生在一個月內。

該模型發布僅兩周后,有進取心的程序員將模型與圖像生成、面部平滑和提示分割結合在一個簡單的UI中:

Stability AI 首席信息官:真正開放AI的轉折點是現在

父親們正在把簡單的兒童繪畫在幾秒鐘內變成傑作,向孩子們展示如果他們堅持畫畫和磨練自己的手藝,會有哪些可能。

Stability AI 首席信息官:真正開放AI的轉折點是現在
Stability AI 首席信息官:真正開放AI的轉折點是現在

(源代碼)

其他公司則將Stable Diffusion與視頻結合在一起,並將其與Ebsyth等其他工具結合在一起。真正的創新來自於開源,因為一個公司無法想象所有的可能性,除非人們能夠真正接觸到它,而不是只接觸到一個被鎖在門后的版本。

Stability AI 首席信息官:真正開放AI的轉折點是現在

(源代碼)

這只是冰山一角。我們發布遊戲才一個月,就已經看到了驚人的反響。六個月或一年後會是什麼樣呢?

環境人工智能(Ambient AI)時代

在Stability,我們認為只有當人工智能輻射到世界各地的人時,它才會真正實現變革。當一個人或幾個人有智能手機時,這沒有什麼有趣的。只有當我們把10億台智能手機連接在一起時,它才變得有趣。

是時候讓我們往大的方面想了,想象一下我們可以在更大的範圍內用這些模型做些什麼,想象一下我們如何以一千種方式將基礎模型編織到全世界的各種軟件中去。

當基礎模型無處不在時,一切都會改變。

想象一下這樣一個世界:不久之後,基礎模型即服務(FMaaS)將湧入我們生活的方方面面,並徹底改變工作和娛樂的方方面面。

設計師和動畫師正在使用模型為他們正在創作的新電影和電子遊戲生成數以千計的潛在概念。皮克斯、漫威和迪士尼的動畫師與FMaaS公司合作,在他們的優秀概念藝術的私人數據集上微調模型,突然發現模型幫助他們的動畫師走向了一個完全不同的方向。這導致他們的下一部電影成為歷史上最賣座的電影,但三年後又以另一部人機混合電影再次登頂。

生物技術公司在蛋白質和化學相互作用的大量數據庫中搜索,並迅速使用微調過的基礎模型設計出20種潛在候選藥物,以對抗最近在世界上某個地方突然出現的一種罕見的運動神經元疾病。

一位音樂家即興創作了一首新歌,然後讓模特們對副歌進行迭代。第17首很棒,音樂家演奏了它,然後做了一些調整,使它更朗朗上口。它在Soundcloud上大受歡迎。

材料科學家們正在設計新的材料,使一切都變得更堅固、更輕,從更容易彎曲的摩天大樓,到輕到可以扛在肩上、摺疊整齊可以帶上火車的電動自行車。

精英編碼人員只是簡單地告訴編碼模型他們想讓它做什麼,它就會產生近乎完美的Python代碼,但它也推薦Go的幾個庫,因為它會更快,更安全。它會自動進行語言間的翻譯並進行測試。它與語言模型進化(ELM)和大型語言模型(LLM)相結合,這些模型幫助編碼人員在一個模型從未通過快速迭代概念而訓練過的領域創建全新的、以前從未想到的代碼。

歡迎來到環境(ambient )AI時代。

內容是活着。它是交互的,迭代的,與我們共同發展的。

所有這一切都將發生,因為環境AI模型的巨大全球網絡。人工智能無處不在,每個設備都在蘇醒,變得越來越智能。一旦我們將智能工業化,它將在我們的工作和娛樂方式上引發一場革命。

但要成為現實,這個行業現在就必須做出改變。

首先,我們必須更加開放。

真正開放的人工智能時代

在Stability,我們正在重新開放AI。

我們從一開始就專註於開源戰略。這與該行業迄今所採取的方法截然不同。雖然AI/ML中許多最重要和最強大的工具,如Pytorch和Tensorflow都是開源的,但我們已經看到,所有最強大的模型都是封閉和專有的。這與幾十年前Linux第一次出現時的世界運行方式驚人地相似。

當我在20世紀90年代第一次在大學里看到Linux時,我知道我看到了一些全新的、不同的東西,一些激進的、奇妙的甚至危險的東西。危險是因為它擁有永遠顛覆整個軟件生態系統的力量,它確實做到了。那些大型的、封閉資源的強國感到了威脅。那時,紅帽Linux還在弗萊電子(Fry’s Electronics)的盒子里出售,史蒂夫•鮑爾默(Steve Ballmer)稱Linux為“癌症”。

想象一下,如果史蒂夫·鮑爾默(Steve Ballmer)贏得了這場戰鬥,摧毀了Linux?就連微軟的雲計算現在也主要是由Linux驅動的,所以他的短視和恐懼會毀掉自己公司的未來。

今天,開源是默認的。從網絡後端到美國和世界上最強大的超級計算機,到你的手機,再到最尖端的人工智能應用程序,Linux為一切提供了動力。它為無數的工作崗位負責。它為雷達系統和核潛艇提供動力。每一項主要技術都是從開源開始的,無論是雲計算、移動還是容器。如果你還年輕,剛剛進入科技行業,開源就像一棵樹或一條河一樣永遠存在。你從來沒有離開過它。Github和跨越世界的開發團隊是常態,而不是例外。

Open是所有地方的默認值。

除了在AI /ML領域。

在Stability,我們認為這種情況必須改變。開源構建模型的工具是不夠的,重要的是模型本身。

如果最強大的模型集中在一小群人手中,我們認為這對世界來說是一場災難。即使是最優秀、最有創造力的公司也無法看到他們技術的所有可能用途。無論一個中心化的團隊如何努力,他們的創造力永遠無法與一個去中心化的團隊相比。這就是“湧現”的力量,才華橫溢、遠見卓識的作家斯蒂芬·約翰遜在他的《Emergence: The Connected Lives of Ants, Brains, Cities and Software》一書中對此進行了概述。

歷史就是這一真理的活生生的證明。以晶體管為例,它可能是模型世界中最重要的發明,因為它使微芯片成為可能,而今天微芯片在你的所有東西中,從你的汽車,到你的微波爐,到你正在閱讀這篇文章的電腦或電話。

晶體管出自貝爾實驗室,歷史上最具創造力的公司之一。在《The Idea Factory》一書中,我們可以將貝爾實驗室視為第一個真正的智庫,它的利益波及到世界各地的相關領域。我們這個時代的許多最重要的發明都出自貝爾實驗室的團隊,比如信息論,它支撐着萬維網和洲際通信的整個通信基礎設施。

然而,即使是偉大的貝爾實驗室也錯過了晶體管的大部分最終用途。他們主要只是想要一種比真空管更有效的東西,在長途電話線上放大電子信號。他們從未預見到微芯片的到來。

是外部公司首先提出了微處理器以及如何擴大和發展它。這些公司(比如英特爾)擁有晶體管和貝爾實驗室的全部血統,還有當今所有的手機公司、計算機公司和雲計算公司。

在Stability,我們相信源源不斷的創造力會讓我們想出前所未有的創意。

朋克搖滾AI和評論角(Critics Corner)

當然,我們知道發布Stable Diffusion並不是沒有爭議的。

有些人害怕道德問題、深度造假(deep fakes)或表示問題(issues of representation)。我們也是,這就是為什麼我們和Hugging Face團隊合作,在革命性的OpenRAIL許可下發布它,禁止將模型用於非法目的和傷害他人。

違反這種許可的人應該為他們的行為付出代價。

但我們不會告訴菜刀製造商:除非他們能向我們保證不會有人用它來刺人,否則他們就不能生產刀具。絕大多數人都很好,會用它來切蔬菜,他們應該有切蔬菜的能力。這些模式應該掌握在多數人手中,而不是少數人手中。

我們也知道,如果允許社區接觸到這種技術,開源工具將會進化出更好的措施來保護人們。並且使得這種技術不會因為恐懼而癱瘓,或者因為善意的立法者被閉源AI公司誤導而立法消失。因為閉源AI公司在假裝讓AI民主化的同時,卻在偷偷地為自己保留所有的蛋糕。

這就是為什麼我們將贊助一系列競賽,為模型提供最好的開源安全工具,我們將為此投入10萬美元的獎金,所以請期待很快的公告。就像開源加密更好,因為與封閉系統相比,更多的人可以發現它的弱點,由社區進化的AI安全控制工具將比單個公司創造的任何東西都更強大、更健壯。

我們也聽到了藝術家們的擔憂,我們正在開發一個工具,讓藝術家們選擇不接受培訓。你說,我們聽。就這麼簡單。

當然,一些爭議來自對人們失業的擔憂,或者來自將人工智能視為弗蘭肯斯坦(科學怪人)的持續敘述。幾十年來,科幻小說中邪惡的人工智能走錯了路,比如《HAL》、《終結者》和《機械姬(Ex Machina)》,助長了對人工智能的恐懼。官僚們撰寫的政府報告也支持了這一觀點,報告中使用了關於人工智能應用的虛構數字,而這些數字實際上還不存在。這些故事和報告基本上都是弗蘭肯斯坦的翻版,作為一個科幻小說愛好者,我承認其中很多都很喜歡,但它們只是故事。

二十年後,我們會意識到他們的預測能力和人口炸彈(the Population Bomb)一樣強,人口炸彈預測20世紀80年代將有10億人餓死,因為我們永遠無法找到養活所有人的方法。相反,我們發動了綠色革命(the Green Revolution),在接下來的30年裡,我們把飢餓率降到歷史最低。

人工智能將創造出一種全新的工作。我們很容易想象所有失去的工作,但人們很難看到新技術創造的所有工作。你如何向18世紀擔心犁地的農民解釋網頁設計師的工作?你不能,因為它是建立在一系列技術的基礎上,從電力,到電線,到電腦和互聯網。

當然,有時舊工作確實會消失或改變,但它們會被一系列新工作所取代。過去,我們通過屠殺大量抹香鯨並從它們的頭骨中提取油脂來照明世界,而不是使用電燈,但今天有多少人會主張恢復使用鯨魚油蠟燭呢?

當照相機在19世紀突然出現時,藝術家們擔心藝術的終結正在迅速到來。波德萊爾稱攝影是“才華不足的失敗畫家的避難所”。人們擔心照相機會破壞社會、文化和女性道德,以及其他事後看來很奇怪的擔憂。回想起來,這些擔憂總是很奇怪,因為生活從來都不是那樣的。我們適應。我們改變。我們整合。這就是我們的工作。

攝像機怎麼了?它將藝術家從對現實主義的嚴格關注中解放出來,並引發了印象派、立體主義和抽象藝術等現代藝術運動。

Stability AI 首席信息官:真正開放AI的轉折點是現在

平心而論,相機最終確實取代了許多肖像藝術家,但隨着時間的推移,相機帶來了大量全新的工作,從自然和野生動物攝影師到電影編輯、電影攝影師等等。它創造了像電影和電影這樣的全新產業。

對了,肖像藝術家們現在也在大舉回歸。看看這8位肖像藝術家的名單,他們改變了我們對肖像的看法。

當然,我在這裡說什麼對有些人來說並不重要。有些人只是想生氣,決心不惜一切代價討厭這項技術。五年後,這看起來就像討厭Photoshop一樣荒謬。人工智能只是另一種工具,它將被證明對大量人非常有用。

今天,在擔心想象中的末日已經成為一種國際消遣,我們聽到的是,這一次真的不同了。

這沒有什麼不同。

人類是適應性極強的生物。我們總是設法通過技術來改變,把它融入我們是誰,我們做什麼,我們如何工作,這次我們還會這樣做。這是因為技術並不存在於我們之外,它是我們的一部分,是我們的本質。

我們不會都靠基本收入過活不,不會在堆疊的《頭號玩家》中,戴着VR頭盔勉強維持悲慘的生活。

當涉及到藝術時,人們擔心Photoshop和數字筆會破壞藝術。他們說用軟件創作的藝術不是“真正的”藝術。現在一切又來了,保守者,憤怒有人憑藉Midjourney贏得數字藝術競賽,誹謗AI混合藝術家是假藝術家,誹謗開源AI模型是為了玷污和美化它們,以便閉源的AI公司能夠牢牢控制未來。如果你攻擊開源AI並要求集中控制,那麼諷刺的是,你正在創造你所害怕的未來,在那裡,一小群大型科技公司控制着你能用技術做什麼和不能做什麼。別上他的當。

當我在寫關於AI藝術生成器的奇妙新世界以及為什麼在Stable Diffusion正式發行前批評他們的人都錯了的時候,我便看到了所有這些恐懼。但讓我在這裡儘可能清楚和簡單地總結一下:

在Stability,我們製作的工具不是為了取代美工。我們愛藝術家。

我們為藝術家製作工具。

我想保護藝術家,因為我是藝術家。除了從事科技工作外,我的大部分生活都在寫作。

但我的最愛是畫畫。作為一個孩子,它是我的整個世界,一個我可以逃避的地方,創造我夢想的風景。我喜歡畫怪物、外星人和宇宙飛船,但在上世紀80年代和90年代初,當我還是孩子的時候,除了極少數人,比如龍地下城的先驅Larry Elmore或早期幻想藝術家Boris Vallejo和Julie Bell,這類繪畫沒有職業道路。那時,你要麼進入美術行業,要麼在廣告行業工作,我決定我寧願再也不畫畫,也不去做廣告。所以我停止了畫畫。

我不相信宇宙會為我開闢道路。我沒有看到互聯網的興起,也沒有看到科幻和奇幻藝術、電子遊戲和大片的爆炸式發展。還有另一個宇宙版本的我,我一直在畫畫,並愉快地以畫怪物和科幻戰鬥盔甲為生,並且隨着每一項新技術的出現,我迅速學會了使用Wacom屏幕和AI美術生成器等新工具。

最終,我學會了用文字畫畫,成為了一名作家,還有許多其他的終身追求。沒有什麼比每天寫作更讓我喜歡的了。

所以我明白了。我知道成為一名藝術家意味着什麼,知道這對我的身份有多重要,知道坐下來寫作能給我帶來多少快樂,幾個小時彷彿一秒一秒地過去。

我不允許我們創造工具來取代藝術家。這很簡單,因為這對我很重要。相反,我們正在為藝術家們建立共同創作、共同合作的工具,這將釋放一個全新的創意世界。正如彼得·蒂爾在《Zero to One》一書中所寫的那樣:“未來最有價值的公司不會問什麼問題可以單獨用計算機解決。相反,他們會問:計算機如何幫助人類解決難題?”

我們已經看到藝術家們在使用我們的工具。Stable Diffusion被集成到Figma和Photoshop中,還有很多其他的,我現在甚至無法跟蹤它們。這就是開放的力量。我們正在開發工具,讓概念設計師可以更換頭盔、戰鬥盔甲和面孔。時裝設計師將與Stable Diffusion一起迭代和共同創造,製作新的手套、帽子、褲子、西裝和鞋子。

美術團隊將聯合Stable Diffusion 3D工具和畫家,自定義內部工具。你會在動畫工作室和電影工作室等地方找到它。而這僅僅是個開始。

對於那些認為“任何人都能做到”的人來說,他們會用低報酬的文字提示器取代所有的藝術家,這是大錯特錯的。當然,任何人都可以用文字創造新的圖像,但這需要藝術家的感性來充分利用這些工具,以及對構圖、主題、比例等的深刻理解。你認為除了出色的服裝設計師,還有誰能在亞馬遜上設計出令人難以置信的指環王新盔甲和服裝的外觀和感覺?你需要一個了解歷史和幻想的人。我們將看到美工快速迭代這些工具,並在AI圖像上作畫,添加正確的感覺、比例和敏感性。

看看這個Reddit線程中藝術家的工作流程,使用一個高級的工作流程,當我們將Stable Diffusion編織到專業工具中時,這種情況會越來越多:

首先,藝術家做一個快速的草圖:

Stability AI 首席信息官:真正開放AI的轉折點是現在

然後,美工使用Stable Diffusion和img2img工具和一個提示(prompt)得到一個不同的版本。

Stability AI 首席信息官:真正開放AI的轉折點是現在

現在,藝術家在Photoshop中對新圖像進行繪製,以賦予它更多的感覺和深度。

Stability AI 首席信息官:真正開放AI的轉折點是現在

最後,美工再次使用SD和img2img生成變體,然後在持續的創作循環中進行更多迭代。

Stability AI 首席信息官:真正開放AI的轉折點是現在

如果你認為任何人都能完成這個工作流程,那說明你看得不夠仔細。而說“任何人都能做”實際上只是表明了另一種擔心,即人工智能工具將使藝術“技能化”,從而導致工資下降,這實際上只是擔心人工智能將摧毀所有工作的另一種變體。

讓我們明確一點:這些工具實際上需要熟練的藝術家。

他們不會取代藝術家。

他們將以全新的方式提升藝術工作流程。

所以感到興奮。參與進來。加入我們的行列。與我們合作。藝術和藝術家不會離開。相反,我們會看到相反的噴發全新類型的藝術倒出來,新類型的油漆一樣釋放出不同種類的繪畫,或新型金屬給了我們不同的雕塑,或Photoshop的方式給了我們更多的液體平面設計,或數字電影編輯給了我們一千種的新方法去改變電影的外觀和感覺,或相機給了我們新的方式去看世界,或者網絡給了我們一個新的方式來分享我們的工作。

老的科技公司逐漸進化到不停地控制我們的注意力,通過不斷地消耗靜態內容,讓一切都強迫性地上癮。你甚至不知道自己為什麼要查看智能手機,它只是偶爾出現在你的手裡。當你高興,難過,沮喪,生氣的時候,它都在。

我們要建立一個充滿活力,活躍,智能內容規則的世界,一個充滿活力,你可以與之互動的數字世界,共同創造的內容,那是你的。

加入我們,你將不再只是在未來的網絡上衝浪,被動地消費內容。

您將創造它。

相關鏈接:

Stability AI: https://stability.ai/

本文鏈接:https://www.8btc.com/article/6781596

轉載請註明文章出處

(0)
上一篇 2022-10-11 14:58
下一篇 2022-10-11 15:33

相关推荐