人工智能白皮書:AIGC 的機會在哪裡?

原文標題:《白皮書 | AIGC 的機會到底在何處?》(AI 2022: The Explosion

撰文:David Cahn、Caryn Marooney、Sri Viswanath、Malachi Price、Jessica Brown、Vibhor Khanna

編譯:阿法兔

人工智能白皮書:AIGC 的機會在哪裡?

圖片來源:由無界版圖AI工具生成

‍‍‍本篇文章,是知名基金(Coatue)發出的白皮書,談到他們認為 AIGC 的機會到底在哪,目前有哪些應用案例。筆者翻譯后,對部分概念做了一些批註。那麼,這篇文章怎麼使用?筆者認為,最有價值閱讀的部分,是文章中的各種應用案例,動態演示部分見下列參考鏈接的原文(請注意:這些大部分都是 Coatue 的 Portofolio,請大家本着客觀理性的態度閱讀,本文不構成任何投資建議或者對項目的推薦),不過這些思路,對於我們目前的觀察研究,特別是根據目前這些項目的表現和狀況,去思考需求在哪,這些需求到底有多大,還是有一定幫助的。

1. 前言

隨着 AI 從研究模式轉變為商業化和規模化,大家都想知道。此時此刻的「人工智能高光時刻」對個人、公司和社會有什麼影響?這種興奮和期盼將如何轉化為切實的進展?

隨着人工智能圖像生成器的出現,人工智能領域似乎正在迎來真正行業的高光時刻,已經逐步成為主流。目前人工智能生成藝術隨時可見,在 Instagram 和 Twitter 上,在《紐約時報》和《大西洋》等主流出版物的頭條上,都有介紹 AIGC 的新聞,或者用這種技術生成的圖像。

這一高光時刻到來的背後,是已經醞釀了五年的科學突破。自 2017 年 Google Brain 推出 Transformers 以來,人工智能一直在悄然迅速迭代,這種現象被稱為深度學習的研究浪潮。

深度學習,使用神經網絡來學習世界運作的通用原則,通過在大型數據集上進行模型訓練,基於深度學習的 AI 可以完成普通的任務,例如自動回應客戶服務請求。當然,這種技術也可以完成更有創造性的工作,如寫博客文章,生成圖像和視頻,以及寫代碼。隨着這些神經網絡的規模呈指數級增長(近年來增長了 1 萬多倍)AI 技術變得更加強大。

十多年來,Coatue 一直密切關注這一趨勢,在 2010 年代中期開始,Coatue 投資了英偉達。在 2018 年 East Meets West 的會議上,英偉達創始人黃仁勛預測,未來人工智能將協助解決人口問題,例如目前美國的勞動力短缺問題,提高整個社會的生產力和繁榮程度。

這個預測中的未來現在正在逐一實現。同年,Coatue 在深度學習領域下了兩個大賭注,加入了流行的機器學習開發者平台 Weights & Biases 的董事會,投資了人工智能芯片公司 Cerebras。

基於 Coatue 從這些經驗中得到經驗,在接下來的幾年,我們加強了對人工智能的關注,投資了許多趨勢中最有前途的公司,包括 Abacus、Edge Impulse、Gantry、Gong、HuggingFace、Jasper、Latch Bio、Lightning、Replit、RunwayML、Scale 和 Stability。

這段時間的熱度,對整個人工智能領域來說是振奮人心的。可以說,人工智能在瞬間就爆發了,真正進入了公眾視野。目前,所有人都在談論 AI,不僅僅是工程師,還包括普通用戶、財富 500 強的高管、和很多媒體人。今年夏天公開推出的開源工具 Stability,短短 30 天內,就有超過一百萬用戶使用他們的產品(文字轉圖像)。

隨着像 Stability 和 OpenAI 這樣的公司通過 API 向開發者發布更新、更強大的人工智能模型,建立人工智能應用的關鍵障礙已經被消除了。結果是我們看到了人工智能的爆發時代,也就是,每天都有新的應用被發布。

隨着 AI 從研究模式轉變為商業化和規模化,大家都想知道。此時此刻的「人工智能高光時刻」對個人、公司和社會有什麼影響?這種興奮和期盼將如何轉化為切實的進展?

本篇白皮書中,我們將回顧人工智能的最新技術突破,並分享我們對「Summer of AI」將如何真正轉化為未來十年的行業性變革。

2. 為什麼目前人工智能很重要

為什麼目前人工智能很重要?(What is the big deal with AI right now)

人工智能白皮書:AIGC 的機會在哪裡?

Jason Allen 的人工智能生成的作品「Théâtre D'opéra Spatial」,在科羅拉多州博覽會上獲得數字類作品第一名。來源:紐約時報

長期以來,許多人認為人工智能是一種只能自動完成簡單任務的技術。2022 年最大的驚喜之一,是市場對人工智能生成藝術的關注度增長迅速。儘管受到了部分傳統藝術家的反對,但是人工智能藝術確實將人工智能革命的創造潛力帶到了真實的生活場景中,並激發了新一代的創作者的熱情。

當然,人工智能生成藝術只是冰山一角。現在,有超過 120 萬名軟件工程師使用 GitHub Copilot,GitHub Copilot 可以自動編寫 40% 的代碼。能夠撰寫博客文章和營銷內容的 Jasper.ai,在過去兩年中得到了廣泛應用,並迅速成為行業標準。基於人工智能的視頻編輯器 RunwayML,目前有數十萬用戶,它們的用戶還包括在《The Late Show》、《Top Gear America》(Top Gear America)和《Everything Everywhere All at Once》等知名節目工作的視頻編輯。

這波人工智能的再次復興,正在許多不同的領域和垂直行業中發生,這並不是一個巧合:我們認為:規模化的突破使人工智能在很短的時間內變得指數級別的強大。工程師們目前正在利用這一技術突破,將其應用到可以能實現的各種場景。

隨着人工智能開始觸及越來越多的行業,越來越多的創業者被這項技術及和它的潛力所吸引也是很自然的。

像 Metaphor 這樣的公司,正在研究人工智能搜索。Podcast.ai 正在創建人工智能生成的訪談。Adept.ai 正在研究「Decision Transformers」,他們將用它來為現有的應用程序(如 Excel 和 Salesforce)建立一個通用的人工智能助手。

Wordtune 已經發布了一個人工智能寫作助手,而 Repl.it 正在建立一個 AI 優先的軟件開發平台。

每個垂直領域都有新的初創公司出現

像 Canva 和 TikTok 這樣的後起之秀,正在用人工智能與它們的現任對手微軟和 Meta 競爭,而這些科技巨頭也在進行反擊:上周,微軟官宣自己的應用——Designer,即 Canva 的競爭對手,由 DALL-E 提供支持。Meta 公司推出了 Make-A-Video,一種生成視頻的新工具。

這些變化在科技領域之外也會有其發展跡象

在生命科學領域,幾十家公司正在致力於將人工智能應用於人類基因組的研究。像基因科技這樣的巨頭正在大筆投資人工智能藥物研發公司,像 AbSci 這樣的生物技術公司,因其在人工智能平台上的模式,也經常在各種大型人工智能會議上亮相。而像 LatchBio 這樣的初創公司正在為生物學家建立基礎設施,以便輕鬆運行人工智能工作負載並進行數據分析。

即使在採礦等傳統行業,新的初創公司也在努力前行,例如,利用人工智能尋找自然資源。Aurora Solar 正在用人工智能生成最佳太陽能屋頂安裝實踐方法。許多大型農業公司正在應用人工智能來提高作物產量,John Deere 已經成為自動化的領導者。

要進一步了解人工智能的新興力量,演示比文字更有說服力。在下一節中,本文將通過一些有趣的產品的演示來展示 AI 生態系統中的快速進展。

3. 人工智能:案例

了解人工智能最好的方式是自己去探索。本節將介紹今年 AI 領域一些最令人興奮的產品和例子,當然,每天都有新的案例出現,這只是一個初步的樣本呈現。

圖像生成模型 StableDiffusion

人工智能圖像生成器,已經以極快的速度變得非常流行。其中使用最廣泛的是 Dream Studio,這是一個基於 StableDiffusion 的 AI 圖像生成器,產品在 30 天內達到了 100 多萬獨立用戶,並且是完全開源的,無需要註冊或付費。

下面是 Dream Studio 的生成的圖像:

人工智能白皮書:AIGC 的機會在哪裡?

參考鏈接:https://www.loom.com/share/de6fcdf84b33424185f02658c7530cb8

Jasper.AI:文本自動生成器

下面這段話,Jasper.AI 可以將簡短的短語或提示,寫出出數百字的文本。下面這篇英文文章,「現在人工智能有什麼大問題」,是 Jasper.AI 根據以下提示寫的。

「寫一篇關於人工智能的文章,以及它現在是如何有史以來第一次產生內容的。」

下文「為什麼人工智能很重要?」這篇英文文章由 Jasper.AI 撰寫

What’s the Big Deal with AI Right Now – Written by Jasper.AI

As anyone who's been keeping up with the latest tech news knows, AI is a big deal right now. But what exactly is AI, and why is it suddenly generating so much buzz?

To put it simply, AI is artificial intelligence. That means creating machines that can think and learn for themselves, rather than just following pre-programmed instructions. This is something that scientists have been working on for decades, but only recently have we started to see real progress.

One of the key reasons AI is generating so much interest right now is because of the sheer amount of data that's now available. With the advent of big data and powerful computer processors, we finally have the ability to store and analyze huge amounts of information. This is giving us insights into how the human brain works, and how we can create machines that mimic its workings.

Another reason AI is such a hot topic right now is because of the potential applications. While it's still early days, there are already many exciting possibilities for how AI could be used. For example, it could help us diagnose diseases earlier, or create more realistic virtual assistants.

So what's the big deal with AI right now? In short, it's a combination of exciting new technology and vast potential applications. We are only just beginning to scratch the surface of what AI can do, and the next few years are sure to be very exciting.

用 RunwayML 生成視頻

基於人工智能的視頻編輯器 RunwayML 已被用於編輯《The Late Show》、《Top Gear America》和《Everything Everywhere All at Once》等電視電影節目。近期,RunwayML 發布了一個生成性的人工智能模型,可以接受各類文本並從頭開始生成新的視頻。以下鏈接是它的運行情況:

人工智能白皮書:AIGC 的機會在哪裡?

參考鏈接:https://twitter.com/runwayml/status/1568220303808991232?s=20&t=SexDMxhkdZSaV8U9p5gl4w

用 GitHub Copilot 和 Repl.it 自動生成代碼

今年早些時候,GitHub 推出了 Copilot,Copilot 是一個人工智能助手,可以幫助工程師更好、更快地編寫代碼。

Coatue 採訪的一位 CEO 是這樣形容的:

「我現在要求公司的每個工程師都使用 Copilot,Copilot 讓每個人都更有效率,甚至比最好的工程師都能寫出更好的代碼。」根據 GitHub 的數據,已經有超過一百萬的開發者使用 Copilot,現在用戶使用該工具生成的代碼超過了 40%。

以下鏈接是關於 Github Copilot 的演示:

參考鏈接:https://www.loom.com/share/79766038ff754612ab8310afc8395890

儘管 GitHub 的目標用戶是專業開發者,但像 Repl.it 這樣的公司正在努力將人工智能編程帶給下一個 10 億開發者:Repl.it 目前擁有超過 1000 萬的註冊用戶,提供了一個集成的軟件開發平台和代碼社交網絡。通過最近發布的 GhostwriterAI(一個人工智能變成助手)的測試版,Repl.it 的團隊相信它可以極大地擴大互聯網上的建設者和創造者的隊伍。

將 AIGC 添加到 Adobe 套件中:

在 AIGC 方面進行創新的不僅僅是初創公司。在 Adobe 的 Analyst DAY 上,公司宣布將在 Photoshop、Lightroom 和創意套件的其他部分嵌入 AIGC 功能。

大科技公司適應這種新的顛覆性趨勢的緊迫性和速度體現了它的力量。Canva 和微軟都在進行類似的布局,Canva 在 9 月宣布它將在其產品套件中加入 StableDiffusion 技術,而微軟也在應用 DALL-E。

以下是 Adobe 的公告的完整演示 DEMO:

人工智能白皮書:AIGC 的機會在哪裡?

https://www.loom.com/share/25281afd22e541d19abc6d78351b64f5

為 Excel、Salesforce 建立通用 AI 助手:

當今人工智能領域最大的主題之一是建立一個通用的 AI 助手,使每個人都更有效率。目前正在測試的一種方法是「Decision Transformers」,這種框架可以教機器學習模型如何做出實際決策,就像人類在日常工作中一樣。

例如,用戶可以教一個人工智能模型如何完成在 Salesforce 中記錄數據、更新 Excel 文件或在 Figma 中對設計進行修改所需的步驟。

人工智能白皮書:AIGC 的機會在哪裡?

Adept.ai 是一家致力於解決上述問題的公司,他們在這裡發布了許多關於其技術的

演示:adept.ai/act

地址:https://s3-us-west-2.amazonaws.com/secure.notion-static.com/c6e19c69-6067-4acd-bcdf-83ab6a2d05d7/Adept_AI_Excel_Demo.mp4

使用人工智能的 PowerPoint Deck

除了創建圖像、視頻和文本,AI 能夠完成相對複雜的任務,例如從頭開始生成一個 PowerPoint 演示文稿。8 月在 ProductHunt 上推出的 DeckRocks,提供了一個很好的案例。DeckRocks 從用戶那裡接受了一個快速的「tagline」,並製作了整個創業公司的宣傳資料。

請看 DeckRocks 根據以下提示創建的宣傳模板:

「A startup that creates music using AI. The idea is to replace Spotify over time. The user can remix different artists and create entirely new music.」

演示地址:

人工智能白皮書:AIGC 的機會在哪裡?

A pitch deck for: “A startup that creates music using AI. The idea is to replace Spotify over time. The user can remix different artists and create entirely new music.” Created using DeckRocks. Scroll to navigate.

語音識別與 Whisper

9 月,OpenAI 推出了一個名為 Whisper 的基於語音識別的模型。該模型可以對語音進行提取、轉錄和翻譯。從歷史上看,有一些非常專業的公司在做這件事(通常有人類在循環中檢查準確性)例如,Nuance,一家為醫生服務的轉錄公司,在今年 3 月被微軟以 200 億美元收購。

下面的例子展示了 Whisper 的示例:

人工智能白皮書:AIGC 的機會在哪裡?

( 演示鏈接:https://www.youtube.com/watch?v=nwPaRSlDSaY)

AlphaFold 算法的應用 (AlphaFold 來模擬蛋白質相互作用 )

很多優秀的 AI 研究人員現在都在關注 AI 在生命科學中的應用。谷歌在 2021 年發表了關於該主題的開創性論文,推出了 AlphaFold,一個基於基因組代碼預測蛋白質結構的模型。下面的演示講述了一項基因組學任務,通過使用人工智能模型來預測蛋白質的摺疊,大大加快了這項任務。

使用 Latch Bio 的界面的 AlphaFold 演示:

人工智能白皮書:AIGC 的機會在哪裡?

Weights & Biases:人工智能的開發者平台

在上述許多應用程序的基礎上,有一個先進的基礎設施層,使 ML 從業者能夠富有成效。

例如,現在有超過 20 萬名機器學習工程師使用 Weights & Biases,以更快地建立更好的 ML 模型,使用該平台進行模型監測、微調等。

下面的例子概述了 ML 工程師如何協作跟蹤實驗,評估 ML 模型的性能,重現 ML 模型,並將其結果可視化。

人工智能白皮書:AIGC 的機會在哪裡?

https://www.youtube.com/watch?v=krWjJcW80_A

Hugging Face:正在建立機器學習領域的 Github

Hugging Face 正在建設「機器學習的 Github」。現在它已經成為分享 ML 模型、數據集以及運行 AI 產品和演示的廣泛選擇,Hugging Face 上最受歡迎的機器學習模型已經獲得了超過 3000 萬次下載,像 StableDiffusion 、OpenAI 的 Whisper 等模型都在 Hugging Face 平台上發布:https://www.loom.com/share/5c7d276c9c0943b7963de09ff78e0fbd

4. 科學的突破:到底是什麼推動了人工智能的發展

在上一節主要是用案例來展示人工智能的力量,AI 現在可以寫文本,生成圖像,編輯視頻,以及在更多場景得以實現。但是,在這些新技術的底層,到底有什麼新的創造?這裡我們要提到一個歷時五年的科學突破:

Transfomer 的發明和深度學習的崛起

在 Transformer 模型誕生之前,各類主流 NLP 神經網絡採用的是 Encoder-Decoder(編碼器 – 解碼器)框架。

深度學習的崛起

神經網絡是推動深度學習的核心技術,神經網絡最早的例子主要用來構建圖像檢測器。深度學習模型的一個簡單例子是貓咪識別,具體指的是通過在貓咪照片的數據集上訓練模型,可以教這個模型理解貓咪的基本特徵:鬍鬚、大小、眼睛顏色等。完成訓練后,這個模型可以準確地預測一張新圖片是否符合貓的特徵。

與傳統的機器學習不同的是,深度學習更多的是統計學和確定性的,深度學習的目的,是教模型基本原理,這個模型不會「記住」貓是什麼,而是正在發展對使某物成為貓的組成部分的基本理解。

傳統的機器學習方法是圍繞着科學家將任務分解成不同的問題陳述或「特徵集」,並開發模型來解決這些問題,這樣的策略,在用於小型數據集和被完全理解的問題時非常有效。然而,當研究人員開始研究更多的開放式問題時,它就沒那麼好用了,例如,理解人類語言或運行自動駕駛汽車,這兩個問題是深度學習運動需要解決的重大問題。

深度學習始於 20 世紀 80 年代 Yann LeCun 發明的卷積神經網絡(CNN),Yann LeCun 現在是 Facebook 的首席人工智能科學家。然而,CNNs 從未發展起來,因為它們並不准確,而且從硬件角度來看,運行 CNNs 所需的計算水平目前還不具備。

深度學習的重大突破是 Transformer 模型的發明。2017 年在 Google Brain 的論文「Attention is All You Need」中首次提出,Transformer 至今仍然是深度學習的最先進技術。在過去的五年裡,建立更強大、更完善的 Transformer 模型的競賽一直在醞釀之中。目前,這些模型已經變得如此強大,以至於抓住了公眾的眼球。最近,像 Diffusion Model 這樣的替代架構也越來越受市場關注。

最初的 Transformer 論文和 Coatue 最近在人工智能領域看到的許多進展之間的有着直接的聯繫。OpenAI 的模型 GPT-3 和 DALL-E 都基於 Transformer 架構,例如承載着世界上最大的人工智能社區之一的 Hugging Face,以推出一個開源的人工智能模型開始了它的旅程。最早的 Transformer 論文的「參與者」已經開始創辦一些最重要的新興人工智能公司,如 Adept(Ashish Vaswani)、Character.ai(Noam Shazeer)、Inceptive(Jakob Uszkoreit)和 Inflection.ai(Mustafa Suleyman,DeepMind 的創始人)。

自然語言處理(NLP)和計算機視覺(CV)

在 Transformer 推出后,兩個方向的進步協助推動了研究和投資的發展:

一是自然語言處理(NLP),二是計算機視覺(CV)。

首先,是 NLP(自然語言處理);

谷歌和 Meta(Facebook)在 NLP 領域帶來了諸多進展,這些嘗試使兩家公司成為人工智能(AI)的領導者。谷歌在 2018 年發布了 BERT,在維基百科上進行了 Next Sentence prediction 的訓練。Meta 在 2019 年發布了 RoBERTa,這是對最初的 BERT 研究的改進。Hugging Face 最終成為真正普及這類工具的公司,當時它發布了開源的 Transformer 庫,其中包括 BERT 和 RoBERTa 模型的預訓練版本。

深度學習的第二個重要用例是計算機視覺。

計算機視覺專註於理解視覺世界,特別是訓練模型來檢測物體:比如一輛車、一個人、一棵樹,以及這些物體中的邊緣、顏色等等。正如谷歌和 Meta 屬於解決 NLP 問題的大拿,像特斯拉、Waymo、Nuro 和蘋果等公司已經在 CV 研究上投入了超過 1000 億美元,以解決自動駕駛汽車問題,這些公司認為這是人工智能領域最有利可圖的機會之一。

隨着人工智能的進步不斷提高,所有這些領域都在融合。OpenAI 的 DALL-E 圖像模型是建立在其 GPT-3 語言模型之上的。在未來,許多人工智能研究人員認為,基礎的人工智能模型將是多模式的,這意味着相同的模型將被用於文本、圖像、視頻等等。這也是他們看到的通往人工通用智能(AGI:Artificial General Intelligence)的道路,其中一個領域的模型,可以複製甚至超越人類智能。

大模型的崛起 (The rise of big models)

深度學習的一大優勢是,模型越大越好。自從 Transformer 發明以來,擴大這些模型的規模,已經成為研究和投資的關鍵領域。在過去三年裡,人工智能模型的規模已經增長了 15500 倍以上。

按參數數量和發布日期劃分的深度學習模型:

人工智能白皮書:AIGC 的機會在哪裡?

OpenAI 一直是推動模型擴展的最大力量之一。在從微軟融資超過 10 億美元之後,該公司發布了一系列名為 GPT 模型的語言模型。今年夏天,OpenAI 發布了圖像生成模型 DALL-E。

GPT 和 DALL-E 一經發布,立即成為最先進的主導模型,現在已經成為業內模型複雜性不斷增加的趨勢的標杆。

如果「從更多的計算,就能意味着更好的結果」這一基本前提出發,那麼可以預期,人工智能生態系統的發展會持續產生巨大的影響。重要的是,這就意味着與其讓每家公司建立自己的 AI 模型,不如由少數具有成本結構優勢和規模的主導供應商去主導這個市場。

這種認知已啟動了一場新的人工智能軍備競賽:據 Pitchbook 報道,在 OpenAI 從微軟融資 10 億美元之後,其競爭對手 Cohere 以 10 億美元的估值融資 1 億美元。由(谷歌 DeepMind 的聯合創始人:Mustafa Suleyman)創立的 Inflection.ai 融資超過 2 億美元,由 OpenAI 自己的團隊創立的 Anthropic 融資超過 5 億美元。隨着人工智能領域的升溫,更多的進入者可能會跟進。

雲計算供應商也認識到了這個巨大的機會。隨着微軟對 OpenAI 的全力投入,我們預計谷歌和亞馬遜很快就會進入這個戰場。鑒於人工智能工作負載的計算強度,隨着時間的推移,它應該為雲計算供應商帶來巨大的收入,他們可能會將這一類別視為戰略要務。

大模型趨勢中的最大贏家可能是英偉達,英偉達的圖形處理單元(GPU):特別是他們最先進的 A100 芯片,已經成為運行雲端 AI 工作負載的實質標準,目前在這個生態系統中投入的大部分資金最終會使英偉達受益。

基石模型公司 (Foundational Models)

隨着模型越來越大,人工智能領域正在出現一個新的類別,就是那些能夠提供基石模型的公司。基石模型公司的願景是提供其他公司可以利用的核心 AI 基礎設施。通過這種方法,公司可以在現有的基礎模型之上建立他們的應用程序,而不是每個公司都必須從頭開始重新訓練自己的模型。

這種模式極大地降低了構建新的人工智能應用的門檻,這也就解釋了為什麼能在 2022 年的夏天,我們能看到的應用層應用的湧現。

例如,Jasper 沒有自己的人工智能模型。但是可以向 OpenAI 支付訪問其 API 的費用。同樣,GitHub Copilot 獨立於底層的人工智能模型,也就是 OpenAI 的 Codex 模型;而 Canva 在 9 月宣布,它將在其平台上使用 Stable Diffusion 來驅動圖像生成。

隨着越來越多的終端產品使用人工智能進行設計,關於技術分佈策略的爭論將會升溫。今天,我們看到人工智能未來的三種可能路線。

1. 可以供所有人使用的模型(Models for ALL)。每年,隨着越來越多的學生選擇專註於人工智能領域,人工智能領域學歷的供給將持續上升。根據 LinkedIn 的數據,今天美國大約有 50 萬名機器學習工程師。在未來幾十年裡,這個數字可能會增長 10 倍或 100 倍?我們預測,未來可能會有和軟件工程師一樣多的人工智能工程師,或者這兩種工作將不會用明顯的區別。在這個世界上,人工智能領域工程師將結合通用的 AI 工具,使用 Weights & Biases 和 Hugging Face 等平台,為僱主建立和部署模型。

2. 新的屬於人工智能 FAANG(Facebook、Apple、Netflix、Alphabet 谷歌)巨頭格局形成:如果基礎模型成為未來部署人工智能的主要方式,那麼一小撮新的公司可能會成為「人工智能領域的 FAANG」。這些新興巨頭可能會控制一個大模型,通過 API 將其授權出去。為了保持行業地位,每個基礎的人工智能公司將花費數十億美元進行模型訓練。而在非人工智能公司內部,軟件工程師將利用這些大模型進行自己的應用,可能會根據自己的應用需求對這些模型進行微調,但他們自己不會建立任何模型。

3.混合式(Hybird Approach)。關於人工智能生態系統如何發展的第三個假設是一種混合方法。在未來的願景中,將存在免費使用和開源的基礎的人工智能模型。隨着這些模型的效率越來越高,訓練成本越來越低,它們將變得商品化。使用這些商品模型,每個企業都可以訓練自己的基礎模型集:例如,迪士尼可以建立一個星球大戰模型和一個漫威復仇者聯盟模型。然後,他們需要在自己的專有數據集上投資模型訓練和微調。

以我們目前在人工智能領域看到的迭代速度,這三種方法都有可能,也有可能出現更新的模式,未來是不確定的,但這也正是此時此刻,AI 如此引人注目的原因:

應用人工智能

基石模型(大模型,Foundation models) 的最大影響是人工智能的更廣泛的應用。一旦這些模型被訓練和部署,它們的力量就可以通過開源代碼或 API 向公眾提供。開發人員可以在這些模型的基礎上構建應用程序:我們將這一趨勢稱為「應用人工智能」。

許多開發者和設計師正在應用人工智能,將其作為他們創意庫中的新工具,並為消費者和企業打造令人難以置信的產品。鑒於這些模型已經存在了不到兩年,而且只在近幾個月內廣泛使用,這一類別才剛剛開始。

應用人工智能的一個新興屬性是,新的開發者類別正在出現,稱為 Prompt Engineer(這裡我們翻譯為提示工程師:是一種對於特定任務去精心構造的輸入。)一個 Prompt Engineer 可以知道人工智能模型是如何工作的,可以用來提供智能提示,但不需要知道如何編程,這就為非技術專業人員獲得人工智能的力量開闢了道路。

在 Stratechery 對 Github 前 CEO、著名的 AI 投資人 Nat Friedman 的採訪中,他是這樣說的:

「最近有位卡車司機,他取消訂閱了 Netflix 劇集,現在他的愛好就是睡前做幾個小時的 AI 圖像,他完全被這個迷住了。客觀上,自己做圖像,要比看 Netflix 和播放節目更好;因為這是探索自己的想法和創造力的空間。因此,事實證明,有很多人有這種創造性的衝動,只是沒有工具,沒有手工技能來表達它和創造藝術,而像 Midjourney 或像 Stable Diffusion 這樣的工具給了他們發揮創造力的空間。」

我們在上一部分展示的許多案例,都是應用人工智能工具,這些應用場景,跨越了從藝術創作到提高軟件開發人員生產力的各種方面:

作為通用的框架,可以按照兩個軸線來組織梳理 AI 的應用範圍:

  1. 模式(Modality):模型作為輸出產生的內容類型(如文本、圖像、視頻、代碼等)
  2. 目的 (Purpose):模型為其用戶實現的功能或「結果」
  3. 生成方向(Generative):代表用戶創造內容(如藝術創作)
  4. 功能方向 (Functional):幫助簡化或改善用戶的工作流(例如,編程助手)
  5. 垂直方向 (Vertical):專門用於特定的行業用例(如蛋白質結構預測)

與許多框架一樣,有一些應用會重疊或跨越以上界限,但我們發現,這種分類法有助於為人工智能這個領域和空間,帶來新的結構:

最終會出現應用人工智能產品,超越上述框架,挑戰新的前沿領域。在這一趨勢中,新的創業思路的發展空間是非常廣泛的,它將成為創業者和工程師們開辦公司和設計新產品的成熟的土壤。我們很高興看到接下來的各種變化和新的方向,因為尚有很多想法還沒有被測試或探索。

MLOps :人工智能是如何建立的?

像所有的軟件一樣,人工智能從根本上說是由代碼構成的。機器學習的開發人員需要工具來編寫、測試、迭代、調試、部署和監控代碼。隨着人工智能變得越來越流行,一套新的工具正在出現,基於從業者新的能量。

像 Weights & Biases 這樣的公司,使機器從業者能夠獲得更多的優勢:為他們提供構建、監測和微調 ML 模型的工具。Hugging Face 提供了一個共享模型和數據集的協作平台,現在是有史以來最受歡迎的商業開源項目之一。

就像 Atlassian、Github 和 Gitlab 提高了開發人員的生產力,並擴大了可以構建軟件應用程序的範圍,我們相信 W&B 和 Hugging Face 將為機器學習帶來同樣的效果。

GPU 和人工智能硬件

隨着人工智能研究支出的增加,硬件的創新及其有效使用(如 CUDA、AIT 等軟件)肯定會成為敘事和賽道發展的重要組成部分。英偉達已經成為人工智能領域的核心硬件公司,幾乎所有的大型人工智能模型都在英偉達的 GPU 上訓練和運行。此外,大多數 AI 開發者已經熟悉英偉達的 CUDA 框架,這是一個并行計算平台,允許開發者通過使用 GPU 來加速應用程序。

谷歌通過 TPU 提出了一個替代方案,而亞馬遜正通過其自己的芯片,如人工智能加速器 Inferentia,進入硬件領域。最值得關注的還有 Cerebras 領導的,它正在建造有史以來最大的計算機芯片,專門用於運行深度學習工作負載。

關於 GPU 和人工智能硬件,英偉達將繼續保持主導地位,還是新進入者將佔據大量市場份額?這是一個開放的問題,問題的答案將在未來幾年內產生重大影響。

在現實世界中部署人工智能(挑戰在哪?)

本文講了很多關於人工智能模型的發展,但最大的未解決的問題之一是在真實生產環境中的部署。今天,從 Hugging Face 公司獲得一個現成的 Transformer 模型或者使用最新的開源版本 Stability 是相當容易的。「從零到一 」比以往任何時候都容易,但從「一到大規模生產」仍然不簡單。

將人工智能整合到公司的業務流程中仍然具有挑戰性。例如,如何確保你的人工智能模型在生產中不被破壞?怎麼能找到需要更多數據的邊緣案例?因為人工智能不是決定性的,而且有許多潛在的用例,對每個場景進行「單元測試」以確保模型行為正常,並不容易。

為了讓人工智能發揮潛應用的力,需要一個更廣泛的生命周期方法來進行人工智能的操作和部署。將人工智能投入真實的生產環境,在生產中監測這些模型,然後通過收集更多的訓練數據來改進發現錯誤的模型,這可能是人工智能的下一個重大創新領域之一,像 Gantry 這樣的公司正專註於這個問題。

物理部署模型是一個額外的挑戰。雖然許多早期的人工智能平台在雲中進行預測,但這隻適用於潛在應用的一個子集。許多最終用例將涉及在邊緣部署模型,例如安全攝像機、可穿戴設備,甚至能源基礎設施。像 Edge Impulse 這樣的新創業公司專註於解決最後一英里的問題,將你的人工智能模型送到你需要的地方。像 OctoML 這樣的其他公司正在研究編譯器,為部署模型的終端進行優化。

未來幾年,企業中從消費級演示到生產級機器學習的飛躍將是一項重要的工作。

5. 懸而未決的疑問:倫理、影響和未來

任何革命性的技術自然會對社會和社會應該如何運作,發起了新的拷問。這些問題不僅僅是專註技術的工程師的職權範圍,也是政府、媒體、公民社會和其他利益相關者的需要關注的範圍。

人工智能倫理是當今一個重要的熱點話題,而且只會越來越熱門。技術總是呈現出有意義的權衡,無論是對終端用戶還是對整個社會,所以在這個話題上自然會有很多討論和看法。

下面,我們將回顧今天引發討論和對話的一些最重要的問題。

人工智能倫理:安全與自由

2022 年出現的最大辯論是安全與自由之間的矛盾。人工智能應該交給大眾隨心所欲地使用,還是為了安全而需要一個監管方?

像 OpenAI 這樣的公司認為,必須有一個 gatekeeper 來保護社會免受人工智能的潛在不良影響,OpenAI 把自己的模型圍起來,用戶需要申請,才能使用,直到最近。OpenAI 被批評為有選擇地確定訪問權限,以及它的一些審查決定。OpenAI 認為,這些措施對於防止人工智能被濫用非常重要。

另一方面,像 Stability 這樣的公司,把自己比作普羅米修斯給人類帶來的火種。Stability 認為,雖然人工智能可能是危險的,但對社會來說,允許一個未經選舉的 gatekeeper 控制誰可以使用該技術以及如何使用,更危險。Stability 認為,技術被濫用是不可避免的,政府的適當角色是規範使用,而不是限制使用。

對於人工智能領域的領軍人物來說,AI 技術的倫理和社會影響是他們工作的驅動力。OpenAI 的明確自己的使命是為了人類而推進人工智能發展,OpenAI 的首席執行官,兼聯合創始人 Sam Altman,提到過,AI 的社會影響也是驅動他前行的主要動力。Stablility AI 的創始人 Emad Mostaque 在開始使用人工智能技術研究自閉症時,開始對人工智能感到興奮,他堅信人工智能將成為貧困國家教育兒童閱讀和寫作的關鍵。

當然,鑒於人工智能的優勢和弊端,基於這些的討論才剛剛開始。

為了領先於這些「和人類相關的倫理問題」,已經有人工智能公司正在僱用內部法律團隊,開始思考道德層面的政策和考量。

HuggingFace 聘請了 Margaret Mitchell 作為其首席倫理科學家。哈佛大學的高級研究員 Joaquin Candela 領導了 Facebook 的「負責任的 AI 人工智能」。為人工智能建立一個強大的法律和監管框架對於長期應用人工智能至關重要,這需要公共和企業部門領袖之間的合作。

人工智能會搶走人類的工作嗎?

在人工智能領域經常被問到的第二個「大問題」是「人工智能會奪走我的工作嗎?」很長時間以來,人們相信人工智能會取代人類的手工勞動。

令人驚訝的是,第一個發展起來的人工智能應用,針對的是藝術等創造性工作,而不是像呼叫中心自動化這樣更普通的任務。但這些應用案例也引發了爭議,包括藝術家的反擊,他們認為用人工智能生成藝術是「作弊」。

當涉及到知識工作時,我們希望人工智能成為一種補充技術,賦予現有工人權力,而不是完全取代他們的工作。例如,Gong 使用人工智能為銷售代表提供超強支持。據該公司稱,Gong 幫助銷售代表節省了 20% 的時間,每個銷售代表的收入增加了 27%。像 PhotoRoom 這樣幫助電子商務商家快速編輯產品照片的公司,因為減少了繁瑣的工作而獲得了很多零售商的青睞。

對於製造業、建築業和呼叫中心等行業來說,人工智能可能是應對人口老齡化挑戰的一個重要解決方案。美國今天嚴重的勞動力短缺,因 COVID-19 而加劇,是人工智能可以幫助解決的另一個緊迫問題。正如英偉達 CEO 在 2018 年 Coatue 會議上指出的那樣,人工智能的最大優勢可能是將富裕世界的經濟體從其人口命運中拯救出來。這種觀點在今天很流行,因為美國在關鍵行業掙扎於勞動力短缺,這可能是支持人工智能興奮度回升的又一個因素。

人工智能已經在成為廣泛應用的助手型工具,這也可能是它在推動廣泛共享的生產力改進方面的早期契機。如果 GitHub Copilot 通過編寫 40% 的代碼加速了軟件工程師的工作,那麼它能為其他人做什麼?我們每天遇到的許多新的公司都在研究如何將這種模式應用於各種不同場景的工作,從安裝太陽能板(Aurora Solar)到維護能源網(Weavegrid)

互聯網並沒有提高人類的生產力,那麼,人工智能呢?

資料來源:《Tech productivity》,AI Next Unlock。

通用人工智能(AGI)

許多人工智能領域的領先公司,包括 OpenAI 和 InflectionAI,都把創造通用人工智能(AGI)作為自己的主要目標。對許多人來說,AGI 這個詞喚起了對未來的科幻想象,即人工智能模型可以接近甚至超過人類智能。

雖然這是一個偏向未來主義的目標,但現實是,通用人工智能這個話題已經在普通大眾中引起了很多困惑。因為許多人將人工智能與通用人工智能混為一談,大家很難理解我們在過去五年中取得的進展,或者人工智能圖像生成器如何融入更廣泛的人工智能軌跡。

最有可能的是,隨着我們進入人工智能的另一個喧囂的周期,關於通用人工智能的討論將再次增多。事實上,谷歌最近解僱了一名公開宣稱其人工智能模型是有生命的員工(谷歌說它自己的人工智能模型沒有生命)。

重要的是要認識到我們離真正的通用人工智能還很遙遠。雖然我們取得的進展值得關注,而且人工智能現在可以理解人類的語言、圖像和其他真實環境,這很棒,但在人工智能能夠解決更複雜和可通用的任務之前,我們還有很長的路要走。

大家都覺得人工智能只是處於初期,未來還有更多的事情要發生,雖然我們目前可能高估了未來一到兩年內的變化,但我們很可能低估了人工智能在未來二到三十年內的影響。

6.結論:接下來會發生什麼?

我們向 StableDiffusion 提了一個問題,它是這麼寫的:

隨着深度學習和基礎模型的興起,我們已經跨越了人工智能旅程中的另一道鴻溝。就在過去的幾個月里,我們看到了人工智能應用的寒武紀爆炸,從它們在博客文章和藝術中的應用到電影等等。隨着人工智能離開研究實驗室,進入現實世界,更多的東西正在到來。未來幾年,人工智能將改變眾多垂直行業的許多業務。我們將看到好萊塢、農業,以及兩者之間的一切變化。

人工智能的機會是巨大的。它有望實現實體經濟的自動化,推動人類生產力的階梯式提高。它還承諾了一個新的創造性的飛躍,人工智能藝術提供了一個探索人類經驗本身的新途徑。還有這麼多工作要做。我們正處於人工智能革命的第一波。規模化運行的機器學習、個性化的模型、多元宇宙 — 還有很多事情要做。最聰明的人正在引領潮流,他們建立的新公司將定義未來十年及以後的發展。

本文鏈接:https://www.8btc.com/article/6787338

轉載請註明文章出處

(0)
上一篇 2022-11-11 11:03
下一篇 2022-11-11 11:24

相关推荐