研報丨AI + Blockchain=?

作者: Yihan Xu
來源:Foresight Ventures
原文標題:《Foresight Ventures: AI + Blockchain=?》

研報丨AI + Blockchain=?

圖片來源:由無界 AI工具生成

Overview

通過這篇文章你可以了解:

什麼是 on-chain AI?

為什麼還沒有鏈上 AI?

AI 上鏈的動力;

技術路徑;

我理解的 on-chain AI 價值;

on-chain AI 的應用場景和項目分析。

一、AI + blockchain =?

開發者對基礎設施建設的瘋狂執着和各種 rollup 解決方案的更新迭代確實讓原本落後的 web3 計算能力實現了突破,這也為 AI 上鏈提供了可能性,但你可能想說與其大費周章地實現鏈上 AI,直接在鏈下運行模型似乎也能滿足大部分需求,而事實上現在幾乎所有的 AI 模型都是以黑盒、中心化的模式在運行,並且同樣在各個領域創造了無法替代的價值。

1)先回到最基礎的問題,什麼是 AI 上鏈?

主流的理解是通過區塊鏈讓 AI 模型 transparent + verifiable

再具體一點,AI 上鏈意味着人工智能模型的 complete verification,也就是說一個模型需要向全網(用戶或驗證者)公開以下三點:

模型架構;

模型參數和權重:公開參數和權重有時候會對產品安全性產生負面影響,因此,針對特定場景,比如風控模型,可以對 weight 做隱藏處理以確保安全性;

模型輸入:在 web3 的場景里基本上是鏈上公開數據。

當滿足以上條件時,整個模型執行的過程是具備確定性的且不再是黑盒操作,任何人都可以在鏈上對模型的輸入和結果進行驗證,從而防止模型擁有者或者相關權限人對模型進行操縱。

2)AI + blockchain 的動力是什麼?

AI 與 blockchain 結合的意義不在於替代中心化的 Web2 人工智能的運作模式,而是:

在不犧牲去中心化和 trustless 的基礎上,為 web3 世界創造下一階段的價值。目前的區塊鏈就像是 web2 的早期階段,還沒有承接更廣泛應用或者創造更大價值的能力。而只有在加入 AI 之後,dapp 的想象力才能真正跳躍到下一階段,這些鏈上應用才有可能更接近 web2 應用的水平,這種接近並不是從功能上做的更相似,而是通過發揮區塊鏈的價值,從用戶體驗和可能性上做出提升。

為 web2 黑盒的 AI 運行模式提供一種透明的、trustless 的解決方案。

想象一下 web3 的應用場景:

將推薦算法加入到 NFT 交易平台,基於用戶喜好推薦相應 NFT,提高轉化;

在遊戲中加入 AI 對手方,更透明、公平的遊戲體驗;

……

但是,這些應用都是通過 AI 對已有的功能在效率或者用戶體驗上的進一步改善。

– 有價值嗎?有。

– 價值大嗎?取決於產品和場景。

AI 能創在的價值從來都不僅是 99 到 100 的優化,真正讓我興奮的,是從 0 到 1 的全新應用,一些只有通過 transparent + verifiable 的鏈上模型才能實現的 use case。不過這些“令人興奮的”use case 目前主要靠想象力,沒有成熟的應用,先來開幾個腦洞:

通過基於 neural network 的決策模型做 crypto trading:一種產品形態可能更像是 copy trading 的升級版本,甚至是一種全新的交易玩法。用戶不再需要信任或調研其他 experienced trader,而是對徹底公開透明的模型以及其 performance 下注。本質上 AI 根據對 crypto 未來價格的預測更快更果斷地進行交易。然而沒有鏈上 AI 自帶的“trustless autonomy”,這樣的下注對象或者標準根本是不存在的。用戶/投資者可以透明地看到模型決策的原因、過程甚至未來上漲/下跌的精確概率;

AI 模型作為裁判:一種產品可能是全新形態的預言機,通過 AI 模型對數據來源的準確性進行預測。用戶不再需要信任 validator,也不必擔心節點作惡,預言機提供方甚至不需要設計複雜的節點網絡和獎懲機制來實現去中心化。相應地,鏈上 transparent + verifiable 的 AI 已經足夠滿足驗證鏈下 data source 置信度的任務。這種全新的產品形態在安全性、效率和成本上有機會形成碾壓,去中心化的對象也由人跳躍到“trustless autonomy”的 AI 工具,無疑是更安全的。

基於大模型的組織管理/運作體系:DAO 的治理本質上應該是高效、去中心化、公平的,而現在的現狀卻背道而馳,鬆散且臃腫,缺乏透明和公平性,鏈上 AI 的加入能提供非常契合的解決方案,將管理模式、效率提升到最高,將管理中系統性和人性的風險無限拉低。我們甚至可以去想象一種全新的 web3 項目的發展和運作模式,整個框架及未來發展方向和提案幾乎不依賴開發團隊或者 DAO 投票的方式來進行決策,相應的,基於大模型更龐大的數據獲取量和遠超人的計算能力去做決策。但這一切的前提也是模型上鏈,沒有 AI 的“trustless autonomy”就不存在去中心化世界從人到工具的躍遷。

……

小結一下

基於鏈上 AI 的新的產品形態基本可以總結為將去中心化和 trustless 的主體從人變為 AI 工具,這也符合傳統世界生產力的進化過程,最開始是在人這個主體上下功夫,不斷升級提升人效,到後面通過智能工具替代人,在安全性和效率上顛覆原有的產品設計。

其中最關鍵的、也是以上一切的前提,是通過區塊鏈實現 AI 的 transparent + verifiable。

3)Web3 的下一個階段

區塊鏈作為一個現象級的技術創新,不可能僅僅停留在原始階段。流量和經濟模型很重要,但用戶不會一直停留在追捧流量或花費大量資源做 X to earn,web3 也不會因此 onboard 下一波新用戶。但有一件事的確定性是很強的:web3 世界生產力和價值的革命一定來自 AI 的加入。

我覺得大致分成下面三個階段

起始:零知識證明算法和硬件的更新迭代為鏈上 AI 的湧現第一次提供了可能性;(我們在這)

發展:不管是 AI 對已有應用的提升還是基於 AI + blockchain 的全新產品,都在將整個行業向前推進;

終局:AI + blockchain 的最終走向是什麼?

上面的討論都是通過 AI 與區塊鏈的結合 bottom up 地發掘應用場景,換個思路 top down 地看待 AI + blockchain,AI 會不會重溯區塊鏈本身?AI + blockchain = 自適應的區塊鏈

一些公鏈會率先融合鏈上 AI,從公鏈的層面轉變為一種自適應的,自身發展方向不再依賴項目基金會決策而是基於龐大數據進行決策、自動化水平遠超傳統區塊鏈的形態,從而從當前多鏈繁榮的格局中脫穎而出。

在 verifiable + transparent 的 AI 加持下,blockchain 的自調節體現在哪裡,可以參考 modulus lab 提到的幾個例子:

鏈上的交易市場可以去中心化地自動調節,比如基於鏈上公開數據實時、不需要 trust assumption 地調整穩定幣的 interest rate;

多模態學習可以讓鏈上協議的交互通過生物特徵識別完成,提供安全的 KYC,並實現身份管理的完全去信任;

允許鏈上應用最大化地捕獲鏈上數據帶來的價值,支持定製化內容推薦等服務。

從另一個角度看,zkrollup 不斷迭代優化,但是始終缺乏一個真正只能在 zk 生態上跑的應用,ZKML 恰好符合這一點,並且想象空間也足夠大。ZK-rollup 未來很可能作為 AI 進入 web3 的入口從而創造更大價值,兩者互相成就。

二、實現方式和可行性

1)Web3 能為 AI 提供什麼?

基礎設施和 ZK 無疑是 web3 最瘋狂內卷的賽道,各種 ZK 項目在電路優化和算法升級上下足了功夫,不管是對多層網絡的探索,或者是對模塊化區塊鏈以及 data availability layer 的開發,還是進一步將 rollup 做成定製化的服務,甚至硬件加速……這些嘗試都在將區塊鏈的可擴展性、成本、算力推向下一個階段。

AI + blockchain 聽上去不錯,但具體怎麼個加法?

一種做法是通過 ZK proof system。比如針對 machine learning 做一個定製化的電路,鏈下電路生成 witness 的過程就是模型執行的過程,對模型預測的過程生成 proof(其中包括模型參數和 input),任何人都可以在鏈上驗證 proof。

AI 模型還是在高效的集群上執行,甚至搞點硬件加速進一步提升計算速度,在最大化利用算力的同時確保沒有中心化的人或者機構可以從中篡改或干涉模型,也就是確保:

模型預測結果的確定性 = 可驗證的(input + 模型架構 + 參數)

根據以上做法,可以進一步推斷哪些 infra 對 AI 上鏈至關重要:

ZKP system、rollup:Rollups 擴張了我們對區塊鏈計算能力的想象空間,把一堆 transactions 打包,甚至遞歸地生成 proof of proof 進一步降低成本。對於現在龐大的模型來說,提供可能性的第一步就是 proof system 和 rollup;

硬件加速:ZK rollup 提供了 verifiable 的基礎,但 proof 的生成速度直接關係到模型的可用性和用戶體驗,等待幾個小時去生成一個模型的 proof 顯然是不 work 的,因此,通過 FPGA 進行硬件加速顯然是一個很好的 boost。

密碼學:密碼學是區塊鏈的基礎,而鏈上模型以及敏感數據同樣需要保證隱私性。

補充:

大模型的基礎是 GPU,沒有高并行的支持,大模型的效率將會非常低,也就無法運行。因此,對於一個鏈上的 zk 生態:

GPU 友好 = AI 友好

拿 Starknet 舉例,Cario 只能在 CPU 上跑,因此只能部署一些小的決策樹模型,長期來看並不利好大模型的部署。

2)挑戰:更強大的 proof system

ZK Proof 的生成速度和內存使用情況至關重要,一個關係到用戶體驗和可行性,一個關係到成本和天花板。

現在的 zkp system 夠用嗎?

夠用,但不夠好…

Modulus lab 在文章“The Cost of Intelligence: Proving Machine Learning Inference with Zero-Knowledge”非常詳細的分析了模型和算力的具體情況。有空可以讀一讀這篇 ZKML 屆的”零號文獻 – paper0“:https://drive.google.com/file/d/1 tylpowpaqcOhKQtYolPlqvx6 R2 Gv4 IzE/view

以下是 paper0 中提到的不同證明系統

研報丨AI + Blockchain=?

基於以上 zk 算法,modulus lab 分別從時間消耗和內存佔用兩個維度出發進行測試,並且在這兩個維度中分別控制了參數和層數兩個核心變量。以下是 benchmark suites,這樣的設計也可以大致覆蓋從 LeNet5 的 60 k 參數量,0.5 MFLOPs,到 ResNet-34 的 22 M 參數量,3.77 GFLOPs。

研報丨AI + Blockchain=?

時間消耗的測試結果:

研報丨AI + Blockchain=?

內存佔用的測試結果:

研報丨AI + Blockchain=?

基於以上數據,整體看目前的 zk 算法以及具備支持對大模型生成 proof 的可能性,但相應的成本依舊很高,需要甚至 10 倍以上的優化。以 Gloth16 為例,雖然受益於高併發帶來的 computation time 的優化,但是作為 tradeoff 內存佔用顯著增加。Plonky2 和 zkCNN 在時間和空間上的表現同樣驗證了這一點。

那麼現在問題其實就從 zkp system 是否可以支持鏈上 AI 轉變為了支持 AI+Blockchain 付出代價值不值?並且隨着模型參數的指數級上升,對 proof system 的壓力也會迅速增加。確實,現在有 trustless 的神經網絡嗎,沒有!就是因為成本算不過來。

因此,打造一個為 AI 定製化的 proof system 至關重要。同時,實現對 AI 這種單次調用計算十分複雜的邏輯,gas 的消耗模型也需重新設計,一個高性能的 zkvm 至關重要,但現在我們已經能看到很多高性能的嘗試,比如 OlaVM, polygon Miden 等,這些基礎設施的不斷優化極大提升了 onchain-AI 的可行性。

三、應用是否值得期待?

儘管鏈上 AI 還在很早期階段,用上面的分層來看可能只處於起始到發展之間,但 AI 這個方向從不缺乏優秀的團隊和創新的想法。

就像上面說的,從 AI + Blockchain 發展階段看現在市場處於起始到發展的中間階段,產品嘗試方向還是以基於現有功能對用戶體驗優化為主。但最能體現價值的還是通過 AI 在鏈上將 trustless 的主體由人變為工具,在安全性和效率上顛覆原有的產品形態。

下面從一些現有的應用嘗試出發,分析一下 AI + Blockchain 長期的產品發展方向

1)The Rockefeller Bot:世界上第一個 on-chain AI

Rockefeller 是 modulus lab 團隊推出的第一個鏈上 AI 的產品,有很強的“紀念價值”。這個模型本質上是一個 trading bot,具體來說,rockefeller 的訓練數據是大量鏈上公開的 WEth-USDC 的 price/exchange rate,其本身是一個三層前饋經網絡模型,預測目標是未來 WEth 價格漲跌。

以下是當 trading bot 決策要進行交易時的流程:

Rockefeller 在 ZK-rollup 上對預測結果生成 ZKP;

ZKP 在 L1 上被驗證(資金由 L1 的合約保管),並執行操作;

可以看出 trading bot 的預測、資金操作完全是去中心化且 trustless 的,就像上面提到的,從更高維度看 rockefeller 更像是一種全新的 Defi 玩法。相比於信任其他 trader,這種模式下其實用戶賭的是 transparent + verifiable + autonomous 的模型。用戶可以不需要信任中心化的機構確保模型決策過程的合法性。同時,AI 也能最大程度上的消除人性的影響,更果斷地進行交易。

研報丨AI + Blockchain=?

你可能已經想給 Rockefeller 注點資金玩一玩了,但這真的能賺錢嗎?

並不能,按照 modulus 團隊的說法,與其說 rockefeller 是一個應用,他更像是 on-chain AI 的 POC,由於成本、效率、證明系統等多方面的限制,rockefeller 的主要目的是作為一個 demo 讓 web3 世界看到 on-chain AI 的可行性。(Rockefeller 已經完成任務下線 T T)

2)Leela:世界上第一個 on-chain AI game

最近發布的 Leela v.s. the world 同樣是出自 modulus lab。遊戲機制很簡單,人類玩家組成陣營對戰 AI。遊戲中玩家可以質押下注,最終誰會贏得對局,每次 match 結束后 loser’s pool 會根據質押代幣的數量相應地分配給 winner。

說到 on-chain AI,這次 modulus lab 部署了一個更大的 deep neural network (Parameter 數量 > 3,700,000)。雖然在模型規模和產品內容上 Leela 都超越了 rockefeller,但歸根結底這還是一次大型的 on-chain AI experiment。Leela 的背後的機制和運行模式才是需要關注的,這能幫我們更好地理解鏈上 AI 的運行模式和改善空間,以下是官方給出的邏輯圖:

研報丨AI + Blockchain=?

Leela 的每一次 move,也就是每次預測,都會生成 ZKP,並且只有在經過合約驗證之後才會在遊戲內生效。也就是說,受益於 trustless autonomous AI,用戶下注的資金和公平性完全受到密碼學的保護還不需要信任遊戲開發者。

Leela 採用的是 Halo2 算法,主要原因是它的工具和設計的靈活性可以幫助設計更高效的證明體系,具體 performance 情況可以參考上面的測試數據。但同時在 Leela 的運行中 modulus 團隊也發現了 Halo2 的弊端,比如生成證明的速度較慢,對 one-shot proving 不友好等。因此,也更加印證了之前基於測試數據得出的結論:如果需要將更大的模型帶入 web3,我們需要開發更強大的 proof system。

不過 Leela 的價值在於給我們帶來了 AI + Web3 game 更大的想象空間,王者榮耀玩家此刻應該無比希望王者匹配算法 fully on-chain:) Gamefi 需要更優質的內容支撐和更公平的遊戲體系,而 on-chain AI 恰好提供了這一點。打個比方,在遊戲中加入 AI-driven 的遊戲場景或者 NPC,不管是玩家的遊戲體驗還是經濟體系的玩法都提供了巨大的想象空間。

3)Worldcoin:AI + KYC

Worldcoin 是一個鏈上身份體系(Privacy-Preserving Proof-of-Personhood Protocol),通過生物識別建立身份體系並實現支付等衍生功能,解決的問題是對抗女巫攻擊,現在的註冊用戶超過了 1.4 m。

用戶通過一個叫 Orb 的硬件掃描虹膜,將個人信息添加到數據庫中,Worldcoin 通過 Orb 硬件中的計算環境運行 CNN 模型壓縮並證實用戶虹膜數據的有效性。聽上去很強,但如果需要做到身份驗證的真正去中心化,worldcoin 團隊正在探索通過 ZKP 驗證模型的輸出。

挑戰

值得一提的是,worldcoin 的 CNN 模型的 size:參數 = 1.8 million,層數 = 50。基於上面展示的測試數據,現有的 proof system 在時間上完全可以勝任,但內存消耗對於消費級的硬件來說是不可能完成的。

4)其他項目

Pragma:Pargma 是從 starkware 生態上發展起來的 ZK oracle。同時團隊也在探索如何通過鏈上 AI 解決去中心化鏈下數據驗證的問題。用戶不再需要信任 validator,而是通過足夠精準且可驗證的鏈上 AI 完成驗證鏈下 data source 的工作,比如對於實際資產或者身份的驗證可以直接讓 AI 去讀取相印的物理信息作為輸入並做出決策。

Lyra finance:Lyra finance 是一個 option AMM,提供衍生品交易市場。為了提高資本利用率,Lyra 團隊和 modulus lab 正在合作開發基於可驗證 AI 模型的 AMM。基於可驗證的、公平的 AI 模型,Lyra finance 有機會成為 AI + Blockchain 的一次大規模落地實驗,為 web3 用戶首次帶來公平的 matchmaking,通過 AI 對鏈上市場進行優化,提供更高的回報。

Giza:ZKML 平台,將模型直接部署在鏈上而不是進行鏈下驗證,Nice try,but…由於算力以及 Cairo 不支持 CUDA-based 的證明生成的問題,Giza 只能支持一些小模型的部署。這也是最致命的問題,從長期來看,能對 web3 產生顛覆性影響的一定是大模型,而這種規模的模型必須有強大的硬件支持,比如 GPU。

Zama-ai:模型的同態加密。同態加密是一種加密形式,簡單表示為:f [E (x)] = E [f (x)],其中 f 是運算操作,E 代表同態加密算法,x 是變量,比如:E (a) + E (b) = E (a + b)。允許對密文進行特定形式的代數運算得到仍然是加密的結果,將其解密所得到的結果與對明文進行同樣的運算結果一樣。模型的隱私性一直是 AI + Blockchain 方向的熱點和瓶頸,雖然 zk 對隱私友好,但 zk 不等於 privacy。zama 致力於確保模型執行的 privacy-preserving。

ML-as-a-service:這目前還只是一個思考方向,沒有具體的落地應用,但目的是通過 ZKP 解決中心化 ML 服務提供者作惡以及用戶信任的問題。Daniel Kang 在文章“Trustless Verification of Machine Learning”中有詳細的描述(參考文中的一張圖)

研報丨AI + Blockchain=?

四、關於 AI + Blockchain 的總結

整體來說,在 web3 世界里的 AI 處於非常早期的階段,但是毋庸置疑的是 onchain-AI 的成熟和普及一定會把 web3 的價值帶到另一個高度。從技術上看,區塊鏈能給 AI 提供獨特的基礎設施,AI 也是改變 web3 生產關係的重要工具,兩者的結合可以碰撞出很多可能性,這也是值得興奮和打開想象力的地方。

從 AI 上鏈的動力看,一方面,transparent + verifiable 的鏈上 AI 將去中心化和 trustless 的主體從人變為 AI 工具,極大提升了效率、安全性,並且為創造全新的產品形態提供了可能性;另一方面,區塊鏈的基礎設施不斷迭代,web3 真正需要一個能讓這些基礎設施發揮最大價值的殺手級應用,ZKML 恰好符合這一點,比如 ZK-rollup 未來很可能作為 AI 進入 web3 的入口。

從可行性上看,現在的基礎設施能一定程度上支持一定規模的模型,但還有很多不確定因素。通過 ZKP 做可驗證模型目前看是 AI 上鏈的必經之路,可能也是確定性最強的將 AI 帶入的 web3 應用的技術路徑。但是長遠來看現在的 proof system 需要再進行指數級的提升才能足夠支持日漸龐大的模型。

從應用場景看,AI 幾乎可以完美地參與到任何一個 web3 的方向,不管是 game、Defi、DID、tooling……雖然目前已有的項目非常匱乏而且缺乏長期價值,還沒有從一種提升效率的工具轉變為改變生產關係的應用。但值得興奮的是有人邁出了第一步,我們可以看到 AI + blockchain 的最早期的樣子和之後的可能性。

本文鏈接:https://www.8btc.com/article/6812066

轉載請註明文章出處

(0)
上一篇 2023-04-07 14:06
下一篇 2023-04-07 14:07

相关推荐