乾貨 | zkEVM：設計挑戰與解決思路

感謝 Vitalik Buterin、Barry Whitehat、Chih-Cheng Liang、Kobi Gurkan 和 Georgios Konstantopoulos 的審閱和真知灼見。

太長不看

我們相信 zk-Rollup 會成為 “香餑餑” —— 其成本優勢和極高的安全性使得一眾 Layer 2 可擴展性方案相形見絀。然而，現有的 zk-Rollup 實現都是針對特定應用的，因此我們很難在某個 zk-Rollup 內構建具有可組合性的通用 dApp，把現有的應用遷移過來也無從談起。我們引入了 zkEVM 用來為通用的 EVM 驗證生成零知識證明。這樣一來，我們就可以構建出完全兼容 EVM 的 zk-Rollup，以便現有以太坊應用輕鬆遷移到這個 zk-Rollup 上。

在本文中，我們明確指出了 zkEVM 在設計上面臨哪些挑戰以及為何 zkEVM 在當下有可能實現。我們還給出了更加具體、直觀的認知，並概述了如何從頭開始構建 zkEVM。

背景

zk-Rollup 是公認的最佳以太坊可擴展性方案。它不僅在安全性上媲美以太坊 Layer 1，而且在交易敲定速度上是 Layer 2 解決方案的翹楚（點擊此處，查看詳細的對比分析（原文、譯本））。

從中長期來看，隨着 ZK-SNARK 技術不斷發展，zk-rollup 將在所有應用場景中力拔頭籌。—— Vitalik Buterin

zk-Rollup 的基礎原理是將大量交易打包到一個 Rollup 區塊內，並在鏈下為該區塊生成一個簡潔證明。隨後，Layer 1 上的智能合約只需驗證該證明即可直接應用新的狀態，無需重新執行這些交易。這樣就可以節約一個數量級的 gas 費，因為證明的驗證成本遠低於重新執行的計算成本。另一個好處是可以通過數據壓縮來節省存儲空間（即，僅在鏈上存儲最少量的數據用於驗證）。

雖然 zk-Rollup 安全且高效，但是其應用依然局限於付款和互換（swap）。通用 dApp 構建起來很難，主要有以下兩個原因：

第一，如果你想在某個 zk-Rollup 內開發 dApp，你需要使用一種特殊的語言（即，R1CS）來編寫你的所有智能合約的邏輯。這種語言有着複雜的語法，而且要求使用者精通零知識證明。
第二，現有的 zk-Rollup 實現不支持可組合性1。因此，在 Layer 2 上，不同的 zk-Rollup 應用之間無法交互，嚴重破壞了 DeFi 應用的可組合性。

簡而言之，zk-Rollup 目前對開發者並不友好，而且功能有限。這是我們想要解決的最大問題。我們想要通過直接支持原生 EVM 驗證來提供最好的開發者體驗，並在 Layer 2 上支持可組合性，讓現有以太坊應用可以原封不動地遷移到 zk-Rollup 上。

在 zk-Rollup 中構建通用 dApp

我們可以通過以下兩種方法在 zk-Rollup 內構建通用 dApp：

一種是為不同 dApp 構建專用電路（“ASIC”）。
另一種是構建通用 “EVM” 電路用於執行智能合約。

“電路（circuit）” 指的是零知識證明中使用的程序表示。例如，如果你想要證明 hash(x) = y，你需要使用電路形式重新編寫哈希函數。電路形式只支持非常有限的表示（即，R1CS 只支持加法和乘法）。因此，使用 circuit 語言編寫程序難度很高 —— 你只能使用加法和乘法來構建所有程序邏輯（包括 if else、循環等等）。

第一種方法要求開發者為不同 dApp 設計專用 “ASIC” 電路。這是最傳統的使用零知識證明的方式。自定義的電路設計有助於降低各個 dApp 的成本。但是，這也帶來了可組合性問題，因為電路是 “靜態的”，而且對電路設計知識的高度依賴導致開發者體驗很糟糕2。

第二種方法不需要任何特殊的設計，也不要求開發者具備極強的專業知識。這種基於機器的證明背後的深層概念是，任何程序終將運行在 CPU 上。因此，我們只需要構建一個通用 CPU 電路來驗證低級 CPU 操作。然後，我們可以使用這個 CPU 電路來驗證任何程序執行。就本文的應用場景而言，程序指的就是智能合約，CPU 就是 EVM。然而，由於成本過高，這個方法在過去幾年裡沒有得到普遍採用。例如，即使你只想證明某一個操作中 add 的結果是正確的，你依然需要負擔整個 EVM 電路的成本。如果你的執行追蹤中有上千個操作，證明者就要負擔 1000 倍的 EVM 電路成本3。

最近，有很多研究致力於利用這兩種方法來優化零知識證明，包括（i）提議新的零知識證明友好型原語 Poseidon 哈希（Poseidon 哈希在電路中的效率是 SHA256 的 100 倍）；（ii）持續提高通用可驗證虛擬機的效率，就像 TinyRAM 那樣；（iii）越來越多的通用優化技巧，如 Plookup，以及運行速度更快的密碼學庫。

在我們之前的文章中，我們提議為每個 dApp 設計 “ASIC” 電路，並讓它們通過密碼學承諾進行通信。然而，根據社區的反饋，我們改變了研究重點，將聚焦於使用第二種方式構建通用 EVM 電路（所謂的 “zkEVM”）。zkEVM 將帶來與 Layer 1 完全相同的開發體驗。我們不會把設計複雜性留給開發者，而是利用自定義 EVM 電路設計取而代之，解決效率問題。

zkEVM 的設計挑戰

zkEVM 構建起來很難。儘管多年來這種直覺都很清晰，但是至今還沒有人成功構建出原生 EVM 電路。不同於 TinyRAM，zkEVM 在設計和實現上更具挑戰性，具體原因如下：

第一，EVM 對橢圓曲線的支持有限。目前，EVM 只支持 BN254 配對。由於不直接支持循環橢圓曲線，EVM 很難實現證明遞歸。在這種設置下，我們也很難使用其它專用協議。驗證算法必須是 EVM 友好型的。
第二，EVM 的 word 大小是 256 位。EVM 基於 256 位整數運行（就像大多數基於 32～64 位整數運行的普通虛擬機那樣），零知識證明則 “天然” 基於素域運行。在電路中進行 “錯配域算術” 需要範圍證明，進而給每個 EVM 操作增加大約 100 個約束。這會將 EVM 電路大小增加兩個數量級。
第三，EVM 有許多特殊的操作碼。不同於傳統虛擬機，EVM 有很多特殊的操作碼，如 CALL ，以及與執行環境和 gas 相關的錯誤類型。這會給電路設計帶來新的挑戰。
第四，EVM 是基於堆棧的虛擬機。SyncVM（zksync）和 Cario（starkware）架構在基於寄存器的模型中定義自己的 IR/AIR。它們構建了一個專門的編譯器來將智能合約代碼編譯成一個新的零知識證明友好型 IR。該方法是語言兼容的，而非原生 EVM 兼容的。無論是證明基於堆棧的模型，還是直接支持原生工具鏈，都會變得更加困難。
第五，以太坊存儲布局帶來了高昂的成本。以太坊存儲布局高度依賴 Keccak 和一個巨型 MPT4。二者都不是零知識證明友好型的，而且會產生高昂的證明成本。例如，Keccak 哈希的電路大小是 Poseidon 哈希的 1000 倍。但是，如果你將 Keccak 哈希替換成另一種哈希，就會給現有的以太坊基礎設施帶來一些兼容問題。
第六，基於機器的證明帶來了高昂的成本。即使你可以妥善處理上述所有問題，你依然需要找到一種有效的方法來將它們組合起來得到一個完整的 EVM 電路。正如我在上一節中提到的，即使像 add 這樣簡單的操作碼也有可能需要你負擔整個 EVM 電路的成本。

為何 zkEVM 在當下有可能實現

得益於研究者取得的重大進展，過去兩年裡越來越多效率問題得到了解決，zkEVM 的證明成本終於不再是障礙！最主要的技術進展體現在以下幾個方面：

多項式承諾（polynomial commitment）的使用。過去幾年來，大多數簡潔零知識證明協議都使用 R1CS，PCP 查詢被編碼到了特定於應用的受信任起步設置（trusted setup）中。這往往會增加電路的大小，導致很多自定義優化都無法實現，因為每個約束的度必須是 2（雙線性配對（bilinear pairing）只允許進行一次指數乘法計算）。有了多項式承諾方案，你可以通過通用設置（universal setup）乃至透明設置（transparent setup）將你的約束提高到任何階，大幅提高了後端選擇的靈活性。
查找表參數和自定義小工具的出現。另一個重要優化是查找表的使用。這個優化首次提議於 Arya，然後在 Plookup 中得到實現。對於零知識證明不友好型原語（即，AND 和 XOR 等位運算）來說，查找表可以省很多事。自定義小工具可以高效實現高階的約束。TurboPlonk 和 UltraPlonk 定義了優雅的程序語法，降低了使用查找表和定義自定義小工具的難度。這對於降低 EVM 電路的成本幫助很大。
遞歸證明的可行性越來越高。過去，遞歸證明會帶來很高的成本，因為它依賴特殊的配對友好型循環橢圓曲線（即，基於 MNT 曲線的結構）。這會產生很高的計算成本。然而，越來越多技術能夠在不犧牲效率的情況下使得遞歸證明成為可能。例如，Halo 無需配對友好型曲線，還可以使用特殊的內積參數來攤銷遞歸成本。Aztec 證明了可以直接聚合現有協議的證明（查找表可以減少非原生域運算的成本，從而縮小驗證電路的體積）。同樣的電路規模現在能夠實現更多的功能。
硬件加速正在提高證明效率。據我們了解，我們已經為證明程序打造了最快的 GPU 和 ASIC/FPGA 加速器。我們關於 ASIC 證明程序的論文已於今年被頂級計算機學術會議 ISCA 接受了。我們的 GPU 證明器比 Filecoin 的實現快了大約 5 至 10 倍，可大幅提高證明器的計算效率。

zkEVM 是如何運作和構建的？

除了強烈的直覺和技術改進，我們還得想明白我們需要證明的是什麼，並構思好一個更加具體的架構。更多的技術細節和對比分析會留到之後的文章中進行介紹。在本文中，我們會介紹整個工作流程和一些核心概念。

開發者和用戶的工作流程

開發者可以使用 EVM 兼容語言實現智能合約並在 Scroll 上部署編譯好的字節碼。之後，用戶可以發送交易來與已經部署好的智能合約進行交互。用戶和開發者將獲得與在 Layer 1 上相同的體驗。但是，gas 費會顯著降低，交易將在 Scroll 上即時得到預先確認（提現只需幾分鐘即可敲定）。

zkEVM 的工作流程

即使外部工作流程保持不變，Layer 1 和 Layer 2 的底層處理過程是完全不同的：

Layer 1 靠的是重新執行智能合約。
Layer 2 靠的是 zkEVM 電路的有效性證明

我們來詳細解釋下 Layer 1 和 Layer 2 上的交易有何不同。

在 Layer 1 上，已部署智能合約的字節碼都存儲在以太坊 storage（存儲項）內。交易將在點對點網絡中傳播。對於每一筆交易，每個全節點需要加載對應的字節碼並在 EVM 上執行以獲得相同的狀態（交易將作為輸入數據）。

在 Layer 2 上，字節碼同樣存儲在存儲項內，用戶的操作方式也相同。交易將在鏈下發送至一個中心化的 zkEVM 節點。然後，zkEVM 不單執行字節碼，還將生成一個簡潔證明來表明交易達成后狀態已正確更新。最後，Layer 1 合約將驗證該證明並更新狀態，不再重新執行交易。

我們來深入了解一下執行過程，看看 zkEVM 最終需要證明的是什麼。在原生執行中，EVM 將加載字節碼並從頭開始逐個執行字節碼中的操作碼。每個操作碼都可以被看作是在執行以下三個步驟：(i) 從堆棧（stack）、memory 或存儲項中讀取元素；(ii) 基於這些元素執行計算；(iii) 將結果寫入堆棧、memory 或存儲項5。例如，add 操作碼需要從堆棧中讀取兩個元素，將它們相加並將結果寫入堆棧。

因此，顯而易見的是，zkEVM 的證明需要包含以下幾個方面（與執行流程對應）：

字節碼從永久存儲項中正確加載（你正在運行從某個地址加載的正確操作碼）
字節碼中的操作碼始終逐一執行（字節碼按順序執行，不會遺漏或跳過任何操作碼）
每個操作碼均正確執行（每個操作碼中的三個子操作都正確執行，R/W + 計算）

zkEVM 設計亮點

在為 zkEVM 設計架構時，我們需要分別採取措施滿足上述三個方面的需求。

1. 我們需要為某個密碼學累加器設計一個電路。

這是為了起到 “可驗證存儲器” 的作用，我們需要通過某種技術來證明讀取過程是準確無誤的。密碼學累加器可以更高效地實現這一點 6。我們以默克爾樹為例。已部署的字節碼會被存儲為默克爾樹上的葉節點。然後，驗證者可以使用簡潔證明來驗證該字節碼是否正確加載自某個地址（即，驗證電路中的默克爾路徑）。針對以太坊存儲，我們需要這個電路同時兼容默克爾-帕特里夏樹和 Keccak 哈希函數。

2. 我們需要設計一個電路將字節碼與實際的執行追蹤關聯起來。

將字節碼轉移到靜態電路中會帶來一個問題：像 jump 這樣的條件式操作碼（與智能合約中的 loop、if else 語句相對應）可能會跳轉到任何地方。在某個人使用特定輸入運行該字節碼之前，跳轉目的地都是不確定的。這就是為什麼我們需要驗證實際的執行蹤跡。執行蹤跡可以被認為是 “展開的字節碼”，包含按實際執行順序排列的操作碼（即，如果你跳轉到另一個位置，蹤跡中將包含該目標操作碼和位置）。

證明者將直接提供執行蹤跡作為電路的見證數據。我們需要證明該執行追蹤確實是特定的字節碼使用特定的輸入 “展開” 的。我們的想法是強制讓程序計數器的值保持一致。針對目的地不確定的問題，解決思路是讓證明者提供一切數據。然後，你可以使用查找參數高效地檢查一致性（即，證明帶有準確全局計數器的操作碼包含在 “總線” 中）。

3. 我們需要為每個操作碼設計電路（證明每個操作碼中的讀、寫和計算都是正確的）。

這是最重要的部分 —— 證明執行追蹤中的每個操作碼都是正確且一致的。如果你直接將所有東西都放在一起，會產生高昂的成本。此處重要的優化思路是：

我們可以將 R/W 和計算分成兩個證明。一個證明會將所有操作碼用到的元素都放到 “總線” 中。另一個證明會證明對 “總線” 上元素的計算是正確執行的。這會大幅降低每個部分的成本（即，你在生成計算證明時無需考慮整個 EVM 存儲）。在更詳細的規範中，前者被稱為 “狀態證明”，後者被稱為 “EVM 證明”。另一個發現是，查找聲明可以有效處理 “總線映射” 。
我們可以為每個操作碼設計度數更高的定製化約束（即，我們可以將一個 EVM word 切分成多個數據塊，以便更高效地處理）。我們可以選擇是否根據需求通過一個選擇符多項式來 “打開” 一個約束。這樣可以避免每個操作都要消耗整個 EVM 電路的成本。

這個架構最初由以太坊基金會提出，依然處於早期階段，正在積極開發中。我們正在與以太坊基金會進行密切合作，旨在找到最佳方式實現該 EVM 電路。迄今為止，我們已經定義了 EVM 電路最重要的特點，並（使用 Halo2 庫中的 UltraPlonk 語法）實現了一些操作碼（點擊此處查看）。更詳細的內容將在後續文章中介紹。我們推薦感興趣的讀者閱讀這篇文檔。開發流程將是透明化的。這將是集整個社區之力的完全開源的設計。希望會有更多人加入進來，貢獻出一份力量。

zkEVM 還能給我們帶來什麼？

zkEVM 遠不僅僅是 Layer 2 擴容。我們可以將它理解為通過 Layer 1 有效性證明擴展以太坊 Layer 1 的直接方式。這意味着不需要任何特殊的 Layer 2 就可以擴展現有的 Layer 1。

例如，你可以將 zkEVM 當作全節點來使用。該證明可以用來直接證明現有狀態之間的轉換。無需將任何東西遷移到 Layer 2 上，你可以直接證明所有 Layer 1 交易！更寬泛地來說，你可以使用 zkEVM 為整個以太坊生成簡潔證明，就像 Mina 那樣。唯一需要增加的東西是證明遞歸（即，將區塊的驗證電路嵌入 zkEVM）7。

結論

zkEVM 可以為開發者和用戶提供相同的體驗，而且可以在不犧牲安全性的前提下將成本降低幾個數量級。目前已經有人提議了一種架構，可以通過模塊化方式構建 zkEVM。這個架構利用零知識證明的最新突破降低成本（包括自定義約束、查找參數、證明遞歸和硬件加速）。我們期待看到更多人為 zkEVM 社區貢獻力量，與我們一起進行頭腦風暴！

註：

Starkware 於 2021 年 9 月 1 日的公告中聲明已實現可組合性（點擊此處，查看公告）。
電路是固定且靜態的。例如，在將一個程序實現為電路時，你無法使用可變上限循環。上限必須固定為最大值。電路無法處理動態邏輯。
為便於讀者理解，我們在這裡詳細說明 EVM 電路的成本。正如前文所言，電路是固定且靜態的。因此，EVM 電路需要包含所有可能的邏輯（這個體量是僅包含 add 的電路的 10000 倍）。這就意味着，即使你只想證明 add，你依然需要負擔該 EVM 電路中可能包含的所有邏輯的成本。也就是說，成本被放大了 10000 倍。在執行追蹤中，你需要證明一連串操作碼，而且每個操作碼都會帶來高昂的成本。
EVM 本身並沒有與默克爾-帕特里夏樹（MPT）緊密綁定。目前，MPT 僅用於存儲以太坊狀態。要換一個很容易（有人提議使用 Verkle 樹替換掉 MPT）。
這是經過高度簡化的抽象概念。從技術上來說，“EVM 狀態” 的名單更長，包括程序計數器、gas 余量、調用棧（以上所有加上堆棧中每次調用的地址和靜態）、一組日誌和交易範圍變量（熱存儲槽、退款、自毀）。我們可以另外引入針對不同調用環境的標識符來直接支持可組合性。
由於存儲量很大，我們使用累加器進行存儲。內存和堆棧可以使用可編輯的 Plookup（我們可以通過這種方式有效地實現 “RAM”）。
將一個完整的遞歸證明添加進 zkEVM 電路並非易事。實現遞歸的最好方式還是使用循環橢圓曲線（即，Pasta 曲線）。我們需要引入某種 “包裝（wrapping）” 過程讓遞歸在以太坊 Layer 1 上可驗證。

（完）

（文內有許多超鏈接，可點擊左下 ”閱讀原文“ 從 EthFans 網站上獲取）

原文鏈接:

https://hackmd.io/@yezhang/S1_KMMbGt

作者: Ye Zhang@Scroll

本文鏈接：https://www.8btc.com/article/6697936

轉載請註明文章出處