1. 引言

前序博客：

Goldwasser, Kalai和Rothblum (GKR) 2008年论文《Delegating Computation: Interactive Proofs for Muggles》中描述了一种强大的通用interactive proof protocol——GKR协议，该协议定位为circuit evaluation 上下文：

已知某layered arithmetic circuit $C$ ，其depth为 $d$ ，size为 $S (n)$ ，fan-in为 $2$ 。其中 $n$ 为input length， $\tilde{O}$ 中隐藏了 $n$ 中的polylogarithmic因子。
GKR协议允许Prover在保证正确的情况下以time $\text{poly}(S(n))$ 来evaluate $C$ 。
Verifier run time为 $\tilde{O}(n+d\log S(n))$ 。

因此，对于具有polynomial size和sublinear depth的电路，其Verifier的runtime为quasilinear in the input length——相比于整个电路size要小很多，因此，相比于Verifier直接在本地执行计算所需用时要节约大量时间。

而Cormode, Mitzenmacher, and Thaler（CMT）2012年论文《Practical Verified Computation with Streaming Interactive Proofs》中，将GKR协议中Prover的runtime，由 $\text{poly}(S(n))$ 降为 $O(S(n)\log S(n))$ ，同时在https://github.com/pepper-project/pepper/tree/master/pepper/cmtgkr（C语言）中做了完整实现并benchmark。

而Thaler 2013年论文《Time-optimal interactive proofs for circuit evaluation》中，对（如任意并行数据计算中的）具有重复结构的电路，将GKR协议中Prover的runtime，由 $O(S(n)\log S(n))$ 进一步降低。

本文：

展示了对CMT协议的改进
提供了一种理论简化方法，可降低Prover runtime、round复杂度，并与CMT相比将GKR协议中总的communication开销降低约33%。

2. 背景知识

2.1 Interactive Proof

为函数 $f$ 定义一个valid interactive proof协议：
在这里插入图片描述

2.2 sum-check 协议

GKR协议中使用的主要技术原语为Lund、Fortnow、Karloff、Nisan 1992年Algebraic methods for interactive proof systems论文中提出的sum-check protocol。
详细可参看Computational Complexity: A Modern Approach中第8章。

假设已知某基于有限域 $\mathbb{F}$ 的具有 $v$ 个变量的多变量多项式 $g$ ，sum-check协议的目的是计算：
$H:=\sum_{b_1\in\{0,1\}}\sum_{b_2\in\{0,1\}}\cdots \sum_{b_v\in\{0,1\}}g(b_1,\cdots,b_v)$

为执行该协议，Verifier需能对随机选择的 $(r_1,\cdots,r_v)\in\mathbb{F}^v$ 进行evaluate $g(r_1,\cdots,r_v)$ 。

sum-check协议执行 $v$ 轮：

第一轮：Prover $P$ 发送多项式 $g_1(X_1)$ ，并声称 $g_1(X_1)=\sum_{x_2,\cdots,x_v\in\{0,1\}^{v-1}}g(X_1,x_2,\cdots,x_v)$ 。由此可知：
- 若 $g_1$ 正确，则有 $H=g_1(0)+g_1(1)$
- 多项式 $g_1(X_1)$ 的degree为 $deg_1(g)$ ——即 $X_1$ 变量在 $g$ 多项式中的degree。因此，可通过 $deg_1(g)+1$ 个field elements来唯一确定 $g_1$ 。
  - 实际实现时，Prover $P$ 可发送 $g$ 在set $\{0,1,\cdots,\deg_1(g)\}$ 的evaluations来唯一确定 $g$ 。
在第 $j > 1$ 轮：
- Verifier $V$ 选择随机值 $r_{j-1}\in\mathbb{F}$ ，并发送给Prover $P$ 。
- Prover $P$ 发送多项式 $g_j(X_j)$ ，并声称：
  $g_j(X_j)=\sum_{x_{j+1},\cdots,x_v\in\{0,1\}^{v-1}}g(r_1,r_2,\cdots,r_{j-1},X_j,x_{j+1},\cdots,x_v) \ \ \ \ (1)$
- Verifier $V$ ：
  - 选择最新的2个多项式，检查 $g_{j-1}(r_{j-1})=g_j(0)+g_j(1)$ 是否成立，若不成立则拒绝。
  - 若多项式 $g_j$ 的degree太高，也会拒绝：每个多项式 $g_j$ 的degree应为 $deg_j(g)$ ——对应为多项式 $g$ 中 $X_j$ 变量的degree。
在最后一轮：
- Prover $P$ 发送 $g_v(X_v)$ ，并声称 $g_v(X_v)=g(r_1,r_2,\cdots,r_{v-1},X_v)$ 。
- Verifier $V$ ：
  - 直接检查 $g_v(r_v)=g(r_1,r_2,\cdots,r_{v-1},r_v)$ 是否成立（之前已假设Verifier $V$ 可evaluate $g$ at $(r_1,\cdots,r_v)$ ）。
  - 若本轮检查、以及之前所有轮检查均成功的话，则Verifier $V$ accept，从而信服 $H=g_1(0)+g_1(1)$ 。

从而有proposition：
在这里插入图片描述

2.3 Multilinear extension

对于任意域 $\mathbb{F}$ ，若 $d$ -variate多项式 $p:\mathbb{F}^d\rightarrow \mathbb{F}$ 的 $d$ 个输入变量的degree最多为1，则称 $p$ 是multilinear的。

已知函数 $W:\{0,1\}^d\rightarrow \{0,1\}$ 的domain为 $d$ -dimensional Boolean hypercube，将基于域 $\mathbb{F}$ 的 $W$ 的multilinear extension表示为 $\tilde{W}$ ，对于在所有Boolean-valued input上的值均与 $W$ 一致，则 $\tilde{W}$ 为 $W$ 的唯一multilinear多项式 $\mathbb{F}^d\rightarrow \mathbb{F}$ 。即对于所有的 $x\in\{0,1\}^d$ ，有 $\tilde{W}(x)=W(x)$ 。

2.4 GKR协议总览

GKR协议中，Prover $P$ 和 Verifier $V$ 需对所关心的、代表特定函数的、基于有限域 $\mathbb{F}$ 的、fan-in 2算术电路 $C$ 达成一致—— $C$ 可能具有多个输出。

假设电路 $C$ 为分层模式，即可将电路分解为多层，将连接相邻层的gate。
假设电路 $C$ 的depth为 $d$ ，则层1~层 $d$ 对应为输入层，且层1对应为输出层。

GKR协议中：

Prover $P$ 发送的第一个消息为：声称的电路 $C$ 的输出。
GKR协议逐层迭代，每个输入层对应一次迭代。
- 第 $i$ 次迭代的目的是将层 $i$ 中的gates values claim reduce为层 $i + 1$ 中的gates values，从而Verifier $V$ 可安全地假设：若第1个claim为true，则第2个claim也为true。——具体通过对特定多项式运用标准的sum-check协议即可实现。（见下一章的Equation (2)）
事实上，GKR协议以 “电路output gates values claim” 为起点，但Verifier $V$ 无法在不evaluate该电路的情况下check该claim——Verifier $V$ 想要避免该工作。
因此，第一个迭代：运用sum-check protocol来将 “电路output gates values claim” reduce 为 “层2的gates values claim”（准确来说，是“对层2的gates values的multilinear extension evaluation的claim”）。
以此类推，每次迭代Verifier $V$ 都不想自己check claim，因此需再用另一个sum-check protocol来将 “层2的gates values claim”（准确来说，是“对层2的gates values的multilinear extension evaluation的claim”） reduce为 “层3的gates values claim”（准确来说，是“对层3的gates values的multilinear extension evaluation的claim”）等等。
最终，Verifier $V$ 剩下的为“电路的inputs claim”，从而Verifier $V$ 可自己检查该claim。

2.5 附加说明

已知某layered arithmetic circuit $C$ ，其depth为 $d$ ，size为 $S (n)$ ，fan-in为 $2$ 。

令 $S_i$ 表示电路circuit $C$ 在层 $i$ 的gates数量。层 $i$ 中gates的编号为 $0,\cdots,S_i-1$ 。
假设 $S_i$ 为a power of 2，并令 $S_i=2^{s_i}$
为解释GKR协议中每个迭代是如何处理的，需额外引入多个函数，每个函数编码了该电路的特定信息。
- a）层 $i$ 中gates的编号为 $0,\cdots,S_i-1$ 。令函数 $W_i:\{0,1\}^{s_i}\rightarrow \mathbb{F}$ 以binary gate label为输入，输出为层 $i$ 中相应gate的value。GKR协议中使用了函数 $W_i$ 的multilinear extension $\tilde{W}_i$ 。
- b）GKR协议中还使用了“wiring predicate”概念来编码 “层 $i + 1$ 中与层 $i$ 中特定gate之间连接关系的wires pairs”。
  为此，定义了2个函数 $add_i,mult_i:\{0,1\}^{s_i+2s_{i+1}}\rightarrow \{0,1\}$ ，来共同构成层 $i$ 的wiring predicate。
  这2个函数已3个gate labels $j_1,j_2,j_3)$ 为输入，若“层 $i$ 中的gate $j_1$ ” 为 “层 $i + 1$ 中gate $j_2,j_3$ ” 的addition（或multiplication），则返回1，否则返回0。
  令 $\tilde{add}_i,\tilde{mult}_i$ 分别为 $add_i,mult_i$ 的multilinear extension。
- c）令 $\beta_{s_i}(z,p)$ 表示为函数：
  $\beta_{s_i}(z,p)=\prod_{j=1}^{s_i}((1-z_j)(1-p_j),z_jp_j)$
  很容易看出， $\beta_{s_i}(z,p)$ 为函数 $B(x,y):\{0,1\}^{s_i}\times \{0,1\}^{s_i}\rightarrow \{0,1\}$ 的multilinear extension，当 $x = y$ 时，有 $B (x, y) = 1$ ，否则为0。

3. CMT的GKR协议细节

CMT论文中实现的GKR协议中利用了如下identity，即对于所有的 $z\in\mathbb{F}^{s_i}$ ，有：
$\tilde{W}_i(z)=\sum_{(p,w_1,w_2)\in\{0,1\}^{s_i+2s_{i+1}}}f^{(i)}(p,w_1,w_2) \ \ \ \ (2)$
其中：
$f^{(i)}(p,w_1,w_2) =\beta_{s_i}(z,p)\cdot (\tilde{add}_i(p,w_1,w_2)(\tilde{W}_{i+1}(w_1)+\tilde{W}_{i+1}(w_2))+\tilde{mult}_i(p,w_1,w_2)(\tilde{W}_{i+1}(w_1)\cdot\tilde{W}_{i+1}(w_2)))$

CMT的第 $i$ 次迭代对多项式 $f^{(i)}$ 运用sum-check protocol。由于多项式 $f^{(i)}$ 有 $s_i+2s_{i+1}$ 个变量，相应的sum-check协议需要 $s_i+2s_{i+1}$ 轮。

CMT论文中展示了：

在每轮，Prover time为 $O (S)$ ——假设 $\mathbb{F}$ 的每个加法和乘法运算为 $O (1)$ time。

4. 本文对CMT的改进

本文对CMT的改进：

对一个不同的、更简单的多项式运用sum-check协议。
将round数由 $s_i+2s_{i+1}$ 降为 $2s_{i+1}$ ，从而将总的communication开销和Prover runtime降低了一个常量因子。
此外，彻底移除了 $\beta_{s_i}(z,p)$ 多项式。

关键的改进之处为：

派生了一个比上面Equation (2)更简单的 $\tilde{W}_i(z)$ ——关键在于仅利用了multilinear extension $\tilde{W}_i$ of $W_i$ 、 $\tilde{add}_i$ of $add_i$ 、 $\tilde{mult}_i$ of $mult_i$ 。【关键点在于：若2个multilinear多项式agree at all Boolean inputs，则相应的2个formal多项式也必须相等。】

因此，改进之后，第 $i$ 次迭代不对多项式 $f^{(i)}$ 运用sum-check protocol，而是，对多项式 $g^{(i)}$ 运用sum-check protocol就足以：
由于 $g^{(i)}$ 具有 $2s_{i+1}$ 个变量，因此需要 $2s_{i+1}$ 轮。
每一轮prover的计算量，等同于，CMT中对 $f^{(i)}$ 运用sum-check协议的最后 $2s_{i+1}$ 轮的Prover计算量。

参考资料

[1] Justin Thaler论文 A Note on the GKR Protocol

GKR协议小记