我偶然在一把小刀上发现了异国的一粒微尘 —— 世界顿时又变得奇异万状,缭绕着五彩缤纷的氤氲。

\newcommand{\bZ}{\mathbb{Z}}

# Pretty Good Measurements

参考:Theory of Quantum Information

考虑这样一个 discriminate quantum states from an ensemble 的问题:

给定一个 ensemble η:ΣD(H)\eta:\Sigma\to \mathcal{D}(\mathcal{H}),其中Σ\Sigma 是一个有限集合,η\eta 满足:

aΣTr(η(a))=1.\sum_{a\in\Sigma}Tr(\eta(a))=1.

理解为:整个系统以一个Tr(η(a))Tr(\eta(a)) 的先验概率处于状态η(a)\eta(a)
现在我们希望设计一个 POVM 测量μ:ΣPos(H)\mu:\Sigma\to Pos(\mathcal{H}) 使得

aΣμ(a),η(a)\sum_{a\in\Sigma}\langle \mu(a),\eta(a)\rangle

尽量大。
理解为:我们希望设计一个测量,使得测量结果得到系统所处状态的概率尽量大。

换句话说,我们希望通过设计一个最 general 的测量,来大概率分辨一个以已知的先验概率处于已知的状态集合的系统,究竟处于哪个状态。

很显然,如果我们把 ensemble 嵌到一个更大的经典 - 量子混合状态:

A=aΣaaη(a)D(HH),A=\sum_{a\in\Sigma}|a\rangle\langle a|\otimes \eta(a)\in \mathcal{D}(\mathcal{H}'\otimes\mathcal{H}),

其中H\mathcal{H}' 就是经典部分的系统

那么原问题可以转化为一个规划问题:

maximizeA,Xsubject toTrH(X)=I,XPos(HH).\begin{aligned} & \text{maximize} && \langle A,X\rangle\\ & \text{subject to}&& Tr_{\mathcal{H}'}(X)=I,\\ & && X\in Pos(\mathcal{H}'\otimes\mathcal{H}).\\ \end{aligned}

注意,这里把一个测量嵌到了一个经典 - 量子混合状态。

X=aΣaaμ(a)X=\sum_{a\in\Sigma}|a\rangle\langle a|\otimes \mu(a)

在这个规划问题中,我们并没有强行要求XX 是上面的形式。实际上,对于所有满足TrH(X)=ITr_{\mathcal{H}'}(X)=IXX,都可以找到一组对应的测量:

Ea=(aI)X(aI).E_a=(\langle a|\otimes I) X (|a\rangle\otimes I).

我们把这个问题和它的对偶问题放在一起看

Primal ProblemmaximizeA,Xsubject toTrH(X)=I,XPos(HH).Dual ProblemminimizeTr(Y)subject toIYA,XHerm(H).\begin{aligned} & && \text{Primal Problem}\\ & \text{maximize} && \langle A,X\rangle\\ & \text{subject to}&& Tr_{\mathcal{H}'}(X)=I,\\ & && X\in Pos(\mathcal{H}'\otimes\mathcal{H}).\\ \end{aligned} \qquad \qquad \begin{aligned} & && \text{Dual Problem} \\ & \text{minimize} && Tr(Y)\\ & \text{subject to}&& I\otimes Y\geq A,\\ & && X\in Herm(\mathcal{H}).\\ \end{aligned}

那么 strong duality 实际上存在:

X=1ΣII,Y=γIX=\frac{1}{|\Sigma|}I\otimes I,\qquad Y=\gamma I

根据 strong duality 和 slater’s theorem 我们知道这两个问题可以取到最优解且最优解是相等的。

但是往往我们很难把最优解的XX 写成一个关于AA 的 analytic description。
所以 Pretty Good Measurement 就是在一个能够显式构造出 measurement 的情况下,给出一个近似的最优解。

我们定义 PGM 测量:

μ(a)=ρ1/2η(a)ρ1/2,其中 ρ=aΣη(a).\mu(a)=\rho^{-1/2}\eta(a)\rho^{-1/2},\qquad\text{其中 } \rho=\sum_{a\in\Sigma}\eta(a).

如果ρ\rho 不可逆,那我们需要采用 Moore–Penrose pseudo-inverse:

μ(a)=ρ+η(a)ρ++1ΣΠkerρ,\mu(a)=\sqrt{\rho^+}\eta(a)\sqrt{\rho^+}+\frac{1}{|\Sigma|}\Pi_{\ker\rho},

其中Πkerρ\Pi_{\ker\rho}ρ\rho 缺少的 eigenspace 部分的投影算子。
我们可以证明

Theorem (Barnum–Knill) 对于如上定义的 PGM,

aΣμ(a),η(a)opt(η)2,\sum_{a\in\Sigma}\langle \mu(a),\eta(a)\rangle \geq opt(\eta)^2,

其中opt(η)opt(\eta) 就是之前规划问题的最优值。

Proof: 因为supp(η(a))supp(ρ),im(η(a))im(ρ)supp(\eta(a))\subseteq supp(\rho),im(\eta(a))\subseteq im(\rho),我们知道 pseudo-inverse 在它的像空间中就起到了 inverse 的作用(即ρρ+=Πim(ρ),ρ+ρ=Πsupp(ρ)\rho\rho^+=\Pi_{im(\rho)},\rho^+\rho=\Pi_{supp(\rho)}),所以对于一个测量ν\nu,我们有

ρ1/4ν(a)ρ1/4,(ρ+)1/4η(a)(ρ+)1/4=Tr(ν(a)Πim(ρ)η(a)Πsupp(ρ))=Tr(ν(a)η(a))=ν(a),η(a).\begin{aligned} \langle\rho^{1/4}\nu(a)\rho^{1/4},(\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4}\rangle &= Tr(\nu(a)\Pi_{im(\rho)}\eta(a)\Pi_{supp(\rho)})\\ &=Tr(\nu(a)\eta(a))\\ &=\langle \nu(a),\eta(a)\rangle.\\ \end{aligned}

根据 Cauchy–Schwarz 不等式,

ν(a),η(a)ρ1/4ν(a)ρ1/42(ρ+)1/4η(a)(ρ+)1/42.\langle \nu(a),\eta(a)\rangle\leq \left \|\rho^{1/4}\nu(a)\rho^{1/4} \right \|_2\left \|(\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4} \right \|_2.

再用一次 Cauchy–Schwarz 不等式,

aΣν(a),η(a)aΣρ1/4ν(a)ρ1/422aΣ(ρ+)1/4η(a)(ρ+)1/422.\sum_{a\in\Sigma}\langle \nu(a),\eta(a)\rangle\leq \sqrt{\sum_{a\in\Sigma}\left \|\rho^{1/4}\nu(a)\rho^{1/4} \right \|_2^2}\sqrt{\sum_{a\in\Sigma}\left \|(\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4} \right \|_2^2}.

其中左侧根号的值不会超过 1,因为

ρ1/4ν(a)ρ1/422=ρ1/4ν(a)ρ1/4,ρ1/4ν(a)ρ1/4=ν(a),ρν(a)ρTr(ρν(a)ρ)=Tr(ν(a)ρ).\left \|\rho^{1/4}\nu(a)\rho^{1/4} \right \|_2^2=\langle \rho^{1/4}\nu(a)\rho^{1/4},\rho^{1/4}\nu(a)\rho^{1/4}\rangle=\langle \nu(a),\sqrt{\rho}\nu(a)\sqrt{\rho}\rangle\leq Tr(\sqrt{\rho}\nu(a)\sqrt{\rho})=Tr(\nu(a)\rho).

所以 sum over 所有aΣa\in\Sigma 后,就不会大于aΣTr(ν(a)ρ)=Tr(ρ)=1\sum_{a\in\Sigma}Tr(\nu(a)\rho)=Tr(\rho)=1

同样地,对于右侧根号,我们知道

(ρ+)1/4η(a)(ρ+)1/422=ρ+η(a)ρ+,η(a)μ(a),η(a).\left \| (\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4}\right \|_2^2=\langle \sqrt{\rho^+}\eta(a)\sqrt{\rho^+},\eta(a)\rangle\leq \langle \mu(a),\eta(a)\rangle.

所以

aΣ(ρ+)1/4η(a)(ρ+)1/422aΣμ(a),η(a).\sum_{a\in\Sigma}\left \| (\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4}\right \|_2^2\leq \sum_{a\in\Sigma}\langle \mu(a),\eta(a)\rangle.

因此,我们得到了

(aΣν(a),η(a))2aΣμ(a),η(a).\left (\sum_{a\in\Sigma}\langle \nu(a),\eta(a)\rangle\right )^2\leq \sum_{a\in\Sigma}\langle \mu(a),\eta(a)\rangle.

这对所有的测量ν\nu 都成立,所以 PGM μ\mu 至少是一个平方近似比。
\square

我们补充一个判断一个测量是否是 optimal 的办法:

Theorem (Holevo–Yuen–Kennedy–Lax) 一个测量μ\mu 是规划问题 optimal 的解当且仅的

Y=aΣη(a)μ(a)Y=\sum_{a\in\Sigma}\eta(a)\mu(a)

是 Hermitian 的并且Yη(b)Y\geq \eta(b) 对于所有的bΣb\in\Sigma

此外,我们知道,如果η\eta 每个状态之间比较 “不相似”,那么 PGM 的成功概率会更高。

Theorem

Pr(PGM errors on η)12abTr(η(a)η(b))F(η(a)/Tr(η(a)),η(b)/Tr(η(b))),\Pr(\text{PGM errors on }\eta)\leq \frac{1}{2}\sum_{a\neq b}\sqrt{Tr(\eta(a)\eta(b))}F(\eta(a)/Tr(\eta(a)),\eta(b)/Tr(\eta(b))),

其中F(ρ,σ)=ρσ1F(\rho,\sigma)=\|\sqrt{\rho}\sqrt{\sigma}\|_1 是 fidelity function。

换句话说,如果两两状态之间的 fidelity 比较小(不相似),那么 PGM 的成功概率会更高。

# PGM for Dihedral Hidden Subgroup Problem

参考:OPTIMAL MEASUREMENTS FOR THE DIHEDRAL HIDDEN SUBGROUP PROBLEM

在之前的一篇 Blog Kuperberg’s algorithm for the dihedral Hidden Subgroup Problem 中,我们讨论过 Dihedral group 其实是ZNZ2\mathbb{Z}_N\rtimes\mathbb{Z}_2,以及不失一般性地我们可以假设隐含子群为H={(0,0),(d,1)}H=\{(0,0),(d,1)\},其中dZNd\in \mathbb{Z}_N
然后通过 Fourier 变化,我们可以以相同的概率得到某个xZNx\in \mathbb{Z}_N 和状态

ψx,d=12x(0+ωNxd1).|\psi_{x,d}\rangle=\frac{1}{\sqrt{2}}|x\rangle(|0\rangle+\omega^{xd}_N|1\rangle).

或者说,我们得到了 hidden subgroup states

ρd=1NxZNψx,dψx,d=12NxZNa,bZ2ωNxd(ab)x,ax,b.\rho_d=\frac{1}{N}\sum_{x\in\mathbb{Z}_N}|\psi_{x,d}\rangle\langle \psi_{x,d}|=\frac{1}{2N}\sum_{x\in\mathbb{Z}_N}\sum_{a,b\in\mathbb{Z}_2}\omega_N^{xd(a-b)}|x,a\rangle\langle x,b|.

我们复制kk copies,就得到

ρdk=1(2N)kxZNka,bZ2kωN((ab)x)dx,ax,b,\rho_d^{\otimes k}=\frac{1}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{a,b\in \mathbb{Z}_2^k}\omega_N^{((a-b)\cdot x)d}|x,a\rangle\langle x,b|,

其中(ab)x(a-b)\cdot x 是按位点乘。

进一步地,令

Srx={bZ2k:bx=rmodN},ηrx=Srx,S_r^x=\{b\in\mathbb{Z}_2^k:b\cdot x=r\mod N\},\qquad \eta^x_r=|S_r^x|,

和状态

Srx=1ηrxbSrxb.|S_r^x\rangle=\frac{1}{\sqrt{\eta_r^x}}\sum_{b\in S_r^x}|b\rangle.

那么kk-copies of hidden subgroup states 可以写成

ρdk=1(2N)kxZNkp,qZNωd(pq)ηpxηqxx,Spxx,Sqx.\rho_d^{\otimes k}=\frac{1}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\omega^{d(p-q)}\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S_q^x|.

即我们把前面相位相同的a,ba,b 那部分放在一起作一个均匀叠加态。

接下来我们考虑做一个假设:假设 hidden subgroup 是以均匀的概率取dZNd\in\mathbb{Z}_N

此时相当于我们有了个 ensemble,以1N\frac{1}{N} 的先验概率处于状态ρdk\rho_d^{\otimes k},那么可以用 PGM 来以一定概率得到dd

具体地,令

G:=dZNρdk=1(2N)kxZNkp,qZN(dZNωd(pq))ηpxηqxx,Spxx,Sqx=N(2N)kxZNkrZNηrxx,Srxx,Srx.\begin{aligned} G&:=\sum_{d\in\mathbb{Z}_N}\rho_d^{\otimes k}\\ &=\frac{1}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\left (\sum_{d\in\mathbb{Z}_N}\omega^{d(p-q)}\right )\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S_q^x|\\ &=\frac{N}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{r\in\mathbb{Z}_N}\eta_r^x|x,S_r^x\rangle\langle x,S_r^x|. \end{aligned}

这里实际上用到了特征标的正交性。虽然在 dihedral group 里具体到了单位根,但是实际上对于一般的特征标也成立。
这也是我理解为什么需要先做一次 Fourier 变化的原因,可以通过特征标使得GG 直接就是对角的。

那么我们构造 PGM 为

Ed=G1/2ρdkG1/2=1Nx1,x2,yZNkr1,r2ZNp,qZNωd(pq)ηpyηqyηr1x1ηr2x2x1,Sr1x1x1,Sr1x1y,Spyy,Sqyx2,Sr2x2x2,Sr2x2=1NxZNkp,qZNωd(pq)x,Spxx,Sqx.\begin{aligned} E_d&=G^{-1/2}\rho_d^{\otimes k}G^{-1/2}\\ &=\frac{1}{N}\sum_{x_1,x_2,y\in\mathbb{Z}_N^k}\sum_{r_1,r_2\in\mathbb{Z}_N}\sum_{p,q\in\mathbb{Z}_N}\frac{\omega^{d(p-q)}\sqrt{\eta_p^y\eta_q^y}}{\sqrt{\eta_{r_1}^{x_1}\eta_{r_2}^{x_2}}}|x_1,S_{r_1}^{x_1}\rangle\langle x_1,S_{r_1}^{x_1}|y,S_p^y\rangle\langle y,S_q^y|x_2,S_{r_2}^{x_2}\rangle\langle x_2,S_{r_2}^{x_2}|\\ &=\frac{1}{N}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\omega^{d(p-q)}|x,S_p^x\rangle\langle x,S_q^x|.\\ \end{aligned}

我们可以利用之前的 Holevo–Yuen–Kennedy–Lax 定理来说明,这个测量是 optimal 的(用于区分ρdk\rho_d^{\otimes k})。
注意到

Y=dZNρdkEd=1N(2N)kdZNx,yZNkp,q,p,qZNωd(pq+pq)ηpxηqxx,Spxx,Sqxy,Spyy,Sqy(q=p,x=y)=1N(2N)kxZNkp,q,qZNdZNωd(pq)ηpxηqxx,Spxx,Sqx(p=q)=1(2N)kxZNkp,qZNηpxηqxx,Spxx,Spx.\begin{aligned} Y&=\sum_{d\in\mathbb{Z}_N}\rho_d^{\otimes k}E_d\\ &=\frac{1}{N(2N)^k}\sum_{d\in\mathbb{Z}_N}\sum_{x,y\in\mathbb{Z}_N^k}\sum_{p,q,p',q'\in\mathbb{Z}_N}\omega^{d(p-q+p'-q')}\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S_q^x|y,S_{p'}^y\rangle\langle y,S_{q'}^y|\\ (q=p',x=y)&=\frac{1}{N(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q,q'\in\mathbb{Z}_N}\sum_{d\in\mathbb{Z}_N}\omega^{d(p-q')}\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S^x_{q'}|\\ (p=q')&=\frac{1}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S_p^x|.\\ \end{aligned}

那么很显然YY 是 Hermitian 的,并且我们重写ρdk\rho^{\otimes k}_d

ρdk=xZNkx,ρdxx,ρdx,其中 ρdx=1(2N)k/2pZNωdpηpxSpx.\rho_d^{\otimes k}=\sum_{x\in\mathbb{Z}_N^k}|x,\rho_d^x\rangle\langle x, \rho_d^x|,\qquad \text{其中 }|\rho_d^x\rangle=\frac{1}{(2N)^{k/2}}\sum_{p\in\mathbb{Z}_N}\omega^{dp}\sqrt{\eta_p^x}|S_p^x\rangle.

换句话说,ρdk\rho_d^{\otimes k} 是分块对角的,每个对角元素是一个 rank 1 的矩阵。

那么可以验证

x,ρdxYx,ρdx=1(2N)kp,qZNηpxηpxηqx1(2N)kqZNηpx=x,ρdxρdkx,ρdx.\langle x,\rho_d^x|Y|x,\rho_d^x\rangle=\frac{1}{(2N)^k}\sum_{p,q\in\mathbb{Z}_N}\eta_p^x\sqrt{\eta_p^x\eta_q^x}\geq \frac{1}{(2N)^k}\sum_{q\in\mathbb{Z}_N}\eta_p^x=\langle x,\rho_d^x|\rho_d^{\otimes k}|x,\rho_d^x\rangle.

也就是说,YρdkY\geq \rho_d^{\otimes k}

注意到dEd<I\sum_dE_d<I 并没有张满整个空间,那么我们单独引入一个Ee=IdZNEdE_e=I-\sum_{d\in\mathbb{Z}_N}E_d 来表示得到这个测量结果时,输出 trivial hidden subgroup {(0,0)}\{(0,0)\}

接下来我们分析成功概率。对于一个 hidden subgroup H={(0,0),(d,1)}H=\{(0,0),(d,1)\},我们会发现成功概率其实和dd 无关(这里小心点计算,类似计算YY 的第二步,实际上有p=qp=q' 然后ωd(pq)=1\omega^{d(p-q')}=1):

p=Tr(Edρdk)=1N(2N)kxZNkp,qZNηpxηqx=12k+1NkxZNk(rZNηrx)2.p=Tr(E_d\rho_d^{\otimes k})=\frac{1}{N(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\sqrt{\eta_p^x\eta_q^x}=\frac{1}{2^{k+1}N^k}\sum_{x\in\mathbb{Z}_N^k}\left (\sum_{r\in\mathbb{Z}_N}\sqrt{\eta_r^x}\right )^2.

ν=k/logN\nu=k/\log N,Childs et al. 做了个结果:

Theorem 2 in (Optimal Measurements for the Dihedral Hidden Subgroup Problem)
如果ν>1+4/logN\nu>1+4/\log N,那么成功概率至少是1/81/8

此外,对于任意N,kN,k,成功概率都小于2k/N2^k/N

我们首先引入一个 lemma。其实可以注意到xbrmodNx\cdot b\equiv r\mod N 本质上是一个 subset-sum 问题,bZ2kb\in\mathbb{Z}_2^k 决定了xx 中哪些元素被选中。

Lemma 对于固定的rZNr\in\mathbb{Z}_N 和均匀随机的xZNkx\in\mathbb{Z}_N^k,有

Prx(ηrx2k2N)14(N1)2k.\Pr_x\left (\eta_r^x\geq \frac{2^k}{2N}\right )\geq 1-\frac{4(N-1)}{2^k}.

Proof: 考虑对于每个bZ2kb\in\mathbb{Z}_2^k,定义一个随机变量XbX_b 为:

Xb={1,if bx=rmodN;0,otherwise.X_b=\begin{cases} 1, & \text{if }b\cdot x=r\mod N;\\ 0, & \text{otherwise}. \end{cases}

那么实际上有

ηrx=bZ2kXb.\eta_r^x=\sum_{b\in\mathbb{Z}_2^k}X_b.

下面我们用 Chebyshev 不等式分析一下右侧随机变量的和。

Ex[ηrx]=Ex[bZ2kXb]=bZ2kEx[Xb]=bZ2kPrx(bx=r)=2kN.\mathop{\mathbb{E}}_{x}[\eta_r^x]=\mathop{\mathbb{E}}_{x}\left [\sum_{ b\in\mathbb{Z}_2^k}X_b\right ]=\sum_{b\in\mathbb{Z}_2^k}\mathbb{E}_x[X_b]=\sum_{b\in\mathbb{Z}_2^k}\Pr_{x}(b\cdot x=r)=\frac{2^k}{N}.

注意,固定了bZ2k,rZNb\in\mathbb{Z}_2^k,r\in\mathbb{Z}_N,然后均匀随机选取xZNkx\in\mathbb{Z}_N^k 的话,bxb\cdot x 是均匀分布在ZN\mathbb{Z}_N 上的。所以Prx(bx=r)=1/N\Pr_x(b\cdot x=r)=1/N

μ=E(bXb)σ2=Var(bXb)\mu=\mathbb{E}(\sum_bX_b)\sigma^2=Var(\sum_bX_b),根据 Chebyshev 不等式我们知道

Prx(bXb12μ)4σ2μ2.\Pr_x\left ( \sum_bX_b\leq \frac{1}{2}\mu\right )\leq\frac{4\sigma^2}{\mu^2}.

接下来,我们可以证明,XbX_b 之间是相互独立的。不妨考虑两个不同的b,bZ2kb,b'\in\mathbb{Z}_2^k,其中不失一般性地b1=1,b1=0b_1=1, b_1'=0(第一位),那么有

Prx[Xb=1Xb=1]=Ex2,...,xk[Prx1(Xb=1Xb=1)]=Ex2,...,xk[1/NδXb,1]=1NPrx2,...,xk(Xb=1)=Prx(Xb=1)Prx(Xb=1).\begin{aligned} \Pr_x[X_b=1\wedge X_{b'}=1]&=\mathbb{E}_{x_2,...,x_k}[\Pr_{x_1}(X_b=1\wedge X_{b'}=1)]\\ &=\mathbb{E}_{x_2,...,x_k}[1/N\cdot \delta_{X_{b'},1}]\\ &=\frac{1}{N}\Pr_{x_2,...,x_k}(X_{b'}=1)\\ &=\Pr_x(X_b=1)\Pr_x(X_{b'}=1).\\ \end{aligned}

其中,第二个等式是因为,XbX_{b'}x1x_1 无关,但是给定x2,...,xkx_2,...,x_k 后,Xb=1X_b=1 的概率是1/N1/N
所以

σ2=Var(bXb)=bVar(Xb)=2kN2kN2.\sigma^2=Var\left (\sum_bX_b\right )=\sum_bVar(X_b)=\frac{2^k}{N}-\frac{2^k}{N^2}.

因此,

Prx(ηrx2k2N)4(N1)2k.\Pr_x\left (\eta_r^x\leq \frac{2^k}{2N}\right )\leq \frac{4(N-1)}{2^k}.

\square

接下来,我们可以证明之前的定理。
Proof: 注意到成功的概率为

p=1N(2N)kxZNk(rZNηrx)212kN(1NkxZNkrZNηrx)2,p=\frac{1}{N(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\left (\sum_{r\in\mathbb{Z}_N}\sqrt{\eta_r^x}\right )^2\geq\frac{1}{2^kN}\left (\frac{1}{N^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{r\in\mathbb{Z}_N}\sqrt{\eta_r^x}\right )^2,

此外,根据之前的 lemma,

1NkxZNkηrx2k2NPrx(ηrx2k2N)2k2N16(N1)22kN.\frac{1}{N^k}\sum_{x\in\mathbb{Z}_N^k}\sqrt{\eta_r^x}\geq \sqrt{\frac{2^k}{2N}}\Pr_x\left (\eta_r^x\geq \frac{2^k}{2N}\right )\geq \sqrt{\frac{2^k}{2N}}-\sqrt{\frac{16(N-1)^2}{2^kN}}.

因此,注意到k>logN+4k>\log N+4

pN2k(2k2N16(N1)22kN)2N2k(2k2N28(N1)2N2)1228N2k1224>18.\begin{aligned} p&\geq \frac{N}{2^k}\left (\sqrt{\frac{2^k}{2N}}-\sqrt{\frac{16(N-1)^2}{2^kN}}\right )^2\\ &\geq \frac{N}{2^k}\left (\frac{2^k}{2N}-2\sqrt{\frac{8(N-1)^2}{N^2}}\right )\\ &\geq \frac{1}{2}-2\sqrt{8}\cdot \frac{N}{2^k}\\ &\geq \frac{1}{2}-\frac{\sqrt{2}}{4}>\frac{1}{8}.\\ \end{aligned}

对于上届,我们有

p12kNk+1xZNk(rZNηrx)2=2kN.p\leq \frac{1}{2^kN^{k+1}}\sum_{x\in\mathbb{Z}_N^k}\left (\sum_{r\in\mathbb{Z}_N}\eta_r^x\right )^2=\frac{2^k}{N}.

\square

# PGM 的实现

还是接上文讨论。我们考虑,如何实现 PGM 测量。
换句话说,我们希望有一个酉变换UU,使得对于一个状态ρ\rho,我们执行 POVM 测量{Ed:dZN}\{E_d:d\in\mathbb{Z}_N\} 等价于在状态UρUU\rho U^\dagger 下进行 computational basis 的测量(PVM)。

我们考虑之前的 POVM 表达式,交换一下第一第二寄存器,

Ed=1NxZNkp,qZNωd(pq)x,Spxx,Sqx=xZNkEdxxx,E_d=\frac{1}{N}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\omega^{d(p-q)}|x,S_p^x\rangle\langle x,S_q^x|=\sum_{x\in\mathbb{Z}_N^k}E_d^x\otimes |x\rangle\langle x|,

其中

Edx=1Np,qZNωd(pq)SpxSqx.E_d^x=\frac{1}{N}\sum_{p,q\in\mathbb{Z}_N}\omega^{d(p-q)}|S_p^x\rangle\langle S_q^x|.

那么,直接进行 POVM {Ed:dZN}\{E_d:d\in\mathbb{Z}_N\} 得到dd 的概率,就等价于先测量第二寄存器xx,然后基于xx 测量第一寄存器EdxE_d^x 得到dd。直觉上:

p(d)=xp(dx)p(x).p(d)=\sum_x p(d\mid x)p(x).

形式化地,

Tr(Edρ)=xZNkTr(EdxxρxTr(xρx))Tr(xρx),Tr(E_d\rho)=\sum_{x\in\mathbb{Z}_N^k}Tr\left (E_d^x\cdot \frac{\langle x|\rho|x\rangle}{Tr(\langle x|\rho|x\rangle)}\right )Tr(\langle x|\rho|x\rangle),

其中,xρxTr(xρx)\frac{\langle x|\rho|x\rangle}{Tr(\langle x|\rho|x\rangle)} 是测量第二寄存器后,得到xx 时第一寄存器坍塌进入的状态。

下面问题是,给定xZNkx\in\mathbb{Z}_N^k,我们需要实现测量{Edx:dZN}\{E_d^x:d\in\mathbb{Z}_N\}
根据 Neumark 定理,我们总是可以通过扩大空间,使得 POVM 被转化成更大空间上的一个 PVM。具体地,可以构造一个 block-encoding unitary operator

Ux=(VxAxBxCx)U^x=\begin{pmatrix} V^x & A^x\\ B^x & C^x \end{pmatrix}

其中Vx=1Nj,qZNωjqjSqxV^x=\frac{1}{\sqrt{N}}\sum_{j,q\in\mathbb{Z}_N}\omega^{-jq}|j\rangle\langle S_q^x|,其他Ax,Bx,CxA^x,B^x,C^x 是为了保证 unitary。

这样对一个状态ρ\rho 进行{Edx:dZN}\{E_d^x:d\in\mathbb{Z}_N\} 的 POVM 测量就等价于,对Ux(00ρ)(Ux)U^x(|0\rangle\langle 0|\otimes \rho)(U^x)^\dagger 进行{00jj:jZN}\{|0\rangle\langle 0|\otimes |j\rangle\langle j|:j\in \mathbb{Z}_N\} 的测量。
这是因为:

jVxρ(Vx)j=Tr(Ejxρ).\langle j|V^x\rho (V^x)^\dagger |j\rangle=Tr(E_j^x\rho).

所以我们要想办法实现UxU^x。进一步地,我们尝试实现FUxFU^x,其中FF 是空心 controlled QFT 算子。即

FUx=F(00Vx+01Ax+10Bx+11Cx)=00V~x+01A~x+10Bx+11Cx,\begin{aligned} FU^x&=F(|0\rangle\langle 0|\otimes V^x+|0\rangle\langle 1|\otimes A^x+|1\rangle\langle 0|\otimes B^x+|1\rangle\langle 1|\otimes C^x)\\ &=|0\rangle\langle 0|\otimes \tilde{V}^x+|0\rangle\langle 1|\otimes \tilde{A}^x+|1\rangle\langle 0|\otimes B^x+|1\rangle\langle 1|\otimes C^x, \end{aligned}

其中

V~x=1Nj,p,qZNωj(pq)pSqx=pZNpSpx.\tilde{V}^x=\frac{1}{N}\sum_{j,p,q\in\mathbb{Z}_N}\omega^{j(p-q)}|p\rangle\langle S_q^x|=\sum_{p\in\mathbb{Z}_N}|p\rangle\langle S_p^x|.

所以如果我们能实现 unitary transformation

p,x{Spx,x,if Spx;ψpx,otherwise,|p,x\rangle\mapsto\begin{cases} |S_p^x,x\rangle, & \text{if }S_p^x\neq \emptyset;\\ |\psi_p^x\rangle, & \text{otherwise}, \end{cases}

其中ψpx|\psi_p^x\rangle 可以是任意一个状态满足 unitary 的限制,那么我们就可以实现FUxFU^x

注意,这里我觉得要求变强了。本来可以测量到xx 后,根据xx hard-code 一个线路,但是这边却要求了一个 coherent 的实现。

如果对于任意的xx 我们都可以高效实现FUxFU^x,那么 subset sum problem 就量子可解了。
因为对于(x,t)ZNk×ZN(x,t)\in\mathbb{Z}_N^k\times \mathbb{Z}_N,我们想求解一个bZ2kb\in\mathbb{Z}_2^k 使得xbtmodNx\cdot b\equiv t\mod N 时,只需要作用(FUx)(FU^x)^\dagger 得到

(FU)(00tt)(FUx)=00StxStx+...(FU^\dagger)(|0\rangle\langle 0|\otimes |t\rangle\langle t|)(FU^x)=|0\rangle\langle 0|\otimes |S_t^x\rangle\langle S_t^x|+...

那么就可以得到一个满足条件bb 的均匀叠加态。

总之,PGM 的高效实现几乎等价于 subset sum problem 的高效量子算法。

着应该并不简单,但是好的是我们只需要考虑ν=k/logN>1\nu=k/\log N>1 的情况,这里ν\nu 会被称为 density
在 subset sum problem 的研究中,ν1\nu\sim 1 是个非常重要的分界线。对于足够大或足够小的ν\nu,subset sum problem 会更 tractable 一些。
譬如当ν<0.941\nu<0.941 时,可以规约到 SVP 问题上,然而 SVP 也很困难。当ν\nu 特别小时,k<clogNk<c\sqrt{\log N} 对于某个常数cc,那么 subset sum problem 是可以多项式时间求解的。

对于很大的ν\nu 时,k>cNk>cN 的情况时 subset sum problem 也是可以求解的,但这时对于量子算法并不高效(指数级别了)。其次就只有一些 sub exponential 的算法了(譬如 Kuperberg)。

原文还有一个 comment,就是虽然直接 measure xx 是一个自然的办法,但不一定是唯一的做法。有可能可以不通过 measure xx,然后就不用求解 subset sum problem 来实现这个 measurement。