我偶然在一把小刀上发现了异国的一粒微尘 —— 世界顿时又变得奇异万状,缭绕着五彩缤纷的氤氲。
\newcommand{\bZ}{\mathbb{Z}}
# Pretty Good Measurements
参考:Theory of Quantum Information
考虑这样一个 discriminate quantum states from an ensemble 的问题:
给定一个 ensemble η : Σ → D ( H ) \eta:\Sigma\to \mathcal{D}(\mathcal{H}) η : Σ → D ( H ) ,其中Σ \Sigma Σ 是一个有限集合,η \eta η 满足:
∑ a ∈ Σ T r ( η ( a ) ) = 1. \sum_{a\in\Sigma}Tr(\eta(a))=1.
a ∈ Σ ∑ T r ( η ( a ) ) = 1 .
理解为:整个系统以一个T r ( η ( a ) ) Tr(\eta(a)) T r ( η ( a ) ) 的先验概率处于状态η ( a ) \eta(a) η ( a ) 。
现在我们希望设计一个 POVM 测量μ : Σ → P o s ( H ) \mu:\Sigma\to Pos(\mathcal{H}) μ : Σ → P o s ( H ) 使得
∑ a ∈ Σ ⟨ μ ( a ) , η ( a ) ⟩ \sum_{a\in\Sigma}\langle \mu(a),\eta(a)\rangle
a ∈ Σ ∑ ⟨ μ ( a ) , η ( a ) ⟩
尽量大。
理解为:我们希望设计一个测量,使得测量结果得到系统所处状态的概率尽量大。
换句话说,我们希望通过设计一个最 general 的测量,来大概率分辨一个以已知的先验概率处于已知的状态集合的系统,究竟处于哪个状态。
很显然,如果我们把 ensemble 嵌到一个更大的经典 - 量子混合状态:
A = ∑ a ∈ Σ ∣ a ⟩ ⟨ a ∣ ⊗ η ( a ) ∈ D ( H ′ ⊗ H ) , A=\sum_{a\in\Sigma}|a\rangle\langle a|\otimes \eta(a)\in \mathcal{D}(\mathcal{H}'\otimes\mathcal{H}),
A = a ∈ Σ ∑ ∣ a ⟩ ⟨ a ∣ ⊗ η ( a ) ∈ D ( H ′ ⊗ H ) ,
其中H ′ \mathcal{H}' H ′ 就是经典部分的系统
那么原问题可以转化为一个规划问题:
maximize ⟨ A , X ⟩ subject to T r H ′ ( X ) = I , X ∈ P o s ( H ′ ⊗ H ) . \begin{aligned}
& \text{maximize} && \langle A,X\rangle\\
& \text{subject to}&& Tr_{\mathcal{H}'}(X)=I,\\
& && X\in Pos(\mathcal{H}'\otimes\mathcal{H}).\\
\end{aligned}
maximize subject to ⟨ A , X ⟩ T r H ′ ( X ) = I , X ∈ P o s ( H ′ ⊗ H ) .
注意,这里把一个测量嵌到了一个经典 - 量子混合状态。
X = ∑ a ∈ Σ ∣ a ⟩ ⟨ a ∣ ⊗ μ ( a ) X=\sum_{a\in\Sigma}|a\rangle\langle a|\otimes \mu(a)
X = a ∈ Σ ∑ ∣ a ⟩ ⟨ a ∣ ⊗ μ ( a )
在这个规划问题中,我们并没有强行要求X X X 是上面的形式。实际上,对于所有满足T r H ′ ( X ) = I Tr_{\mathcal{H}'}(X)=I T r H ′ ( X ) = I 的X X X ,都可以找到一组对应的测量:
E a = ( ⟨ a ∣ ⊗ I ) X ( ∣ a ⟩ ⊗ I ) . E_a=(\langle a|\otimes I) X (|a\rangle\otimes I).
E a = ( ⟨ a ∣ ⊗ I ) X ( ∣ a ⟩ ⊗ I ) .
我们把这个问题和它的对偶问题放在一起看
Primal Problem maximize ⟨ A , X ⟩ subject to T r H ′ ( X ) = I , X ∈ P o s ( H ′ ⊗ H ) . Dual Problem minimize T r ( Y ) subject to I ⊗ Y ≥ A , X ∈ H e r m ( H ) . \begin{aligned}
& && \text{Primal Problem}\\
& \text{maximize} && \langle A,X\rangle\\
& \text{subject to}&& Tr_{\mathcal{H}'}(X)=I,\\
& && X\in Pos(\mathcal{H}'\otimes\mathcal{H}).\\
\end{aligned}
\qquad \qquad
\begin{aligned}
& && \text{Dual Problem} \\
& \text{minimize} && Tr(Y)\\
& \text{subject to}&& I\otimes Y\geq A,\\
& && X\in Herm(\mathcal{H}).\\
\end{aligned}
maximize subject to Primal Problem ⟨ A , X ⟩ T r H ′ ( X ) = I , X ∈ P o s ( H ′ ⊗ H ) . minimize subject to Dual Problem T r ( Y ) I ⊗ Y ≥ A , X ∈ H e r m ( H ) .
那么 strong duality 实际上存在:
X = 1 ∣ Σ ∣ I ⊗ I , Y = γ I X=\frac{1}{|\Sigma|}I\otimes I,\qquad Y=\gamma I
X = ∣ Σ ∣ 1 I ⊗ I , Y = γ I
根据 strong duality 和 slater’s theorem 我们知道这两个问题可以取到最优解且最优解是相等的。
但是往往我们很难把最优解的X X X 写成一个关于A A A 的 analytic description。
所以 Pretty Good Measurement 就是在一个能够显式构造出 measurement 的情况下,给出一个近似的最优解。
我们定义 PGM 测量:
μ ( a ) = ρ − 1 / 2 η ( a ) ρ − 1 / 2 , 其中 ρ = ∑ a ∈ Σ η ( a ) . \mu(a)=\rho^{-1/2}\eta(a)\rho^{-1/2},\qquad\text{其中 } \rho=\sum_{a\in\Sigma}\eta(a).
μ ( a ) = ρ − 1 / 2 η ( a ) ρ − 1 / 2 , 其中 ρ = a ∈ Σ ∑ η ( a ) .
如果ρ \rho ρ 不可逆,那我们需要采用 Moore–Penrose pseudo-inverse:
μ ( a ) = ρ + η ( a ) ρ + + 1 ∣ Σ ∣ Π ker ρ , \mu(a)=\sqrt{\rho^+}\eta(a)\sqrt{\rho^+}+\frac{1}{|\Sigma|}\Pi_{\ker\rho},
μ ( a ) = ρ + η ( a ) ρ + + ∣ Σ ∣ 1 Π k e r ρ ,
其中Π ker ρ \Pi_{\ker\rho} Π k e r ρ 是ρ \rho ρ 缺少的 eigenspace 部分的投影算子。
我们可以证明
Theorem (Barnum–Knill) 对于如上定义的 PGM,
∑ a ∈ Σ ⟨ μ ( a ) , η ( a ) ⟩ ≥ o p t ( η ) 2 , \sum_{a\in\Sigma}\langle \mu(a),\eta(a)\rangle \geq opt(\eta)^2,
a ∈ Σ ∑ ⟨ μ ( a ) , η ( a ) ⟩ ≥ o p t ( η ) 2 ,
其中o p t ( η ) opt(\eta) o p t ( η ) 就是之前规划问题的最优值。
Proof : 因为s u p p ( η ( a ) ) ⊆ s u p p ( ρ ) , i m ( η ( a ) ) ⊆ i m ( ρ ) supp(\eta(a))\subseteq supp(\rho),im(\eta(a))\subseteq im(\rho) s u p p ( η ( a ) ) ⊆ s u p p ( ρ ) , i m ( η ( a ) ) ⊆ i m ( ρ ) ,我们知道 pseudo-inverse 在它的像空间中就起到了 inverse 的作用(即ρ ρ + = Π i m ( ρ ) , ρ + ρ = Π s u p p ( ρ ) \rho\rho^+=\Pi_{im(\rho)},\rho^+\rho=\Pi_{supp(\rho)} ρ ρ + = Π i m ( ρ ) , ρ + ρ = Π s u p p ( ρ ) ),所以对于一个测量ν \nu ν ,我们有
⟨ ρ 1 / 4 ν ( a ) ρ 1 / 4 , ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ⟩ = T r ( ν ( a ) Π i m ( ρ ) η ( a ) Π s u p p ( ρ ) ) = T r ( ν ( a ) η ( a ) ) = ⟨ ν ( a ) , η ( a ) ⟩ . \begin{aligned}
\langle\rho^{1/4}\nu(a)\rho^{1/4},(\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4}\rangle &= Tr(\nu(a)\Pi_{im(\rho)}\eta(a)\Pi_{supp(\rho)})\\
&=Tr(\nu(a)\eta(a))\\
&=\langle \nu(a),\eta(a)\rangle.\\
\end{aligned}
⟨ ρ 1 / 4 ν ( a ) ρ 1 / 4 , ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ⟩ = T r ( ν ( a ) Π i m ( ρ ) η ( a ) Π s u p p ( ρ ) ) = T r ( ν ( a ) η ( a ) ) = ⟨ ν ( a ) , η ( a ) ⟩ .
根据 Cauchy–Schwarz 不等式,
⟨ ν ( a ) , η ( a ) ⟩ ≤ ∥ ρ 1 / 4 ν ( a ) ρ 1 / 4 ∥ 2 ∥ ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ∥ 2 . \langle \nu(a),\eta(a)\rangle\leq \left \|\rho^{1/4}\nu(a)\rho^{1/4} \right \|_2\left \|(\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4} \right \|_2.
⟨ ν ( a ) , η ( a ) ⟩ ≤ ∥ ∥ ∥ ∥ ρ 1 / 4 ν ( a ) ρ 1 / 4 ∥ ∥ ∥ ∥ 2 ∥ ∥ ∥ ∥ ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ∥ ∥ ∥ ∥ 2 .
再用一次 Cauchy–Schwarz 不等式,
∑ a ∈ Σ ⟨ ν ( a ) , η ( a ) ⟩ ≤ ∑ a ∈ Σ ∥ ρ 1 / 4 ν ( a ) ρ 1 / 4 ∥ 2 2 ∑ a ∈ Σ ∥ ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ∥ 2 2 . \sum_{a\in\Sigma}\langle \nu(a),\eta(a)\rangle\leq \sqrt{\sum_{a\in\Sigma}\left \|\rho^{1/4}\nu(a)\rho^{1/4} \right \|_2^2}\sqrt{\sum_{a\in\Sigma}\left \|(\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4} \right \|_2^2}.
a ∈ Σ ∑ ⟨ ν ( a ) , η ( a ) ⟩ ≤ a ∈ Σ ∑ ∥ ∥ ∥ ρ 1 / 4 ν ( a ) ρ 1 / 4 ∥ ∥ ∥ 2 2 a ∈ Σ ∑ ∥ ∥ ∥ ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ∥ ∥ ∥ 2 2 .
其中左侧根号的值不会超过 1,因为
∥ ρ 1 / 4 ν ( a ) ρ 1 / 4 ∥ 2 2 = ⟨ ρ 1 / 4 ν ( a ) ρ 1 / 4 , ρ 1 / 4 ν ( a ) ρ 1 / 4 ⟩ = ⟨ ν ( a ) , ρ ν ( a ) ρ ⟩ ≤ T r ( ρ ν ( a ) ρ ) = T r ( ν ( a ) ρ ) . \left \|\rho^{1/4}\nu(a)\rho^{1/4} \right \|_2^2=\langle \rho^{1/4}\nu(a)\rho^{1/4},\rho^{1/4}\nu(a)\rho^{1/4}\rangle=\langle \nu(a),\sqrt{\rho}\nu(a)\sqrt{\rho}\rangle\leq Tr(\sqrt{\rho}\nu(a)\sqrt{\rho})=Tr(\nu(a)\rho).
∥ ∥ ∥ ∥ ρ 1 / 4 ν ( a ) ρ 1 / 4 ∥ ∥ ∥ ∥ 2 2 = ⟨ ρ 1 / 4 ν ( a ) ρ 1 / 4 , ρ 1 / 4 ν ( a ) ρ 1 / 4 ⟩ = ⟨ ν ( a ) , ρ ν ( a ) ρ ⟩ ≤ T r ( ρ ν ( a ) ρ ) = T r ( ν ( a ) ρ ) .
所以 sum over 所有a ∈ Σ a\in\Sigma a ∈ Σ 后,就不会大于∑ a ∈ Σ T r ( ν ( a ) ρ ) = T r ( ρ ) = 1 \sum_{a\in\Sigma}Tr(\nu(a)\rho)=Tr(\rho)=1 ∑ a ∈ Σ T r ( ν ( a ) ρ ) = T r ( ρ ) = 1 。
同样地,对于右侧根号,我们知道
∥ ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ∥ 2 2 = ⟨ ρ + η ( a ) ρ + , η ( a ) ⟩ ≤ ⟨ μ ( a ) , η ( a ) ⟩ . \left \| (\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4}\right \|_2^2=\langle \sqrt{\rho^+}\eta(a)\sqrt{\rho^+},\eta(a)\rangle\leq \langle \mu(a),\eta(a)\rangle.
∥ ∥ ∥ ∥ ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ∥ ∥ ∥ ∥ 2 2 = ⟨ ρ + η ( a ) ρ + , η ( a ) ⟩ ≤ ⟨ μ ( a ) , η ( a ) ⟩ .
所以
∑ a ∈ Σ ∥ ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ∥ 2 2 ≤ ∑ a ∈ Σ ⟨ μ ( a ) , η ( a ) ⟩ . \sum_{a\in\Sigma}\left \| (\rho^+)^{1/4}\eta(a)(\rho^+)^{1/4}\right \|_2^2\leq \sum_{a\in\Sigma}\langle \mu(a),\eta(a)\rangle.
a ∈ Σ ∑ ∥ ∥ ∥ ∥ ( ρ + ) 1 / 4 η ( a ) ( ρ + ) 1 / 4 ∥ ∥ ∥ ∥ 2 2 ≤ a ∈ Σ ∑ ⟨ μ ( a ) , η ( a ) ⟩ .
因此,我们得到了
( ∑ a ∈ Σ ⟨ ν ( a ) , η ( a ) ⟩ ) 2 ≤ ∑ a ∈ Σ ⟨ μ ( a ) , η ( a ) ⟩ . \left (\sum_{a\in\Sigma}\langle \nu(a),\eta(a)\rangle\right )^2\leq \sum_{a\in\Sigma}\langle \mu(a),\eta(a)\rangle.
( a ∈ Σ ∑ ⟨ ν ( a ) , η ( a ) ⟩ ) 2 ≤ a ∈ Σ ∑ ⟨ μ ( a ) , η ( a ) ⟩ .
这对所有的测量ν \nu ν 都成立,所以 PGM μ \mu μ 至少是一个平方近似比。
□ \square □
我们补充一个判断一个测量是否是 optimal 的办法:
Theorem (Holevo–Yuen–Kennedy–Lax) 一个测量μ \mu μ 是规划问题 optimal 的解当且仅的
Y = ∑ a ∈ Σ η ( a ) μ ( a ) Y=\sum_{a\in\Sigma}\eta(a)\mu(a)
Y = a ∈ Σ ∑ η ( a ) μ ( a )
是 Hermitian 的并且Y ≥ η ( b ) Y\geq \eta(b) Y ≥ η ( b ) 对于所有的b ∈ Σ b\in\Sigma b ∈ Σ 。
此外,我们知道,如果η \eta η 每个状态之间比较 “不相似”,那么 PGM 的成功概率会更高。
Theorem
Pr ( PGM errors on η ) ≤ 1 2 ∑ a ≠ b T r ( η ( a ) η ( b ) ) F ( η ( a ) / T r ( η ( a ) ) , η ( b ) / T r ( η ( b ) ) ) , \Pr(\text{PGM errors on }\eta)\leq \frac{1}{2}\sum_{a\neq b}\sqrt{Tr(\eta(a)\eta(b))}F(\eta(a)/Tr(\eta(a)),\eta(b)/Tr(\eta(b))),
Pr ( PGM errors on η ) ≤ 2 1 a = b ∑ T r ( η ( a ) η ( b ) ) F ( η ( a ) / T r ( η ( a ) ) , η ( b ) / T r ( η ( b ) ) ) ,
其中F ( ρ , σ ) = ∥ ρ σ ∥ 1 F(\rho,\sigma)=\|\sqrt{\rho}\sqrt{\sigma}\|_1 F ( ρ , σ ) = ∥ ρ σ ∥ 1 是 fidelity function。
换句话说,如果两两状态之间的 fidelity 比较小(不相似),那么 PGM 的成功概率会更高。
# PGM for Dihedral Hidden Subgroup Problem
参考:OPTIMAL MEASUREMENTS FOR THE DIHEDRAL HIDDEN SUBGROUP PROBLEM
在之前的一篇 Blog Kuperberg’s algorithm for the dihedral Hidden Subgroup Problem 中,我们讨论过 Dihedral group 其实是Z N ⋊ Z 2 \mathbb{Z}_N\rtimes\mathbb{Z}_2 Z N ⋊ Z 2 ,以及不失一般性地我们可以假设隐含子群为H = { ( 0 , 0 ) , ( d , 1 ) } H=\{(0,0),(d,1)\} H = { ( 0 , 0 ) , ( d , 1 ) } ,其中d ∈ Z N d\in \mathbb{Z}_N d ∈ Z N 。
然后通过 Fourier 变化,我们可以以相同的概率得到某个x ∈ Z N x\in \mathbb{Z}_N x ∈ Z N 和状态
∣ ψ x , d ⟩ = 1 2 ∣ x ⟩ ( ∣ 0 ⟩ + ω N x d ∣ 1 ⟩ ) . |\psi_{x,d}\rangle=\frac{1}{\sqrt{2}}|x\rangle(|0\rangle+\omega^{xd}_N|1\rangle).
∣ ψ x , d ⟩ = 2 1 ∣ x ⟩ ( ∣ 0 ⟩ + ω N x d ∣ 1 ⟩ ) .
或者说,我们得到了 hidden subgroup states
ρ d = 1 N ∑ x ∈ Z N ∣ ψ x , d ⟩ ⟨ ψ x , d ∣ = 1 2 N ∑ x ∈ Z N ∑ a , b ∈ Z 2 ω N x d ( a − b ) ∣ x , a ⟩ ⟨ x , b ∣ . \rho_d=\frac{1}{N}\sum_{x\in\mathbb{Z}_N}|\psi_{x,d}\rangle\langle \psi_{x,d}|=\frac{1}{2N}\sum_{x\in\mathbb{Z}_N}\sum_{a,b\in\mathbb{Z}_2}\omega_N^{xd(a-b)}|x,a\rangle\langle x,b|.
ρ d = N 1 x ∈ Z N ∑ ∣ ψ x , d ⟩ ⟨ ψ x , d ∣ = 2 N 1 x ∈ Z N ∑ a , b ∈ Z 2 ∑ ω N x d ( a − b ) ∣ x , a ⟩ ⟨ x , b ∣ .
我们复制k k k copies,就得到
ρ d ⊗ k = 1 ( 2 N ) k ∑ x ∈ Z N k ∑ a , b ∈ Z 2 k ω N ( ( a − b ) ⋅ x ) d ∣ x , a ⟩ ⟨ x , b ∣ , \rho_d^{\otimes k}=\frac{1}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{a,b\in \mathbb{Z}_2^k}\omega_N^{((a-b)\cdot x)d}|x,a\rangle\langle x,b|,
ρ d ⊗ k = ( 2 N ) k 1 x ∈ Z N k ∑ a , b ∈ Z 2 k ∑ ω N ( ( a − b ) ⋅ x ) d ∣ x , a ⟩ ⟨ x , b ∣ ,
其中( a − b ) ⋅ x (a-b)\cdot x ( a − b ) ⋅ x 是按位点乘。
进一步地,令
S r x = { b ∈ Z 2 k : b ⋅ x = r m o d N } , η r x = ∣ S r x ∣ , S_r^x=\{b\in\mathbb{Z}_2^k:b\cdot x=r\mod N\},\qquad \eta^x_r=|S_r^x|,
S r x = { b ∈ Z 2 k : b ⋅ x = r m o d N } , η r x = ∣ S r x ∣ ,
和状态
∣ S r x ⟩ = 1 η r x ∑ b ∈ S r x ∣ b ⟩ . |S_r^x\rangle=\frac{1}{\sqrt{\eta_r^x}}\sum_{b\in S_r^x}|b\rangle.
∣ S r x ⟩ = η r x 1 b ∈ S r x ∑ ∣ b ⟩ .
那么k k k -copies of hidden subgroup states 可以写成
ρ d ⊗ k = 1 ( 2 N ) k ∑ x ∈ Z N k ∑ p , q ∈ Z N ω d ( p − q ) η p x η q x ∣ x , S p x ⟩ ⟨ x , S q x ∣ . \rho_d^{\otimes k}=\frac{1}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\omega^{d(p-q)}\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S_q^x|.
ρ d ⊗ k = ( 2 N ) k 1 x ∈ Z N k ∑ p , q ∈ Z N ∑ ω d ( p − q ) η p x η q x ∣ x , S p x ⟩ ⟨ x , S q x ∣ .
即我们把前面相位相同的a , b a,b a , b 那部分放在一起作一个均匀叠加态。
接下来我们考虑做一个假设:假设 hidden subgroup 是以均匀的概率取d ∈ Z N d\in\mathbb{Z}_N d ∈ Z N 的 。
此时相当于我们有了个 ensemble,以1 N \frac{1}{N} N 1 的先验概率处于状态ρ d ⊗ k \rho_d^{\otimes k} ρ d ⊗ k ,那么可以用 PGM 来以一定概率得到d d d 。
具体地,令
G : = ∑ d ∈ Z N ρ d ⊗ k = 1 ( 2 N ) k ∑ x ∈ Z N k ∑ p , q ∈ Z N ( ∑ d ∈ Z N ω d ( p − q ) ) η p x η q x ∣ x , S p x ⟩ ⟨ x , S q x ∣ = N ( 2 N ) k ∑ x ∈ Z N k ∑ r ∈ Z N η r x ∣ x , S r x ⟩ ⟨ x , S r x ∣ . \begin{aligned}
G&:=\sum_{d\in\mathbb{Z}_N}\rho_d^{\otimes k}\\
&=\frac{1}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\left (\sum_{d\in\mathbb{Z}_N}\omega^{d(p-q)}\right )\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S_q^x|\\
&=\frac{N}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{r\in\mathbb{Z}_N}\eta_r^x|x,S_r^x\rangle\langle x,S_r^x|.
\end{aligned}
G : = d ∈ Z N ∑ ρ d ⊗ k = ( 2 N ) k 1 x ∈ Z N k ∑ p , q ∈ Z N ∑ ( d ∈ Z N ∑ ω d ( p − q ) ) η p x η q x ∣ x , S p x ⟩ ⟨ x , S q x ∣ = ( 2 N ) k N x ∈ Z N k ∑ r ∈ Z N ∑ η r x ∣ x , S r x ⟩ ⟨ x , S r x ∣ .
这里实际上用到了特征标的正交性。虽然在 dihedral group 里具体到了单位根,但是实际上对于一般的特征标也成立。
这也是我理解为什么需要先做一次 Fourier 变化的原因,可以通过特征标使得G G G 直接就是对角的。
那么我们构造 PGM 为
E d = G − 1 / 2 ρ d ⊗ k G − 1 / 2 = 1 N ∑ x 1 , x 2 , y ∈ Z N k ∑ r 1 , r 2 ∈ Z N ∑ p , q ∈ Z N ω d ( p − q ) η p y η q y η r 1 x 1 η r 2 x 2 ∣ x 1 , S r 1 x 1 ⟩ ⟨ x 1 , S r 1 x 1 ∣ y , S p y ⟩ ⟨ y , S q y ∣ x 2 , S r 2 x 2 ⟩ ⟨ x 2 , S r 2 x 2 ∣ = 1 N ∑ x ∈ Z N k ∑ p , q ∈ Z N ω d ( p − q ) ∣ x , S p x ⟩ ⟨ x , S q x ∣ . \begin{aligned}
E_d&=G^{-1/2}\rho_d^{\otimes k}G^{-1/2}\\
&=\frac{1}{N}\sum_{x_1,x_2,y\in\mathbb{Z}_N^k}\sum_{r_1,r_2\in\mathbb{Z}_N}\sum_{p,q\in\mathbb{Z}_N}\frac{\omega^{d(p-q)}\sqrt{\eta_p^y\eta_q^y}}{\sqrt{\eta_{r_1}^{x_1}\eta_{r_2}^{x_2}}}|x_1,S_{r_1}^{x_1}\rangle\langle x_1,S_{r_1}^{x_1}|y,S_p^y\rangle\langle y,S_q^y|x_2,S_{r_2}^{x_2}\rangle\langle x_2,S_{r_2}^{x_2}|\\
&=\frac{1}{N}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\omega^{d(p-q)}|x,S_p^x\rangle\langle x,S_q^x|.\\
\end{aligned}
E d = G − 1 / 2 ρ d ⊗ k G − 1 / 2 = N 1 x 1 , x 2 , y ∈ Z N k ∑ r 1 , r 2 ∈ Z N ∑ p , q ∈ Z N ∑ η r 1 x 1 η r 2 x 2 ω d ( p − q ) η p y η q y ∣ x 1 , S r 1 x 1 ⟩ ⟨ x 1 , S r 1 x 1 ∣ y , S p y ⟩ ⟨ y , S q y ∣ x 2 , S r 2 x 2 ⟩ ⟨ x 2 , S r 2 x 2 ∣ = N 1 x ∈ Z N k ∑ p , q ∈ Z N ∑ ω d ( p − q ) ∣ x , S p x ⟩ ⟨ x , S q x ∣ .
我们可以利用之前的 Holevo–Yuen–Kennedy–Lax 定理来说明,这个测量是 optimal 的(用于区分ρ d ⊗ k \rho_d^{\otimes k} ρ d ⊗ k )。
注意到
Y = ∑ d ∈ Z N ρ d ⊗ k E d = 1 N ( 2 N ) k ∑ d ∈ Z N ∑ x , y ∈ Z N k ∑ p , q , p ′ , q ′ ∈ Z N ω d ( p − q + p ′ − q ′ ) η p x η q x ∣ x , S p x ⟩ ⟨ x , S q x ∣ y , S p ′ y ⟩ ⟨ y , S q ′ y ∣ ( q = p ′ , x = y ) = 1 N ( 2 N ) k ∑ x ∈ Z N k ∑ p , q , q ′ ∈ Z N ∑ d ∈ Z N ω d ( p − q ′ ) η p x η q x ∣ x , S p x ⟩ ⟨ x , S q ′ x ∣ ( p = q ′ ) = 1 ( 2 N ) k ∑ x ∈ Z N k ∑ p , q ∈ Z N η p x η q x ∣ x , S p x ⟩ ⟨ x , S p x ∣ . \begin{aligned}
Y&=\sum_{d\in\mathbb{Z}_N}\rho_d^{\otimes k}E_d\\
&=\frac{1}{N(2N)^k}\sum_{d\in\mathbb{Z}_N}\sum_{x,y\in\mathbb{Z}_N^k}\sum_{p,q,p',q'\in\mathbb{Z}_N}\omega^{d(p-q+p'-q')}\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S_q^x|y,S_{p'}^y\rangle\langle y,S_{q'}^y|\\
(q=p',x=y)&=\frac{1}{N(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q,q'\in\mathbb{Z}_N}\sum_{d\in\mathbb{Z}_N}\omega^{d(p-q')}\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S^x_{q'}|\\
(p=q')&=\frac{1}{(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\sqrt{\eta_p^x\eta_q^x}|x,S_p^x\rangle\langle x,S_p^x|.\\
\end{aligned}
Y ( q = p ′ , x = y ) ( p = q ′ ) = d ∈ Z N ∑ ρ d ⊗ k E d = N ( 2 N ) k 1 d ∈ Z N ∑ x , y ∈ Z N k ∑ p , q , p ′ , q ′ ∈ Z N ∑ ω d ( p − q + p ′ − q ′ ) η p x η q x ∣ x , S p x ⟩ ⟨ x , S q x ∣ y , S p ′ y ⟩ ⟨ y , S q ′ y ∣ = N ( 2 N ) k 1 x ∈ Z N k ∑ p , q , q ′ ∈ Z N ∑ d ∈ Z N ∑ ω d ( p − q ′ ) η p x η q x ∣ x , S p x ⟩ ⟨ x , S q ′ x ∣ = ( 2 N ) k 1 x ∈ Z N k ∑ p , q ∈ Z N ∑ η p x η q x ∣ x , S p x ⟩ ⟨ x , S p x ∣ .
那么很显然Y Y Y 是 Hermitian 的,并且我们重写ρ d ⊗ k \rho^{\otimes k}_d ρ d ⊗ k 为
ρ d ⊗ k = ∑ x ∈ Z N k ∣ x , ρ d x ⟩ ⟨ x , ρ d x ∣ , 其中 ∣ ρ d x ⟩ = 1 ( 2 N ) k / 2 ∑ p ∈ Z N ω d p η p x ∣ S p x ⟩ . \rho_d^{\otimes k}=\sum_{x\in\mathbb{Z}_N^k}|x,\rho_d^x\rangle\langle x, \rho_d^x|,\qquad \text{其中 }|\rho_d^x\rangle=\frac{1}{(2N)^{k/2}}\sum_{p\in\mathbb{Z}_N}\omega^{dp}\sqrt{\eta_p^x}|S_p^x\rangle.
ρ d ⊗ k = x ∈ Z N k ∑ ∣ x , ρ d x ⟩ ⟨ x , ρ d x ∣ , 其中 ∣ ρ d x ⟩ = ( 2 N ) k / 2 1 p ∈ Z N ∑ ω d p η p x ∣ S p x ⟩ .
换句话说,ρ d ⊗ k \rho_d^{\otimes k} ρ d ⊗ k 是分块对角的,每个对角元素是一个 rank 1 的矩阵。
那么可以验证
⟨ x , ρ d x ∣ Y ∣ x , ρ d x ⟩ = 1 ( 2 N ) k ∑ p , q ∈ Z N η p x η p x η q x ≥ 1 ( 2 N ) k ∑ q ∈ Z N η p x = ⟨ x , ρ d x ∣ ρ d ⊗ k ∣ x , ρ d x ⟩ . \langle x,\rho_d^x|Y|x,\rho_d^x\rangle=\frac{1}{(2N)^k}\sum_{p,q\in\mathbb{Z}_N}\eta_p^x\sqrt{\eta_p^x\eta_q^x}\geq \frac{1}{(2N)^k}\sum_{q\in\mathbb{Z}_N}\eta_p^x=\langle x,\rho_d^x|\rho_d^{\otimes k}|x,\rho_d^x\rangle.
⟨ x , ρ d x ∣ Y ∣ x , ρ d x ⟩ = ( 2 N ) k 1 p , q ∈ Z N ∑ η p x η p x η q x ≥ ( 2 N ) k 1 q ∈ Z N ∑ η p x = ⟨ x , ρ d x ∣ ρ d ⊗ k ∣ x , ρ d x ⟩ .
也就是说,Y ≥ ρ d ⊗ k Y\geq \rho_d^{\otimes k} Y ≥ ρ d ⊗ k 。
注意到∑ d E d < I \sum_dE_d<I ∑ d E d < I 并没有张满整个空间,那么我们单独引入一个E e = I − ∑ d ∈ Z N E d E_e=I-\sum_{d\in\mathbb{Z}_N}E_d E e = I − ∑ d ∈ Z N E d 来表示得到这个测量结果时,输出 trivial hidden subgroup { ( 0 , 0 ) } \{(0,0)\} { ( 0 , 0 ) } 。
接下来我们分析成功概率。对于一个 hidden subgroup H = { ( 0 , 0 ) , ( d , 1 ) } H=\{(0,0),(d,1)\} H = { ( 0 , 0 ) , ( d , 1 ) } ,我们会发现成功概率其实和d d d 无关(这里小心点计算,类似计算Y Y Y 的第二步,实际上有p = q ′ p=q' p = q ′ 然后ω d ( p − q ′ ) = 1 \omega^{d(p-q')}=1 ω d ( p − q ′ ) = 1 ):
p = T r ( E d ρ d ⊗ k ) = 1 N ( 2 N ) k ∑ x ∈ Z N k ∑ p , q ∈ Z N η p x η q x = 1 2 k + 1 N k ∑ x ∈ Z N k ( ∑ r ∈ Z N η r x ) 2 . p=Tr(E_d\rho_d^{\otimes k})=\frac{1}{N(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\sqrt{\eta_p^x\eta_q^x}=\frac{1}{2^{k+1}N^k}\sum_{x\in\mathbb{Z}_N^k}\left (\sum_{r\in\mathbb{Z}_N}\sqrt{\eta_r^x}\right )^2.
p = T r ( E d ρ d ⊗ k ) = N ( 2 N ) k 1 x ∈ Z N k ∑ p , q ∈ Z N ∑ η p x η q x = 2 k + 1 N k 1 x ∈ Z N k ∑ ( r ∈ Z N ∑ η r x ) 2 .
令ν = k / log N \nu=k/\log N ν = k / log N ,Childs et al. 做了个结果:
Theorem 2 in (Optimal Measurements for the Dihedral Hidden Subgroup Problem)
如果ν > 1 + 4 / log N \nu>1+4/\log N ν > 1 + 4 / log N ,那么成功概率至少是1 / 8 1/8 1 / 8 。
此外,对于任意N , k N,k N , k ,成功概率都小于2 k / N 2^k/N 2 k / N 。
我们首先引入一个 lemma。其实可以注意到x ⋅ b ≡ r m o d N x\cdot b\equiv r\mod N x ⋅ b ≡ r m o d N 本质上是一个 subset-sum 问题,b ∈ Z 2 k b\in\mathbb{Z}_2^k b ∈ Z 2 k 决定了x x x 中哪些元素被选中。
Lemma 对于固定的r ∈ Z N r\in\mathbb{Z}_N r ∈ Z N 和均匀随机的x ∈ Z N k x\in\mathbb{Z}_N^k x ∈ Z N k ,有
Pr x ( η r x ≥ 2 k 2 N ) ≥ 1 − 4 ( N − 1 ) 2 k . \Pr_x\left (\eta_r^x\geq \frac{2^k}{2N}\right )\geq 1-\frac{4(N-1)}{2^k}.
x Pr ( η r x ≥ 2 N 2 k ) ≥ 1 − 2 k 4 ( N − 1 ) .
Proof : 考虑对于每个b ∈ Z 2 k b\in\mathbb{Z}_2^k b ∈ Z 2 k ,定义一个随机变量X b X_b X b 为:
X b = { 1 , if b ⋅ x = r m o d N ; 0 , otherwise . X_b=\begin{cases}
1, & \text{if }b\cdot x=r\mod N;\\
0, & \text{otherwise}.
\end{cases}
X b = { 1 , 0 , if b ⋅ x = r m o d N ; otherwise .
那么实际上有
η r x = ∑ b ∈ Z 2 k X b . \eta_r^x=\sum_{b\in\mathbb{Z}_2^k}X_b.
η r x = b ∈ Z 2 k ∑ X b .
下面我们用 Chebyshev 不等式分析一下右侧随机变量的和。
E x [ η r x ] = E x [ ∑ b ∈ Z 2 k X b ] = ∑ b ∈ Z 2 k E x [ X b ] = ∑ b ∈ Z 2 k Pr x ( b ⋅ x = r ) = 2 k N . \mathop{\mathbb{E}}_{x}[\eta_r^x]=\mathop{\mathbb{E}}_{x}\left [\sum_{ b\in\mathbb{Z}_2^k}X_b\right ]=\sum_{b\in\mathbb{Z}_2^k}\mathbb{E}_x[X_b]=\sum_{b\in\mathbb{Z}_2^k}\Pr_{x}(b\cdot x=r)=\frac{2^k}{N}.
E x [ η r x ] = E x ⎣ ⎢ ⎡ b ∈ Z 2 k ∑ X b ⎦ ⎥ ⎤ = b ∈ Z 2 k ∑ E x [ X b ] = b ∈ Z 2 k ∑ x Pr ( b ⋅ x = r ) = N 2 k .
注意,固定了b ∈ Z 2 k , r ∈ Z N b\in\mathbb{Z}_2^k,r\in\mathbb{Z}_N b ∈ Z 2 k , r ∈ Z N ,然后均匀随机选取x ∈ Z N k x\in\mathbb{Z}_N^k x ∈ Z N k 的话,b ⋅ x b\cdot x b ⋅ x 是均匀分布在Z N \mathbb{Z}_N Z N 上的。所以Pr x ( b ⋅ x = r ) = 1 / N \Pr_x(b\cdot x=r)=1/N Pr x ( b ⋅ x = r ) = 1 / N 。
令μ = E ( ∑ b X b ) σ 2 = V a r ( ∑ b X b ) \mu=\mathbb{E}(\sum_bX_b)\sigma^2=Var(\sum_bX_b) μ = E ( ∑ b X b ) σ 2 = V a r ( ∑ b X b ) ,根据 Chebyshev 不等式我们知道
Pr x ( ∑ b X b ≤ 1 2 μ ) ≤ 4 σ 2 μ 2 . \Pr_x\left ( \sum_bX_b\leq \frac{1}{2}\mu\right )\leq\frac{4\sigma^2}{\mu^2}.
x Pr ( b ∑ X b ≤ 2 1 μ ) ≤ μ 2 4 σ 2 .
接下来,我们可以证明,X b X_b X b 之间是相互独立的。不妨考虑两个不同的b , b ′ ∈ Z 2 k b,b'\in\mathbb{Z}_2^k b , b ′ ∈ Z 2 k ,其中不失一般性地b 1 = 1 , b 1 ′ = 0 b_1=1, b_1'=0 b 1 = 1 , b 1 ′ = 0 (第一位),那么有
Pr x [ X b = 1 ∧ X b ′ = 1 ] = E x 2 , . . . , x k [ Pr x 1 ( X b = 1 ∧ X b ′ = 1 ) ] = E x 2 , . . . , x k [ 1 / N ⋅ δ X b ′ , 1 ] = 1 N Pr x 2 , . . . , x k ( X b ′ = 1 ) = Pr x ( X b = 1 ) Pr x ( X b ′ = 1 ) . \begin{aligned}
\Pr_x[X_b=1\wedge X_{b'}=1]&=\mathbb{E}_{x_2,...,x_k}[\Pr_{x_1}(X_b=1\wedge X_{b'}=1)]\\
&=\mathbb{E}_{x_2,...,x_k}[1/N\cdot \delta_{X_{b'},1}]\\
&=\frac{1}{N}\Pr_{x_2,...,x_k}(X_{b'}=1)\\
&=\Pr_x(X_b=1)\Pr_x(X_{b'}=1).\\
\end{aligned}
x Pr [ X b = 1 ∧ X b ′ = 1 ] = E x 2 , . . . , x k [ x 1 Pr ( X b = 1 ∧ X b ′ = 1 ) ] = E x 2 , . . . , x k [ 1 / N ⋅ δ X b ′ , 1 ] = N 1 x 2 , . . . , x k Pr ( X b ′ = 1 ) = x Pr ( X b = 1 ) x Pr ( X b ′ = 1 ) .
其中,第二个等式是因为,X b ′ X_{b'} X b ′ 和x 1 x_1 x 1 无关,但是给定x 2 , . . . , x k x_2,...,x_k x 2 , . . . , x k 后,X b = 1 X_b=1 X b = 1 的概率是1 / N 1/N 1 / N 。
所以
σ 2 = V a r ( ∑ b X b ) = ∑ b V a r ( X b ) = 2 k N − 2 k N 2 . \sigma^2=Var\left (\sum_bX_b\right )=\sum_bVar(X_b)=\frac{2^k}{N}-\frac{2^k}{N^2}.
σ 2 = V a r ( b ∑ X b ) = b ∑ V a r ( X b ) = N 2 k − N 2 2 k .
因此,
Pr x ( η r x ≤ 2 k 2 N ) ≤ 4 ( N − 1 ) 2 k . \Pr_x\left (\eta_r^x\leq \frac{2^k}{2N}\right )\leq \frac{4(N-1)}{2^k}.
x Pr ( η r x ≤ 2 N 2 k ) ≤ 2 k 4 ( N − 1 ) .
□ \square □
接下来,我们可以证明之前的定理。
Proof : 注意到成功的概率为
p = 1 N ( 2 N ) k ∑ x ∈ Z N k ( ∑ r ∈ Z N η r x ) 2 ≥ 1 2 k N ( 1 N k ∑ x ∈ Z N k ∑ r ∈ Z N η r x ) 2 , p=\frac{1}{N(2N)^k}\sum_{x\in\mathbb{Z}_N^k}\left (\sum_{r\in\mathbb{Z}_N}\sqrt{\eta_r^x}\right )^2\geq\frac{1}{2^kN}\left (\frac{1}{N^k}\sum_{x\in\mathbb{Z}_N^k}\sum_{r\in\mathbb{Z}_N}\sqrt{\eta_r^x}\right )^2,
p = N ( 2 N ) k 1 x ∈ Z N k ∑ ( r ∈ Z N ∑ η r x ) 2 ≥ 2 k N 1 ⎝ ⎛ N k 1 x ∈ Z N k ∑ r ∈ Z N ∑ η r x ⎠ ⎞ 2 ,
此外,根据之前的 lemma,
1 N k ∑ x ∈ Z N k η r x ≥ 2 k 2 N Pr x ( η r x ≥ 2 k 2 N ) ≥ 2 k 2 N − 16 ( N − 1 ) 2 2 k N . \frac{1}{N^k}\sum_{x\in\mathbb{Z}_N^k}\sqrt{\eta_r^x}\geq \sqrt{\frac{2^k}{2N}}\Pr_x\left (\eta_r^x\geq \frac{2^k}{2N}\right )\geq \sqrt{\frac{2^k}{2N}}-\sqrt{\frac{16(N-1)^2}{2^kN}}.
N k 1 x ∈ Z N k ∑ η r x ≥ 2 N 2 k x Pr ( η r x ≥ 2 N 2 k ) ≥ 2 N 2 k − 2 k N 1 6 ( N − 1 ) 2 .
因此,注意到k > log N + 4 k>\log N+4 k > log N + 4 ,
p ≥ N 2 k ( 2 k 2 N − 16 ( N − 1 ) 2 2 k N ) 2 ≥ N 2 k ( 2 k 2 N − 2 8 ( N − 1 ) 2 N 2 ) ≥ 1 2 − 2 8 ⋅ N 2 k ≥ 1 2 − 2 4 > 1 8 . \begin{aligned}
p&\geq \frac{N}{2^k}\left (\sqrt{\frac{2^k}{2N}}-\sqrt{\frac{16(N-1)^2}{2^kN}}\right )^2\\
&\geq \frac{N}{2^k}\left (\frac{2^k}{2N}-2\sqrt{\frac{8(N-1)^2}{N^2}}\right )\\
&\geq \frac{1}{2}-2\sqrt{8}\cdot \frac{N}{2^k}\\
&\geq \frac{1}{2}-\frac{\sqrt{2}}{4}>\frac{1}{8}.\\
\end{aligned}
p ≥ 2 k N ( 2 N 2 k − 2 k N 1 6 ( N − 1 ) 2 ) 2 ≥ 2 k N ( 2 N 2 k − 2 N 2 8 ( N − 1 ) 2 ) ≥ 2 1 − 2 8 ⋅ 2 k N ≥ 2 1 − 4 2 > 8 1 .
对于上届,我们有
p ≤ 1 2 k N k + 1 ∑ x ∈ Z N k ( ∑ r ∈ Z N η r x ) 2 = 2 k N . p\leq \frac{1}{2^kN^{k+1}}\sum_{x\in\mathbb{Z}_N^k}\left (\sum_{r\in\mathbb{Z}_N}\eta_r^x\right )^2=\frac{2^k}{N}.
p ≤ 2 k N k + 1 1 x ∈ Z N k ∑ ( r ∈ Z N ∑ η r x ) 2 = N 2 k .
□ \square □
# PGM 的实现
还是接上文讨论。我们考虑,如何实现 PGM 测量。
换句话说,我们希望有一个酉变换U U U ,使得对于一个状态ρ \rho ρ ,我们执行 POVM 测量{ E d : d ∈ Z N } \{E_d:d\in\mathbb{Z}_N\} { E d : d ∈ Z N } 等价于在状态U ρ U † U\rho U^\dagger U ρ U † 下进行 computational basis 的测量(PVM)。
我们考虑之前的 POVM 表达式,交换一下第一第二寄存器,
E d = 1 N ∑ x ∈ Z N k ∑ p , q ∈ Z N ω d ( p − q ) ∣ x , S p x ⟩ ⟨ x , S q x ∣ = ∑ x ∈ Z N k E d x ⊗ ∣ x ⟩ ⟨ x ∣ , E_d=\frac{1}{N}\sum_{x\in\mathbb{Z}_N^k}\sum_{p,q\in\mathbb{Z}_N}\omega^{d(p-q)}|x,S_p^x\rangle\langle x,S_q^x|=\sum_{x\in\mathbb{Z}_N^k}E_d^x\otimes |x\rangle\langle x|,
E d = N 1 x ∈ Z N k ∑ p , q ∈ Z N ∑ ω d ( p − q ) ∣ x , S p x ⟩ ⟨ x , S q x ∣ = x ∈ Z N k ∑ E d x ⊗ ∣ x ⟩ ⟨ x ∣ ,
其中
E d x = 1 N ∑ p , q ∈ Z N ω d ( p − q ) ∣ S p x ⟩ ⟨ S q x ∣ . E_d^x=\frac{1}{N}\sum_{p,q\in\mathbb{Z}_N}\omega^{d(p-q)}|S_p^x\rangle\langle S_q^x|.
E d x = N 1 p , q ∈ Z N ∑ ω d ( p − q ) ∣ S p x ⟩ ⟨ S q x ∣ .
那么,直接进行 POVM { E d : d ∈ Z N } \{E_d:d\in\mathbb{Z}_N\} { E d : d ∈ Z N } 得到d d d 的概率,就等价于先测量第二寄存器x x x ,然后基于x x x 测量第一寄存器E d x E_d^x E d x 得到d d d 。直觉上:
p ( d ) = ∑ x p ( d ∣ x ) p ( x ) . p(d)=\sum_x p(d\mid x)p(x).
p ( d ) = x ∑ p ( d ∣ x ) p ( x ) .
形式化地,
T r ( E d ρ ) = ∑ x ∈ Z N k T r ( E d x ⋅ ⟨ x ∣ ρ ∣ x ⟩ T r ( ⟨ x ∣ ρ ∣ x ⟩ ) ) T r ( ⟨ x ∣ ρ ∣ x ⟩ ) , Tr(E_d\rho)=\sum_{x\in\mathbb{Z}_N^k}Tr\left (E_d^x\cdot \frac{\langle x|\rho|x\rangle}{Tr(\langle x|\rho|x\rangle)}\right )Tr(\langle x|\rho|x\rangle),
T r ( E d ρ ) = x ∈ Z N k ∑ T r ( E d x ⋅ T r ( ⟨ x ∣ ρ ∣ x ⟩ ) ⟨ x ∣ ρ ∣ x ⟩ ) T r ( ⟨ x ∣ ρ ∣ x ⟩ ) ,
其中,⟨ x ∣ ρ ∣ x ⟩ T r ( ⟨ x ∣ ρ ∣ x ⟩ ) \frac{\langle x|\rho|x\rangle}{Tr(\langle x|\rho|x\rangle)} T r ( ⟨ x ∣ ρ ∣ x ⟩ ) ⟨ x ∣ ρ ∣ x ⟩ 是测量第二寄存器后,得到x x x 时第一寄存器坍塌进入的状态。
下面问题是,给定x ∈ Z N k x\in\mathbb{Z}_N^k x ∈ Z N k ,我们需要实现测量{ E d x : d ∈ Z N } \{E_d^x:d\in\mathbb{Z}_N\} { E d x : d ∈ Z N } 。
根据 Neumark 定理,我们总是可以通过扩大空间,使得 POVM 被转化成更大空间上的一个 PVM。具体地,可以构造一个 block-encoding unitary operator
U x = ( V x A x B x C x ) U^x=\begin{pmatrix}
V^x & A^x\\
B^x & C^x
\end{pmatrix}
U x = ( V x B x A x C x )
其中V x = 1 N ∑ j , q ∈ Z N ω − j q ∣ j ⟩ ⟨ S q x ∣ V^x=\frac{1}{\sqrt{N}}\sum_{j,q\in\mathbb{Z}_N}\omega^{-jq}|j\rangle\langle S_q^x| V x = N 1 ∑ j , q ∈ Z N ω − j q ∣ j ⟩ ⟨ S q x ∣ ,其他A x , B x , C x A^x,B^x,C^x A x , B x , C x 是为了保证 unitary。
这样对一个状态ρ \rho ρ 进行{ E d x : d ∈ Z N } \{E_d^x:d\in\mathbb{Z}_N\} { E d x : d ∈ Z N } 的 POVM 测量就等价于,对U x ( ∣ 0 ⟩ ⟨ 0 ∣ ⊗ ρ ) ( U x ) † U^x(|0\rangle\langle 0|\otimes \rho)(U^x)^\dagger U x ( ∣ 0 ⟩ ⟨ 0 ∣ ⊗ ρ ) ( U x ) † 进行{ ∣ 0 ⟩ ⟨ 0 ∣ ⊗ ∣ j ⟩ ⟨ j ∣ : j ∈ Z N } \{|0\rangle\langle 0|\otimes |j\rangle\langle j|:j\in \mathbb{Z}_N\} { ∣ 0 ⟩ ⟨ 0 ∣ ⊗ ∣ j ⟩ ⟨ j ∣ : j ∈ Z N } 的测量。
这是因为:
⟨ j ∣ V x ρ ( V x ) † ∣ j ⟩ = T r ( E j x ρ ) . \langle j|V^x\rho (V^x)^\dagger |j\rangle=Tr(E_j^x\rho).
⟨ j ∣ V x ρ ( V x ) † ∣ j ⟩ = T r ( E j x ρ ) .
所以我们要想办法实现U x U^x U x 。进一步地,我们尝试实现F U x FU^x F U x ,其中F F F 是空心 controlled QFT 算子。即
F U x = F ( ∣ 0 ⟩ ⟨ 0 ∣ ⊗ V x + ∣ 0 ⟩ ⟨ 1 ∣ ⊗ A x + ∣ 1 ⟩ ⟨ 0 ∣ ⊗ B x + ∣ 1 ⟩ ⟨ 1 ∣ ⊗ C x ) = ∣ 0 ⟩ ⟨ 0 ∣ ⊗ V ~ x + ∣ 0 ⟩ ⟨ 1 ∣ ⊗ A ~ x + ∣ 1 ⟩ ⟨ 0 ∣ ⊗ B x + ∣ 1 ⟩ ⟨ 1 ∣ ⊗ C x , \begin{aligned}
FU^x&=F(|0\rangle\langle 0|\otimes V^x+|0\rangle\langle 1|\otimes A^x+|1\rangle\langle 0|\otimes B^x+|1\rangle\langle 1|\otimes C^x)\\
&=|0\rangle\langle 0|\otimes \tilde{V}^x+|0\rangle\langle 1|\otimes \tilde{A}^x+|1\rangle\langle 0|\otimes B^x+|1\rangle\langle 1|\otimes C^x,
\end{aligned}
F U x = F ( ∣ 0 ⟩ ⟨ 0 ∣ ⊗ V x + ∣ 0 ⟩ ⟨ 1 ∣ ⊗ A x + ∣ 1 ⟩ ⟨ 0 ∣ ⊗ B x + ∣ 1 ⟩ ⟨ 1 ∣ ⊗ C x ) = ∣ 0 ⟩ ⟨ 0 ∣ ⊗ V ~ x + ∣ 0 ⟩ ⟨ 1 ∣ ⊗ A ~ x + ∣ 1 ⟩ ⟨ 0 ∣ ⊗ B x + ∣ 1 ⟩ ⟨ 1 ∣ ⊗ C x ,
其中
V ~ x = 1 N ∑ j , p , q ∈ Z N ω j ( p − q ) ∣ p ⟩ ⟨ S q x ∣ = ∑ p ∈ Z N ∣ p ⟩ ⟨ S p x ∣ . \tilde{V}^x=\frac{1}{N}\sum_{j,p,q\in\mathbb{Z}_N}\omega^{j(p-q)}|p\rangle\langle S_q^x|=\sum_{p\in\mathbb{Z}_N}|p\rangle\langle S_p^x|.
V ~ x = N 1 j , p , q ∈ Z N ∑ ω j ( p − q ) ∣ p ⟩ ⟨ S q x ∣ = p ∈ Z N ∑ ∣ p ⟩ ⟨ S p x ∣ .
所以如果我们能实现 unitary transformation
∣ p , x ⟩ ↦ { ∣ S p x , x ⟩ , if S p x ≠ ∅ ; ∣ ψ p x ⟩ , otherwise , |p,x\rangle\mapsto\begin{cases}
|S_p^x,x\rangle, & \text{if }S_p^x\neq \emptyset;\\
|\psi_p^x\rangle, & \text{otherwise},
\end{cases}
∣ p , x ⟩ ↦ { ∣ S p x , x ⟩ , ∣ ψ p x ⟩ , if S p x = ∅ ; otherwise ,
其中∣ ψ p x ⟩ |\psi_p^x\rangle ∣ ψ p x ⟩ 可以是任意一个状态满足 unitary 的限制,那么我们就可以实现F U x FU^x F U x 。
注意,这里我觉得要求变强了。本来可以测量到x x x 后,根据x x x hard-code 一个线路,但是这边却要求了一个 coherent 的实现。
如果对于任意的x x x 我们都可以高效实现F U x FU^x F U x ,那么 subset sum problem 就量子可解了。
因为对于( x , t ) ∈ Z N k × Z N (x,t)\in\mathbb{Z}_N^k\times \mathbb{Z}_N ( x , t ) ∈ Z N k × Z N ,我们想求解一个b ∈ Z 2 k b\in\mathbb{Z}_2^k b ∈ Z 2 k 使得x ⋅ b ≡ t m o d N x\cdot b\equiv t\mod N x ⋅ b ≡ t m o d N 时,只需要作用( F U x ) † (FU^x)^\dagger ( F U x ) † 得到
( F U † ) ( ∣ 0 ⟩ ⟨ 0 ∣ ⊗ ∣ t ⟩ ⟨ t ∣ ) ( F U x ) = ∣ 0 ⟩ ⟨ 0 ∣ ⊗ ∣ S t x ⟩ ⟨ S t x ∣ + . . . (FU^\dagger)(|0\rangle\langle 0|\otimes |t\rangle\langle t|)(FU^x)=|0\rangle\langle 0|\otimes |S_t^x\rangle\langle S_t^x|+...
( F U † ) ( ∣ 0 ⟩ ⟨ 0 ∣ ⊗ ∣ t ⟩ ⟨ t ∣ ) ( F U x ) = ∣ 0 ⟩ ⟨ 0 ∣ ⊗ ∣ S t x ⟩ ⟨ S t x ∣ + . . .
那么就可以得到一个满足条件b b b 的均匀叠加态。
总之,PGM 的高效实现几乎等价于 subset sum problem 的高效量子算法。
着应该并不简单,但是好的是我们只需要考虑ν = k / log N > 1 \nu=k/\log N>1 ν = k / log N > 1 的情况,这里ν \nu ν 会被称为 density
在 subset sum problem 的研究中,ν ∼ 1 \nu\sim 1 ν ∼ 1 是个非常重要的分界线。对于足够大或足够小的ν \nu ν ,subset sum problem 会更 tractable 一些。
譬如当ν < 0.941 \nu<0.941 ν < 0 . 9 4 1 时,可以规约到 SVP 问题上,然而 SVP 也很困难。当ν \nu ν 特别小时,k < c log N k<c\sqrt{\log N} k < c log N 对于某个常数c c c ,那么 subset sum problem 是可以多项式时间求解的。
对于很大的ν \nu ν 时,k > c N k>cN k > c N 的情况时 subset sum problem 也是可以求解的,但这时对于量子算法并不高效(指数级别了)。其次就只有一些 sub exponential 的算法了(譬如 Kuperberg)。
原文还有一个 comment,就是虽然直接 measure x x x 是一个自然的办法,但不一定是唯一的做法。有可能可以不通过 measure x x x ,然后就不用求解 subset sum problem 来实现这个 measurement。