吾生而有涯而学而无涯 以有涯而逐无涯 殆矣!
# 量子力学引论
# 线性代数基础
# 记号
# 线性算子与矩阵
定义在空间 V 到空间 W 上的线性算子 为对任一输入是线性的函数A : V → W A:V\rightarrow W A : V → W 满足:
A ( ∑ i a i ∣ ψ ⟩ ) = ∑ i a i ( A ∣ ψ ⟩ ) A(\sum_ia_i|\psi\rang)=\sum_ia_i(A|\psi\rang)
A ( i ∑ a i ∣ ψ ⟩ ) = i ∑ a i ( A ∣ ψ ⟩ )
称 A 为线性算子。
线性算子常用矩阵来表示。考虑线性算子A : V → W A:V\rightarrow W A : V → W
设∣ v 1 ⟩ , . . . , ∣ v n ⟩ |v_1\rang,...,|v_n\rang ∣ v 1 ⟩ , . . . , ∣ v n ⟩ 是空间V V V 的一组基,∣ w 1 ⟩ , . . . , ∣ w m ⟩ |w_1\rang,...,|w_m\rang ∣ w 1 ⟩ , . . . , ∣ w m ⟩ 是空间W W W 的一组基,若:
A ∣ v j ⟩ ≡ ∑ i A i j ∣ w i ⟩ A|v_j\rang\equiv\sum_iA_{ij}|w_i\rang
A ∣ v j ⟩ ≡ i ∑ A i j ∣ w i ⟩
则A i j A_{ij} A i j 为 A 的一个矩阵表示。
上式的意义为,把 A 作用于 V 中的每个基向量(此时 A 是抽象的算子而非矩阵),一定会得到 W 中的一个向量。而这个向量可以用 W 的基表示。将每个 V 中的基向量对应的 W 中的坐标放在一起,就可以精确地 描述这个算子实际上进行了怎样的运算。
# Pauli 阵
I = ( 1 0 0 1 ) , X = ( 0 1 1 0 ) Y = ( 0 − i i 0 ) , Z = ( 1 0 0 − 1 ) I=\begin{pmatrix}1&0\\0&1\end{pmatrix},X=\begin{pmatrix}0&1\\1&0\end{pmatrix}\\
Y=\begin{pmatrix}0&-i\\i&0\end{pmatrix},Z=\begin{pmatrix}1&0\\0&-1\end{pmatrix}
I = ( 1 0 0 1 ) , X = ( 0 1 1 0 ) Y = ( 0 i − i 0 ) , Z = ( 1 0 0 − 1 )
# 内积
内积定义为V × V → C V\times V\rightarrow C V × V → C 的函数,满足对任意∣ v ⟩ , ∣ w ⟩ ∈ V |v\rang,|w\rang\in V ∣ v ⟩ , ∣ w ⟩ ∈ V :
( ∣ v ⟩ , ∑ i λ i ∣ w i ⟩ ) = ∑ i λ i ( ∣ v ⟩ , ∣ w i ⟩ ) (|v\rang,\sum_i\lambda_i|w_i\rang)=\sum_i\lambda_i(|v\rang,|w_i\rang)
( ∣ v ⟩ , i ∑ λ i ∣ w i ⟩ ) = i ∑ λ i ( ∣ v ⟩ , ∣ w i ⟩ )
( ∣ v ⟩ , ∣ w ⟩ ) = ( ∣ w ⟩ , ∣ v ⟩ ) ∗ (|v\rang,|w\rang)=(|w\rang,|v\rang)^*
( ∣ v ⟩ , ∣ w ⟩ ) = ( ∣ w ⟩ , ∣ v ⟩ ) ∗
( ∣ v ⟩ , ∣ v ⟩ ) ≥ 0 , ( ∣ v ⟩ , ∣ v ⟩ ) = 0 i f f ∣ v ⟩ = 0 (|v\rang,|v\rang)\geq 0,(|v\rang,|v\rang)=0\quad iff|v\rang=0
( ∣ v ⟩ , ∣ v ⟩ ) ≥ 0 , ( ∣ v ⟩ , ∣ v ⟩ ) = 0 i f f ∣ v ⟩ = 0
( ∑ i λ i ∣ v i ⟩ , ∣ w ⟩ ) = ∑ i λ i ∗ ( ∣ v i ⟩ , ∣ w ⟩ ) (\sum_i\lambda_i|v_i\rang,|w\rang)=\sum_i\lambda_i^*(|v_i\rang,|w\rang)
( i ∑ λ i ∣ v i ⟩ , ∣ w ⟩ ) = i ∑ λ i ∗ ( ∣ v i ⟩ , ∣ w ⟩ )
范束定义为|||v\rang||=\sqrt{\lang v|v\rang},\lang i|j\rang=\delta_
Schmidt 正交化
∣ v 1 ⟩ = ∣ w 1 ⟩ ∣ v k + 1 ⟩ = ∣ w k + 1 ⟩ − ∑ i = 1 k ⟨ v i ∣ w k + 1 ⟩ ∣ v i ⟩ ∣ ∣ ∣ w k + 1 ⟩ − ∑ i = 1 k ⟨ v i ∣ w k + 1 ⟩ ∣ v i ⟩ ∣ ∣ |v_1\rang=|w_1\rang\\
|v_{k+1}\rang=\frac{|w_{k+1}\rang-\sum_{i=1}^k\lang v_i|w_{k+1}\rang|v_i\rang}{|||w_{k+1}\rang-\sum_{i=1}^k\lang v_i|w_{k+1}\rang|v_i\rang||}
∣ v 1 ⟩ = ∣ w 1 ⟩ ∣ v k + 1 ⟩ = ∣ ∣ ∣ w k + 1 ⟩ − ∑ i = 1 k ⟨ v i ∣ w k + 1 ⟩ ∣ v i ⟩ ∣ ∣ ∣ w k + 1 ⟩ − ∑ i = 1 k ⟨ v i ∣ w k + 1 ⟩ ∣ v i ⟩
# 外积
对∣ v ⟩ ∈ V , ∣ w ⟩ ∈ W , |v\rang\in V,|w\rang\in W, ∣ v ⟩ ∈ V , ∣ w ⟩ ∈ W , 外积∣ w ⟩ ⟨ v ∣ |w\rang\lang v| ∣ w ⟩ ⟨ v ∣ 定义为V → W V\rightarrow W V → W 的算子,满足:
( ∣ w ⟩ ⟨ v ∣ ) ∣ v ′ ⟩ = ⟨ v ∣ v ′ ⟩ ∣ w ⟩ (|w\rang\lang v|)|v'\rang=\lang v|v'\rang|w\rang
( ∣ w ⟩ ⟨ v ∣ ) ∣ v ′ ⟩ = ⟨ v ∣ v ′ ⟩ ∣ w ⟩
令∣ v i ⟩ |v_i\rang ∣ v i ⟩ 为空间V V V 的一组标准正交基,有:
∀ ∣ v ⟩ ∈ V , ∑ i ( ∣ v i ⟩ ⟨ v i ∣ ) ∣ v ⟩ = ∑ i ⟨ v i ∣ v ⟩ ∣ v i ⟩ = ∣ v ⟩ ( ∣ v ⟩ 在 ∣ i ⟩ 上的投影为 ⟨ v i ∣ v ⟩ ) \forall |v\rang\in V,\sum_i(|v_i\rang\lang v_i|)|v\rang=\sum_i\lang v_i|v\rang|v_i\rang=|v\rang(|v\rang在|i\rang上的投影为\lang v_i|v\rang)
∀ ∣ v ⟩ ∈ V , i ∑ ( ∣ v i ⟩ ⟨ v i ∣ ) ∣ v ⟩ = i ∑ ⟨ v i ∣ v ⟩ ∣ v i ⟩ = ∣ v ⟩ ( ∣ v ⟩ 在 ∣ i ⟩ 上 的 投 影 为 ⟨ v i ∣ v ⟩ )
所以,∑ i ∣ i ⟩ ⟨ i ∣ = I \sum_i|i\rang\lang i|=I ∑ i ∣ i ⟩ ⟨ i ∣ = I
对任意一个V → W V\rightarrow W V → W 的算子 A,它都可以表示成外积关系。
A = I W A I V = ∑ i , j ∣ w j ⟩ ⟨ w j ∣ A ∣ v i ⟩ ⟨ v i ∣ = ∑ i , j ⟨ w j ∣ A ∣ v i ⟩ ∣ w j ⟩ ⟨ v i ∣ A=I_WAI_V=\sum_{i,j}|w_j\rang\lang w_j|A|v_i\rang\lang v_i|\\
=\sum_{i,j}\lang w_j|A|v_i\rang|w_j\rang\lang v_i|
A = I W A I V = i , j ∑ ∣ w j ⟩ ⟨ w j ∣ A ∣ v i ⟩ ⟨ v i ∣ = i , j ∑ ⟨ w j ∣ A ∣ v i ⟩ ∣ w j ⟩ ⟨ v i ∣
所以对于输入基∣ v i ⟩ |v_i\rang ∣ v i ⟩ 和输出基∣ w i ⟩ |w_i\rang ∣ w i ⟩ ,A 的矩阵表示中A j i = ⟨ w j ∣ A ∣ v i ⟩ A_{ji}=\lang w_j|A|v_i\rang A j i = ⟨ w j ∣ A ∣ v i ⟩
Cauchy-Schwarz 不等式
∣ ⟨ v ∣ w ⟩ ∣ 2 ≤ ⟨ v ∣ v ⟩ ⟨ w ∣ w ⟩ |\lang v|w\rang|^2\leq\lang v|v\rang\lang w|w\rang
∣ ⟨ v ∣ w ⟩ ∣ 2 ≤ ⟨ v ∣ v ⟩ ⟨ w ∣ w ⟩
# 特征值与特征向量
若矩阵 A 是酉相似与对角阵,则它是酉可对角化的。即:若 A = U − 1 d i a g { λ 1 , . . . , λ n } U , 其中, U ⊺ U = U ⊺ U = I , 则 A = ∑ i λ i ∣ λ = i ⟩ ⟨ λ = i ∣ 若A=U^{-1}diag\{\lambda_1,...,\lambda_n\}U,其中,U^\intercal U=U^\intercal U=I,则A=\sum_i\lambda_i|\lambda=i\rang\lang\lambda=i|
若 A = U − 1 d i a g { λ 1 , . . . , λ n } U , 其 中 , U ⊺ U = U ⊺ U = I , 则 A = i ∑ λ i ∣ λ = i ⟩ ⟨ λ = i ∣
# Hermite 算子与伴随
设 A 是空间V V V 上的线性算子,则存在且只存在一个空间V V V 上的算子A ⊺ A^\intercal A ⊺ 使得:
∀ ∣ v ⟩ , ∣ w ⟩ ∈ V , ( ∣ v ⟩ , A ∣ w ⟩ ) = ( A ⊺ ∣ v ⟩ , ∣ w ⟩ ) \forall |v\rang,|w\rang\in V,(|v\rang,A|w\rang)=(A^\intercal|v\rang,|w\rang)
∀ ∣ v ⟩ , ∣ w ⟩ ∈ V , ( ∣ v ⟩ , A ∣ w ⟩ ) = ( A ⊺ ∣ v ⟩ , ∣ w ⟩ )
( A B ) ⊺ = B ⊺ A ⊺ , ( ∣ v ⟩ ) ⊺ = ⟨ v ∣ A ⊺ = ( A ∗ ) T (AB)^\intercal = B^\intercal A^\intercal,(|v\rang)^\intercal=\lang v|\\
A^\intercal = (A^*)^T
( A B ) ⊺ = B ⊺ A ⊺ , ( ∣ v ⟩ ) ⊺ = ⟨ v ∣ A ⊺ = ( A ∗ ) T
设W W W 是 d 维空间V V V 的 k 维子空间,且∣ v 1 ⟩ , . . . , ∣ v k ⟩ |v_1\rang,...,|v_k\rang ∣ v 1 ⟩ , . . . , ∣ v k ⟩ 为W W W 的一组标准正交基,定义:
P ≡ ∑ i = 1 k ∣ v k ⟩ ⟨ v k ∣ P\equiv\sum_{i=1}^k|v_k\rang\lang v_k|
P ≡ i = 1 ∑ k ∣ v k ⟩ ⟨ v k ∣
则 P 是 Hermite 的,即P ⊺ = P P^\intercal = P P ⊺ = P 。我们称 P 为 “到空间 W 上的投影算子 ”,它的意义是,对于任意一个 V 中的向量∣ v ⟩ |v\rang ∣ v ⟩ ,P ∣ v ⟩ = ∑ i = 1 k ⟨ v k ∣ v ⟩ ∣ v k ⟩ P|v\rang=\sum_{i=1}^k\lang v_k|v\rang|v_k\rang P ∣ v ⟩ = ∑ i = 1 k ⟨ v k ∣ v ⟩ ∣ v k ⟩ ,其实就把∣ v ⟩ |v\rang ∣ v ⟩ 分解到 W 的基上,从而去除和 W 正交的分量。(和数学中定义幂等算子为投影算子不等价!)
P 的正交补算子Q ≡ I − P Q\equiv I-P Q ≡ I − P 就是把向量投影到补空间上。显然( P + Q ) ∣ v ⟩ = ∣ v ⟩ (P+Q)|v\rang=|v\rang ( P + Q ) ∣ v ⟩ = ∣ v ⟩
投影算子满足P 2 = P P^2=P P 2 = P ,但反之不成立!
矩阵 A 是正规 的当且仅当A ⊺ A = A A ⊺ A^\intercal A=AA^\intercal A ⊺ A = A A ⊺ 。矩阵 A 可酉对角化(酉相似于对角阵,可对角化)当且仅当 A 是正规矩阵。(谱分解定理)
正规矩阵是 Hermite 的当且仅当它的特征值全为实数。
矩阵 A 是酉 的当且仅当A ⊺ A = I A^\intercal A=I A ⊺ A = I
酉矩阵保持内积( U ∣ v ⟩ , U ∣ w ⟩ ) = ( U ∣ v ⟩ ) ⊺ ( U ∣ w ⟩ ) = ⟨ v ∣ U ⊺ U ∣ w ⟩ = ⟨ v ∣ w ⟩ (U|v\rang,U|w\rang)=(U|v\rang)^\intercal(U|w\rang)=\lang v|U^\intercal U|w\rang=\lang v|w\rang ( U ∣ v ⟩ , U ∣ w ⟩ ) = ( U ∣ v ⟩ ) ⊺ ( U ∣ w ⟩ ) = ⟨ v ∣ U ⊺ U ∣ w ⟩ = ⟨ v ∣ w ⟩
因此,酉算子有很好的性质:
若∣ v i ⟩ |v_i\rang ∣ v i ⟩ 为一组标准正交基,则定义∣ w i ⟩ ≡ U ∣ v i ⟩ |w_i\rang\equiv U|v_i\rang ∣ w i ⟩ ≡ U ∣ v i ⟩ 也为一组标准正交基,且U = ∑ ∣ w i ⟩ ⟨ v i ∣ U=\sum|w_i\rang\lang v_i| U = ∑ ∣ w i ⟩ ⟨ v i ∣
反之,若∣ w i ⟩ , ∣ v i ⟩ |w_i\rang,|v_i\rang ∣ w i ⟩ , ∣ v i ⟩ 都为标准正交基,则∑ ∣ w i ⟩ ⟨ v i ∣ \sum|w_i\rang\lang v_i| ∑ ∣ w i ⟩ ⟨ v i ∣ 是酉的。
酉矩阵所有特征值模均为一。即λ ≡ e i θ \lambda\equiv e^{i\theta} λ ≡ e i θ ,Pauli 矩阵都是 Hermite 和酉的。
正定和半正定算子,即考量⟨ v ∣ A ∣ v ⟩ \lang v|A|v\rang ⟨ v ∣ A ∣ v ⟩ 是否恒大于(大于等于)零。
# 张量积
设∣ i ⟩ |i\rang ∣ i ⟩ 为V V V 的一组标准正交基,∣ j ⟩ |j\rang ∣ j ⟩ 为W W W 的一组标准正交基,则∣ i ⟩ ⊗ ∣ j ⟩ |i\rang\otimes|j\rang ∣ i ⟩ ⊗ ∣ j ⟩ 为空间V ⊗ W V\otimes W V ⊗ W (nm 维) 的一组标准正交基。
张量积满足:
z ( ∣ v ⟩ ⊗ ∣ w ⟩ ) = z ∣ v ⟩ ⊗ z ∣ w ⟩ z(|v\rang\otimes|w\rang)=z|v\rang\otimes z|w\rang
z ( ∣ v ⟩ ⊗ ∣ w ⟩ ) = z ∣ v ⟩ ⊗ z ∣ w ⟩
( ∣ v ⟩ + ∣ w ⟩ ) ⊗ ∣ u ⟩ = ∣ v ⟩ ⊗ ∣ u ⟩ + ∣ w ⟩ ⊗ ∣ u ⟩ (|v\rang+|w\rang)\otimes|u\rang=|v\rang\otimes|u\rang+|w\rang\otimes|u\rang
( ∣ v ⟩ + ∣ w ⟩ ) ⊗ ∣ u ⟩ = ∣ v ⟩ ⊗ ∣ u ⟩ + ∣ w ⟩ ⊗ ∣ u ⟩
∣ u ⟩ ⊗ ( ∣ v ⟩ + ∣ w ⟩ ) = ∣ u ⟩ ⊗ ∣ v ⟩ + ∣ u ⟩ ⊗ ∣ w ⟩ |u\rang\otimes(|v\rang+|w\rang)=|u\rang\otimes|v\rang+|u\rang\otimes|w\rang
∣ u ⟩ ⊗ ( ∣ v ⟩ + ∣ w ⟩ ) = ∣ u ⟩ ⊗ ∣ v ⟩ + ∣ u ⟩ ⊗ ∣ w ⟩
由此,可以定义定义在V ⊗ W V\otimes W V ⊗ W 上的线性算子A ⊗ B A\otimes B A ⊗ B 满足:
( A ⊗ B ) ( ∣ v ⟩ ⊗ ∣ w ⟩ ) = A ∣ v ⟩ ⊗ B ∣ w ⟩ (A\otimes B)(|v\rang\otimes|w\rang)=A|v\rang\otimes B|w\rang
( A ⊗ B ) ( ∣ v ⟩ ⊗ ∣ w ⟩ ) = A ∣ v ⟩ ⊗ B ∣ w ⟩
(有点类似同构映射保持运算的意思。)
同样,可以定义V ⊗ W V\otimes W V ⊗ W 上的自然内积 为:
( ∣ v 1 ⟩ ⊗ ∣ w 1 ⟩ , ∣ v 2 ⟩ ⊗ ∣ w 2 ⟩ ) = ⟨ v 1 ∣ v 2 ⟩ ⟨ w 1 ∣ w 2 ⟩ ( ∑ i a i ∣ v i ⟩ ⊗ ∣ w i ⟩ , ∑ j b j ∣ v j ′ ⟩ ⊗ ∣ w j ′ ⟩ ) = ∑ i , j a i ∗ b j ⟨ v i ∣ v j ′ ⟩ ⟨ w i ∣ w j ′ ⟩ (|v_1\rang\otimes|w_1\rang,|v_2\rang\otimes|w_2\rang)=\lang v_1|v_2\rang\lang w_1|w_2\rang\\
(\sum_ia_i|v_i\rang\otimes|w_i\rang,\sum_jb_j|v_j'\rang\otimes |w_j'\rang)=\sum_{i,j}a_i^*b_j\lang v_i|v_j'\rang\lang w_i|w_j'\rang
( ∣ v 1 ⟩ ⊗ ∣ w 1 ⟩ , ∣ v 2 ⟩ ⊗ ∣ w 2 ⟩ ) = ⟨ v 1 ∣ v 2 ⟩ ⟨ w 1 ∣ w 2 ⟩ ( i ∑ a i ∣ v i ⟩ ⊗ ∣ w i ⟩ , j ∑ b j ∣ v j ′ ⟩ ⊗ ∣ w j ′ ⟩ ) = i , j ∑ a i ∗ b j ⟨ v i ∣ v j ′ ⟩ ⟨ w i ∣ w j ′ ⟩
一个具体的张量积:Kronecker 积
A m × n ⊗ B p × q = ( A 11 B A 12 B . . . A 1 n B . . . . . . . . . . . . A m 1 B A m 2 . . . A m n B ) m p × n q A_{m\times n}\otimes B_{p\times q}=\begin{pmatrix}A_{11}B&A_{12}B&...&A_{1n}B\\
...&...&...&...\\A_{m1}B&A_{m2}&...&A_{mn}B\end{pmatrix}_{mp\times nq}
A m × n ⊗ B p × q = ⎝ ⎛ A 1 1 B . . . A m 1 B A 1 2 B . . . A m 2 . . . . . . . . . A 1 n B . . . A m n B ⎠ ⎞ m p × n q
张量积对一些运算是分配的:
( A ⊗ B ) ∗ = A ∗ ⊗ B ∗ , ( A ⊗ B ) T = A T ⊗ B T , ( A ⊗ B ) ⊺ = A ⊺ ⊗ B ⊺ (A\otimes B)^*=A^*\otimes B^*,(A\otimes B)^T=A^T\otimes B^T,(A\otimes B)^\intercal = A^\intercal\otimes B^\intercal
( A ⊗ B ) ∗ = A ∗ ⊗ B ∗ , ( A ⊗ B ) T = A T ⊗ B T , ( A ⊗ B ) ⊺ = A ⊺ ⊗ B ⊺
两个酉算子张量积是酉的,两个 Hermite 张量积是 Hermite 的,两个半正定算子的张量积是半正定的,两个投影算子的张量积是投影算子。
# 算子函数
算子函数定义在正规算子上。f ( A ) = f ( ∑ λ i ∣ i ⟩ ⟨ i ∣ ) = ∑ f ( λ i ) ∣ i ⟩ ⟨ i ∣ f(A)=f(\sum\lambda_i|i\rang\lang i|)=\sum f(\lambda_i)|i\rang\lang i| f ( A ) = f ( ∑ λ i ∣ i ⟩ ⟨ i ∣ ) = ∑ f ( λ i ) ∣ i ⟩ ⟨ i ∣
算子的迹定义为算子任意一个矩阵表示的对角线元素和。不难证明t r ( A B ) = t r ( B A ) , t r ( z A ) = z t r ( A ) tr(AB)=tr(BA),tr(zA)=ztr(A) t r ( A B ) = t r ( B A ) , t r ( z A ) = z t r ( A ) ,且矩阵的迹在酉相似下保持不变。故可定义为任意一个矩阵表示。
t r ( A ∣ ψ ⟩ ⟨ ψ ∣ ) = ∑ ⟨ i ∣ A ∣ ψ ⟩ ⟨ ψ ∣ i ⟩ = ⟨ ψ ∣ A ∣ ψ ⟩ , ∣ i ⟩ = ( 0 , 0 , . . . , 1 ( 第 i 个 ) , . . . , 0 ) T tr(A|\psi\rang\lang\psi|)=\sum\lang i|A|\psi\rang\lang\psi|i\rang=\lang \psi|A|\psi\rang,|i\rang=(0,0,...,1(第i个),...,0)^T
t r ( A ∣ ψ ⟩ ⟨ ψ ∣ ) = ∑ ⟨ i ∣ A ∣ ψ ⟩ ⟨ ψ ∣ i ⟩ = ⟨ ψ ∣ A ∣ ψ ⟩ , ∣ i ⟩ = ( 0 , 0 , . . . , 1 ( 第 i 个 ) , . . . , 0 ) T
# 对易式与反对易式
对易式[ A , B ] ≡ A B − B A [A,B]\equiv AB-BA [ A , B ] ≡ A B − B A ,反对易式{ A , B } = A B + B A \{A,B\}=AB+BA { A , B } = A B + B A ,若[ A , B ] = 0 [A,B]=0 [ A , B ] = 0 ,则称 A,B 为对易的。
同时对角化定理:设 A,B 是 Hermite 算子,当且仅当存在一个标准正交基,使得 A 和 B 在这个基下同时是可酉对角化的,则[ A , B ] = 0 [A,B]=0 [ A , B ] = 0 ,在这种情况下,称 A,B 可同时对角化。
可以验证 A = Q − 1 D 1 Q , B = Q − 1 D 2 Q , Q ⊺ Q = I ⇒ [ A , B ] = 0 ,下面证明反过来的命题 可以验证A=Q^{-1}D_1Q,B=Q^{-1}D_2Q,Q^\intercal Q=I\Rightarrow [A,B]=0,下面证明反过来的命题
可 以 验 证 A = Q − 1 D 1 Q , B = Q − 1 D 2 Q , Q ⊺ Q = I ⇒ [ A , B ] = 0 , 下 面 证 明 反 过 来 的 命 题
记 ∣ a j ⟩ 为本征值 a 的本征空间 V a 的一组标准正交基,有 : A B ∣ a j ⟩ = B A ∣ a j ⟩ = a B ∣ a j ⟩ 令 P a 为到 V a 的投影算子,定义 B a ≡ P a B P a , 显然 B a 的本征空间是 V a 的子空间 ( P a ( B P a ∣ v ⟩ ) = b ∣ v ⟩ ⇒ ∣ v ⟩ ∈ V a ) ,且 B a 是 H e r m i t e 的 于是 B a 在 V a 的标准正交基下可谱分解,记这些本征矢为 ∣ a b j ⟩ 显然有 P a ∣ a b j ⟩ = ∣ a b j ⟩ , B ∣ a b j ⟩ = P a B ∣ a b j ⟩ ( B ∣ a b j ⟩ 是 V a 中的元素 ) 所以有 B ∣ a b j ⟩ = P a B P a ∣ a b j ⟩ = b ∣ a b j ⟩ 所以在 ∣ a b j ⟩ 下 , A , B 可同时对角化 记|a_j\rang为本征值a的本征空间V_a的一组标准正交基,有:\\
AB|a_j\rang=BA|a_j\rang=aB|a_j\rang\\
令P_a为到V_a的投影算子,定义B_a\equiv P_aBP_a,显然B_a的本征空间是V_a 的子空间\\(P_a(BP_a|v\rang)=b|v\rang\Rightarrow |v\rang\in V_a)\\,且B_a是Hermite的\\
于是B_a在V_a的标准正交基下可谱分解,记这些本征矢为|a_{b_j}\rang\\
显然有P_a|a_{b_j}\rang=|a_{b_j}\rang,B|a_{b_j}\rang=P_aB|a_{b_j}\rang(B|a_{b_j}\rang是V_a中的元素)\\
所以有B|a_{b_j}\rang=P_aBP_a|a_{b_j}\rang=b|a_{b_j}\rang\\
所以在|a_{b_j}\rang下,A,B可同时对角化
记 ∣ a j ⟩ 为 本 征 值 a 的 本 征 空 间 V a 的 一 组 标 准 正 交 基 , 有 : A B ∣ a j ⟩ = B A ∣ a j ⟩ = a B ∣ a j ⟩ 令 P a 为 到 V a 的 投 影 算 子 , 定 义 B a ≡ P a B P a , 显 然 B a 的 本 征 空 间 是 V a 的 子 空 间 ( P a ( B P a ∣ v ⟩ ) = b ∣ v ⟩ ⇒ ∣ v ⟩ ∈ V a ) , 且 B a 是 H e r m i t e 的 于 是 B a 在 V a 的 标 准 正 交 基 下 可 谱 分 解 , 记 这 些 本 征 矢 为 ∣ a b j ⟩ 显 然 有 P a ∣ a b j ⟩ = ∣ a b j ⟩ , B ∣ a b j ⟩ = P a B ∣ a b j ⟩ ( B ∣ a b j ⟩ 是 V a 中 的 元 素 ) 所 以 有 B ∣ a b j ⟩ = P a B P a ∣ a b j ⟩ = b ∣ a b j ⟩ 所 以 在 ∣ a b j ⟩ 下 , A , B 可 同 时 对 角 化
A B = [ A , B ] + { A , B } 2 AB=\frac{[A,B]+\{A,B\}}{2}
A B = 2 [ A , B ] + { A , B }
# 极式分解和奇异值分解
极式分解:令 A 是空间 V 上的线性算子,则存在酉算子 U 和半正定算子 J,K 满足:
A = U J = K U , 其中 J ≡ A ⊺ A , K ≡ A A ⊺ 而且若 A 可逆,则 U 也唯一 A=UJ=KU,其中J\equiv\sqrt{A^\intercal A},K\equiv\sqrt{AA^\intercal}\\
而且若A可逆,则U也唯一
A = U J = K U , 其 中 J ≡ A ⊺ A , K ≡ A A ⊺ 而 且 若 A 可 逆 , 则 U 也 唯 一
证明:
J ≡ A ⊺ A 是一个半正定算子,则其也是 H e r m i t e 的,可进行谱分解 J = ∑ i λ i ∣ i ⟩ ⟨ i ∣ 定义 ∣ ψ i ⟩ ≡ A ∣ i ⟩ , 有 ⟨ ψ i ∣ ψ i ⟩ = λ i 2 考虑 λ i ≠ 0 的本征矢,定义 ∣ e i ⟩ ≡ ∣ ψ i ⟩ / λ i ,故 ∣ e i ⟩ 是单位化的 且对于 i ≠ j , ⟨ e i ∣ e j ⟩ = ⟨ i ∣ A ⊺ A ∣ j ⟩ λ i λ j = ⟨ i ∣ J 2 ∣ j ⟩ λ i λ j = λ i ∗ λ j ⟨ i ∣ j ⟩ λ i λ j = 0 所以 ∣ e i ⟩ 是标准正交的 定义酉算子 U ≡ ∑ i ∣ e i ⟩ ⟨ i ∣ , 下面证明算子 U = 算子 A ∀ ∣ i ⟩ , λ i ≠ 0 时, U J ∣ i ⟩ = λ i ∣ e i ⟩ = A ∣ i ⟩ λ i = 0 时, U J ∣ i ⟩ = 0 = A ∣ i ⟩ 所以 A = U J J\equiv \sqrt{A^\intercal A}是一个半正定算子,则其也是Hermite的,可进行谱分解J=\sum_i\lambda_i| i\rang\lang i|\\
定义|\psi_i\rang\equiv A|i\rang,有\lang\psi_i|\psi_i\rang=\lambda_i^2\\
考虑\lambda_i\neq 0的本征矢,定义|e_i\rang\equiv|\psi_i\rang/\lambda_i,故|e_i\rang是单位化的\\
且对于i\neq j,\lang e_i|e_j\rang=\frac{\lang i|A^\intercal A|j\rang}{\lambda_i\lambda_j}=\frac{\lang i|J^2|j\rang}{\lambda_i\lambda_j}=\frac{\lambda_i^*\lambda_j\lang i|j\rang}{\lambda_i\lambda_j}=0\\
所以|e_i\rang是标准正交的\\
定义酉算子U\equiv \sum_i|e_i\rang\lang i|,下面证明算子U=算子A\\
\forall |i\rang,\lambda_i\neq 0时,UJ|i\rang=\lambda_i|e_i\rang=A|i\rang\\
\lambda_i=0时,UJ|i\rang=0=A|i\rang\\
所以A=UJ
J ≡ A ⊺ A 是 一 个 半 正 定 算 子 , 则 其 也 是 H e r m i t e 的 , 可 进 行 谱 分 解 J = i ∑ λ i ∣ i ⟩ ⟨ i ∣ 定 义 ∣ ψ i ⟩ ≡ A ∣ i ⟩ , 有 ⟨ ψ i ∣ ψ i ⟩ = λ i 2 考 虑 λ i = 0 的 本 征 矢 , 定 义 ∣ e i ⟩ ≡ ∣ ψ i ⟩ / λ i , 故 ∣ e i ⟩ 是 单 位 化 的 且 对 于 i = j , ⟨ e i ∣ e j ⟩ = λ i λ j ⟨ i ∣ A ⊺ A ∣ j ⟩ = λ i λ j ⟨ i ∣ J 2 ∣ j ⟩ = λ i λ j λ i ∗ λ j ⟨ i ∣ j ⟩ = 0 所 以 ∣ e i ⟩ 是 标 准 正 交 的 定 义 酉 算 子 U ≡ i ∑ ∣ e i ⟩ ⟨ i ∣ , 下 面 证 明 算 子 U = 算 子 A ∀ ∣ i ⟩ , λ i = 0 时 , U J ∣ i ⟩ = λ i ∣ e i ⟩ = A ∣ i ⟩ λ i = 0 时 , U J ∣ i ⟩ = 0 = A ∣ i ⟩ 所 以 A = U J
下面证明 J 是唯一的 . 因为 A = U J , 所以 A ⊺ = J ⊺ U ⊺ = J U ⊺ 乘在一起, A ⊺ A = J 2 , 即 J 是固定唯一的 关于右极式分解, A = U J U ⊺ U = ( U J U ⊺ ) U = K U , K 也是半正定的。 下面证明J是唯一的.\\
因为A=UJ,所以A^\intercal = J^\intercal U^\intercal=JU^\intercal\\
乘在一起,A^\intercal A=J^2,即J是固定唯一的\\
关于右极式分解,A=UJU^\intercal U=(UJU^\intercal)U=KU,K也是半正定的。
下 面 证 明 J 是 唯 一 的 . 因 为 A = U J , 所 以 A ⊺ = J ⊺ U ⊺ = J U ⊺ 乘 在 一 起 , A ⊺ A = J 2 , 即 J 是 固 定 唯 一 的 关 于 右 极 式 分 解 , A = U J U ⊺ U = ( U J U ⊺ ) U = K U , K 也 是 半 正 定 的 。
奇异值分解:令 A 是一方阵,则必存在酉矩阵 U,V 和一个非负对角阵 D,使得:
A = U D V A=UDV
A = U D V
简单证明:
A = S J ( 极值分解 ) J = T D T ⊺ ( J = A ⊺ A 酉相似于对角阵, T 为酉矩阵 ) 所以 A = ( S T ) D ( T ⊺ ) = U D V A=SJ(极值分解)\\
J=TDT^\intercal(J=\sqrt{A^\intercal A}酉相似于对角阵,T为酉矩阵)\\
所以A=(ST)D(T^\intercal)=UDV
A = S J ( 极 值 分 解 ) J = T D T ⊺ ( J = A ⊺ A 酉 相 似 于 对 角 阵 , T 为 酉 矩 阵 ) 所 以 A = ( S T ) D ( T ⊺ ) = U D V
其中 D 的对角元素称为 A 的奇异值。
# 量子力学假设
# 假设一:状态空间
假设 1:任意一个孤立物理系统都有一个称为系统状态空间 的复内积向量空间(即 Hilbert 空间)与之联系,系统完全由状态向量所描述,这个向量是系统状态空间的一个单位向量。
例:一个量子比特的状态空间(二维)。状态空间中的任意状态向量可写作
∣ ψ ⟩ = a ∣ 0 ⟩ + b ∣ 1 ⟩ , a , b ∈ C |\psi\rang=a|0\rang+b|1\rang,a,b\in C
∣ ψ ⟩ = a ∣ 0 ⟩ + b ∣ 1 ⟩ , a , b ∈ C
而∣ a ∣ 2 + ∣ b ∣ 2 = 1 |a|^2+|b|^2=1 ∣ a ∣ 2 + ∣ b ∣ 2 = 1 常称为状态向量的归一化条件。
任意线性组合∑ i α i ∣ ψ i ⟩ \sum_i\alpha_i|\psi_i\rang ∑ i α i ∣ ψ i ⟩ 理解为状态∣ ψ i ⟩ |\psi_i\rang ∣ ψ i ⟩ 具有幅度α i \alpha_i α i 的一个叠加。
# 假设二:演化
假设 2:一个封闭量子系统的演化可以由一个酉变化来刻画。即系统在时刻t 1 t_1 t 1 的状态∣ ψ 1 ⟩ |\psi_1\rang ∣ ψ 1 ⟩ 和在t 2 t_2 t 2 的状态∣ ψ 2 ⟩ |\psi_2\rang ∣ ψ 2 ⟩ 可以通过一个仅依赖时间t 1 , t 2 t_1,t_2 t 1 , t 2 的酉算子来联系:
∣ ψ 2 ⟩ = U ( t 1 , t 2 ) ∣ ψ 1 ⟩ , w h e r e U ⊺ U = U U ⊺ = I |\psi_2\rang=U(t_1,t_2)|\psi_1\rang,where\quad U^\intercal U=UU^\intercal =I
∣ ψ 2 ⟩ = U ( t 1 , t 2 ) ∣ ψ 1 ⟩ , w h e r e U ⊺ U = U U ⊺ = I
Pauli 矩阵中 X 被称为比特翻转(bit flip)矩阵,Z 被称为相位翻转(phase flip)矩阵。
假设 2‘:封闭量子系统的演化由薛定谔方程描述:
i ℏ d ∣ ψ ⟩ d t = H ∣ ψ ⟩ i\hbar\frac{d|\psi\rang}{dt}=H|\psi\rang
i ℏ d t d ∣ ψ ⟩ = H ∣ ψ ⟩
其中,H H H 称为封闭系统 Hamilton 量固定 Hermite 算子,常用实验得出。
而因为 H 是 Hermite 的,故有谱分解:
H = ∑ E E ∣ E ⟩ ⟨ E ∣ H=\sum_E E|E\rang\lang E|
H = E ∑ E ∣ E ⟩ ⟨ E ∣
其中,状态∣ E ⟩ |E\rang ∣ E ⟩ 习惯上称作能量本征态 (energy eigenstate)或定态 (stationary state),而E E E 是∣ E ⟩ |E\rang ∣ E ⟩ 的能量。最小的 E 称为系统的基态能量 (ground state energy),相应的能量本征态(或本征空间)称为基态 (ground state)。
* 状态∣ E ⟩ |E\rang ∣ E ⟩ 常被称作定态是因为它们随时间的变化只是一个数值因子:
∣ E ⟩ → e x p ( − i E t ℏ ) ∣ E ⟩ |E\rang\rightarrow exp(\frac{-iEt}{\hbar})|E\rang
∣ E ⟩ → e x p ( ℏ − i E t ) ∣ E ⟩
薛定谔方程的解:(2021-07-16by 武汉大学数学李平学姐)
因为H H H 是 Hermitian 的,故酉相似于对角矩阵P † H P = P − 1 H P = D = d i a g { d 1 , . . . , d n } P^\dagger HP=P^{-1}HP=D=diag\{d_1,...,d_n\} P † H P = P − 1 H P = D = d i a g { d 1 , . . . , d n } 。
又因为P P † = I PP^\dagger=I P P † = I ,有i ℏ P † d ∣ ψ ⟩ d t = P † H ( P P † ) ∣ ψ ⟩ i\hbar P^\dagger \frac{d|\psi\rang}{dt}=P^\dagger H(PP^\dagger)|\psi\rang i ℏ P † d t d ∣ ψ ⟩ = P † H ( P P † ) ∣ ψ ⟩ ,即i ℏ d P † ∣ ψ ⟩ d t = D P † ∣ ψ ⟩ i\hbar\frac{dP^\dagger |\psi\rang}{dt}=DP^\dagger|\psi\rang i ℏ d t d P † ∣ ψ ⟩ = D P † ∣ ψ ⟩ 。
令∣ ϕ ⟩ ≡ P † ∣ ψ ⟩ |\phi\rang\equiv P^\dagger |\psi\rang ∣ ϕ ⟩ ≡ P † ∣ ψ ⟩ ,即有i ℏ d ∣ ϕ ⟩ d t = D ∣ ϕ ⟩ i\hbar\frac{d|\phi\rang}{dt}=D|\phi\rang i ℏ d t d ∣ ϕ ⟩ = D ∣ ϕ ⟩ ,即线性微分方程组:i ℏ d ϕ i d t = d i ϕ i i\hbar\frac{d\phi_i}{dt}=d_i\phi_i i ℏ d t d ϕ i = d i ϕ i 。
解得,有ϕ i = ϕ i 0 e − i t d i ℏ \phi_i=\phi_{i0}e^{\frac{-itd_i}{\hbar}} ϕ i = ϕ i 0 e ℏ − i t d i ,其中ϕ i 0 \phi_{i0} ϕ i 0 为ϕ i \phi_i ϕ i 的初始值。写成矩阵形式,即∣ ϕ ⟩ = e − i t D ℏ ∣ ϕ 0 ⟩ |\phi\rang=e^{\frac{-itD}{\hbar}}|\phi_0\rang ∣ ϕ ⟩ = e ℏ − i t D ∣ ϕ 0 ⟩ 。
而∣ ψ ⟩ = P ∣ ϕ ⟩ = P e − i t D ℏ ( P † P ) ∣ ϕ 0 ⟩ |\psi\rang=P|\phi\rang=Pe^{\frac{-itD}{\hbar}}(P^\dagger P)|\phi_0\rang ∣ ψ ⟩ = P ∣ ϕ ⟩ = P e ℏ − i t D ( P † P ) ∣ ϕ 0 ⟩ 。
所以∣ ψ ⟩ = e − i t P D P † ℏ P ∣ ϕ 0 ⟩ = e − i t H ℏ ∣ ψ 0 ⟩ |\psi\rang=e^{\frac{-itPDP^\dagger}{\hbar}}P|\phi_0\rang=e^{\frac{-itH}{\hbar}}|\psi_0\rang ∣ ψ ⟩ = e ℏ − i t P D P † P ∣ ϕ 0 ⟩ = e ℏ − i t H ∣ ψ 0 ⟩ 。
常有以下说法:
“把一个酉算子应用到一个特定的量子系统上”(applying a unitary operator to a particular quantum system),量子系统在和 “我们” 相互作用后将不再封闭。但状态向量仍可以用另一个 Hamilton 量相近似。
# 假设三:量子测量
假设 3:量子测量由一组测量算子{ M m } \{M_m\} { M m } 描述,这些算子作用在被测系统状态空间上,指标m m m 表示实验中可能的测量结果。若在测量前,量子系统最新状态是∣ ψ ⟩ |\psi\rang ∣ ψ ⟩ ,则结果m m m 发生的可能性是:
p ( m ) = ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩ = t r ( ∣ ψ ⟩ ⟨ ψ ∣ M m ⊺ M m ) p(m)=\lang\psi|M_m^\intercal M_m|\psi\rang=tr(|\psi\rang\lang\psi|M_m^\intercal M_m)
p ( m ) = ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩ = t r ( ∣ ψ ⟩ ⟨ ψ ∣ M m ⊺ M m )
且测量后系统的状态为:
∣ ψ ′ ⟩ = M m ∣ ψ ⟩ ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩ |\psi'\rang=\frac{M_m|\psi\rang}{\sqrt{\lang\psi|M_m^\intercal M_m|\psi\rang}}
∣ ψ ′ ⟩ = ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩ M m ∣ ψ ⟩
假设内容包括:测量算子M m M_m M m 满足完备性方程:∑ m M m ⊺ M m = I \sum_m M_m^\intercal M_m=I ∑ m M m ⊺ M m = I ,因此:
∑ m p ( m ) = ∑ m t r ( ∣ ψ ⟩ ⟨ ψ ∣ M m ⊺ M m ) = t r ( ∣ ψ ⟩ ⟨ ψ ∣ ∑ m M m ⊺ M m ) = t r ( ∣ ψ ⟩ ⟨ ψ ∣ I ) = ⟨ ψ ∣ I ∣ ψ ⟩ = 1 \sum_mp(m)=\sum_mtr(|\psi\rang\lang\psi|M_m^\intercal M_m)=tr(|\psi\rang\lang\psi|\sum_mM_m^\intercal M_m)=tr(|\psi\rang\lang\psi|I)=\lang\psi|I|\psi\rang=1
m ∑ p ( m ) = m ∑ t r ( ∣ ψ ⟩ ⟨ ψ ∣ M m ⊺ M m ) = t r ( ∣ ψ ⟩ ⟨ ψ ∣ m ∑ M m ⊺ M m ) = t r ( ∣ ψ ⟩ ⟨ ψ ∣ I ) = ⟨ ψ ∣ I ∣ ψ ⟩ = 1
我自己对 “quantum measurement operator” 的理解:
M m M_m M m ,其中,m m m 表示实验结果。譬如一个系统有状态∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ |\psi_1\rang,|\psi_2\rang ∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ ,测量这个系统这样一个实验的结果只有 2 种 (1, 2):
若⟨ ψ 1 ∣ M 1 ∣ ψ 1 ⟩ = 1 , ⟨ ψ 1 ∣ M 2 ∣ ψ 1 ⟩ = 0 \lang\psi_1|M_1|\psi_1\rang=1,\lang\psi_1|M_2|\psi_1\rang=0 ⟨ ψ 1 ∣ M 1 ∣ ψ 1 ⟩ = 1 , ⟨ ψ 1 ∣ M 2 ∣ ψ 1 ⟩ = 0 ,我理解为:若系统状态为∣ ψ 1 ⟩ |\psi_1\rang ∣ ψ 1 ⟩ ,则测量结果一定为 1.
若⟨ ψ 2 ∣ M 1 ∣ ψ 2 ⟩ = 0.75 , ⟨ ψ 2 ∣ M 2 ∣ ψ 2 ⟩ = 0.25 \lang\psi_2|M_1|\psi_2\rang=0.75,\lang\psi_2|M_2|\psi_2\rang=0.25 ⟨ ψ 2 ∣ M 1 ∣ ψ 2 ⟩ = 0 . 7 5 , ⟨ ψ 2 ∣ M 2 ∣ ψ 2 ⟩ = 0 . 2 5 ,我理解为:若系统状态为∣ ψ 2 ⟩ |\psi_2\rang ∣ ψ 2 ⟩ ,则有 75% 的概率测量到结果 1,25% 概率测量到结果 2 .
因此,在这样的假设下,若不知道系统状态下进行测量,若测量到结果 1,则无法确定系统是哪个状态;但如果测量到结果 2,则确定系统状态为∣ ψ 2 ⟩ |\psi_2\rang ∣ ψ 2 ⟩ 。
但若⟨ ψ 1 ∣ M 1 ∣ ψ 1 ⟩ = 1 , ⟨ ψ 1 ∣ M 2 ∣ ψ 1 ⟩ = 0 , ⟨ ψ 2 ∣ M 1 ∣ ψ 2 ⟩ = 0 , ⟨ ψ 2 ∣ M 2 ∣ ψ 2 ⟩ = 1 \lang\psi_1|M_1|\psi_1\rang=1,\lang\psi_1|M_2|\psi_1\rang=0,\lang\psi_2|M_1|\psi_2\rang=0,\lang\psi_2|M_2|\psi_2\rang=1 ⟨ ψ 1 ∣ M 1 ∣ ψ 1 ⟩ = 1 , ⟨ ψ 1 ∣ M 2 ∣ ψ 1 ⟩ = 0 , ⟨ ψ 2 ∣ M 1 ∣ ψ 2 ⟩ = 0 , ⟨ ψ 2 ∣ M 2 ∣ ψ 2 ⟩ = 1 ,则发现系统状态与实验结果是一一对应的。即出现结果 2,可以肯定系统状态是∣ ψ 2 ⟩ |\psi_2\rang ∣ ψ 2 ⟩ ;出现结果 1,可以肯定系统状态是∣ ψ 1 ⟩ |\psi_1\rang ∣ ψ 1 ⟩ 。
若存在这样的测量实验(测量算子),则状态∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ |\psi_1\rang,|\psi_2\rang ∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ 是可区分的。
特别地,还有一种情况。若系统只有两个状态,某个测量实验却有三个测量结果。如果状态为∣ ψ 1 ⟩ |\psi_1\rang ∣ ψ 1 ⟩ ,则测量结果一定为 1 或 2(至于是哪个不一定),如果状态为∣ ψ 2 ⟩ |\psi_2\rang ∣ ψ 2 ⟩ ,则测量结果一定为 3。显然这时∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ |\psi_1\rang,|\psi_2\rang ∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ 也是可区分的,也因为此时可以把M 1 M_1 M 1 和M 2 M_2 M 2 合并。所以我认为,如果两个状态是可区分的,则在合并测量算子后,只剩下和状态一一对应的测量算子。
关于可测量量(Observable)为什么可以用一个矩阵表示:
根据我的理解,在经典物理下,“测量” 就是
系统状态 → 测量结果 系统状态\rightarrow测量结果 系 统 状 态 → 测 量 结 果 的映射。即对于不同的系统状态可以得出不同的测量结果。
在量子力学中,可以用线性空间中的矢量∣ ψ ⟩ |\psi\rang ∣ ψ ⟩ 表示系统状态,而量子力学一大假设是测量结果一定是可测量量的本征值,且对应此时测量结果的系统状态为属于此本征值的本征矢。
所以我认为,将 “可测量量” 用一个形如M = ∑ λ P λ = ∑ λ ∣ λ ⟩ ⟨ λ ∣ M=\sum\lambda P_\lambda=\sum \lambda|\lambda\rang\lang\lambda| M = ∑ λ P λ = ∑ λ ∣ λ ⟩ ⟨ λ ∣ 的 Hermite 算子表示,其实就是,构造 了一个测量算子,使得利用这个测量算子可以根据系统状态计算出各个结果出现的概率。
也就是说,可测量量的算子表示正好代表了一个测量实验,而这个测量算子正好可以用于根据系统状态来推断不同测量结果的概率(系统状态 → 测量结果 系统状态\rightarrow测量结果 系 统 状 态 → 测 量 结 果 的映射)。
根据我的理解,对于任意一个系统状态∣ A ⟩ |A\rang ∣ A ⟩ ,采用测量算子P λ P_\lambda P λ ,则⟨ A ∣ P λ ∣ A ⟩ \lang A|P_\lambda|A\rang ⟨ A ∣ P λ ∣ A ⟩ 就是系统状态为∣ A ⟩ |A\rang ∣ A ⟩ 时,对其进行测量得到结果是λ \lambda λ 的概率(我认为是对系统 进行测量!而不是对可测量量 进行测量,可测量量只反映了可能的测量结果及其过程),特别地,若∣ A ⟩ |A\rang ∣ A ⟩ 正交于测量算子M M M 的属于本征值λ \lambda λ 的本征空间,则概率为 0;否则概率为∣ A ⟩ |A\rang ∣ A ⟩ 向λ \lambda λ 的本征空间投影的模长平方。
可测量量 = 对系统进行测量所有可能得到的结果以及系统状态信息的整合
# 证明非正交状态的不可区分:
设状态∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ |\psi_1\rang,|\psi_2\rang ∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ 非正交。反设它们可区分,则存在测量算子M 1 , M 2 M_1,M_2 M 1 , M 2 ,使得:
⟨ ψ 1 ∣ M 1 ⊺ M 1 ∣ ψ 1 ⟩ = 1 , ⟨ ψ 1 ∣ M 2 ⊺ M 2 ∣ ψ 1 ⟩ = 0 ⟨ ψ 2 ∣ M 1 ⊺ M 1 ∣ ψ 1 ⟩ = 0 , ⟨ ψ 2 ∣ M 2 ⊺ M 2 ∣ ψ 2 ⟩ = 1 ⇒ ∣ ∣ M 1 ∣ ψ 1 ⟩ ∣ ∣ = 1 , ∣ ∣ M 2 ∣ ψ 1 ⟩ ∣ ∣ = 0 ∣ ∣ M 1 ∣ ψ 2 ⟩ ∣ ∣ = 0 , ∣ ∣ M 2 ∣ ψ 2 ⟩ ∣ ∣ = 1 \lang\psi_1|M_1^\intercal M_1|\psi_1\rang=1,\lang\psi_1|M_2^\intercal M_2|\psi_1\rang=0\\
\lang\psi_2|M_1^\intercal M_1|\psi_1\rang=0,\lang\psi_2|M_2^\intercal M_2|\psi_2\rang=1\\
\Rightarrow ||M_1|\psi_1\rang||=1,||M_2|\psi_1\rang||=0\\
||M_1|\psi_2\rang||=0,||M_2|\psi_2\rang||=1
⟨ ψ 1 ∣ M 1 ⊺ M 1 ∣ ψ 1 ⟩ = 1 , ⟨ ψ 1 ∣ M 2 ⊺ M 2 ∣ ψ 1 ⟩ = 0 ⟨ ψ 2 ∣ M 1 ⊺ M 1 ∣ ψ 1 ⟩ = 0 , ⟨ ψ 2 ∣ M 2 ⊺ M 2 ∣ ψ 2 ⟩ = 1 ⇒ ∣ ∣ M 1 ∣ ψ 1 ⟩ ∣ ∣ = 1 , ∣ ∣ M 2 ∣ ψ 1 ⟩ ∣ ∣ = 0 ∣ ∣ M 1 ∣ ψ 2 ⟩ ∣ ∣ = 0 , ∣ ∣ M 2 ∣ ψ 2 ⟩ ∣ ∣ = 1
此时因为∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ |\psi_1\rang,|\psi_2\rang ∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ 不正交,则∣ ψ 2 ⟩ = α ∣ ψ 1 ⟩ + β ∣ ψ ⟩ |\psi_2\rang=\alpha|\psi_1\rang+\beta|\psi\rang ∣ ψ 2 ⟩ = α ∣ ψ 1 ⟩ + β ∣ ψ ⟩ ,其中∣ ψ 1 ⟩ |\psi_1\rang ∣ ψ 1 ⟩ 和∣ ψ ⟩ |\psi\rang ∣ ψ ⟩ 正交,且∣ α ∣ 2 + ∣ β ∣ 2 = 1 , ∣ β ∣ < 1 |\alpha|^2+|\beta|^2=1,|\beta|< 1 ∣ α ∣ 2 + ∣ β ∣ 2 = 1 , ∣ β ∣ < 1
又因为:
1 = ∣ ∣ M 2 ∣ ψ 2 ⟩ ∣ ∣ = ∣ ∣ α M 2 ∣ ψ 1 ⟩ + β M 2 ∣ ψ ⟩ ∣ ∣ ≤ α ∣ ∣ M 2 ∣ ψ 1 ⟩ ∣ ∣ + β ∣ ∣ M 2 ∣ ψ ⟩ ∣ ∣ = β ∣ ∣ M 2 ∣ ψ ⟩ ∣ ∣ 1=||M_2|\psi_2\rang||=||\alpha M_2|\psi_1\rang+\beta M_2|\psi\rang||\leq\alpha||M_2|\psi_1\rang||+\beta||M_2|\psi\rang||=\beta||M_2|\psi\rang||\\
1 = ∣ ∣ M 2 ∣ ψ 2 ⟩ ∣ ∣ = ∣ ∣ α M 2 ∣ ψ 1 ⟩ + β M 2 ∣ ψ ⟩ ∣ ∣ ≤ α ∣ ∣ M 2 ∣ ψ 1 ⟩ ∣ ∣ + β ∣ ∣ M 2 ∣ ψ ⟩ ∣ ∣ = β ∣ ∣ M 2 ∣ ψ ⟩ ∣ ∣
而
∣ ∣ M 2 ∣ ψ ⟩ ∣ ∣ 2 ≤ ⟨ ψ ∣ M 1 ⊺ M 1 ∣ ψ ⟩ + ⟨ ψ ∣ M 2 ⊺ M 2 ∣ ψ ⟩ = 1 ||M_2|\psi\rang||^2\leq\lang\psi|M_1^\intercal M_1|\psi\rang+\lang\psi|M_2^\intercal M_2|\psi\rang=1
∣ ∣ M 2 ∣ ψ ⟩ ∣ ∣ 2 ≤ ⟨ ψ ∣ M 1 ⊺ M 1 ∣ ψ ⟩ + ⟨ ψ ∣ M 2 ⊺ M 2 ∣ ψ ⟩ = 1
所以:
1 = β ∣ ∣ M 2 ∣ ψ ⟩ ∣ ∣ ≤ β < 1 1=\beta||M_2|\psi\rang||\leq\beta<1
1 = β ∣ ∣ M 2 ∣ ψ ⟩ ∣ ∣ ≤ β < 1
矛盾,故证毕。
其实本质在于∣ ψ 1 ⟩ |\psi_1\rang ∣ ψ 1 ⟩ 在∣ ψ 2 ⟩ |\psi_2\rang ∣ ψ 2 ⟩ 上有分量,因此∣ ψ 2 ⟩ |\psi_2\rang ∣ ψ 2 ⟩ 状态对应可能的测量结果,状态∣ ψ 1 ⟩ |\psi_1\rang ∣ ψ 1 ⟩ 也一定会有一定概率产生这个结果,故不可区分。
物理含义
数学表象
Observable
Hermitian operator
Possible values (实验可能的结果)
Eigenvalues
States in which result is unambiguous
Eigenvectors
注意最后一个,States in which result is unambiguous 表示系统在这个状态时,根据实验测量结果可以断定出系统的状态。根据我的理解,此时系统的状态与实验结果是一一对应的。而这样的状态只能是可观测量的本征矢量。
# 投影测量
投影测量由被测量系统状态空间上的一个可观测量 Hermite 算子 M 描述,该可观测量具有谱分解:
M = ∑ m m P m M=\sum_mmP_m
M = m ∑ m P m
其中,P m P_m P m 为到特征值 m 的本征空间的投影算子(∣ λ = m ⟩ |\lambda=m\rang ∣ λ = m ⟩ 为该本征空间的一组标准正交基):
P m = ∑ ∣ λ = m ⟩ ⟨ λ = m ∣ P_m=\sum|\lambda=m\rang\lang\lambda=m|
P m = ∑ ∣ λ = m ⟩ ⟨ λ = m ∣
有P m ⊺ P m = P m P_m^\intercal P_m=P_m P m ⊺ P m = P m
测量状态∣ ψ ⟩ |\psi\rang ∣ ψ ⟩ 时,得到结果 m 的概率为:
p ( m ) = ⟨ ψ ∣ P m ⊺ P m ∣ ψ ⟩ = ⟨ ψ ∣ P m ∣ ψ ⟩ 其实本质是 ∣ ψ ⟩ 在本征空间上投影的模长平方 p ( m ) = ∣ ∣ P m ∣ ψ ⟩ ∣ ∣ 2 p(m)=\lang\psi|P_m^\intercal P_m|\psi\rang=\lang\psi|P_m|\psi\rang\\
其实本质是|\psi\rang 在本征空间上投影的模长平方p(m)=||P_m|\psi\rang||^2
p ( m ) = ⟨ ψ ∣ P m ⊺ P m ∣ ψ ⟩ = ⟨ ψ ∣ P m ∣ ψ ⟩ 其 实 本 质 是 ∣ ψ ⟩ 在 本 征 空 间 上 投 影 的 模 长 平 方 p ( m ) = ∣ ∣ P m ∣ ψ ⟩ ∣ ∣ 2
测量后,状态变为
∣ ψ ′ ⟩ = P m ∣ ψ ⟩ p ( m ) |\psi'\rang=\frac{P_m|\psi\rang}{\sqrt{p(m)}}
∣ ψ ′ ⟩ = p ( m ) P m ∣ ψ ⟩
显然,P m P_m P m 满足:
∑ m P m ⊺ P m = ∑ m P m = I , P m ⊺ = P m \sum_mP_m^\intercal P_m=\sum_mP_m=I,P_m^\intercal=P_m
m ∑ P m ⊺ P m = m ∑ P m = I , P m ⊺ = P m
投影测量有很多很好的性质:
Heisenberger 测不准原理
不妨设A , B A,B A , B 是 Hermite 矩阵,设⟨ ψ ∣ A B ∣ ψ ⟩ = x + i y \lang\psi|AB|\psi\rang=x+iy ⟨ ψ ∣ A B ∣ ψ ⟩ = x + i y
则有⟨ ψ ∣ [ A , B ] ∣ ψ ⟩ = 2 i y , ⟨ ψ ∣ { A , B } ∣ ψ ⟩ = 2 x \lang\psi|[A,B]|\psi\rang=2iy,\lang\psi|\{A,B\}|\psi\rang=2x ⟨ ψ ∣ [ A , B ] ∣ ψ ⟩ = 2 i y , ⟨ ψ ∣ { A , B } ∣ ψ ⟩ = 2 x ,所以有:
∣ ⟨ ψ ∣ [ A , B ] ∣ ψ ⟩ ∣ 2 + ∣ ⟨ ψ ∣ { A , B } ∣ ψ ⟩ ∣ 2 = 4 ∣ ⟨ ψ ∣ A B ∣ ψ ⟩ ∣ 2 |\lang\psi|[A,B]|\psi\rang|^2+|\lang\psi|\{A,B\}|\psi\rang|^2=4|\lang\psi|AB|\psi\rang|^2
∣ ⟨ ψ ∣ [ A , B ] ∣ ψ ⟩ ∣ 2 + ∣ ⟨ ψ ∣ { A , B } ∣ ψ ⟩ ∣ 2 = 4 ∣ ⟨ ψ ∣ A B ∣ ψ ⟩ ∣ 2
又 Cauchy-Schwarz 不等式以及A , B A,B A , B 是 Hermite 的
∣ ⟨ ψ ∣ A B ∣ ψ ⟩ ∣ 2 ≤ ⟨ ψ ∣ A 2 ∣ ψ ⟩ ⟨ ψ ∣ B 2 ∣ ψ ⟩ |\lang\psi|AB|\psi\rang|^2\leq\lang\psi|A^2|\psi\rang\lang\psi|B^2|\psi\rang
∣ ⟨ ψ ∣ A B ∣ ψ ⟩ ∣ 2 ≤ ⟨ ψ ∣ A 2 ∣ ψ ⟩ ⟨ ψ ∣ B 2 ∣ ψ ⟩
所以有
∣ ⟨ ψ ∣ [ A , B ] ∣ ψ ⟩ ∣ 2 ≤ 4 ⟨ ψ ∣ A 2 ∣ ψ ⟩ ⟨ ψ ∣ B 2 ∣ ψ ⟩ |\lang\psi|[A,B]|\psi\rang|^2\leq 4\lang\psi|A^2|\psi\rang\lang\psi|B^2|\psi\rang
∣ ⟨ ψ ∣ [ A , B ] ∣ ψ ⟩ ∣ 2 ≤ 4 ⟨ ψ ∣ A 2 ∣ ψ ⟩ ⟨ ψ ∣ B 2 ∣ ψ ⟩
此时,令A = C − ⟨ C ⟩ I , B = D − ⟨ D ⟩ I A=C-\lang C\rang I,B=D-\lang D\rang I A = C − ⟨ C ⟩ I , B = D − ⟨ D ⟩ I ,C , D C,D C , D 是两个可测量量的矩阵表示
有[ A , B ] = [ C , D ] , ⟨ ∣ ψ ∣ A 2 ∣ ψ ⟩ = ⟨ ψ ∣ C 2 ∣ ψ ⟩ − 2 ⟨ C ⟩ ⟨ ψ ∣ C ∣ ψ ⟩ + ⟨ C ⟩ 2 = ⟨ C 2 ⟩ − ⟨ C ⟩ 2 = ( Δ C ) 2 [A,B]=[C,D],\lang|\psi|A^2|\psi\rang=\lang\psi|C^2|\psi\rang-2\lang C\rang\lang\psi|C|\psi\rang+\lang C\rang ^2=\lang C^2\rang-\lang C\rang^2=(\Delta C)^2 [ A , B ] = [ C , D ] , ⟨ ∣ ψ ∣ A 2 ∣ ψ ⟩ = ⟨ ψ ∣ C 2 ∣ ψ ⟩ − 2 ⟨ C ⟩ ⟨ ψ ∣ C ∣ ψ ⟩ + ⟨ C ⟩ 2 = ⟨ C 2 ⟩ − ⟨ C ⟩ 2 = ( Δ C ) 2
所以有:
Δ C Δ D ≥ ∣ ⟨ ψ ∣ [ C , D ] ∣ ψ ⟩ ∣ 2 \Delta C\Delta D\geq\frac{|\lang\psi|[C,D]|\psi\rang|}{2}
Δ C Δ D ≥ 2 ∣ ⟨ ψ ∣ [ C , D ] ∣ ψ ⟩ ∣
测不准原理的正确理解:制备具有相同状态∣ ψ ⟩ |\psi\rang ∣ ψ ⟩ 的大量量子系统,并对其中一部分以测量算子C C C 去测量,另一部分以D D D 去测量。则测量的结果(C , D C,D C , D 的本征量)的标准差要满足上面不等式。
# POVM 测量
对于一个一般测量算子M m M_m M m ,定义半正定算子E m ≡ M m ⊺ M m E_m\equiv M_m^\intercal M_m E m ≡ M m ⊺ M m ,则有∑ m E m = I , p ( m ) = ⟨ ψ ∣ E m ∣ ψ ⟩ \sum_mE_m=I,p(m)=\lang\psi|E_m|\psi\rang ∑ m E m = I , p ( m ) = ⟨ ψ ∣ E m ∣ ψ ⟩ 。于是算子集合E m E_m E m 足以确定不同测量结果的概率,算子E m E_m E m 称为与测量相联系的 POVM 元 ,完整的集合{ E m } \{E_m\} { E m } 称为一个 POVM。
同样可以给出更自然的 POVM 定义:满足 (1) 每个算子E m E_m E m 是半正定的 (2)∑ m E m = I \sum_mE_m=I ∑ m E m = I 的算子集合{ E m } \{E_m\} { E m } 是一个 POVM。(因为半正定性,也可以反求出M m = E m M_m=\sqrt{E_m} M m = E m 。
投影测量的可重复性:(根据我的理解)如果投影算子P m P_m P m 包含足够的维数,则P m ∣ ψ ⟩ = ∣ ψ ⟩ P_m|\psi\rang=|\psi\rang P m ∣ ψ ⟩ = ∣ ψ ⟩ (投影无信息损失),此时⟨ ψ ∣ P m ∣ ψ ⟩ = ⟨ ψ ∣ ψ ⟩ = 1 \lang\psi|P_m|\psi\rang=\lang\psi|\psi\rang=1 ⟨ ψ ∣ P m ∣ ψ ⟩ = ⟨ ψ ∣ ψ ⟩ = 1 , 所以有∣ ψ ′ ⟩ = P m ∣ ψ ⟩ ⟨ ψ ∣ P m ∣ ψ ⟩ = ∣ ψ ⟩ |\psi'\rang=\frac{P_m|\psi\rang}{\sqrt{\lang\psi|P_m|\psi\rang}}=|\psi\rang ∣ ψ ′ ⟩ = ⟨ ψ ∣ P m ∣ ψ ⟩ P m ∣ ψ ⟩ = ∣ ψ ⟩ ,即无论进行多少次投影测量都不会改变系统的状态。
注意 POVM 测量并不等价于一般测量!对于一个一般测量{ M m } \{M_m\} { M m } ,可对应唯一一个 POVM:{ E m = M m ⊺ M m } \{E_m=M_m^\intercal M_m\} { E m = M m ⊺ M m } ,但是给出一个 POVM{ E m } \{E_m\} { E m } ,你却不能直接得出一般测量{ M m = E m } \{M_m=\sqrt{E_m}\} { M m = E m } ,因为只要M m = U E m , U M_m=U\sqrt{E_m},U M m = U E m , U 是酉的就都满足M m ⊺ M m = E m M_m^\intercal M_m=E_m M m ⊺ M m = E m 。这也应证了 POVM 为什么用于 “只关心概率结果而不关心系统测量后的状态”,因为给出E m E_m E m 可以测出概率,但无法得出M m M_m M m 也就无法得到系统测量后进入的状态。
* 存在系统可能的状态集合以及一个 POVM,使得根据测量结果推断出的系统状态不会出错,但是这是以有时候无法判断为代价。
# 相位(phase)
全局相位因子:e i θ e^{i\theta} e i θ ,状态e i θ ∣ ψ ⟩ e^{i\theta}|\psi\rang e i θ ∣ ψ ⟩ 与∣ ψ ⟩ |\psi\rang ∣ ψ ⟩ 在统计意义上是相同的。因为⟨ ψ ∣ e − i θ M ⊺ M e i θ ∣ ψ ⟩ = ⟨ ψ ∣ M ⊺ M ∣ ψ ⟩ \lang\psi|e^{-i\theta}M^\intercal Me^{i\theta}|\psi\rang=\lang\psi|M^\intercal M|\psi\rang ⟨ ψ ∣ e − i θ M ⊺ M e i θ ∣ ψ ⟩ = ⟨ ψ ∣ M ⊺ M ∣ ψ ⟩
相对相位:如果两个模长相同的幅度 a,b 满足a = e i θ b a=e^{i\theta}b a = e i θ b ,则我们说幅度 a,b 差了一个相对相位。
特别地,若两个状态∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ |\psi_1\rang,|\psi_2\rang ∣ ψ 1 ⟩ , ∣ ψ 2 ⟩ 在这同一组基下每个幅度都差了一个相对相位,则称这两个状态在这组基下差了一个相对相位。
相对相位与全局相位不同之处在于相对相位需要依赖基的选择。在某个基下差了相对的相位的状态有物理统计差别,而差了全局相位的状态却没有。
# 假设四:复合系统
假设 4:复合物理系统的状态空间是分物理系统状态空间的张量积,若将分系统编号为 1 到 n,系统 i 的状态为∣ ψ i ⟩ |\psi_i\rang ∣ ψ i ⟩ ,则系统的总状态为∣ ψ 1 ⟩ ⊗ . . . ⊗ ∣ ψ n ⟩ |\psi_1\rang\otimes...\otimes|\psi_n\rang ∣ ψ 1 ⟩ ⊗ . . . ⊗ ∣ ψ n ⟩ 。
一个算不上推导的解释:为什么选择张量积来描述联合系统的状态?
由叠加性原理:若∣ x ⟩ , ∣ y ⟩ |x\rang,|y\rang ∣ x ⟩ , ∣ y ⟩ 是系统的两个状态,则它们的任意叠加α ∣ x ⟩ + β ∣ y ⟩ \alpha|x\rang+\beta|y\rang α ∣ x ⟩ + β ∣ y ⟩ 也应该是系统的一个状态,其中∣ α ∣ 2 + ∣ β ∣ 2 = 1 |\alpha|^2+|\beta|^2=1 ∣ α ∣ 2 + ∣ β ∣ 2 = 1 。
考虑系统 A 的一个状态∣ v ⟩ |v\rang ∣ v ⟩ ,系统 B 的两个状态∣ w 1 ⟩ , ∣ w 2 ⟩ |w_1\rang,|w_2\rang ∣ w 1 ⟩ , ∣ w 2 ⟩ ,系统 AB 的两个状态∣ v ⟩ ⊗ ∣ w 1 ⟩ , ∣ v ⟩ ⊗ ∣ w 2 ⟩ |v\rang\otimes|w_1\rang,|v\rang\otimes|w_2\rang ∣ v ⟩ ⊗ ∣ w 1 ⟩ , ∣ v ⟩ ⊗ ∣ w 2 ⟩ ,则显然对于任意∣ α ∣ 2 + ∣ β ∣ 2 = 1 |\alpha|^2+|\beta|^2=1 ∣ α ∣ 2 + ∣ β ∣ 2 = 1 ,都有α ( ∣ v ⟩ ⊗ ∣ w 1 ⟩ ) + β ( ∣ v ⟩ ⊗ ∣ w 2 ⟩ ) = ∣ v ⟩ ⊗ ( α ∣ w 1 ⟩ ⊗ β ∣ w 2 ⟩ ) \alpha(|v\rang\otimes|w_1\rang)+\beta(|v\rang\otimes|w_2\rang)=|v\rang\otimes(\alpha|w_1\rang\otimes\beta|w_2\rang) α ( ∣ v ⟩ ⊗ ∣ w 1 ⟩ ) + β ( ∣ v ⟩ ⊗ ∣ w 2 ⟩ ) = ∣ v ⟩ ⊗ ( α ∣ w 1 ⟩ ⊗ β ∣ w 2 ⟩ ) ,其中∣ v ⟩ , α ∣ w 1 ⟩ ⊗ β ∣ w 2 ⟩ |v\rang,\alpha|w_1\rang\otimes\beta|w_2\rang ∣ v ⟩ , α ∣ w 1 ⟩ ⊗ β ∣ w 2 ⟩ 分别是系统 A,B 的状态,所以α ( ∣ v ⟩ ⊗ ∣ w 1 ⟩ ) + β ( ∣ v ⟩ + ∣ w 2 ⟩ ) \alpha(|v\rang\otimes|w_1\rang)+\beta(|v\rang+|w_2\rang) α ( ∣ v ⟩ ⊗ ∣ w 1 ⟩ ) + β ( ∣ v ⟩ + ∣ w 2 ⟩ ) 也是联合系统 AB 的状态。
其实我认为满足这样性质的运算有很多,方便选了张量积。
关于一个投影测量加上一个酉算子就可以实现一般测量:
设有一个状态空间为 Q 的量子系统,希望在系统 Q 上进行由算子M m M_m M m 定义的测量。
引入一个辅助系统,其状态空间为 M。该系统有一个与测量结果一一对应的标准正交基∣ m ⟩ |m\rang ∣ m ⟩ (即⟨ m ′ ∣ M m ⊺ M m ∣ m ′ ⟩ ≡ m = = m ′ ? 1 : 0 \lang m'|M_m^\intercal M_m|m'\rang\equiv m==m'?1:0 ⟨ m ′ ∣ M m ⊺ M m ∣ m ′ ⟩ ≡ m = = m ′ ? 1 : 0 )。
设 M 有一个状态为∣ 0 ⟩ |0\rang ∣ 0 ⟩ ,对于 Q 中所有状态∣ ψ ⟩ |\psi\rang ∣ ψ ⟩ ,在∣ ψ ⟩ ⊗ ∣ 0 ⟩ |\psi\rang\otimes|0\rang ∣ ψ ⟩ ⊗ ∣ 0 ⟩ 上定义酉算子 U:
U ( ∣ ψ ⟩ ⊗ ∣ 0 ⟩ ) ≡ ∑ m ( M m ∣ ψ ⟩ ) ⊗ ∣ m ⟩ U(|\psi\rang\otimes|0\rang)\equiv\sum_m (M_m|\psi\rang)\otimes|m\rang
U ( ∣ ψ ⟩ ⊗ ∣ 0 ⟩ ) ≡ m ∑ ( M m ∣ ψ ⟩ ) ⊗ ∣ m ⟩
因此有:
( U ( ∣ ψ 1 ⟩ ⊗ ∣ 0 ⟩ ) , U ( ∣ ψ 2 ⟩ ⊗ ∣ 0 ⟩ ) ) = ∑ m , m ′ ( ( M m ∣ ψ 1 ⟩ ) ⊗ ∣ m ⟩ ) ⊺ ( ( M m ′ ∣ ψ 2 ⟩ ) ⊗ ∣ m ′ ⟩ ) = ∑ m , m ′ ( ( ⟨ ψ 1 ∣ M m ⊺ ) ⊗ ⟨ m ∣ ) ( ( M m ′ ∣ ψ 2 ⟩ ) ⊗ ∣ m ′ ⟩ ) = ∑ m , m ′ ⟨ ψ 1 ∣ M m ⊺ M m ′ ∣ ψ 2 ⟩ ⟨ m ∣ m ′ ⟩ = ⟨ ψ 1 ∣ ∑ m M m ⊺ M m ∣ ψ 2 ⟩ = ⟨ ψ 1 ∣ ψ 2 ⟩ (U(|\psi_1\rang\otimes |0\rang),U(|\psi_2\rang\otimes|0\rang))=\sum_{m,m'}((M_m|\psi_1\rang)\otimes|m\rang)^\intercal((M_{m'}|\psi_2\rang)\otimes|m'\rang)\\
=\sum_{m,m'}((\lang\psi_1|M_m^\intercal)\otimes\lang m|)((M_{m'}|\psi_2\rang)\otimes|m'\rang)\\
=\sum_{m,m'}\lang\psi_1|M_m^\intercal M_{m'}|\psi_2\rang\lang m|m'\rang=\lang\psi_1|\sum_mM_m^\intercal M_m|\psi_2\rang=\lang\psi_1|\psi_2\rang
( U ( ∣ ψ 1 ⟩ ⊗ ∣ 0 ⟩ ) , U ( ∣ ψ 2 ⟩ ⊗ ∣ 0 ⟩ ) ) = m , m ′ ∑ ( ( M m ∣ ψ 1 ⟩ ) ⊗ ∣ m ⟩ ) ⊺ ( ( M m ′ ∣ ψ 2 ⟩ ) ⊗ ∣ m ′ ⟩ ) = m , m ′ ∑ ( ( ⟨ ψ 1 ∣ M m ⊺ ) ⊗ ⟨ m ∣ ) ( ( M m ′ ∣ ψ 2 ⟩ ) ⊗ ∣ m ′ ⟩ ) = m , m ′ ∑ ⟨ ψ 1 ∣ M m ⊺ M m ′ ∣ ψ 2 ⟩ ⟨ m ∣ m ′ ⟩ = ⟨ ψ 1 ∣ m ∑ M m ⊺ M m ∣ ψ 2 ⟩ = ⟨ ψ 1 ∣ ψ 2 ⟩
可以发现如此定义的酉算子U : S p a n { ∣ ψ ⟩ ⊗ ∣ 0 ⟩ } → Q ⊗ M U:Span\{|\psi\rang\otimes|0\rang\}\rightarrow Q\otimes M U : S p a n { ∣ ψ ⟩ ⊗ ∣ 0 ⟩ } → Q ⊗ M 是保持内积的。
由 Ex2.67 ,存在一个扩张到酉算子U ′ : Q ⊗ M → Q ⊗ M U':Q\otimes M\rightarrow Q\otimes M U ′ : Q ⊗ M → Q ⊗ M ,使得∀ ∣ w ⟩ ∈ S p a n { ∣ ψ ⟩ ⊗ ∣ 0 ⟩ } , U ′ ∣ w ⟩ ≡ U ∣ w ⟩ \forall |w\rang \in Span\{|\psi\rang\otimes|0\rang\},U'|w\rang\equiv U|w\rang ∀ ∣ w ⟩ ∈ S p a n { ∣ ψ ⟩ ⊗ ∣ 0 ⟩ } , U ′ ∣ w ⟩ ≡ U ∣ w ⟩ (证明在下面)
令U ′ U' U ′ 作用于∣ ψ ⟩ ⊗ ∣ 0 ⟩ |\psi\rang\otimes|0\rang ∣ ψ ⟩ ⊗ ∣ 0 ⟩ ,考虑对复合系统的投影测量算子P m = I Q ⊗ ( ∣ m ⟩ ⟨ m ∣ ) P_m=I_Q\otimes(|m\rang\lang m|) P m = I Q ⊗ ( ∣ m ⟩ ⟨ m ∣ )
p ( m ) = ∑ m ′ , m ′ ′ [ ( ⟨ ψ ∣ M m ′ ⊺ ) ⊗ ⟨ m ′ ∣ ] ⋅ [ I Q ⊗ ∣ m ⟩ ⟨ m ∣ ] ⋅ [ ( M m ′ ′ ∣ ψ ⟩ ) ⊗ ∣ m ′ ′ ⟩ ] = ∑ m ′ , m ′ ′ ⟨ ψ ∣ M m ′ ⊺ I Q M m ′ ′ ∣ ψ ⟩ ⋅ [ ⟨ m ′ ∣ m ⟩ ⟨ m ∣ m ′ ′ ⟩ ] = ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩ p(m)=\sum_{m',m''}[(\lang\psi|M_{m'}^\intercal)\otimes\lang m'|]\cdot[I_Q\otimes|m\rang\lang m|]\cdot[(M_{m''}|\psi\rang)\otimes|m''\rang]\\
=\sum_{m',m''}\lang\psi|M_{m'}^\intercal I_QM_{m''}|\psi\rang\cdot[\lang m'|m\rang\lang m|m''\rang]\\
=\lang\psi|M_m^\intercal M_m|\psi\rang
p ( m ) = m ′ , m ′ ′ ∑ [ ( ⟨ ψ ∣ M m ′ ⊺ ) ⊗ ⟨ m ′ ∣ ] ⋅ [ I Q ⊗ ∣ m ⟩ ⟨ m ∣ ] ⋅ [ ( M m ′ ′ ∣ ψ ⟩ ) ⊗ ∣ m ′ ′ ⟩ ] = m ′ , m ′ ′ ∑ ⟨ ψ ∣ M m ′ ⊺ I Q M m ′ ′ ∣ ψ ⟩ ⋅ [ ⟨ m ′ ∣ m ⟩ ⟨ m ∣ m ′ ′ ⟩ ] = ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩
测量后系统状态变为:
P m U ( ∣ ψ ⟩ ⊗ ∣ 0 ⟩ ) p ( m ) = M m ∣ ψ ⟩ ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩ ⊗ ∣ m ⟩ \frac{P_mU(|\psi\rang\otimes|0\rang)}{\sqrt{p(m)}}=\frac{M_m|\psi\rang}{\sqrt{\lang\psi|M_m^\intercal M_m|\psi\rang}}\otimes |m\rang
p ( m ) P m U ( ∣ ψ ⟩ ⊗ ∣ 0 ⟩ ) = ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩ M m ∣ ψ ⟩ ⊗ ∣ m ⟩
其中,M 系统状态∣ m ⟩ |m\rang ∣ m ⟩ 被测量不会发生变化,而 Q 系统状态变为M m ∣ ψ ⟩ ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩ \frac{M_m|\psi\rang}{\sqrt{\lang\psi|M_m^\intercal M_m|\psi\rang}} ⟨ ψ ∣ M m ⊺ M m ∣ ψ ⟩ M m ∣ ψ ⟩ ,就此借用酉算子 + 引入辅助系统实现了对 Q 系统的一般测量。
关于 Ex2.67*“设 V 是 Hilbert 空间且 W 是其子空间。设U : W → V U:W\rightarrow V U : W → V 是一个保持内积的线性算子,即∀ ∣ w 1 ⟩ , ∣ w 2 ⟩ ∈ W , ⟨ w 1 ∣ U ⊺ U ∣ w 2 ⟩ = ⟨ w 1 ∣ w 2 ⟩ \forall |w_1\rang,|w_2\rang \in W,\lang w_1|U^\intercal U|w_2\rang=\lang w_1|w_2\rang ∀ ∣ w 1 ⟩ , ∣ w 2 ⟩ ∈ W , ⟨ w 1 ∣ U ⊺ U ∣ w 2 ⟩ = ⟨ w 1 ∣ w 2 ⟩ 。求证存在 U 的扩张算子U ′ : V → V U':V\rightarrow V U ′ : V → V ,使得U ′ ∣ w ⟩ ≡ U ∣ w ⟩ U'|w\rang\equiv U|w\rang U ′ ∣ w ⟩ ≡ U ∣ w ⟩ 。”*
其实复合系统状态记号很多样。根据我的理解∣ v w ⟩ = ∣ v ⟩ ∣ w ⟩ = ∣ v ⟩ ⊗ ∣ w ⟩ |vw\rang=|v\rang|w\rang=|v\rang\otimes|w\rang ∣ v w ⟩ = ∣ v ⟩ ∣ w ⟩ = ∣ v ⟩ ⊗ ∣ w ⟩
# 纠缠
考虑双量子比特系统状态∣ ψ ⟩ = ∣ 00 ⟩ + ∣ 11 ⟩ 2 |\psi\rang=\frac{|00\rang+|11\rang}{\sqrt2} ∣ ψ ⟩ = 2 ∣ 0 0 ⟩ + ∣ 1 1 ⟩ ,它并不能表示为两个单量子比特系统状态的(张量)积。复合系统这种独特的状态称为纠缠态(entangled state),起因尚不明确。
# 总览
假设 1 说明了如何描述一个孤立的量子系统的状态;假设 2 说明封闭量子系统的动态由薛定谔方程,也就是酉演化来描述;假设 3 说明了如何通过规定测量的描述来从量子系统获取信息;假设 4 说明如何将不同的量子系统合成复合系统。
量子力学不同于传统经典力学在于无法直接观察系统的状态向量。因此诸如位置,能量,速率 等经典力学里可以直接观测的量在量子力学中将变得不再基本。量子系统好像一个隐藏和封闭的世界,每次观测都将引起状态的改变。
# 初等量子力学的一个应用:超密编码
问题:Alice 要给 Bob 传输一份两个经典比特的信息 (00, 01, 10, 11),但却只被允许发送一个量子比特。
首先,Alice 和 Bob 共享一对纠缠态的量子比特∣ ψ ⟩ = ∣ 00 ⟩ + ∣ 11 ⟩ 2 |\psi\rang=\frac{|00\rang+|11\rang}{\sqrt2} ∣ ψ ⟩ = 2 ∣ 0 0 ⟩ + ∣ 1 1 ⟩ ,Alice 拥有第一个量子比特,Bob 拥有第二个量子比特。
若想传输 00,Alice 作用 I 于第一量子比特上:∣ ψ ′ ⟩ = I 1 ∣ ψ ⟩ = ∣ 00 ⟩ + ∣ 11 ⟩ 2 |\psi'\rang=I_1|\psi\rang=\frac{|00\rang+|11\rang}{\sqrt{2}} ∣ ψ ′ ⟩ = I 1 ∣ ψ ⟩ = 2 ∣ 0 0 ⟩ + ∣ 1 1 ⟩
若想传输 01,Alice 作用 Z 于第一量子比特上:∣ ψ ′ ⟩ = Z 1 ∣ ψ ⟩ = ∣ 00 ⟩ − ∣ 11 ⟩ 2 |\psi'\rang=Z_1|\psi\rang=\frac{|00\rang-|11\rang}{\sqrt{2}} ∣ ψ ′ ⟩ = Z 1 ∣ ψ ⟩ = 2 ∣ 0 0 ⟩ − ∣ 1 1 ⟩
若想传输 10,Alice 作用 X 于第一量子比特上:∣ ψ ′ ⟩ = X 1 ∣ ψ ⟩ = ∣ 10 ⟩ + ∣ 01 ⟩ 2 |\psi'\rang=X_1|\psi\rang=\frac{|10\rang+|01\rang}{\sqrt{2}} ∣ ψ ′ ⟩ = X 1 ∣ ψ ⟩ = 2 ∣ 1 0 ⟩ + ∣ 0 1 ⟩
若想传输 11,Alice 作用 iY 于第一量子比特上:∣ ψ ′ ⟩ = i Y 1 ∣ ψ ⟩ = − ∣ 10 ⟩ + ∣ 01 ⟩ 2 |\psi'\rang=iY_1|\psi\rang=\frac{-|10\rang+|01\rang}{\sqrt{2}} ∣ ψ ′ ⟩ = i Y 1 ∣ ψ ⟩ = 2 − ∣ 1 0 ⟩ + ∣ 0 1 ⟩
作用后得到的四个状态称为 Bell 态 (或 Bell 基,EPR 对)不难验证它们是正交的。因此在 Alice 将第一个量子比特发送给 Bob 后,Bob 可以通过测量实验可靠区分这四种状态,即得到了传输的信息。事实上,传输信息的过程 Alice 永远不需要和第二个量子比特打交道。
特别地,若有人劫持了 Alice 发的第一个量子比特,由于对于任意测量算子M m M_m M m ,⟨ ψ ∣ M m ⊺ M m ⊗ I ∣ ψ ⟩ \lang\psi|M_m^\intercal M_m\otimes I|\psi\rang ⟨ ψ ∣ M m ⊺ M m ⊗ I ∣ ψ ⟩ 结果都一样,则劫持者也无法只通过第一个量子比特解密信息。
# 密度算子
密度算子是一种数学上等价于状态向量的可以用来描述量子力学的工具。
# 量子状态的综述
设量子系统以概率p i p_i p i 处在一组状态{ ∣ ψ i ⟩ } \{|\psi_i\rang\} { ∣ ψ i ⟩ } 中的某一个,则称{ p i , ∣ ψ i ⟩ } \{p_i,|\psi_i\rang\} { p i , ∣ ψ i ⟩ } 为一个纯态 的系综 (ensemble of pure state),系统的密度算子 (密度矩阵)定义为:
ρ ≡ ∑ i p i ∣ ψ i ⟩ ⟨ ψ i ∣ \rho\equiv\sum_ip_i|\psi_i\rang\lang\psi_i|
ρ ≡ i ∑ p i ∣ ψ i ⟩ ⟨ ψ i ∣
封闭量子系统的演化由酉算子来描述。系统初态为∣ ψ i ⟩ |\psi_i\rang ∣ ψ i ⟩ 的概率为p i p_i p i ,则演化发生后,系统会以概率p i p_i p i 进入状态U ∣ ψ ⟩ U|\psi_\rang U ∣ ψ ⟩ 。于是:
ρ ′ = ∑ i p i U ∣ ψ i ⟩ ⟨ ψ i ∣ U ⊺ = U ρ U ⊺ \rho'=\sum_ip_iU|\psi_i\rang\lang\psi_i|U^\intercal=U\rho U^\intercal
ρ ′ = i ∑ p i U ∣ ψ i ⟩ ⟨ ψ i ∣ U ⊺ = U ρ U ⊺
观测算子M m M_m M m 测量系统时,
p ( m ) = ∑ i p ( 测量结果为 m ∣ 系统状态为 i ) ∗ p i = ∑ i ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ p i = ∑ i t r ( M m ⊺ M m ∣ ψ i ⟩ ⟨ ψ i ∣ ) p i = t r ( M m ⊺ M m ρ ) p(m)=\sum_ip(测量结果为m|系统状态为i)*p_i\\
=\sum_i\lang\psi_i|M_m^\intercal M_m|\psi_i\rang p_i\\
=\sum_itr(M_m^\intercal M_m|\psi_i\rang\lang\psi_i|)p_i\\
=tr(M_m^\intercal M_m\rho)
p ( m ) = i ∑ p ( 测 量 结 果 为 m ∣ 系 统 状 态 为 i ) ∗ p i = i ∑ ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ p i = i ∑ t r ( M m ⊺ M m ∣ ψ i ⟩ ⟨ ψ i ∣ ) p i = t r ( M m ⊺ M m ρ )
考虑测量后的状态:
∣ ψ i m ⟩ = M m ∣ ψ i ⟩ ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ |\psi_i^m\rang=\frac{M_m|\psi_i\rang}{\sqrt{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang}}\\
∣ ψ i m ⟩ = ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ M m ∣ ψ i ⟩
注意:∣ ψ i m ⟩ |\psi_i^m\rang ∣ ψ i m ⟩ 是得到结果为 m 之后的状态!因此在计算测量得到结果为 m 后的密度算子ρ m \rho_m ρ m 时,应为:
ρ m = ∑ i p ( 系统状态为 i ∣ 得到测量结果 m ) ∣ ψ i m ⟩ ⟨ ψ i m ∣ \rho_m=\sum_ip(系统状态为i|得到测量结果m)|\psi_i^m\rang\lang\psi_i^m|\\
ρ m = i ∑ p ( 系 统 状 态 为 i ∣ 得 到 测 量 结 果 m ) ∣ ψ i m ⟩ ⟨ ψ i m ∣
由概率论基本原理,有:p ( i ∣ m ) = p ( i m ) p ( m ) = p ( m ∣ i ) p ( i ) p ( m ) = ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ p i t r ( M m ⊺ M m ρ ) p(i|m)=\frac{p(im)}{p(m)}=\frac{p(m|i)p(i)}{p(m)}=\frac{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang p_i}{tr(M_m^\intercal M_m\rho)} p ( i ∣ m ) = p ( m ) p ( i m ) = p ( m ) p ( m ∣ i ) p ( i ) = t r ( M m ⊺ M m ρ ) ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ p i ,所以:
ρ m = ∑ i ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ p i t r ( M m ⊺ M m ρ ) ⋅ M m ∣ ψ i ⟩ ⟨ ψ i ∣ M m ⊺ ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ = M m ρ M m ⊺ t r ( M m ⊺ M m ρ ) \rho_m=\sum_i\frac{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang p_i}{tr(M_m^\intercal M_m\rho)}\cdot \frac{M_m|\psi_i\rang\lang\psi_i|M_m^\intercal}{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang}=\frac{M_m\rho M_m^\intercal}{tr(M_m^\intercal M_m\rho)}
ρ m = i ∑ t r ( M m ⊺ M m ρ ) ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ p i ⋅ ⟨ ψ i ∣ M m ⊺ M m ∣ ψ i ⟩ M m ∣ ψ i ⟩ ⟨ ψ i ∣ M m ⊺ = t r ( M m ⊺ M m ρ ) M m ρ M m ⊺
处于某一个精确已知状态的量子系统称为处于纯态 (pure state)。在这种情况下,ρ = ∣ ψ ⟩ ⟨ ψ ∣ \rho=|\psi\rang\lang\psi| ρ = ∣ ψ ⟩ ⟨ ψ ∣ 。否则,就处于混合态 (mixed state),是在ρ \rho ρ 的系综中不同纯态的混合.
显然,对于一个纯态,t r ( ρ 2 ) = t r ( ∣ ψ ⟩ ⟨ ψ ∣ ψ ⟩ ⟨ ψ ∣ ) = ⟨ ψ ∣ ψ ⟩ ⟨ ψ ∣ ψ ⟩ = 1 tr(\rho^2)=tr(|\psi\rang\lang\psi|\psi\rang\lang\psi|)=\lang\psi|\psi\rang\lang\psi|\psi\rang=1 t r ( ρ 2 ) = t r ( ∣ ψ ⟩ ⟨ ψ ∣ ψ ⟩ ⟨ ψ ∣ ) = ⟨ ψ ∣ ψ ⟩ ⟨ ψ ∣ ψ ⟩ = 1 , 而对于一个混合态,t r ( ρ 2 ) < 1 tr(\rho^2)<1 t r ( ρ 2 ) < 1 . 有时人们用混合态表示纯态和混合态 (可以把纯态看作特殊的混合态).
混合态密度算子计算:如果系统以概率p i p_i p i 处于某混合态ρ i \rho_i ρ i (注意这里不是纯态的系综了!), 则系统的密度算子为ρ = ∑ i p i ρ i \rho=\sum_i p_i\rho_i ρ = ∑ i p i ρ i . 证明如下:
不妨记ρ i = ∑ j p i j ∣ ψ i j ⟩ ⟨ ψ i j ∣ \rho_i=\sum_jp_{ij}|\psi_{ij}\rang\lang\psi_{ij}| ρ i = ∑ j p i j ∣ ψ i j ⟩ ⟨ ψ i j ∣ 其中{ p i j , ∣ ψ i j ⟩ } \{p_{ij},|\psi_{ij}\rang\} { p i j , ∣ ψ i j ⟩ } (i 固定) 是一个纯态的系综。则
ρ = ∑ i , j ( p i ∗ p i j ) ∣ ψ i j ⟩ ⟨ ψ i j ∣ = ∑ i p i ∑ j p i j ∣ ψ i j ⟩ ⟨ ψ i j ∣ = ∑ i p i ρ i \rho=\sum_{i,j}(p_i*p_{ij})|\psi_{ij}\rang\lang\psi_{ij}|=\sum_ip_i\sum_jp_{ij}|\psi_{ij}\rang\lang\psi_{ij}|=\sum_ip_i\rho_i
ρ = i , j ∑ ( p i ∗ p i j ) ∣ ψ i j ⟩ ⟨ ψ i j ∣ = i ∑ p i j ∑ p i j ∣ ψ i j ⟩ ⟨ ψ i j ∣ = i ∑ p i ρ i
称ρ \rho ρ 为具有概率p i p_i p i 的状态ρ i \rho_i ρ i 的混合.
因此,可以考虑混合态测量后的进入的混合态:
ρ ′ = ∑ m p ( m ) ρ m \rho'=\sum_mp(m)\rho_m
ρ ′ = m ∑ p ( m ) ρ m
其中,如果系统得到结果为 m, 则系统会进入状态ρ m \rho_m ρ m . 即测量后系统以概率为p ( m ) p(m) p ( m ) 处于状态ρ m \rho_m ρ m . 故测量后系统状态为:
ρ ′ = ∑ m p ( m ) ρ m = ∑ m t r ( M m ⊺ M m ρ ) M m ρ M m ⊺ t r ( M m ⊺ M m ρ ) = ∑ m M m ρ M m ⊺ \rho'=\sum_mp(m)\rho_m=\sum_mtr(M_m^\intercal M_m\rho)\frac{M_m\rho M_m^\intercal}{tr(M_m^\intercal M_m\rho)}=\sum_mM_m\rho M_m^\intercal
ρ ′ = m ∑ p ( m ) ρ m = m ∑ t r ( M m ⊺ M m ρ ) t r ( M m ⊺ M m ρ ) M m ρ M m ⊺ = m ∑ M m ρ M m ⊺
# 密度算子的特征
一个算子ρ \rho ρ 是和某个系综{ p i , ∣ ψ i ⟩ } \{p_i,|\psi_i\rang\} { p i , ∣ ψ i ⟩ } 相联系的密度算子,当且仅当:
t r ( ρ ) = 1 tr(\rho)=1 t r ( ρ ) = 1
ρ \rho ρ 是半正定的。
证明如下:
若ρ \rho ρ 是密度算子,有t r ( ρ ) = ∑ i p i t r ( ∣ ψ i ⟩ ⟨ ψ i ∣ ) = ∑ i p i ⟨ ψ i ∣ I ∣ ψ i ⟩ = ∑ i p i = 1 tr(\rho)=\sum_i p_itr(|\psi_i\rang\lang\psi_i|)=\sum_ip_i\lang\psi_i|I|\psi_i\rang=\sum_ip_i=1 t r ( ρ ) = ∑ i p i t r ( ∣ ψ i ⟩ ⟨ ψ i ∣ ) = ∑ i p i ⟨ ψ i ∣ I ∣ ψ i ⟩ = ∑ i p i = 1 ,⟨ φ ∣ ρ ∣ φ ⟩ = ∑ i p i ∣ ⟨ φ ∣ ψ ⟩ ∣ 2 ≥ 0 \lang\varphi|\rho|\varphi\rang=\sum_ip_i|\lang\varphi|\psi\rang|^2\geq 0 ⟨ φ ∣ ρ ∣ φ ⟩ = ∑ i p i ∣ ⟨ φ ∣ ψ ⟩ ∣ 2 ≥ 0 。
反过来,因为