通常认为贝尔定理经常被用来证明自然界存在非局域性。也经常有人认为,纠缠经常被认为是一种非局域效应,使得纠缠粒子可以影响彼此,无论距离多远。然而,这两个说法不仅错误,而且可以证明,纠缠实际上确保了量子力学的局域性。
量子纠缠确保了局域性量子力学是一种统计理论,其中概率幅是复数值。它与其他概率理论的操作方式类似,但有一个例外:在量子力学中,事件可以具有负值或甚至是虚数的概率幅,而不仅仅是介于0和1之间的实数值。这就是量子力学特有的现象,其中正负概率可以相互抵消,这种现象在传统概率论中是无法实现的。我在一篇文章中尝试用简单的直觉来解释这种干涉现象。点击这里查看文章。
不仅我在那篇文章中解释了干涉现象,我还解释了当两个系统纠缠在一起时,就无法再单独给每个子系统分配状态矢量(复数概率幅值的集合),而只能分配给整体。因此,干涉效应仅属于整体系统,而在单个子系统中则不再存在。
在那篇文章中,我并没有深入实际的数学,但在本文中我将深入探讨。我们可以使用程序Octave(类似于MATLAB,但更强大)来展示这一点。首先,我们需要定义一些逻辑门。我们将使用的逻辑门只有两个:CX门和Hadamard门。逻辑门通过每一可能输入的行和相应的输出列来表示。如果是单量子比特门,那么你需要两行来表示输入的0和1,并需要两列来表示输出的0和1。如果是双量子比特门,那么你需要四行来表示输入的00、01、10和11,并需要四列来表示输出的00、01、10和11。接下来我们就来定义这两个逻辑门。
octave:1> H = 1/sqrt(2) * [ 1, 1; 1, -1 ]
H =
0.7071 0.7071
0.7071 -0.7071
% 矩阵H的每一项都是1除以平方根2的结果,形成了一个简单的正交矩阵。
octave:2> CX = [
> 1, 0, 0, 0;
> 0, 0, 0, 1;
> 0, 0, 1, 0;
> 0, 1, 0, 0
> ]
CX =
1 0 0 0
0 0 0 1
0 0 1 0
0 1 0 0
% 矩阵CX是一个置换矩阵,主要用于交换或排列向量中的元素。
对于 Hadamard 门,如果输入是 0,则我们查看第一列的输出,即对于 0 和 1,输出都是 1/sqrt(2)。这意味着 Hadamard 门会将一个处于本征态(即 0 或 1)的量子比特置于叠加态。CX 门只有当次量子比特为 1 时才会反转主量子比特。因此,00 的输出为 00,01 的输出为 11,10 的输出为 10,11 的输出为 01。你可以通过对比输入和输出与表格中的行和列来验证这一点。
应用逻辑门就是通过将操作与状态向量相乘来完成,如下,其中 U 表示一个幺正逻辑门。从物理角度来看,这可以理解为与某个粒子发生某种交互,导致你可能观察到的概率幅度发生变化。
我们可以从一个双量子位系统开始,它将由一个大小为4的状态向量表示,因为它将包含测量00、01、10和11概率振幅的列表。我们可以通过首先对最不显著的量子位应用哈达马德门,然后应用CX门来纠缠这两个量子位。最显著的量子位将根据最不显著的量子位的值进行翻转,但最不显著的量子位将处于状态叠加状态。结果是,这两个量子位将彼此相关,但整体上仍处于状态叠加中。
如下所示,在最终结果中,只有00和11这两种结果的概率是非零的,因此当你观察它们时,量子比特必定表现出相同的值,即使在观察之前它们处于状态叠加态。
octave:3> psi = [ 1; 0; 0; 0 ] # 设置量子态 psi 为初始状态 [1; 0; 0; 0]
psi =
1
0
0
0
octave:4> psi = kron(eye(2), H) * psi # 应用矩阵乘法,将H矩阵应用于psi状态
psi =
0.7071
0.7071
0
0
# 结果表明psi状态现在是 [0.7071; 0.7071; 0; 0]
octave:5> psi = CX * psi # 应用CX门操作到psi状态
psi =
0.7071
0
0
0.7071
# 结果表明psi状态现在是 [0.7071; 0; 0; 0.7071]
顺便说一下,你可以用克罗内克积把逻辑门拼接在一起,形成一个更大的门,该门的作用相当于并行运行它们。你需要在上述示例中(使用“kron”函数)这样做,因为我们有一个双量子比特系统(二体系统),它的规模太小,不足以应用单量子比特的Hadamard门,所以我们就用“eye”函数将它与单位矩阵做克罗内克积,从而形成一个新的逻辑门,该门对最重要的量子比特进行单位矩阵操作(即不做任何改变),而对次重要的量子比特应用Hadamard门。
假设我给你一个我对其执行了哈达玛门操作的单一量子比特。你可以从逻辑门矩阵中看出,输入0或1时,输出0或1的概率各为50%,因此它有50%的几率是0或1。然而,就像我在另一篇文章中展示的干涉例子一样,如果你两次应用哈达玛门操作,它会相互抵消,因此如果你一开始输入的是1,并且两次应用哈达玛门,那么输出仍然是1。
经典概率和量子概率的表现有所不同。想象一下,我以50%的概率随机给你一个0或1,然后让你对它应用Hadamard变换。按照逻辑门矩阵,无论输入是什么,经过Hadamard变换后,输出0和1的概率都是相等的。尽管在应用Hadamard变换之前,测量到0或1的初始概率都是50%,但在一种情况下,它会给你确定的结果,而在另一种情况下,它会给你随机的结果。
量子概率和经典概率之间的差异可以用密度矩阵来表示。密度矩阵是通过将状态向量的厄米共轭转置与其自身相乘来计算得到的。厄米共轭转置是先对矩阵进行转置,然后对所有元素取复共轭。
密度矩阵的对角线(从左上到右下)存储 Born 规则的概率值(0到1)。对于任何状态的叠加,至少在某些非对角线上(矩阵中不在对角线上的数字)会有非零项。但是,对于本征态,它们的所有非对角线元素总是为零。
下面你可以看到,在应用了Hadamard门之后,输出0和1的概率均为50%。此外,非对角线上的值也不为零。不过,对于本征态,非对角线上的值依然是零。
octave:7> [1; 0] * transpose(conj([1; 0]))
ans =
1 0
0 0
octave:8> [0; 1] * transpose(conj([0; 1]))
ans =
0 0
0 1
octave:9> (H * [0; 1]) * transpose(conj(H * [0; 1]))
ans =
0.5000 -0.5000
-0.5000 0.5000
你可以用每个本征态密度矩阵乘以其出现概率的线性组合来表示经典概率。这样你得到的矩阵对角线上的值是概率,其余都是零,这不会对应任何可能的量子态叠加情况。
比如下面的例子,我们将代表0和1的两个本征态密度矩阵各取0.5进行混合,得到一个新的密度矩阵,它在对角线上仍然是50%的概率为0和50%的概率为1,但在非对角线上全部是0,这与我们通过应用哈达玛门得到的密度矩阵不同。
octave:13> 0.5 * ([0; 1] * transpose(conj([ 0; 1 ]))) + 0.5 * ([1; 0] * transpose(conj([ 1; 0 ])))
// 这个代码计算了两个向量的内积并加权平均
ans =
0.5000 0
0 0.5000
// 结果为 0.5 和 0
为了展示这为何有趣,我们还需要引入 部分迹。回想一下,每当您拥有纠缠的粒子或量子位时,您不能将状态向量单独分配给单个粒子或量子位,而只能分配给整个系统。但是,如果我们想知道单个粒子单独会如何表现呢?您可以使用部分迹来计算这个,通过部分迹,您可以从纠缠系统的密度矩阵中“追踪出”(忽略)您不关心的粒子或量子位。下面是两个方程,第一个方程追踪出次位量子位,第二个方程追踪出高位量子位。
让我们回到我们的双边纠缠系统。还记得吗?让我们先算算它的密度矩阵,看看它是什么样子。你可以看到这是一个密度矩阵,在两条非对角上有非零值,这是一个可以与自己干涉的量子概率分布。
octave:14> psi
psi 是
0.7071
0
0
0.7071
这里 psi 是一个向量。
octave:15> p = psi * transpose(conj(psi))
结果 是
0.5000 0 0 0.5000
0 0 0 0
0 0 0 0
0.5000 0 0 0.5000
计算 psi 的Hermitian转置乘积。
现在,如果我们从纠缠系统中分离出最重要的量子比特,只剩下单个量子比特的密度矩阵,会发生什么?结果如下。我们得到的是一个经典的密度矩阵。也就是说,对于从纠缠对中分离出的单个量子比特而言,它会表现得像一个随机的经典量子比特。它不会表现出干涉现象。
在Octave环境中第20行
kron([1, 0], eye(2)) * p * kron(transpose(conj([1, 0])), eye(2)) + kron([0, 1], eye(2)) * p * kron(transpose(conj([0, 1])), eye(2))
/* 其中的kron表示克罗内克积,transpose表示转置,conj表示共轭。变量p在代码中未定义,这里假设它是一个已定义的矩阵。*/
这行代码计算了一个矩阵的克罗内克积并乘以另一个矩阵,然后加上另一个类似的计算结果。
结果为:
0.5000 0
0 0.5000
记得我们先是给单个量子位加上了哈达玛门,再用CX门让它与另一个量子位纠缠,形成了这个纠缠态。这意味着,单个量子位本来可以展示干涉效应,但和另一个量子位纠缠后,它就无法再和自己产生干涉了。确实,如下面的例子所示,如果我们只对最低位的量子位使用哈达玛门,并且不使用CX门,然后追踪最重要的量子位,我们就能看到密度矩阵中的非对角线元素有了非零值。
octave:21> kron(eye(2), H) * [1; 0; 0; 0]
结果为:
0.7071
0.7071
0
0
octave:22> 定义一个变量p为ans与ans的共轭转置的乘积
p =
0.5000 0.5000 0 0
0.5000 0.5000 0 0
0 0 0 0
0 0 0 0
octave:23> 计算kron([1, 0], eye(2))与p的乘积,再乘以kron([1, 0]的共轭转置, eye(2)),然后加上kron([0, 1], eye(2))与p的乘积,再乘以kron([0, 1]的共轭转置, eye(2))
结果为:
0.5000 0.5000
0.5000 0.5000
这表明计算结果是0.5和0.5。
纠缠一个量子位或粒子与另一个量子位或粒子会剥夺它与其自身发生干涉的能力,因为只有整个系统才能表现出干涉效应。确实,我们可以通过一个三元系统重复整个过程,将这三个量子位相互纠缠,然后不考虑其中一个。我们发现剩下的是两个量子位,它们无论是单独还是一起都不会与自身发生干涉。
>> psi = kron(CX, eye(2)) * kron(eye(2), CX) * kron(eye(4), H) * [1; 0; 0; 0; 0; 0; 0; 0]
psi =
0.7071
0
0
0
0
0
0
0.7071
>> p = psi * 共轭转置(psi)
p =
0.5000 0 0 0 0 0 0 0.5000
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0.5000 0 0 0 0 0 0 0.5000
>> kron([1, 0], eye(4)) * p * kron(共轭转置(conj([1, 0])), eye(4)) + kron([0, 1], eye(4)) * p * kron(共轭转置(conj([0, 1])), eye(4))
ans =
0.5000 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0.5000
>> kron([1, 0], eye(2)) * ans * kron(共轭转置(conj([1, 0])), eye(2)) + kron([0, 1], eye(2)) * ans * kron(共轭转置(conj([0, 1])), eye(2))
ans =
0.5000 0
0 0.5000
纠缠实际上保证了量子力学仍然是一个局域理论,而非远距互动的。为什么呢?首先,要使量子位纠缠起来,它们必须近距离接触才能相互作用。也就是说,它们之间的相互作用必须是近距离的。其次,一旦它们纠缠起来,它们将不会表现出干涉效应,而是像传统粒子那样表现。这意呈,唯一能看到干涉效应的方式是将纠缠粒子放在一起进行观测。
一个受影响不会影响另一个当这两个粒子分开时,它们将再次表现得像经典粒子一样。你对它们所做的任何事情都可以用经典理论来解释。有一种错误的说法认为当你与一个粒子互动时,另一个粒子会瞬间也做出反应,比如如果你反转了一个纠缠粒子对中的一个粒子,那么另一个粒子也会被反转成相反状态。当你对纠缠粒子对中的一个粒子进行操作时,另一个粒子也会被瞬间影响到,就像当你翻转一个粒子时,另一个粒子也会被翻转一样。
假设我们有两个纠缠的量子比特,它们变成00或11的概率是相等的。如果影响一个会相应地影响另一个,那么翻转其中一个,这将翻转另一个。这将改变概率分布为11和00,尽管这实际上与初始状态相同,因此实际上不会有任何改变。如果影响一个不会影响另一个,那么翻转第二个量子比特,会将00和11的概率分布变为01和10。这将把完全的正相关转变为完全的反相关。
假设我有两个信封,每个信封里都有一枚硬币。我将硬币这样混合,使得两个信封里的硬币要么都是正面朝上,要么都是反面朝上。因此,可能的结果是 HH(正面朝上)和 TT(反面朝上)。现在,假设我们将这些信封分开几百万英里之隔,然后才打开。你决定在打开之前将你的硬币翻个面。这样做会让结果从 HH 和 TT 变为 HT 和 TH。你的硬币结果肯定会和我的相反,但你并没有影响我的硬币。
我们可以在Octave中进行这个实验,如下。翻转其中一个量子比特后,00和11的等概率会变成01和10的等概率。这不会影响另一个量子比特,其表现也与经典情况相同。
>> X = [ 0, 1; 1, 0 ] # 定义一个2x2的交换矩阵
X =
0 1
1 0
>> psi = CX * kron(eye(2), H) * [ 1; 0; 0; 0 ] # 计算psi,使用克罗内克积和单位矩阵
psi =
0.7071
0
0
0.7071
>> kron(eye(2), X) * psi # 使用单位矩阵和克罗内克积与psi相乘
结果 =
0
0.7071
0.7071
0
确实,如果我们计算两个量子比特各自的约化密度矩阵,你会发现它们其实并没有变化。你对一个量子比特的操作不会影响另一个量子比特的约化密度矩阵。
这基本上就是 无通信定理 所展示的内容。如果你创建两个密度矩阵,其中一个是对两个纠缠的量子位,另一个是对经过某种幺正变换操作后的两个纠缠量子位,比如说对最不重要的那个量子位进行了操作,你通过部分迹操作可以得到最重要的量子位的约化密度矩阵,并证明这个约化密度矩阵总和没有对最不重要的量子位进行任何幺正变换时的情况相同。换句话说,这个约化密度矩阵总是与没有对最不重要的量子位进行任何幺正变换时的情况相同。
单独来看,它们彼此不会有任何影响。只有将它们放在一起时,你才会观察到它们的相互干涉。因此,干涉效应只能在局部观察到。它们不可能被远距离观察到。
因此,如果你坚持量子力学是非局域的,你就会陷入一个尴尬的境地,必须争辩这种非局域性是“勾结性的”。这种“勾结”必须隐藏在表面之下,无法被直接观测到,从而使得数学结果恰好与局域性的情况吻合。换句话说,这种非局域性必须以“勾结”的方式隐藏起来,不被我们发现。
在现实世界中,当你进行贝尔测试时,你首先在本地纠缠两个粒子,然后将它们分开一个巨大的距离,然后再将它们重新聚在一起并观察它们的干涉效应。如果你从未将它们重新聚在一起,就无法观察到任何违反贝尔不等式的现象。只有当你假设结果是预先确定的,贝尔测试才需要一些非局部的元素。我在那篇文章中讨论了这个问题:这里。
如果你认为结果是预先决定的,你必须预先设定所有这些值,但这将导致数学上的矛盾,除非你假设测量设置会改变结果的方式。然而,在贝尔测试中,测量是在两个粒子之间进行空间分布的。每个单独的粒子都必须受到可能远距离的测量设置的影响,从而暗示了非局域性。
然而,如果你不预设决定,那么你就无需为所有值预设具体数值,也就不会遇到这种矛盾情况。贝尔定理排除了局域性 隐变量 理论(暂且不讨论超决定论的问题),但并不排除局域性这一概念本身。
量子力学之所以是概率性的,并不是因为存在着某种隐藏变量,如果知道了这些变量就能预测结果。量子力学之所以是概率性的,是因为结果本身不是预先确定的。我们不知道的是将来与之互动时它的结果会是什么。当然,但这在实际中是不可能的,因为它等同于知道未来。和所有统计理论一样,它之所以是统计性的,是因为我们对某些信息一无所知,但在这种情况下,我们无知的是这些无法提前获得的信息。
无“崩溃”的非局部性现在,你可能会说,即使两个粒子互不影响,测量其中一个粒子是否会瞬间坍缩其波函数,因此,坍缩是否是一个非局域事件?不,原因很简单:其实并没有波函数坍缩这回事。我不是在多宇宙论的背景下这么说的。我已经写过一篇文章在这里阐述了我认为多世界解释是不一致的。按其本来的意思来看,量子力学并没有所谓的“坍缩假设”,这一点常被这样表述。
确实,当你观察到一个确定的结果时,你会将状态向量缩减为1,无论你看到的是哪种结果。然而,这与“塌缩”没有任何关系,也不是一个公设。这只是概率运作的方式。如果我抛硬币,当它在空中时,是正面的概率是50%,是反面的概率也是50%。如果它落在了正面,我看到了结果,我会更新我的预测,将正面的概率更新为100%,反面的概率更新为0%,因为我知道了结果。这并不是一个独立的公设或假设,而是概率定义必然得出的结果。如果我们已经同意状态向量代表概率幅值,那么这直接由定义得出,并不是在这个定义之上的额外公设。你无需额外假设,在观察时会自然将概率分布调整为已知结果。
这里的问题是,人们倾向于将状态向量物化,而状态向量只是概率幅的列表。他们声称状态向量不是概率幅的列表,而是表示一个物体——物理波的维度或属性。这种对状态向量的理解意味着你扰动波使其物理上“坍缩”成单一粒子。
然而,这只是极其荒谬的信念。如果有1枚硬币,我会给它分配2个概率振幅,分别对应0和1。如果有2枚硬币,我会分配4个振幅,分别对应00、01、10和11。如果有4枚硬币,我会分配8个振幅,分别对应000、001、010、011、100、101、110和111。振幅的数量没有上限,并且随着硬币数量的增加,振幅的数量呈指数级增长。
由于状态矢量只是一个概率幅的列表,它随着考虑的粒子数量增加,其增长是无限制且呈指数级的。如果每个幅值实际上并不表示概率,而是描述波的一种维度,那么这种波的维度数将是无限的。这种波将不会存在于我们简单的四维时空之中,而是存在于一个无限维度的希尔伯特空间中。
人们喜欢通过想象波在双缝实验中穿过两个缝隙来自我欺骗,认为这样可以直观地理解波的现象,从而觉得自己对正在发生的事情有某种“直觉”。然而,他们只是在自欺欺人。波穿过两个缝隙实际上存在于希尔伯特空间,而不是普通的时空,因此任何将它描述成在空间中移动的波的描绘本质上都是错误的。这只是对实际发生情况的一种错误描述。
确实,这种将事物想象成在空间中波动从而获得“直观”理解的想法只会造成困惑并浪费时间。一旦尝试将这种图像应用于其他任何东西上,它就会变得不再适用。考虑一个量子计算机,其中量子位的状态由电子自旋决定。电子基本保持在原地不动,不像光子那样在空间中移动,但你仍然会为这个量子计算机中的状态向量随逻辑门操作而随时间演化分配一个状态。
仅仅用100个电子,这个波就会存在于一个超过10³⁰维的希尔伯特空间中。地球上只有大约10¹⁸粒沙子。在整个程序运行过程中它不会移动。你又怎么去想象这种事情呢?错误地认为你能做到,并试图把量子计算想象成波浪,只会让你浪费时间。这只是一个思维上的把戏,让你误以为可以用一种根本无法在其他地方应用的错误方法来理解双缝实验。我希望从来没人告诉我这样去思考,因为它确实给我最初的困惑添了不少麻烦,当我试图这样想象时,它一点帮助也没有,只是让我更加困惑而已。
不需要将状态矢量当作字面上的波来看待,而是当作一组复杂的概率幅值。这些复数值的性质导致了干涉现象。光的波动行为不是单个粒子的特性,也不是说单个粒子会因为不被观察而变成波。实际上,对于单个粒子来说,根本不存在波动性。我们实际观察到的波动,比如光的波动性,是从大量粒子的干涉现象中弱化地涌现出来的。观察到的波动,如干涉图案,应当被视为与粒子个体行为的概率性不同的、独立的涌现现象。
当你做出这种区分时,就比较容易理解为什么分离纠缠的两个粒子并测量其中一个,并不会对另一个产生远距离的影响。状态向量依然是概率振幅的列表,因此它是一个预见工具,并不是在说明系统。比如说,一枚硬币有50%的可能是正面,50%的可能是反面,我并不是在说这枚硬币处于两者之间的某种中间状态,而是在说我对于结果的预见,就像赌博中的概率一样。
如果我有纠缠的量子比特,我的胜算最初是00有50%,11也有50%。如果我测量其中一个,测量得到00,那么我就把我的胜算更新为100%对00和0%对11。这并不意味着我通过更新预测就扰动了另一个粒子。没有所谓的“坍缩”的巨大波连接我和另一个人。我只是根据概率的运作方式来更新预测。
记得我说过,相信量子力学是非局域的,由于诺通讯定理,意味着一种隐秘的非局域性。那些认为粒子实际上会在希尔伯特空间里变成波,直到你观察它们并使它们塌缩成粒子的人,相信自然界中存在着超光速信号传递,只是隐藏在我们无法察觉的地方。
考虑例如,如果爱丽丝和鲍勃共享一个纠缠粒子,爱丽丝测量了她的粒子。如果你认为状态向量真的代表了一种物理波,那么在那一刻,爱丽丝坍缩了一种巨大的波,这种波从爱丽丝延伸至鲍勃,在两端各留下了一个粒子。如果鲍勃以某种方式能够不坍缩波而看到这种波,他将立即收到爱丽丝所做事情的信号,速度超过光速,从而违反了光速的限制。
当然,毕竟鲍勃无法直接观察到波函数而不将其坍缩。如果鲍勃在爱丽丝之前尝试观察,他会自己将波函数坍缩,因此也无法接收到来自爱丽丝的信息。然而,这仍然意味着自然界确实存在超光速信号传递的现象,只是这种信号传递方式像是阴谋般,每当你试图观察它时,它就会消失。它总是隐藏在你无法观察到的地方,而你能观察到的现象完全是局部的。但如果有一个像神一样能够看到自然界真实状态的存在,他们就能利用这种超光速信号传递来工作。
为什么要相信自然会以一种看起来是局域性的方式运作,实际上在我们无法观察到的表面之下具有非局域性呢?为什么不简单地相信自然就是局域性的?这种结论仅仅基于我们能观察到的现象,并不需要假设这些无法观察到的无限维度的非局域性波,这些波就像纸牌屋一样,在你看它们的时候就会倒塌。
共同学习,写下你的评论
评论加载中...
作者其他优质文章