$\gdef\b#1{\boldsymbol{#1}}\gdef\d{\mathrm{d}}$
这篇笔记是学普物二时为了理解磁场和电场本质一致的关系时写的,侧重于理解狭相的推导过程。好像这学期普物一也会用,大家可以参考。
这篇文章里没包含的内容:
- 用闵氏空间语言讲相对论,包括时空间隔的几何意义、四维矢量,以及一些高级的上下标表示法。
- 钟慢、尺缩、质量的三个实验详细推导。
- 双生子佯谬。
- 四维加速度的推导(其实应该算是四维力的前置,但是后续只有力变换用得着,我就没推)。
公理 1:在任意惯性系内,所有物理规律都是相同的。
这里“惯性系”根本没定义,我们可以理解成,是这几条公理定义了惯性系,或者说惯性系要满足这几条公理。
公理 2:在任意惯性系内,光速均 $=c$。
公理 *:如果从惯性系 $A$ 来看,惯性系 $B$ 相对于 $A$ 以 $\b v$ 的速度运动,那么从惯性系 $B$ 来看,惯性系 $A$ 相对于 $B$ 以 $-\b v$ 的速度运动。
这条公理本来是可以由前两条公理推导出来,但是太复杂了(详见这里),所以就默认它也算公理了。
惯性系的描述:一个惯性系中,事件可以用三维空间加一维时间 $(x,y,z,t)$ 描述。同一个惯性(参考)系可以有很多惯性坐标系,但这些坐标系直接只是平移(含时间)和旋转(不含时间)关系,所以这个不是重点。注意,对坐标进行拉伸或压缩后,得到的并不是合法的惯性坐标系。
惯性系中的观测:可以认为,当一个事件发生时,这个惯性系可以立即得到其坐标,而并非一个站在原点处的人通过眼睛观测这个事件。书中具体实现这个事情,是通过在三维空间的每一点放一个钟,然后对时。
$$
\boxed{\gamma=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}}}
$$
钟慢效应:当一个钟在运动时(不一定是惯性地),它本身有一个固有时 $\tau$。这个固有时与观测它的参考系无关。
通过对车上法向测距的几何分析(自己看书)(注意需要假设与速度垂直方向空间不伸缩)可得 $\Delta t=\gamma\Delta\tau$。
注意这个式子的含义不是“在系 $A^\prime$ 中经过了 $\Delta\tau$ 时间,对应在系 $A$ 中经过了 $\gamma\Delta\tau$ 时间”,这个对应是非良定义的。它的严格表述是,“在 $A^\prime$ 中同一点处发生的间隔 $\Delta\tau$ 的事件,从 $A$ 中来看是间隔 $\gamma\Delta\tau$ 的事件”。
尺缩效应:类似地,如果两点相对于钟静止,那么两点之间的距离就是固有长度 $l_0$。
通过对车上径向测距的几何分析(注意需要依赖钟慢效应的推导)可得(与速度方向相同的杆)$l=l_0/\gamma$。
更一般的尺缩效应会在下面解释。
同时相对性:一个系对时的过程中出现两处同时收到光信号,从另一个系看来是不同时的。注意这是一个定性的规律,因为从另一个系来看的长度还需分析。
洛伦兹变换推导:
这里我们默认两个参考系的 $(0,0)$ 重合。
-
一维洛伦兹变换的推导(依赖于钟慢、尺缩):
我们首先不加证明地说,变换存在,且是线性的。
钟慢效应说,在参考系 $A^\prime$ 中发生的事 $(0,0)-(0,t)$,可以对应到 $A$ 中发生的事 $(0,0)-(v\gamma t,t)$;
尺缩效应需要改一下才能用,书里说的是,长度的测量是通过“激光测距仪”实现的,这个不好搞。考虑这样:$A^\prime$ 中有一根 $-l\sim 0$ 的棍子,它的两端经过 $A$ 中的原点作为两个事件。$A^\prime$ 中是 $(0,0)-(-l,l/v)$,$A$ 中则由于两次测的点相同,故反用钟慢效应,是 $(0,0)-(0,l/\gamma v)$。
于是我们有方程: $$ \left\{\begin{align*} \begin{bmatrix}0\\ t\end{bmatrix}&=\begin{bmatrix}a_{11}&a_{12}\\ a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}v\gamma t\\ t\end{bmatrix}\\ \begin{bmatrix}-l\\ \frac lv\end{bmatrix}&=\begin{bmatrix}a_{11}&a_{12}\\ a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}0\\ \frac{l}{\gamma v}\end{bmatrix} \end{align*}\right. $$ 解得 $$ \Lambda=\begin{bmatrix}\gamma&-\gamma v\\ -\frac{\gamma v}{c^2}&\gamma\end{bmatrix} $$
-
一维洛伦兹变换的推导(依赖于时空间隔不变性)(《电动力学》(郭硕鸿)):
光速不变的说法强于 $\sqrt{x^2+y^2+z^2}=ct\Leftrightarrow \sqrt{{x^\prime}^2+{y^\prime}^2+{z^\prime}^2}=ct^\prime$。我们可以说时空间隔是不变量 $$ x^2+y^2+z^2-c^2t^2={x^\prime}^2+{y^\prime}^2+{z^\prime}^2-c^2{t^\prime}^2 $$ 于是 $$ (a_{11}x+a_{12}t)^2-c^2(a_{21}x+a_{22}t)^2=x^2-c^2t^2 $$ 给出了三个方程(比对 $x^2$、$xt$、$t^2$ 的系数)。另外,考虑到 $v$,我们知道 $A$ 中的 $(vt,t)$ 对应着 $A^\prime$ 中的 $(0,?)$。于是 $$ \left\{ \begin{align*} a_{11}^2-a_{21}^2&=1\\ a_{11}a_{12}-c^2a_{21}a_{22}&=0\\ a_{12}^2-c^2a_{22}^2&=-c^2\\ a_{11}v+a_{12}&=0 \end{align*} \right. $$ 其中 $a_{11},a_{22}>0$。解得同样的结果。
- 注:为什么我们必须要么构造实际场景,要么用有额外公理之感的时空间隔不变性,才能证明洛伦兹比变换呢?因为公理 2 要是用严格的语言描述,必须引入闵氏空间,就很麻烦了。
-
三维洛伦兹变换的推导(https://zhuanlan.zhihu.com/p/266509750):我们固然可以用基变换矩阵,但是另两维其实没必要分开。
空间的拉伸,只需将 $\b x=(x,y,z)$ 分解为与速度方向共线与垂直的两部分即可(至于垂直为啥不变,我也不知道)。即: $$ \left\{\begin{align*} \b x_{\parallel}&=\frac{\b x\cdot\b v}{v^2}\b v\\ \b x_{\perp}&=\b x-\b x_{\parallel}\\ \begin{bmatrix}|\b x_{\parallel}^\prime|\\ \b x_{\perp}^\prime\\ t^\prime\end{bmatrix}&=\begin{bmatrix}\gamma&0&-\gamma v\\ 0&1&0\\ -\frac{\gamma v}{c^2}&0&\gamma\end{bmatrix}\begin{bmatrix}|\b x_{\parallel}|\\ \b x_{\perp}\\ t\end{bmatrix} \end{align*}\right. $$ 于是 $$ \begin{align*} &\b x^\prime=\b x_\parallel^\prime+\b x_\perp=\gamma\b x_\parallel-\gamma\b vt+\b x-\b x_\parallel\\ &t^\prime=-\frac{\gamma v}{c^2}|\b x_\parallel|+\gamma t=-\frac{\gamma}{c^2}|\b x\cdot\b v|+\gamma t \end{align*} $$
主要要展开的就是(这里 $v$ 再加粗就太阴间了……) $$ \b x_\parallel=\frac{xv_x+yv_y+zv_z}{v^2}\begin{bmatrix}v_x\\ v_y\\ v_z\end{bmatrix} $$ 于是 $$ \b x^\prime=\begin{bmatrix} \gamma tv_x+x+(\gamma-1)\frac{v_x^2}{v^2}x+(\gamma-1)\frac{v_xv_y}{v^2}y+(\gamma-1)\frac{v_xv_z}{v^2}z\\ \gamma tv_y+(\gamma-1)\frac{v_yv_x}{v^2}x+y+(\gamma-1)\frac{v_y^2}{v^2}y+(\gamma-1)\frac{v_yv_z}{v^2}z\\ \gamma tv_z+(\gamma-1)\frac{v_zv_x}{v^2}x+(\gamma-1)\frac{v_zv_y}{v^2}y+z+(\gamma-1)\frac{v_z^2}{v^2}z\\ \end{bmatrix} $$ 即 $$ \begin{bmatrix}x^\prime\\ y^\prime\\ z^\prime\\ t^\prime\end{bmatrix}= \begin{bmatrix} 1+(\gamma-1)\frac{v_x^2}{v^2}&(\gamma-1)\frac{v_xv_y}{v^2}&(\gamma-1)\frac{v_xv_z}{v^2}&\gamma v_x\\ (\gamma-1)\frac{v_yv_x}{v^2}&1+(\gamma-1)\frac{v_y^2}{v^2}&(\gamma-1)\frac{v_yv_z}{v^2}&\gamma v_y\\ (\gamma-1)\frac{v_zv_x}{v^2}&(\gamma-1)\frac{v_zv_y}{v^2}&1+(\gamma-1)\frac{v_z^2}{v^2}&\gamma v_z\\ -\gamma\frac{v_x}{c^2}&-\gamma\frac{v_y}{c^2}&-\gamma\frac{v_z}{c^2}&\gamma \end{bmatrix} \begin{bmatrix}x\\ y\\ z\\ t\end{bmatrix} $$
用洛伦兹变换解释尺缩效应:值得注意的是,上面说的“尺缩效应”是一般情况的特例。简单分析是无法得到一般情况的。有洛伦兹变换之后就可以分析了。
尺缩效应的表述是“在系 $A^\prime$ 中沿运动方向的长为 $l_0$ 的静止的杆,对应在系 $A$ 中长为 $l_0/\gamma$”。必须定义的是,如何在一个参考系中测量一个运动的杆:如果在系 $A$ 中有两个事件 $(x_0,t)$ 和 $(x_1,t)$(这里简化就用一维空间了),第一个事件是该地该时观测到杆的一头在该地,第二个事件是(另一)该地(同一)该时观测到杆的另一头在该地,那么 $|x_1-x_0|$ 就是观测到的长度。
那么严格的推导是 $l_0=x_1^\prime-x_0^\prime=\Lambda_{11}x_1+\Lambda_{12}t-\Lambda_{11}x_0-\Lambda_{12}t=\gamma(x_1-x_0)=\gamma l$。
现在我们可以明确,所谓“$A^\prime$ 比 $A$ 慢/短,反过来 $A$ 又比 $A^\prime$ 慢/短”,只是没有搞清钟慢和尺缩的严格表述犯的错,这两个效应不能正反连续两次应用(不是“对合”的)。
速度变换:速度显然可以定义为,如果质点在两处分别出现的事件为 $(x_0,t_0)$ 和 $(x_0+\d x,t_0+\d t)$,那么 $v=\frac{\d x}{\d t}$。如果系 $A$ 中有个质点以 $v$ 的速度移动,而系 $A$ 相对于 $A^\prime$ 以 $v_0$ 的速度移动,那么从 $A^\prime$ 看来, $$ v^\prime=\frac{\d x^\prime}{\d t^\prime}=\frac{\Lambda_{11}\d x+\Lambda_{12}\d t}{\Lambda_{21}\d x+\Lambda_{22}\d t}=\frac{\gamma_0\d x+\gamma_0v_0\d t}{\frac{\gamma_0v_0}{c^2}\d x+\gamma_0\d t}=\frac{v+v_0}{\frac{v_0v}{c^2}+1} $$ 从这里开始,$\gamma_0$ 表示 $v_0$ 对应的洛伦兹因子,$\gamma$ 表示 $v$ 对应的。如果是垂直方向的速度,则 $$ v_y^\prime=\frac{\d y}{\d t^\prime}=\frac{\d y}{\frac{\gamma_0v_0}{c^2}\d x+\gamma_0\d t}=\frac{v_y}{\gamma_0\left(\frac{v_0v_x}{c^2}+1\right)} $$ 例:两个相对地球反向分别以 $0.5c$ 的速度运动的飞船,从一架飞船上看另一架,相对速度为 $$ \frac{0.5c+0.5c}{0.25+1}=0.8c $$ 动量定义:对于一个参考系中一个运动的质点,其动量 $\b p$ 为一个与它运动方向同向的向量。不同系中动量由于速度不同可能不同,但必须只依赖于 $v$ 和质点本身的性质(而不依赖于参考系),必须满足动量守恒。
质量定义:对于 $\b v\ne 0$ 的质点,动质量 $m_v$ 定义为使得 $\b p=m_v\b v$ 的标量,特殊地定义静质量 $m_0$,经过后续推导可知 $m_v$ 在 $v=0$ 处右连续。质量必须满足质量守恒。
质量变换:考虑 $A$ 中静质量相同的两个质点,一动一静发生完全非弹性碰撞。考虑与碰撞后状态相对静止的另一个系 $A^\prime$。在两个系中分别列出动量守恒与质量守恒方程,可以解得 $$ m_v=\gamma m_0 $$ 同理可以得出动量变换,它有个更优美的形式,所以我们放到能量之后讲。
力的定义:和速度类似,$\b F=\frac{\d\b p}{\d t}$。
功与能量:功的定义和经典力学一样:
$$
\begin{align*}
\d W&=\b F\cdot\d\b x\\
&=\frac{\d\b p\cdot\d\b x}{\d t}\\
&=\b v\cdot\d\b p\\
&=\b v\cdot\d(\gamma m_0\b v)\\
&=m_0(v^2\d\gamma+\gamma\b v\cdot\d\b v)\\
&=m_0v(v\d\gamma+\gamma\d v)\\
&=m_0\gamma^3v\d v\\
&=m_0c^2\d\gamma
\end{align*}
$$
(最后两行就是在凑积分)也就是说,定义能量变化量为做功的话,
$$
\Delta E=W=\Delta\gamma m_0c^2=\Delta m_vc^2
$$
也是只跟初末状态有关。$m_0c^2$ 被称为静能,$(\gamma-1)m_0c^2$ 被称为动能,$m_vc^2=\gamma m_0c^2$ 被称为总能。
动质量、动量、总能都是守恒量,但参考系不同会不同;静质量不是守恒量,但与参考系无关。考虑一个质量转换成能量的例子:原来一个静止的物体爆炸,碎片向各处飞去。动质量守恒说明,原静质量等于现动质量之和,从而大于现静质量之和。少的质量充当动能。
最后,我们可以推出能量与动量的关系:
$$
E^2=\gamma^2m_0^2c^4=\frac{1-\frac{v^2}{c^2}+\frac{v^2}{c^2}}{1-\frac{v^2}{c^2}}m_0^2c^4=m_0^2c^4+\gamma^2m_0^2v^2c^2=E_0^2+p^2c^2
$$
四维速度与四维动量:我们希望用洛伦兹变换矩阵直接表示速度、动量变换。考虑速度,其一大问题在于,它在变换后是两个变换量之比 $\frac{\d\b x^\prime}{\d t^\prime}$,这个没法方便地写成线性变换的形式。很容易想到,我们希望让分母变成一个不需变换的东西。所以考虑定义一种初看起来有些不伦不类的速度:对于在系 $A$ 中运动的一个质点,它本身有一个固有时 $\tau$。若它在 $\d\tau$ 的时间内,从 $A$ 观测走了 $\d\b x$,定义 $\b u=\frac{\d\b x}{\d\tau}$。
由于 $\tau$ 与选取的参考系无关,现在我们就有(可根据实际情况选取一维空间或三维空间的 $\Lambda$)
$$
\begin{bmatrix}\frac{\d\b x^\prime}{\d \tau}\\ \frac{\d t^\prime}{\d\tau}\end{bmatrix}=\Lambda\begin{bmatrix}\frac{\d\b x}{\d\tau}\\ \frac{\d t}{\d\tau}\end{bmatrix}
$$
而 $\frac{\d}{\d\tau}=\frac{\d}{\d t}\frac{\d t}{\d\tau}=\gamma\frac{\d}{\d t}$,从而
$$
\begin{bmatrix}\gamma^\prime\b v^\prime\\ \gamma^\prime\end{bmatrix}=\Lambda\begin{bmatrix}\gamma\b v\\ \gamma\end{bmatrix}
$$
同样可以在 $\Lambda$ 中代入 $-v_0$,求出 $v_x^\prime$ 与 $v_x$ 的关系,与上面那种推导校验。
动量变换反而容易了!因为 $\b p=\gamma m_0\b v$,直接就有
$$
\begin{bmatrix}\b p^\prime\\ m_{v^\prime}\end{bmatrix}=\Lambda\begin{bmatrix}\b p\\ m_v\end{bmatrix}
$$
四维力:动量非常自然地把 $\d\tau$ “吸收”进了 $\gamma$,于是我们又可以通过 $/\d\tau$ 定义一个怪怪的力了!(大雾)
$$
\begin{bmatrix}\frac{\d\b p^\prime}{\d\tau}\\ \frac{\d m_{v^\prime}}{\d\tau}\end{bmatrix}=\Lambda\begin{bmatrix}\frac{\d\b p}{\d\tau}\\ \frac{\d m_v}{\d\tau}\end{bmatrix}
$$
上面就是 $\gamma\b F$,但是下面这个呢?实际算问题的时候鬼知道 $\frac{\d m_v}{\d\tau}$ 是多少啊……
$$
\frac{\d m_v}{\d\tau}=m_0\frac{\d\gamma}{\d\tau}=\frac{\b F\cdot\d\b x}{c^2\d\tau}=\frac{\b F\cdot\b u}{c^2}=\gamma\frac{\b F\cdot\b v}{c^2}
$$
第二个等号参见功与能量那边的推导。于是(网上有些文章是把 $/\d t$ 的速度记成 $\b u$,不要搞混了)
$$
\begin{bmatrix}\gamma^\prime\b F^\prime\\ \gamma^\prime\frac{\b F^\prime\cdot\b v^\prime}{c^2}\end{bmatrix}=\Lambda\begin{bmatrix}\gamma\b F\\ \gamma\frac{\b F\cdot\b v}{c^2}\end{bmatrix}
$$
于是我们发现,力的变换不仅与时空有关系,还与质点当前的速度有关系。
四维加速度见 https://zhuanlan.zhihu.com/p/114045707。另一个比较靠谱的推导 https://dsl.nju.edu.cn/litao/teach/Ch6.pdf。
参考书:《从零学相对论》(梁灿彬、曹周键),《新概念物理学教程 力学》(赵凯华、罗蔚茵)。