专栏文章

广义相对论基础导引 第一部分

科技·工程参与者 16已保存评论 15

文章操作

快速查看文章及其快照的属性,并进行相关操作。

当前评论
15 条
当前快照
1 份
快照标识符
@mj4joayl
此快照首次捕获于
2025/12/14 01:03
2 个月前
此快照最后确认于
2026/02/14 01:30
5 天前
查看原文

第一章:微分几何基础

1.1 可微流形 (Differentiable Manifolds)

这一节是整个广义相对论的“数据结构定义”。我们将展示如何从一堆局部看起来像欧几里得空间(Rn\mathbb{R}^n)的碎片,通过严格的接口协议拼装成一个全局的弯曲空间。

定义 1.1.1:拓扑流形 (Topological Manifold)

一个 nn 维拓扑流形 M\mathcal{M} 是一个拓扑空间,满足以下三条公理:
  1. Hausdorff 性 (分离公理):对于任意不同两点 p,qMp, q \in \mathcal{M},存在不相交的开集 Op,OqO_p, O_q 分别包含 ppqq
    • CS 类比:保证了点的“可区分性”。如果没有这条,可能会出现两个无法通过逼近算法区分的“重叠点”。
  2. 第二可数性 (Second Countable):存在可数的拓扑基。
    • CS 类比:保证了流形不会过大/过于离散,确保了分割(Partition of Unity)的存在,这是定义积分和度量的基础。
  3. 局部欧氏性 (Locally Euclidean):对于 pM\forall p \in \mathcal{M},存在一个邻域 UpU \ni p 和一个同胚映射(连续且逆连续的双射) ϕ:UU^Rn\phi: U \to \hat{U} \subseteq \mathbb{R}^n,其中 U^\hat{U}Rn\mathbb{R}^n 中的开集。

定义 1.1.2:坐标卡 (Coordinate Chart)

对元组 (U,ϕ)(U, \phi) 称为流形上的一个坐标卡 (Chart)
  • 坐标映射ϕ(p)=(x1,x2,...,xn)Rn\phi(p) = (x^1, x^2, ..., x^n) \in \mathbb{R}^n。这被称为点 pp 在该坐标卡下的局部坐标
  • 参数化映射:逆映射 ϕ1:U^U\phi^{-1}: \hat{U} \to URn\mathbb{R}^n 中的数据“还原”回流形上的点。

定义 1.1.3:光滑图集与微分结构 (Smooth Atlas & Differential Structure)

这是“可微”二字的关键。单个坐标卡只能覆盖局部,要描述整个流形,我们需要覆盖全集的图集 (Atlas) A={(Uα,ϕα)}αI\mathcal{A} = \{(U_\alpha, \phi_\alpha)\}_{\alpha \in I}
若两个坐标卡 (Uα,ϕα)(U_\alpha, \phi_\alpha)(Uβ,ϕβ)(U_\beta, \phi_\beta) 有重叠(UαUβU_\alpha \cap U_\beta \neq \emptyset),则定义坐标转换函数 (Transition Map) ψβα\psi_{\beta\alpha}
ψβα=ϕβϕα1:ϕα(UαUβ)ϕβ(UαUβ)\psi_{\beta\alpha} = \phi_\beta \circ \phi_\alpha^{-1} : \quad \phi_\alpha(U_\alpha \cap U_\beta) \to \phi_\beta(U_\alpha \cap U_\beta)
这是一个从 Rn\mathbb{R}^n 的子集到 Rn\mathbb{R}^n 的子集的普通函数。
  • A\mathcal{A} 中所有的转换函数 ψβα\psi_{\beta\alpha} 都是 CC^\infty (无穷阶可微) 的,则称 A\mathcal{A}光滑图集
  • 装备了最大光滑图集的拓扑流形称为光滑流形 (Smooth Manifold)

1.1.4 构建圆 (S1S^1) 的微分结构

问题描述: 证明单位圆 S1={(x,y)R2x2+y2=1}S^1 = \{ (x, y) \in \mathbb{R}^2 \mid x^2 + y^2 = 1 \} 是一个 1 维可微流形。 注意:圆是一个嵌入在 2 维空间的 1 维对象,但我们不能直接用极坐标角度 θ[0,2π)\theta \in [0, 2\pi) 作为一个全局坐标卡,因为在 002π2\pi 的连接处不连续。我们需要至少两个坐标卡。
解题步骤:我们使用立体投影 (Stereographic Projection) 来构建图集。

步骤 1:构造坐标卡 11 (北极投影)

取去心北极点 N=(0,1)N=(0, 1) 的圆 UN=S1{N}U_N = S^1 \setminus \{N\}。 定义映射 ϕN:UNR\phi_N: U_N \to \mathbb{R},将圆上一点 (x,y)(x, y) 连线 NN,投射到 XX 轴 (y=0y=0) 上。 通过简单的几何相似关系推导投影公式: u=ϕN(x,y)=x1yu = \phi_N(x, y) = \frac{x}{1-y} 其逆映射(参数化)ϕN1:RUN\phi_N^{-1}: \mathbb{R} \to U_N 为(解方程组): x=2uu2+1,y=u21u2+1x = \frac{2u}{u^2+1}, \quad y = \frac{u^2-1}{u^2+1} 显然,ϕN\phi_NϕN1\phi_N^{-1} 在其定义域内连续。

步骤 2:构造坐标卡 22 (南极投影)

取去心南极点 S=(0,1)S=(0, -1) 的圆 US=S1{S}U_S = S^1 \setminus \{S\}。 定义映射 ϕS:USR\phi_S: U_S \to \mathbb{R},将圆上一点 (x,y)(x, y) 连线 SS,投射到 XX 轴上。 公式为: v=ϕS(x,y)=x1+yv = \phi_S(x, y) = \frac{x}{1+y} 其逆映射 ϕS1:RUS\phi_S^{-1}: \mathbb{R} \to U_S 为: x=2v1+v2,y=1v21+v2x = \frac{2v}{1+v^2}, \quad y = \frac{1-v^2}{1+v^2}

步骤 3:分析重叠区域与转换函数

图集 A={(UN,ϕN),(US,ϕS)}\mathcal{A} = \{(U_N, \phi_N), (U_S, \phi_S)\} 覆盖了 S1S^1(因为没有任何点既是北极又是南极)。 重叠区域 UNS=S1{N,S}U_{N \cap S} = S^1 \setminus \{N, S\}
我们需要计算从 uu 坐标系变换到 vv 坐标系的转换函数 ψSN=ϕSϕN1\psi_{SN} = \phi_S \circ \phi_N^{-1}。 思路:
  1. 输入 uu
  2. 通过 ϕN1\phi_N^{-1} 还原为流形上的点 (x,y)(x, y)
  3. (x,y)(x, y) 喂给 ϕS\phi_S 得到 vv
计算:
v=ϕS(2uu2+1,u21u2+1)=x1+yv = \phi_S \left( \frac{2u}{u^2+1}, \frac{u^2-1}{u^2+1} \right) = \frac{x}{1+y}
代入 x,yx, yuu 表达式:
v=2uu2+11+u21u2+1=2uu2+1u2+1+u21u2+1=2u2u2=1uv = \frac{ \frac{2u}{u^2+1} }{ 1 + \frac{u^2-1}{u^2+1} } = \frac{ \frac{2u}{u^2+1} }{ \frac{u^2+1 + u^2-1}{u^2+1} } = \frac{2u}{2u^2} = \frac{1}{u}
所以,转换函数为:
ψSN(u)=1u\psi_{SN}(u) = \frac{1}{u}
定义域为 ϕN(UNS)=R{0}\phi_N(U_{N \cap S}) = \mathbb{R} \setminus \{0\}

步骤 4:验证微分结构 (Compatibility Check)

函数 f(u)=1/uf(u) = 1/uR{0}\mathbb{R} \setminus \{0\} 上是 CC^\infty (光滑) 的。(其导数为 1/u2-1/u^2, 2/u32/u^3, ... 均存在且连续)。 同理,反向转换 ψNS(v)=1/v\psi_{NS}(v) = 1/v 也是 CC^\infty 的。
结论: 由于所有的转换函数都是光滑的,(UN,ϕN)(U_N, \phi_N)(US,ϕS)(U_S, \phi_S) 是兼容的。这个图集赋予了 S1S^1 标准的微分结构。这意味着我们可以在 S1S^1 上进行微积分运算,而不必担心“接缝”处的奇异性。

值得一提 在数值计算或几何处理中,如果试图用单一的 double theta (0θ<2π0 \le \theta < 2\pi) 变量来模拟圆环上的物理场,会遇到著名的 "Hairy Ball Theorem" (毛球定理) 或类似的拓扑障碍带来的数值不稳定:
  1. 奇点:在 θ=0\theta = 0 处进行插值或求导时,需要特殊的 if 逻辑处理周期性边界条件。
  2. 流形视角:使用图集(Atlas)的方法则是真正通用的。您存储两个 patch 的数据(uuvv),当物体运动到北极附近时(uu \to \infty),程序逻辑自动检测并使用 Transition Map 切换到南极坐标系(v0v \approx 0),从而避免数值溢出(Overflow)和精度丢失。 * 这就是流形在“计算”中的本质:没有全局最优坐标系,只有通过协议(转换函数)互联的局部坐标系

1.2 切空间与切矢量 (Tangent Space & Vectors)

在欧几里得空间 Rn\mathbb{R}^n 中,我们习惯将向量视为连接两点(如原点到某点)的直观箭头。然而在弯曲流形(Manifold)上,两点之间的连线通常不在流形内部(例如球面上的两点连线会穿过球体内部)。
因此,我们需要从局部性质出发,建立一种不依赖于嵌入高维空间的内在定义。我们将切矢量严格定义为作用在光滑函数上的导数算子(Derivation)

1.2.1 作为导数算子的切矢量

M\mathcal{M}nn 维光滑流形,pMp \in \mathcal{M} 为流形上的一点。令 C(p)C^\infty(p) 为在点 pp 的邻域内定义的所有实值光滑函数 f:MRf: \mathcal{M} \to \mathbb{R} 的集合。
定义 1.2.1 (切矢量): 点 pp 处的切矢量 vv 是一个线性映射 v:C(p)Rv: C^\infty(p) \to \mathbb{R},它满足以下两条公理:
  1. 线性性 (Linearity)v(af+bg)=av(f)+bv(g),f,gC(p),a,bRv(af + bg) = a v(f) + b v(g), \quad \forall f, g \in C^\infty(p), \forall a, b \in \mathbb{R}
  2. 莱布尼茨律 (Leibniz Rule / Product Rule)v(fg)=f(p)v(g)+g(p)v(f)v(fg) = f(p)v(g) + g(p)v(f)
直观理解:切矢量本质上是“方向导数”。v(f)v(f) 的值表示函数 ff 沿着 vv 方向在 pp 点的变化率。

1.2.2 切空间的基底与分量

虽然定义是抽象的,但我们需要具体计算。这需要引入坐标系。 设 x=(x0,x1,,xn1)x = (x^0, x^1, \dots, x^{n-1}) 为点 pp 周围的一个局部坐标系。
定义 1.2.2 (坐标基底): 对于坐标系中的每一个坐标 xμx^\mu,定义算子 xμ\frac{\partial}{\partial x^\mu} 作用于函数 ff 如下: (xμ)p(f)(fϕ1)xμϕ(p)\left( \frac{\partial}{\partial x^\mu} \right)_p (f) \equiv \frac{\partial (f \circ \phi^{-1})}{\partial x^\mu} \Bigg|_{\phi(p)} 这正是标准的偏导数。很容易验证它满足上述的线性性和莱布尼茨律。
定理 1.2.1 (切空间基定理): 集合 {(x0)p,,(xn1)p}\left\{ \left(\frac{\partial}{\partial x^0}\right)_p, \dots, \left(\frac{\partial}{\partial x^{n-1}}\right)_p \right\} 构成了切空间 TpMT_p\mathcal{M} 的一组基,称为坐标基 (Coordinate Basis)
因此,任意切矢量 vTpMv \in T_p\mathcal{M} 都可以唯一地写成这组基的线性组合: v=μ=0n1vμ(xμ)p=Einsteinvμμv = \sum_{\mu=0}^{n-1} v^\mu \left(\frac{\partial}{\partial x^\mu}\right)_p \overset{\text{Einstein}}{=} v^\mu \partial_\mu 其中系数 vμv^\mu 称为矢量 vv 在该坐标系下的分量
值得一提
  • vv (对象) = vμv^\mu (数据) \cdot μ\partial_\mu (接口/方法)。
  • 当我们说“求矢量 vv 作用于函数 ff”时,运算过程是:v(f)=(vμμ)f=vμfxμv(f) = (v^\mu \partial_\mu) f = v^\mu \frac{\partial f}{\partial x^\mu}

1.2.3 与路径切线的联系

为了联系物理直觉,通常通过流形上的曲线来构造切矢量。
γ:(ϵ,ϵ)M\gamma: (-\epsilon, \epsilon) \to \mathcal{M} 是一条光滑曲线,且 γ(0)=p\gamma(0) = p。这条曲线在点 pp 定义了一个切矢量 vγv_\gamma,其作用法则为: vγ(f)ddt(fγ)(t)t=0v_\gamma(f) \equiv \frac{d}{dt} (f \circ \gamma)(t) \Bigg|_{t=0} 根据链式法则,如果曲线在坐标系 xμx^\mu 下的方程为 xμ(t)x^\mu(t),则: ddtf(x(t))=μdxμdtfxμ\frac{d}{dt} f(x(t)) = \sum_{\mu} \frac{dx^\mu}{dt} \frac{\partial f}{\partial x^\mu} 对比 v=vμμv = v^\mu \partial_\mu,我们得到矢量的分量即为坐标对参数的导数: vμ=dxμdtt=0v^\mu = \frac{dx^\mu}{dt}\Bigg|_{t=0}

1.2.4 切空间与切矢量例题

例题 1:算子操作与求值

场景:考虑 2 维平面 R2\mathbb{R}^2(流形),坐标为笛卡尔坐标 (x,y)(x, y)。 定义一个函数 f(x,y)=x2y+sin(x)f(x, y) = x^2 y + \sin(x)。 定义点 p=(0,2)p = (0, 2) 处的一个切矢量 v=3xyv = 3 \partial_x - \partial_y
问题:计算 v(f)v(f) 的值。
解答: 切矢量是微分算子,我们直接将算子作用于函数:
v(f)=(3x1y)(x2y+sin(x))(0,2)=3x(x2y+sin(x))(0,2)y(x2y+sin(x))(0,2)=3(2xy+cos(x))(0,2)(x2)(0,2)\begin{aligned} v(f) &= \left( 3 \frac{\partial}{\partial x} - 1 \frac{\partial}{\partial y} \right) (x^2 y + \sin(x)) \Bigg|_{(0,2)} \\ &= 3 \frac{\partial}{\partial x}(x^2 y + \sin(x)) \Bigg|_{(0,2)} - \frac{\partial}{\partial y}(x^2 y + \sin(x)) \Bigg|_{(0,2)} \\ &= 3 (2xy + \cos(x)) \Bigg|_{(0,2)} - (x^2) \Bigg|_{(0,2)} \end{aligned}
代入点 pp 的坐标 x=0,y=2x=0, y=2
=3(202+cos(0))(02)=3(0+1)0=3\begin{aligned} &= 3 (2 \cdot 0 \cdot 2 + \cos(0)) - (0^2) \\ &= 3 (0 + 1) - 0 \\ &= 3 \end{aligned}
物理含义:若你站在 (0,2)(0,2) 处,沿着向量 (3,1)(3, -1) 的方向移动,感受到标量场 ff 的瞬时变化率为 3。

例题 2:坐标变换法则 (基变换)

这是广义相对论中最核心的运算之一。
场景:考虑 R2\mathbb{R}^2,从笛卡尔坐标 (x,y)(x, y) 变换到极坐标 (r,θ)(r, \theta)。 变换公式为:x=rcosθ,y=rsinθx = r \cos\theta, \quad y = r \sin\theta
问题
  1. 将极坐标基矢量 r\partial_rθ\partial_\theta 用笛卡尔基矢量 x,y\partial_x, \partial_y 表示。
  2. 验证变换矩阵(Jacobian)的作用。
解答1. 使用链式法则推导基底变换: 我们将 r\partial_r 视为作用于任意函数 ff 的算子。根据多元微积分链式法则: fr=fxxr+fyyr\frac{\partial f}{\partial r} = \frac{\partial f}{\partial x} \frac{\partial x}{\partial r} + \frac{\partial f}{\partial y} \frac{\partial y}{\partial r} 剥离测试函数 ff,得到算子关系: r=xrx+yry\partial_r = \frac{\partial x}{\partial r} \partial_x + \frac{\partial y}{\partial r} \partial_y 计算偏导系数:
  • xr=cosθ\frac{\partial x}{\partial r} = \cos\theta
  • yr=sinθ\frac{\partial y}{\partial r} = \sin\theta
同理对于 θ\partial_\theta
  • xθ=rsinθ\frac{\partial x}{\partial \theta} = -r\sin\theta
  • yθ=rcosθ\frac{\partial y}{\partial \theta} = r\cos\theta
所以基变换关系为:
r=cosθx+sinθyθ=rsinθx+rcosθy\begin{aligned} \partial_r &= \cos\theta \, \partial_x + \sin\theta \, \partial_y \\ \partial_\theta &= -r\sin\theta \, \partial_x + r\cos\theta \, \partial_y \end{aligned}
2. 分量变换的逆变性验证: 设某矢量 vv 在极坐标下的分量为 (vr,vθ)=(1,0)(v^r, v^\theta) = (1, 0)(即径向单位矢量)。 该矢量在笛卡尔坐标系下的分量 (vx,vy)(v^x, v^y) 是什么?
根据矢量本身是不变量:v=vrr+vθθ=vxx+vyyv = v^r \partial_r + v^\theta \partial_\theta = v^x \partial_x + v^y \partial_y。 将刚才推导的 r\partial_r 表达式代入左边: 1(cosθx+sinθy)+0=vxx+vyy1 \cdot (\cos\theta \, \partial_x + \sin\theta \, \partial_y) + 0 = v^x \partial_x + v^y \partial_y 对比系数可得: vx=cosθ,vy=sinθv^x = \cos\theta, \quad v^y = \sin\theta 这通过矢量变换法则公式验证如下(其中 xμ={x,y},xμ={r,θ}x^{\mu'} = \{x, y\}, x^\mu = \{r, \theta\}): vμ=xμxμvμv^{\mu'} = \frac{\partial x^{\mu'}}{\partial x^\mu} v^\mu vx=xrvr+xθvθ=(cosθ)(1)+(rsinθ)(0)=cosθv^x = \frac{\partial x}{\partial r} v^r + \frac{\partial x}{\partial \theta} v^\theta = (\cos\theta)(1) + (-r\sin\theta)(0) = \cos\theta 结论:这展示了基矢量μ\partial_\mu)与分量vμv^\mu)变换行为相反(一为协变,一为逆变),从而保证总矢量 vv 是一个几何不变量。

1.3 爱因斯坦求和约定 (Einstein Summation Convention)

在广义相对论中,公式往往涉及大量的多重求和。为了简化符号,爱因斯坦引入了一套省略求和号 \sum 的记法。这不仅仅是速记法,它更是张量代数的语法检查器,能直观反映方程的协变性(Covariance)。

1.3.1 核心定义与规则

定义 1.8 (指标分类): 在一个单项式(Term)中,任何一个指标(Index,如 μ,ν,α\mu, \nu, \alpha)只可能属于以下两类之一:
  1. 哑指标 (Dummy Index)
    • 特征:在单项式中出现两次,且必须是一上一下
    • 语义:表示对该指标进行遍历求和。
    • 性质:可以用任意其他未占用的字母替换(如 μσ\mu \to \sigma),不改变表达式的值(相当于局部变量重命名)。
  2. 自由指标 (Free Index)
    • 特征:在单项式中仅出现一次(通常)。
    • 语义:代表方程对该维度的每一个分量都成立。
    • 性质:在方程的所有项(左边和右边)中,自由指标必须名称相同、位置(上下)相同。
约定规则: 设维度为 nn(GR 中 n=4n=4,指标取 {0,1,2,3}\{0, 1, 2, 3\})。若指标 μ\mu 在单项式中出现一次上标、一次下标,则: AμBμμ=0n1AμBμ=A0B0+A1B1++An1Bn1A^\mu B_\mu \equiv \sum_{\mu=0}^{n-1} A^\mu B_\mu = A^0 B_0 + A^1 B_1 + \dots + A^{n-1} B_{n-1}
算法视角
  • 自由指标 \leftrightarrow 外层循环 / 数组索引
  • 哑指标 \leftrightarrow 内层循环 / 局部迭代变量
表达式 yμ=Mνμxνy^\mu = M^\mu_\nu x^\nu 等价于以下代码逻辑:
PYTHON
# n = 4 (Space-time dimensions)
y = [0.0] * 4  # Initialize output array

# Free index mu appears once on LHS, once on RHS -> Outer Loop
for mu in range(4):
    sum_val = 0.0
    # Dummy index nu appears twice (up/down) on RHS -> Inner Summation
    for nu in range(4):
        sum_val += M[mu][nu] * x[nu]
    y[mu] = sum_val

1.3.2 基础例题:线性代数操作

通过常见的矩阵运算来熟悉张量标记法。
例题 1:内积与矩阵乘法 假设 u,vu, v 是矢量,A,BA, B 是矩阵(二阶张量)。请用爱因斯坦约定表示以下运算:
  1. 向量内积 s=uvs = u \cdot v(注:需通过度规定义,暂假设欧氏空间或对偶配对)。
  2. 矩阵-向量乘法 w=Avw = Av
  3. 矩阵-矩阵乘法 C=ABC = AB
  4. 矩阵的迹 (Trace) t=tr(A)t = \text{tr}(A)
解答
  1. 内积:即行向量乘列向量。 s=uμvμs = u_\mu v^\mu 这里 μ\mu 是哑指标,结果 ss 没有自由指标,是一个标量(0阶张量)。
  2. 矩阵-向量乘法wμ=Aνμvνw^\mu = A^\mu_\nu v^\nu
    • ν\nu 是哑指标(求和),消去。
    • μ\mu 是自由指标,保留。左边是矢量分量 wμw^\mu,右边缩并后也是矢量分量,类型匹配。
  3. 矩阵乘法Cρμ=AνμBρνC^\mu_\rho = A^\mu_\nu B^\nu_\rho
    • ν\nu 它是中间连接的桥梁(求和),即 Cik=jAijBjkC_{ik} = \sum_j A_{ij} B_{jk}
    • μ\mu(上)和 ρ\rho(下)是自由指标。
  4. :对角元之和。即令上标等于下标。 t=Aμμt = A^\mu_\mu
    • μ\mu 既在上也在下,触发求和:A00+A11+A^0_0 + A^1_1 + \dots

1.3.3 进阶例题:多重求和与指标代换

在推导场方程时,经常遇到多个张量相乘,此时必须小心管理指标名称(Scope Management)。
例题 2:二次型与嵌套定义 已知 yα=Aβαxβy^\alpha = A^\alpha_\beta x^\betaz=ωαyαz = \omega_\alpha y^\alpha。 请将 zz 直接表示为关于 xx 的表达式。
解答: 直接代入: z=ωα(Aβαxβ)=ωαAβαxβz = \omega_\alpha (A^\alpha_\beta x^\beta) = \omega_\alpha A^\alpha_\beta x^\beta 分析指标:
  • α\alpha:出现两次(ωα\omega_\alphaAαA^\alpha_\dots),是一对哑指标 \rightarrow 第一重循环。
  • β\beta:出现两次(AβA^\dots_\betaxβx^\beta),是一对哑指标 \rightarrow 第二重循环。
  • 此式包含双重求和:z=αβωαAβαxβz = \sum_\alpha \sum_\beta \omega_\alpha A^\alpha_\beta x^\beta
陷阱提示(Variable Shadowing): 如果你有两个方程 aμ=Bνμbνa^\mu = B^\mu_\nu b^\nucμ=Dνμdνc^\mu = D^\mu_\nu d^\nu,想要相乘。 错误写法aμcμ=BνμbνDνμdνa^\mu c^\mu = B^\mu_\nu b^\nu D^\mu_\nu d^\nu
  • 错误 1μ\mu 在左边出现两次(同为上标),非法。
  • 错误 2ν\nu 在右边出现四次,语义不清。
正确写法(重命名哑指标)aμcρ=(Bνμbν)(Dσρdσ)=BνμDσρbνdσa^\mu c^\rho = (B^\mu_\nu b^\nu) (D^\rho_\sigma d^\sigma) = B^\mu_\nu D^\rho_\sigma b^\nu d^\sigma
  • 在合并两个表达式时,必须确保各自的哑指标不冲突(就像在编程中不能在嵌套循环中使用相同的迭代变量名 i)。

1.3.4 合法性判断

这是学习 GR 初期的重要训练:判断一个表达式是否符合张量语法。
例题 3:以下表达式在爱因斯坦约定下是否合法?如果不合法,指出原因。 (设 TT(2,0)(2,0) 张量,SS(1,1)(1,1) 张量,vv 为矢量)
  1. Tμνvν=SνμvνT^{\mu\nu} v_\nu = S^\mu_\nu v^\nu
  2. a=Tμμa = T^{\mu\mu}
  3. bμ=Tμνvμvνb_\mu = T^{\mu\nu} v_\mu v_\nu
  4. Rμν12gμνR=8πGTμνR_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R = 8\pi G T_{\mu\nu} (爱因斯坦场方程)
解答
  1. 非法
    • 左边 (LHS):TμνvνT^{\mu\nu} v_\nuν\nu 缩并,自由指标是 μ\mu(上)。合法。
    • 右边 (RHS):SνμvνS^\mu_\nu v^\nuν\nu 缩并,自由指标是 μ\mu(上)。合法。
    • 左右对比:看起来自由指标都是 μ\mu。但是,仔细观察左边的求和项:TμνvνT^{\mu\nu} v_\nu 中,ν\nu 一上一下。然而公式中的写法,在通常的几何意义下要求很严,但如果你指的是 vνv_\nu 是协变矢量,这是合法的。
    • 修正思考:如果是 TμνvνT^{\mu\nu} v^\nu,则两个上标无法缩并(除非有度规参与)。如果是 vνv_\nu(已降标),则 TμνvνwμT^{\mu\nu} v_\nu \to w^\mu
    • 结论语法上合法。LHS 和 RHS 都是含有一个上标自由指标 μ\mu 的矢量。
  2. 非法
    • TμμT^{\mu\mu}μ\mu 出现了两次,但都在上标位置
    • 爱因斯坦求和必须是一上一下。如果想表达对角线求和,必须引入度规:gμνTμνg_{\mu\nu} T^{\mu\nu}。单纯的 TμμT^{\mu\mu} 在不指定坐标系的情况下没有几何意义(不具备协变性)。
  3. 非法
    • 观察指标 μ\mu
      • TμνT^{\mu\nu} (上)
      • bμb_\mu (下)
      • vμv_\mu (下)
    • μ\mu 在方程中出现了三次(左1,右2)。这违反了“每个指标在一项中最多出现两次”的规则。
    • 更深层错误:右边的 TμT^{\mu\dots} (上) 和 vμv_\mu (下) 看起来可以缩并,但如果缩并了,μ\mu 就变成了哑指标(消失),但左边 bμb_\mu 却还保留着 μ\mu 作为自由指标。逻辑矛盾。
  4. 合法
    • 这是张量分析中最标准的方程。
    • 自由指标μ,ν\mu, \nu (均为下标)。
    • 第一项 RμνR_{\mu\nu}:自由指标 μ,ν\mu, \nu
    • 第二项 12gμνR\frac{1}{2} g_{\mu\nu} RRR 是标量(已完全缩并),gμνg_{\mu\nu} 提供自由指标 μ,ν\mu, \nu
    • 第三项 TμνT_{\mu\nu}:自由指标 μ,ν\mu, \nu
    • 每一项的自由指标结构完全一致。

1.4 对偶空间与余切矢量 (Dual Space & Cotangent Vectors)

在这一节中,我们将严格区分“矢量”和“梯度”这两个在欧几里得空间中经常混淆的概念,并引入 GR 描述物理场的关键接口——余切矢量。
在平直的欧几里得空间中,列向量 vv 和行向量 vTv^T 看起来包含相同的数据(只是转置了一下),因此我们经常混用梯度向量 f\nabla f 和位移向量 r\vec{r}
但在流形上,它们是完全不同类型的数据对象,居住在完全不同的空间中,拥有不同的坐标变换法则。

1.4.1 几何直观:箭头 vs. 等高线

  • 切矢量 (Tangent Vector, vTpMv \in T_p\mathcal{M})
    • 几何形象:一个小箭头。
    • 物理意义:速度、位移、流量。
    • 类比实例。它是有“大小”和“方向”的实体。
  • 余切矢量 (Cotangent Vector / One-form, ωTpM\omega \in T_p^*\mathcal{M})
    • 几何形象:一组成层排列的平行面(类似于地图上的等高线)。
    • 物理意义:密度、梯度、动量。
    • 类比方法/查询。它的作用是“吃掉”一个矢量,吐出一个实数(测量值)。
当我们将一个矢量(箭头)“射入”一个余切矢量(层叠面)时,箭头穿过的层数,就是两者缩并(Contraction)的结果数值。

1.4.2 形式化定义:线性泛函

定义 1.9 (对偶空间): 设 TpMT_p\mathcal{M} 是点 pp 处的切空间(向量空间)。定义其对偶空间 (Dual Space) TpMT_p^*\mathcal{M} 为所有从 TpMT_p\mathcal{M}R\mathbb{R} 的线性映射(线性泛函)的集合。 ωTpM    ω:TpMR 是线性的\omega \in T_p^*\mathcal{M} \iff \omega: T_p\mathcal{M} \to \mathbb{R} \text{ 是线性的}
定义 1.10 (对偶基 / Dual Basis): 在坐标系 {xμ}\{x^\mu\} 下,自然切基是 {eμ=xμ}\{\mathbf{e}_\mu = \frac{\partial}{\partial x^\mu}\}。我们定义其对偶基 {θν=dxν}\{\theta^\nu = dx^\nu\} 满足如下正交归一条件: dxν(xμ)=δμνdx^\nu \left( \frac{\partial}{\partial x^\mu} \right) = \delta^\nu_\mu
为什么记作 dxdx 在微积分中,dxdx 是一个无穷小量。但在流形几何中,dxμdx^\mu 被严格定义为坐标函数 xμx^\mu 的梯度(即 dxμdx^\mu 是一个“提取第 μ\mu 个分量”的机器)。
任意余切矢量 ω\omega 可在基底下展开为分量形式(注意下标): ω=ωμdxμ\omega = \omega_\mu dx^\mu

1.4.3 核心原型:梯度 (The Gradient)

在 GR 中,标量场 ff 的导数天然产生一个余切矢量,而不是切矢量。这一对象记为 dfdf(微分/外导数)。
定理 1.2 (梯度的自然性): 设 f:MRf: \mathcal{M} \to \mathbb{R} 是光滑函数,沿着矢量 vv 的方向导数定义为 v(f)v(f)。 我们可以构造一个线性映射 dfdf,使得: df,vv(f)\langle df, v \rangle \equiv v(f) 利用链式法则展开 v(f)=vμfxμv(f) = v^\mu \frac{\partial f}{\partial x^\mu},根据线性性,我们可以读出 dfdf 的分量: df=fxμdxμdf = \frac{\partial f}{\partial x^\mu} dx^\mu 这意味着梯度的分量是 ωμ=μf\omega_\mu = \partial_\mu f
值得一提: 想求一个函数的梯度,本质上是求它相对于坐标网格变化率的线性组合。这是一个行向量操作,因为它等待与一个列向量(变化方向)相乘来产生标量(变化量)。

1.4.4 坐标变换法则 (Transformation Laws)

区分矢量和余切矢量最根本的方法是看它们在坐标变换下的表现。这类似于协变 (Covariant)逆变 (Contravariant) 类型检查。
设坐标系从 xx 变换到 xx',雅可比矩阵为 Λνμ=xμxν\Lambda^{\mu'}_{\nu} = \frac{\partial x'^{\mu'}}{\partial x^\nu},其逆矩阵为 (Λ1)μν=xνxμ(\Lambda^{-1})^\nu_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}}
  1. 切矢量 (Contravariant / 上标): 矢量 v=vμμv = v^\mu \partial_\mu 是客观存在的几何对象,其本体不变。当基底变换时,分量必须反向补偿。 vμ=xμxνvνv'^{\mu'} = \frac{\partial x'^{\mu'}}{\partial x^\nu} v^\nu (分量随坐标“分子”变换)
  2. 余切矢量 (Covariant / 下标): 由链式法则 fxμ=fxνxνxμ\frac{\partial f}{\partial x'^{\mu'}} = \frac{\partial f}{\partial x^\nu} \frac{\partial x^\nu}{\partial x'^{\mu'}} 可知: ωμ=xνxμων\omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu (分量随坐标“分母”变换,即逆雅可比矩阵)
口诀
  • 标(矢量):用向导数(新对旧 x/xx'/x)。
  • 标(余切):用向导数(旧对新 x/xx/x')。

1.4.5 例题讲解

例题 1:欧氏空间与极坐标变换

考虑二维平面上的点 pp
  1. 直角坐标 xμ=(x,y)x^\mu = (x, y)。有一常数余切矢量 ω=3dx+4dy\omega = 3dx + 4dy,即分量 ωμ=(3,4)\omega_\mu = (3, 4)
  2. 极坐标 xμ=(r,θ)x'^{\mu'} = (r, \theta),其中 x=rcosθ,y=rsinθx = r \cos\theta, y = r \sin\theta问题:求 ω\omega 在极坐标系下的分量 ωμ=(ωr,ωθ)\omega'_{\mu'} = (\omega_r, \omega_\theta)
解答: 我们需要使用余切矢量的变换法则(下标法则): ωμ=xνxμων\omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu
我们需要计算逆雅可比矩阵 (x,y)(r,θ)\frac{\partial(x, y)}{\partial(r, \theta)}
  • xr=cosθ,xθ=rsinθ\frac{\partial x}{\partial r} = \cos\theta, \quad \frac{\partial x}{\partial \theta} = -r\sin\theta
  • yr=sinθ,yθ=rcosθ\frac{\partial y}{\partial r} = \sin\theta, \quad \frac{\partial y}{\partial \theta} = r\cos\theta
计算分量:
  • ωr=xrωx+yrωy=(cosθ)3+(sinθ)4=3cosθ+4sinθ\omega_r = \frac{\partial x}{\partial r}\omega_x + \frac{\partial y}{\partial r}\omega_y = (\cos\theta) \cdot 3 + (\sin\theta) \cdot 4 = 3\cos\theta + 4\sin\theta
  • ωθ=xθωx+yθωy=(rsinθ)3+(rcosθ)4=r(4cosθ3sinθ)\omega_\theta = \frac{\partial x}{\partial \theta}\omega_x + \frac{\partial y}{\partial \theta}\omega_y = (-r\sin\theta) \cdot 3 + (r\cos\theta) \cdot 4 = r(4\cos\theta - 3\sin\theta)
注意 ωθ\omega_\theta 的量纲带有一个长度 rr。这说明余切矢量的分量物理量纲与矢量相反(为了乘积是标量)。在代码中,如果你直接把 (3,4)(3,4) 赋给 (r,θ)(r, \theta) 分量是类型错误的。

例题 2:标量的不变性验证 (Invariant Check)

问题:验证 ω(v)\omega(v) 的值与坐标系选择无关。 设矢量 vv 在直角坐标系下为 v=vxx+vyyv = v^x \partial_x + v^y \partial_y。在极坐标系下为 v=vrr+vθθv' = v^r \partial_r + v^\theta \partial_\theta。 证明:ωμvμ=ωμvμ\omega_\mu v^\mu = \omega'_{\mu'} v'^{\mu'}
证明: 从 RHS(右边)开始: RHS=ωμvμ\text{RHS} = \omega'_{\mu'} v'^{\mu'} 代入变换公式:
  1. 余切矢量展开:ωμ=xνxμων\omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu
  2. 切矢量展开:vμ=xμxσvσv'^{\mu'} = \frac{\partial x'^{\mu'}}{\partial x^\sigma} v^\sigma
组合: RHS=(xνxμων)(xμxσvσ)\text{RHS} = \left( \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu \right) \left( \frac{\partial x'^{\mu'}}{\partial x^\sigma} v^\sigma \right)
这里对 μ,ν,σ\mu', \nu, \sigma 都有求和。利用导数的链式法则,注意 μ\mu' 是中间变量(哑指标): xνxμxμxσ=xνxσ=δσν\frac{\partial x^\nu}{\partial x'^{\mu'}} \frac{\partial x'^{\mu'}}{\partial x^\sigma} = \frac{\partial x^\nu}{\partial x^\sigma} = \delta^\nu_\sigma (对同一个坐标系,坐标 xνx^\nuxσx^\sigma 的偏导仅当 ν=σ\nu=\sigma 时为 1,否则为 0)
于是: RHS=δσνωνvσ=ωνvν=LHS\text{RHS} = \delta^\nu_\sigma \omega_\nu v^\sigma = \omega_\nu v^\nu = \text{LHS} 结论:缩并操作 ω,v\langle \omega, v \rangle 是一个标量(Scalar),它代表真实的物理量,不随我们观察的角度(坐标系)而改变。

例题 3:从度规推导对偶矢量

在闵可夫斯基时空(狭义相对论)中,度规 gμν=diag(1,1,1,1)g_{\mu\nu} = \text{diag}(-1, 1, 1, 1)。 设四维速度矢量 uμ=(γ,γv,0,0)u^\mu = (\gamma, \gamma v, 0, 0),其中 γ=1/1v2\gamma = 1/\sqrt{1-v^2}问题:求对应的余切矢量 uμu_\mu
解答: 这是利用度规进行降指 (Index Lowering) 的典型操作: uμ=gμνuνu_\mu = g_{\mu\nu} u^\nu 展开矩阵乘法:
  • u0=g00u0+g01u1+=(1)(γ)+0=γu_0 = g_{00} u^0 + g_{01} u^1 + \dots = (-1)(\gamma) + 0 = -\gamma
  • u1=g10u0+g11u1+=0+(1)(γv)=γvu_1 = g_{10} u^0 + g_{11} u^1 + \dots = 0 + (1)(\gamma v) = \gamma v
  • u2=10=0u_2 = 1 \cdot 0 = 0
  • u3=10=0u_3 = 1 \cdot 0 = 0
结果: uμ=(γ,γv,0,0)u_\mu = (-\gamma, \gamma v, 0, 0)
注意:在 GR 中,矢量 uμu^\mu 和对应的 1-form uμu_\mu 在第 0 分量上符号相反。如果不区分上下指标,在计算模长 u2=uμuμu^2 = u^\mu u_\mu 时就会得到错误的结果。

1.5 通用张量 (General Tensors)

张量是将标量、矢量和余切矢量推广到任意“秩(Rank)”的几何对象。它描述了不同几何实体之间的线性关系。

1.5.1 定义:多重线性映射

定义 1.11 ((k,l)(k, l) 型张量): 在流形 M\mathcal{M} 上的点 pp,一个 (k,l)(k, l) 型张量 TT 是一个多重线性映射: T:TpM××TpMk 个 (输入 1-form)×TpM××TpMl 个 (输入 Vector)RT: \underbrace{T_p^*\mathcal{M} \times \dots \times T_p^*\mathcal{M}}_{k \text{ 个 (输入 1-form)}} \times \underbrace{T_p\mathcal{M} \times \dots \times T_p\mathcal{M}}_{l \text{ 个 (输入 Vector)}} \to \mathbb{R}
  • kk 称为逆变秩 (Contravariant Rank):对应的分量指标在上。
  • ll 称为协变秩 (Covariant Rank):对应的分量指标在下。
  • 线性性:对任意参数位置,满足 T(,au+bv,)=aT(,u,)+bT(,v,)T(\dots, a\mathbf{u} + b\mathbf{v}, \dots) = aT(\dots, \mathbf{u}, \dots) + bT(\dots, \mathbf{v}, \dots)
类比:函数签名 一个 (1,1)(1, 1) 张量可以看作一个函数,其强类型签名为: double tensor_mapping(CotangentVector omega, TangentVector v)
  • 输入:需要 kk 个行向量(用来与上指标缩并)和 ll 个列向量(用来与下指标缩并)。
  • 输出:当你把所有“槽位(Slots)”填满后,它返回一个不变量(标量)。

1.5.2 张量积与分量表示

我们需要一种“胶水”来将低阶对象组合成高阶张量。
定义 1.12 (张量积 / Tensor Product \otimes): 设 SS(k,l)(k, l) 型张量,RR(m,n)(m, n) 型张量。它们的张量积 SRS \otimes R 是一个 (k+m,l+n)(k+m, l+n) 型张量,其定义为: (SR)(ω1,,ωk+m,v1,,vl+n)S(ω1,,ωk,v1,,vl)R(ωk+1,,vl+1,)(S \otimes R)(\omega_1, \dots, \omega_{k+m}, v_1, \dots, v_{l+n}) \equiv S(\omega_1, \dots, \omega_k, v_1, \dots, v_l) \cdot R(\omega_{k+1}, \dots, v_{l+1}, \dots) 即:输入参数被分发给 SSRR,结果相乘。
定理 1.3 (基底展开): 利用张量积,我们可以构建张量空间的基底。任意 (k,l)(k, l) 张量 TT 可在坐标基 {μ}\{ \partial_\mu \}{dxν}\{ dx^\nu \} 下唯一展开: T=Tν1νlμ1μk(μ1μk)(dxν1dxνl)T = T^{\mu_1 \dots \mu_k}_{\nu_1 \dots \nu_l} \, (\partial_{\mu_1} \otimes \dots \otimes \partial_{\mu_k}) \otimes (dx^{\nu_1} \otimes \dots \otimes dx^{\nu_l}) 其中,Tν1νlμ1μkT^{\mu_1 \dots \mu_k}_{\nu_1 \dots \nu_l}nk+ln^{k+l} 个实数组成的分量数组

1.5.3 坐标变换法则 (The Supreme Law)

判断一个多维数组是否是“物理张量”的唯一标准,是看它是否遵循以下变换规律。这是 GR 中所有物理定律必须满足的类型安全检查
设坐标变换 xxx \to x',雅可比矩阵为 Λνμ=xμxν\Lambda^{\mu'}_{\nu} = \frac{\partial x'^{\mu'}}{\partial x^\nu},逆雅可比矩阵为 (Λ1)μν=xνxμ(\Lambda^{-1})^\nu_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}}
张量分量变换法则: 对于 (k,l)(k, l) 张量,其新坐标下的分量 Tν1μ1T'^{\mu'_1 \dots}_{\nu'_1 \dots} 为: Tν1νlμ1μk=xμ1xρ1xμkxρk针对 k 个上指标xσ1xν1xσlxνl针对 l 个下指标Tσ1σlρ1ρkT'^{\mu'_1 \dots \mu'_k}_{\nu'_1 \dots \nu'_l} = \underbrace{\frac{\partial x'^{\mu'_1}}{\partial x^{\rho_1}} \dots \frac{\partial x'^{\mu'_k}}{\partial x^{\rho_k}}}_{\text{针对 } k \text{ 个上指标}} \cdot \underbrace{\frac{\partial x^{\sigma_1}}{\partial x'^{\nu'_1}} \dots \frac{\partial x^{\sigma_l}}{\partial x'^{\nu'_l}}}_{\text{针对 } l \text{ 个下指标}} \cdot T^{\rho_1 \dots \rho_k}_{\sigma_1 \dots \sigma_l}
规则总结
  1. 每个指标(逆变)“携带”一个 xx\frac{\partial x'}{\partial x} (分子是新坐标)。
  2. 每个指标(协变)“携带”一个 xx\frac{\partial x}{\partial x'} (分母是新坐标)。
  3. 所有旧指标 (ρ,σ\rho, \sigma) 都是哑指标,进行求和。

1.5.4 关键操作:缩并 (Contraction)

缩并是降低张量秩(Rank)的唯一内部操作(无需引入外部度规)。
定义 1.13 (缩并): 设 TT(k,l)(k, l) 型张量(k,l1k,l \ge 1)。令其第 ii 个上指标与第 jj 个下指标相等(求和)。 这将产生一个新的 (k1,l1)(k-1, l-1) 型张量。
例如,对于 (1,1)(1, 1) 张量 TνμT^\mu_\nu,缩并得到标量(迹): S=tr(T)=Tμμ=μ=0n1TμμS = \text{tr}(T) = T^\mu_\mu = \sum_{\mu=0}^{n-1} T^\mu_\mu
定理 1.4 (缩并的几何意义): 在张量作为映射的视角下,T(ω,v)T(\omega, v) 本质上就是张量 TT 与输入 v,ωv, \omega缩并T(ω,v)    TνμωμvνT(\omega, v) \iff T^\mu_\nu \omega_\mu v^\nu 这里的“填槽”过程,实际上就是把输入的自由指标与张量的对应指标变为哑指标并求和。

1.5.5 例题讲解

例题 1:类型推断与对象识别

问题: 在广义相对论中,判断以下对象的张量类型 (k,l)(k, l)
  1. 度规张量 gμνg_{\mu\nu}
  2. 逆度规 gμνg^{\mu\nu}
  3. 克里斯托费尔符号 Γμνλ\Gamma^\lambda_{\mu\nu}
  4. 里奇曲率张量 RμνR_{\mu\nu}
  5. 黎曼曲率张量 RσμνρR^\rho_{\sigma\mu\nu}
解答
  1. (0,2)(0, 2) 张量。它接受两个矢量 u,vu, v,输出内积 g(u,v)Rg(u,v) \in \mathbb{R}
  2. (2,0)(2, 0) 张量。它本质上是两个余切矢量的内积映射。
  3. 不是张量Γμνλ\Gamma^\lambda_{\mu\nu} 在坐标变换时包含二阶导数项 2xx2\frac{\partial^2 x}{\partial x'^2},破坏了线性变换规律(它是仿射联络系数,而非张量)。
  4. (0,2)(0, 2) 张量。是 (1,3)(1,3) 黎曼张量的缩并结果(缩并了一个上标和一个下标,秩减2)。
  5. (1,3)(1, 3) 张量。虽然它有4个指标,但标准定义是接受1个 1-form 和 3个矢量。

例题 2:张量积与运算逻辑

问题: 设矢量 uμ=(1,0)u^\mu = (1, 0),1-form ων=(1,3)\omega_\nu = (1, 3)(在二维平面)。 定义 (1,1)(1, 1) 张量 T=uωT = u \otimes \omega
  1. 写出 TT 的分量矩阵 TνμT^\mu_\nu
  2. 计算 TT 对矢量 vν=(2,1)v^\nu = (2, 1) 的作用结果。
解答
  1. 计算分量: 根据张量积定义:Tνμ=uμωνT^\mu_\nu = u^\mu \omega_\nu
    T=(u0u1)(ω0ω1)=(10)(13)=(11130103)=(1300)T = \begin{pmatrix} u^0 \\ u^1 \end{pmatrix} \begin{pmatrix} \omega_0 & \omega_1 \end{pmatrix} = \begin{pmatrix} 1 \\ 0 \end{pmatrix} \begin{pmatrix} 1 & 3 \end{pmatrix} = \begin{pmatrix} 1\cdot 1 & 1\cdot 3 \\ 0\cdot 1 & 0\cdot 3 \end{pmatrix} = \begin{pmatrix} 1 & 3 \\ 0 & 0 \end{pmatrix}
    注意:在习惯上,第一个指标 μ\mu (Row) 代表行索引,第二个指标 ν\nu (Col) 代表列索引。
  2. 作用于矢量 vv: 这是张量缩并 wμ=Tνμvνw^\mu = T^\mu_\nu v^\nu(矩阵乘法):
    w=(1300)(21)=(2+30+0)=(50)w = \begin{pmatrix} 1 & 3 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} 2 \\ 1 \end{pmatrix} = \begin{pmatrix} 2 + 3 \\ 0 + 0 \end{pmatrix} = \begin{pmatrix} 5 \\ 0 \end{pmatrix}
    验证T(v)=(uω)(v)=u[ω(v)]=u[ωνvν]=u(12+31)=5u=(5,0)T(v) = (u \otimes \omega)(v) = u \cdot [\omega(v)] = u \cdot [\omega_\nu v^\nu] = u \cdot (1\cdot 2 + 3\cdot 1) = 5u = (5, 0)。结果一致。

例题 3:商定理 (Quotient Theorem) 的应用

问题: 假如有一个多维数组 XμνX^{\mu\nu},我们不确定它是不是张量。 已知对于任意的协变矢量(1-form) aμa_\mubνb_\nu,缩并结果 S=XμνaμbνS = X^{\mu\nu} a_\mu b_\nu 在任何坐标系下都是一个标量(即 S=SS' = S)。 证明:XμνX^{\mu\nu} 必须是一个 (2,0)(2, 0) 型张量。
证明思路: 这是一个非常重要的判定定理,称为商定理:如果一个对象被张量“除”(缩并)后得到张量,那它本身就是张量。
  1. 根据题意:Xαβaαbβ=XμνaμbνX'^{\alpha\beta} a'_\alpha b'_\beta = X^{\mu\nu} a_\mu b_\nu (标量不变)。
  2. 我们将 a,ba', b' 变换回旧坐标系: aμ=xαxμaαa_\mu = \frac{\partial x'^\alpha}{\partial x^\mu} a'_\alpha bν=xβxνbβb_\nu = \frac{\partial x'^\beta}{\partial x^\nu} b'_\beta
  3. 代入 RHS: Xαβaαbβ=Xμν(xαxμaα)(xβxνbβ)X'^{\alpha\beta} a'_\alpha b'_\beta = X^{\mu\nu} \left( \frac{\partial x'^\alpha}{\partial x^\mu} a'_\alpha \right) \left( \frac{\partial x'^\beta}{\partial x^\nu} b'_\beta \right)
  4. 整理项: (XαβxαxμxβxνXμν)aαbβ=0\left( X'^{\alpha\beta} - \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} X^{\mu\nu} \right) a'_\alpha b'_\beta = 0
  5. 由于 a,ba', b'任意矢量,若要上式恒成立,括号内的部分必须为 0(线性代数基本性质)。
  6. 因此:Xαβ=xαxμxβxνXμνX'^{\alpha\beta} = \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} X^{\mu\nu}。 这正是 (2,0)(2, 0) 张量的变换法则。得证

1.6 度规张量 (The Metric Tensor)

1.6.1 定义:广义内积

在抽象向量空间中,内积是一个双线性映射。在微分几何中,我们要求这个映射在每一点都是光滑变化的。可以将度规张量理解为定义在流形上的 内积 API。一旦你给流形装备了这个 API,流形就升级为了黎曼流形(或伪黎曼流形),此时我们才能计算长度、角度,并定义因果结构。
定义 1.14 (度规张量): 度规 gg 是一个光滑的 (0,2)(0, 2) 型张量场。在流形上的任意点 pp,它接受两个切矢量 u,vTpMu, v \in T_p\mathcal{M},并输出一个实数(标量积): gp(u,v)Rg_p(u, v) \in \mathbb{R} 它必须满足两个公理:
  1. 对称性 (Symmetry)g(u,v)=g(v,u)    gμν=gνμg(u, v) = g(v, u) \iff g_{\mu\nu} = g_{\nu\mu} 这保证了 AABB 的“距离”等于 BBAA 的距离。
  2. 非退化性 (Non-degeneracy): 若对于所有的 vv,都有 g(u,v)=0g(u, v) = 0,则必须有 u=0u=0。 这等价于度规矩阵的行列式不为零:det(gμν)0\det(g_{\mu\nu}) \neq 0

1.6.2 线元 (The Line Element)

物理文献中极少直接写出 gμνg_{\mu\nu} 矩阵,而是通过线元 ds2ds^2 来定义度规。线元描述了无穷小位移矢量 dx=dxμμd\mathbf{x} = dx^\mu \partial_\mu 的自内积(即模长的平方)。
ds2=g(dx,dx)=gμνdxμdxνds^2 = \mathbf{g}(d\mathbf{x}, d\mathbf{x}) = g_{\mu\nu} dx^\mu dx^\nu
二次型视角 ds2ds^2 只是一个二次型符号。 gμνg_{\mu\nu} 是一个存储几何权重的 4×44 \times 4 对称矩阵。dxμdx^\mu 是输入的差分向量。 Cost=[dx0,,dx3]×[G]×[dx0,,dx3]T\text{Cost} = [dx^0, \dots, dx^3] \times [G] \times [dx^0, \dots, dx^3]^T

1.6.3 符号差与因果结构 (The Signature & Causality)

度规的符号差 (Signature) 决定了流形的物理性质。 将 gμνg_{\mu\nu} 对角化后,对角线上正负号的个数称为符号差。
  1. 黎曼度规 (Euclidean/Riemannian)
    • 签名:(+,+,+,+)(+, +, +, +)
    • 性质:ds2=0    dx=0ds^2 = 0 \iff dx = 0。即只要动了,距离就是正的。
    • 用途:普通几何空间。
  2. 洛伦兹度规 (Lorentzian) —— 广义相对论使用此定义
    • 签名:(,+,+,+)(-, +, +, +)(+,,,)(+, -, -, -)(文献中称为 "East Coast" 或 "West Coast" 惯例,本文采用 +++-+++)。
    • 关键性质:即使 dx0dx \neq 0,也可以有 ds2=0ds^2 = 0
    • 因果分类:对于切矢量 vv
      • g(v,v)<0g(v, v) < 0类时 (Timelike),有质量粒子的轨迹。
      • g(v,v)=0g(v, v) = 0类光 (Null/Lightlike),光子的轨迹。
      • g(v,v)>0g(v, v) > 0类空 (Spacelike),超光速区域(因果上不可达)。

1.6.4 音乐同构:升降指标 (Musical Isomorphisms)

度规张量提供了一种“自然”的方式将切空间 TpMT_p\mathcal{M} 和对偶空间 TpMT_p^*\mathcal{M} 粘合起来。
定义 1.15 (降指 / Lowering Indices - \flat): 给定矢量 vμv^\mu,通过与度规的部分缩并,生成一个余切矢量 vμv_\muvμgμνvνv_\mu \equiv g_{\mu\nu} v^\nu 在矩阵视角下,这等价于:行向量 = 矩阵 ×\times 列向量
定义 1.16 (逆度规与升指 / Raising Indices - \sharp): 度规矩阵的逆矩阵记为 gμνg^{\mu\nu}(注意双上标),满足: gμρgρν=δνμg^{\mu\rho} g_{\rho\nu} = \delta^\mu_\nu 利用它将余切矢量转换回矢量: vμgμνvνv^\mu \equiv g^{\mu\nu} v_\nu
值得一提: 在欧氏空间(笛卡尔坐标),g=Ig = I(单位阵),所以 vμv^\muvμv_\mu 数值相同。 但在弯曲时空或闵可夫斯基时空中,分量的数值甚至符号都会改变!混淆上下标会导致致命的物理错误

1.6.5 例题讲解

例题 1:从线元读取度规分量

问题: 考虑三维球坐标空间,其线元公式为: ds2=dr2+r2dθ2+r2sin2θdϕ2ds^2 = dr^2 + r^2 d\theta^2 + r^2 \sin^2\theta \, d\phi^2
  1. 写出对应的坐标系 {xμ}\{x^\mu\}
  2. 写出度规张量 gμνg_{\mu\nu} 的矩阵形式。
  3. 写出逆度规张量 gμνg^{\mu\nu} 的矩阵形式。
解答
  1. 坐标系 x1=r,x2=θ,x3=ϕx^1 = r, x^2 = \theta, x^3 = \phi
  2. 观察 ds2=g11(dr)2+g22(dθ)2+g33(dϕ)2ds^2 = g_{11}(dr)^2 + g_{22}(d\theta)^2 + g_{33}(d\phi)^2。由于没有交叉项(如 drdθdr d\theta),非对角元为 0。 [gμν]=(1000r200r2sin2θ)[g_{\mu\nu}] = \begin{pmatrix} 1 & 0 & 0 \\ 0 & r^2 & 0 \\ 0 & r^2 \sin^2\theta \end{pmatrix}
  3. 由于矩阵是对角阵,其逆矩阵就是对角线元素取倒数: [gμν]=(1000r200(rsinθ)2)[g^{\mu\nu}] = \begin{pmatrix} 1 & 0 & 0 \\ 0 & r^{-2} & 0 \\ 0 & (r \sin\theta)^{-2} \end{pmatrix} 检验gμνgνλ=δλμg^{\mu\nu} g_{\nu\lambda} = \delta^\mu_\lambda。例如 μ=2,λ=2\mu=2, \lambda=2: r2r2=1r^{-2} \cdot r^2 = 1

例题 2:指标升降与符号陷阱

问题: 在狭义相对论(平直闵可夫斯基时空)中,使用 (+++)(-+++) 度规: gμν=diag(1,1,1,1)g_{\mu\nu} = \text{diag}(-1, 1, 1, 1) 给定一个四维动量矢量 Pμ=(E,px,py,pz)P^\mu = (E, p_x, p_y, p_z)(这里设 c=1c=1)。
  1. 计算协变矢量 PμP_\mu
  2. 计算模长平方 P2=PμPμP^2 = P^\mu P_\mu
  3. 对于光子 (m=0m=0),这意味着什么?
解答
  1. 降指P0=g00P0=(1)E=EP_0 = g_{00} P^0 = (-1) \cdot E = -E P1=g11P1=(1)px=pxP_1 = g_{11} P^1 = (1) \cdot p_x = p_x ... 所以:Pμ=(E,px,py,pz)P_\mu = (-E, p_x, p_y, p_z) 注意时间分量反号了!
  2. 计算模长P2=PμPμ=P0P0+PiPi=E(E)+(px2+py2+pz2)=E2+p2P^2 = P^\mu P_\mu = P^0 P_0 + P^i P_i = E(-E) + (p_x^2 + p_y^2 + p_z^2) = -E^2 + |\vec{p}|^2
  3. 物理诠释: 在相对论力学中,P2=m2P^2 = -m^2(静质量平方的负数,取决于定义)。 对于光子,m=0m=0。所以 P2=0P^2 = 0。 这意味着 E2+p2=0    E=p-E^2 + |\vec{p}|^2 = 0 \implies E = |\vec{p}|几何结论:光子的动量矢量在四维时空中是非零矢量,但其“长度”(自内积)为零。这是一个零矢量 (Null Vector)

例题 3:非对角度规与混合索引

问题: 考虑一个二维“旋转”坐标系(如克尔黑洞的赤道面简化版),线元包含交叉项: ds2=dt2+2dtdϕ+dr2ds^2 = -dt^2 + 2 dt d\phi + dr^2 坐标为 (t,ϕ,r)(t, \phi, r)
  1. 写出矩阵 gμνg_{\mu\nu}
  2. 计算行列式 det(g)\det(g),检查其是否退化。
  3. 求逆度规 gμνg^{\mu\nu} 中的 gttg^{tt} 分量。
解答
  1. 识别分量
    • dt2dt^2 系数 1    gtt=1-1 \implies g_{tt} = -1
    • dr2dr^2 系数 1    grr=11 \implies g_{rr} = 1
    • dtdϕdt d\phi 系数 22。注意公式是 gμνdxμdxν\sum g_{\mu\nu}dx^\mu dx^\nu,对于交叉项 dtdϕdt d\phi,由于对称性 gtϕ=gϕtg_{t\phi} = g_{\phi t},这一项会出现两次。所以 2gtϕ=2    gtϕ=12 g_{t\phi} = 2 \implies g_{t\phi} = 1。(注意系数除以2的规则!)
    • dϕ2d\phi^2 系数 0    gϕϕ=00 \implies g_{\phi\phi} = 0
    矩阵形式(顺序 t,ϕ,rt, \phi, r):
    g=(110100001)g = \begin{pmatrix} -1 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}
  2. 计算行列式: 这是块对角矩阵。右上角是 (1110)\begin{pmatrix} -1 & 1 \\ 1 & 0 \end{pmatrix},右下角是 11det(g)=[(1)(0)(1)(1)]×1=10\det(g) = [(-1)(0) - (1)(1)] \times 1 = -1 \neq 0 度规非退化,是个合法的洛伦兹度规。
  3. 求逆度规: 需要求该矩阵的逆。重点关注左上 2×22\times 2A=(1110)A = \begin{pmatrix} -1 & 1 \\ 1 & 0 \end{pmatrix}A1=1det(A)(0111)=11(0111)=(0111)A^{-1} = \frac{1}{\det(A)} \begin{pmatrix} 0 & -1 \\ -1 & -1 \end{pmatrix} = \frac{1}{-1} \begin{pmatrix} 0 & -1 \\ -1 & -1 \end{pmatrix} = \begin{pmatrix} 0 & 1 \\ 1 & 1 \end{pmatrix} 即:
    gμν=(010110001)g^{\mu\nu} = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}
    结果分析:虽然 gtt=1g_{tt} = -1,但逆矩阵分量 gtt=0g^{tt} = 0!这再次强调了 gμνg^{\mu\nu} 不是简单地对 gμνg_{\mu\nu} 每个元素取倒数,而是矩阵求逆的操作。

评论

15 条评论,欢迎与作者交流。

正在加载评论...