第一章：微分几何基础

1.1 可微流形 (Differentiable Manifolds)

这一节是整个广义相对论的“数据结构定义”。我们将展示如何从一堆局部看起来像欧几里得空间（

\mathbb{R}^n

）的碎片，通过严格的接口协议拼装成一个全局的弯曲空间。

定义 1.1.1：拓扑流形 (Topological Manifold)

一个 $n$ 维拓扑流形

\mathcal{M}

是一个拓扑空间，满足以下三条公理：

Hausdorff 性 (分离公理)：对于任意不同两点 $p, q \in \mathcal{M}$ $p, q \in M$ ，存在不相交的开集 $O_p, O_q$ $O_{p}, O_{q}$ 分别包含 $p$ $p$ 和 $q$ $q$ 。
- CS 类比：保证了点的“可区分性”。如果没有这条，可能会出现两个无法通过逼近算法区分的“重叠点”。
第二可数性 (Second Countable)：存在可数的拓扑基。
- CS 类比：保证了流形不会过大/过于离散，确保了分割（Partition of Unity）的存在，这是定义积分和度量的基础。
局部欧氏性 (Locally Euclidean)：对于 $\forall p \in \mathcal{M}$ ，存在一个邻域 $U \ni p$ 和一个同胚映射（连续且逆连续的双射） $\phi: U \to \hat{U} \subseteq \mathbb{R}^n$ ，其中 $\hat{U}$ 是 $\mathbb{R}^n$ 中的开集。

定义 1.1.2：坐标卡 (Coordinate Chart)

对元组

(U, \phi)

称为流形上的一个坐标卡 (Chart)。

坐标映射： $\phi(p) = (x^1, x^2, ..., x^n) \in \mathbb{R}^n$ 。这被称为点 $p$ 在该坐标卡下的局部坐标。
参数化映射：逆映射 $\phi^{-1}: \hat{U} \to U$ 将 $\mathbb{R}^n$ 中的数据“还原”回流形上的点。

定义 1.1.3：光滑图集与微分结构 (Smooth Atlas & Differential Structure)

这是“可微”二字的关键。单个坐标卡只能覆盖局部，要描述整个流形，我们需要覆盖全集的图集 (Atlas)

\mathcal{A} = \{(U_\alpha, \phi_\alpha)\}_{\alpha \in I}

。

若两个坐标卡

(U_\alpha, \phi_\alpha)

和

(U_\beta, \phi_\beta)

有重叠（

U_\alpha \cap U_\beta \neq \emptyset

），则定义坐标转换函数 (Transition Map)

\psi_{\beta\alpha}

：

\psi_{\beta\alpha} = \phi_\beta \circ \phi_\alpha^{-1} : \quad \phi_\alpha(U_\alpha \cap U_\beta) \to \phi_\beta(U_\alpha \cap U_\beta)

这是一个从

\mathbb{R}^n

的子集到

\mathbb{R}^n

的子集的普通函数。

若 $\mathcal{A}$ 中所有的转换函数 $\psi_{\beta\alpha}$ 都是 $C^\infty$ (无穷阶可微) 的，则称 $\mathcal{A}$ 为光滑图集。
装备了最大光滑图集的拓扑流形称为光滑流形 (Smooth Manifold)。

1.1.4 构建圆 ( $S^1$ ) 的微分结构

问题描述：证明单位圆

S^1 = \{ (x, y) \in \mathbb{R}^2 \mid x^2 + y^2 = 1 \}

是一个 1 维可微流形。注意：圆是一个嵌入在 2 维空间的 1 维对象，但我们不能直接用极坐标角度 $\theta \in [0, 2\pi)$ 作为一个全局坐标卡，因为在 $0$ 和 $2\pi$ 的连接处不连续。我们需要至少两个坐标卡。

解题步骤：我们使用立体投影 (Stereographic Projection) 来构建图集。

步骤 1：构造坐标卡 $1$ (北极投影)

取去心北极点

N=(0, 1)

的圆

U_N = S^1 \setminus \{N\}

。定义映射

\phi_N: U_N \to \mathbb{R}

，将圆上一点

(x, y)

连线

N

，投射到

X

轴 (

y=0

) 上。通过简单的几何相似关系推导投影公式：

u = \phi_N(x, y) = \frac{x}{1-y}

其逆映射（参数化）

\phi_N^{-1}: \mathbb{R} \to U_N

为（解方程组）：

x = \frac{2u}{u^2+1}, \quad y = \frac{u^2-1}{u^2+1}

显然，

\phi_N

和

\phi_N^{-1}

在其定义域内连续。

步骤 2：构造坐标卡 $2$ (南极投影)

取去心南极点

S=(0, -1)

的圆

U_S = S^1 \setminus \{S\}

。定义映射

\phi_S: U_S \to \mathbb{R}

，将圆上一点

(x, y)

连线

S

，投射到

X

轴上。公式为：

v = \phi_S(x, y) = \frac{x}{1+y}

其逆映射

\phi_S^{-1}: \mathbb{R} \to U_S

为：

x = \frac{2v}{1+v^2}, \quad y = \frac{1-v^2}{1+v^2}

步骤 3：分析重叠区域与转换函数

图集

\mathcal{A} = \{(U_N, \phi_N), (U_S, \phi_S)\}

覆盖了

S^1

（因为没有任何点既是北极又是南极）。重叠区域

U_{N \cap S} = S^1 \setminus \{N, S\}

。

我们需要计算从

u

坐标系变换到

v

坐标系的转换函数

\psi_{SN} = \phi_S \circ \phi_N^{-1}

。思路：

输入 $u$ 。
通过 $\phi_N^{-1}$ 还原为流形上的点 $(x, y)$ 。
将 $(x, y)$ 喂给 $\phi_S$ 得到 $v$ 。

计算：

v = \phi_S \left( \frac{2u}{u^2+1}, \frac{u^2-1}{u^2+1} \right) = \frac{x}{1+y}

代入

x, y

的

u

表达式：

v = \frac{ \frac{2u}{u^2+1} }{ 1 + \frac{u^2-1}{u^2+1} } = \frac{ \frac{2u}{u^2+1} }{ \frac{u^2+1 + u^2-1}{u^2+1} } = \frac{2u}{2u^2} = \frac{1}{u}

所以，转换函数为：

\psi_{SN}(u) = \frac{1}{u}

定义域为

\phi_N(U_{N \cap S}) = \mathbb{R} \setminus \{0\}

。

步骤 4：验证微分结构 (Compatibility Check)

函数

f(u) = 1/u

在

\mathbb{R} \setminus \{0\}

上是

C^\infty

(光滑) 的。（其导数为

-1/u^2

2/u^3

, ... 均存在且连续）。同理，反向转换

\psi_{NS}(v) = 1/v

也是

C^\infty

的。

结论：由于所有的转换函数都是光滑的，

(U_N, \phi_N)

和

(U_S, \phi_S)

是兼容的。这个图集赋予了

S^1

标准的微分结构。这意味着我们可以在

S^1

上进行微积分运算，而不必担心“接缝”处的奇异性。

值得一提 在数值计算或几何处理中，如果试图用单一的 double theta ( $0 \le \theta < 2\pi$ ) 变量来模拟圆环上的物理场，会遇到著名的 "Hairy Ball Theorem" (毛球定理) 或类似的拓扑障碍带来的数值不稳定：

奇点：在 $\theta = 0$ 处进行插值或求导时，需要特殊的 if 逻辑处理周期性边界条件。

流形视角：使用图集（Atlas）的方法则是真正通用的。您存储两个 patch 的数据（ $u$ 和 $v$ ），当物体运动到北极附近时（ $u \to \infty$ ），程序逻辑自动检测并使用 Transition Map 切换到南极坐标系（ $v \approx 0$ ），从而避免数值溢出（Overflow）和精度丢失。 * 这就是流形在“计算”中的本质：没有全局最优坐标系，只有通过协议（转换函数）互联的局部坐标系。

1.2 切空间与切矢量 (Tangent Space & Vectors)

在欧几里得空间

\mathbb{R}^n

中，我们习惯将向量视为连接两点（如原点到某点）的直观箭头。然而在弯曲流形（Manifold）上，两点之间的连线通常不在流形内部（例如球面上的两点连线会穿过球体内部）。

因此，我们需要从局部性质出发，建立一种不依赖于嵌入高维空间的内在定义。我们将切矢量严格定义为作用在光滑函数上的导数算子（Derivation）。

1.2.1 作为导数算子的切矢量

设

\mathcal{M}

为

n

维光滑流形，

p \in \mathcal{M}

为流形上的一点。令

C^\infty(p)

为在点

p

的邻域内定义的所有实值光滑函数

f: \mathcal{M} \to \mathbb{R}

的集合。

定义 1.2.1 (切矢量)：点

p

处的切矢量

v

是一个线性映射

v: C^\infty(p) \to \mathbb{R}

，它满足以下两条公理：

线性性 (Linearity)： $v(af + bg) = a v(f) + b v(g), \quad \forall f, g \in C^\infty(p), \forall a, b \in \mathbb{R}$
莱布尼茨律 (Leibniz Rule / Product Rule)： $v(fg) = f(p)v(g) + g(p)v(f)$

直观理解：切矢量本质上是“方向导数”。

v(f)

的值表示函数

f

沿着

v

方向在

p

点的变化率。

1.2.2 切空间的基底与分量

虽然定义是抽象的，但我们需要具体计算。这需要引入坐标系。设

x = (x^0, x^1, \dots, x^{n-1})

为点

p

周围的一个局部坐标系。

定义 1.2.2 (坐标基底)：对于坐标系中的每一个坐标

x^\mu

，定义算子

\frac{\partial}{\partial x^\mu}

作用于函数

f

如下：

\left( \frac{\partial}{\partial x^\mu} \right)_p (f) \equiv \frac{\partial (f \circ \phi^{-1})}{\partial x^\mu} \Bigg|_{\phi(p)}

这正是标准的偏导数。很容易验证它满足上述的线性性和莱布尼茨律。

定理 1.2.1 (切空间基定理)：集合

\left\{ \left(\frac{\partial}{\partial x^0}\right)_p, \dots, \left(\frac{\partial}{\partial x^{n-1}}\right)_p \right\}

构成了切空间

T_p\mathcal{M}

的一组基，称为坐标基 (Coordinate Basis)。

因此，任意切矢量

v \in T_p\mathcal{M}

都可以唯一地写成这组基的线性组合：

v = \sum_{\mu=0}^{n-1} v^\mu \left(\frac{\partial}{\partial x^\mu}\right)_p \overset{\text{Einstein}}{=} v^\mu \partial_\mu

其中系数

v^\mu

称为矢量

v

在该坐标系下的分量。

值得一提：

$v$ (对象) = $v^\mu$ (数据) $\cdot$ $\partial_\mu$ (接口/方法)。

当我们说“求矢量 $v$ 作用于函数 $f$ ”时，运算过程是： $v(f) = (v^\mu \partial_\mu) f = v^\mu \frac{\partial f}{\partial x^\mu}$ 。

1.2.3 与路径切线的联系

为了联系物理直觉，通常通过流形上的曲线来构造切矢量。

设

\gamma: (-\epsilon, \epsilon) \to \mathcal{M}

是一条光滑曲线，且

\gamma(0) = p

。这条曲线在点

p

定义了一个切矢量

v_\gamma

，其作用法则为：

v_\gamma(f) \equiv \frac{d}{dt} (f \circ \gamma)(t) \Bigg|_{t=0}

根据链式法则，如果曲线在坐标系

x^\mu

下的方程为

x^\mu(t)

，则：

\frac{d}{dt} f(x(t)) = \sum_{\mu} \frac{dx^\mu}{dt} \frac{\partial f}{\partial x^\mu}

对比

v = v^\mu \partial_\mu

，我们得到矢量的分量即为坐标对参数的导数：

v^\mu = \frac{dx^\mu}{dt}\Bigg|_{t=0}

1.2.4 切空间与切矢量例题

例题 1：算子操作与求值

场景：考虑 2 维平面

\mathbb{R}^2

（流形），坐标为笛卡尔坐标

(x, y)

。定义一个函数

f(x, y) = x^2 y + \sin(x)

。定义点

p = (0, 2)

处的一个切矢量

v = 3 \partial_x - \partial_y

。

问题：计算

v(f)

的值。

解答：切矢量是微分算子，我们直接将算子作用于函数：

\begin{aligned} v(f) &= \left( 3 \frac{\partial}{\partial x} - 1 \frac{\partial}{\partial y} \right) (x^2 y + \sin(x)) \Bigg|_{(0,2)} \\ &= 3 \frac{\partial}{\partial x}(x^2 y + \sin(x)) \Bigg|_{(0,2)} - \frac{\partial}{\partial y}(x^2 y + \sin(x)) \Bigg|_{(0,2)} \\ &= 3 (2xy + \cos(x)) \Bigg|_{(0,2)} - (x^2) \Bigg|_{(0,2)} \end{aligned}

代入点

p

的坐标

x=0, y=2

：

\begin{aligned} &= 3 (2 \cdot 0 \cdot 2 + \cos(0)) - (0^2) \\ &= 3 (0 + 1) - 0 \\ &= 3 \end{aligned}

物理含义：若你站在

(0,2)

处，沿着向量

(3, -1)

的方向移动，感受到标量场

f

的瞬时变化率为 3。

例题 2：坐标变换法则 (基变换)

这是广义相对论中最核心的运算之一。

场景：考虑

\mathbb{R}^2

，从笛卡尔坐标

(x, y)

变换到极坐标

(r, \theta)

。变换公式为：

x = r \cos\theta, \quad y = r \sin\theta

。

问题：

将极坐标基矢量 $\partial_r$ 和 $\partial_\theta$ 用笛卡尔基矢量 $\partial_x, \partial_y$ 表示。
验证变换矩阵（Jacobian）的作用。

解答： 1. 使用链式法则推导基底变换： 我们将

\partial_r

视为作用于任意函数

f

的算子。根据多元微积分链式法则：

\frac{\partial f}{\partial r} = \frac{\partial f}{\partial x} \frac{\partial x}{\partial r} + \frac{\partial f}{\partial y} \frac{\partial y}{\partial r}

剥离测试函数

f

，得到算子关系：

\partial_r = \frac{\partial x}{\partial r} \partial_x + \frac{\partial y}{\partial r} \partial_y

计算偏导系数：

$\frac{\partial x}{\partial r} = \cos\theta$
$\frac{\partial y}{\partial r} = \sin\theta$

同理对于

\partial_\theta

：

$\frac{\partial x}{\partial \theta} = -r\sin\theta$
$\frac{\partial y}{\partial \theta} = r\cos\theta$

所以基变换关系为：

\begin{aligned} \partial_r &= \cos\theta \, \partial_x + \sin\theta \, \partial_y \\ \partial_\theta &= -r\sin\theta \, \partial_x + r\cos\theta \, \partial_y \end{aligned}

2. 分量变换的逆变性验证： 设某矢量

v

在极坐标下的分量为

(v^r, v^\theta) = (1, 0)

（即径向单位矢量）。该矢量在笛卡尔坐标系下的分量

(v^x, v^y)

是什么？

根据矢量本身是不变量：

v = v^r \partial_r + v^\theta \partial_\theta = v^x \partial_x + v^y \partial_y

。将刚才推导的

\partial_r

表达式代入左边：

1 \cdot (\cos\theta \, \partial_x + \sin\theta \, \partial_y) + 0 = v^x \partial_x + v^y \partial_y

对比系数可得：

v^x = \cos\theta, \quad v^y = \sin\theta

这通过矢量变换法则公式验证如下（其中

x^{\mu'} = \{x, y\}, x^\mu = \{r, \theta\}

）：

v^{\mu'} = \frac{\partial x^{\mu'}}{\partial x^\mu} v^\mu

v^x = \frac{\partial x}{\partial r} v^r + \frac{\partial x}{\partial \theta} v^\theta = (\cos\theta)(1) + (-r\sin\theta)(0) = \cos\theta

结论：这展示了基矢量（

\partial_\mu

）与分量（

v^\mu

）变换行为相反（一为协变，一为逆变），从而保证总矢量

v

是一个几何不变量。

1.3 爱因斯坦求和约定 (Einstein Summation Convention)

在广义相对论中，公式往往涉及大量的多重求和。为了简化符号，爱因斯坦引入了一套省略求和号

\sum

的记法。这不仅仅是速记法，它更是张量代数的语法检查器，能直观反映方程的协变性（Covariance）。

1.3.1 核心定义与规则

定义 1.8 (指标分类)：在一个单项式（Term）中，任何一个指标（Index，如

\mu, \nu, \alpha

）只可能属于以下两类之一：

哑指标 (Dummy Index)：
- 特征：在单项式中出现两次，且必须是一上一下。
- 语义：表示对该指标进行遍历求和。
- 性质：可以用任意其他未占用的字母替换（如 $\mu \to \sigma$ ），不改变表达式的值（相当于局部变量重命名）。
自由指标 (Free Index)：
- 特征：在单项式中仅出现一次（通常）。
- 语义：代表方程对该维度的每一个分量都成立。
- 性质：在方程的所有项（左边和右边）中，自由指标必须名称相同、位置（上下）相同。

约定规则：设维度为

n

（GR 中

n=4

，指标取

\{0, 1, 2, 3\}

）。若指标

\mu

在单项式中出现一次上标、一次下标，则：

A^\mu B_\mu \equiv \sum_{\mu=0}^{n-1} A^\mu B_\mu = A^0 B_0 + A^1 B_1 + \dots + A^{n-1} B_{n-1}

算法视角

自由指标 $\leftrightarrow$ 外层循环 / 数组索引

哑指标 $\leftrightarrow$ 内层循环 / 局部迭代变量

表达式 $y^\mu = M^\mu_\nu x^\nu$ 等价于以下代码逻辑：
PYTHON
# n = 4 (Space-time dimensions) y = [0.0] * 4 # Initialize output array # Free index mu appears once on LHS, once on RHS -> Outer Loop for mu in range(4): sum_val = 0.0 # Dummy index nu appears twice (up/down) on RHS -> Inner Summation for nu in range(4): sum_val += M[mu][nu] * x[nu] y[mu] = sum_val

1.3.2 基础例题：线性代数操作

通过常见的矩阵运算来熟悉张量标记法。

例题 1：内积与矩阵乘法 假设

u, v

是矢量，

A, B

是矩阵（二阶张量）。请用爱因斯坦约定表示以下运算：

向量内积 $s = u \cdot v$ （注：需通过度规定义，暂假设欧氏空间或对偶配对）。
矩阵-向量乘法 $w = Av$ 。
矩阵-矩阵乘法 $C = AB$ 。
矩阵的迹 (Trace) $t = \text{tr}(A)$ 。

解答：

内积：即行向量乘列向量。 $s = u_\mu v^\mu$ 这里 $\mu$ 是哑指标，结果 $s$ 没有自由指标，是一个标量（0阶张量）。
矩阵-向量乘法： $w^\mu = A^\mu_\nu v^\nu$ $w^{μ} = A_{ν}^{μ} v^{ν}$
- $\nu$ 是哑指标（求和），消去。
- $\mu$ 是自由指标，保留。左边是矢量分量 $w^\mu$ ，右边缩并后也是矢量分量，类型匹配。
矩阵乘法： $C^\mu_\rho = A^\mu_\nu B^\nu_\rho$ $C_{ρ}^{μ} = A_{ν}^{μ} B_{ρ}^{ν}$
- $\nu$ 它是中间连接的桥梁（求和），即 $C_{ik} = \sum_j A_{ij} B_{jk}$ 。
- $\mu$ （上）和 $\rho$ （下）是自由指标。
迹：对角元之和。即令上标等于下标。 $t = A^\mu_\mu$ $t = A_{μ}^{μ}$
- $\mu$ 既在上也在下，触发求和： $A^0_0 + A^1_1 + \dots$ 。

1.3.3 进阶例题：多重求和与指标代换

在推导场方程时，经常遇到多个张量相乘，此时必须小心管理指标名称（Scope Management）。

例题 2：二次型与嵌套定义 已知

y^\alpha = A^\alpha_\beta x^\beta

且

z = \omega_\alpha y^\alpha

。请将

z

直接表示为关于

x

的表达式。

解答：直接代入：

z = \omega_\alpha (A^\alpha_\beta x^\beta) = \omega_\alpha A^\alpha_\beta x^\beta

分析指标：

$\alpha$ ：出现两次（ $\omega_\alpha$ 和 $A^\alpha_\dots$ ），是一对哑指标 $\rightarrow$ 第一重循环。
$\beta$ ：出现两次（ $A^\dots_\beta$ 和 $x^\beta$ ），是一对哑指标 $\rightarrow$ 第二重循环。
此式包含双重求和： $z = \sum_\alpha \sum_\beta \omega_\alpha A^\alpha_\beta x^\beta$ 。

陷阱提示（Variable Shadowing）：如果你有两个方程 $a^\mu = B^\mu_\nu b^\nu$ 和 $c^\mu = D^\mu_\nu d^\nu$ ，想要相乘。 错误写法： $a^\mu c^\mu = B^\mu_\nu b^\nu D^\mu_\nu d^\nu$

错误 1： $\mu$ 在左边出现两次（同为上标），非法。

错误 2： $\nu$ 在右边出现四次，语义不清。

正确写法（重命名哑指标）： $a^\mu c^\rho = (B^\mu_\nu b^\nu) (D^\rho_\sigma d^\sigma) = B^\mu_\nu D^\rho_\sigma b^\nu d^\sigma$

在合并两个表达式时，必须确保各自的哑指标不冲突（就像在编程中不能在嵌套循环中使用相同的迭代变量名 i）。

1.3.4 合法性判断

这是学习 GR 初期的重要训练：判断一个表达式是否符合张量语法。

例题 3：以下表达式在爱因斯坦约定下是否合法？如果不合法，指出原因。 (设

T

为

(2,0)

张量，

S

为

(1,1)

张量，

v

为矢量)

$T^{\mu\nu} v_\nu = S^\mu_\nu v^\nu$
$a = T^{\mu\mu}$
$b_\mu = T^{\mu\nu} v_\mu v_\nu$
$R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R = 8\pi G T_{\mu\nu}$ (爱因斯坦场方程)

解答：

非法。
- 左边 (LHS)： $T^{\mu\nu} v_\nu$ 。 $\nu$ 缩并，自由指标是 $\mu$ （上）。合法。
- 右边 (RHS)： $S^\mu_\nu v^\nu$ 。 $\nu$ 缩并，自由指标是 $\mu$ （上）。合法。
- 左右对比：看起来自由指标都是 $\mu$ 。但是，仔细观察左边的求和项： $T^{\mu\nu} v_\nu$ 中， $\nu$ 一上一下。然而公式中的写法，在通常的几何意义下要求很严，但如果你指的是 $v_\nu$ 是协变矢量，这是合法的。
- 修正思考：如果是 $T^{\mu\nu} v^\nu$ ，则两个上标无法缩并（除非有度规参与）。如果是 $v_\nu$ （已降标），则 $T^{\mu\nu} v_\nu \to w^\mu$ 。
- 结论：语法上合法。LHS 和 RHS 都是含有一个上标自由指标 $\mu$ 的矢量。
非法。
- $T^{\mu\mu}$ 中 $\mu$ 出现了两次，但都在上标位置。
- 爱因斯坦求和必须是一上一下。如果想表达对角线求和，必须引入度规： $g_{\mu\nu} T^{\mu\nu}$ 。单纯的 $T^{\mu\mu}$ 在不指定坐标系的情况下没有几何意义（不具备协变性）。
非法。
- 观察指标 $\mu$ $μ$ ：
  - $T^{\mu\nu}$ (上)
  - $b_\mu$ (下)
  - $v_\mu$ (下)
- $\mu$ 在方程中出现了三次（左1，右2）。这违反了“每个指标在一项中最多出现两次”的规则。
- 更深层错误：右边的 $T^{\mu\dots}$ (上) 和 $v_\mu$ (下) 看起来可以缩并，但如果缩并了， $\mu$ 就变成了哑指标（消失），但左边 $b_\mu$ 却还保留着 $\mu$ 作为自由指标。逻辑矛盾。
合法。
- 这是张量分析中最标准的方程。
- 自由指标： $\mu, \nu$ (均为下标)。
- 第一项 $R_{\mu\nu}$ ：自由指标 $\mu, \nu$ 。
- 第二项 $\frac{1}{2} g_{\mu\nu} R$ ： $R$ 是标量（已完全缩并）， $g_{\mu\nu}$ 提供自由指标 $\mu, \nu$ 。
- 第三项 $T_{\mu\nu}$ ：自由指标 $\mu, \nu$ 。
- 每一项的自由指标结构完全一致。

1.4 对偶空间与余切矢量 (Dual Space & Cotangent Vectors)

在这一节中，我们将严格区分“矢量”和“梯度”这两个在欧几里得空间中经常混淆的概念，并引入 GR 描述物理场的关键接口——余切矢量。

在平直的欧几里得空间中，列向量

v

和行向量

v^T

看起来包含相同的数据（只是转置了一下），因此我们经常混用梯度向量

\nabla f

和位移向量

\vec{r}

。

但在流形上，它们是完全不同类型的数据对象，居住在完全不同的空间中，拥有不同的坐标变换法则。

1.4.1 几何直观：箭头 vs. 等高线

切矢量 (Tangent Vector, $v \in T_p\mathcal{M}$ )：
- 几何形象：一个小箭头。
- 物理意义：速度、位移、流量。
- 类比：实例。它是有“大小”和“方向”的实体。
余切矢量 (Cotangent Vector / One-form, $\omega \in T_p^*\mathcal{M}$ )：
- 几何形象：一组成层排列的平行面（类似于地图上的等高线）。
- 物理意义：密度、梯度、动量。
- 类比：方法/查询。它的作用是“吃掉”一个矢量，吐出一个实数（测量值）。

当我们将一个矢量（箭头）“射入”一个余切矢量（层叠面）时，箭头穿过的层数，就是两者缩并（Contraction）的结果数值。

1.4.2 形式化定义：线性泛函

定义 1.9 (对偶空间)：设

T_p\mathcal{M}

是点

p

处的切空间（向量空间）。定义其对偶空间 (Dual Space)

T_p^*\mathcal{M}

为所有从

T_p\mathcal{M}

到

\mathbb{R}

的线性映射（线性泛函）的集合。

\omega \in T_p^*\mathcal{M} \iff \omega: T_p\mathcal{M} \to \mathbb{R} \text{ 是线性的}

定义 1.10 (对偶基 / Dual Basis)：在坐标系

\{x^\mu\}

下，自然切基是

\{\mathbf{e}_\mu = \frac{\partial}{\partial x^\mu}\}

。我们定义其对偶基

\{\theta^\nu = dx^\nu\}

满足如下正交归一条件：

dx^\nu \left( \frac{\partial}{\partial x^\mu} \right) = \delta^\nu_\mu

为什么记作 $dx$ ？ 在微积分中， $dx$ 是一个无穷小量。但在流形几何中， $dx^\mu$ 被严格定义为坐标函数 $x^\mu$ 的梯度（即 $dx^\mu$ 是一个“提取第 $\mu$ 个分量”的机器）。

任意余切矢量

\omega

可在基底下展开为分量形式（注意下标）：

\omega = \omega_\mu dx^\mu

1.4.3 核心原型：梯度 (The Gradient)

在 GR 中，标量场

f

的导数天然产生一个余切矢量，而不是切矢量。这一对象记为

df

（微分/外导数）。

定理 1.2 (梯度的自然性)：设

f: \mathcal{M} \to \mathbb{R}

是光滑函数，沿着矢量

v

的方向导数定义为

v(f)

。我们可以构造一个线性映射

df

，使得：

\langle df, v \rangle \equiv v(f)

利用链式法则展开

v(f) = v^\mu \frac{\partial f}{\partial x^\mu}

，根据线性性，我们可以读出

df

的分量：

df = \frac{\partial f}{\partial x^\mu} dx^\mu

这意味着梯度的分量是

\omega_\mu = \partial_\mu f

。

值得一提：想求一个函数的梯度，本质上是求它相对于坐标网格变化率的线性组合。这是一个行向量操作，因为它等待与一个列向量（变化方向）相乘来产生标量（变化量）。

1.4.4 坐标变换法则 (Transformation Laws)

区分矢量和余切矢量最根本的方法是看它们在坐标变换下的表现。这类似于协变 (Covariant) 与 逆变 (Contravariant) 类型检查。

设坐标系从

x

变换到

x'

，雅可比矩阵为

\Lambda^{\mu'}_{\nu} = \frac{\partial x'^{\mu'}}{\partial x^\nu}

，其逆矩阵为

(\Lambda^{-1})^\nu_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}}

。

切矢量 (Contravariant / 上标)：矢量 $v = v^\mu \partial_\mu$ 是客观存在的几何对象，其本体不变。当基底变换时，分量必须反向补偿。 $v'^{\mu'} = \frac{\partial x'^{\mu'}}{\partial x^\nu} v^\nu$ （分量随坐标“分子”变换）
余切矢量 (Covariant / 下标)：由链式法则 $\frac{\partial f}{\partial x'^{\mu'}} = \frac{\partial f}{\partial x^\nu} \frac{\partial x^\nu}{\partial x'^{\mu'}}$ 可知： $\omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu$ （分量随坐标“分母”变换，即逆雅可比矩阵）

口诀：

上标（矢量）：用顺向导数（新对旧 $x'/x$ ）。

下标（余切）：用逆向导数（旧对新 $x/x'$ ）。

1.4.5 例题讲解

例题 1：欧氏空间与极坐标变换

考虑二维平面上的点

p

。

直角坐标 $x^\mu = (x, y)$ 。有一常数余切矢量 $\omega = 3dx + 4dy$ ，即分量 $\omega_\mu = (3, 4)$ 。
极坐标 $x'^{\mu'} = (r, \theta)$ ，其中 $x = r \cos\theta, y = r \sin\theta$ 。问题：求 $\omega$ 在极坐标系下的分量 $\omega'_{\mu'} = (\omega_r, \omega_\theta)$ 。

解答：我们需要使用余切矢量的变换法则（下标法则）：

\omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu

我们需要计算逆雅可比矩阵

\frac{\partial(x, y)}{\partial(r, \theta)}

：

$\frac{\partial x}{\partial r} = \cos\theta, \quad \frac{\partial x}{\partial \theta} = -r\sin\theta$
$\frac{\partial y}{\partial r} = \sin\theta, \quad \frac{\partial y}{\partial \theta} = r\cos\theta$

计算分量：

$\omega_r = \frac{\partial x}{\partial r}\omega_x + \frac{\partial y}{\partial r}\omega_y = (\cos\theta) \cdot 3 + (\sin\theta) \cdot 4 = 3\cos\theta + 4\sin\theta$
$\omega_\theta = \frac{\partial x}{\partial \theta}\omega_x + \frac{\partial y}{\partial \theta}\omega_y = (-r\sin\theta) \cdot 3 + (r\cos\theta) \cdot 4 = r(4\cos\theta - 3\sin\theta)$

注意 $\omega_\theta$ 的量纲带有一个长度 $r$ 。这说明余切矢量的分量物理量纲与矢量相反（为了乘积是标量）。在代码中，如果你直接把 $(3,4)$ 赋给 $(r, \theta)$ 分量是类型错误的。

例题 2：标量的不变性验证 (Invariant Check)

问题：验证

\omega(v)

的值与坐标系选择无关。设矢量

v

在直角坐标系下为

v = v^x \partial_x + v^y \partial_y

。在极坐标系下为

v' = v^r \partial_r + v^\theta \partial_\theta

。证明：

\omega_\mu v^\mu = \omega'_{\mu'} v'^{\mu'}

。

证明：从 RHS（右边）开始：

\text{RHS} = \omega'_{\mu'} v'^{\mu'}

代入变换公式：

余切矢量展开： $\omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu$
切矢量展开： $v'^{\mu'} = \frac{\partial x'^{\mu'}}{\partial x^\sigma} v^\sigma$

组合：

\text{RHS} = \left( \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu \right) \left( \frac{\partial x'^{\mu'}}{\partial x^\sigma} v^\sigma \right)

这里对

\mu', \nu, \sigma

都有求和。利用导数的链式法则，注意

\mu'

是中间变量（哑指标）：

\frac{\partial x^\nu}{\partial x'^{\mu'}} \frac{\partial x'^{\mu'}}{\partial x^\sigma} = \frac{\partial x^\nu}{\partial x^\sigma} = \delta^\nu_\sigma

（对同一个坐标系，坐标

x^\nu

对

x^\sigma

的偏导仅当

\nu=\sigma

时为 1，否则为 0）

于是：

\text{RHS} = \delta^\nu_\sigma \omega_\nu v^\sigma = \omega_\nu v^\nu = \text{LHS}

结论：缩并操作

\langle \omega, v \rangle

是一个标量（Scalar），它代表真实的物理量，不随我们观察的角度（坐标系）而改变。

例题 3：从度规推导对偶矢量

在闵可夫斯基时空（狭义相对论）中，度规

g_{\mu\nu} = \text{diag}(-1, 1, 1, 1)

。设四维速度矢量

u^\mu = (\gamma, \gamma v, 0, 0)

，其中

\gamma = 1/\sqrt{1-v^2}

。问题：求对应的余切矢量

u_\mu

。

解答：这是利用度规进行降指 (Index Lowering) 的典型操作：

u_\mu = g_{\mu\nu} u^\nu

展开矩阵乘法：

$u_0 = g_{00} u^0 + g_{01} u^1 + \dots = (-1)(\gamma) + 0 = -\gamma$
$u_1 = g_{10} u^0 + g_{11} u^1 + \dots = 0 + (1)(\gamma v) = \gamma v$
$u_2 = 1 \cdot 0 = 0$
$u_3 = 1 \cdot 0 = 0$

结果：

u_\mu = (-\gamma, \gamma v, 0, 0)

注意：在 GR 中，矢量

u^\mu

和对应的 1-form

u_\mu

在第 0 分量上符号相反。如果不区分上下指标，在计算模长

u^2 = u^\mu u_\mu

时就会得到错误的结果。

1.5 通用张量 (General Tensors)

张量是将标量、矢量和余切矢量推广到任意“秩（Rank）”的几何对象。它描述了不同几何实体之间的线性关系。

1.5.1 定义：多重线性映射

定义 1.11 ( $(k, l)$ 型张量)：在流形

\mathcal{M}

上的点

p

，一个 $(k, l)$ 型张量

T

是一个多重线性映射：

T: \underbrace{T_p^*\mathcal{M} \times \dots \times T_p^*\mathcal{M}}_{k \text{ 个 (输入 1-form)}} \times \underbrace{T_p\mathcal{M} \times \dots \times T_p\mathcal{M}}_{l \text{ 个 (输入 Vector)}} \to \mathbb{R}

$k$ 称为逆变秩 (Contravariant Rank)：对应的分量指标在上。
$l$ 称为协变秩 (Covariant Rank)：对应的分量指标在下。
线性性：对任意参数位置，满足 $T(\dots, a\mathbf{u} + b\mathbf{v}, \dots) = aT(\dots, \mathbf{u}, \dots) + bT(\dots, \mathbf{v}, \dots)$ 。

类比：函数签名 一个 $(1, 1)$ 张量可以看作一个函数，其强类型签名为： double tensor_mapping(CotangentVector omega, TangentVector v)

输入：需要 $k$ 个行向量（用来与上指标缩并）和 $l$ 个列向量（用来与下指标缩并）。

输出：当你把所有“槽位（Slots）”填满后，它返回一个不变量（标量）。

1.5.2 张量积与分量表示

我们需要一种“胶水”来将低阶对象组合成高阶张量。

定义 1.12 (张量积 / Tensor Product $\otimes$ )：设

S

是

(k, l)

型张量，

R

是

(m, n)

型张量。它们的张量积

S \otimes R

是一个

(k+m, l+n)

型张量，其定义为：

(S \otimes R)(\omega_1, \dots, \omega_{k+m}, v_1, \dots, v_{l+n}) \equiv S(\omega_1, \dots, \omega_k, v_1, \dots, v_l) \cdot R(\omega_{k+1}, \dots, v_{l+1}, \dots)

即：输入参数被分发给

S

和

R

，结果相乘。

定理 1.3 (基底展开)：利用张量积，我们可以构建张量空间的基底。任意

(k, l)

张量

T

可在坐标基

\{ \partial_\mu \}

和

\{ dx^\nu \}

下唯一展开：

T = T^{\mu_1 \dots \mu_k}_{\nu_1 \dots \nu_l} \, (\partial_{\mu_1} \otimes \dots \otimes \partial_{\mu_k}) \otimes (dx^{\nu_1} \otimes \dots \otimes dx^{\nu_l})

其中，

T^{\mu_1 \dots \mu_k}_{\nu_1 \dots \nu_l}

是

n^{k+l}

个实数组成的分量数组。

1.5.3 坐标变换法则 (The Supreme Law)

判断一个多维数组是否是“物理张量”的唯一标准，是看它是否遵循以下变换规律。这是 GR 中所有物理定律必须满足的类型安全检查。

设坐标变换

x \to x'

，雅可比矩阵为

\Lambda^{\mu'}_{\nu} = \frac{\partial x'^{\mu'}}{\partial x^\nu}

，逆雅可比矩阵为

(\Lambda^{-1})^\nu_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}}

。

张量分量变换法则：对于

(k, l)

张量，其新坐标下的分量

T'^{\mu'_1 \dots}_{\nu'_1 \dots}

为：

T'^{\mu'_1 \dots \mu'_k}_{\nu'_1 \dots \nu'_l} = \underbrace{\frac{\partial x'^{\mu'_1}}{\partial x^{\rho_1}} \dots \frac{\partial x'^{\mu'_k}}{\partial x^{\rho_k}}}_{\text{针对 } k \text{ 个上指标}} \cdot \underbrace{\frac{\partial x^{\sigma_1}}{\partial x'^{\nu'_1}} \dots \frac{\partial x^{\sigma_l}}{\partial x'^{\nu'_l}}}_{\text{针对 } l \text{ 个下指标}} \cdot T^{\rho_1 \dots \rho_k}_{\sigma_1 \dots \sigma_l}

规则总结：

每个上指标（逆变）“携带”一个 $\frac{\partial x'}{\partial x}$ （分子是新坐标）。

每个下指标（协变）“携带”一个 $\frac{\partial x}{\partial x'}$ （分母是新坐标）。

所有旧指标 ( $\rho, \sigma$ ) 都是哑指标，进行求和。

1.5.4 关键操作：缩并 (Contraction)

缩并是降低张量秩（Rank）的唯一内部操作（无需引入外部度规）。

定义 1.13 (缩并)：设

T

为

(k, l)

型张量（

k,l \ge 1

）。令其第

i

个上指标与第

j

个下指标相等（求和）。这将产生一个新的

(k-1, l-1)

型张量。

例如，对于

(1, 1)

张量

T^\mu_\nu

，缩并得到标量（迹）：

S = \text{tr}(T) = T^\mu_\mu = \sum_{\mu=0}^{n-1} T^\mu_\mu

定理 1.4 (缩并的几何意义)：在张量作为映射的视角下，

T(\omega, v)

本质上就是张量

T

与输入

v, \omega

的缩并。

T(\omega, v) \iff T^\mu_\nu \omega_\mu v^\nu

这里的“填槽”过程，实际上就是把输入的自由指标与张量的对应指标变为哑指标并求和。

1.5.5 例题讲解

例题 1：类型推断与对象识别

问题：在广义相对论中，判断以下对象的张量类型

(k, l)

：

度规张量 $g_{\mu\nu}$
逆度规 $g^{\mu\nu}$
克里斯托费尔符号 $\Gamma^\lambda_{\mu\nu}$
里奇曲率张量 $R_{\mu\nu}$
黎曼曲率张量 $R^\rho_{\sigma\mu\nu}$

解答：

$(0, 2)$ 张量。它接受两个矢量 $u, v$ ，输出内积 $g(u,v) \in \mathbb{R}$ 。
$(2, 0)$ 张量。它本质上是两个余切矢量的内积映射。
不是张量。 $\Gamma^\lambda_{\mu\nu}$ 在坐标变换时包含二阶导数项 $\frac{\partial^2 x}{\partial x'^2}$ ，破坏了线性变换规律（它是仿射联络系数，而非张量）。
$(0, 2)$ 张量。是 $(1,3)$ 黎曼张量的缩并结果（缩并了一个上标和一个下标，秩减2）。
$(1, 3)$ 张量。虽然它有4个指标，但标准定义是接受1个 1-form 和 3个矢量。

例题 2：张量积与运算逻辑

问题：设矢量

u^\mu = (1, 0)

，1-form

\omega_\nu = (1, 3)

（在二维平面）。定义

(1, 1)

张量

T = u \otimes \omega

。

写出 $T$ 的分量矩阵 $T^\mu_\nu$ 。
计算 $T$ 对矢量 $v^\nu = (2, 1)$ 的作用结果。

解答：

计算分量：根据张量积定义： $T^\mu_\nu = u^\mu \omega_\nu$ 。
$T = \begin{pmatrix} u^0 \\ u^1 \end{pmatrix} \begin{pmatrix} \omega_0 & \omega_1 \end{pmatrix} = \begin{pmatrix} 1 \\ 0 \end{pmatrix} \begin{pmatrix} 1 & 3 \end{pmatrix} = \begin{pmatrix} 1\cdot 1 & 1\cdot 3 \\ 0\cdot 1 & 0\cdot 3 \end{pmatrix} = \begin{pmatrix} 1 & 3 \\ 0 & 0 \end{pmatrix}$
注意：在习惯上，第一个指标 $\mu$ (Row) 代表行索引，第二个指标 $\nu$ (Col) 代表列索引。
作用于矢量 $v$ ：这是张量缩并 $w^\mu = T^\mu_\nu v^\nu$ （矩阵乘法）：
$w = \begin{pmatrix} 1 & 3 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} 2 \\ 1 \end{pmatrix} = \begin{pmatrix} 2 + 3 \\ 0 + 0 \end{pmatrix} = \begin{pmatrix} 5 \\ 0 \end{pmatrix}$
验证： $T(v) = (u \otimes \omega)(v) = u \cdot [\omega(v)] = u \cdot [\omega_\nu v^\nu] = u \cdot (1\cdot 2 + 3\cdot 1) = 5u = (5, 0)$ 。结果一致。

例题 3：商定理 (Quotient Theorem) 的应用

问题：假如有一个多维数组

X^{\mu\nu}

，我们不确定它是不是张量。已知对于任意的协变矢量（1-form）

a_\mu

和

b_\nu

，缩并结果

S = X^{\mu\nu} a_\mu b_\nu

在任何坐标系下都是一个标量（即

S' = S

）。证明：

X^{\mu\nu}

必须是一个

(2, 0)

型张量。

证明思路：这是一个非常重要的判定定理，称为商定理：如果一个对象被张量“除”（缩并）后得到张量，那它本身就是张量。

根据题意： $X'^{\alpha\beta} a'_\alpha b'_\beta = X^{\mu\nu} a_\mu b_\nu$ (标量不变)。
我们将 $a', b'$ 变换回旧坐标系： $a_\mu = \frac{\partial x'^\alpha}{\partial x^\mu} a'_\alpha$ $b_\nu = \frac{\partial x'^\beta}{\partial x^\nu} b'_\beta$
代入 RHS： $X'^{\alpha\beta} a'_\alpha b'_\beta = X^{\mu\nu} \left( \frac{\partial x'^\alpha}{\partial x^\mu} a'_\alpha \right) \left( \frac{\partial x'^\beta}{\partial x^\nu} b'_\beta \right)$
整理项： $\left( X'^{\alpha\beta} - \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} X^{\mu\nu} \right) a'_\alpha b'_\beta = 0$
由于 $a', b'$ 是任意矢量，若要上式恒成立，括号内的部分必须为 0（线性代数基本性质）。
因此： $X'^{\alpha\beta} = \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} X^{\mu\nu}$ 。这正是 $(2, 0)$ 张量的变换法则。得证。

1.6 度规张量 (The Metric Tensor)

1.6.1 定义：广义内积

在抽象向量空间中，内积是一个双线性映射。在微分几何中，我们要求这个映射在每一点都是光滑变化的。可以将度规张量理解为定义在流形上的 内积 API。一旦你给流形装备了这个 API，流形就升级为了黎曼流形（或伪黎曼流形），此时我们才能计算长度、角度，并定义因果结构。

定义 1.14 (度规张量)：度规

g

是一个光滑的

(0, 2)

型张量场。在流形上的任意点

p

，它接受两个切矢量

u, v \in T_p\mathcal{M}

，并输出一个实数（标量积）：

g_p(u, v) \in \mathbb{R}

它必须满足两个公理：

对称性 (Symmetry)： $g(u, v) = g(v, u) \iff g_{\mu\nu} = g_{\nu\mu}$ 这保证了 $A$ 到 $B$ 的“距离”等于 $B$ 到 $A$ 的距离。
非退化性 (Non-degeneracy)：若对于所有的 $v$ ，都有 $g(u, v) = 0$ ，则必须有 $u=0$ 。这等价于度规矩阵的行列式不为零： $\det(g_{\mu\nu}) \neq 0$ 。

1.6.2 线元 (The Line Element)

物理文献中极少直接写出

g_{\mu\nu}

矩阵，而是通过线元

ds^2

来定义度规。线元描述了无穷小位移矢量

d\mathbf{x} = dx^\mu \partial_\mu

的自内积（即模长的平方）。

ds^2 = \mathbf{g}(d\mathbf{x}, d\mathbf{x}) = g_{\mu\nu} dx^\mu dx^\nu

二次型视角 $ds^2$ 只是一个二次型符号。 $g_{\mu\nu}$ 是一个存储几何权重的 $4 \times 4$ 对称矩阵。 $dx^\mu$ 是输入的差分向量。 $\text{Cost} = [dx^0, \dots, dx^3] \times [G] \times [dx^0, \dots, dx^3]^T$

1.6.3 符号差与因果结构 (The Signature & Causality)

度规的符号差 (Signature) 决定了流形的物理性质。将

g_{\mu\nu}

对角化后，对角线上正负号的个数称为符号差。

黎曼度规 (Euclidean/Riemannian)：
- 签名： $(+, +, +, +)$
- 性质： $ds^2 = 0 \iff dx = 0$ 。即只要动了，距离就是正的。
- 用途：普通几何空间。
洛伦兹度规 (Lorentzian) —— 广义相对论使用此定义
- 签名： $(-, +, +, +)$ 或 $(+, -, -, -)$ （文献中称为 "East Coast" 或 "West Coast" 惯例，本文采用 $-+++$ ）。
- 关键性质：即使 $dx \neq 0$ ，也可以有 $ds^2 = 0$ 。
- 因果分类：对于切矢量 $v$ $v$ ，
  - $g(v, v) < 0$ ：类时 (Timelike)，有质量粒子的轨迹。
  - $g(v, v) = 0$ ：类光 (Null/Lightlike)，光子的轨迹。
  - $g(v, v) > 0$ ：类空 (Spacelike)，超光速区域（因果上不可达）。

1.6.4 音乐同构：升降指标 (Musical Isomorphisms)

度规张量提供了一种“自然”的方式将切空间

T_p\mathcal{M}

和对偶空间

T_p^*\mathcal{M}

粘合起来。

定义 1.15 (降指 / Lowering Indices - $\flat$ )：给定矢量

v^\mu

，通过与度规的部分缩并，生成一个余切矢量

v_\mu

：

v_\mu \equiv g_{\mu\nu} v^\nu

在矩阵视角下，这等价于：行向量 = 矩阵 $\times$ 列向量。

定义 1.16 (逆度规与升指 / Raising Indices - $\sharp$ )：度规矩阵的逆矩阵记为

g^{\mu\nu}

（注意双上标），满足：

g^{\mu\rho} g_{\rho\nu} = \delta^\mu_\nu

利用它将余切矢量转换回矢量：

v^\mu \equiv g^{\mu\nu} v_\nu

值得一提：在欧氏空间（笛卡尔坐标）， $g = I$ （单位阵），所以 $v^\mu$ 和 $v_\mu$ 数值相同。但在弯曲时空或闵可夫斯基时空中，分量的数值甚至符号都会改变！混淆上下标会导致致命的物理错误。

1.6.5 例题讲解

例题 1：从线元读取度规分量

问题：考虑三维球坐标空间，其线元公式为：

ds^2 = dr^2 + r^2 d\theta^2 + r^2 \sin^2\theta \, d\phi^2

写出对应的坐标系 $\{x^\mu\}$ 。
写出度规张量 $g_{\mu\nu}$ 的矩阵形式。
写出逆度规张量 $g^{\mu\nu}$ 的矩阵形式。

解答：

坐标系 $x^1 = r, x^2 = \theta, x^3 = \phi$ 。
观察 $ds^2 = g_{11}(dr)^2 + g_{22}(d\theta)^2 + g_{33}(d\phi)^2$ 。由于没有交叉项（如 $dr d\theta$ ），非对角元为 0。 $[g_{\mu\nu}] = \begin{pmatrix} 1 & 0 & 0 \\ 0 & r^2 & 0 \\ 0 & r^2 \sin^2\theta \end{pmatrix}$
由于矩阵是对角阵，其逆矩阵就是对角线元素取倒数： $[g^{\mu\nu}] = \begin{pmatrix} 1 & 0 & 0 \\ 0 & r^{-2} & 0 \\ 0 & (r \sin\theta)^{-2} \end{pmatrix}$ 检验： $g^{\mu\nu} g_{\nu\lambda} = \delta^\mu_\lambda$ 。例如 $\mu=2, \lambda=2$ : $r^{-2} \cdot r^2 = 1$ 。

例题 2：指标升降与符号陷阱

问题：在狭义相对论（平直闵可夫斯基时空）中，使用

(-+++)

度规：

g_{\mu\nu} = \text{diag}(-1, 1, 1, 1)

给定一个四维动量矢量

P^\mu = (E, p_x, p_y, p_z)

（这里设

c=1

）。

计算协变矢量 $P_\mu$ 。
计算模长平方 $P^2 = P^\mu P_\mu$ 。
对于光子 ( $m=0$ )，这意味着什么？

解答：

降指： $P_0 = g_{00} P^0 = (-1) \cdot E = -E$ $P_1 = g_{11} P^1 = (1) \cdot p_x = p_x$ ... 所以： $P_\mu = (-E, p_x, p_y, p_z)$ 注意时间分量反号了！
计算模长： $P^2 = P^\mu P_\mu = P^0 P_0 + P^i P_i = E(-E) + (p_x^2 + p_y^2 + p_z^2) = -E^2 + |\vec{p}|^2$
物理诠释：在相对论力学中， $P^2 = -m^2$ （静质量平方的负数，取决于定义）。对于光子， $m=0$ 。所以 $P^2 = 0$ 。这意味着 $-E^2 + |\vec{p}|^2 = 0 \implies E = |\vec{p}|$ 。 几何结论：光子的动量矢量在四维时空中是非零矢量，但其“长度”（自内积）为零。这是一个零矢量 (Null Vector)。

例题 3：非对角度规与混合索引

问题：考虑一个二维“旋转”坐标系（如克尔黑洞的赤道面简化版），线元包含交叉项：

ds^2 = -dt^2 + 2 dt d\phi + dr^2

坐标为

(t, \phi, r)

。

写出矩阵 $g_{\mu\nu}$ 。
计算行列式 $\det(g)$ ，检查其是否退化。
求逆度规 $g^{\mu\nu}$ 中的 $g^{tt}$ 分量。

解答：

识别分量：
- $dt^2$ 系数 $-1 \implies g_{tt} = -1$ 。
- $dr^2$ 系数 $1 \implies g_{rr} = 1$ 。
- $dt d\phi$ 系数 $2$ 。注意公式是 $\sum g_{\mu\nu}dx^\mu dx^\nu$ ，对于交叉项 $dt d\phi$ ，由于对称性 $g_{t\phi} = g_{\phi t}$ ，这一项会出现两次。所以 $2 g_{t\phi} = 2 \implies g_{t\phi} = 1$ 。（注意系数除以2的规则！）
- $d\phi^2$ 系数 $0 \implies g_{\phi\phi} = 0$ 。
矩阵形式（顺序 $t, \phi, r$ ）：
$g = \begin{pmatrix} -1 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}$
计算行列式：这是块对角矩阵。右上角是 $\begin{pmatrix} -1 & 1 \\ 1 & 0 \end{pmatrix}$ ，右下角是 $1$ 。 $\det(g) = [(-1)(0) - (1)(1)] \times 1 = -1 \neq 0$ 度规非退化，是个合法的洛伦兹度规。
求逆度规：需要求该矩阵的逆。重点关注左上 $2\times 2$ 块 $A = \begin{pmatrix} -1 & 1 \\ 1 & 0 \end{pmatrix}$ 。 $A^{-1} = \frac{1}{\det(A)} \begin{pmatrix} 0 & -1 \\ -1 & -1 \end{pmatrix} = \frac{1}{-1} \begin{pmatrix} 0 & -1 \\ -1 & -1 \end{pmatrix} = \begin{pmatrix} 0 & 1 \\ 1 & 1 \end{pmatrix}$ 即：
$g^{\mu\nu} = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}$
结果分析：虽然 $g_{tt} = -1$ ，但逆矩阵分量 $g^{tt} = 0$ ！这再次强调了 $g^{\mu\nu}$ 不是简单地对 $g_{\mu\nu}$ 每个元素取倒数，而是矩阵求逆的操作。