第一章:微分几何基础
1.1 可微流形 (Differentiable Manifolds)
这一节是整个广义相对论的“数据结构定义”。我们将展示如何从一堆局部看起来像欧几里得空间(
R n \mathbb{R}^n R n )的碎片,通过严格的接口协议拼装成一个全局的弯曲空间。
定义 1.1.1:拓扑流形 (Topological Manifold)
一个
n n n 维拓扑流形 M \mathcal{M} M 是一个拓扑空间,满足以下三条公理:
Hausdorff 性 (分离公理) :对于任意不同两点 p , q ∈ M p, q \in \mathcal{M} p , q ∈ M ,存在不相交的开集 O p , O q O_p, O_q O p , O q 分别包含 p p p 和 q q q 。
CS 类比 :保证了点的“可区分性”。如果没有这条,可能会出现两个无法通过逼近算法区分的“重叠点”。
第二可数性 (Second Countable) :存在可数的拓扑基。
CS 类比 :保证了流形不会过大/过于离散,确保了分割(Partition of Unity)的存在,这是定义积分和度量的基础。
局部欧氏性 (Locally Euclidean) :对于 ∀ p ∈ M \forall p \in \mathcal{M} ∀ p ∈ M ,存在一个邻域 U ∋ p U \ni p U ∋ p 和一个同胚映射(连续且逆连续的双射) ϕ : U → U ^ ⊆ R n \phi: U \to \hat{U} \subseteq \mathbb{R}^n ϕ : U → U ^ ⊆ R n ,其中 U ^ \hat{U} U ^ 是 R n \mathbb{R}^n R n 中的开集。
定义 1.1.2:坐标卡 (Coordinate Chart)
对元组
( U , ϕ ) (U, \phi) ( U , ϕ ) 称为流形上的一个
坐标卡 (Chart) 。
坐标映射 :ϕ ( p ) = ( x 1 , x 2 , . . . , x n ) ∈ R n \phi(p) = (x^1, x^2, ..., x^n) \in \mathbb{R}^n ϕ ( p ) = ( x 1 , x 2 , ... , x n ) ∈ R n 。这被称为点 p p p 在该坐标卡下的局部坐标 。
参数化映射 :逆映射 ϕ − 1 : U ^ → U \phi^{-1}: \hat{U} \to U ϕ − 1 : U ^ → U 将 R n \mathbb{R}^n R n 中的数据“还原”回流形上的点。
定义 1.1.3:光滑图集与微分结构 (Smooth Atlas & Differential Structure)
这是“可微”二字的关键。单个坐标卡只能覆盖局部,要描述整个流形,我们需要覆盖全集的
图集 (Atlas) A = { ( U α , ϕ α ) } α ∈ I \mathcal{A} = \{(U_\alpha, \phi_\alpha)\}_{\alpha \in I} A = {( U α , ϕ α ) } α ∈ I 。
若两个坐标卡
( U α , ϕ α ) (U_\alpha, \phi_\alpha) ( U α , ϕ α ) 和
( U β , ϕ β ) (U_\beta, \phi_\beta) ( U β , ϕ β ) 有重叠(
U α ∩ U β ≠ ∅ U_\alpha \cap U_\beta \neq \emptyset U α ∩ U β = ∅ ),则定义
坐标转换函数 (Transition Map) ψ β α \psi_{\beta\alpha} ψ β α :
ψ β α = ϕ β ∘ ϕ α − 1 : ϕ α ( U α ∩ U β ) → ϕ β ( U α ∩ U β ) \psi_{\beta\alpha} = \phi_\beta \circ \phi_\alpha^{-1} : \quad \phi_\alpha(U_\alpha \cap U_\beta) \to \phi_\beta(U_\alpha \cap U_\beta) ψ β α = ϕ β ∘ ϕ α − 1 : ϕ α ( U α ∩ U β ) → ϕ β ( U α ∩ U β )
这是一个从
R n \mathbb{R}^n R n 的子集到
R n \mathbb{R}^n R n 的子集的普通函数。
若 A \mathcal{A} A 中所有的转换函数 ψ β α \psi_{\beta\alpha} ψ β α 都是 C ∞ C^\infty C ∞ (无穷阶可微) 的,则称 A \mathcal{A} A 为光滑图集 。
装备了最大光滑图集的拓扑流形称为光滑流形 (Smooth Manifold) 。
1.1.4 构建圆 (S 1 S^1 S 1 ) 的微分结构
问题描述 :
证明单位圆
S 1 = { ( x , y ) ∈ R 2 ∣ x 2 + y 2 = 1 } S^1 = \{ (x, y) \in \mathbb{R}^2 \mid x^2 + y^2 = 1 \} S 1 = {( x , y ) ∈ R 2 ∣ x 2 + y 2 = 1 } 是一个 1 维可微流形。
注意:圆是一个嵌入在 2 维空间的 1 维对象,但我们不能直接用极坐标角度 θ ∈ [ 0 , 2 π ) \theta \in [0, 2\pi) θ ∈ [ 0 , 2 π ) 作为一个全局坐标卡,因为在 0 0 0 和 2 π 2\pi 2 π 的连接处不连续。我们需要至少两个坐标卡。
解题步骤 :我们使用立体投影 (Stereographic Projection) 来构建图集。
步骤 1:构造坐标卡 1 1 1 (北极投影)
取去心北极点
N = ( 0 , 1 ) N=(0, 1) N = ( 0 , 1 ) 的圆
U N = S 1 ∖ { N } U_N = S^1 \setminus \{N\} U N = S 1 ∖ { N } 。
定义映射
ϕ N : U N → R \phi_N: U_N \to \mathbb{R} ϕ N : U N → R ,将圆上一点
( x , y ) (x, y) ( x , y ) 连线
N N N ,投射到
X X X 轴 (
y = 0 y=0 y = 0 ) 上。
通过简单的几何相似关系推导投影公式:
u = ϕ N ( x , y ) = x 1 − y u = \phi_N(x, y) = \frac{x}{1-y} u = ϕ N ( x , y ) = 1 − y x
其逆映射(参数化)
ϕ N − 1 : R → U N \phi_N^{-1}: \mathbb{R} \to U_N ϕ N − 1 : R → U N 为(解方程组):
x = 2 u u 2 + 1 , y = u 2 − 1 u 2 + 1 x = \frac{2u}{u^2+1}, \quad y = \frac{u^2-1}{u^2+1} x = u 2 + 1 2 u , y = u 2 + 1 u 2 − 1
显然,
ϕ N \phi_N ϕ N 和
ϕ N − 1 \phi_N^{-1} ϕ N − 1 在其定义域内连续。
步骤 2:构造坐标卡 2 2 2 (南极投影)
取去心南极点
S = ( 0 , − 1 ) S=(0, -1) S = ( 0 , − 1 ) 的圆
U S = S 1 ∖ { S } U_S = S^1 \setminus \{S\} U S = S 1 ∖ { S } 。
定义映射
ϕ S : U S → R \phi_S: U_S \to \mathbb{R} ϕ S : U S → R ,将圆上一点
( x , y ) (x, y) ( x , y ) 连线
S S S ,投射到
X X X 轴上。
公式为:
v = ϕ S ( x , y ) = x 1 + y v = \phi_S(x, y) = \frac{x}{1+y} v = ϕ S ( x , y ) = 1 + y x
其逆映射
ϕ S − 1 : R → U S \phi_S^{-1}: \mathbb{R} \to U_S ϕ S − 1 : R → U S 为:
x = 2 v 1 + v 2 , y = 1 − v 2 1 + v 2 x = \frac{2v}{1+v^2}, \quad y = \frac{1-v^2}{1+v^2} x = 1 + v 2 2 v , y = 1 + v 2 1 − v 2
步骤 3:分析重叠区域与转换函数
图集
A = { ( U N , ϕ N ) , ( U S , ϕ S ) } \mathcal{A} = \{(U_N, \phi_N), (U_S, \phi_S)\} A = {( U N , ϕ N ) , ( U S , ϕ S )} 覆盖了
S 1 S^1 S 1 (因为没有任何点既是北极又是南极)。
重叠区域
U N ∩ S = S 1 ∖ { N , S } U_{N \cap S} = S^1 \setminus \{N, S\} U N ∩ S = S 1 ∖ { N , S } 。
我们需要计算从
u u u 坐标系变换到
v v v 坐标系的
转换函数 ψ S N = ϕ S ∘ ϕ N − 1 \psi_{SN} = \phi_S \circ \phi_N^{-1} ψ SN = ϕ S ∘ ϕ N − 1 。
思路:
输入 u u u 。
通过 ϕ N − 1 \phi_N^{-1} ϕ N − 1 还原为流形上的点 ( x , y ) (x, y) ( x , y ) 。
将 ( x , y ) (x, y) ( x , y ) 喂给 ϕ S \phi_S ϕ S 得到 v v v 。
计算:
v = ϕ S ( 2 u u 2 + 1 , u 2 − 1 u 2 + 1 ) = x 1 + y v = \phi_S \left( \frac{2u}{u^2+1}, \frac{u^2-1}{u^2+1} \right) = \frac{x}{1+y} v = ϕ S ( u 2 + 1 2 u , u 2 + 1 u 2 − 1 ) = 1 + y x
v = 2 u u 2 + 1 1 + u 2 − 1 u 2 + 1 = 2 u u 2 + 1 u 2 + 1 + u 2 − 1 u 2 + 1 = 2 u 2 u 2 = 1 u v = \frac{ \frac{2u}{u^2+1} }{ 1 + \frac{u^2-1}{u^2+1} } = \frac{ \frac{2u}{u^2+1} }{ \frac{u^2+1 + u^2-1}{u^2+1} } = \frac{2u}{2u^2} = \frac{1}{u} v = 1 + u 2 + 1 u 2 − 1 u 2 + 1 2 u = u 2 + 1 u 2 + 1 + u 2 − 1 u 2 + 1 2 u = 2 u 2 2 u = u 1
所以,转换函数为:
ψ S N ( u ) = 1 u \psi_{SN}(u) = \frac{1}{u} ψ SN ( u ) = u 1
定义域为
ϕ N ( U N ∩ S ) = R ∖ { 0 } \phi_N(U_{N \cap S}) = \mathbb{R} \setminus \{0\} ϕ N ( U N ∩ S ) = R ∖ { 0 } 。
步骤 4:验证微分结构 (Compatibility Check)
函数
f ( u ) = 1 / u f(u) = 1/u f ( u ) = 1/ u 在
R ∖ { 0 } \mathbb{R} \setminus \{0\} R ∖ { 0 } 上是
C ∞ C^\infty C ∞ (光滑) 的。(其导数为
− 1 / u 2 -1/u^2 − 1/ u 2 ,
2 / u 3 2/u^3 2/ u 3 , ... 均存在且连续)。
同理,反向转换
ψ N S ( v ) = 1 / v \psi_{NS}(v) = 1/v ψ NS ( v ) = 1/ v 也是
C ∞ C^\infty C ∞ 的。
结论 :
由于所有的转换函数都是光滑的,
( U N , ϕ N ) (U_N, \phi_N) ( U N , ϕ N ) 和
( U S , ϕ S ) (U_S, \phi_S) ( U S , ϕ S ) 是兼容的。这个图集赋予了
S 1 S^1 S 1 标准的微分结构。这意味着我们可以在
S 1 S^1 S 1 上进行微积分运算,而不必担心“接缝”处的奇异性。
值得一提
在数值计算或几何处理中,如果试图用单一的
double theta (
0 ≤ θ < 2 π 0 \le \theta < 2\pi 0 ≤ θ < 2 π ) 变量来模拟圆环上的物理场,会遇到著名的
"Hairy Ball Theorem" (毛球定理) 或类似的拓扑障碍带来的数值不稳定:
奇点 :在 θ = 0 \theta = 0 θ = 0 处进行插值或求导时,需要特殊的 if 逻辑处理周期性边界条件。
流形视角 :使用图集(Atlas)的方法则是真正通用的。您存储两个 patch 的数据(u u u 和 v v v ),当物体运动到北极附近时(u → ∞ u \to \infty u → ∞ ),程序逻辑自动检测并使用 Transition Map 切换到南极坐标系(v ≈ 0 v \approx 0 v ≈ 0 ),从而避免数值溢出(Overflow)和精度丢失。
* 这就是流形在“计算”中的本质:没有全局最优坐标系,只有通过协议(转换函数)互联的局部坐标系 。
1.2 切空间与切矢量 (Tangent Space & Vectors)
在欧几里得空间
R n \mathbb{R}^n R n 中,我们习惯将向量视为连接两点(如原点到某点)的直观箭头。然而在弯曲流形(Manifold)上,两点之间的连线通常不在流形内部(例如球面上的两点连线会穿过球体内部)。
因此,我们需要从局部 性质出发,建立一种不依赖于嵌入高维空间的内在定义。我们将切矢量严格定义为作用在光滑函数上的导数算子(Derivation) 。
1.2.1 作为导数算子的切矢量
设
M \mathcal{M} M 为
n n n 维光滑流形,
p ∈ M p \in \mathcal{M} p ∈ M 为流形上的一点。令
C ∞ ( p ) C^\infty(p) C ∞ ( p ) 为在点
p p p 的邻域内定义的所有实值光滑函数
f : M → R f: \mathcal{M} \to \mathbb{R} f : M → R 的集合。
定义 1.2.1 (切矢量) :
点
p p p 处的切矢量
v v v 是一个线性映射
v : C ∞ ( p ) → R v: C^\infty(p) \to \mathbb{R} v : C ∞ ( p ) → R ,它满足以下两条公理:
线性性 (Linearity) :
v ( a f + b g ) = a v ( f ) + b v ( g ) , ∀ f , g ∈ C ∞ ( p ) , ∀ a , b ∈ R v(af + bg) = a v(f) + b v(g), \quad \forall f, g \in C^\infty(p), \forall a, b \in \mathbb{R} v ( a f + b g ) = a v ( f ) + b v ( g ) , ∀ f , g ∈ C ∞ ( p ) , ∀ a , b ∈ R
莱布尼茨律 (Leibniz Rule / Product Rule) :
v ( f g ) = f ( p ) v ( g ) + g ( p ) v ( f ) v(fg) = f(p)v(g) + g(p)v(f) v ( f g ) = f ( p ) v ( g ) + g ( p ) v ( f )
直观理解 :切矢量本质上是“方向导数”。
v ( f ) v(f) v ( f ) 的值表示函数
f f f 沿着
v v v 方向在
p p p 点的变化率。
1.2.2 切空间的基底与分量
虽然定义是抽象的,但我们需要具体计算。这需要引入坐标系。
设
x = ( x 0 , x 1 , … , x n − 1 ) x = (x^0, x^1, \dots, x^{n-1}) x = ( x 0 , x 1 , … , x n − 1 ) 为点
p p p 周围的一个局部坐标系。
定义 1.2.2 (坐标基底) :
对于坐标系中的每一个坐标
x μ x^\mu x μ ,定义算子
∂ ∂ x μ \frac{\partial}{\partial x^\mu} ∂ x μ ∂ 作用于函数
f f f 如下:
( ∂ ∂ x μ ) p ( f ) ≡ ∂ ( f ∘ ϕ − 1 ) ∂ x μ ∣ ϕ ( p ) \left( \frac{\partial}{\partial x^\mu} \right)_p (f) \equiv \frac{\partial (f \circ \phi^{-1})}{\partial x^\mu} \Bigg|_{\phi(p)} ( ∂ x μ ∂ ) p ( f ) ≡ ∂ x μ ∂ ( f ∘ ϕ − 1 ) ϕ ( p )
这正是标准的偏导数。很容易验证它满足上述的线性性和莱布尼茨律。
定理 1.2.1 (切空间基定理) :
集合
{ ( ∂ ∂ x 0 ) p , … , ( ∂ ∂ x n − 1 ) p } \left\{ \left(\frac{\partial}{\partial x^0}\right)_p, \dots, \left(\frac{\partial}{\partial x^{n-1}}\right)_p \right\} { ( ∂ x 0 ∂ ) p , … , ( ∂ x n − 1 ∂ ) p } 构成了切空间
T p M T_p\mathcal{M} T p M 的一组基,称为
坐标基 (Coordinate Basis) 。
因此,任意切矢量
v ∈ T p M v \in T_p\mathcal{M} v ∈ T p M 都可以唯一地写成这组基的线性组合:
v = ∑ μ = 0 n − 1 v μ ( ∂ ∂ x μ ) p = Einstein v μ ∂ μ v = \sum_{\mu=0}^{n-1} v^\mu \left(\frac{\partial}{\partial x^\mu}\right)_p \overset{\text{Einstein}}{=} v^\mu \partial_\mu v = ∑ μ = 0 n − 1 v μ ( ∂ x μ ∂ ) p = Einstein v μ ∂ μ
其中系数
v μ v^\mu v μ 称为矢量
v v v 在该坐标系下的
分量 。
值得一提 :
v v v (对象) = v μ v^\mu v μ (数据) ⋅ \cdot ⋅ ∂ μ \partial_\mu ∂ μ (接口/方法)。
当我们说“求矢量 v v v 作用于函数 f f f ”时,运算过程是:v ( f ) = ( v μ ∂ μ ) f = v μ ∂ f ∂ x μ v(f) = (v^\mu \partial_\mu) f = v^\mu \frac{\partial f}{\partial x^\mu} v ( f ) = ( v μ ∂ μ ) f = v μ ∂ x μ ∂ f 。
1.2.3 与路径切线的联系
为了联系物理直觉,通常通过流形上的曲线来构造切矢量。
设
γ : ( − ϵ , ϵ ) → M \gamma: (-\epsilon, \epsilon) \to \mathcal{M} γ : ( − ϵ , ϵ ) → M 是一条光滑曲线,且
γ ( 0 ) = p \gamma(0) = p γ ( 0 ) = p 。这条曲线在点
p p p 定义了一个切矢量
v γ v_\gamma v γ ,其作用法则为:
v γ ( f ) ≡ d d t ( f ∘ γ ) ( t ) ∣ t = 0 v_\gamma(f) \equiv \frac{d}{dt} (f \circ \gamma)(t) \Bigg|_{t=0} v γ ( f ) ≡ d t d ( f ∘ γ ) ( t ) t = 0
根据链式法则,如果曲线在坐标系
x μ x^\mu x μ 下的方程为
x μ ( t ) x^\mu(t) x μ ( t ) ,则:
d d t f ( x ( t ) ) = ∑ μ d x μ d t ∂ f ∂ x μ \frac{d}{dt} f(x(t)) = \sum_{\mu} \frac{dx^\mu}{dt} \frac{\partial f}{\partial x^\mu} d t d f ( x ( t )) = ∑ μ d t d x μ ∂ x μ ∂ f
对比
v = v μ ∂ μ v = v^\mu \partial_\mu v = v μ ∂ μ ,我们得到矢量的分量即为坐标对参数的导数:
v μ = d x μ d t ∣ t = 0 v^\mu = \frac{dx^\mu}{dt}\Bigg|_{t=0} v μ = d t d x μ t = 0
1.2.4 切空间与切矢量例题
例题 1:算子操作与求值
场景 :考虑 2 维平面
R 2 \mathbb{R}^2 R 2 (流形),坐标为笛卡尔坐标
( x , y ) (x, y) ( x , y ) 。
定义一个函数
f ( x , y ) = x 2 y + sin ( x ) f(x, y) = x^2 y + \sin(x) f ( x , y ) = x 2 y + sin ( x ) 。
定义点
p = ( 0 , 2 ) p = (0, 2) p = ( 0 , 2 ) 处的一个切矢量
v = 3 ∂ x − ∂ y v = 3 \partial_x - \partial_y v = 3 ∂ x − ∂ y 。
解答 :
切矢量是微分算子,我们直接将算子作用于函数:
v ( f ) = ( 3 ∂ ∂ x − 1 ∂ ∂ y ) ( x 2 y + sin ( x ) ) ∣ ( 0 , 2 ) = 3 ∂ ∂ x ( x 2 y + sin ( x ) ) ∣ ( 0 , 2 ) − ∂ ∂ y ( x 2 y + sin ( x ) ) ∣ ( 0 , 2 ) = 3 ( 2 x y + cos ( x ) ) ∣ ( 0 , 2 ) − ( x 2 ) ∣ ( 0 , 2 ) \begin{aligned}
v(f) &= \left( 3 \frac{\partial}{\partial x} - 1 \frac{\partial}{\partial y} \right) (x^2 y + \sin(x)) \Bigg|_{(0,2)} \\
&= 3 \frac{\partial}{\partial x}(x^2 y + \sin(x)) \Bigg|_{(0,2)} - \frac{\partial}{\partial y}(x^2 y + \sin(x)) \Bigg|_{(0,2)} \\
&= 3 (2xy + \cos(x)) \Bigg|_{(0,2)} - (x^2) \Bigg|_{(0,2)}
\end{aligned} v ( f ) = ( 3 ∂ x ∂ − 1 ∂ y ∂ ) ( x 2 y + sin ( x )) ( 0 , 2 ) = 3 ∂ x ∂ ( x 2 y + sin ( x )) ( 0 , 2 ) − ∂ y ∂ ( x 2 y + sin ( x )) ( 0 , 2 ) = 3 ( 2 x y + cos ( x )) ( 0 , 2 ) − ( x 2 ) ( 0 , 2 )
代入点
p p p 的坐标
x = 0 , y = 2 x=0, y=2 x = 0 , y = 2 :
= 3 ( 2 ⋅ 0 ⋅ 2 + cos ( 0 ) ) − ( 0 2 ) = 3 ( 0 + 1 ) − 0 = 3 \begin{aligned}
&= 3 (2 \cdot 0 \cdot 2 + \cos(0)) - (0^2) \\
&= 3 (0 + 1) - 0 \\
&= 3
\end{aligned} = 3 ( 2 ⋅ 0 ⋅ 2 + cos ( 0 )) − ( 0 2 ) = 3 ( 0 + 1 ) − 0 = 3
物理含义 :若你站在
( 0 , 2 ) (0,2) ( 0 , 2 ) 处,沿着向量
( 3 , − 1 ) (3, -1) ( 3 , − 1 ) 的方向移动,感受到标量场
f f f 的瞬时变化率为 3。
例题 2:坐标变换法则 (基变换)
这是广义相对论中最核心的运算之一。
场景 :考虑
R 2 \mathbb{R}^2 R 2 ,从笛卡尔坐标
( x , y ) (x, y) ( x , y ) 变换到极坐标
( r , θ ) (r, \theta) ( r , θ ) 。
变换公式为:
x = r cos θ , y = r sin θ x = r \cos\theta, \quad y = r \sin\theta x = r cos θ , y = r sin θ 。
问题 :
将极坐标基矢量 ∂ r \partial_r ∂ r 和 ∂ θ \partial_\theta ∂ θ 用笛卡尔基矢量 ∂ x , ∂ y \partial_x, \partial_y ∂ x , ∂ y 表示。
验证变换矩阵(Jacobian)的作用。
解答 :
1. 使用链式法则推导基底变换:
我们将
∂ r \partial_r ∂ r 视为作用于任意函数
f f f 的算子。根据多元微积分链式法则:
∂ f ∂ r = ∂ f ∂ x ∂ x ∂ r + ∂ f ∂ y ∂ y ∂ r \frac{\partial f}{\partial r} = \frac{\partial f}{\partial x} \frac{\partial x}{\partial r} + \frac{\partial f}{\partial y} \frac{\partial y}{\partial r} ∂ r ∂ f = ∂ x ∂ f ∂ r ∂ x + ∂ y ∂ f ∂ r ∂ y
剥离测试函数
f f f ,得到算子关系:
∂ r = ∂ x ∂ r ∂ x + ∂ y ∂ r ∂ y \partial_r = \frac{\partial x}{\partial r} \partial_x + \frac{\partial y}{\partial r} \partial_y ∂ r = ∂ r ∂ x ∂ x + ∂ r ∂ y ∂ y
计算偏导系数:
∂ x ∂ r = cos θ \frac{\partial x}{\partial r} = \cos\theta ∂ r ∂ x = cos θ
∂ y ∂ r = sin θ \frac{\partial y}{\partial r} = \sin\theta ∂ r ∂ y = sin θ
同理对于
∂ θ \partial_\theta ∂ θ :
∂ x ∂ θ = − r sin θ \frac{\partial x}{\partial \theta} = -r\sin\theta ∂ θ ∂ x = − r sin θ
∂ y ∂ θ = r cos θ \frac{\partial y}{\partial \theta} = r\cos\theta ∂ θ ∂ y = r cos θ
所以基变换关系为:
∂ r = cos θ ∂ x + sin θ ∂ y ∂ θ = − r sin θ ∂ x + r cos θ ∂ y \begin{aligned}
\partial_r &= \cos\theta \, \partial_x + \sin\theta \, \partial_y \\
\partial_\theta &= -r\sin\theta \, \partial_x + r\cos\theta \, \partial_y
\end{aligned} ∂ r ∂ θ = cos θ ∂ x + sin θ ∂ y = − r sin θ ∂ x + r cos θ ∂ y
2. 分量变换的逆变性验证:
设某矢量
v v v 在极坐标下的分量为
( v r , v θ ) = ( 1 , 0 ) (v^r, v^\theta) = (1, 0) ( v r , v θ ) = ( 1 , 0 ) (即径向单位矢量)。
该矢量在笛卡尔坐标系下的分量
( v x , v y ) (v^x, v^y) ( v x , v y ) 是什么?
根据矢量本身是不变量:
v = v r ∂ r + v θ ∂ θ = v x ∂ x + v y ∂ y v = v^r \partial_r + v^\theta \partial_\theta = v^x \partial_x + v^y \partial_y v = v r ∂ r + v θ ∂ θ = v x ∂ x + v y ∂ y 。
将刚才推导的
∂ r \partial_r ∂ r 表达式代入左边:
1 ⋅ ( cos θ ∂ x + sin θ ∂ y ) + 0 = v x ∂ x + v y ∂ y 1 \cdot (\cos\theta \, \partial_x + \sin\theta \, \partial_y) + 0 = v^x \partial_x + v^y \partial_y 1 ⋅ ( cos θ ∂ x + sin θ ∂ y ) + 0 = v x ∂ x + v y ∂ y
对比系数可得:
v x = cos θ , v y = sin θ v^x = \cos\theta, \quad v^y = \sin\theta v x = cos θ , v y = sin θ
这通过矢量变换法则公式验证如下(其中
x μ ′ = { x , y } , x μ = { r , θ } x^{\mu'} = \{x, y\}, x^\mu = \{r, \theta\} x μ ′ = { x , y } , x μ = { r , θ } ):
v μ ′ = ∂ x μ ′ ∂ x μ v μ v^{\mu'} = \frac{\partial x^{\mu'}}{\partial x^\mu} v^\mu v μ ′ = ∂ x μ ∂ x μ ′ v μ
v x = ∂ x ∂ r v r + ∂ x ∂ θ v θ = ( cos θ ) ( 1 ) + ( − r sin θ ) ( 0 ) = cos θ v^x = \frac{\partial x}{\partial r} v^r + \frac{\partial x}{\partial \theta} v^\theta = (\cos\theta)(1) + (-r\sin\theta)(0) = \cos\theta v x = ∂ r ∂ x v r + ∂ θ ∂ x v θ = ( cos θ ) ( 1 ) + ( − r sin θ ) ( 0 ) = cos θ
结论 :这展示了
基矢量 (
∂ μ \partial_\mu ∂ μ )与
分量 (
v μ v^\mu v μ )变换行为相反(一为协变,一为逆变),从而保证总矢量
v v v 是一个几何不变量。
1.3 爱因斯坦求和约定 (Einstein Summation Convention)
在广义相对论中,公式往往涉及大量的多重求和。为了简化符号,爱因斯坦引入了一套省略求和号
∑ \sum ∑ 的记法。这不仅仅是速记法,它更是
张量代数的语法检查器 ,能直观反映方程的协变性(Covariance)。
1.3.1 核心定义与规则
定义 1.8 (指标分类) :
在一个单项式(Term)中,任何一个指标(Index,如
μ , ν , α \mu, \nu, \alpha μ , ν , α )只可能属于以下两类之一:
哑指标 (Dummy Index) :
特征 :在单项式中出现两次 ,且必须是一上一下 。
语义 :表示对该指标进行遍历求和。
性质 :可以用任意其他未占用的字母替换(如 μ → σ \mu \to \sigma μ → σ ),不改变表达式的值(相当于局部变量重命名)。
自由指标 (Free Index) :
特征 :在单项式中仅出现一次 (通常)。
语义 :代表方程对该维度的每一个分量都成立。
性质 :在方程的所有项(左边和右边)中,自由指标必须名称相同、位置(上下)相同。
约定规则 :
设维度为
n n n (GR 中
n = 4 n=4 n = 4 ,指标取
{ 0 , 1 , 2 , 3 } \{0, 1, 2, 3\} { 0 , 1 , 2 , 3 } )。若指标
μ \mu μ 在单项式中出现一次上标、一次下标,则:
A μ B μ ≡ ∑ μ = 0 n − 1 A μ B μ = A 0 B 0 + A 1 B 1 + ⋯ + A n − 1 B n − 1 A^\mu B_\mu \equiv \sum_{\mu=0}^{n-1} A^\mu B_\mu = A^0 B_0 + A^1 B_1 + \dots + A^{n-1} B_{n-1} A μ B μ ≡ ∑ μ = 0 n − 1 A μ B μ = A 0 B 0 + A 1 B 1 + ⋯ + A n − 1 B n − 1
算法视角
自由指标 ↔ \leftrightarrow ↔ 外层循环 / 数组索引
哑指标 ↔ \leftrightarrow ↔ 内层循环 / 局部迭代变量
表达式
y μ = M ν μ x ν y^\mu = M^\mu_\nu x^\nu y μ = M ν μ x ν 等价于以下代码逻辑:
PYTHON
y = [0.0 ] * 4
for mu in range (4 ):
sum_val = 0.0
for nu in range (4 ):
sum_val += M[mu][nu] * x[nu]
y[mu] = sum_val
1.3.2 基础例题:线性代数操作
通过常见的矩阵运算来熟悉张量标记法。
例题 1:内积与矩阵乘法
假设
u , v u, v u , v 是矢量,
A , B A, B A , B 是矩阵(二阶张量)。请用爱因斯坦约定表示以下运算:
向量内积 s = u ⋅ v s = u \cdot v s = u ⋅ v (注:需通过度规定义,暂假设欧氏空间或对偶配对)。
矩阵-向量乘法 w = A v w = Av w = A v 。
矩阵-矩阵乘法 C = A B C = AB C = A B 。
矩阵的迹 (Trace) t = tr ( A ) t = \text{tr}(A) t = tr ( A ) 。
解答 :
内积 :即行向量乘列向量。
s = u μ v μ s = u_\mu v^\mu s = u μ v μ
这里 μ \mu μ 是哑指标,结果 s s s 没有自由指标,是一个标量(0阶张量)。
矩阵-向量乘法 :
w μ = A ν μ v ν w^\mu = A^\mu_\nu v^\nu w μ = A ν μ v ν
ν \nu ν 是哑指标(求和),消去。
μ \mu μ 是自由指标,保留。左边是矢量分量 w μ w^\mu w μ ,右边缩并后也是矢量分量,类型匹配。
矩阵乘法 :
C ρ μ = A ν μ B ρ ν C^\mu_\rho = A^\mu_\nu B^\nu_\rho C ρ μ = A ν μ B ρ ν
ν \nu ν 它是中间连接的桥梁(求和),即 C i k = ∑ j A i j B j k C_{ik} = \sum_j A_{ij} B_{jk} C ik = ∑ j A ij B jk 。
μ \mu μ (上)和 ρ \rho ρ (下)是自由指标。
迹 :对角元之和。即令上标等于下标。
t = A μ μ t = A^\mu_\mu t = A μ μ
μ \mu μ 既在上也在下,触发求和:A 0 0 + A 1 1 + … A^0_0 + A^1_1 + \dots A 0 0 + A 1 1 + … 。
1.3.3 进阶例题:多重求和与指标代换
在推导场方程时,经常遇到多个张量相乘,此时必须小心管理指标名称(Scope Management)。
例题 2:二次型与嵌套定义
已知
y α = A β α x β y^\alpha = A^\alpha_\beta x^\beta y α = A β α x β 且
z = ω α y α z = \omega_\alpha y^\alpha z = ω α y α 。
请将
z z z 直接表示为关于
x x x 的表达式。
解答 :
直接代入:
z = ω α ( A β α x β ) = ω α A β α x β z = \omega_\alpha (A^\alpha_\beta x^\beta) = \omega_\alpha A^\alpha_\beta x^\beta z = ω α ( A β α x β ) = ω α A β α x β
分析指标:
α \alpha α :出现两次(ω α \omega_\alpha ω α 和 A … α A^\alpha_\dots A … α ),是一对哑指标 → \rightarrow → 第一重循环。
β \beta β :出现两次(A β … A^\dots_\beta A β … 和 x β x^\beta x β ),是一对哑指标 → \rightarrow → 第二重循环。
此式包含双重求和:z = ∑ α ∑ β ω α A β α x β z = \sum_\alpha \sum_\beta \omega_\alpha A^\alpha_\beta x^\beta z = ∑ α ∑ β ω α A β α x β 。
陷阱提示(Variable Shadowing) :
如果你有两个方程
a μ = B ν μ b ν a^\mu = B^\mu_\nu b^\nu a μ = B ν μ b ν 和
c μ = D ν μ d ν c^\mu = D^\mu_\nu d^\nu c μ = D ν μ d ν ,想要相乘。
错误写法 :
a μ c μ = B ν μ b ν D ν μ d ν a^\mu c^\mu = B^\mu_\nu b^\nu D^\mu_\nu d^\nu a μ c μ = B ν μ b ν D ν μ d ν
错误 1 :μ \mu μ 在左边出现两次(同为上标),非法。
错误 2 :ν \nu ν 在右边出现四次,语义不清。
正确写法(重命名哑指标) :
a μ c ρ = ( B ν μ b ν ) ( D σ ρ d σ ) = B ν μ D σ ρ b ν d σ a^\mu c^\rho = (B^\mu_\nu b^\nu) (D^\rho_\sigma d^\sigma) = B^\mu_\nu D^\rho_\sigma b^\nu d^\sigma a μ c ρ = ( B ν μ b ν ) ( D σ ρ d σ ) = B ν μ D σ ρ b ν d σ
在合并两个表达式时,必须确保各自的哑指标不冲突(就像在编程中不能在嵌套循环中使用相同的迭代变量名 i)。
1.3.4 合法性判断
这是学习 GR 初期的重要训练:判断一个表达式是否符合张量语法。
例题 3:以下表达式在爱因斯坦约定下是否合法?如果不合法,指出原因。
(设
T T T 为
( 2 , 0 ) (2,0) ( 2 , 0 ) 张量,
S S S 为
( 1 , 1 ) (1,1) ( 1 , 1 ) 张量,
v v v 为矢量)
T μ ν v ν = S ν μ v ν T^{\mu\nu} v_\nu = S^\mu_\nu v^\nu T μν v ν = S ν μ v ν
a = T μ μ a = T^{\mu\mu} a = T μμ
b μ = T μ ν v μ v ν b_\mu = T^{\mu\nu} v_\mu v_\nu b μ = T μν v μ v ν
R μ ν − 1 2 g μ ν R = 8 π G T μ ν R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R = 8\pi G T_{\mu\nu} R μν − 2 1 g μν R = 8 π G T μν (爱因斯坦场方程)
解答 :
非法 。
左边 (LHS):T μ ν v ν T^{\mu\nu} v_\nu T μν v ν 。ν \nu ν 缩并,自由指标是 μ \mu μ (上)。合法。
右边 (RHS):S ν μ v ν S^\mu_\nu v^\nu S ν μ v ν 。ν \nu ν 缩并,自由指标是 μ \mu μ (上)。合法。
左右对比 :看起来自由指标都是 μ \mu μ 。但是,仔细观察左边的求和项:T μ ν v ν T^{\mu\nu} v_\nu T μν v ν 中,ν \nu ν 一上一下。然而公式中的写法,在通常的几何意义下要求很严,但如果你指的是 v ν v_\nu v ν 是协变矢量,这是合法 的。
修正思考 :如果是 T μ ν v ν T^{\mu\nu} v^\nu T μν v ν ,则两个上标无法缩并(除非有度规参与)。如果是 v ν v_\nu v ν (已降标),则 T μ ν v ν → w μ T^{\mu\nu} v_\nu \to w^\mu T μν v ν → w μ 。
结论 :语法上合法 。LHS 和 RHS 都是含有一个上标自由指标 μ \mu μ 的矢量。
非法 。
T μ μ T^{\mu\mu} T μμ 中 μ \mu μ 出现了两次,但都在上标位置 。
爱因斯坦求和必须是一上一下 。如果想表达对角线求和,必须引入度规:g μ ν T μ ν g_{\mu\nu} T^{\mu\nu} g μν T μν 。单纯的 T μ μ T^{\mu\mu} T μμ 在不指定坐标系的情况下没有几何意义(不具备协变性)。
非法 。
观察指标 μ \mu μ :
T μ ν T^{\mu\nu} T μν (上)
b μ b_\mu b μ (下)
v μ v_\mu v μ (下)
μ \mu μ 在方程中出现了三次(左1,右2)。这违反了“每个指标在一项中最多出现两次”的规则。
更深层错误:右边的 T μ … T^{\mu\dots} T μ … (上) 和 v μ v_\mu v μ (下) 看起来可以缩并,但如果缩并了,μ \mu μ 就变成了哑指标(消失),但左边 b μ b_\mu b μ 却还保留着 μ \mu μ 作为自由指标。逻辑矛盾。
合法 。
这是张量分析中最标准的方程。
自由指标 :μ , ν \mu, \nu μ , ν (均为下标)。
第一项 R μ ν R_{\mu\nu} R μν :自由指标 μ , ν \mu, \nu μ , ν 。
第二项 1 2 g μ ν R \frac{1}{2} g_{\mu\nu} R 2 1 g μν R :R R R 是标量(已完全缩并),g μ ν g_{\mu\nu} g μν 提供自由指标 μ , ν \mu, \nu μ , ν 。
第三项 T μ ν T_{\mu\nu} T μν :自由指标 μ , ν \mu, \nu μ , ν 。
每一项的自由指标结构完全一致。
1.4 对偶空间与余切矢量 (Dual Space & Cotangent Vectors)
在这一节中,我们将严格区分“矢量”和“梯度”这两个在欧几里得空间中经常混淆的概念,并引入 GR 描述物理场的关键接口——余切矢量。
在平直的欧几里得空间中,列向量
v v v 和行向量
v T v^T v T 看起来包含相同的数据(只是转置了一下),因此我们经常混用梯度向量
∇ f \nabla f ∇ f 和位移向量
r ⃗ \vec{r} r 。
但在流形上,它们是完全不同类型的数据对象 ,居住在完全不同的空间中,拥有不同的坐标变换法则。
1.4.1 几何直观:箭头 vs. 等高线
切矢量 (Tangent Vector, v ∈ T p M v \in T_p\mathcal{M} v ∈ T p M ) :
几何形象 :一个小箭头。
物理意义 :速度、位移、流量。
类比 :实例 。它是有“大小”和“方向”的实体。
余切矢量 (Cotangent Vector / One-form, ω ∈ T p ∗ M \omega \in T_p^*\mathcal{M} ω ∈ T p ∗ M ) :
几何形象 :一组成层排列的平行面(类似于地图上的等高线)。
物理意义 :密度、梯度、动量。
类比 :方法/查询 。它的作用是“吃掉”一个矢量,吐出一个实数(测量值)。
当我们将一个矢量(箭头)“射入”一个余切矢量(层叠面)时,箭头穿过的层数,就是两者缩并(Contraction)的结果数值。
1.4.2 形式化定义:线性泛函
定义 1.9 (对偶空间) :
设
T p M T_p\mathcal{M} T p M 是点
p p p 处的切空间(向量空间)。定义其
对偶空间 (Dual Space) T p ∗ M T_p^*\mathcal{M} T p ∗ M 为所有从
T p M T_p\mathcal{M} T p M 到
R \mathbb{R} R 的线性映射(线性泛函)的集合。
ω ∈ T p ∗ M ⟺ ω : T p M → R 是线性的 \omega \in T_p^*\mathcal{M} \iff \omega: T_p\mathcal{M} \to \mathbb{R} \text{ 是线性的} ω ∈ T p ∗ M ⟺ ω : T p M → R 是线性的
定义 1.10 (对偶基 / Dual Basis) :
在坐标系
{ x μ } \{x^\mu\} { x μ } 下,自然切基是
{ e μ = ∂ ∂ x μ } \{\mathbf{e}_\mu = \frac{\partial}{\partial x^\mu}\} { e μ = ∂ x μ ∂ } 。我们定义其对偶基
{ θ ν = d x ν } \{\theta^\nu = dx^\nu\} { θ ν = d x ν } 满足如下正交归一条件:
d x ν ( ∂ ∂ x μ ) = δ μ ν dx^\nu \left( \frac{\partial}{\partial x^\mu} \right) = \delta^\nu_\mu d x ν ( ∂ x μ ∂ ) = δ μ ν
为什么记作 d x dx d x ?
在微积分中,
d x dx d x 是一个无穷小量。但在流形几何中,
d x μ dx^\mu d x μ 被严格定义为
坐标函数 x μ x^\mu x μ 的梯度 (即
d x μ dx^\mu d x μ 是一个“提取第
μ \mu μ 个分量”的机器)。
任意余切矢量
ω \omega ω 可在基底下展开为分量形式(注意
下标 ):
ω = ω μ d x μ \omega = \omega_\mu dx^\mu ω = ω μ d x μ
1.4.3 核心原型:梯度 (The Gradient)
在 GR 中,标量场
f f f 的导数天然产生一个余切矢量,而不是切矢量。这一对象记为
d f df df (微分/外导数)。
定理 1.2 (梯度的自然性) :
设
f : M → R f: \mathcal{M} \to \mathbb{R} f : M → R 是光滑函数,沿着矢量
v v v 的方向导数定义为
v ( f ) v(f) v ( f ) 。
我们可以构造一个线性映射
d f df df ,使得:
⟨ d f , v ⟩ ≡ v ( f ) \langle df, v \rangle \equiv v(f) ⟨ df , v ⟩ ≡ v ( f )
利用链式法则展开
v ( f ) = v μ ∂ f ∂ x μ v(f) = v^\mu \frac{\partial f}{\partial x^\mu} v ( f ) = v μ ∂ x μ ∂ f ,根据线性性,我们可以读出
d f df df 的分量:
d f = ∂ f ∂ x μ d x μ df = \frac{\partial f}{\partial x^\mu} dx^\mu df = ∂ x μ ∂ f d x μ
这意味着梯度的分量是
ω μ = ∂ μ f \omega_\mu = \partial_\mu f ω μ = ∂ μ f 。
值得一提 :
想求一个函数的梯度,本质上是求它相对于坐标网格变化率的线性组合。这是一个行向量操作,因为它等待与一个列向量(变化方向)相乘来产生标量(变化量)。
区分矢量和余切矢量最根本的方法是看它们在坐标变换下的表现。这类似于协变 (Covariant) 与 逆变 (Contravariant) 类型检查。
设坐标系从
x x x 变换到
x ′ x' x ′ ,雅可比矩阵为
Λ ν μ ′ = ∂ x ′ μ ′ ∂ x ν \Lambda^{\mu'}_{\nu} = \frac{\partial x'^{\mu'}}{\partial x^\nu} Λ ν μ ′ = ∂ x ν ∂ x ′ μ ′ ,其逆矩阵为
( Λ − 1 ) μ ′ ν = ∂ x ν ∂ x ′ μ ′ (\Lambda^{-1})^\nu_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} ( Λ − 1 ) μ ′ ν = ∂ x ′ μ ′ ∂ x ν 。
切矢量 (Contravariant / 上标) :
矢量
v = v μ ∂ μ v = v^\mu \partial_\mu v = v μ ∂ μ 是客观存在的几何对象,其本体不变。当基底变换时,分量必须反向补偿。
v ′ μ ′ = ∂ x ′ μ ′ ∂ x ν v ν v'^{\mu'} = \frac{\partial x'^{\mu'}}{\partial x^\nu} v^\nu v ′ μ ′ = ∂ x ν ∂ x ′ μ ′ v ν
(分量随坐标“分子”变换)
余切矢量 (Covariant / 下标) :
由链式法则
∂ f ∂ x ′ μ ′ = ∂ f ∂ x ν ∂ x ν ∂ x ′ μ ′ \frac{\partial f}{\partial x'^{\mu'}} = \frac{\partial f}{\partial x^\nu} \frac{\partial x^\nu}{\partial x'^{\mu'}} ∂ x ′ μ ′ ∂ f = ∂ x ν ∂ f ∂ x ′ μ ′ ∂ x ν 可知:
ω μ ′ ′ = ∂ x ν ∂ x ′ μ ′ ω ν \omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu ω μ ′ ′ = ∂ x ′ μ ′ ∂ x ν ω ν
(分量随坐标“分母”变换,即逆雅可比矩阵)
口诀 :
上 标(矢量):用顺 向导数(新对旧 x ′ / x x'/x x ′ / x )。
下 标(余切):用逆 向导数(旧对新 x / x ′ x/x' x / x ′ )。
1.4.5 例题讲解
例题 1:欧氏空间与极坐标变换
直角坐标 x μ = ( x , y ) x^\mu = (x, y) x μ = ( x , y ) 。有一常数余切矢量 ω = 3 d x + 4 d y \omega = 3dx + 4dy ω = 3 d x + 4 d y ,即分量 ω μ = ( 3 , 4 ) \omega_\mu = (3, 4) ω μ = ( 3 , 4 ) 。
极坐标 x ′ μ ′ = ( r , θ ) x'^{\mu'} = (r, \theta) x ′ μ ′ = ( r , θ ) ,其中 x = r cos θ , y = r sin θ x = r \cos\theta, y = r \sin\theta x = r cos θ , y = r sin θ 。
问题 :求 ω \omega ω 在极坐标系下的分量 ω μ ′ ′ = ( ω r , ω θ ) \omega'_{\mu'} = (\omega_r, \omega_\theta) ω μ ′ ′ = ( ω r , ω θ ) 。
解答 :
我们需要使用余切矢量的变换法则(下标法则):
ω μ ′ ′ = ∂ x ν ∂ x ′ μ ′ ω ν \omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu ω μ ′ ′ = ∂ x ′ μ ′ ∂ x ν ω ν
我们需要计算逆雅可比矩阵
∂ ( x , y ) ∂ ( r , θ ) \frac{\partial(x, y)}{\partial(r, \theta)} ∂ ( r , θ ) ∂ ( x , y ) :
∂ x ∂ r = cos θ , ∂ x ∂ θ = − r sin θ \frac{\partial x}{\partial r} = \cos\theta, \quad \frac{\partial x}{\partial \theta} = -r\sin\theta ∂ r ∂ x = cos θ , ∂ θ ∂ x = − r sin θ
∂ y ∂ r = sin θ , ∂ y ∂ θ = r cos θ \frac{\partial y}{\partial r} = \sin\theta, \quad \frac{\partial y}{\partial \theta} = r\cos\theta ∂ r ∂ y = sin θ , ∂ θ ∂ y = r cos θ
计算分量:
ω r = ∂ x ∂ r ω x + ∂ y ∂ r ω y = ( cos θ ) ⋅ 3 + ( sin θ ) ⋅ 4 = 3 cos θ + 4 sin θ \omega_r = \frac{\partial x}{\partial r}\omega_x + \frac{\partial y}{\partial r}\omega_y = (\cos\theta) \cdot 3 + (\sin\theta) \cdot 4 = 3\cos\theta + 4\sin\theta ω r = ∂ r ∂ x ω x + ∂ r ∂ y ω y = ( cos θ ) ⋅ 3 + ( sin θ ) ⋅ 4 = 3 cos θ + 4 sin θ
ω θ = ∂ x ∂ θ ω x + ∂ y ∂ θ ω y = ( − r sin θ ) ⋅ 3 + ( r cos θ ) ⋅ 4 = r ( 4 cos θ − 3 sin θ ) \omega_\theta = \frac{\partial x}{\partial \theta}\omega_x + \frac{\partial y}{\partial \theta}\omega_y = (-r\sin\theta) \cdot 3 + (r\cos\theta) \cdot 4 = r(4\cos\theta - 3\sin\theta) ω θ = ∂ θ ∂ x ω x + ∂ θ ∂ y ω y = ( − r sin θ ) ⋅ 3 + ( r cos θ ) ⋅ 4 = r ( 4 cos θ − 3 sin θ )
注意
ω θ \omega_\theta ω θ 的量纲带有一个长度
r r r 。这说明余切矢量的分量物理量纲与矢量相反(为了乘积是标量)。在代码中,如果你直接把
( 3 , 4 ) (3,4) ( 3 , 4 ) 赋给
( r , θ ) (r, \theta) ( r , θ ) 分量是类型错误的。
例题 2:标量的不变性验证 (Invariant Check)
问题 :验证
ω ( v ) \omega(v) ω ( v ) 的值与坐标系选择无关。
设矢量
v v v 在直角坐标系下为
v = v x ∂ x + v y ∂ y v = v^x \partial_x + v^y \partial_y v = v x ∂ x + v y ∂ y 。在极坐标系下为
v ′ = v r ∂ r + v θ ∂ θ v' = v^r \partial_r + v^\theta \partial_\theta v ′ = v r ∂ r + v θ ∂ θ 。
证明:
ω μ v μ = ω μ ′ ′ v ′ μ ′ \omega_\mu v^\mu = \omega'_{\mu'} v'^{\mu'} ω μ v μ = ω μ ′ ′ v ′ μ ′ 。
证明 :
从 RHS(右边)开始:
RHS = ω μ ′ ′ v ′ μ ′ \text{RHS} = \omega'_{\mu'} v'^{\mu'} RHS = ω μ ′ ′ v ′ μ ′
代入变换公式:
余切矢量展开:ω μ ′ ′ = ∂ x ν ∂ x ′ μ ′ ω ν \omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu ω μ ′ ′ = ∂ x ′ μ ′ ∂ x ν ω ν
切矢量展开:v ′ μ ′ = ∂ x ′ μ ′ ∂ x σ v σ v'^{\mu'} = \frac{\partial x'^{\mu'}}{\partial x^\sigma} v^\sigma v ′ μ ′ = ∂ x σ ∂ x ′ μ ′ v σ
组合:
RHS = ( ∂ x ν ∂ x ′ μ ′ ω ν ) ( ∂ x ′ μ ′ ∂ x σ v σ ) \text{RHS} = \left( \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu \right) \left( \frac{\partial x'^{\mu'}}{\partial x^\sigma} v^\sigma \right) RHS = ( ∂ x ′ μ ′ ∂ x ν ω ν ) ( ∂ x σ ∂ x ′ μ ′ v σ )
这里对
μ ′ , ν , σ \mu', \nu, \sigma μ ′ , ν , σ 都有求和。利用导数的链式法则,注意
μ ′ \mu' μ ′ 是中间变量(哑指标):
∂ x ν ∂ x ′ μ ′ ∂ x ′ μ ′ ∂ x σ = ∂ x ν ∂ x σ = δ σ ν \frac{\partial x^\nu}{\partial x'^{\mu'}} \frac{\partial x'^{\mu'}}{\partial x^\sigma} = \frac{\partial x^\nu}{\partial x^\sigma} = \delta^\nu_\sigma ∂ x ′ μ ′ ∂ x ν ∂ x σ ∂ x ′ μ ′ = ∂ x σ ∂ x ν = δ σ ν
(对同一个坐标系,坐标
x ν x^\nu x ν 对
x σ x^\sigma x σ 的偏导仅当
ν = σ \nu=\sigma ν = σ 时为 1,否则为 0)
于是:
RHS = δ σ ν ω ν v σ = ω ν v ν = LHS \text{RHS} = \delta^\nu_\sigma \omega_\nu v^\sigma = \omega_\nu v^\nu = \text{LHS} RHS = δ σ ν ω ν v σ = ω ν v ν = LHS
结论 :缩并操作
⟨ ω , v ⟩ \langle \omega, v \rangle ⟨ ω , v ⟩ 是一个标量(Scalar),它代表真实的物理量,不随我们观察的角度(坐标系)而改变。
例题 3:从度规推导对偶矢量
在闵可夫斯基时空(狭义相对论)中,度规
g μ ν = diag ( − 1 , 1 , 1 , 1 ) g_{\mu\nu} = \text{diag}(-1, 1, 1, 1) g μν = diag ( − 1 , 1 , 1 , 1 ) 。
设四维速度矢量
u μ = ( γ , γ v , 0 , 0 ) u^\mu = (\gamma, \gamma v, 0, 0) u μ = ( γ , γ v , 0 , 0 ) ,其中
γ = 1 / 1 − v 2 \gamma = 1/\sqrt{1-v^2} γ = 1/ 1 − v 2 。
问题 :求对应的余切矢量
u μ u_\mu u μ 。
解答 :
这是利用度规进行
降指 (Index Lowering) 的典型操作:
u μ = g μ ν u ν u_\mu = g_{\mu\nu} u^\nu u μ = g μν u ν
展开矩阵乘法:
u 0 = g 00 u 0 + g 01 u 1 + ⋯ = ( − 1 ) ( γ ) + 0 = − γ u_0 = g_{00} u^0 + g_{01} u^1 + \dots = (-1)(\gamma) + 0 = -\gamma u 0 = g 00 u 0 + g 01 u 1 + ⋯ = ( − 1 ) ( γ ) + 0 = − γ
u 1 = g 10 u 0 + g 11 u 1 + ⋯ = 0 + ( 1 ) ( γ v ) = γ v u_1 = g_{10} u^0 + g_{11} u^1 + \dots = 0 + (1)(\gamma v) = \gamma v u 1 = g 10 u 0 + g 11 u 1 + ⋯ = 0 + ( 1 ) ( γ v ) = γ v
u 2 = 1 ⋅ 0 = 0 u_2 = 1 \cdot 0 = 0 u 2 = 1 ⋅ 0 = 0
u 3 = 1 ⋅ 0 = 0 u_3 = 1 \cdot 0 = 0 u 3 = 1 ⋅ 0 = 0
结果:
u μ = ( − γ , γ v , 0 , 0 ) u_\mu = (-\gamma, \gamma v, 0, 0) u μ = ( − γ , γ v , 0 , 0 )
注意 :在 GR 中,矢量
u μ u^\mu u μ 和对应的 1-form
u μ u_\mu u μ 在第 0 分量上符号相反。如果不区分上下指标,在计算模长
u 2 = u μ u μ u^2 = u^\mu u_\mu u 2 = u μ u μ 时就会得到错误的结果。
1.5 通用张量 (General Tensors)
张量是将标量、矢量和余切矢量推广到任意“秩(Rank)”的几何对象。它描述了不同几何实体之间的线性关系。
1.5.1 定义:多重线性映射
定义 1.11 (( k , l ) (k, l) ( k , l ) 型张量) :
在流形
M \mathcal{M} M 上的点
p p p ,一个
( k , l ) (k, l) ( k , l ) 型张量 T T T 是一个多重线性映射:
T : T p ∗ M × ⋯ × T p ∗ M ⏟ k 个 (输入 1-form) × T p M × ⋯ × T p M ⏟ l 个 (输入 Vector) → R T: \underbrace{T_p^*\mathcal{M} \times \dots \times T_p^*\mathcal{M}}_{k \text{ 个 (输入 1-form)}} \times \underbrace{T_p\mathcal{M} \times \dots \times T_p\mathcal{M}}_{l \text{ 个 (输入 Vector)}} \to \mathbb{R} T : k 个 ( 输入 1-form) T p ∗ M × ⋯ × T p ∗ M × l 个 ( 输入 Vector) T p M × ⋯ × T p M → R
k k k 称为逆变秩 (Contravariant Rank) :对应的分量指标在上。
l l l 称为协变秩 (Covariant Rank) :对应的分量指标在下。
线性性 :对任意参数位置,满足 T ( … , a u + b v , … ) = a T ( … , u , … ) + b T ( … , v , … ) T(\dots, a\mathbf{u} + b\mathbf{v}, \dots) = aT(\dots, \mathbf{u}, \dots) + bT(\dots, \mathbf{v}, \dots) T ( … , a u + b v , … ) = a T ( … , u , … ) + b T ( … , v , … ) 。
类比:函数签名
一个
( 1 , 1 ) (1, 1) ( 1 , 1 ) 张量可以看作一个函数,其强类型签名为:
double tensor_mapping(CotangentVector omega, TangentVector v)
输入 :需要 k k k 个行向量(用来与上指标缩并)和 l l l 个列向量(用来与下指标缩并)。
输出 :当你把所有“槽位(Slots)”填满后,它返回一个不变量(标量)。
1.5.2 张量积与分量表示
我们需要一种“胶水”来将低阶对象组合成高阶张量。
定义 1.12 (张量积 / Tensor Product ⊗ \otimes ⊗ ) :
设
S S S 是
( k , l ) (k, l) ( k , l ) 型张量,
R R R 是
( m , n ) (m, n) ( m , n ) 型张量。它们的张量积
S ⊗ R S \otimes R S ⊗ R 是一个
( k + m , l + n ) (k+m, l+n) ( k + m , l + n ) 型张量,其定义为:
( S ⊗ R ) ( ω 1 , … , ω k + m , v 1 , … , v l + n ) ≡ S ( ω 1 , … , ω k , v 1 , … , v l ) ⋅ R ( ω k + 1 , … , v l + 1 , … ) (S \otimes R)(\omega_1, \dots, \omega_{k+m}, v_1, \dots, v_{l+n}) \equiv S(\omega_1, \dots, \omega_k, v_1, \dots, v_l) \cdot R(\omega_{k+1}, \dots, v_{l+1}, \dots) ( S ⊗ R ) ( ω 1 , … , ω k + m , v 1 , … , v l + n ) ≡ S ( ω 1 , … , ω k , v 1 , … , v l ) ⋅ R ( ω k + 1 , … , v l + 1 , … )
即:输入参数被分发给
S S S 和
R R R ,结果相乘。
定理 1.3 (基底展开) :
利用张量积,我们可以构建张量空间的基底。任意
( k , l ) (k, l) ( k , l ) 张量
T T T 可在坐标基
{ ∂ μ } \{ \partial_\mu \} { ∂ μ } 和
{ d x ν } \{ dx^\nu \} { d x ν } 下唯一展开:
T = T ν 1 … ν l μ 1 … μ k ( ∂ μ 1 ⊗ ⋯ ⊗ ∂ μ k ) ⊗ ( d x ν 1 ⊗ ⋯ ⊗ d x ν l ) T = T^{\mu_1 \dots \mu_k}_{\nu_1 \dots \nu_l} \, (\partial_{\mu_1} \otimes \dots \otimes \partial_{\mu_k}) \otimes (dx^{\nu_1} \otimes \dots \otimes dx^{\nu_l}) T = T ν 1 … ν l μ 1 … μ k ( ∂ μ 1 ⊗ ⋯ ⊗ ∂ μ k ) ⊗ ( d x ν 1 ⊗ ⋯ ⊗ d x ν l )
其中,
T ν 1 … ν l μ 1 … μ k T^{\mu_1 \dots \mu_k}_{\nu_1 \dots \nu_l} T ν 1 … ν l μ 1 … μ k 是
n k + l n^{k+l} n k + l 个实数组成的
分量数组 。
1.5.3 坐标变换法则 (The Supreme Law)
判断一个多维数组是否是“物理张量”的唯一标准,是看它是否遵循以下变换规律。这是 GR 中所有物理定律必须满足的类型安全检查 。
设坐标变换
x → x ′ x \to x' x → x ′ ,雅可比矩阵为
Λ ν μ ′ = ∂ x ′ μ ′ ∂ x ν \Lambda^{\mu'}_{\nu} = \frac{\partial x'^{\mu'}}{\partial x^\nu} Λ ν μ ′ = ∂ x ν ∂ x ′ μ ′ ,逆雅可比矩阵为
( Λ − 1 ) μ ′ ν = ∂ x ν ∂ x ′ μ ′ (\Lambda^{-1})^\nu_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} ( Λ − 1 ) μ ′ ν = ∂ x ′ μ ′ ∂ x ν 。
张量分量变换法则 :
对于
( k , l ) (k, l) ( k , l ) 张量,其新坐标下的分量
T ν 1 ′ … ′ μ 1 ′ … T'^{\mu'_1 \dots}_{\nu'_1 \dots} T ν 1 ′ … ′ μ 1 ′ … 为:
T ν 1 ′ … ν l ′ ′ μ 1 ′ … μ k ′ = ∂ x ′ μ 1 ′ ∂ x ρ 1 … ∂ x ′ μ k ′ ∂ x ρ k ⏟ 针对 k 个上指标 ⋅ ∂ x σ 1 ∂ x ′ ν 1 ′ … ∂ x σ l ∂ x ′ ν l ′ ⏟ 针对 l 个下指标 ⋅ T σ 1 … σ l ρ 1 … ρ k T'^{\mu'_1 \dots \mu'_k}_{\nu'_1 \dots \nu'_l} = \underbrace{\frac{\partial x'^{\mu'_1}}{\partial x^{\rho_1}} \dots \frac{\partial x'^{\mu'_k}}{\partial x^{\rho_k}}}_{\text{针对 } k \text{ 个上指标}} \cdot \underbrace{\frac{\partial x^{\sigma_1}}{\partial x'^{\nu'_1}} \dots \frac{\partial x^{\sigma_l}}{\partial x'^{\nu'_l}}}_{\text{针对 } l \text{ 个下指标}} \cdot T^{\rho_1 \dots \rho_k}_{\sigma_1 \dots \sigma_l} T ν 1 ′ … ν l ′ ′ μ 1 ′ … μ k ′ = 针对 k 个上指标 ∂ x ρ 1 ∂ x ′ μ 1 ′ … ∂ x ρ k ∂ x ′ μ k ′ ⋅ 针对 l 个下指标 ∂ x ′ ν 1 ′ ∂ x σ 1 … ∂ x ′ ν l ′ ∂ x σ l ⋅ T σ 1 … σ l ρ 1 … ρ k
规则总结 :
每个上 指标(逆变)“携带”一个 ∂ x ′ ∂ x \frac{\partial x'}{\partial x} ∂ x ∂ x ′ (分子是新坐标)。
每个下 指标(协变)“携带”一个 ∂ x ∂ x ′ \frac{\partial x}{\partial x'} ∂ x ′ ∂ x (分母是新坐标)。
所有旧指标 (ρ , σ \rho, \sigma ρ , σ ) 都是哑指标,进行求和。
1.5.4 关键操作:缩并 (Contraction)
缩并是降低张量秩(Rank)的唯一内部操作(无需引入外部度规)。
定义 1.13 (缩并) :
设
T T T 为
( k , l ) (k, l) ( k , l ) 型张量(
k , l ≥ 1 k,l \ge 1 k , l ≥ 1 )。令其第
i i i 个上指标与第
j j j 个下指标相等(求和)。
这将产生一个新的
( k − 1 , l − 1 ) (k-1, l-1) ( k − 1 , l − 1 ) 型张量。
例如,对于
( 1 , 1 ) (1, 1) ( 1 , 1 ) 张量
T ν μ T^\mu_\nu T ν μ ,缩并得到标量(迹):
S = tr ( T ) = T μ μ = ∑ μ = 0 n − 1 T μ μ S = \text{tr}(T) = T^\mu_\mu = \sum_{\mu=0}^{n-1} T^\mu_\mu S = tr ( T ) = T μ μ = ∑ μ = 0 n − 1 T μ μ
定理 1.4 (缩并的几何意义) :
在张量作为映射的视角下,
T ( ω , v ) T(\omega, v) T ( ω , v ) 本质上就是张量
T T T 与输入
v , ω v, \omega v , ω 的
缩并 。
T ( ω , v ) ⟺ T ν μ ω μ v ν T(\omega, v) \iff T^\mu_\nu \omega_\mu v^\nu T ( ω , v ) ⟺ T ν μ ω μ v ν
这里的“填槽”过程,实际上就是把输入的自由指标与张量的对应指标变为哑指标并求和。
1.5.5 例题讲解
例题 1:类型推断与对象识别
问题 :
在广义相对论中,判断以下对象的张量类型
( k , l ) (k, l) ( k , l ) :
度规张量 g μ ν g_{\mu\nu} g μν
逆度规 g μ ν g^{\mu\nu} g μν
克里斯托费尔符号 Γ μ ν λ \Gamma^\lambda_{\mu\nu} Γ μν λ
里奇曲率张量 R μ ν R_{\mu\nu} R μν
黎曼曲率张量 R σ μ ν ρ R^\rho_{\sigma\mu\nu} R σ μν ρ
解答 :
( 0 , 2 ) (0, 2) ( 0 , 2 ) 张量 。它接受两个矢量 u , v u, v u , v ,输出内积 g ( u , v ) ∈ R g(u,v) \in \mathbb{R} g ( u , v ) ∈ R 。
( 2 , 0 ) (2, 0) ( 2 , 0 ) 张量 。它本质上是两个余切矢量的内积映射。
不是张量 。Γ μ ν λ \Gamma^\lambda_{\mu\nu} Γ μν λ 在坐标变换时包含二阶导数项 ∂ 2 x ∂ x ′ 2 \frac{\partial^2 x}{\partial x'^2} ∂ x ′2 ∂ 2 x ,破坏了线性变换规律(它是仿射联络系数,而非张量)。
( 0 , 2 ) (0, 2) ( 0 , 2 ) 张量 。是 ( 1 , 3 ) (1,3) ( 1 , 3 ) 黎曼张量的缩并结果(缩并了一个上标和一个下标,秩减2)。
( 1 , 3 ) (1, 3) ( 1 , 3 ) 张量 。虽然它有4个指标,但标准定义是接受1个 1-form 和 3个矢量。
例题 2:张量积与运算逻辑
问题 :
设矢量
u μ = ( 1 , 0 ) u^\mu = (1, 0) u μ = ( 1 , 0 ) ,1-form
ω ν = ( 1 , 3 ) \omega_\nu = (1, 3) ω ν = ( 1 , 3 ) (在二维平面)。
定义
( 1 , 1 ) (1, 1) ( 1 , 1 ) 张量
T = u ⊗ ω T = u \otimes \omega T = u ⊗ ω 。
写出 T T T 的分量矩阵 T ν μ T^\mu_\nu T ν μ 。
计算 T T T 对矢量 v ν = ( 2 , 1 ) v^\nu = (2, 1) v ν = ( 2 , 1 ) 的作用结果。
解答 :
计算分量 :
根据张量积定义:
T ν μ = u μ ω ν T^\mu_\nu = u^\mu \omega_\nu T ν μ = u μ ω ν 。
T = ( u 0 u 1 ) ( ω 0 ω 1 ) = ( 1 0 ) ( 1 3 ) = ( 1 ⋅ 1 1 ⋅ 3 0 ⋅ 1 0 ⋅ 3 ) = ( 1 3 0 0 ) T = \begin{pmatrix} u^0 \\ u^1 \end{pmatrix} \begin{pmatrix} \omega_0 & \omega_1 \end{pmatrix}
= \begin{pmatrix} 1 \\ 0 \end{pmatrix} \begin{pmatrix} 1 & 3 \end{pmatrix}
= \begin{pmatrix} 1\cdot 1 & 1\cdot 3 \\ 0\cdot 1 & 0\cdot 3 \end{pmatrix}
= \begin{pmatrix} 1 & 3 \\ 0 & 0 \end{pmatrix} T = ( u 0 u 1 ) ( ω 0 ω 1 ) = ( 1 0 ) ( 1 3 ) = ( 1 ⋅ 1 0 ⋅ 1 1 ⋅ 3 0 ⋅ 3 ) = ( 1 0 3 0 )
注意:在习惯上,第一个指标
μ \mu μ (Row) 代表行索引,第二个指标
ν \nu ν (Col) 代表列索引。
作用于矢量 v v v :
这是张量缩并
w μ = T ν μ v ν w^\mu = T^\mu_\nu v^\nu w μ = T ν μ v ν (矩阵乘法):
w = ( 1 3 0 0 ) ( 2 1 ) = ( 2 + 3 0 + 0 ) = ( 5 0 ) w = \begin{pmatrix} 1 & 3 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} 2 \\ 1 \end{pmatrix} = \begin{pmatrix} 2 + 3 \\ 0 + 0 \end{pmatrix} = \begin{pmatrix} 5 \\ 0 \end{pmatrix} w = ( 1 0 3 0 ) ( 2 1 ) = ( 2 + 3 0 + 0 ) = ( 5 0 )
验证 :
T ( v ) = ( u ⊗ ω ) ( v ) = u ⋅ [ ω ( v ) ] = u ⋅ [ ω ν v ν ] = u ⋅ ( 1 ⋅ 2 + 3 ⋅ 1 ) = 5 u = ( 5 , 0 ) T(v) = (u \otimes \omega)(v) = u \cdot [\omega(v)] = u \cdot [\omega_\nu v^\nu] = u \cdot (1\cdot 2 + 3\cdot 1) = 5u = (5, 0) T ( v ) = ( u ⊗ ω ) ( v ) = u ⋅ [ ω ( v )] = u ⋅ [ ω ν v ν ] = u ⋅ ( 1 ⋅ 2 + 3 ⋅ 1 ) = 5 u = ( 5 , 0 ) 。结果一致。
例题 3:商定理 (Quotient Theorem) 的应用
问题 :
假如有一个多维数组
X μ ν X^{\mu\nu} X μν ,我们不确定它是不是张量。
已知对于任意的协变矢量(1-form)
a μ a_\mu a μ 和
b ν b_\nu b ν ,缩并结果
S = X μ ν a μ b ν S = X^{\mu\nu} a_\mu b_\nu S = X μν a μ b ν 在任何坐标系下都是一个标量(即
S ′ = S S' = S S ′ = S )。
证明:
X μ ν X^{\mu\nu} X μν 必须是一个
( 2 , 0 ) (2, 0) ( 2 , 0 ) 型张量。
证明思路 :
这是一个非常重要的判定定理,称为商定理 :如果一个对象被张量“除”(缩并)后得到张量,那它本身就是张量。
根据题意:X ′ α β a α ′ b β ′ = X μ ν a μ b ν X'^{\alpha\beta} a'_\alpha b'_\beta = X^{\mu\nu} a_\mu b_\nu X ′ α β a α ′ b β ′ = X μν a μ b ν (标量不变)。
我们将 a ′ , b ′ a', b' a ′ , b ′ 变换回旧坐标系:
a μ = ∂ x ′ α ∂ x μ a α ′ a_\mu = \frac{\partial x'^\alpha}{\partial x^\mu} a'_\alpha a μ = ∂ x μ ∂ x ′ α a α ′
b ν = ∂ x ′ β ∂ x ν b β ′ b_\nu = \frac{\partial x'^\beta}{\partial x^\nu} b'_\beta b ν = ∂ x ν ∂ x ′ β b β ′
代入 RHS:
X ′ α β a α ′ b β ′ = X μ ν ( ∂ x ′ α ∂ x μ a α ′ ) ( ∂ x ′ β ∂ x ν b β ′ ) X'^{\alpha\beta} a'_\alpha b'_\beta = X^{\mu\nu} \left( \frac{\partial x'^\alpha}{\partial x^\mu} a'_\alpha \right) \left( \frac{\partial x'^\beta}{\partial x^\nu} b'_\beta \right) X ′ α β a α ′ b β ′ = X μν ( ∂ x μ ∂ x ′ α a α ′ ) ( ∂ x ν ∂ x ′ β b β ′ )
整理项:
( X ′ α β − ∂ x ′ α ∂ x μ ∂ x ′ β ∂ x ν X μ ν ) a α ′ b β ′ = 0 \left( X'^{\alpha\beta} - \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} X^{\mu\nu} \right) a'_\alpha b'_\beta = 0 ( X ′ α β − ∂ x μ ∂ x ′ α ∂ x ν ∂ x ′ β X μν ) a α ′ b β ′ = 0
由于 a ′ , b ′ a', b' a ′ , b ′ 是任意 矢量,若要上式恒成立,括号内的部分必须为 0(线性代数基本性质)。
因此:X ′ α β = ∂ x ′ α ∂ x μ ∂ x ′ β ∂ x ν X μ ν X'^{\alpha\beta} = \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} X^{\mu\nu} X ′ α β = ∂ x μ ∂ x ′ α ∂ x ν ∂ x ′ β X μν 。
这正是 ( 2 , 0 ) (2, 0) ( 2 , 0 ) 张量的变换法则。得证 。
1.6 度规张量 (The Metric Tensor)
1.6.1 定义:广义内积
在抽象向量空间中,内积是一个双线性映射。在微分几何中,我们要求这个映射在每一点都是光滑变化的。可以将度规张量理解为定义在流形上的 内积 API 。一旦你给流形装备了这个 API,流形就升级为了黎曼流形 (或伪黎曼流形),此时我们才能计算长度、角度,并定义因果结构。
定义 1.14 (度规张量) :
度规
g g g 是一个光滑的
( 0 , 2 ) (0, 2) ( 0 , 2 ) 型张量场。在流形上的任意点
p p p ,它接受两个切矢量
u , v ∈ T p M u, v \in T_p\mathcal{M} u , v ∈ T p M ,并输出一个实数(标量积):
g p ( u , v ) ∈ R g_p(u, v) \in \mathbb{R} g p ( u , v ) ∈ R
它必须满足两个公理:
对称性 (Symmetry) :
g ( u , v ) = g ( v , u ) ⟺ g μ ν = g ν μ g(u, v) = g(v, u) \iff g_{\mu\nu} = g_{\nu\mu} g ( u , v ) = g ( v , u ) ⟺ g μν = g νμ
这保证了 A A A 到 B B B 的“距离”等于 B B B 到 A A A 的距离。
非退化性 (Non-degeneracy) :
若对于所有的 v v v ,都有 g ( u , v ) = 0 g(u, v) = 0 g ( u , v ) = 0 ,则必须有 u = 0 u=0 u = 0 。
这等价于度规矩阵的行列式不为零:det ( g μ ν ) ≠ 0 \det(g_{\mu\nu}) \neq 0 det ( g μν ) = 0 。
1.6.2 线元 (The Line Element)
物理文献中极少直接写出
g μ ν g_{\mu\nu} g μν 矩阵,而是通过
线元 d s 2 ds^2 d s 2 来定义度规。线元描述了无穷小位移矢量
d x = d x μ ∂ μ d\mathbf{x} = dx^\mu \partial_\mu d x = d x μ ∂ μ 的自内积(即模长的平方)。
d s 2 = g ( d x , d x ) = g μ ν d x μ d x ν ds^2 = \mathbf{g}(d\mathbf{x}, d\mathbf{x}) = g_{\mu\nu} dx^\mu dx^\nu d s 2 = g ( d x , d x ) = g μν d x μ d x ν
二次型视角
d s 2 ds^2 d s 2 只是一个二次型符号。
g μ ν g_{\mu\nu} g μν 是一个存储几何权重的
4 × 4 4 \times 4 4 × 4 对称矩阵。
d x μ dx^\mu d x μ 是输入的差分向量。
Cost = [ d x 0 , … , d x 3 ] × [ G ] × [ d x 0 , … , d x 3 ] T \text{Cost} = [dx^0, \dots, dx^3] \times [G] \times [dx^0, \dots, dx^3]^T Cost = [ d x 0 , … , d x 3 ] × [ G ] × [ d x 0 , … , d x 3 ] T
1.6.3 符号差与因果结构 (The Signature & Causality)
度规的
符号差 (Signature) 决定了流形的物理性质。
将
g μ ν g_{\mu\nu} g μν 对角化后,对角线上正负号的个数称为符号差。
黎曼度规 (Euclidean/Riemannian) :
签名:( + , + , + , + ) (+, +, +, +) ( + , + , + , + )
性质:d s 2 = 0 ⟺ d x = 0 ds^2 = 0 \iff dx = 0 d s 2 = 0 ⟺ d x = 0 。即只要动了,距离就是正的。
用途:普通几何空间。
洛伦兹度规 (Lorentzian) —— 广义相对论使用此定义
签名:( − , + , + , + ) (-, +, +, +) ( − , + , + , + ) 或 ( + , − , − , − ) (+, -, -, -) ( + , − , − , − ) (文献中称为 "East Coast" 或 "West Coast" 惯例,本文采用 − + + + -+++ − + + + )。
关键性质 :即使 d x ≠ 0 dx \neq 0 d x = 0 ,也可以有 d s 2 = 0 ds^2 = 0 d s 2 = 0 。
因果分类 :对于切矢量 v v v ,
g ( v , v ) < 0 g(v, v) < 0 g ( v , v ) < 0 :类时 (Timelike) ,有质量粒子的轨迹。
g ( v , v ) = 0 g(v, v) = 0 g ( v , v ) = 0 :类光 (Null/Lightlike) ,光子的轨迹。
g ( v , v ) > 0 g(v, v) > 0 g ( v , v ) > 0 :类空 (Spacelike) ,超光速区域(因果上不可达)。
1.6.4 音乐同构:升降指标 (Musical Isomorphisms)
度规张量提供了一种“自然”的方式将切空间
T p M T_p\mathcal{M} T p M 和对偶空间
T p ∗ M T_p^*\mathcal{M} T p ∗ M 粘合起来。
定义 1.15 (降指 / Lowering Indices - ♭ \flat ♭ ) :
给定矢量
v μ v^\mu v μ ,通过与度规的
部分缩并 ,生成一个余切矢量
v μ v_\mu v μ :
v μ ≡ g μ ν v ν v_\mu \equiv g_{\mu\nu} v^\nu v μ ≡ g μν v ν
在矩阵视角下,这等价于:
行向量 = 矩阵 × \times × 列向量 。
定义 1.16 (逆度规与升指 / Raising Indices - ♯ \sharp ♯ ) :
度规矩阵的逆矩阵记为
g μ ν g^{\mu\nu} g μν (注意双上标),满足:
g μ ρ g ρ ν = δ ν μ g^{\mu\rho} g_{\rho\nu} = \delta^\mu_\nu g μ ρ g ρ ν = δ ν μ
利用它将余切矢量转换回矢量:
v μ ≡ g μ ν v ν v^\mu \equiv g^{\mu\nu} v_\nu v μ ≡ g μν v ν
值得一提 :
在欧氏空间(笛卡尔坐标),
g = I g = I g = I (单位阵),所以
v μ v^\mu v μ 和
v μ v_\mu v μ 数值相同。
但在弯曲时空或闵可夫斯基时空中,分量的数值甚至符号都会改变!
混淆上下标会导致致命的物理错误 。
1.6.5 例题讲解
例题 1:从线元读取度规分量
问题 :
考虑三维球坐标空间,其线元公式为:
d s 2 = d r 2 + r 2 d θ 2 + r 2 sin 2 θ d ϕ 2 ds^2 = dr^2 + r^2 d\theta^2 + r^2 \sin^2\theta \, d\phi^2 d s 2 = d r 2 + r 2 d θ 2 + r 2 sin 2 θ d ϕ 2
写出对应的坐标系 { x μ } \{x^\mu\} { x μ } 。
写出度规张量 g μ ν g_{\mu\nu} g μν 的矩阵形式。
写出逆度规张量 g μ ν g^{\mu\nu} g μν 的矩阵形式。
解答 :
坐标系 x 1 = r , x 2 = θ , x 3 = ϕ x^1 = r, x^2 = \theta, x^3 = \phi x 1 = r , x 2 = θ , x 3 = ϕ 。
观察 d s 2 = g 11 ( d r ) 2 + g 22 ( d θ ) 2 + g 33 ( d ϕ ) 2 ds^2 = g_{11}(dr)^2 + g_{22}(d\theta)^2 + g_{33}(d\phi)^2 d s 2 = g 11 ( d r ) 2 + g 22 ( d θ ) 2 + g 33 ( d ϕ ) 2 。由于没有交叉项(如 d r d θ dr d\theta d r d θ ),非对角元为 0。
[ g μ ν ] = ( 1 0 0 0 r 2 0 0 r 2 sin 2 θ ) [g_{\mu\nu}] = \begin{pmatrix}
1 & 0 & 0 \\
0 & r^2 & 0 \\
0 & r^2 \sin^2\theta
\end{pmatrix} [ g μν ] = 1 0 0 0 r 2 r 2 sin 2 θ 0 0
由于矩阵是对角阵,其逆矩阵就是对角线元素取倒数:
[ g μ ν ] = ( 1 0 0 0 r − 2 0 0 ( r sin θ ) − 2 ) [g^{\mu\nu}] = \begin{pmatrix}
1 & 0 & 0 \\
0 & r^{-2} & 0 \\
0 & (r \sin\theta)^{-2}
\end{pmatrix} [ g μν ] = 1 0 0 0 r − 2 ( r sin θ ) − 2 0 0
检验 :g μ ν g ν λ = δ λ μ g^{\mu\nu} g_{\nu\lambda} = \delta^\mu_\lambda g μν g ν λ = δ λ μ 。例如 μ = 2 , λ = 2 \mu=2, \lambda=2 μ = 2 , λ = 2 : r − 2 ⋅ r 2 = 1 r^{-2} \cdot r^2 = 1 r − 2 ⋅ r 2 = 1 。
例题 2:指标升降与符号陷阱
问题 :
在狭义相对论(平直闵可夫斯基时空)中,使用
( − + + + ) (-+++) ( − + + + ) 度规:
g μ ν = diag ( − 1 , 1 , 1 , 1 ) g_{\mu\nu} = \text{diag}(-1, 1, 1, 1) g μν = diag ( − 1 , 1 , 1 , 1 )
给定一个四维动量矢量
P μ = ( E , p x , p y , p z ) P^\mu = (E, p_x, p_y, p_z) P μ = ( E , p x , p y , p z ) (这里设
c = 1 c=1 c = 1 )。
计算协变矢量 P μ P_\mu P μ 。
计算模长平方 P 2 = P μ P μ P^2 = P^\mu P_\mu P 2 = P μ P μ 。
对于光子 (m = 0 m=0 m = 0 ),这意味着什么?
解答 :
降指 :
P 0 = g 00 P 0 = ( − 1 ) ⋅ E = − E P_0 = g_{00} P^0 = (-1) \cdot E = -E P 0 = g 00 P 0 = ( − 1 ) ⋅ E = − E
P 1 = g 11 P 1 = ( 1 ) ⋅ p x = p x P_1 = g_{11} P^1 = (1) \cdot p_x = p_x P 1 = g 11 P 1 = ( 1 ) ⋅ p x = p x
...
所以:
P μ = ( − E , p x , p y , p z ) P_\mu = (-E, p_x, p_y, p_z) P μ = ( − E , p x , p y , p z )
注意时间分量反号了!
计算模长 :
P 2 = P μ P μ = P 0 P 0 + P i P i = E ( − E ) + ( p x 2 + p y 2 + p z 2 ) = − E 2 + ∣ p ⃗ ∣ 2 P^2 = P^\mu P_\mu = P^0 P_0 + P^i P_i = E(-E) + (p_x^2 + p_y^2 + p_z^2) = -E^2 + |\vec{p}|^2 P 2 = P μ P μ = P 0 P 0 + P i P i = E ( − E ) + ( p x 2 + p y 2 + p z 2 ) = − E 2 + ∣ p ∣ 2
物理诠释 :
在相对论力学中,
P 2 = − m 2 P^2 = -m^2 P 2 = − m 2 (静质量平方的负数,取决于定义)。
对于光子,
m = 0 m=0 m = 0 。所以
P 2 = 0 P^2 = 0 P 2 = 0 。
这意味着
− E 2 + ∣ p ⃗ ∣ 2 = 0 ⟹ E = ∣ p ⃗ ∣ -E^2 + |\vec{p}|^2 = 0 \implies E = |\vec{p}| − E 2 + ∣ p ∣ 2 = 0 ⟹ E = ∣ p ∣ 。
几何结论 :光子的动量矢量在四维时空中是非零矢量,但其“长度”(自内积)为零。这是一个
零矢量 (Null Vector) 。
例题 3:非对角度规与混合索引
问题 :
考虑一个二维“旋转”坐标系(如克尔黑洞的赤道面简化版),线元包含交叉项:
d s 2 = − d t 2 + 2 d t d ϕ + d r 2 ds^2 = -dt^2 + 2 dt d\phi + dr^2 d s 2 = − d t 2 + 2 d t d ϕ + d r 2
坐标为
( t , ϕ , r ) (t, \phi, r) ( t , ϕ , r ) 。
写出矩阵 g μ ν g_{\mu\nu} g μν 。
计算行列式 det ( g ) \det(g) det ( g ) ,检查其是否退化。
求逆度规 g μ ν g^{\mu\nu} g μν 中的 g t t g^{tt} g tt 分量。
解答 :
识别分量 :
d t 2 dt^2 d t 2 系数 − 1 ⟹ g t t = − 1 -1 \implies g_{tt} = -1 − 1 ⟹ g tt = − 1 。
d r 2 dr^2 d r 2 系数 1 ⟹ g r r = 1 1 \implies g_{rr} = 1 1 ⟹ g rr = 1 。
d t d ϕ dt d\phi d t d ϕ 系数 2 2 2 。注意公式是 ∑ g μ ν d x μ d x ν \sum g_{\mu\nu}dx^\mu dx^\nu ∑ g μν d x μ d x ν ,对于交叉项 d t d ϕ dt d\phi d t d ϕ ,由于对称性 g t ϕ = g ϕ t g_{t\phi} = g_{\phi t} g tϕ = g ϕt ,这一项会出现两次。所以 2 g t ϕ = 2 ⟹ g t ϕ = 1 2 g_{t\phi} = 2 \implies g_{t\phi} = 1 2 g tϕ = 2 ⟹ g tϕ = 1 。(注意系数除以2的规则!)
d ϕ 2 d\phi^2 d ϕ 2 系数 0 ⟹ g ϕ ϕ = 0 0 \implies g_{\phi\phi} = 0 0 ⟹ g ϕϕ = 0 。
矩阵形式(顺序
t , ϕ , r t, \phi, r t , ϕ , r ):
g = ( − 1 1 0 1 0 0 0 0 1 ) g = \begin{pmatrix}
-1 & 1 & 0 \\
1 & 0 & 0 \\
0 & 0 & 1
\end{pmatrix} g = − 1 1 0 1 0 0 0 0 1
计算行列式 :
这是块对角矩阵。右上角是
( − 1 1 1 0 ) \begin{pmatrix} -1 & 1 \\ 1 & 0 \end{pmatrix} ( − 1 1 1 0 ) ,右下角是
1 1 1 。
det ( g ) = [ ( − 1 ) ( 0 ) − ( 1 ) ( 1 ) ] × 1 = − 1 ≠ 0 \det(g) = [(-1)(0) - (1)(1)] \times 1 = -1 \neq 0 det ( g ) = [( − 1 ) ( 0 ) − ( 1 ) ( 1 )] × 1 = − 1 = 0
度规非退化,是个合法的洛伦兹度规。
求逆度规 :
需要求该矩阵的逆。重点关注左上
2 × 2 2\times 2 2 × 2 块
A = ( − 1 1 1 0 ) A = \begin{pmatrix} -1 & 1 \\ 1 & 0 \end{pmatrix} A = ( − 1 1 1 0 ) 。
A − 1 = 1 det ( A ) ( 0 − 1 − 1 − 1 ) = 1 − 1 ( 0 − 1 − 1 − 1 ) = ( 0 1 1 1 ) A^{-1} = \frac{1}{\det(A)} \begin{pmatrix} 0 & -1 \\ -1 & -1 \end{pmatrix} = \frac{1}{-1} \begin{pmatrix} 0 & -1 \\ -1 & -1 \end{pmatrix} = \begin{pmatrix} 0 & 1 \\ 1 & 1 \end{pmatrix} A − 1 = d e t ( A ) 1 ( 0 − 1 − 1 − 1 ) = − 1 1 ( 0 − 1 − 1 − 1 ) = ( 0 1 1 1 )
即:
g μ ν = ( 0 1 0 1 1 0 0 0 1 ) g^{\mu\nu} = \begin{pmatrix}
0 & 1 & 0 \\
1 & 1 & 0 \\
0 & 0 & 1
\end{pmatrix} g μν = 0 1 0 1 1 0 0 0 1
结果分析 :虽然
g t t = − 1 g_{tt} = -1 g tt = − 1 ,但逆矩阵分量
g t t = 0 g^{tt} = 0 g tt = 0 !这再次强调了
g μ ν g^{\mu\nu} g μν 不是简单地对
g μ ν g_{\mu\nu} g μν 每个元素取倒数,而是矩阵求逆的操作。