极限
我们先来定义数列的极限。感性理解,极限是指这个数列越往后,值会越靠近某个值
a a a ,且这个靠近可以无限接近,我们将其描述为对于任意一个距离
ε \varepsilon ε 都可以比它更小,且在某个点之后都满足距离比
ε \varepsilon ε 小。因此可以定义:
数列的极限:设
x n x_n x n 为一数列,如果存在常数
a a a 使得对于任意正数
ε \varepsilon ε ,总存在正整数
N N N 使得当
n > N n>N n > N ,
∣ x n − a ∣ < ε |x_n-a|<\varepsilon ∣ x n − a ∣ < ε ,称数列
x n x_n x n 收敛于
a a a ,记作
lim n → ∞ x n = a \lim_{n\to\infty}x_n=a lim n → ∞ x n = a 。若不存在,称数列
x n x_n x n 发散。
类似地,我们可以定义函数的极限。先定义趋于有限值的极限,这要求函数在不断接近一个
x 0 x_0 x 0 处时,值能无限接近极限:
自变量趋于有限值时函数的极限:若存在常数
A A A 使得对于任意正数
ε \varepsilon ε ,总存在正数
δ \delta δ ,使得当
0 < ∣ x − x 0 ∣ < δ 0<|x-x_0|<\delta 0 < ∣ x − x 0 ∣ < δ ,满足
∣ f ( x ) − A ∣ < ε |f(x)-A|<\varepsilon ∣ f ( x ) − A ∣ < ε ,那么称常数
A A A 是函数
f ( x ) f(x) f ( x ) 当
x → x 0 x\to x_0 x → x 0 时的极限,记作
lim x → x 0 f ( x ) = A \lim_{x\to x_0}f(x)=A lim x → x 0 f ( x ) = A 。
注意,函数在
x 0 x_0 x 0 处可以未定义,只需要在周围有定义,或者说是某个去心邻域。邻域
U ( x 0 , δ ) ( x 0 ∈ R , δ > 0 ) U(x_0,\delta)(x_0\in\mathbb R,\delta>0) U ( x 0 , δ ) ( x 0 ∈ R , δ > 0 ) 为开区间
( x 0 − δ , x 0 + δ ) (x_0-\delta,x_0+\delta) ( x 0 − δ , x 0 + δ ) ,去心邻域
U ˚ ( x 0 , δ ) ( x 0 ∈ R , δ > 0 ) \mathring U(x_0,\delta)(x_0\in\mathbb R,\delta>0) U ˚ ( x 0 , δ ) ( x 0 ∈ R , δ > 0 ) 为
( x 0 − δ , x 0 + δ ) ∖ { x 0 } (x_0-\delta,x_0+\delta)\setminus\{x_0\} ( x 0 − δ , x 0 + δ ) ∖ { x 0 } 。
我们也可以定义左极限和右极限,只从左侧接近或只从右侧接近,将
0 < ∣ x − x 0 ∣ < δ 0<|x-x_0|<\delta 0 < ∣ x − x 0 ∣ < δ 改为
x 0 − δ < x < x 0 x_0-\delta<x<x_0 x 0 − δ < x < x 0 或
x 0 < x < x 0 + δ x_0<x<x_0+\delta x 0 < x < x 0 + δ ,分别记作
lim x → x 0 − f ( x ) = A , lim x → x 0 + f ( x ) = A \lim_{x\to x_0^-}f(x)=A,\lim_{x\to x_0^+}f(x)=A lim x → x 0 − f ( x ) = A , lim x → x 0 + f ( x ) = A 。极限就是要求左极限和右极限都存在且相等。
我们也可以让函数往两边接近无穷。将
0 < ∣ x − x 0 ∣ < δ 0<|x-x_0|<\delta 0 < ∣ x − x 0 ∣ < δ 改为
∣ x ∣ > X |x|>X ∣ x ∣ > X ,其中
X X X 是某个正数,就得到
lim x → ∞ f ( x ) \lim_{x\to\infty}f(x) lim x → ∞ f ( x ) 的定义。同理可以定义
lim x → + ∞ f ( x ) , lim x → − ∞ f ( x ) \lim_{x\to+\infty}f(x),\lim_{x\to-\infty}f(x) lim x → + ∞ f ( x ) , lim x → − ∞ f ( x ) ,改为
x > X x>X x > X 或
x < X x<X x < X 即可。
用极限,我们也可以描述函数趋向于无穷大,将
∣ f ( x ) − A ∣ < ε |f(x)-A|<\varepsilon ∣ f ( x ) − A ∣ < ε 改为
∣ f ( x ) ∣ > M |f(x)|>M ∣ f ( x ) ∣ > M ,其中
M M M 是任意正数。按上面的定义,
f ( x ) f(x) f ( x ) 在
x → x 0 / ∞ x\to x_0/\infty x → x 0 /∞ 时没有极限,但我们仍然称极限是无穷大。此时我们也称
f ( x ) f(x) f ( x ) 是
x → x 0 / ∞ x\to x_0/\infty x → x 0 /∞ 时的无穷大。
对应的,我们已经定义了无穷小,也就是
f ( x ) f(x) f ( x ) 在
x → x 0 / ∞ x\to x_0/\infty x → x 0 /∞ 时极限为
0 0 0 ,称
f ( x ) f(x) f ( x ) 是
x → x 0 / ∞ x\to x_0/\infty x → x 0 /∞ 时的无穷小。显然在同一变化过程中,无穷大的倒数是无穷小,无穷小(不为
0 0 0 )的倒数是无穷大。
极限有以下运算法则,以下性质是显然的:
两个无穷小的和是无穷小;
有界函数与无穷小的乘积是无穷小;
lim ( f ( x ) ± g ( x ) ) = lim f ( x ) ± lim g ( x ) \lim(f(x)\pm g(x))=\lim f(x)\pm\lim g(x) lim ( f ( x ) ± g ( x )) = lim f ( x ) ± lim g ( x ) ;
lim f ( x ) g ( x ) = lim f ( x ) ⋅ lim g ( x ) \lim f(x)g(x)=\lim f(x)\cdot\lim g(x) lim f ( x ) g ( x ) = lim f ( x ) ⋅ lim g ( x ) ;
lim f ( x ) g ( x ) = lim f ( x ) lim g ( x ) ( lim g ( x ) ≠ 0 ) \lim \frac{f(x)}{g(x)}=\frac{\lim f(x)}{\lim g(x)}(\lim g(x)\ne0) lim g ( x ) f ( x ) = l i m g ( x ) l i m f ( x ) ( lim g ( x ) = 0 ) 。
对数列的极限类似。
对函数的复合,也可以找到规律:若
( f ∘ g ) ( x ) (f\circ g)(x) ( f ∘ g ) ( x ) 在
x 0 x_0 x 0 的某去心邻域有定义,
lim x → x 0 / ∞ g ( x ) = u 0 / ∞ , lim u → u 0 / ∞ f ( u ) = A \lim_{x\to x_0/\infty}g(x)=u_0/\infty,\lim_{u\to u_0/\infty}f(u)=A lim x → x 0 /∞ g ( x ) = u 0 /∞ , lim u → u 0 /∞ f ( u ) = A ,且存在
x 0 x_0 x 0 的某去心邻域的
g ( x ) g(x) g ( x ) 都不等于
u 0 u_0 u 0 ,则
lim x → x 0 / ∞ ( f ∘ g ) ( x ) = A \lim_{x\to x_0/\infty}(f\circ g)(x)=A lim x → x 0 /∞ ( f ∘ g ) ( x ) = A 。这说的其实就是将
g ( x ) g(x) g ( x ) 放到自变量上,也是一个向
u 0 u_0 u 0 的逼近。后面的一句特判是防止
x x x 周围形成一个平台,比如
f ( x ) = [ x = 1 ] , g ( x ) = 1 f(x)=[x=1],g(x)=1 f ( x ) = [ x = 1 ] , g ( x ) = 1 ,这样
g ( x ) g(x) g ( x ) 无法在
x 0 x_0 x 0 周围形成一个向
u 0 u_0 u 0 的逼近,因为取到
u 0 u_0 u 0 。
下面讲述极限存在的一些准则:
夹逼准则:若在
x 0 x_0 x 0 的某去心邻域内或
∣ x ∣ > M |x|>M ∣ x ∣ > M 时
g ( x ) ≤ f ( x ) ≤ h ( x ) g(x)\leq f(x)\leq h(x) g ( x ) ≤ f ( x ) ≤ h ( x ) ,且
lim x → x 0 / ∞ g ( x ) = lim x → x 0 / ∞ h ( x ) = A \lim_{x\to x_0/\infty}g(x)=\lim_{x\to x_0/\infty}h(x)=A lim x → x 0 /∞ g ( x ) = lim x → x 0 /∞ h ( x ) = A ,则
lim x → x 0 / ∞ f ( x ) = A \lim_{x\to x_0/\infty}f(x)=A lim x → x 0 /∞ f ( x ) = A 。
容易感性理解。对数列类似。
一个经典例子是
lim x → 0 sin x x = 1 \lim_{x\to0}\frac{\sin x}x=1 lim x → 0 x s i n x = 1 。如下图,我们有一个单位元和一个圆心角
∠ A O C = x ( 0 < x < π 2 ) \angle AOC=x(0<x<\frac\pi2) ∠ A OC = x ( 0 < x < 2 π ) ,有
S △ A O B < S 扇形 A O B < S △ A O C S_{\triangle AOB}<S_{\text{扇形}AOB}<S_{\triangle AOC} S △ A OB < S 扇形 A OB < S △ A OC ,即
sin x 2 < x 2 < tan x 2 , cos x < sin x x < 1 \frac{\sin x}2<\frac x2<\frac{\tan x}2,\cos x<\frac{\sin x}x<1 2 s i n x < 2 x < 2 t a n x , cos x < x s i n x < 1 ,而前后两者在
x → 0 x\to0 x → 0 的极限都是
1 1 1 。
单调有界定理:单调有界数列必有极限。对于函数,若
f ( x ) f(x) f ( x ) 在
x 0 x_0 x 0 的某个左邻域内单调且有界,则
f ( x ) f(x) f ( x ) 在
x 0 x_0 x 0 的左极限存在。
感性理解,单调要求往一个方向,但是有界又要求不能超过
± M \pm M ± M ,所以只能无限接近某个位置而不越过。
经典例子是
lim x → ∞ ( 1 + 1 x ) x = e \lim_{x\to\infty}(1+\frac1x)^x=e lim x → ∞ ( 1 + x 1 ) x = e 。我们先构造
a n = ( 1 + 1 n ) n a_n=(1+\frac1n)^n a n = ( 1 + n 1 ) n ,证明它的极限存在。
首先它单调递增,因为
a n = ∑ i = 0 n C n i 1 n i = ∑ i = 0 n 1 i ! ∏ j = 0 i ( 1 − j n ) a_n=\sum_{i=0}^nC_n^i\frac1{n^i}=\sum_{i=0}^n\frac1{i!}\prod_{j=0}^i(1-\frac jn) a n = ∑ i = 0 n C n i n i 1 = ∑ i = 0 n i ! 1 ∏ j = 0 i ( 1 − n j ) ,每一项都是单调递增的。而且它有界,将其放缩为
∑ i = 0 n 1 i ! ≤ 1 + ∑ i = 0 n 1 2 i < 3 \sum_{i=0}^n\frac1{i!}\leq1+\sum_{i=0}^n\frac1{2^i}<3 ∑ i = 0 n i ! 1 ≤ 1 + ∑ i = 0 n 2 i 1 < 3 。因此它有极限。对原问题,构造
g ( x ) = ( 1 + 1 ⌊ x ⌋ + 1 ) ⌊ x ⌋ , h ( x ) = ( 1 + 1 ⌊ x ⌋ ) ⌊ x ⌋ + 1 g(x)=(1+\frac1{\lfloor x\rfloor+1})^{\lfloor x\rfloor},h(x)=(1+\frac1{\lfloor x\rfloor})^{\lfloor x\rfloor+1} g ( x ) = ( 1 + ⌊ x ⌋ + 1 1 ) ⌊ x ⌋ , h ( x ) = ( 1 + ⌊ x ⌋ 1 ) ⌊ x ⌋ + 1 ,极限都是
e e e ,用夹逼准则即可。
柯西极限存在准则:数列
x n x_n x n 收敛的充要条件是对于任意正数
ε \varepsilon ε ,存在正整数
N N N 使
∀ n , m > N , ∣ x n − x m ∣ < ε \forall n,m>N,|x_n-x_m|<\varepsilon ∀ n , m > N , ∣ x n − x m ∣ < ε 。
必要性显然,设极限是
a a a ,存在
N N N 使
∀ n > N , ∣ x n − a ∣ < ε 2 \forall n>N,|x_n-a|<\frac\varepsilon2 ∀ n > N , ∣ x n − a ∣ < 2 ε 。
感性理解充分性,考虑在
N N N 之后,所有
x n x_n x n 会落在一个长度小于
ε \varepsilon ε 的区间内,且随着
ε \varepsilon ε 的缩小,区间长度也缩小,且趋向
0 0 0 。因此最后区间内会剩一个单点。上述过程也相当于归约到了闭区间套定理。
对于极限,我们可以定义无穷小之间的比较。
在同一个变化过程中,若
lim β α = 0 \lim\frac\beta\alpha=0 lim α β = 0 ,称
β \beta β 是比
α \alpha α 高阶的无穷小,记作
β = o ( α ) \beta=o(\alpha) β = o ( α ) ;
若
lim β α = ∞ \lim\frac\beta\alpha=\infty lim α β = ∞ ,称
β \beta β 是比
α \alpha α 低阶的无穷小;
若
lim β α = c ≠ 0 \lim\frac\beta\alpha=c\ne0 lim α β = c = 0 ,称
β \beta β 与
α \alpha α 是同阶无穷小。特别地,若
c = 1 c=1 c = 1 ,称
β \beta β 与
α \alpha α 是等价无穷小,记作
β ∼ α \beta\sim\alpha β ∼ α ;
若
lim β α k = c ≠ 0 \lim\frac\beta{\alpha^k}=c\ne0 lim α k β = c = 0 ,称
β \beta β 是关于
α \alpha α 的
k k k 阶无穷小。
关于等价无穷小有以下定理:
β \beta β 与
α \alpha α 是等价无穷小的充要条件是
β = α + o ( α ) \beta=\alpha+o(\alpha) β = α + o ( α ) 。
必要性:
lim β − α α = lim ( β α − 1 ) = 0 , β − α = o ( α ) \lim\frac{\beta-\alpha}\alpha=\lim(\frac\beta\alpha-1)=0,\beta-\alpha=o(\alpha) lim α β − α = lim ( α β − 1 ) = 0 , β − α = o ( α ) 。
充分性:
lim β α = lim α + o ( α ) α = lim ( 1 + o ( α ) α ) = 1 \lim\frac\beta\alpha=\lim\frac{\alpha+o(\alpha)}\alpha=\lim(1+\frac{o(\alpha)}\alpha)=1 lim α β = lim α α + o ( α ) = lim ( 1 + α o ( α ) ) = 1 。
若
α ∼ α ~ , β ∼ β ~ \alpha\sim\tilde\alpha,\beta\sim\tilde\beta α ∼ α ~ , β ∼ β ~ ,且
lim α ~ β ~ \lim\frac{\tilde\alpha}{\tilde\beta} lim β ~ α ~ 存在,则
lim α β = lim α ~ β ~ \lim\frac\alpha\beta=\lim\frac{\tilde\alpha}{\tilde\beta} lim β α = lim β ~ α ~ 。
证明:
lim α β = lim α ~ β ~ β β ~ α ~ α = lim α ~ β ~ lim β β ~ lim α ~ α = lim α ~ β ~ \lim\frac\alpha\beta=\lim\frac{\tilde\alpha}{\tilde\beta}\frac\beta{\tilde\beta}\frac{\tilde\alpha}\alpha=\lim\frac{\tilde\alpha}{\tilde\beta}\lim\frac\beta{\tilde\beta}\lim\frac{\tilde\alpha}\alpha=\lim\frac{\tilde\alpha}{\tilde\beta} lim β α = lim β ~ α ~ β ~ β α α ~ = lim β ~ α ~ lim β ~ β lim α α ~ = lim β ~ α ~ 。
通过极限,我们可以刻画函数的连续性,就是两端能向这里的函数值逼近,不能出现断层,即若函数
y = f ( x ) y=f(x) y = f ( x ) 在点
x 0 x_0 x 0 的某一邻域有定义且
lim x → x 0 f ( x ) = f ( x 0 ) \lim_{x\to x_0}f(x)=f(x_0) lim x → x 0 f ( x ) = f ( x 0 ) ,称函数
y = f ( x ) y=f(x) y = f ( x ) 在点
x 0 x_0 x 0 连续。同理可定义左连续和右连续。也可定义在一个区间连续,就是在内部的某个点连续,如果含左端点就在左端点左连续,含右端点就在右端点右连续。
根据极限的四则运算,可以立即得出两个在
x 0 x_0 x 0 连续的函数的和/差/积/分母不为
0 0 0 的商在
x 0 x_0 x 0 连续。
讨论反函数的连续性,易得:若函数
y = f ( x ) y=f(x) y = f ( x ) 在区间
I x I_x I x 单调递增/单调递减且连续,则它的反函数
x = f − 1 ( y ) x=f^{-1}(y) x = f − 1 ( y ) 在区间
I y = { y ∣ y = f ( x ) , x ∈ I x } I_y=\{y\mid y=f(x),x\in I_x\} I y = { y ∣ y = f ( x ) , x ∈ I x } 单调递增/单调递减且连续。直觉上容易理解,这相当于交换
x x x 轴和
y y y 轴。
对复合函数,用复合函数的极限可得:若
( f ∘ g ) ( x ) (f\circ g)(x) ( f ∘ g ) ( x ) 在
x 0 x_0 x 0 的某去心邻域有定义,
u = g ( x ) u=g(x) u = g ( x ) 在
x 0 x_0 x 0 连续且
g ( x 0 ) = u 0 g(x_0)=u_0 g ( x 0 ) = u 0 ,
y = f ( u ) y=f(u) y = f ( u ) 在
u 0 u_0 u 0 连续,则
( f ∘ g ) ( x ) (f\circ g)(x) ( f ∘ g ) ( x ) 在
x 0 x_0 x 0 连续。
综上,我们可以证明初等函数(幂函数、指数函数、对数函数、三角函数、反三角函数)在其定义域内都连续。
关于函数的连续性,有以下几个定理:
有界性与最大值最小值定理:在闭区间上的函数在该区间上有界,且一定能取得它的最大值和最小值。
容易感性理解。这里闭区间是必要的,开区间有可能在端点处左/右极限为无穷大,如
tan x \tan x tan x 在
( − π 2 , π 2 ) (-\frac\pi2,\frac\pi2) ( − 2 π , 2 π ) 。
介值定理:设函数
f ( x ) f(x) f ( x ) 在
[ a , b ] [a,b] [ a , b ] 连续,且
f ( a ) = A , f ( b ) = B f(a)=A,f(b)=B f ( a ) = A , f ( b ) = B ,则对于任意的
min ( A , B ) < C < max ( A , B ) \min(A,B)<C<\max(A,B) min ( A , B ) < C < max ( A , B ) ,存在
a < ξ < b , f ( ξ ) = C a<\xi<b,f(\xi)=C a < ξ < b , f ( ξ ) = C 。
几何意义就是函数值从
A A A 连续变化到
B B B ,必然经过中间每个值。
导数与微分
导数描述了一个函数在某点的瞬时增长率,或者说切线斜率。其定义为
f ′ ( x 0 ) = lim h → 0 f ( x 0 + h ) − f ( x 0 ) h f'(x_0)=\lim_{h\to0}\frac{f(x_0+h)-f(x_0)}h f ′ ( x 0 ) = lim h → 0 h f ( x 0 + h ) − f ( x 0 ) 。若这个极限存在,称函数
y = f ( x ) y=f(x) y = f ( x ) 在
x 0 x_0 x 0 处可导。连续是可导的充分条件(不是必要条件,比如考虑
∣ x ∣ |x| ∣ x ∣ 在
x 0 = 0 x_0=0 x 0 = 0 )。以下是几个常用导数:
( C ) ′ = 0 (C)'=0 ( C ) ′ = 0
( x n ) ′ ( n ∈ N ∗ ) = lim h → 0 ( x + h ) n − x n h = lim h → 0 ∑ i = 0 n − 1 C n i x i h n − i − 1 = n x n − 1 \begin{aligned}&(x^n)'(n\in\mathbb N^\ast)\\&=\lim_{h\to 0}\frac{(x+h)^n-x^n}h\\&=\lim_{h\to0}\sum_{i=0}^{n-1}C_n^ix^ih^{n-i-1}\\&=nx^{n-1}\end{aligned} ( x n ) ′ ( n ∈ N ∗ ) = h → 0 lim h ( x + h ) n − x n = h → 0 lim i = 0 ∑ n − 1 C n i x i h n − i − 1 = n x n − 1
( x μ ) ′ ( μ ∈ R , x 0 ≠ 0 ) = lim h → 0 ( x + h ) μ − x μ h = lim h → 0 x μ − 1 ( 1 + h x ) μ − 1 h x = lim h → 0 x μ − 1 ( 1 + x ) μ − 1 x = lim h → 0 x μ − 1 ( 1 + x ) μ − 1 ln ( 1 + x ) μ μ ln ( 1 + x ) x = x μ − 1 lim t → 0 t ln ( t + 1 ) lim x → 0 μ ln ( 1 + x ) x ( t = ( 1 + x ) μ − 1 ) = x μ − 1 μ \begin{aligned}&(x^\mu)'(\mu\in\mathbb R,x_0\ne0)\\&=\lim_{h\to0}\frac{(x+h)^\mu-x^\mu}h\\&=\lim_{h\to0}x^{\mu-1}\frac{(1+\frac hx)^\mu-1}{\frac hx}\\&=\lim_{h\to0}x^{\mu-1}\frac{(1+x)^\mu-1}x\\&=\lim_{h\to0}x^{\mu-1}\frac{(1+x)^\mu-1}{\ln(1+x)^\mu}\frac{\mu\ln(1+x)}x\\&=x^{\mu-1}\lim_{t\to0}\frac t{\ln(t+1)}\lim_{x\to0}\frac{\mu\ln(1+x)}x(t=(1+x)^\mu-1)\\&=x^{\mu-1}\mu\end{aligned} ( x μ ) ′ ( μ ∈ R , x 0 = 0 ) = h → 0 lim h ( x + h ) μ − x μ = h → 0 lim x μ − 1 x h ( 1 + x h ) μ − 1 = h → 0 lim x μ − 1 x ( 1 + x ) μ − 1 = h → 0 lim x μ − 1 ln ( 1 + x ) μ ( 1 + x ) μ − 1 x μ ln ( 1 + x ) = x μ − 1 t → 0 lim ln ( t + 1 ) t x → 0 lim x μ ln ( 1 + x ) ( t = ( 1 + x ) μ − 1 ) = x μ − 1 μ
( sin x ) ′ = lim h → 0 sin ( x + h ) − sin x h = lim h → 0 2 cos ( x + h 2 ) sin h 2 h = lim h → 0 cos ( x + h 2 ) lim h → 0 sin h 2 h 2 = cos x \begin{aligned}&(\sin x)'\\&=\lim_{h\to0}\frac{\sin(x+h)-\sin x}h\\&=\lim_{h\to0}\frac{2\cos(x+\frac h2)\sin\frac h2}h\\&=\lim_{h\to0}\cos(x+\frac h2)\lim_{h\to0}\frac{\sin\frac h2}{\frac h2}\\&=\cos x\end{aligned} ( sin x ) ′ = h → 0 lim h sin ( x + h ) − sin x = h → 0 lim h 2 cos ( x + 2 h ) sin 2 h = h → 0 lim cos ( x + 2 h ) h → 0 lim 2 h sin 2 h = cos x
( cos x ) ′ = lim h → 0 cos ( x + h ) − cos h h = lim h → 0 − 2 sin ( x + h 2 ) sin h 2 h = lim h → 0 − sin ( x + h 2 ) lim h → 0 sin h 2 h 2 = − sin x \begin{aligned}&(\cos x)'\\&=\lim_{h\to0}\frac{\cos(x+h)-\cos h}h\\&=\lim_{h\to0}\frac{-2\sin(x+\frac h2)\sin\frac h2}h\\&=\lim_{h\to0}-\sin(x+\frac h2)\lim_{h\to0}\frac{\sin\frac h2}{\frac h2}\\&=-\sin x\end{aligned} ( cos x ) ′ = h → 0 lim h cos ( x + h ) − cos h = h → 0 lim h − 2 sin ( x + 2 h ) sin 2 h = h → 0 lim − sin ( x + 2 h ) h → 0 lim 2 h sin 2 h = − sin x
( a x ) ′ ( a > 0 , a ≠ 1 ) = lim h → 0 a x + h − a x h = a x lim h → 0 a h − 1 h = a x lim t → 0 t log a ( 1 + t ) ( t = a h − 1 ) = a x lim t → 0 1 log a ( 1 + t ) 1 t = a x log a e = a x ln a \begin{aligned}&(a^x)'(a>0,a\ne1)\\&=\lim_{h\to0}\frac{a^{x+h}-a^x}h\\&=a^x\lim_{h\to0}\frac{a^h-1}h\\&=a^x\lim_{t\to0}\frac t{\log_a(1+t)}(t=a^h-1)\\&=a^x\lim_{t\to0}\frac1{\log_a(1+t)^{\frac1t}}\\&=\frac{a^x}{\log_ae}\\&=a^x\ln a\end{aligned} ( a x ) ′ ( a > 0 , a = 1 ) = h → 0 lim h a x + h − a x = a x h → 0 lim h a h − 1 = a x t → 0 lim log a ( 1 + t ) t ( t = a h − 1 ) = a x t → 0 lim log a ( 1 + t ) t 1 1 = log a e a x = a x ln a
( e x ) ′ = e x (e^x)'=e^x ( e x ) ′ = e x
( log a x ) ′ ( a > 0 , a ≠ 1 ) = lim h → 0 log a ( x + h ) − log a x h = lim h → 0 log a x + h x h = 1 x lim h → 0 log a ( 1 + h x ) h x = 1 x log a e = 1 x ln a \begin{aligned}&(\log_a x)'(a>0,a\ne1)\\&=\lim_{h\to0}\frac{\log_a(x+h)-\log_ax}h\\&=\lim_{h\to0}\frac{\log_a\frac{x+h}x}h\\&=\frac1x\lim_{h\to0}\frac{\log_a(1+\frac hx)}{\frac hx}\\&=\frac1x\log_ae\\&=\frac1{x\ln a}\end{aligned} ( log a x ) ′ ( a > 0 , a = 1 ) = h → 0 lim h log a ( x + h ) − log a x = h → 0 lim h log a x x + h = x 1 h → 0 lim x h log a ( 1 + x h ) = x 1 log a e = x ln a 1
( ln x ) ′ = 1 x (\ln x)'=\frac1x ( ln x ) ′ = x 1
函数有以下求导法则:
( u ± v ) ′ = u ′ ± v ′ (u\pm v)'=u'\pm v' ( u ± v ) ′ = u ′ ± v ′ ;
( u v ) ′ = u ′ v + u v ′ (uv)'=u'v+uv' ( uv ) ′ = u ′ v + u v ′ ;
证明:
( u ( x ) v ( x ) ) ′ = lim h → 0 u ( x + h ) v ( x + h ) − u ( x ) v ( x ) h = lim h → 0 v ( x + h ) ( u ( x + h ) − u ( x ) ) + u ( x ) ( v ( x + h ) − v ( x ) ) h = lim h → 0 v ( x + h ) lim h → 0 u ( x + h ) − u ( x ) h + lim h → 0 u ( x ) ( v ( x + h ) − v ( x ) ) h = u ′ ( x ) v ( x ) + v ′ ( x ) u ( x ) \begin{aligned}&(u(x)v(x))'\\&=\lim_{h\to0}\frac{u(x+h)v(x+h)-u(x)v(x)}h\\&=\lim_{h\to0}\frac{v(x+h)(u(x+h)-u(x))+u(x)(v(x+h)-v(x))}h\\&=\lim_{h\to0}v(x+h)\lim_{h\to0}\frac{u(x+h)-u(x)}h+\lim_{h\to0}\frac{u(x)(v(x+h)-v(x))}h\\&=u'(x)v(x)+v'(x)u(x)\end{aligned} ( u ( x ) v ( x ) ) ′ = h → 0 lim h u ( x + h ) v ( x + h ) − u ( x ) v ( x ) = h → 0 lim h v ( x + h ) ( u ( x + h ) − u ( x )) + u ( x ) ( v ( x + h ) − v ( x )) = h → 0 lim v ( x + h ) h → 0 lim h u ( x + h ) − u ( x ) + h → 0 lim h u ( x ) ( v ( x + h ) − v ( x )) = u ′ ( x ) v ( x ) + v ′ ( x ) u ( x )
( u v ) ′ = u ′ v − u v ′ v 2 (\frac uv)'=\frac{u'v-uv'}{v^2} ( v u ) ′ = v 2 u ′ v − u v ′ ;
证明:
( u ( x ) v ( x ) ) ′ = lim h → 0 u ( x + h ) v ( x + h ) − u ( x ) v ( x ) h = lim h → 0 u ( x + h ) v ( x ) − u ( x ) v ( x + h ) v ( x + h ) v ( x ) h = lim h → 0 v ( x ) ( u ( x + h ) − u ( x ) ) − u ( x ) ( v ( x + h ) − v ( x ) ) v ( x + h ) v ( x ) h = u ′ ( x ) v ( x ) + u ( x ) v ′ ( x ) v ( x ) 2 \begin{aligned}&\left(\frac{u(x)}{v(x)}\right)'\\&=\lim_{h\to0}\frac{\frac{u(x+h)}{v(x+h)}-\frac{u(x)}{v(x)}}h\\&=\lim_{h\to0}\frac{u(x+h)v(x)-u(x)v(x+h)}{v(x+h)v(x)h}\\&=\lim_{h\to0}\frac{v(x)(u(x+h)-u(x))-u(x)(v(x+h)-v(x))}{v(x+h)v(x)h}\\&=\frac{u'(x)v(x)+u(x)v'(x)}{v(x)^2}\end{aligned} ( v ( x ) u ( x ) ) ′ = h → 0 lim h v ( x + h ) u ( x + h ) − v ( x ) u ( x ) = h → 0 lim v ( x + h ) v ( x ) h u ( x + h ) v ( x ) − u ( x ) v ( x + h ) = h → 0 lim v ( x + h ) v ( x ) h v ( x ) ( u ( x + h ) − u ( x )) − u ( x ) ( v ( x + h ) − v ( x )) = v ( x ) 2 u ′ ( x ) v ( x ) + u ( x ) v ′ ( x )
对反函数,有:若函数
y = f ( x ) y=f(x) y = f ( x ) 在区间
I x I_x I x 单调、可导且
f ′ ( x ) ≠ 0 f'(x)\ne0 f ′ ( x ) = 0 ,那么它的反函数
x = f − 1 ( y ) x=f^{-1}(y) x = f − 1 ( y ) 在区间
I y = { y ∣ y = f ( x ) , x ∈ I x } I_y=\{y\mid y=f(x),x\in I_x\} I y = { y ∣ y = f ( x ) , x ∈ I x } 内可导且
f − 1 ( x ) ′ = 1 f ′ ( y ) f^{-1}(x)'=\frac1{f'(y)} f − 1 ( x ) ′ = f ′ ( y ) 1 。同理,反函数可以看成交换
x x x 轴和
y y y 轴。
对复合函数,有:若
u = g ( x ) u=g(x) u = g ( x ) 在点
x x x 处可导且
y = f ( u ) y=f(u) y = f ( u ) 在点
u = g ( x ) u=g(x) u = g ( x ) 处可导,那么
y = ( f ∘ g ) ( x ) y=(f\circ g)(x) y = ( f ∘ g ) ( x ) 在点
x x x 处可导且
( f ∘ g ) ( x ) = f ′ ( u ) g ′ ( x ) (f\circ g)(x)=f'(u)g'(x) ( f ∘ g ) ( x ) = f ′ ( u ) g ′ ( x ) 。这也是好理解的,
x x x 输入
g g g 后在
u u u 周围产生了变化速度为
g ′ ( x ) g'(x) g ′ ( x ) 的点列,套一层
f f f 后变成了
f ′ ( u ) g ′ ( x ) f'(u)g'(x) f ′ ( u ) g ′ ( x ) 。
导数可以嵌套,我们定义高阶导数
f ( n ) ( x ) f^{(n)}(x) f ( n ) ( x ) 为导数迭代
n n n 次。
对于一个函数,如果它在点
x x x 处可导,我们就可以用切线拟合函数的曲线,这就是说,用
f ′ ( x ) Δ x f'(x)\Delta x f ′ ( x ) Δ x 估计
Δ y \Delta y Δ y 。
此时有
lim Δ x → 0 Δ y Δ x = f ′ ( x 0 ) \lim_{\Delta x\to0}\frac{\Delta y}{\Delta x}=f'(x_0) lim Δ x → 0 Δ x Δ y = f ′ ( x 0 ) ,则
Δ y Δ x = f ′ ( x 0 ) + α ( lim Δ x → 0 α = 0 ) \frac{\Delta y}{\Delta x}=f'(x_0)+\alpha(\lim_{\Delta x\to0}\alpha=0) Δ x Δ y = f ′ ( x 0 ) + α ( lim Δ x → 0 α = 0 ) ,移项可得
Δ y = f ′ ( x 0 ) Δ x + α Δ x = Δ y = f ′ ( x 0 ) Δ x + o ( Δ x ) \Delta y=f'(x_0)\Delta x+\alpha\Delta x=\Delta y=f'(x_0)\Delta x+o(\Delta x) Δ y = f ′ ( x 0 ) Δ x + α Δ x = Δ y = f ′ ( x 0 ) Δ x + o ( Δ x ) 。这也是微分的定义:
设函数
y = f ( x ) y=f(x) y = f ( x ) 在某区间内有定义,
x 0 , x 0 + Δ x x_0,x_0+\Delta x x 0 , x 0 + Δ x 在这个区间内,若函数的增量
Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x_0+\Delta x)-f(x_0) Δ y = f ( x 0 + Δ x ) − f ( x 0 ) 可表示为
Δ y + A Δ x + o ( Δ x ) \Delta y+A\Delta x+o(\Delta x) Δ y + A Δ x + o ( Δ x ) ,其中
A A A 是与
Δ x \Delta x Δ x 无关的常数,那么称函数
y = f ( x ) y=f(x) y = f ( x ) 在
x 0 x_0 x 0 处可微,
A Δ x A\Delta x A Δ x 是函数
y = f ( x ) y=f(x) y = f ( x ) 在点
x 0 x_0 x 0 相应于自变量增量
x x x 的微分,记作
d y \mathrm dy d y 。可导是可微的充要条件,且一定满足
A = f ′ ( x 0 ) A=f'(x_0) A = f ′ ( x 0 ) 。这也说明导数是函数的微分除以自变量的微分,即
d y d x \frac{\mathrm dy}{\mathrm dx} d x d y 。
根据导数的运算,容易推出微分的运算。
下面介绍微分的几个中值定理:
先引入费马引理:设函数
f ( x ) f(x) f ( x ) 在点
x 0 x_0 x 0 的某邻域
U ( x 0 ) U(x_0) U ( x 0 ) 有定义且在
x 0 x_0 x 0 处可导,若
x 0 x_0 x 0 是
f ( x ) f(x) f ( x ) 在
U ( x 0 ) U(x_0) U ( x 0 ) 的最大值或最小值,则
f ′ ( x 0 ) = 0 f'(x_0)=0 f ′ ( x 0 ) = 0 。
这就是说,在这个函数的局部极值,切线是水平线。证明考虑左极限和右极限一个
≥ 0 \geq0 ≥ 0 一个
≤ 0 \leq0 ≤ 0 。称导数为
0 0 0 的点为函数的驻点。
罗尔定理:若函数
f ( x ) f(x) f ( x ) 在
[ a , b ] [a,b] [ a , b ] 上连续且在
( a , b ) (a,b) ( a , b ) 内可导,且
f ( a ) = f ( b ) f(a)=f(b) f ( a ) = f ( b ) ,则存在
a < ξ < b a<\xi<b a < ξ < b 使
f ′ ( ξ ) = 0 f'(\xi)=0 f ′ ( ξ ) = 0 。
取不是端点的最大/最小值,用费马引理即可。
我们可以拓展到
f ( a ) ≠ f ( b ) f(a)\ne f(b) f ( a ) = f ( b ) 的情况,得到拉格朗日中值定理:若函数
f ( x ) f(x) f ( x ) 在
[ a , b ] [a,b] [ a , b ] 上连续且在
( a , b ) (a,b) ( a , b ) 内可导,则存在
a < ξ < b a<\xi<b a < ξ < b 使
f ′ ( ξ ) = f ( a ) − f ( b ) a − b f'(\xi)=\frac{f(a)-f(b)}{a-b} f ′ ( ξ ) = a − b f ( a ) − f ( b ) 。
证明将函数偏移,减掉直线
A B AB A B ,对
g ( x ) = f ( x ) − x f ( a ) − f ( b ) a − b g(x)=f(x)-x\frac{f(a)-f(b)}{a-b} g ( x ) = f ( x ) − x a − b f ( a ) − f ( b ) 使用罗尔定理即可。实际意义是在
( a , b ) (a,b) ( a , b ) 内能找到一点的切线平行于直线
A B AB A B 。
将这个式子变形,得到
Δ y = f ′ ( x + θ Δ x ) ⋅ Δ x \Delta y=f'(x+\theta\Delta x)\cdot\Delta x Δ y = f ′ ( x + θ Δ x ) ⋅ Δ x ,其中
θ \theta θ 是某个
0 < θ < 1 0<\theta<1 0 < θ < 1 的值。这也被称为有限增量定理。
这可以导出,若函数
f ( x ) f(x) f ( x ) 在
[ a , b ] [a,b] [ a , b ] 上连续且在
( a , b ) (a,b) ( a , b ) 内可导且导数恒为
0 0 0 ,那么
f ( x ) f(x) f ( x ) 在区间
[ a , b ] [a,b] [ a , b ] 是常数。任取
a ≤ x 1 < x 2 ≤ b a\leq x_1<x_2\leq b a ≤ x 1 < x 2 ≤ b ,都存在
f ′ ( ξ ) = f ( x 1 ) − f ( x 2 ) x 1 − x 2 = 0 , f ( x 1 ) = f ( x 2 ) f'(\xi)=\frac{f(x_1)-f(x_2)}{x_1-x_2}=0,f(x_1)=f(x_2) f ′ ( ξ ) = x 1 − x 2 f ( x 1 ) − f ( x 2 ) = 0 , f ( x 1 ) = f ( x 2 ) 。
我们还可以把
a − b a-b a − b 换成另一个函数,得到柯西中值定理: 若函数
f ( x ) , F ( x ) f(x),F(x) f ( x ) , F ( x ) 在
[ a , b ] [a,b] [ a , b ] 上连续且在
( a , b ) (a,b) ( a , b ) 内可导,且
F ′ ( x ) ≠ 0 ( a < x < b ) F'(x)\ne0(a<x<b) F ′ ( x ) = 0 ( a < x < b ) ,则存在
a < ξ < b a<\xi<b a < ξ < b 使
f ′ ( ξ ) F ′ ( ξ ) = f ( a ) − f ( b ) F ( a ) − F ( b ) \frac{f'(\xi)}{F'(\xi)}=\frac{f(a)-f(b)}{F(a)-F(b)} F ′ ( ξ ) f ′ ( ξ ) = F ( a ) − F ( b ) f ( a ) − f ( b ) 。
感性理解,这相当于把自变量换成一个
F ( x ) F(x) F ( x ) ,可以前后移动,变成了一条曲线。构造
g ( x ) = f ( x ) − f ( a ) − f ( b ) F ( a ) − F ( b ) F ( x ) g(x)=f(x)-\frac{f(a)-f(b)}{F(a)-F(b)}F(x) g ( x ) = f ( x ) − F ( a ) − F ( b ) f ( a ) − f ( b ) F ( x ) 用罗尔定理即可。
通过柯西中值定理,可以导出一种求
0 0 \frac00 0 0 型极限的方式。
洛必达法则:若
lim x → a / ∞ f ( x ) = lim x → a / ∞ F ( x ) = 0 \lim_{x\to a/\infty}f(x)=\lim_{x\to a/\infty}F(x)=0 lim x → a /∞ f ( x ) = lim x → a /∞ F ( x ) = 0 ,在点
a / ∞ a/\infty a /∞ 的某去心邻域内
f ′ ( x ) , F ′ ( x ) f'(x),F'(x) f ′ ( x ) , F ′ ( x ) 存在且
F ′ ( x ) ≠ 0 F'(x)\ne0 F ′ ( x ) = 0 且
lim x → a / ∞ f ′ ( x ) F ′ ( x ) \lim_{x\to a/\infty}\frac{f'(x)}{F'(x)} lim x → a /∞ F ′ ( x ) f ′ ( x ) 存在或为无穷大,则
lim x → a / ∞ f ( x ) F ( x ) = lim x → a / ∞ f ′ ( x ) F ′ ( x ) \lim_{x\to a/\infty}\frac{f(x)}{F(x)}=\lim_{x\to a/\infty}\frac{f'(x)}{F'(x)} lim x → a /∞ F ( x ) f ( x ) = lim x → a /∞ F ′ ( x ) f ′ ( x ) 。
证明:我们钦定
f ( a ) = F ( a ) = 0 f(a)=F(a)=0 f ( a ) = F ( a ) = 0 ,当
x x x 从
a a a 左侧/右侧逼近时,我们可以将
f ( x ) F ( x ) \frac{f(x)}{F(x)} F ( x ) f ( x ) 替换为
f ′ ( ξ ) F ′ ( ξ ) \frac{f'(\xi)}{F'(\xi)} F ′ ( ξ ) f ′ ( ξ ) ,这个
ξ \xi ξ 在
x , a x,a x , a 中间向
a a a 逼近。
用导数可以在某个点
x 0 x_0 x 0 拟合函数。考虑用更高阶多项式去拟合,我们尝试构造一个多项式
p n ( x − x 0 ) = ∑ i = 0 n a i ( x − x 0 ) i p_n(x-x_0)=\sum_{i=0}^na_i(x-x_0)^i p n ( x − x 0 ) = ∑ i = 0 n a i ( x − x 0 ) i 使得
p n p_n p n 的
0 ∼ n 0\sim n 0 ∼ n 阶导在
x 0 x_0 x 0 处和
f f f 的
0 ∼ n 0\sim n 0 ∼ n 阶导相等。导
i i i 次后,低于
i i i 的项都没了,高于
i i i 的项有个
x − x 0 x-x_0 x − x 0 也为
0 0 0 ,第
i i i 项变成
i ! a i i!a_i i ! a i ,则
a i = f ( i ) ( x 0 ) i ! a_i=\frac{f^{(i)}(x_0)}{i!} a i = i ! f ( i ) ( x 0 ) 。下面我们研究误差,设
f ( x ) = R n ( x ) + ∑ i = 0 n f ( i ) i ! ( x − x 0 ) i f(x)=R_n(x)+\sum_{i=0}^n\frac{f^{(i)}}{i!}(x-x_0)^i f ( x ) = R n ( x ) + ∑ i = 0 n i ! f ( i ) ( x − x 0 ) i 。
根据上面有
R n ( k ) ( x ) = 0 ( 0 ≤ k ≤ n ) R_n^{(k)}(x)=0(0\leq k\leq n) R n ( k ) ( x ) = 0 ( 0 ≤ k ≤ n ) 。对
lim x → x 0 R n ( x ) ( x − x 0 ) n \lim_{x\to x_0}\frac{R_n(x)}{(x-x_0)^n} lim x → x 0 ( x − x 0 ) n R n ( x ) ,我们可以洛必达
n n n 次,上面是
0 0 0 ,下面是
n ! n! n ! 。因此
R n ( x ) = o ( ( x − x 0 ) n ) R_n(x)=o((x-x_0)^n) R n ( x ) = o (( x − x 0 ) n ) 。
假设
f ( x ) f(x) f ( x ) 在
x 0 x_0 x 0 的某邻域内有
n + 1 n+1 n + 1 阶导数,我们还可以用中值定理继续分析。此时有
R n ( k ) ( x ) = 0 ( 0 ≤ k ≤ n ) , R n ( n + 1 ) ( x ) = f ( n + 1 ) ( x ) R_n^{(k)}(x)=0(0\leq k\leq n),R_n^{(n+1)}(x)=f^{(n+1)}(x) R n ( k ) ( x ) = 0 ( 0 ≤ k ≤ n ) , R n ( n + 1 ) ( x ) = f ( n + 1 ) ( x ) 。对
R n ( x ) ( x − x 0 ) n + 1 \frac{R_n(x)}{(x-x_0)^{n+1}} ( x − x 0 ) n + 1 R n ( x ) ,在
[ x 0 , x ] [x_0,x] [ x 0 , x ] 用柯西中值定理,找到
R n ′ ( ξ 1 ) n ( ξ 1 − x 0 ) n = R n ( x ) ( x − x 0 ) n + 1 \frac{R_n'(\xi_1)}{n(\xi_1-x_0)^{n}}=\frac{R_n(x)}{(x-x_0)^{n+1}} n ( ξ 1 − x 0 ) n R n ′ ( ξ 1 ) = ( x − x 0 ) n + 1 R n ( x ) 。我们对
R n ′ ( ξ 1 ) n ( ξ 1 − x 0 ) n \frac{R_n'(\xi_1)}{n(\xi_1-x_0)^{n}} n ( ξ 1 − x 0 ) n R n ′ ( ξ 1 ) 在
[ x 0 , ξ 1 ] [x_0,\xi_1] [ x 0 , ξ 1 ] 再用一次柯西中值定理找到
ξ 2 \xi_2 ξ 2 。用
n + 1 n+1 n + 1 次,会得到一个
x 0 < ξ < x x_0<\xi<x x 0 < ξ < x 满足
R n ( x ) ( x − x 0 ) n + 1 = R n ( n + 1 ) ) ( ξ ) ( n + 1 ) ! \frac{R_n(x)}{(x-x_0)^{n+1}}=\frac{R_n^{(n+1)})(\xi)}{(n+1)!} ( x − x 0 ) n + 1 R n ( x ) = ( n + 1 )! R n ( n + 1 ) ) ( ξ ) ,则
R n ( x ) = R n ( n + 1 ) ) ( ξ ) ( n + 1 ) ! ( x − x 0 ) n + 1 R_n(x)=\frac{R_n^{(n+1)})(\xi)}{(n+1)!}(x-x_0)^{n+1} R n ( x ) = ( n + 1 )! R n ( n + 1 ) ) ( ξ ) ( x − x 0 ) n + 1 。