专栏文章

高中数学笔记 - 统计 & 概率 & 组合

学习·文化课参与者 1已保存评论 0

文章操作

快速查看文章及其快照的属性,并进行相关操作。

当前评论
0 条
当前快照
1 份
快照标识符
@miqoovbv
此快照首次捕获于
2025/12/04 08:14
3 个月前
此快照最后确认于
2025/12/04 08:14
3 个月前
查看原文

统计

简单随机抽样:1.1. 个体数有限 2.2. 逐个抽取 3.3. 被抽到的概率相等。
例:1010 个个体里抽一个容量为 nn 的样本, 某个个体 AA 第一次被抽到的可能性为 ?第二次被抽到的可能性为 ?
第一次:110\frac{1}{10} 第二次:910×19=110\frac{9}{10}\times\frac{1}{9}=\frac{1}{10}
随机数表题:范围 [0,39][0,39],有以下随机数表,从第 11 行第 33 列开始,选出的数依次为 36,33,26,16,11,14,1036,33,26,16,11,14,10
034703474373437386368636964796473661366146984698
637163716233623326162616804580456011601114101410
总体平均数:xˉ=1ni=1nxi  \bar{x}=\frac{1}{n}\displaystyle\sum_{i=1}^{n}x_i\ \ \text{} 中位数:{xn2x mod 21xn2+xn2+12x mod 20  \begin{cases}x_{\lceil\frac{n}{2}\rceil} & x\ \mathrm{mod}\ 2\equiv 1 \\ \frac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2} & x\ \mathrm{mod}\ 2\equiv 0\end{cases}\ \ \text{}
众数:出现次数最多的数据,不一定唯一,也不一定有众数。
极差:max{xi}min{xi}    \max{\set{x_i}}-\min{\set{x_i}}\ \ \ \ \text{} 标准差:s=1ni=1n(xixˉ)2s=\sqrt{\frac{1}{n}\displaystyle\sum_{i=1}^{n}(x_i-\bar{x})^2}
方差:s2=1ni=1n(xixˉ)2=1ni=1n(xi22xixˉ+xˉ2)=1ni=1nxi21ni=1n2xixˉ+1ni=1nxˉ2=1ni=1nxi22xˉ2+xˉ2=1ni=1nxi2xˉ2\begin{aligned}方差:s^2&=\frac{1}{n}\displaystyle\sum_{i=1}^{n}(x_i-\bar{x})^2=\frac{1}{n}\displaystyle\sum_{i=1}^{n}(x_i^2-2x_i\bar{x}+\bar{x}^2)=\frac{1}{n}\displaystyle\sum_{i=1}^{n}x_i^2-\frac{1}{n}\displaystyle\sum_{i=1}^{n}2x_i\bar{x}+\frac{1}{n}\displaystyle\sum_{i=1}^{n}\bar{x}^2\\&=\frac{1}{n}\displaystyle\sum_{i=1}^{n}x_i^2-2\bar{x}^2+\bar{x}^2=\frac{1}{n}\displaystyle\sum_{i=1}^{n}x_i^2-\bar{x}^2\end{aligned}
若采用分层随机抽样,分 nn 层,样本数 m1,m2,,mnm_1,m_2,\dots,m_n,平均值 x1,x2,,xnx_1,x_2,\dots,x_n\\ 则样本平均数 xˉ=i=1nmixij=1nmj\bar{x}=\displaystyle\sum_{i=1}^{n}\frac{m_i\cdot x_i}{\displaystyle\sum_{j=1}^{n}m_j},注意样本平均数 \neq 总体平均数。
分层随机抽样需按比例分配:总体中第 m 层个体数总体中第 n 层个体数=样本中第 m 层个体数样本中第 n 层个体数\frac{总体中第\ m\ 层个体数}{总体中第\ n\ 层个体数}=\frac{样本中第\ m\ 层个体数}{样本中第\ n\ 层个体数}样本中第 m 层个体数总体中第 m 层个体数=样本容量总体容量\frac{样本中第\ m\ 层个体数}{总体中第\ m\ 层个体数}=\frac{样本容量}{总体容量}
pp 百分位数:数据中至少有 p%p\% 的数据 \leq 这个值,至少有 (100p)%(100-p)\% 的数 \geq 这个值。
2525 百分位数:第一四分位数 / 下四分位数;第 7575 百分位数:第三四分位数 / 上四分位数;第 5050 百分位数:中位数。
已知数据求第 pp 百分位数:1. 从小到大排序,令 i=n×p%i=n\times p\% 2. {ans=ai+ai+12i=ians=aiii\begin{cases}\text{ans}=\frac{a_i+a_{i+1}}{2} & \lfloor i \rfloor = i \\ \text{ans}=a_{\lceil i \rceil} & \lfloor i \rfloor \neq i \end{cases}
格式要求:{[a,b)的频率<x%[a,c)的频率>x%    \begin{cases}[a,b) 的频率 <x\% \\ [a,c)的频率>x\%\end{cases}\impliesxx 百分位数在 [b,c)[b,c) 内。
nn 层构成样本的方差:s2=i=1nwi[si2+(xˉixˉ)2]s^2=\displaystyle\sum_{i=1}^{n}w_i[s_i^2+(\bar{x}_i-\bar{x})^2],其中 xˉi\bar{x}_i 为样本中不同层的平均数,si2s_i^2 为不同层的方差,wiw_i 为相应的权重( 该层样本数占总样本的多少,wi<1w_i<1 )。
特别地,只有 22 层时,若:
11mm 个数xˉ\bar xs2s^2
22nn 个数yˉ\bar yt2t^2
则总平均数 aˉ=mxˉ+nyˉm+n\displaystyle\bar a=\frac{m\bar x+n\bar y}{m+n},总方差 b2=ms2+nt2+m(xˉaˉ)2+n(yˉaˉ)2m+n\displaystyle b^2=\frac{ms^2+nt^2+m(\bar x-\bar a)^2+n(\bar y-\bar a)^2}{m+n}
若数据 x1,x2,,xnx_1,x_2,\dots,x_n 的平均数 xˉ\bar x,方差 s2s^2,标准差 ss,则数据 mx1+a,mx2+a,,mxn+amx_1+a,mx_2+a,\dots,mx_n+a 的平均数 mxˉ+am\bar{x}+a,方差 s2m2s^2m^2,标准差 smsm
线性回归问题的一般步骤:
  1. 列表 + 画散点图
    xxx1x_1x2x_2\dotsxnx_n
    yyy1y_1y2y_2\dotsyny_n
  2. 通过公式求 b^,a^\hat b,\hat a
b^=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2=i=1nxiyinxˉyˉi=1nxi2nxˉ2             a^=yˉb^xˉ\hat b=\frac{\displaystyle\sum_{i=1}^{n}(x_i-\bar x)(y_i-\bar y)}{\displaystyle\sum_{i=1}^{n}(x_i-\bar x)^2}=\frac{\displaystyle\sum_{i=1}^{n} x_iy_i-n\bar x\bar y}{\displaystyle\sum_{i=1}^{n}x_i^2-n\bar x^2}\ \ \ \ \ \ \ \ \ \ \ \ \ \hat a=\bar y-\hat b\bar x
  1. 根据直线方程一定过 xˉ,yˉ\bar x,\bar y 得出 y^=b^x+a^\hat y=\hat bx+\hat a
如果散点均匀分布在回归直线的两侧,那么回归效果就好
如果 b^>0\hat b > 0 则两变量正相关,反之则负相关,也可利用样本相关系数 rr 来判断。
1r1,r-1\leq r\leq 1,|r| 越接近 11,回归效果越好;r>0r>0 则正相关,r<0r<0 则负相关。
r=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2i=1n(yiyˉ)2=i=1nxiyinxˉyˉi=1nxi2nxˉ2i=1nyi2nyˉ2r=\frac{\displaystyle\sum_{i=1}^{n}(x_i-\bar x)(y_i-\bar y)}{\sqrt{\displaystyle\sum_{i=1}^{n}(x_i-\bar x)^2\sum_{i=1}^{n}(y_i-\bar y)^2}}=\frac{\displaystyle\sum_{i=1}^{n} x_iy_i-n\bar x\bar y}{\sqrt{\displaystyle\sum_{i=1}^{n}x_i^2-n\bar x^2}\sqrt{\displaystyle\sum_{i=1}^{n}y_i^2-n\bar y^2}}
非线性回归方程:转化为线性回归方程。
  1. 幂函数型:y=c1xn+c2 (ny=c_1x^{n}+c_2\ (n 一般为 12\frac{1}{2}2)2)
    变换:令 t=xn,b=c1,a=c2t=x^n,b=c_1,a=c_2,则 y=bt+ay=bt+a
  2. 指数型:y=c1ec2xy=c_1e^{c_2x}
    变换:两边取对数并令 z=lny,a=lnc1,b=c2z=\ln y,a=\ln c_1,b=c_2,则 z=bx+az=bx+a
变换后,需转化原函数关系,一般用相关指数来看拟合效果的强弱。( 注:非线性的不能用相关系数 rr

概率

基本概念

  • 随机试验:对随机现象的实现和观察,用 EE 表示。
  • 样本点:EE 的每个可能的基本结果,用 ω\omega 表示。
  • 样本空间:全体 ω\omega 的集合,用 Ω\Omega 表示。
  • 有限样本空间:若一个随机试验有 nn 个可能结果 ω1,ω2,,ωn\omega_1,\omega_2,\dots,\omega_n,则称样本空间 Ω={ω1,ω2,,ωn}\Omega=\set{\omega_1,\omega_2,\dots,\omega_n} 为有限样本空间 \\( 即 Ω\Omega 为有限集 )。
  • 随机事件:Ω\Omega 的子集,简称事件,用大写字母 A,B,C,A,B,C,\dots 表示,当且仅当 AA 中的某个样本点出现时,称事件 AA 发生。
  • 基本事件:只包含一个样本点的事件。
  • 必然事件:Ω\Omega 作为自身的子集,包含了所有样本点,在每次试验中总有一个样本点发生,即 Ω\Omega 总会发生。
  • 不可能事件:\varnothing 不含任何样本点,在每次试验中都不会发生,必然事件与不可能事件不具有随机性。

事件的关系和运算

事件的关系含义符号表示
包含AA 发生     B\implies B 发生ABA\subseteq B
并事件 / 和事件AABB 至少一个发生ABA\bigcup BA+BA+B
交事件 / 积事件AABB 同时发生ABA\bigcap BABAB
互斥 / 互不相容AABB 不能同时发生AB=A\bigcap B=\varnothing
互为独立AABB 有且仅有一个发生AB=A\bigcap B=\varnothingAB=ΩA\bigcup B=\Omega
如果 A,BA,B 互斥,记 Aˉ,Bˉ\bar{A},\bar{B} 分别为 A,BA,B 的对立事件。
ABA\subseteq BBAB\subseteq A,则事件 AA 和事件 BB 相等,A=BA=B
对于三个事件 A,B,CA,B,CABCA\bigcup B\bigcup CA+B+CA+B+C 表示 A,B,CA,B,C 至少一个发生,其余同理。

古典概型

  • 满足有限性( 有限样本空间 )、等可能性。
  • EE 为古典概型,样本空间 Ω\Omega 包含 nn 个样本点,事件 AA 包含其中的 kk 个样本点,则事件 AA 的概率为 P(A)=kn=n(A)n(Ω)n(A),n(Ω)P(A)=\frac{k}{n}=\frac{n(A)}{n(\Omega)} \\ n(A),n(\Omega) 表示事件 AA 和样本空间 Ω\Omega 包含的样本点个数。

概率的基本性质

  1. A,0P(A)1\forall A,0\leq P(A)\leq 1
  2. 必然事件 Ω\Omega 概率为 P(Ω)=1P(\Omega)=1,不可能事件 \varnothing 概率为 P()=0P(\varnothing)=0
  3. A,BA,B 互斥,则 P(AB)=P(A)+P(B)P(A\bigcup B)=P(A)+P(B)\\ 推广:若 A1,A2,,AmA_1,A_2,\dots,A_m 两两互斥,则 P(A1A2Am)=i=1mP(Ai)P(A_1\bigcup A_2\bigcup\dots\bigcup A_m)=\displaystyle\sum_{i=1}^{m}P(A_i)
  4. A,BA,B 对立,则 P(B)=1P(A),P(A)=1P(B)P(B)=1-P(A),P(A)=1-P(B);若 P(A)+P(B)=1P(A)+P(B)=1,则 A,BA,B 不一定对立。
  5. ABA\subseteq B,则 P(A)P(B)P(A)\leq P(B)( 概率的单调性 )。
  6. A,BA,B 为随机试验中的两个事件,则 P(AB)=P(A)+P(B)P(AB)P(A\bigcup B)=P(A)+P(B)-P(A\bigcap B) ( 容斥原理 )。
  7. 对任意 22 个事件 A,BA,B,若 P(AB)=P(A)P(B)P(AB)=P(A)P(B),则 AABB 相互独立,记 A,BA,B 的对立事件分别为 Aˉ,Bˉ\bar{A},\bar{B} \\ 因事件 A,BA,B 的发生互不影响,则 AABˉ\bar{B}Aˉ\bar{A}BBAˉ\bar{A}Bˉ\bar{B} 也相互独立。
  8. A,B,CA,B,C 两两独立,则 P(ABC)P(A)P(B)P(C)P(ABC)\neq P(A)P(B)P(C)
  9. AˉBˉ=AB,AˉBˉ=AB\bar{A}\cap\bar{B}=\overline{A\cup B},\bar{A}\cup\bar{B}=\overline{A\cap B}
事件含义事件表示概率A,BA,B 互斥A,BA,B 相互独立
AABB 至少一个发生ABA\bigcup BP(AB)P(A\bigcup B)P(A)+P(B)P(A)+P(B)1P(Aˉ)P(Bˉ)1-P(\bar{A})P(\bar{B})
AABB 同时发生ABABP(AB)P(AB)00P(A)P(B)P(A)P(B)
AABB 都不发生AˉBˉ\bar{A}\bar{B}P(AˉBˉ)P(\bar{A}\bar{B})1[P(A)+P(B)]1-[P(A)+P(B)]P(Aˉ)P(Bˉ)P(\bar{A})P(\bar{B})
AABB 只有一个发生ABˉ+AˉBA\bar{B}+\bar{A}BP(ABˉAˉB)P(A\bar{B}\bigcup\bar{A}B)P(A)+P(B)P(A)+P(B)P(A)P(Bˉ)+P(Aˉ)P(B)P(A)P(\bar{B})+P(\bar{A})P(B)

组合计数

  • 加法原理( 分类 ),乘法原理( 分步 )。
  • 排列:从 nn 个不同元素中取 mm 个排成一列,考虑顺序,产生不同排列的数量为 Anm\\ A_n^m ( 也可记作 PnmP_n^m ) =n!(nm)!=n×(n1)×(n2)××(nm+1)=\frac{n!}{(n-m)!}=n\times(n-1)\times(n-2)\times\dots\times(n-m+1)
  • 组合:从 nn 个不同元素中取 mm 个排成一列,不考虑顺序,产生不同组合的数量为 (mn)=Cnm=n!m!(nm)!=n×(n1)××(nm+1)m×(m1)××2×1\\ \begin{pmatrix}m \\ n\end{pmatrix}=C_n^m=\frac{n!}{m!(n-m)!}=\frac{n\times(n-1)\times\dots\times(n-m+1)}{m\times(m-1)\times\dots\times 2\times 1}
    性质:
    1. Cnm=CnnmC_n^m=C_n^{n-m}
    2. Cnm=Cn1m+Cn1m1C_n^m=C_{n-1}^m+C_{n-1}^{m-1}
    3. i=0nCni=Cn0+Cn1+Cn2++Cnn=2n\displaystyle\sum_{i=0}^{n}C_n^i=C_n^0+C_n^1+C_n^2+\dots+C_n^n=2^n
  • 组合数的应用
  1. nn完全相同的元素,要求将其分为 kk 组,保证每组至少有一个元素,一共有多少种分法?\\ 考虑拿 k1k-1 块板子插入到 nn 个元素两两形成的 n1n-1 个空里面。\\ 答案为 (n1k1)\begin{pmatrix}n-1 \\ k-1\end{pmatrix} \\ 本质是求 x1+x2++xk=nx_1+x_2+\dots+x_k=n 的正整数解的组数。\\
  2. 若问题变换一下,每组允许为空?\\ 考虑创造条件转化成有限制的问题一,先借 kk 个元素过来,在这 n+kn+k 个元素形成的 n+k1n+k-1 个空里面插板。\\ 答案为 (n+k1k1)=(n+k1n)\begin{pmatrix}n+k-1 \\ k-1\end{pmatrix}=\begin{pmatrix}n+k-1 \\ n\end{pmatrix} \\ 本质是求 x1+x2++xk=nx_1+x_2+\dots+x_k=n 的非负整数解的组数。
  3. 再扩展一步,要求对于第 ii 组,至少要分到 aia_i 个元素呢?( ain\sum a_i\leq n\\ 本质是求 x1+x2++xk=nx_1+x_2+\dots+x_k=n 的解的数目。\\ 类比无限制的情况,我们借 ai\sum a_i 个元素过来,保证第 ii 组能至少分到 aia_i 个,也就是令 xi=xiaix_i'=x_i-a_ixi0x_i'\geq 0 \\ 得到新方程 (x1+a1)+(x2+a2)++(xk+ak)=n(x_1'+a_1)+(x_2'+a_2)+\dots+(x_k'+a_k)=n 转化为 i=1kxi=nai\displaystyle\sum_{i=1}^{k}x_i'=n-\sum a_i 答案为 (nai+k1k1)=(nai+k1nai)\begin{pmatrix}n-\sum a_i+k-1\\k-1 \end{pmatrix}=\begin{pmatrix}n-\sum a_i+k-1 \\ n-\sum a_i\end{pmatrix}
  4. 11 ~ nnnn 个自然数选 kk 个,这 kk 个数中两两都不相邻的组合有 (nk+1k)\begin{pmatrix}n-k+1 \\ k\end{pmatrix} 种。
  • 二项式定理:
(a+b)n=k=0nCnkakbnk       (ax+by)n=k=0nCnkakbnkxkynk(a+b)^n=\displaystyle\sum_{k=0}^{n}C_n^ka^kb^{n-k}\ \ \ \ \ \ \ (ax+by)^n=\displaystyle\sum_{k=0}^{n}C_n^ka^kb^{n-k}x^ky^{n-k}
证明可利用数学归纳法,利用 (nk)+(nk1)=(n+1k)\begin{pmatrix}n \\ k\end{pmatrix}+\begin{pmatrix}n \\ k-1\end{pmatrix}=\begin{pmatrix}n+1 \\ k\end{pmatrix}
若将二项式定理扩展成多项式的形式,有:
(x1+x2++xt)n=满足 n1+n2++nt=n 的非负整数解(nn1,n2,,nt)x1n1x2n2xtnt(x_1+x_2+\dots+x_t)^n=\displaystyle\sum_{满足\ n_1+n_2+\dots+n_t=n\ 的非负整数解}\begin{pmatrix}n \\ n_1,n_2,\dots,n_t\end{pmatrix}x_1^{n_1}x_2^{n_2}\dots x_t^{n_t}
其中 (nn1,n2,,nt)\begin{pmatrix}n \\ n_1,n_2,\dots,n_t\end{pmatrix} 是多项式系数,满足 (nn1,n2,,nt)=tn\displaystyle\sum \begin{pmatrix}n \\ n_1,n_2,\dots,n_t\end{pmatrix}=t^n
  • 范德蒙德卷积
i=0k(ni)(mki)=(n+mk)\displaystyle\sum_{i=0}^{k}\begin{pmatrix}n \\ i\end{pmatrix}\begin{pmatrix}m \\ k-i\end{pmatrix}=\begin{pmatrix}n+m \\ k\end{pmatrix}
  • Lucas\text{Lucas} 定理:( pp 是质数,1mn1\leq m\leq n
CnmCn mod pm mod p×Cn/pm/p (mod p)C_n^m\equiv C_{n\ \text{mod}\ p}^{m\ \text{mod}\ p}\times C_{n/p}^{m/p}\ (\text{mod}\ p)
  • Catalan\text{Catalan} 数列:给定 nn00nn11,它们按照某种顺序排成长度为 2n2n 的序列,满足任意前缀中 00 的个数都不少于 11 的个数的序列的数量为:
Catn=C2nnn+1Cat_n=\frac{C_{2n}^n}{n+1}
nn1122334455667788991010
CatnCat_n1122551414424213213242942914301430486248621679616796
以下问题都与 Catalan\text{Catalan} 数有关:
  1. nn 个左括号和 nn 个右括号组成的合法括号序列的数量为 CatnCat_n
  2. 1,2,,n1,2,\dots,n 经过一个栈,形成的合法出栈序列的数量为 CatnCat_n
  3. nn 个节点构成的不同二叉树的数量为 CatnCat_nnn 个节点的 mm 叉树有 (nmn1)n\frac{\begin{pmatrix}nm \\ n-1\end{pmatrix}}{n}
  4. 在平面直角坐标系上,每一步只能向上或向右走,从 (0,0)(0,0) 走到 (n,n)(n,n) 并且两个端点外不接触直线 y=xy=x 的路线数量为 2Catn12Cat_{n-1}
  5. 对于一个凸多边形的顶点数为 nnCatn2Cat_{n-2} 代表所有可能的三角剖分的数量。
  • 容斥原理:设 S1,S2,,SnS_1,S_2,\dots,S_n 为有限集合,S|S| 表示集合 SS 的大小,则:
i=1nSi=i=1nSi1i<jnSiSj+1i<j<knSiSjSk++(1)n+1S1Sn|\displaystyle\bigcup_{i=1}^{n}S_i|=\displaystyle\sum_{i=1}^{n}|S_i|-\displaystyle\sum_{1\leq i<j\leq n}|S_i\bigcap S_j|+\displaystyle\sum_{1\leq i<j<k\leq n}|S_i\bigcap S_j\bigcap S_k|+\dots+(-1)^{n+1}|S_1\bigcap\dots\bigcap S_n|
  • 第 1 类 Stirling\mathrm{Stirling} 数:11 ~ nn 的排列有 mm 个环:
S1(n,m)=S1(n1,m1)+S1(n1,m)×(n1)S_1(n,m)=S_1(n-1,m-1)+S_1(n-1,m)\times(n-1)
  • 第 2 类 Stirling\mathrm{Stirling} 数:nn 个不同的球放入 mm 个相同盒子且盒子非空:
S2(n,m)=S2(n1,m1)+S2(n1,m)×mS_2(n,m)=S_2(n-1,m-1)+S_2(n-1,m)\times m
  • 错排数:11 ~ nn 的排列,第 ii 个位置上均不为 ii
D(n)=(n1)(D(n1)+D(n2))=n×D(n1)+(1)nD(n)=(n-1)(D(n-1)+D(n-2))=n\times D(n-1)+(-1)^n

评论

0 条评论,欢迎与作者交流。

正在加载评论...