专栏文章

再谈概率期望(一)

算法·理论参与者 6已保存评论 5

文章操作

快速查看文章及其快照的属性,并进行相关操作。

当前评论
5 条
当前快照
1 份
快照标识符
@mk74j01s
此快照首次捕获于
2026/01/10 01:02
2 个月前
此快照最后确认于
2026/03/08 01:25
3 天前
查看原文

绪言

本文为笔者学习概率期望搜集资料有所感悟后所写的文章,如有勘误欢迎指正。
前置知识:小学二年级[^bidao]就会学的集合

概率期望(一)

随机事件

对于一个随机现象,对每一个不能再细分的结果为样本点,所有样本点的集合为样本空间 Ω\Omega。一个随机事件 AA[^jian] 为 Ω\Omega 的一个子集,若干个样本点的集合。
一个随机事件 AA 发生当且仅当随机现象的结果 ω\omega 满足 ωA\omega\in A
以抛骰子的点数举例。此时,Ω={1,2,3,4,5,6}\Omega= \{1,2,3,4,5,6\},则骰子点数小于等于 22 的随机事件 A={1,2}A=\{1,2\}

事件域

事件域 FF 即为所有可能事件的的集合,其必须包含 \varnothing 且对于补运算、可数并封闭。可以证明,在这种情况下,FF 对于可数交也是封闭的。
形式化定义为:
  • F\varnothing\in F
  • AFAFA\in F\Rightarrow \overline{A}\in F
  • A1,A2An,AFi=1nAiF\forall A_1,A_2 \dots A_n,\forall A\in F\Rightarrow \bigcup_{i=1}^{n} A_i\in F

定义

定义事件 AA 的概率为 P(A)=AΩP(A)=\frac{|A|}{|\Omega|}
其中 A|A| 表示对于该集合大小的度量。[^du]
对于任意随机事件 A,BΩA,B\subset \Omega,有
  • 单调性:若 ABA\subset B,则有 P(A)P(B)P(A)\le P(B)
  • 容斥原理P(A+B)=P(A)+P(B)P(AB)P(A+B)=P(A)+P(B)-P(AB),其中 A+BA+B 表示 ABA\cup BABAB 表示 ABA\cap B
本文暂时只讨论古典概型,因此,略过有关概率空间公理化定义的内容,具体读者可自行查看。

条件概率

若已知事件 AA 发生,在此条件下事件 BB 发生的概率称为条件概率,记作 P(BA)P(B|A)
条件概率的公式为 P(BA)=P(AB)P(A)P(B|A)=\frac{P(AB)}{P(A)}
此公式有意义当且仅当 P(A)>0P(A)>0,因此,讨论条件概率 P(BA)P(B|A) 时,我们默认 P(A)>0P(A)>0
由此,可以推出两个公式:
  • 概率乘法公式P(AB)=P(A)P(BA)P(AB)=P(A)P(B|A)
  • 全概率公式:若一组事件 A1,A2AnA_1,A_2\dots A_nΩ\Omega 的一个划分[^huafen],则有 P(B)=i=1nP(Ai)P(BAi)P(B)=\sum^{n}_{i=1}P(A_i)P(B|A_i)

独立性

P(AB)=P(A)P(B)P(AB)=P(A)P(B) 时,我们就说这两个随机事件独立。这可以从直观上理解:此时若 P(A)>0P(A)>0,则 P(BA)=P(B)P(B|A)=P(B),这等于就是说随机事件 AA 是否发生并不影响随机事件 BB 的发生概率。
推广出去,对于 A1,A2AnA_1,A_2\dots A_n,称其独立当且仅当 P(i=1nAi)=i=1nP(Ai)P(\bigcap_{i=1}^{n} A_i)=\prod_{i=1}^{n}P(A_i)
但笔者认为,这样定义独立性会存在一定的问题,即两两独立的事件不一定合起来独立,如 OI Wiki 中的反例所言。
考虑将其抽象。令 Ω={1,2,3,4},A={1,4},B={2,4},C={3,4}\Omega=\{1,2,3,4\},A=\{1,4\},B=\{2,4\},C=\{3,4\}。此时,计算结果与原文相同。
修改使 Ω{1,2,3,4,5},A{1,4,5}\Omega\gets \{1,2,3,4,5\},A\gets \{1,4,5\}
此时,P(A)=35,P(B)=P(C)=25,P(AB)=P(AC)=P(BC)=P(ABC)=15P(A)=\frac{3}{5},P(B)=P(C)=\frac{2}{5},P(AB)=P(AC)=P(BC)=P(ABC)=\frac{1}{5}
由此可以看出,原文所举的反例只是一种数值上的巧合。要让两两独立能推出全部独立,只需修改独立的定义为事件集合两两不交即可。
但坏消息是:现实中只能通过反复实验得到概率的数值,因此这种独立定义不无其道理。

Bayes 公式

P(A|B) &=\frac{P(A)P(B|A)}{P(B)}\\ &=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})} \end{aligned}$$ 这里只给出贝叶斯公式的简化形式,其完整形式可由全概率公式推出。 这个公式的形式化证明十分简单(读者甚至可以在一分钟内自行完成),但其中蕴含的思想却并不好理解。 为了解释这个公式的意义,需要一些理(kou)解(hu)。 ### 先验概率与后验概率 $$P(A|B)=\frac{P(B|A)}{P(B)}P(A)$$ 若将 $P(A)$ 称为**先验概率**,$P(A|B)$ 称为**后验概率**,则此公式是一个能将**先验概率**和**后验概率**间相互转化的工具。 $\frac{P(B|A)}{P(B)}$ 可以理解为是事件 $B$ 的发生的情况中,有**伴随**[^bansui]事件 $A$ 一起发生的对它的提升有多大。而**先验概率**乘上它就相当于是在 $A$ 中找到了那些对 $B$ 的影响的部分。 或者从集合的意义理解 $$\begin{aligned} \frac{P(B|A)}{P(B)}&=\frac{\frac{|A\cap B|}{|A|}}{\frac{|B|}{\Omega}}\\ &=\frac{|A\cap B||\Omega|}{|A||B|} \end{aligned}$$ 这就相当于“提取”出 $A$ 和 $B$ 中那些相同的部分,并以此计算先验概率与后验概率之间的关系。比如 $A\cap B=\varnothing$,此时即说明事件 $A,B$ 互斥,那么后验概率 $P(A|B)=0$。 ### 从一个例子出发 从特殊到一般,再从一般到特殊。如果抽象的论述无法理解,那就找一个具体的例子。 想象有 $1000$ 名 OIer,其中有 $1\%$ 得了 P 话病。他们都接受了模拟赛检查,其中 $9$ 个 P 话病人得到了正确的阳性结果,剩下 $1$ 个则是假阴性。剩下的人里面,有 $89$ 个假阳性,$901$ 个正确的阴性结果。 我经过了检测,结果为阳性,求得了 P 话病的概率 $P(A)$。 根据具体数据,容易算出阳性里面真病人的占比为 $\frac{9}{9+89}=\frac{9}{98}$,因为概率均等,所以 $P(A)=\frac{9}{98}$,约为 $\frac{1}{11}$。 阳性的组成部分,可以分为两个,分别是检出的**真阳性**和**假阳性**,前者在病人的占比为**灵敏度**,后者在非病人的占比为**假阳性率**。 在本次测验中,**灵敏度**为 $90\%$,**假阳性率**约为 $91\%$。这就引出一个悖论:为什么准确度这么高,阳性里真病人的概率却这么低? 这是因为,检测不是作为阳性的概率,而是**更新**了阳性的概率;或者说,使**先验概率**转化为了**后验概率**。 用**真阳性**在病人中的占比除以**总阳性**在所有人中的占比,即可得到所有阳性中有多少的**真阳性**。 而这个占比的占比,其实就是贝叶斯公式中的 $\frac{P(B|A)}{P(B)}$,也就是通常所说的**贝叶斯因子**,其说明了应该如何将**先验概率**转化为**后验概率**。 ## 后记 就先讲到这里,期望和实际做题的部分等更新吧。 如果仍有疑惑,可以翻阅下方所列的参考文献。 ~~点赞收藏加关注,一键三连不迷路。~~ ## 参考文献 1. [胡渊鸣,《浅析信息学竞赛中概率论的基础与应用》,《国家集训队2013论文集》](https://chxulong.oss-cn-shenzhen.aliyuncs.com/%E5%9B%BD%E5%AE%B6%E9%9B%86%E8%AE%AD%E9%98%9F%E8%AE%BA%E6%96%87/%E5%9B%BD%E5%AE%B6%E9%9B%86%E8%AE%AD%E9%98%9F2013%E8%AE%BA%E6%96%87%E9%9B%86/2013%20%E5%B9%B4%E4%BF%A1%E6%81%AF%E5%AD%A6%E5%A5%A5%E6%9E%97%E5%8C%B9%E5%85%8B%E4%B8%AD%E5%9B%BD%E5%9B%BD%E5%AE%B6%E9%98%9F%E5%80%99%E9%80%89%E9%98%9F%E5%91%98%E8%AE%BA%E6%96%87%E9%9B%86.pdf)[^2013] 2. [Grant Sanderson,Bayes theorem, and making probability intuitive](https://www.bilibili.com/video/BV1R7411a76r)[^3b1b] 3. [Grant Sanderson,Bayes theorem, The medical test paradox: Can redesigning Bayes rule help?](https://www.bilibili.com/video/BV1Ei4y1F72M)[^yi] 4. [OI Wiki, 概率论](https://oi-wiki.org/math/probability/basic-conception/) 5. [长河劫,【数学史】初等概率论的起源](https://www.bilibili.com/video/BV1tnYCzeEGE) 本文遵循 [CC BY-SA 4.0](https://creativecommons.org/licenses/by-sa/4.0/deed.zh-hans) 协议[^cc]。 [^3b1b]:原链接在[这里](https://youtu.be/HZGCoVF3YvM),但我上不了油管 QAQ。 [^cc]:我也不知道这是什么,总之挺高级的就写这里了。 [^2013]:没有空格是因为原标题如此。 [^jian]:随机事件通常用大写字母表示。 [^du]:对于有限集,其为集合的元素个数;对于无限集则为一个特定的函数。这涉及到部分[测度论](https://baike.baidu.com/item/%E6%B5%8B%E5%BA%A6%E8%AE%BA/918407)的内容,暂时不做讨论 ~~(其实是因为我也不会)~~。 [^bidao]:毕导小学。 [^huafen]:对于 $A_1,A_2\dots A_n$,若其满足 $\forall x\ne y,A_x\cap A_y=\varnothing$ 且 $\bigcup^{n}_{i=1}A_i=U$,则称其为 $U$ 的一个划分。 [^bansui]:不能简单说成是因果关系,因为不知道两者是谁造成谁又或者有一个相同的原因。 [^yi]:[同上](https://youtu.be/lG4VkPoG3ko)。

评论

5 条评论,欢迎与作者交流。

正在加载评论...