再谈概率期望（一）

绪言

本文为笔者学习概率期望搜集资料有所感悟后所写的文章，如有勘误欢迎指正。

前置知识：小学二年级[^bidao]就会学的集合。

概率期望（一）

随机事件

对于一个随机现象，对每一个不能再细分的结果为样本点，所有样本点的集合为样本空间

\Omega

。一个随机事件

A

[^jian] 为

\Omega

的一个子集，若干个样本点的集合。

一个随机事件

A

发生当且仅当随机现象的结果

\omega

满足

\omega\in A

。

以抛骰子的点数举例。此时，

\Omega= \{1,2,3,4,5,6\}

，则骰子点数小于等于

2

的随机事件

A=\{1,2\}

。

事件域

F

即为所有可能事件的的集合，其必须包含

\varnothing

且对于补运算、可数并封闭。可以证明，在这种情况下，

F

对于可数交也是封闭的。

形式化定义为：

$\varnothing\in F$ ；
$A\in F\Rightarrow \overline{A}\in F$ ；
$\forall A_1,A_2 \dots A_n,\forall A\in F\Rightarrow \bigcup_{i=1}^{n} A_i\in F$ 。

定义

定义事件

A

的概率为

P(A)=\frac{|A|}{|\Omega|}

其中

|A|

表示对于该集合大小的度量。[^du]

对于任意随机事件

A,B\subset \Omega

，有

单调性：若 $A\subset B$ ，则有 $P(A)\le P(B)$ 。
容斥原理： $P(A+B)=P(A)+P(B)-P(AB)$ ，其中 $A+B$ 表示 $A\cup B$ ， $AB$ 表示 $A\cap B$ 。

本文暂时只讨论古典概型，因此，略过有关概率空间和公理化定义的内容，具体读者可自行查看。

条件概率

若已知事件 $A$ 发生，在此条件下事件 $B$ 发生的概率称为条件概率，记作 $P(B|A)$ 。

条件概率的公式为

P(B|A)=\frac{P(AB)}{P(A)}

此公式有意义当且仅当

P(A)>0

，因此，讨论条件概率

P(B|A)

时，我们默认

P(A)>0

。

由此，可以推出两个公式：

概率乘法公式： $P(AB)=P(A)P(B|A)$
全概率公式：若一组事件 $A_1,A_2\dots A_n$ 为 $\Omega$ 的一个划分[^huafen]，则有 $P(B)=\sum^{n}_{i=1}P(A_i)P(B|A_i)$

独立性

当

P(AB)=P(A)P(B)

时，我们就说这两个随机事件独立。这可以从直观上理解：此时若

P(A)>0

，则

P(B|A)=P(B)

，这等于就是说随机事件

A

是否发生并不影响随机事件

B

的发生概率。

推广出去，对于

A_1,A_2\dots A_n

，称其独立当且仅当

P(\bigcap_{i=1}^{n} A_i)=\prod_{i=1}^{n}P(A_i)

上文为参照 OI Wiki 内容所写。

但笔者认为，这样定义独立性会存在一定的问题，即两两独立的事件不一定合起来独立，如 OI Wiki 中的反例所言。

考虑将其抽象。令

\Omega=\{1,2,3,4\},A=\{1,4\},B=\{2,4\},C=\{3,4\}

。此时，计算结果与原文相同。

修改使

\Omega\gets \{1,2,3,4,5\},A\gets \{1,4,5\}

。

此时，

P(A)=\frac{3}{5},P(B)=P(C)=\frac{2}{5},P(AB)=P(AC)=P(BC)=P(ABC)=\frac{1}{5}

。

由此可以看出，原文所举的反例只是一种数值上的巧合。要让两两独立能推出全部独立，只需修改独立的定义为事件集合两两不交即可。

但坏消息是：现实中只能通过反复实验得到概率的数值，因此这种独立定义不无其道理。

Bayes 公式

P(A|B) &=\frac{P(A)P(B|A)}{P(B)}\\ &=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})} \end{aligned}$$ 这里只给出贝叶斯公式的简化形式，其完整形式可由全概率公式推出。 这个公式的形式化证明十分简单（读者甚至可以在一分钟内自行完成），但其中蕴含的思想却并不好理解。 为了解释这个公式的意义，需要一些理（kou）解（hu）。 ### 先验概率与后验概率 $$P(A|B)=\frac{P(B|A)}{P(B)}P(A)$$ 若将 $P(A)$ 称为**先验概率**，$P(A|B)$ 称为**后验概率**，则此公式是一个能将**先验概率**和**后验概率**间相互转化的工具。 $\frac{P(B|A)}{P(B)}$ 可以理解为是事件 $B$ 的发生的情况中，有**伴随**[^bansui]事件 $A$ 一起发生的对它的提升有多大。而**先验概率**乘上它就相当于是在 $A$ 中找到了那些对 $B$ 的影响的部分。 或者从集合的意义理解 $$\begin{aligned} \frac{P(B|A)}{P(B)}&=\frac{\frac{|A\cap B|}{|A|}}{\frac{|B|}{\Omega}}\\ &=\frac{|A\cap B||\Omega|}{|A||B|} \end{aligned}$$ 这就相当于“提取”出 $A$ 和 $B$ 中那些相同的部分，并以此计算先验概率与后验概率之间的关系。比如 $A\cap B=\varnothing$，此时即说明事件 $A,B$ 互斥，那么后验概率 $P(A|B)=0$。 ### 从一个例子出发 从特殊到一般，再从一般到特殊。如果抽象的论述无法理解，那就找一个具体的例子。 想象有 $1000$ 名 OIer，其中有 $1\%$ 得了 P 话病。他们都接受了模拟赛检查，其中 $9$ 个 P 话病人得到了正确的阳性结果，剩下 $1$ 个则是假阴性。剩下的人里面，有 $89$ 个假阳性，$901$ 个正确的阴性结果。 我经过了检测，结果为阳性，求得了 P 话病的概率 $P(A)$。 根据具体数据，容易算出阳性里面真病人的占比为 $\frac{9}{9+89}=\frac{9}{98}$，因为概率均等，所以 $P(A)=\frac{9}{98}$，约为 $\frac{1}{11}$。 阳性的组成部分，可以分为两个，分别是检出的**真阳性**和**假阳性**，前者在病人的占比为**灵敏度**，后者在非病人的占比为**假阳性率**。 在本次测验中，**灵敏度**为 $90\%$，**假阳性率**约为 $91\%$。这就引出一个悖论：为什么准确度这么高，阳性里真病人的概率却这么低？ 这是因为，检测不是作为阳性的概率，而是**更新**了阳性的概率；或者说，使**先验概率**转化为了**后验概率**。 用**真阳性**在病人中的占比除以**总阳性**在所有人中的占比，即可得到所有阳性中有多少的**真阳性**。 而这个占比的占比，其实就是贝叶斯公式中的 $\frac{P(B|A)}{P(B)}$，也就是通常所说的**贝叶斯因子**，其说明了应该如何将**先验概率**转化为**后验概率**。 ## 后记 就先讲到这里，期望和实际做题的部分等更新吧。 如果仍有疑惑，可以翻阅下方所列的参考文献。 ~~点赞收藏加关注，一键三连不迷路。~~ ## 参考文献 1. [胡渊鸣，《浅析信息学竞赛中概率论的基础与应用》，《国家集训队2013论文集》](https://chxulong.oss-cn-shenzhen.aliyuncs.com/%E5%9B%BD%E5%AE%B6%E9%9B%86%E8%AE%AD%E9%98%9F%E8%AE%BA%E6%96%87/%E5%9B%BD%E5%AE%B6%E9%9B%86%E8%AE%AD%E9%98%9F2013%E8%AE%BA%E6%96%87%E9%9B%86/2013%20%E5%B9%B4%E4%BF%A1%E6%81%AF%E5%AD%A6%E5%A5%A5%E6%9E%97%E5%8C%B9%E5%85%8B%E4%B8%AD%E5%9B%BD%E5%9B%BD%E5%AE%B6%E9%98%9F%E5%80%99%E9%80%89%E9%98%9F%E5%91%98%E8%AE%BA%E6%96%87%E9%9B%86.pdf)[^2013] 2. [Grant Sanderson，Bayes theorem, and making probability intuitive](https://www.bilibili.com/video/BV1R7411a76r)[^3b1b] 3. [Grant Sanderson，Bayes theorem, The medical test paradox: Can redesigning Bayes rule help?](https://www.bilibili.com/video/BV1Ei4y1F72M)[^yi] 4. [OI Wiki， 概率论](https://oi-wiki.org/math/probability/basic-conception/) 5. [长河劫，【数学史】初等概率论的起源](https://www.bilibili.com/video/BV1tnYCzeEGE) 本文遵循 [CC BY-SA 4.0](https://creativecommons.org/licenses/by-sa/4.0/deed.zh-hans) 协议[^cc]。 [^3b1b]:原链接在[这里](https://youtu.be/HZGCoVF3YvM)，但我上不了油管 QAQ。 [^cc]:我也不知道这是什么，总之挺高级的就写这里了。 [^2013]:没有空格是因为原标题如此。 [^jian]:随机事件通常用大写字母表示。 [^du]:对于有限集，其为集合的元素个数；对于无限集则为一个特定的函数。这涉及到部分[测度论](https://baike.baidu.com/item/%E6%B5%8B%E5%BA%A6%E8%AE%BA/918407)的内容，暂时不做讨论 ~~（其实是因为我也不会）~~。 [^bidao]:毕导小学。 [^huafen]:对于 $A_1,A_2\dots A_n$，若其满足 $\forall x\ne y,A_x\cap A_y=\varnothing$ 且 $\bigcup^{n}_{i=1}A_i=U$，则称其为 $U$ 的一个划分。 [^bansui]:不能简单说成是因果关系，因为不知道两者是谁造成谁又或者有一个相同的原因。 [^yi]:[同上](https://youtu.be/lG4VkPoG3ko)。

再谈概率期望（一）

文章操作

绪言

概率期望（一）

随机事件

事件域

定义

条件概率

独立性

Bayes 公式

相关推荐

评论

再谈概率期望（一）