专栏文章
再谈概率期望(一)
算法·理论参与者 6已保存评论 5
文章操作
快速查看文章及其快照的属性,并进行相关操作。
- 当前评论
- 5 条
- 当前快照
- 1 份
- 快照标识符
- @mk74j01s
- 此快照首次捕获于
- 2026/01/10 01:02 2 个月前
- 此快照最后确认于
- 2026/03/08 01:25 3 天前
绪言
本文为笔者学习概率期望搜集资料有所感悟后所写的文章,如有勘误欢迎指正。
前置知识:小学二年级[^bidao]就会学的集合。
概率期望(一)
随机事件
对于一个随机现象,对每一个不能再细分的结果为样本点,所有样本点的集合为样本空间 。一个随机事件 [^jian] 为 的一个子集,若干个样本点的集合。
一个随机事件 发生当且仅当随机现象的结果 满足 。
以抛骰子的点数举例。此时,,则骰子点数小于等于 的随机事件 。
事件域
事件域 即为所有可能事件的的集合,其必须包含 且对于补运算、可数并封闭。可以证明,在这种情况下, 对于可数交也是封闭的。
形式化定义为:
- ;
- ;
- 。
定义
定义事件 的概率为
其中 表示对于该集合大小的度量。[^du]
对于任意随机事件 ,有
- 单调性:若 ,则有 。
- 容斥原理:,其中 表示 , 表示 。
条件概率
若已知事件 发生,在此条件下事件 发生的概率称为条件概率,记作 。
条件概率的公式为
此公式有意义当且仅当 ,因此,讨论条件概率 时,我们默认 。
由此,可以推出两个公式:
- 概率乘法公式:
- 全概率公式:若一组事件 为 的一个划分[^huafen],则有
独立性
当 时,我们就说这两个随机事件独立。这可以从直观上理解:此时若 ,则 ,这等于就是说随机事件 是否发生并不影响随机事件 的发生概率。
推广出去,对于 ,称其独立当且仅当
但笔者认为,这样定义独立性会存在一定的问题,即两两独立的事件不一定合起来独立,如 OI Wiki 中的反例所言。
考虑将其抽象。令 。此时,计算结果与原文相同。
修改使 。
此时,。
由此可以看出,原文所举的反例只是一种数值上的巧合。要让两两独立能推出全部独立,只需修改独立的定义为事件集合两两不交即可。
但坏消息是:现实中只能通过反复实验得到概率的数值,因此这种独立定义不无其道理。
Bayes 公式
P(A|B) &=\frac{P(A)P(B|A)}{P(B)}\\ &=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})} \end{aligned}$$ 这里只给出贝叶斯公式的简化形式,其完整形式可由全概率公式推出。 这个公式的形式化证明十分简单(读者甚至可以在一分钟内自行完成),但其中蕴含的思想却并不好理解。 为了解释这个公式的意义,需要一些理(kou)解(hu)。 ### 先验概率与后验概率 $$P(A|B)=\frac{P(B|A)}{P(B)}P(A)$$ 若将 $P(A)$ 称为**先验概率**,$P(A|B)$ 称为**后验概率**,则此公式是一个能将**先验概率**和**后验概率**间相互转化的工具。 $\frac{P(B|A)}{P(B)}$ 可以理解为是事件 $B$ 的发生的情况中,有**伴随**[^bansui]事件 $A$ 一起发生的对它的提升有多大。而**先验概率**乘上它就相当于是在 $A$ 中找到了那些对 $B$ 的影响的部分。 或者从集合的意义理解 $$\begin{aligned} \frac{P(B|A)}{P(B)}&=\frac{\frac{|A\cap B|}{|A|}}{\frac{|B|}{\Omega}}\\ &=\frac{|A\cap B||\Omega|}{|A||B|} \end{aligned}$$ 这就相当于“提取”出 $A$ 和 $B$ 中那些相同的部分,并以此计算先验概率与后验概率之间的关系。比如 $A\cap B=\varnothing$,此时即说明事件 $A,B$ 互斥,那么后验概率 $P(A|B)=0$。 ### 从一个例子出发 从特殊到一般,再从一般到特殊。如果抽象的论述无法理解,那就找一个具体的例子。 想象有 $1000$ 名 OIer,其中有 $1\%$ 得了 P 话病。他们都接受了模拟赛检查,其中 $9$ 个 P 话病人得到了正确的阳性结果,剩下 $1$ 个则是假阴性。剩下的人里面,有 $89$ 个假阳性,$901$ 个正确的阴性结果。 我经过了检测,结果为阳性,求得了 P 话病的概率 $P(A)$。 根据具体数据,容易算出阳性里面真病人的占比为 $\frac{9}{9+89}=\frac{9}{98}$,因为概率均等,所以 $P(A)=\frac{9}{98}$,约为 $\frac{1}{11}$。 阳性的组成部分,可以分为两个,分别是检出的**真阳性**和**假阳性**,前者在病人的占比为**灵敏度**,后者在非病人的占比为**假阳性率**。 在本次测验中,**灵敏度**为 $90\%$,**假阳性率**约为 $91\%$。这就引出一个悖论:为什么准确度这么高,阳性里真病人的概率却这么低? 这是因为,检测不是作为阳性的概率,而是**更新**了阳性的概率;或者说,使**先验概率**转化为了**后验概率**。 用**真阳性**在病人中的占比除以**总阳性**在所有人中的占比,即可得到所有阳性中有多少的**真阳性**。 而这个占比的占比,其实就是贝叶斯公式中的 $\frac{P(B|A)}{P(B)}$,也就是通常所说的**贝叶斯因子**,其说明了应该如何将**先验概率**转化为**后验概率**。 ## 后记 就先讲到这里,期望和实际做题的部分等更新吧。 如果仍有疑惑,可以翻阅下方所列的参考文献。 ~~点赞收藏加关注,一键三连不迷路。~~ ## 参考文献 1. [胡渊鸣,《浅析信息学竞赛中概率论的基础与应用》,《国家集训队2013论文集》](https://chxulong.oss-cn-shenzhen.aliyuncs.com/%E5%9B%BD%E5%AE%B6%E9%9B%86%E8%AE%AD%E9%98%9F%E8%AE%BA%E6%96%87/%E5%9B%BD%E5%AE%B6%E9%9B%86%E8%AE%AD%E9%98%9F2013%E8%AE%BA%E6%96%87%E9%9B%86/2013%20%E5%B9%B4%E4%BF%A1%E6%81%AF%E5%AD%A6%E5%A5%A5%E6%9E%97%E5%8C%B9%E5%85%8B%E4%B8%AD%E5%9B%BD%E5%9B%BD%E5%AE%B6%E9%98%9F%E5%80%99%E9%80%89%E9%98%9F%E5%91%98%E8%AE%BA%E6%96%87%E9%9B%86.pdf)[^2013] 2. [Grant Sanderson,Bayes theorem, and making probability intuitive](https://www.bilibili.com/video/BV1R7411a76r)[^3b1b] 3. [Grant Sanderson,Bayes theorem, The medical test paradox: Can redesigning Bayes rule help?](https://www.bilibili.com/video/BV1Ei4y1F72M)[^yi] 4. [OI Wiki, 概率论](https://oi-wiki.org/math/probability/basic-conception/) 5. [长河劫,【数学史】初等概率论的起源](https://www.bilibili.com/video/BV1tnYCzeEGE) 本文遵循 [CC BY-SA 4.0](https://creativecommons.org/licenses/by-sa/4.0/deed.zh-hans) 协议[^cc]。 [^3b1b]:原链接在[这里](https://youtu.be/HZGCoVF3YvM),但我上不了油管 QAQ。 [^cc]:我也不知道这是什么,总之挺高级的就写这里了。 [^2013]:没有空格是因为原标题如此。 [^jian]:随机事件通常用大写字母表示。 [^du]:对于有限集,其为集合的元素个数;对于无限集则为一个特定的函数。这涉及到部分[测度论](https://baike.baidu.com/item/%E6%B5%8B%E5%BA%A6%E8%AE%BA/918407)的内容,暂时不做讨论 ~~(其实是因为我也不会)~~。 [^bidao]:毕导小学。 [^huafen]:对于 $A_1,A_2\dots A_n$,若其满足 $\forall x\ne y,A_x\cap A_y=\varnothing$ 且 $\bigcup^{n}_{i=1}A_i=U$,则称其为 $U$ 的一个划分。 [^bansui]:不能简单说成是因果关系,因为不知道两者是谁造成谁又或者有一个相同的原因。 [^yi]:[同上](https://youtu.be/lG4VkPoG3ko)。相关推荐
评论
共 5 条评论,欢迎与作者交流。
正在加载评论...