概率与数学期望

样本、样本空间、随机事件和随机变量

在概率论中，我们把一个随机实验的某种可能结果称为一个样本，把所有可能结果构成的集合称为 样本空间，一般记为 $S$。$S$ 中的元素即为实验的每一个结果，称为 样本点。在一个给定的样本空间中，我们把若干个样本构成的集合，即样本空间的子集，称为 随机事件。在每次试验中，当且仅当这一子集中的一个样本点出现时，称这一事件“发生”。有一个样本点组成的单个元素的集合，称为 基本事件。$S$ 是自身的子集，在每次试验中必然发生，称为 必然事件。空集 $\varnothing$ 也是 $S$ 的一个子集，在每次试验中都不可能发生，称为 不可能事件。

我们把将样本映射为实数的函数称为 随机变量。当随机变量的取值有限时，我们称该随机变量为 离散型随机变量，反之当随机变量的取值无限时，我们称该随机变量为 连续型随机变量。

概率

定义

概率有多种定义，如 古典定义、统计定义 和 公理化定义。

古典定义

如果一个试验满足两条：

试验只有有限个基本结果；
试验的每个基本结果出现的可能性是一样的；

这样的试验便是古典试验。

对于古典试验中的事件 $A$，它的概率定义为 $P(A)=\dfrac{m}{n}$，其中 $n$ 表示该试验中所有可能出现的基本结果的总数目，$m$ 表示事件 $A$ 包含的试验基本结果数。

公理化定义

设样本空间为 $\Omega$，如果对于 $\Omega$ 中的每一个随机事件 $A$，都存在实值函数 $P(A)$，满足：

$P(A) \ge 0$。
$P(\Omega)=1$。
对于若干个两两互斥事件 $A_i$，有 $\sum P(A_i)=P(\bigcup A_i)$，其中 $\bigcup$ 表示并集。

则称 $P(A)$ 为随机事件 $A$ 发生的概率。通俗来说，概率就是对随机事件发生可能性的度量，是一个 $[0,1]$ 之间的实数。

条件概率

记 $P(B|A)$ 表示在 $A$ 事件发生的前提下，$B$ 事件发生的概率，则 $P(B|A)=\dfrac{P(AB)}{P(A)}$（其中 $P(AB)$ 为事件 $A$ 和事件 $B$ 同时发生的概率）。

独立事件

当两个事件发生的概率互不影响时，我们称这两个事件互为独立事件。更规范来说，我们称事件 $A$ 和事件 $B$ 互为独立事件，当且仅当 $P(A|B)=P(A)$。

独立变量

对于两个变量 $x,y$，我们称 $x$ 和 $y$ 是相互独立的当且仅当 $\forall a,b,P(x=a \cap y=b)=P(x=a)P(y=b)$，更进一步的，$E(xy)=E(x)(y)$。

概率的性质

$P(\emptyset)=0$。
（有限可加性）当 $n$ 个事件 $A_1,A_2,\cdots,A_n$ 两两不相容时，$P(A_1 \cup A_2 \cup \cdots \cup A_n)=P(A_1)+P(A_2)+\cdots+P(A_n)$。
对于任意一个事件 $A$，$P(A)=1-P(!A)$。
当事件 $A$ 包含于 $B$ 时，$P(B-A)=P(B)-P(A)$ 且 $P(A) \le P(B)$。
对于任意两个事件 $A$ 和 $B$，$P(B-A)=P(B)-P(A \cap B)$。
（广义加法公式）对于任意两个事件 $A$ 和 $B$，$P(A \cup B)=P(A)+P(B)-P(A \cap B)$。
（乘法公式）对于任意两个事件 $A$ 和 $B$，$P(AB)=P(A)P(B|A)$。

全概率公式

若事件 $A_1,A_2,\cdots,A_n$ 构成一组完备的事件且都有正概率，即 $\forall i,j|A_i \cap A_j=\emptyset$ 且 $\sum\limits_{i=1}^nA_i=1$，则有 $P(B)=\sum\limits_{i=1}^nP(A_i)P(B|A_i)$。

贝叶斯公式

若事件 $B_1,B_2,\cdots,B_n$ 构成一组完备的事件且都有正概率，即 $\forall i,j|B_i \cap B_j=\emptyset$ 且 $\sum\limits_{i=1}^nB_i=1$，则有 $P(B_i|A)=\dfrac{P(B_i)P(A|B_i)}{\sum\limits_{j=1}^nP(B_j)P(A|B_j)}$。

证明：（使用条件概率和全概率公式）

$$\begin{aligned} P(B_i|A) &= \dfrac{P(AB_i)}{P(A)} \\ &= \dfrac{P(B_i)P(A|B_i)}{\sum\limits_{j=1}^nP(B_j)P(A|B_j)} \end{aligned}$$

期望

定义

（本文以介绍离散型随机变量为主。）

离散型随机变量的数学期望

一个离散型随机变量 $X$ 的 数学期望 是其每个取值乘以该取值对应概率的总和，记为 $E(X)$。

$$E(X)=\sum\limits_{\alpha \in I(X)} \alpha\cdot P(X=\alpha)=\sum\limits_{\omega \in S}X(\omega)P(\omega)$$

其中 $I(X)$ 表示随机变量 $X$ 的值域，$S$ 表示 $X$ 所在概率空间的样本集合。

连续型随机变量的数学期望

若有一个连续型随机变量 $X$ 取值为 $\xi$ 的概率为 $p(\xi)$，则定义其期望 $E(X)$ 为：

$$E(X)=\int_{-\infty}^{+\infty}Xp(X)\mathrm{d}X$$

性质

全期望公式

$E(Y)=\sum\limits_{\alpha \in I(X)} P(X=\alpha)E(Y|(X=\alpha))$，其中 $X,Y$ 是随机变量，$E(Y|A)$ 是在 $A$ 成立的条件下 $Y$ 的期望（即“条件期望”）。

期望的线性性

对于任意两个随机变量 $X,Y$（不要求相互独立），有 $E(X+Y)=E(X)+E(Y)$。

证明：我们把 $\sum\limits_x$ 和 $\sum\limits_y$ 当作 $\sum\limits_{x \in I(X)}$ 和 $\sum\limits_{y \in I(Y)}$ 的简称。那么：

$$\begin{aligned} E(X+Y) &= \sum\limits_x\sum\limits_y(x+y)P(X=x,Y=y) \\ &= \sum\limits_x\sum\limits_yxP(X=x,Y=y)+\sum\limits_x\sum\limits_yyP(X=x,Y=y) \\ &= \sum\limits_xx\sum\limits_yP(X=x,Y=y)+\sum\limits_yy\sum\limits_xP(X=x,Y=y) \\ &= \sum\limits_xxP(X=x)+\sum\limits_yyP(Y=y) \\ &= E(X)+E(Y) \end{aligned}$$

乘积的期望

对于任意两个相互独立的随机变量 $X,Y$，有 $E(XY)=E(X)E(Y)$。

证明：我们把 $\sum\limits_x$ 和 $\sum\limits_y$ 当作 $\sum\limits_{x \in I(X)}$ 和 $\sum\limits_{y \in I(Y)}$ 的简称。那么：

$$\begin{aligned} E(XY) &= \sum\limits_x\sum\limits_y(xy)P(X=x,Y=y) \\ &= \sum\limits_xx\sum\limits_yyP(X=x,Y=y) \\ &= \sum\limits_xxP(X=x)\sum\limits_yyP(Y=y) \\ &= E(X)E(Y) \end{aligned}$$

经典题目和结论

首次期望

对于一个随机事件 $A$，它成功的概率为 $P(A)$。那么，第一次成功所需的次数的期望值为 $\dfrac{1}{P(A)}$。

证明：考虑枚举第 $1$ 次成功，第 $2$ 次成功等等的可能性。

$E(A)=\sum\limits_{i=1}^{+\infty}(i \times (1-P(A))^{i-1} \times P(A))$

考虑错位相减消项

$\begin{aligned} E(A)(1-P(A)) &= P(A)\sum\limits_{i=1}^{+\infty}i(1-P(A))^i \\ &= P(A)\sum\limits_{i=2}^{+\infty}(i-1)(1-P(A))^{i-1} \end{aligned}$

将上面两式相减

$\begin{aligned} E(A)P(A) &= P(A)(1+\sum\limits_{i=2}^{\infty}(1-P(A))^{i-1}) \\ &= P(A)\sum\limits_{i=1}^{+\infty}(1-P(A))^{i-1} \end{aligned}$

再用等比数列求和公式

$\begin{aligned} E(A) &= \sum\limits_{i=1}^{+\infty}(1-P(A))^{i-1} \\ &= \dfrac{(1-P(A))^0}{1-(1-P(A))} \\ &= \dfrac{1}{P(A)} \end{aligned}$

取球问题

取球问题 1

箱子里有 $n$ 个球 $1 \dots n$，你要从中拿 $m$ 次球，拿了后不放回，求取出的数字之和的期望。

取球问题 2

箱子里有 $n$ 个球 $1 \dots n$，你要从中拿 $m$ 次球，拿了后放回，求取出的数字之和的期望。

取球问题 3

箱子里有 $n$ 个球 $1 \dots n$，你要从中拿 $m$ 次球，拿了后有 $P$ 的概率放回，有 $1-P$ 的概率不放回，求取出的数字之和的期望。

随机游走问题

链上的随机游走

在一条 $n$ 个点的链上随机游走，求从一端走到另一端的期望步数。

完全图上的随机游走

在一条 $n$ 个点的完全图上随机游走，求从一点走到另一点的期望步数。

完全二分图上的随机游走

在一条 $2n$ 个点的完全二分图上随机游走，求从一点走到另一点的期望步数。

菊花图上的随机游走

在一条 $n$ 个点的菊花图上随机游走，求从一点走到另一点的期望步数。

树上的随机游走

在一条 $n$ 个点的树上随机游走，求从一点走到另一点的期望步数。（设计算法）

例题：简单概率

名称	编号	备注	题解
		简单条件概率

例题：期望的线性性

名称	编号	备注	题解

例题：简单期望 DP / 手算方程

名称	编号	备注	题解
		期望 DP
		解关于期望值 $E$ 的方程

		期望 DP 的倒推
		期望 DP 的倒推
OSU!	Luogu P1654	高维期望值 DP	题解见下

例题：链上 / 环上随机游走

名称	编号	备注	题解


		数学期望，转化为上凸壳

例题：树上随机游走的期望次数

名称	编号	备注	题解
		期望概率，树上问题

例题：与 $\max$、$\min$ 有关的二分技巧

名称	编号	备注	题解