Doob‘s Maximal Inequality
OST、MCT、UI 都是关于 $X_T$ 或 $X_\infty$ 的——也就是某个特定时刻的值。Doob’s Maximal Inequality 回答一个不同的问题:
过程在一段时间内的最大值有多大?
也就是控制 $\max_{0 \leq t \leq n} |X_t|$ 这个量。
Doob’s Maximal Inequalities的物理意义可以用极其霸道的一句话来概括:“用过程终点的能量,死死拿捏住整个历史轨迹的最高峰。”
在常规的随机过程中,你想知道一段路径的最大值(比如股票在这一年内的最高价),你必须掌握它每一天的联合概率分布,这几乎是不可能计算的。但 Doob 证明了,只要这个过程是鞅(没有系统性趋势),你只需要看最后一天的状态,就能推断出历史最高点绝对不会失控。
1. $L^1$ Version:超级进化版的马尔可夫不等式
公式:$\mathbb{P}\left(\max_{0\le t\le n}|X_t|\ge a\right) \le \frac{\mathbb{E}[|X_n|]}{a}$
- 回顾经典: 在基础概率论中,经典的马尔可夫不等式是 $\mathbb{P}(|X_n| \ge a) \le \frac{\mathbb{E}[|X_n|]}{a}$。它只能用来评估时刻 $n$ 这一个孤立点出现极端大值的概率。马尔可夫不等式的核心逻辑:一个非负的群体,如果平均值被固定了,那么极高值出现的比例就被严格封顶了。
- Doob 的魔法: 你仔细看 Doob 不等式的左边,它把孤立的 $|X_n|$ 换成了 $\max_{0\le t\le n}|X_t|$(即从 0 到 $n$ 这整段历史路径中的最大值)。
- 物理意义: 即使我让你在时间长河中任意挑选最高的一个浪头($\max$),这个浪头超过警戒线 $a$ 的概率,依然被时刻 $n$ 最终的平均能量 $\mathbb{E}[|X_n|]$ 给牢牢封顶了。
2. $L^p$ Version:放大惩罚后的全面压制 (通常取 $p=2$)
公式:$\mathbb{E}\left[\max_{0\le t\le n}|X_t|^p\right] \le \left(\frac{p}{p-1}\right)^p\mathbb{E}[|X_n|^p]$
- $L^1$ 版本只给出了超过阈值的“概率上限”,而 $L^p$ 版本直接给出了整个历史最大值本身的期望上限。
- 代入 $p=2$(最常用的情况): 公式变为:$\mathbb{E}\left[\max_{0\le t\le n}|X_t|^2\right] \le 4 \cdot \mathbb{E}[|X_n|^2]$
- 物理意义: 这是一个极其漂亮且惊人的结论。它告诉你,在任意一个公平赌局中,无论你玩多少把,你**“历史最高资产(或最大负债)的平方期望”,最多也就是你“离场时最终资产平方期望”的 4 倍**。历史最高点绝不可能脱离最终状态的引力独自升天。
3. Common Consequence:打通 UI 与最终收敛的桥梁
公式:If $\sup_n \mathbb{E}[|X_n|^2]<\infty$, then $\mathbb{E}\left[\sup_{n\ge 0}|X_n|^2\right]<\infty$.
这段话把 Doob 不等式和我们刚才讲过的 $L^2$ 有界性与 Uniform Integrability (UI) 完美闭环了。
问题:“难道 $L^2$ 有界不能阻止那个逃逸到无穷的反例吗?”
- Doob 给出了终极裁判:如果一个鞅满足 $\sup_n \mathbb{E}[|X_n|^2]<\infty$(即最终状态的二阶矩是有界的),那么根据 $L^p$ 不等式(把 $n$ 推到无穷大),它整条无限长路径的全局最高点 $\sup_{n\ge 0}|X_n|^2$,其期望也是有限的!
- 结论: 既然连它一辈子能达到的最高点都被常数压住了,它怎么可能像之前那个反例一样“越变越窄、越变越高”逃逸到无穷远呢?所以,$L^2$ 有界直接宣判了整条路径的最高点被全局锁定,从而完美保证了 UI,保证了期望的绝对守恒。
回顾与理解Markov不等式
马尔可夫不等式(Markov’s Inequality)是整个概率论中最底层、最基础的边界估计定理。无论是切比雪夫不等式(Chebyshev)、大数定律(LLN),还是我们刚才讲的杜布最大值不等式(Doob’s Maximal Inequality),全都是在它的基础上“加装备”进化出来的。
我们先抛开公式,用一个极其现实的例子来理解它的本质。
1. 直觉理解:马尔可夫不等式在算什么?
假设你在一家公司,老板告诉你:“我们公司的平均月薪是 1 万块。”(这是你唯一的已知信息,且工资不能是负数)。
现在我问你:这家公司里,月薪超过 10 万块的高管,最多能占公司总人数的百分之几?
你可能不知道具体的工资分布,但你可以进行极端的“反证”推理: 如果高管比例超过了 10%(比如 11%),就算剩下的 89% 的普通员工一分钱工资都不拿(工资为 0),单单这 11% 的高管就会把公司的平均工资拉高到:$10万 \times 11\% = 1.1万$。 但这与“平均工资是 1 万块”的前提矛盾了!
所以,你立刻就能断定:月薪超过 10 万的人数比例,绝对不可能超过 10%(即 $1万 / 10万$)。
这就是马尔可夫不等式的核心逻辑:一个非负的群体,如果平均值被固定了,那么极高值出现的比例就被严格封顶了。
2. Formal Statement (正式数学定义)
Let $X$ be a non-negative random variable ($X \ge 0$ almost surely), and let $a > 0$ be any positive constant. Then:
$$\mathbb{P}(X \ge a) \le \frac{\mathbb{E}[X]}{a}$$符号对应刚才的例子:
- $X$:员工的工资(非负数,不能欠公司钱)。
- $\mathbb{E}[X]$:平均工资(1 万)。
- $a$:你设定的极端高薪阈值(10 万)。
- $\mathbb{P}(X \ge a)$:拿到极端高薪的概率(或者说人数比例),它必然小于等于 $\frac{1万}{10万} = 10\%$。
3. 证明
它的证明只需要用到极其简单的逻辑(指示函数)。
对于任何非负随机变量 $X$ 和正数 $a$,我们可以把 $X$ 的取值分为两截:
- 当 $X < a$ 时,$X \ge 0$。
- 当 $X \ge a$ 时,$X \ge a$。
我们引入指示函数 $\mathbf{1}_{(X \ge a)}$(当事件发生时为 1,否则为 0)。那么在任何情况下,下面这个不等式都绝对成立:
$$X \ge a \cdot \mathbf{1}_{(X \ge a)}$$(解释:如果 $X$ 比 $a$ 小,右边是 0,左边非负,成立;如果 $X$ 比 $a$ 大,右边是 $a$,左边是 $X$,依然成立。)
对不等式两边同时取数学期望(因为期望保持不等号方向):
$$\mathbb{E}[X] \ge \mathbb{E}[a \cdot \mathbf{1}_{(X \ge a)}]$$因为 $a$ 是常数,可以直接提出来,而指示函数的期望就等于事件发生的概率:
$$\mathbb{E}[X] \ge a \cdot \mathbb{P}(X \ge a)$$把 $a$ 除过去,证明结束:
$$\mathbb{P}(X \ge a) \le \frac{\mathbb{E}[X]}{a}$$4. 它的优缺点与 Doob 的联系
- 优点(极其霸道): 它要求的信息极少。只要变量是非负的,并且你知道它的均值,你就能瞬间给出一个合法的上限。
- 缺点(极其粗糙): 这个上限通常非常“松(Loose)”。比如在正态分布里,其实远远达不到这个上限,马尔可夫给的是一个最极端的“理论死角”。
回到 Doob’s $L^1$ Inequality:
$$\mathbb{P}\left(\max_{0\le t\le n}|X_t|\ge a\right) \le \frac{\mathbb{E}[|X_n|]}{a}$$你看懂了马尔可夫,再看 Doob 的这个式子,就会发现它其实就是把马尔可夫不等式套在了“历史最大值” $\max |X_t|$ 这个非负随机变量上。 Doob 的神来之笔在于,他证明了 $\mathbb{E}[\max |X_t|]$ 这个极难计算的“整个路径最大值的期望”,可以被“终点状态的期望” $\mathbb{E}[|X_n|]$ 给盖住(对于子鞅来说)。