停时的布朗运动 (维纳过程 )是鞅的一个例子
在機率论 中,平賭 (英語:martingale )是满足下述条件的随机过程 :已知过去某一 时刻 s 以及之前所有时刻的观测值,若某一时刻 t 的观测值的条件期望 等於过去某一时刻 s 的观测值,则称这一随机过程是平賭。而於博弈论中,平賭經常用來作為公平博弈的数学模型。
历史
三维布朗运动 (维纳过程 )
鞅的原名「martingale」原指一类於18世纪流行於法国 的投注策略 ,称为加倍赌注法 [ 1] 。这类策略中最简单的一种策略是为博弈设计的。在博弈中,赌徒会掷硬币,若硬币正面向上,赌徒会赢得赌本,若硬币反面向上,赌徒会输掉赌本。这一策略使赌徒在输钱後加倍赌金投注,为的是在初次赢钱时赢回之前输掉的所有钱,同时又能另外赢得与最初赌本等值的收益。当赌徒的财产和可用时间同时接近无穷时,他掷硬币後硬币正面向上的概率会接近1,由此看来,加倍赌注法似乎是一种必然 能赢钱的策略。然而,由于现实中赌徒的资金是有限的,赌金的指数增长 最终会导致使用这一策略的赌徒破产。
鞅的概念首先是由保羅·皮埃爾·萊維 於1934年提出的,但他只提出了離散時間的版本,而且沒有給予命名。直到1939年,約翰·維爾 將此概念推廣到連續時間的情況,並且首次提出「martingale」这個名稱。约瑟夫·利奧·杜布 等人在鞅的相關理論的初期發展做出重大貢獻,而完成这些工作的部分动机是为了表明成功的投注策略不可能存在。此外,伊藤清 在分析应用方面作出了重要的贡献。从1970年代开始,鞅论就在纯粹数学 和应用数学 的很多领域中有广泛的应用,特别是在数学物理 和金融数学 中。
定义
離散時間鞅
离散时间鞅 是对於所有 n 都满足
E
(
|
X
n
|
)
<
∞
{\displaystyle \mathbf {E} (\vert X_{n}\vert )<\infty }
E
(
X
n
+
1
∣
X
1
,
…
,
X
n
)
=
X
n
,
n
∈
N
,
{\displaystyle \mathbf {E} (X_{n+1}\mid X_{1},\ldots ,X_{n})=X_{n},\quad n\in \mathbb {N} ,}
的时间离散的随机过程 X1 ,X2 ,X3, …,也就是说,已知之前所有观测值,若下一次观测值的条件期望 等於本次观测值,则称这一随机过程(即随机变量 序列 )是离散时间鞅。
關於隨機過程的離散時間鞅
相对来说更为一般的定义如下:若对於所有 n 都满足
E
(
|
Y
n
|
)
<
∞
{\displaystyle \mathbf {E} (\vert Y_{n}\vert )<\infty }
E
(
Y
n
+
1
∣
X
1
,
…
,
X
n
)
=
Y
n
,
n
∈
N
,
{\displaystyle \mathbf {E} (Y_{n+1}\mid X_{1},\ldots ,X_{n})=Y_{n},\quad n\in \mathbb {N} ,}
则称随机过程 Y1 ,Y2 ,Y3 ,…是关於另一随机过程 X1 ,X2 ,X3 ,…的鞅。
連續時間鞅
与离散时间鞅的定义相似,连续时间鞅的定义为:若对於所有 t 都满足
E
(
|
Y
t
|
)
<
∞
{\displaystyle \mathbf {E} (\vert Y_{t}\vert )<\infty }
E
(
Y
t
∣
{
X
τ
,
τ
≤
s
}
)
=
Y
s
,
∀
s
≤
t
,
{\displaystyle \mathbf {E} (Y_{t}\mid \{X_{\tau },\tau \leq s\})=Y_{s},\ \forall \ s\leq t,}
则称关於随机过程 Xt 的连续时间鞅是随机过程 Yt 。
上述定义表达了鞅的性质,即在 s ≤ t 的条件下,已知时刻 s 以及之前所有时刻的观测值,若时刻 t 的观测值的条件期望等於时刻 s 的观测值,则随机过程是鞅。
廣義的定義
更為一般性的定义如下:若随机过程
Y
:
T
×
Ω
→
S
{\displaystyle Y:T\times \Omega \to S}
满足如下性质,则稱 Y 是一個关於滤链 Σ∗ 和概率测度 P 的鞅。
Σ∗ 是给定機率空間 (Ω, Σ, P ) 的滤链 ;
Y 是适应 於滤链 Σ∗ 的适应过程,即对於指标集 T 中的每一 t ,随机变量 Yt 是一个 Σt 可测函数 ;
对於任意 t ,Yt 存在於 Lp 空间 L1 (Ω, Σt , P ; S) 中,即
E
P
(
|
Y
t
|
)
<
+
∞
;
{\displaystyle \mathbf {E} _{\mathbf {P} }(|Y_{t}|)<+\infty ;}
对於所有 s 和 t (s < t )和所有 F ∈ Σs ,
E
P
(
[
Y
t
−
Y
s
]
χ
F
)
=
0
,
{\displaystyle \mathbf {E} _{\mathbf {P} }\left([Y_{t}-Y_{s}]\chi _{F}\right)=0,}
其中 χF 表示事件 F 的指示函数 。在 Grimmett 和 Stirzaker 的《Probability and Random Processes 》一书中,最後一个条件被表示为条件期望 的一般形式[ 2] :
Y
s
=
E
P
(
Y
t
|
Σ
s
)
,
{\displaystyle Y_{s}=\mathbf {E} _{\mathbf {P} }(Y_{t}|\Sigma _{s}),}
要注意的重点是鞅成立的性质与滤链以及关於选定期望的機率测度 都有关。Y 可能是某一测度的鞅,但不是另一测度的鞅;而要说明某一伊藤过程 是鞅,则可以利用吉尔萨诺夫定理 找出相关的测度。
鞅的例子
设 Xn 是一个赌徒 n 次抛掷公平硬币 後的财产,規則是如果硬币正面朝上,则赌徒赢得 1 美元,硬币反面朝上,则赌徒输掉 1 美元。在已知過去不同時刻所拥有的财产之下,下一次试验後赌徒财产的条件期望与其现在的财产相等,故这一随机过程是鞅。这个例子称为賭徒謬誤 。
令 Yn = Xn 2 − n ,其中 Xn 是上例中赌徒的财产,则随机过程{ Yn : n = 1, 2, 3, ... }是鞅。这一例子可以表明赌徒的全部收益或损失大致在抛掷次数的正负平方根 之间变化。
(棣莫弗 鞅)设抛掷的是有偏硬币(或称为不公平硬币),正面向上的概率为 p,反面向上的概率为 q = 1 − p 。令
X
n
+
1
=
X
n
±
1
{\displaystyle X_{n+1}=X_{n}\pm 1}
正面情况用“+”,反面情况用“−”。令
Y
n
=
(
q
/
p
)
X
n
,
{\displaystyle Y_{n}=(q/p)^{X_{n}},}
则{ Yn : n = 1, 2, 3, ... }是关於{ Xn : n = 1, 2, 3, ... }的鞅。证明如下:
E
[
Y
n
+
1
∣
X
1
,
…
,
X
n
]
=
p
(
q
/
p
)
X
n
+
1
+
q
(
q
/
p
)
X
n
−
1
=
p
(
q
/
p
)
(
q
/
p
)
X
n
+
q
(
p
/
q
)
(
q
/
p
)
X
n
=
q
(
q
/
p
)
X
n
+
p
(
q
/
p
)
X
n
=
(
q
/
p
)
X
n
=
Y
n
.
{\displaystyle {\begin{aligned}E[Y_{n+1}\mid X_{1},\dots ,X_{n}]&=p(q/p)^{X_{n}+1}+q(q/p)^{X_{n}-1}\\&=p(q/p)(q/p)^{X_{n}}+q(p/q)(q/p)^{X_{n}}\\&=q(q/p)^{X_{n}}+p(q/p)^{X_{n}}=(q/p)^{X_{n}}=Y_{n}.\end{aligned}}}
复合补偿泊松过程的2条轨道,强度分别为2.4(蓝)和0.6(红),服从正态分布
N
(
0.25
,
1
)
{\displaystyle N(0.25,1)\,}
(波利亞 罐子模型)一个罐子中最初装有 r 个红球和 b 个蓝球。某人随机取出一个球,然後将此球与另一个与此球颜色相同的球放回罐子中。令 Xn 为重复上述步骤 n 次後罐子中的红球数,令 Yn = Xn / (n + r + b)。这时随机过程{ Yn : n = 1, 2, 3, ... }是鞅。
(统计学 中的似然比检验 )某一总体可能是按照概率密度 f 分布,也可能是按照概率密度 g 分布。从总体中取出一个随机样本 ,数据为 X1 , ..., Xn 。令 Yn 为“似然比”:
Y
n
=
∏
i
=
1
n
g
(
X
i
)
f
(
X
i
)
{\displaystyle Y_{n}=\prod _{i=1}^{n}{\frac {g(X_{i})}{f(X_{i})}}}
(上式在应用中用作检验统计量。)若总体实际上是按照概率密度 f 而不是 g 分布,则{ Yn : n = 1, 2, 3, ... }是关於{ Xn : n = 1, 2, 3, ... }的鞅。
设每一變形蟲 不是以概率 p 分裂成两个变形虫,就是以概率 1 − p 最终死亡。令 Xn 为 n 代後变形虫的存活数目(若种群在某一时刻灭绝,则这一时刻的 Xn = 0)。令 r 为最终灭绝的概率 。(找出 r 关於 p 的函数在实际应用中是非常有用的。提示:已知最初的一个变形虫已经分裂了,则这个变形虫的後代最终灭绝的概率等於其分裂直接得到的两个後代中任何一个死亡的概率。)则
{
r
X
n
:
n
=
1
,
2
,
3
,
…
}
{\displaystyle \{\,r^{X_{n}}:n=1,2,3,\dots \,\}}
是关於{ Xn : n = 1, 2, 3, ... }的鞅。
软件生成的鞅序列
若{ Nt : t ≥ 0 }是强度为λ的泊松过程 ,则补偿泊松过程{ Nt − λt : t ≥ 0 }是具有右连续且有左极限 的样本轨道的连续时间鞅(更确切地说是局部鞅 )。
利用计算机软件,鞅序列可以很容易地制作出来:
Microsoft Excel 或类似的电子制表软件:在A1(左上角)单元格中输入0.0,在下方的A2单元格中输入=A1+NORMINV(RAND(),0,1)
。这时下拉复制此单元格,得到大约300个单元格,这样就能创建均值为0,标准差为1的鞅序列。在这些单元格仍处於选中状态的情况下,利用图表创建工具创建这些值的图表。这时每次重新计算後(在Excel中可按F9实现),图表都会显示出不同的鞅序列。
R语言 :若要再现上述例子,可运行如下命令。若要显示另一个鞅,重新输入如下命令即可。
plot(cumsum(rnorm(100, mean=0, sd=1)), t="l", col="darkblue", lwd=3)
下鞅与上鞅
(离散时间)下鞅 (submartingale,又称亚鞅 )是满足
E
[
X
n
+
1
|
X
1
,
…
,
X
n
]
≥
X
n
,
n
∈
N
{\displaystyle {}E[X_{n+1}|X_{1},\ldots ,X_{n}]\geq X_{n},\quad n\in \mathbb {N} }
的可积 随机过程 X1 ,X2 ,X3 ,…。
类似地,(离散时间)上鞅 (supermartingale,又称超鞅 )是满足
E
[
X
n
+
1
|
X
1
,
…
,
X
n
]
≤
X
n
,
n
∈
N
{\displaystyle {}E[X_{n+1}|X_{1},\ldots ,X_{n}]\leq X_{n},\quad n\in \mathbb {N} }
的可积 随机过程 X1 ,X2 ,X3 ,…。
下鞅或上鞅的定义都可由前述的离散时间和连续时间鞅的更为一般的定义转换得到,只需将条件期望的等式代换成不等式即可。
这里给出一个区分下鞅和上鞅的记忆方法:“生活是一个上鞅:随着时间的推进,期望降低。”
例子
每一个鞅既是下鞅又是上鞅,反过来任何既是下鞅又是上鞅的随机过程是鞅。
再次考虑赌徒的例子,若硬币正面向上,赌徒赢得1美元,若硬币反面向上,赌徒输掉1美元。设此时硬币是有偏的,则硬币正面向上的概率为p 。
若 p 等於 1/2,平均起来,赌徒既未赢钱也未输钱,则随着时间的流逝,赌徒的财产是一个鞅。
若 p 小於 1/2,平均起来,赌徒输了钱,则随着时间的流逝,赌徒的财产是一个上鞅。
若 p 大於 1/2,平均起来,赌徒赢了钱,则随着时间的流逝,赌徒的财产是一个下鞅。
由延森不等式 求出的鞅的凸函数 (convex function)是下鞅。例如,公平硬币博弈中赌徒财产的平方是下鞅(同时也是根据 Xn 2 − n 是鞅的事实得出的)。类似地,鞅的凹函数 (concave function)是一个上鞅。
鞅与停时
关於随机过程 X1 ,X2 ,X3 ,… 的停时 是随机变量 τ,这一随机变量具有如下性质:对於每一個時間 ,事件 τ = t 的发生与否仅取决於 X1 ,X2 ,X3 ,…,Xt 的取值。从定义中可以感受到的直觉是在任一特定时刻 t,我们都可以知道在这一时刻随机过程是否到了停时。现实生活中停时的例子如赌徒离开赌桌的时刻,这一时刻可能是赌徒以前赢得钱财的函数(例如,仅当他没有钱时,他才可能离开赌桌),但是他不可能根据还未完成的博弈的结果来选择离开还是留下。
上述停时定义满足强条件,下面给出一个弱条件的停时定义:若事件 τ = t 的发生与否統計獨立 於 Xt+1 ,Xt+2 ,… 但并不是完全决定於时刻 t 以及之前的过程历史,则随机变量 τ 是停时。虽然这是一个弱条件,但在需要用到停时的证明中的一些情况也算是足够强的条件。
鞅的一个基本性质是若
(
X
t
)
t
>
0
{\displaystyle (X_{t})_{t>0}}
是下\上鞅且
τ
{\displaystyle \tau }
是停时,由
X
t
τ
:=
X
min
{
τ
,
t
}
{\displaystyle X_{t}^{\tau }:=X_{\min\{\tau ,t\}}}
定义的对应停止过程
(
X
t
τ
)
t
>
0
{\displaystyle (X_{t}^{\tau })_{t>0}}
也是下\上鞅。
停时鞅的概念引出了一系列定理,例如可选停止定理 (又称可选抽样定理):在特定条件下,停时的鞅的期望值等於其初始值。利用这一定理,我们可以证明对於一个寿命有限且房产有限的赌徒,成功的投注策略不可能存在。
参见
参考文献
脚注
参考书目