Processing math: 100%

Jensen不等式

Jensen不等式以丹麦数学家约翰·詹森(Johan Jensen)命名。它给出均值的凸函数值和凸函数的均值间的大小关系。

if X is a random variable and φ is a convex function, then
φ(E[X])E[φ(X)].
特别地,如果φ是严格凸函数,当且仅当X是常量时,上式取等号。Jensen不等式应用于凹函数时,不等号方向反向。

从凸函数说起, 设φ 是定义域为实数的函数,如果对于所有的实数xφ(x)的二次导数大于等于0,那么φ(x)是凸函数。如果f(x)的二次导数只大于0,不等于0,那么称 φ(x) 是严格凸函数。当 x 是向量时,如果φ(x) 的 Hessian 矩阵H是半正定的,那么φ(x)是凸函数。如果 Hessian 矩阵H是正定的那么称φ(x)是严格凸函数。

凸函数又如下性质: 过一个凸函数上任意两点所作割线, 割线一定在这两点间的函数图象的上方,即:
f(tx1+(1t)x2)tf(x1)+(1t)f(x2).

其中, f 为如函数, 如下图所示:

ConvexFunction

将(1)推广到一般情形:

f(ni=1tixi)ni=1tif(xi).
其中: xiI,ti0,ni=1ti=1,1in

令:
ti=pini=1pi.
则 (2) 可以改写成
f(ni=1pixini=1pi)ni=1pif(xi)ni=1pi.

这就是jensen不等式的形式之一.

如果是pi都取特殊的值,如:pi=1i=1,2,,n 则(3)可表示为

f(ni=1xin)ni=1f(xi)n

即:
f(E[X])E[f(X)].
其中: X={x1,x2,,xn}.

式(4)就是均值形式Jensen不等式.

reference

Jensen’s inequality