Jensen不等式以丹麦数学家约翰·詹森(Johan Jensen)命名。它给出均值的凸函数值和凸函数的均值间的大小关系。
if X is a random variable and φ is a convex function, then
φ(E[X])≤E[φ(X)].
特别地,如果φ是严格凸函数,当且仅当X是常量时,上式取等号。Jensen不等式应用于凹函数时,不等号方向反向。
从凸函数说起, 设φ 是定义域为实数的函数,如果对于所有的实数x,φ(x)的二次导数大于等于0,那么φ(x)是凸函数。如果f(x)的二次导数只大于0,不等于0,那么称 φ(x) 是严格凸函数。当 x 是向量时,如果φ(x) 的 Hessian 矩阵H是半正定的,那么φ(x)是凸函数。如果 Hessian 矩阵H是正定的那么称φ(x)是严格凸函数。
凸函数又如下性质: 过一个凸函数上任意两点所作割线, 割线一定在这两点间的函数图象的上方,即:
f(tx1+(1−t)x2)≤tf(x1)+(1−t)f(x2).
其中, f 为如函数, 如下图所示:
将(1)推广到一般情形:
f(n∑i=1tixi)≤n∑i=1tif(xi).
其中: xi∈I,ti≥0,∑ni=1ti=1,1≤i≤n
令:
ti=pi∑ni=1pi.
则 (2) 可以改写成
f(∑ni=1pixi∑ni=1pi)≤∑ni=1pif(xi)∑ni=1pi.
这就是jensen不等式的形式之一.
如果是pi都取特殊的值,如:pi=1,i=1,2,…,n 则(3)可表示为
f(∑ni=1xin)≤∑ni=1f(xi)n
即:
f(E[X])≤E[f(X)].
其中: X={x1,x2,…,xn}.
式(4)就是均值形式Jensen不等式.
reference