凸函数

来自testwiki
跳转到导航 跳转到搜索

Template:About

凸函数的圖像上任取兩點,連成的線段必在圖像上方。
二元二次多項式函數(x,y)x2+xy+y2的圖像,形如開口向上的碗。

凸函数(英文:Convex function)是指函数图形上,任意兩點連成的線段,皆位於圖形的上方的实值函数[1]如單變數的二次函数指数函数。二階可導的一元函數f為凸,当且仅当其定義域為凸集,且函數的二階導數f在整個定義域上非負。直觀理解,凸函數的圖像形如開口向上的杯,而相反,凹函数則形如開口向下的帽

最优化研究中,凸函數的最小化問題有唯一性,即凸開集上的嚴格凸函數,至多只有一個極小值。

概率论中,凸函數f作用在某随机变量期望值𝔼[X]所得的結果,總不大於對隨機變量先取函數值再取期望,即

f(𝔼[X])𝔼[f(X)],

稱為延森不等式。該不等式可以推導出均值不等式赫尔德不等式等結果。

Template:函数凹凸性注意事项

定義

File:Convex 01.ogv

C為某向量空間凸子集,若实值函数f:C 對任意 0t1及任意v,wC,皆有

f[v+t(wv)]f(v)+t[f(w)f(v)]

f 稱為凸函数

C ,然後在 f 圖像上任取兩點(x1,f(x1))(x2,f(x2)) 連線,則連線上某點 px 座標可以想成從 x1 出發,前進了 x2x1 這整段的一部分而已,也就是說

0t=xx1x2x11

循著同樣的比例 tpy 座標就可以寫成

0t=yf(x1)f(x2)f(x1)1

但同樣的 x 座標下,對應的 f 函數值就是

f[x1+t(x2x1)]

所以,凸函數的定義意為,f 的圖像上,任意相異兩點的連線不能低於中間f 的曲線。[2]換言之,函數的Template:Le(圖像上方的點的集合)为凸集

严格凸函数

若將定義的號換成<,則得到嚴格凸的定義:

f稱為嚴格凸,意思是對0<t<1和任意不相等的v,wC,皆有

f[v+t(wv)]<f(v)+t[f(w)f(v)]

C ,在嚴格凸函數f的圖像曲線上,任意兩相異點的連線,除端點外皆高於曲線。

几乎凸函数

C实值函数f:C 對於任意三實數 xzy ,都有f(z)max{f(x),f(y)},則稱 f幾乎凸的。

性质

凸函數的某些性質,多元情況的敍述與一元情況同樣簡單。此種性質,可能僅於多元情況列舉,恕不在一元情況贅述。

一元情況

函数(蓝色)是凸的,当且仅当其上方的区域(绿色)是一个凸集
  • f是一元實函數定義域區間。考慮割線斜率R(x1,x2)=f(x2)f(x1)x2x1,則函數R對稱函數,即關於R(x1,x2)=R(x2,x1)f為凸,當且僅當對每個固定的x2,皆有R(x1,x2)關於x1單調不減(或由對稱性,可將此句中x1,x2互換)。此刻劃有助證明以下的結果。
  • 若一元凸函数f定义在开区间C內,則在C连续,且處處有左側及右側的Template:Le。如此定義的兩個單邊導函數,皆為單調不減。由此推出,除可数个点外,f在其他点皆可微(不過不可導的點組成的集合,仍有可能稠密)。如果C闭区间,那么f有可能在C的端点不连续,見例子
  • 一元可微函数在区间上是凸的,当且仅当函数位于所有它的切线的上方:[3]Template:Rp对于区间内的所有xy,都有f(x)f(y)+f(y)(xy).特别地,如果f(y)=0,則上式化為f(x)f(y),故f(y)f最小值
  • 一元可微函数在某个区间上是凸的,当且仅当它的导数在该区间上单调不减。若一元函數既凸又可導,則其導數也連續
  • 一元二阶可微的函数在区间上是凸的,当且仅当它的二阶导数是非负的;这是判断某个函数是否凸的實用方法。直觀地,二階可導的凸函數「向上彎」,而不會屈向另一邊(即無拐点)。如果它的二阶导数是正数,那么函数就是严格凸的,但反过来不成立。例如,f(x)=x4的二阶导数是f(x)=12x2,当x=0时为零,但f是严格凸的。
    • 此性質的條件「二階導數非負」與前一個性質的條件「導數單調不減」有差異。若f在區間C非負,則的確fC單調不減。反之則不然,因為可能有fC單調不減,但在某點不可導,即fC中某點無定義。
  • f為一元凸函數,且f(0)0,則f正數集內為Template:Link-en,即f(a+b)f(a)+f(b)對任意正實數a,b成立。

多元情況

更一般地,多元二次可微的连续函数在凸集上是凸的,当且仅当它的黑塞矩阵在凸集的内部是半正定的。

凸函数的任何极小值也是最小值。严格凸函数最多有一个最小值。

对于凸函数f水平子集{x | f(x) < a}和{x | f(x) ≤ a}(aR)是凸集。然而,水平子集是凸集的函数不一定是凸函数;这样的函数称为拟凸函数

延森不等式对于每一个凸函数f都成立。如果X是一个随机变量,在f的定义域内取值,那么f(𝔼[X])𝔼[f(X)],(在这里,E表示数学期望。)

凸函數的初等運算

  • 如果fg是凸函數,那麼m(x)=max{f(x),g(x)}h(x)=f(x)+g(x)也是凸函數。
  • 如果fg是凸函數,且g遞增,那麼h(x)=g(f(x))是凸函數。
  • 凸性在仿射映射下不變:也就是說,如果f(x)是凸函數(xn),那麼g(y)=f(Ay+b)也是凸函數,其中An×m,bn.
  • 如果f(x,y)(x,y)內是凸函數,且C是一個凸的非空集,那麼g(x)=infyCf(x,y)x內是凸函數,只要對於某個x,有g(x)>

例子

  • 函数f(x)=x2处处有f(x)=2>0,因此f是一个(严格的)凸函数。
  • 绝对值函数f(x)=|x|是凸函数,虽然它在点x = 0没有导数。
  • p1时,函数f(x)=|x|p是凸函数。
  • 定义域为[0,1]的函数f,定义为f(0)=f(1)=1,当0<x<1时f(x)=0,是凸函数;它在开区间(0,1)内连续,但在0和1不连续。
  • 函数f(x)=x3的二阶导数为f(x)=6x,因此它在x ≥ 0的集合上是凸函数,在x ≤ 0的集合上是凹函数
  • 每一个在内取值的线性变换都是凸函数,但不是严格凸函数,因为如果f是线性函数,那么f(a+b)=f(a)+f(b)。如果将“凸”替换为“凹”,该命题也成立。
  • 每一个在内取值的仿射变换,也就是说,每一个形如f(x)=aTx+b的函数,既是凸函数又是凹函数。
  • 每一个范数都是凸函数,这是由于三角不等式
  • 如果f是凸函数,那么当t>0时,g(x,t)=tf(x/t)是凸函数。
  • f(x)=xg(x)=log(x)单调递增但非凸的函数。
  • 函数f(x) = 1/x2f(0)=+∞,在区间(0,+∞)内是凸函数,在区间(-∞,0)内也是凸函数,但是在区间(-∞,+∞)内不是凸函数,这是由于x = 0处的奇点。

参见

参考文献

Template:Reflist

  • Hiriart-Urruty, Jean-Baptiste, and Lemaréchal, Claude. (2004). Fundamentals of Convex analysis. Berlin: Springer.
  • Template:Cite book
  • Borwein, Jonathan, and Lewis, Adrian. (2000). Convex Analysis and Nonlinear Optimization. Springer.

Template:Authority control