查看“︁凸函数”︁的源代码
←
凸函数
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{about|英文为Convex function的函数|英文为Concave function的函数|凹函数}} [[File:凸函数定义.png|替代=|缩略图|凸函数的圖像上任取兩點,連成的線段必在圖像上方。]] [[Image:Grafico 3d x2+xy+y2.png|right|300px|thumb|二元二次[[多項式]]函數<math>(x, y) \mapsto x^2 + xy + y^2</math>的圖像,形如開口向上的碗。]] '''凸函数'''(英文:Convex function)是指[[函数图形]]上,任意兩點連成的線段,皆位於圖形的上方的[[实函数|实值函数]],<ref>{{Cite web|url=https://www.stat.cmu.edu/~larry/=stat705/Lecture2.pdf|title=36-705 Intermediate Statistics: Lecture Notes 2|trans-title=中級統計學:講義2|website=www.stat.cmu.edu|access-date=3 March 2017|language=en|archive-date=2021-05-06|archive-url=https://web.archive.org/web/20210506221153/http://www.stat.cmu.edu/~larry/=stat705/Lecture2.pdf|dead-url=no}}</ref>如單變數的[[二次函数]]和[[指数函数]]。二階可導的一元函數<math>f</math>為凸,[[当且仅当]]其定義域為凸集,且函數的二階導數<math>f''</math>在整個定義域上非負。直觀理解,凸函數的圖像形如開口向上的杯<math>\cup</math>,而相反,[[凹函数]]則形如開口向下的帽<math>\cap</math>。 在[[最优化]]研究中,[[凸優化|凸函數的最小化]]問題有唯一性,即[[開集|凸開集]]上的嚴格凸函數,至多只有一個極小值。 [[概率论]]中,凸函數<math>f</math>作用在某[[随机变量]][[期望值]]<math>\mathbb E [X]</math>所得的結果,總不大於對隨機變量先取函數值再取期望,即 :<math>f(\mathbb E [X]) \le \mathbb E [f(X)],</math> 稱為[[延森不等式]]。該不等式可以推導出[[算术-几何平均值不等式|均值不等式]]及[[赫尔德不等式]]等結果。 {{函数凹凸性注意事项}} ==定義== [[File:Convex 01.ogg|thumb|right|形像理解凸函數與延森不等式]] <math>C</math>為某[[實數|實]][[向量空間]]的[[凸集|凸子集]],若[[实函数|实值函数]]<math>f: C \to \R</math> 對任意 <math>0 \leq t \leq 1</math>及任意<math>v,\,w\in C</math>,皆有 :<math>f\left[v+t\cdot(w-v)\right] \leq f(v) + t \cdot \left[f(w)-f(v)\right]</math> 則 <math>f</math> 稱為'''凸函数'''。 若 <math>C\subseteq\mathbb{R}</math> ,然後在 <math>f</math> 圖像上任取兩點<math>\left( x_1, f\left(x_1\right) \right)</math>和<math>\left( x_2, f\left(x_2\right) \right)</math> 連線,則連線上某點 <math>p</math> 的 <math>x</math> 座標可以想成從 <math>x_1</math> 出發,前進了 <math>x_2-x_1</math> 這整段的一部分而已,也就是說 :<math>0\leq t=\frac{x-x_1}{x_2-x_1} \leq 1</math> 循著同樣的比例 <math>t</math> , <math>p</math> 的 <math>y</math> 座標就可以寫成 :<math>0\leq t=\frac{y-f(x_1)}{f(x_2)-f(x_1)} \leq 1</math> 但同樣的 <math>x</math> 座標下,對應的 <math>f</math> 函數值就是 :<math>f\left[x_1+t\cdot(x_2-x_1)\right]</math> 所以,凸函數的定義意為,<math>f</math> 的圖像上,任意相異兩點的連線不能低於中間<math>f</math> 的曲線。<ref>{{Cite web|last=|first=|date=|title=Concave Upward and Downward|trans-title=上凸與下凸|url=https://www.mathsisfun.com/calculus/concave-up-down-convex.html|url-status=no|archive-url=https://web.archive.org/web/20131218034748/http://www.mathsisfun.com/calculus/concave-up-down-convex.html|archive-date=2013-12-18|access-date=|website=mathsisfun.com|language=en}}</ref>換言之,函數的{{Le|上境圖|Epigraph (mathematics)}}(圖像上方的點的集合)为[[凸集]]。 === 严格凸函数 === 若將定義的<math>\le </math>號換成<math> < </math>,則得到嚴格凸的定義: <math>f</math>稱為'''嚴格凸''',意思是對<math>0 < t < 1</math>和任意不相等的<math>v,\,w\in C</math>,皆有 :<math>f\left[v+t\cdot(w-v)\right] < f(v) + t \cdot \left[f(w)-f(v)\right]</math> 若 <math>C\subseteq\mathbb{R}</math> ,在嚴格凸函數<math>f</math>的圖像曲線上,任意兩相異點的連線,除端點外皆高於曲線。 === 几乎凸函数 === 若 <math>C\subseteq\mathbb{R}</math>,[[实函数|实值函数]]<math>f: C \to \R</math> 對於任意三實數 <math>x\le z\le y</math> ,都有<math>f(z)\leq \max\{f(x),\,f(y)\}</math>,則稱 <math>f</math> 是'''幾乎凸'''的。 == 性质 == 凸函數的某些性質,多元情況的敍述與一元情況同樣簡單。此種性質,可能僅於多元情況列舉,恕不在一元情況贅述。 === 一元情況 === [[File:Convex supergraph.svg|right|thumb|函数(蓝色)是凸的,当且仅当其上方的区域(绿色)是一个[[凸集]]。]] * 設<math>f</math>是一元[[實函數]],[[定義域]]為[[區間]]。考慮[[割線]][[斜率]]<math display = "block">R(x_1, x_2) = \frac{f(x_2) - f(x_1)}{x_2 - x_1},</math>則函數<math>R</math>是[[對稱函數]],即關於<math>R(x_1, x_2) = R(x_2, x_1)</math>。<math>f</math>為凸,當且僅當對每個固定的<math>x_2</math>,皆有<math>R(x_1, x_2)</math>關於<math>x_1</math>[[單調函數|單調不減]](或由對稱性,可將此句中<math>x_1, x_2</math>互換)。此刻劃有助證明以下的結果。 * 若一元凸函数<math>f</math>定义在[[开区间]]<math>C</math>內,則在''C''内[[连续函数|连续]],且處處有左側及右側的{{le|單邊可導|Semi-differentiability|單邊導數}}。如此定義的兩個單邊導函數,皆為[[单调函数|單調不減]]。由此推出,除[[可數集|可数]]个点外,<math>f</math>在其他点皆[[可微函数|可微]](不過不可導的點組成的集合,仍有可能[[稠密集|稠密]])。如果<math>C</math>是[[闭区间]],那么<math>f</math>有可能在<math>C</math>的端点不连续,見[[#例子|例子]]。 * 一元[[可微]]函数在区间上是凸的,当且仅当函数位于所有它的[[切线]]的上方:<ref name="boyd">{{cite book|title=Convex Optimization|trans-title=凸優化|first1=Stephen P.|last1=Boyd|first2=Lieven|last2=Vandenberghe|year=2004|publisher=Cambridge University Press|isbn=978-0-521-83378-3|url=https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf#page=83|format=pdf|access-date=October 15, 2011|language=en|archive-date=2021-05-09|archive-url=https://web.archive.org/web/20210509212522/https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf#page=83|dead-url=no}}</ref>{{rp|69}}对于区间内的所有<math>x</math>和<math>y</math>,都有<math display=block>f(x) \geq f(y) + f'(y) (x-y).</math>特别地,如果<math>f'(y) = 0</math>,則上式化為<math>f(x) \ge f(y)</math>,故<math>f(y)</math>是<math>f</math>的[[最小值]]。 * 一元可微函数在某个区间上是凸的,当且仅当它的[[导数]]在该区间上[[單調函數|单调不减]]。若一元函數既凸又可導,則其[[可微函数#连续可微的分类|導數也連續]]。 * 一元二阶可微的函数在区间上是凸的,当且仅当它的[[二阶导数]]是非负的;这是判断某个函数是否凸的實用方法。直觀地,二階可導的凸函數「向上彎」,而不會屈向另一邊(即無[[拐点]])。如果它的二阶导数是正数,那么函数就是严格凸的,但[[逆命題|反过来]]不成立。例如,<math>f(x) = x^4</math>的二阶导数是<math>f''(x)=12x^{2}</math>,当<math>x = 0</math>时为零,但<math>f</math>是严格凸的。 **此性質的條件「二階導數非負」與前一個性質的條件「導數單調不減」有差異。若<math>f''</math>在區間<math>C</math>非負,則的確<math>f'</math>在<math>C</math>單調不減。反之則不然,因為可能有<math>f'</math>在<math>C</math>單調不減,但在某點不可導,即<math>f''</math>在<math>C</math>中某點無定義。 * 若<math>f</math>為一元凸函數,且<math>f(0)\le 0</math>,則<math>f</math>在[[正數|正數集]]內為{{link-en|超可加|Superadditivity|超可加函數}},即<math>f(a + b) \geq f(a) + f(b)</math>對任意正實數<math>a, b</math>成立。<!--英文此處有證明--> <!--英文此處有中點凸與凸的關係,待修改定義後再譯--> === 多元情況 === 更一般地,多元二次可微的连续函数在凸集上是凸的,当且仅当它的[[黑塞矩阵]]在凸集的内部是半[[正定矩阵|正定]]的。 凸函数的任何[[极小值]]也是[[最小值]]。严格凸函数最多有一个最小值。 对于凸函数''f'',[[水平子集]]{''x'' | ''f''(''x'') < ''a''}和{''x'' | ''f''(''x'') ≤ ''a''}(''a'' ∈ '''R''')是凸集。然而,水平子集是凸集的函数不一定是凸函数;这样的函数称为''[[拟凸函数]]''。 [[延森不等式]]对于每一个凸函数''f''都成立。如果<math> X </math>是一个随机变量,在''f''的定义域内取值,那么<math>f(\mathbb E [X]) \le \mathbb E [f(X)],</math>(在这里,<math>E</math>表示[[数学期望]]。) == 凸函數的初等運算 == *如果<math>f </math>和<math>g </math>是凸函數,那麼<math>m(x) = \max\{f(x),g(x) \} </math>和<math>h(x) = f(x) + g(x) </math>也是凸函數。 *如果<math>f </math>和<math>g </math>是凸函數,且<math>g</math>遞增,那麼<math>h(x) = g(f(x))</math>是凸函數。 *凸性在仿射映射下不變:也就是說,如果<math>f(x) </math>是凸函數(<math>x\in\mathbb{R}^n</math>),那麼<math>g(y) = f(Ay+b) </math>也是凸函數,其中<math>A\in\mathbb{R}^{n \times m},\; b\in\mathbb{R}^n.</math> *如果<math>f(x,y) </math>在<math>(x,y) </math>內是凸函數,且<math>C </math>是一個凸的非空集,那麼<math>g(x) = \inf_{y\in C} f(x,y)</math>在<math>x </math>內是凸函數,只要對於某個<math>x </math>,有<math>g(x) > -\infty</math>。 == 例子 == * 函数<math>f(x)=x^2</math>处处有<math>f\,''(x)=2>0</math>,因此''f''是一个(严格的)凸函数。 * [[绝对值]]函数<math>f(x)=|x|</math>是凸函数,虽然它在点''x'' = 0没有导数。 * 当<math>p\geqslant 1</math>时,函数<math>f(x)=|x|^p</math>是凸函数。 * 定义域为[0,1]的函数''f'',定义为''f''(0)=''f''(1)=1,当0<''x''<1时''f''(''x'')=0,是凸函数;它在开区间(0,1)内连续,但在0和1不连续。 * 函数<math>f(x)=x^3</math>的二阶导数为<math>f\,''(x)=6x </math>,因此它在''x'' ≥ 0的集合上是凸函数,在''x'' ≤ 0的集合上是[[凹函数]]。 * 每一个在<math>\mathbb{R}</math>内取值的[[线性变换]]都是凸函数,但不是严格凸函数,因为如果''f''是线性函数,那么<math>f(a + b) = f(a) + f(b)</math>。如果将“凸”替换为“凹”,该命题也成立。 * 每一个在<math>\mathbb{R}</math>内取值的[[仿射变换]],也就是说,每一个形如<math>f(x) = a^T x + b </math>的函数,既是凸函数又是凹函数。 * 每一个[[范数]]都是凸函数,这是由于[[三角不等式]]。 * 如果<math>f </math>是凸函数,那么当<math>t > 0 </math>时,<math>g(x,t) = tf(x/t) </math>是凸函数。 *<math>f(x) = \sqrt x</math>和<math>g(x) = \log(x)</math>为[[单调函数|单调递增]]但非凸的函数。 * 函数''f''(''x'') = 1/''x''<sup>2</sup>,''f''(0)=+∞,在区间(0,+∞)内是凸函数,在区间(-∞,0)内也是凸函数,但是在区间(-∞,+∞)内不是凸函数,这是由于''x'' = 0处的奇点。 == 参见 == * [[凹函数]] * [[凸集]] * [[對數凸函數]] == 参考文献 == <!--added under references heading by script-assisted edit--> {{reflist}} * {{cite web | last = Moon | first = Todd | title = Tutorial: Convexity and Jensen's inequality | url = http://www.neng.usu.edu/classes/ece/7680/lecture2/node5.html | accessdate = 2008-09-04 | archive-date = 2008-04-20 | archive-url = https://web.archive.org/web/20080420125407/http://www.neng.usu.edu/classes/ece/7680/lecture2/node5.html | dead-url = no }} * {{cite book | last = Rockafellar | first = R. T. | title = Convex analysis | url = https://archive.org/details/convexanalysis0000rock | publisher = Princeton University Press | year = 1970 | location = Princeton }} * {{cite book | last = Luenberger | first = David | title = Linear and Nonlinear Programming | publisher = Addison-Wesley | year = 1984 }} * {{cite book | last = Luenberger | first = David | title = Optimization by Vector Space Methods | publisher = Wiley & Sons | year = 1969 }} * {{cite book | last = Bertsekas | first = Dimitri | title = Convex Analysis and Optimization | publisher = Athena Scientific | year = 2003 }} * {{ cite book | last = Thomson | first = Brian | title = Symmetric Properties of Real Functions | publisher = CRC Press | year = 1994 }} * Hiriart-Urruty, Jean-Baptiste, and Lemaréchal, Claude. (2004). Fundamentals of Convex analysis. Berlin: Springer. *{{cite book | author =[[Mark Krasnosel'skii|Krasnosel'skii M.A.]], Rutickii Ya.B. | title=Convex Functions and Orlicz Spaces | publisher= P.Noordhoff Ltd | location=Groningen | year=1961}} * Borwein, Jonathan, and Lewis, Adrian. (2000). Convex Analysis and Nonlinear Optimization. Springer. {{Authority control}} [[Category:各类函数]] [[Category:凸分析]] [[Category:广义凸性]]
该页面使用的模板:
Template:About
(
查看源代码
)
Template:Authority control
(
查看源代码
)
Template:Cite book
(
查看源代码
)
Template:Cite web
(
查看源代码
)
Template:Le
(
查看源代码
)
Template:Link-en
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Rp
(
查看源代码
)
Template:函数凹凸性注意事项
(
查看源代码
)
返回
凸函数
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息