跳转到内容

对偶性 (最佳化)

维基百科,自由的百科全书

最优化理论中的对偶(duality)或对偶性原则(duality principle)是指最佳化问题可以用两种观点来看待的理论,两种观点分别是“原始问题”(primal problem)及“对偶问题”(dual problem)。对偶问题的解提供了原始问题(假设是最小化问题)的下限[1],不过一般而言,原始问题和对偶问题的最佳解不相同。两个最佳解的差距为对偶间隙。若是凸优化问题,对偶间隙也称为是卡鲁什-库恩-塔克条件

对偶问题

[编辑]

一般而言“对偶问题”是指“拉格朗日对偶问题”(Lagrangian dual problem),不过也有其他的对偶问题,例如Wolfe对偶问题英语Wolfe dual problemFenchel对偶问题英语Fenchel's duality theorem。拉格朗日对偶问题是指在最小化问题上加上拉格朗日乘数,也就是在目标函数上加上对应限制条件的非负拉格朗日乘数,再求解可将原目标函数最小的原始变数值。此解会得到以拉格朗日乘数的函数表示的原始变数,称为是“对偶变数”(dual variables),因此,新的问题就是要衍生对偶变数的限制下(包括非负的限制条件),找到可以使目标函数最大化的对偶变数。

一般而言,给定二个对偶对英语dual pair分隔局部凸空间英语locally convex space ,以及函数,可以定义原始问题为找到使得 换句话说,若存在,是函数最小极值(minimum),也可以得到函数的最大下界(infimum)。

若有限制条件,可以整合到函数中,方式是令,其中是在上的适当函数,在限制条件上有最小值0,可以证明。后者的条件很明显,但不一定很方便可以符合示性函数(也就是说,满足限制条件的,在其他情形,)。因此可以将延伸为扰动函数使得[2]

对偶间隙就是不等式

左侧和右侧的差。

其中是二个变数的凸共轭,而上确界[2][3][4]

线性规划

[编辑]

线性规划问题是指损失函数约束都是线性关系最优化问题。原始问题中,目标函数是n个变数的线性组合,问题有m个约束,每一个都有上限,上限由n个变数的线性组合表示。其目的是要在满足限制条件的情形下,最大化目标函数的值。其解是由n个值表示的向量,可以让目标函数有最大值。

在对偶问题中,目标函数是m个值的线性组合,这些是原始问题中m个限制条件的上下限。有n个对偶限制条件,每一个的下限都是由m个对偶变数的线性组合所表示。

原始问题和对偶问题的关系

[编辑]

针对线性的最佳化问题,在原始问题中每一个符合限制条件的次佳点,都有一个方向(或方向的子空间),可以往目标函数增加的方向移动。若往这类的方向移动,称为除去候选解英语candidate solution和一个或多个限制之间的松弛量(slack)。候选解中不可行的值即为超过一个或多个限制的值。

在对偶问题中,会将对偶向量和限制条件相乘,这些限制条件会决定原始问题中限制条件的位置。在对偶问题中变动对偶向量类似在原始问题中调整上限。要找到最小的上限。也就是说,要将对偶向量最小化,以移除限制的候选位置和实际最佳解之间的松弛量(slack)。对偶向量中的不可行值是指哪些太低的值。这会让候选解的一个或多个限制条件落在排除实际最佳解的位置。

线性规划中探讨对偶性的方程式中,会对上述直觉有型式化的叙述。

非线性规划

[编辑]

非线性规划中的限制条件不一定是线性的,不过许多线性规划的原则还是适用。

为了确保可以简单的识别非线性规划中的全域最大值,问题一般会要求函数要是凸函数,而且有紧致的lower level sets。

由此可以看出卡鲁什-库恩-塔克条件的重要性。卡鲁什-库恩-塔克条件可以提供非线性规划问题中识别局部最佳值的必要条件。也有一些额外的必要条件(约束规范,constraint qualifications)可以用来判断可能有“最佳解”(是局部最佳解,但不一定是全域最佳解)的方式。

强拉格朗日原则:拉格朗日对偶

[编辑]

考虑以下形式的非线性规划:

其定义域有非空的内部。其拉格朗日函数定义为

向量是有关此问题的“对偶变数”(dual variables)或拉格朗日乘数向量(Lagrange multiplier vectors)。拉格朗日对偶函数(Lagrange dual function)定义如下

对偶函数g是凹函数,就算初始问题不是凸也会如此,因为是仿射函数的点状最大下界。对偶函数提供初始问题最佳值的下界:针对任意及任意,可以得到

若满足约束规范(例如斯莱特条件英语Slater's condition),且原问题是凸,则可以得到强对偶英语strong duality

凸问题

[编辑]

针对有不等式限制的凸最小化问题

拉格朗日对偶问题为

其中目标函数是拉格朗日对偶函数。假设函数 and 连续可微,最大下界出现在梯度等于零的位置。问题

称为Wolfe对偶问题。此问题用计算的方式处理可能会很困难,因为目标函数在联合变数上不是凹。而且,一般而言,等式的限制条件也是非线性的,因此Wolfe对偶问题一般而言会不会是凸最佳化问题。不论如何,弱对偶英语weak duality会成立[5]

历史

[编辑]

依照乔治·伯纳德·丹齐格所述,在丹齐格提出了线性规划问题后,约翰·冯·诺伊曼就提出了线性规划的对偶性定理的猜想。冯·诺伊曼注意到他使用了来自其博弈论中的资讯,并且猜想两人零和的矩阵博弈和线性规划等效。严谨的证明最早是由阿尔伯特·塔克和其团队发表(丹齐格在Nering和塔克1993年著作中的前言)

相关条目

[编辑]

脚注

[编辑]
  1. ^ Boyd, Stephen P.; Vandenberghe, Lieven. Convex Optimization (pdf). Cambridge University Press. 2004: 216 [October 15, 2011]. ISBN 978-0-521-83378-3. (原始内容存档 (PDF)于2021-05-09). 
  2. ^ 2.0 2.1 Boţ, Radu Ioan; Wanka, Gert; Grad, Sorin-Mihai. Duality in Vector Optimization. Springer. 2009. ISBN 978-3-642-02885-4. 
  3. ^ Csetnek, Ernö Robert. Overcoming the failure of the classical generalized interior-point regularity conditions in convex optimization. Applications of the duality theory to enlargements of maximal monotone operators. Logos Verlag Berlin GmbH. 2010. ISBN 978-3-8325-2503-3. 
  4. ^ Zălinescu, Constantin. Convex analysis in general vector spaces有限度免费查阅,超限则需付费订阅. River Edge, NJ: World Scientific Publishing Co., Inc. 2002: 106–113. ISBN 981-238-067-1. MR 1921556.  |issue=被忽略 (帮助)
  5. ^ Geoffrion, Arthur M. Duality in Nonlinear Programming: A Simplified Applications-Oriented Development. SIAM Review. 1971, 13 (1): 1–37. JSTOR 2028848. doi:10.1137/1013001. 

参考资料

[编辑]

书籍

[编辑]

论文

[编辑]