《凸优化》第五章部分习题
5.6
(a)
(b)
容易得到 |\hat\nu|_1\leq1 ,|\tilde{\nu}|_1\leq1 。
即两个 \nu 都是问题的可行解。考虑 b^T\nu:
即 \tilde{\nu} 给出了更好(大)的下界。和(a)相比:
比 (a) 给出了一个更好的下界。
总结:
解是一些矩阵代换。不过这一题还给出了一个通过最小二乘问题等其他问题的对偶问题来逼近原问题最优解的方法。通常这类问题没有解析解,通过其他问题的对偶问题的分析得到的下界通常比一般不等式要好。
5.7
(a)
对偶问题:
由于原函数有线性部分,考虑 g(\nu):
优化 x 时, \sum\nu^T a_i=0, i.e. A^T\nu=0 否则拉格朗日函数无下界。
优化 y 时,\max y_i-\nu^Ty=0 否则拉格朗日函数无下界,即 v^T\textbf{1}=1 。
等价对偶问题:
(b)
原问题的上境图形式为LP:
约束等价变换:
对偶问题:
和(a)中对偶问题完全等价。
(c)
考虑无约束几何规划对偶问题的最优解 d^\star 以及其最优点 z^\star :
将其变换成LP ,对某个 \nu 有以下式子成立:
又因为 z^\star 在GP对偶问题上的可行域也是原分片线性极小化对偶问题的可行域,即 z^\star 为此LP的可行解:
(d)
写出对偶问题,先变换问题为
拉格朗日函数:
x 的最优化条件为 A^T\lambda=0 ,对 y 第一项为 Log-Sum-Exp 函数,其导数为 Softmax。即 y 的最优化条件为:
对偶问题为:
按照处理(c)中GP对偶问题的步骤,第二项可以放缩为 1/\gamma \log m令其最优解为 p^\star_{gp}(\gamma)-1/\gamma\log m 有:
可看出 \gamma 变大会让此优化问题逼近 p^\star_{pw1} 。
总结:
问题的拉格朗日对偶问题常常会因为保证满足优化时极小值可达所需要的条件,从而消去一些项使目标函数或约束变得简单 (拉格朗日对偶问题优化拉格朗日变量,对原问题优化变量直接取inf下界,化成等价问题时常常消去inf,即把原优化变量全部去掉),等价问题还可能直接优化成LP形式。(c)的解法比较技巧化,即通过辅助的LP问题分析,能用到之前分片线性极小化问题的性质。
5.16
(a)
因为 $f0 凸, f_i 凸,所以 \max{0, f_i} 凸,所以 \max{i=1,\cdots,m}\max{0,f_i} 凸,所以 \phi$ 凸。
(b)
优化 g’(\lambda,\nu) 的等价问题:
(c)
\lambda^\star 为原对偶问题最优解:
辅助问题最优解 x_s^\star\geq \lambda^\star_s ,且容易知道辅助问题对偶最优解 \lambda^\star_s 在原对偶问题上可行。又有 \alpha>\textbf{1}^T\lambda^\star , 即 \lambda^\star 也是辅助问题对偶最优解,两者可行域以及优化函数等价,辅助问题的最优解是其对偶问题最优解,由于原问题强对偶成立,所以对偶问题最优解也是原问题最优解,即:辅助问题的最优解也是原问题的最优解。
总结:
比较常规的对偶分析。罚函数项和一些损失函数正则项有相似之处。
5.23
(a)
设不存在这样的 z ,即 -c\notin{\sum z_ia_i\mid z_i\geq0} ,右侧为闭凸集,根据严格分离超平面定理,存在超平面 u^Tx 严格分离点和集合。即:
约束为 z\succeq 0 ,可以看出 u^Tc<0, u^TA^T<0 。令 x=x^\star+tu :
即 x 可行;考虑目标函数:
我们找到了比 x^\star 更优的解,矛盾。所以存在满足题意的 z 。
(b)
对偶问题可行即 -b\notin {Ax+s\mid s\succeq0} ,右侧为闭凸集,根据严格分离超平面定理,存在超平面 v^Tx 严格分离点和集合。即:
在 x 任意取值下成立需要 v^TA=0 , 等价式子为:
那么对偶问题可行性条件 A^Tz+c=0=A^T(z+v) ,即对偶问题在 v 方向上是无界的, d^\star =\infty。
(c)
原问题容易看出不可行 (0\leq -1),p^\star=\infty 。
可行性条件 \lambda_1+1=0 ,对偶线性规划:
容易看出此问题约束 \lambda_1=-1\geq0 不能满足,对偶问题不可行。d^\star=-\infty 。
5.27
拉格朗日函数:
KKT条件:
最优解 x^\star 可以用 \nu^\star 显式表达:
代入 Gx^\star-h=0, x^\star=G^{-1}h 后 \nu^\star 可独立写出: