风暴-风暴娱乐-注册登录站

风暴注册

风暴资讯

更多
电话:400-123-4567
传真:+86-123-4567
邮箱:admin@youweb.com
地址:广东省广州市天河区88号

风暴资讯

当前位置: 首页 > 风暴资讯

最优化系列(2)—— 最优化问题

浏览次数:96 发布时间:2024-09-09 13:18:36

标准形式

\\begin{align*}\\min &~ ~ ~ f_0(x)\\\\     \	ext{s.t.}&~~ ~ f_i(x) \\leq 0,~ i=1, \\ldots, m\\\\                 &~ ~ ~ h_j(x)=0, j=1,~ \\ldots, p\\\\ \\end{align*}\\\\\	ag{P}

定义x 是可行解当且仅当 x \\in \\mathrm{dom}(f_0), f_{i}(x)\\le 0, h_{j}(x)=0

定义:可行解 x^* 是(全局)最优解如果 f_0(x^*) \\le f_0(x) 对于所有的可行解 x 成立。

定义:可行解 x^* 是局部最优解,如果存在 R>0f_0(x^*) \\le f_0(x) 对于所有满足 \\|x - x^*\\|_2\\leq R 的可行解成立。

凸优化问题:如果(1)中 f_0f_i 是凸函数, h_j 是仿射函数,那么我们称该优化问题是凸优化问题。

命题:凸优化问题的可行解集一定是凸集。

定理:凸优化问题的局部最优解一定是全局最优解。

证明:

设(P)的可行解集是 Cx^* 是局部最优解,那么存在 \\delta>0 ,使得 f(x)\\ge f(x^*),~\\forall x\\in C\\cap B(x^*, \\delta)

\\forall y\\in C\\exists \\lambda \\in (0,1)\\lambda x^*+ (1 - \\lambda) y \\in B(x^*, \\delta) ,因为 C 是凸集,所以 \\lambda x^*+ (1 - \\lambda) y \\in B(x^*, \\delta) \\cap C ,进而有:

f(\\lambda x^*+ (1 - \\lambda))\\ge f(x^*)\\\\

f(x^*) \\le f(\\lambda x + (1 - \\lambda) y) \\le \\lambda f(x^*) + (1 - \\lambda) f(y) \\\\

所以: f(x^*)\\le f(y) 成立。 \\color{red}{\	ag*{□}}

定理x 是凸优化问题的最优解当且仅当 x 是可行的,并且 \
abla f(x)^\	op (y - x)\\geq 0 对于所有的可行解 y 成立。

推论:

凸优化问题如果存在可行解 x 并且 \
abla f(x)=0 ,那么 x 一定是最优解。

无约束问题的最优解:

凸问题:最优解 等价于 梯度为零

非凸问题:

  • 如果 x 是局部最优解,那么 \
abla f(x)=0
  • 如果 \
abla f(x)=0, \
abla^2 f(x)\\succ 0 ,那么 x 是局部最优解。

我们说两个优化问题(P1),(P2)是等价的:如果可以通过(P1)的最优解得到(P2)的最优解,反之亦然。

产生等价问题的变换:

  1. 变量替换
  2. 目标函数和约束的变换

比如在最小二乘法中下面两个问题是等价的:

\\min \\|Ax - b\\|_{2}\\\\

\\min \\|Ax - b\\|_{2}^2\\\\

2. 松弛变量(Slack variable)

注意到 f\\leq 0 当且仅当 \\exists s \\ge 0, f+s=0 ,所以优化问题(P)等价于:

\\begin{align*}\\min &\\quad f_0(x)\\\\     \	ext{s.t.}&\\quad s_{i}\\geq 0, i=1, \\ldots , m\\\\                 &\\quad f_{i}(x) + s_{i}=0, i=1, \\ldots , m\\\\                 &\\quad h_{i}(x)=0 , i=1, \\ldots , p\\\\ \\end{align*}\\\\\	ag{P3}

注意到(P3)的变量是 (x,s) ,一共有 n+m 个变量,新变量 s 叫做松弛变量。显然(P1)和(P3)等价,这是因为如果 x 是(P1)的最优解,那么 (x, -f_1(x), \\ldots, f_m(x)) 是(P3)的最优解;反之 (x,s) 是(P3)的最优解,那么 x 是(P1)的最优解。

3. 函数上图优化问题(epigraph problem form)

优化问题(P)等价于:

\\begin{align*}\\min &\\quad t\\\\     \	ext{s.t.}&\\quad f_0(x) - t \\leq 0\\\\                 &\\quad f_{i}(x) \\le  0, i=1, \\ldots, m\\\\                 &\\quad h_{i}(x)=0, i=1, \\ldots, p\\\\ \\end{align*}\\\\\	ag{P4}

x 是(P)的最优解当且仅当 (x, f_0(x)) 是(P4)的最优解。

LP(线性规划问题):

\\begin{align*}\\min &\\quad c^\	op x\\\\     \	ext{s.t.}&\\quad x \\geq 0\\\\     &\\quad Ax=0\\\\ \\end{align*}\\\\\	ag{P5}

(P5)是线性规划问题的标准形式,更广泛的线性规划问题是:

\\begin{align*}\\min &\\quad c^\	op x + d\\\\     \	ext{s.t.}&\\quad Gx \\leq h\\\\     &\\quad Ax=b\\\\ \\end{align*}\	ag{P6}

而(P6)和(P5)事实上是等价的:也就是说广泛线性规划问题可以转化为线性规划的标准格式。方法是引入松弛变量 s 和将 x=x^+  - x^- 分为正部和负部,那么(P6)可以转化为:

\\begin{align*}\\min &\\quad c^\	op x^{+}- c^\	op x^{-}+ d\\\\     \	ext{s.t.}&\\quad s \\geq 0, x^{+}\\ge 0, x^{-}\\ge 0\\\\                 &\\quad Gx^{+}- Gx^{-}+ s -h=0\\\\     &\\quad Ax^{+}- Ax^{-}-b=0\\\\ \\end{align*}\\\\

QP(二次规划问题):

\\begin{align*}\\min &\\quad \\frac{1}{2}x^\	op Q x + c^\	op x\\\\     \	ext{s.t.}&\\quad Gx \\leq h\\\\     &\\quad Ax -  b=0\\\\ \\end{align*}\\\\

这里要求 Q\\succeq 0 。可以看到 LP 是 QP 在 Q=0 时的特殊形式

QCQP(二次约束二次规划问题)

\\begin{align*}\\min &\\quad \\frac{1}{2}x^\	op P x + q^\	op x + r\\\\     \	ext{s.t.}&\\quad \\frac{1}{2}x^\	op P_{i}x + q_{i}^\	op x + r_{i}\\leq 0,~ i=1, \\ldots ,m\\\\     &\\quad Ax - b=0\\\\ \\end{align*}\\\\

SOC(二阶锥优化问题)

\\begin{align*}\\min &\\quad f^\	op x\\\\     \	ext{s.t.}&\\quad \\|A_{i}^\	op x + b_{i}\\|_2 \\le c_{i}^\	op x + d_{i}, i=1, \\ldots , m\\\\     &\\quad Fx=g\\\\ \\end{align*}\\\\

c_i=0 时,SOC 退化为一个 QOQP 问题;当 A_i=0 时,SOC 退化为一个 LP 问题。因此SOC 是比 QCQP 更加泛化的问题。

例子:

最优线性分类问题:

假设我们有两类点: A\\colon x_1, x_2, \\ldots ,x_{n}\\in \\mathbb{R}^k, B\\colon x_{n+1}, x_{n+2},\\ldots , x_{n+p}\\in \\mathbb{R}^n ,我们希望找到一个超平面能够使得A、B中的点在超平面两边,并且使得距离超平面最近点到超平面的距离是最大的。

那么优化问题是:

\\begin{align*}\\max_{w, \\beta}\\min_{i=1, \\ldots ,m+p}&\\quad \\frac{|w^\	op x_{i}+ \\beta|}{\\|w\\|_{2}}\\\\     \	ext{s.t.}&\\quad w^\	op  x_{i}+ \\beta > 0, i=1, \\ldots ,m\\\\      &\\quad w^\	op  x_{i}+ \\beta < 0, i=m+1 , \\ldots , m+p\\\\ \\end{align*}\\\\\	ag{P1}

这个优化问题不是一个凸优化问题,但是可以转化为一个凸优化问题:

\\begin{align*}\\min &\\quad \\frac{1}{2}\\|w\\|_{2}^2\\\\     \	ext{s.t.}&\\quad w^\	op x_{i}+\\beta \\leq  -1, i=1, \\ldots , m\\\\      &\\quad w^\	op x_{i}+\\beta \\geq  1, i=m+1, \\ldots , m+p\\\\ \\end{align*}\\\\\	ag{P2}

这是因为对于(P2)的一个可行解 (w, \\beta) ,那么它也是(P1)的可行解,并且 f_{P1}(w, \\beta) \\geq \\frac{1}{\\sqrt{2 f_{P2}(w,\\beta)}} ,因此存在 (w,\\beta) 使得:

f_{P1}(w,\\alpha) \\geq \\frac{1}{\\sqrt{2 v_{P2}}}\\\\

也就是说:

v_{P1}\\geq \\frac{1}{\\sqrt{2 v_{P2}}}\\\\

对于(P1)的一个可行解 (w, \\beta) ,令 \\alpha=\\min_{i=1, \\ldots , m+1}|w^\	op x_{i}+\\beta| ,那么 (\\frac{w}{\\alpha}, \\frac{\\beta}{\\alpha}) 是(P2)的一个可行解,并且有:

\\begin{align*}f_{\	ext{P2}}(\\frac{w}{\\alpha}, \\frac{\\beta}{\\alpha}) &=\\frac{1}{2}\\frac{\\|w\\|_{2}^2}{\\alpha^2}\\\\                                                            &=\\frac{1}{2f_{P1}(w, \\beta)^2}\\\\ \\end{align*}\\\\

因此存在 (w,\\beta) 使得:

f_{P2}(\\frac{w}{\\alpha}, \\frac{\\beta}{\\alpha})=\\frac{1}{2 v_{P1}^2}\\\\

因此:

v_{P2}\\leq \\frac{1}{2 v_{P1}^2}\\\\

因此:

v_{P1}=\\frac{1}{\\sqrt{2 v_{P2}}}\\\\

把下述优化问题:

    \\max_{\\|B\\|_{2}\\leq 1 }A \\cdot B\\\\

转化为 SDP(半定规划)问题。

    \\begin{align*}&\\quad \\|B\\|_{2}\\le 1\\\\     &\\Leftrightarrow B^\	op B \\succeq I_n  \\\\     &\\Leftrightarrow \\begin{bmatrix}I_m	& B	\\\\                          B^\	op	& I_n	\\\\                      \\end{bmatrix}\\succeq 0\\\\     \\end{align*}\\\\

平台注册入口