
http://www.ma-xy.com
1.4 支持向量机的求解 第一章 基本支持向量机
凸函数的二阶充要条件 S 是 R
n
中的非空开凸集,f 是 S 上二次可微函数,f 为凸函数的充要
条件为:在每一个 x ∈ S 上,Hesse 矩阵是半正定的。
注:函数 f 在 x
∗
的 Hesse 矩阵 (Hessian Matrix) 定义为
H(x
∗
) =
∂
2
f(x
∗
)
∂x
2
1
∂
2
f(x
∗
)
∂x
1
∂x
2
···
∂
2
f(x
∗
)
∂x
1
∂x
n
∂
2
f(x
∗
)
∂x
2
∂x
1
∂
2
f(x
∗
)
∂x
2
2
···
∂
2
f(x
∗
)
∂x
2
∂x
n
.
.
.
.
.
.
.
.
.
.
.
.
∂
2
f(x
∗
)
∂x
n
∂x
1
∂
2
f(x
∗
)
∂x
n
∂x
2
···
∂
2
f(x
∗
)
∂x
2
n
并且,H 正定的充要条件是 H 左上角各阶主子式都大于 0。
凸函数的一阶充要条件 S 是 R
n
中的非空开凸集,f 在 S 上有一阶连续偏导数,f 为凸函数的
充要条件为:∀x
1
, x
2
∈ S,x
1
= x
2
,有
f(x
2
) > f(x
1
) + ∇f(x
1
)
T
(x
2
− x
1
)
1.3.4 凸规划
上面给出了二次规划以及凸函数,下面我们来看凸规划问题 (关于规划问题的详细说明,参
考后面优化章节)。凸规划是一类特殊的优化问题,含约束的非线性规划问题定义如下
min
w∈R
n
f
(
w
)
s.t.
g
i
(w) ⩽ 0 i = 1, 2, . . . , l
h
j
(w) = 0 j = 1, 2, . . . , m
而凸规划是指 g
i
为连续可微的凸函数,h
j
为仿射函数的规划。仿射函数是指可以用矩阵 A
和向量 b 表示成 f(w) = Aw + b 形式的函数,因为仿射矩阵有空的 Hesse 矩阵,因而为凸。对
于前面提到过的二次规划问题,显然,当 H 为半正定时,二次规划为凸二次规划。
1.4 支持向量机的求解
1.4.1 为什么要讲凸规划
在求解优化问题时,我们会运用到各式各样的算法。然而,绝大多数算法可能求解的是局部
最优解,而非全局最优解。那么是否有特殊类型的规划,它的局部最优解等价于全局最优解呢?
后面将提到 KKT 条件 (库恩 - 塔克) 给出了算法迭代的方向:最优解必定满足 KKT,但满足
KKT 的不一定就是最优解 (即最优解仅属于 KKT 的子集)。但是,如果问题是凸规划问题,那
么 KKT 条件与最优解等价 (充要条件)。
凸规划的局部最优解就是全局最优解,且极值点集合为凸集,如果凸规划的目标是严格凸,
又存在极值点,那么极值点唯一。(证明可以参见《支持向量机:理论算法和拓展》P11)
http://www.ma-xy.com 6 http://www.ma-xy.com