http://www.ma-xy.com

第一章二阶椎规划 1

1.1 问题的引入与分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 凸二次规划的转化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.2 凸二次约束线性规划的转化 . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.1.3 凸二次约束二次规划问题 QCQP . . . . . . . . . . . . . . . . . . . . . . . 2

1.1.4 支持向量机的锥形式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2

模型规范化及其基本理论

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.1 二阶椎和二阶椎规划的定义 . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.2 拉格朗日对偶问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2.3 二阶锥规划的研究进展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2.4 最优化条件及对偶定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.3 最优化算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.1 原始 - 对偶内点算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.2 非精确不可行内点算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.3 预估校正算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.4 基于核函数的原始-对偶内定算法 . . . . . . . . . . . . . . . . . . . . . . . 15

http://www.ma-xy.com

第一章二阶椎规划

1.1 问题的引入与分析

为了说明二阶椎规划的重要性，我们先将如下几个优化问题转化为二阶椎规划 SOCP 问题：

1. 凸二次规划的转化；

2. 凸二次约束线性规划的转化；

3. 凸二次约束二次规划的转化；

4. 支持向量机的二阶锥形式；

1.1.1 凸二次规划的转化

考虑如下的严格凸二次规划问题

min f(x) = x

Qx + a

x + β

s.t.







Ax = b

x ⩾ 0

其中：Q 是一个对称正定矩阵，即 Q = Q

> 0；a ∈ R

, β ∈ R, A ∈ R

m×n

。令 ¯u = Q

−

a，

则目标函数 f 可以写为

f(x) = ∥¯u∥

+ β −

−1

于是原问题变为

min u

s.t.











Ax = b

x − ¯u = −

−

; ¯u) ⪰ 0

x ⪰ 0

其中：⪰ 是定义在 K 上的偏序。∀x, y ∈ K，如果 x − y ∈ K，记为 x ⪰ K

或 x ⪰ y, x ∈ R

。

http://www.ma-xy.com

1.1 问题的引入与分析第一章二阶椎规划

1.1.2 凸二次约束线性规划的转化

考虑凸二次约束线性目标规划问题

min

s.t.







x + a

x + β

⩽ 0

i ∈ I = {1, 2, . . . , r}

其中：对

作

Cholesky

分解，设

(i = 0, 1, . . . , m)，B

∈ R

×n

，rank(B

) = k

, i ∈ I。

记 q(x) = x

Bx + a

x + β ⩽ 0，则

(Bx)

Bx ⩽ 1 · (−a

x − β)

即 ∥Bx∥

⩽ (

1−a

x−β

)

− (

1+a

x+β

)

。令



1 − a

x − β



¯u =



1+a

+β



于是 q(x) = ∥¯u∥

− µ

⩽ 0。

1.1.3 凸二次约束二次规划问题 QCQP

考虑凸二次约束二次规划问题 QCQP

min x

x + a

x + β

s.t.







x + a

x + β

⩽ 0

i = 1, 2, . . . , m

其中：a

∈ R

，β

∈ R，Q

为对称半正定，即 Q

⪰ 0(i = 1, 2, . . . , m)，x ∈ R

。

对 Q

作 Cholesky 分解，设 Q

= B

(i = 0, 1, . . . , m)，则原问题变为如下二阶锥规划

min t

s.t.











; ¯u

) ⪰ 0 i = 1, 2, . . . , m

1 + a

x − β

+ t

¯u =



x+β

−t+1



1 − a

x − β

¯u



x+β



http://www.ma-xy.com 2 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.1 问题的引入与分析

1.1.4 支持向量机的锥形式

SVM 针对大规模不是十分有效，Debrath、Muramatsu 和 Takahashi 于 2005 年给出了一个

针对大规模问题的基于二阶锥规划的支持向量机学习方法。考虑二分类支持向量机的一般形式

min

w + C



i=1

s.t.











ϕ(x

) + b) ⩾ 1 − ξ

⩾ 0

i = 1, 2, ···

其中：C 为罚权重，ϕ(x

) 是一个将 x

映射到高维的映射，y

= {−1, 1}，w 为优化参数，{x

, y

}

i=1

为样本数据且已知。

上述模型的对偶问题为

min

Qα − e

s.t.







α = 0

0 ⩽ α

⩽ C

其中：α 为拉格朗日乘子，e 为单位向量，Q ⩾ 0，Q

= y

K(x

)。K(x

) =



ϕ(x

), ϕ(x

)



是内积核。将模型重新写为

min

Qα − e

s.t.











α = 0

α + β = Ce

α, β ⩾ 0

α, β ∈ R

其中：β 为松弛变量，Q ⩾ 0，设 Q 的秩为 r，其 Cholesky 分解为 Q = BB

，其中 B ∈ R

l×r

，

则

Qα = α

α = ∥B

α∥

于是，极小化 α

Qα 等价于在约束 ∥B

α∥

下极小化 θ。利用双曲约束的等价关系：

w ⩽ xy, w ∈ R

, x ∈ R

, y ∈ R

⇔ (x + y; 2w; x − y) ⩾ 0

可以把约束 ∥B

α∥

⩽ Q 转化为



θ − 1



+ ∥B

α∥

⩽



θ + 1



http://www.ma-xy.com 3 http://www.ma-xy.com

http://www.ma-xy.com

1.2 模型规范化及其基本理论第一章二阶椎规划

令

u = B

θ + 1

θ − 1

则模型定为

min

+ z

) − e

s.t.











α = 0

α + β = Ce

α − u = 0, u ∈ R

− z

= 1

α, β ⩾ 0

⩾ z

+ ∥w∥

上述问题是一个二阶锥规划。

1.2 模型规范化及其基本理论

1.2.1 二阶椎和二阶椎规划的定义

定义 (二阶锥) 二阶锥又称为 Lorentz 锥，n 维二阶锥 K

的定义为

= {(x

, x

) ∈ R × R

n−1

⩾ ∥x

∥}

其中：∥ · ∥ 为 L

范数，如果是其它范数，亦可定义其它锥。

定义二阶锥内部为

intK

= {(x

, x

) ∈ R × R

n−1

> ∥x

∥}

不难看出在 R, R

, R

中二阶锥的形状，如图 (1.1) 所示

http://www.ma-xy.com 4 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.2 模型规范化及其基本理论

图 1.1: 三维二阶锥示意图

上面给出了二阶锥 K 的定义，二阶锥规划就是在二阶锥内求变量 x 使目标最优，即最优化

模型的约束条件为二阶锥条件。

二阶锥规划的标准形式为

min



i=1

s.t.













i=1

= b

∈ K

i ∈ I

其中：I = {1, 2, . . . , r}，b ∈ R

，C

∈ K

，A

∈ R

m×n

，K

= {(x

, ¯x

) ∈ R

⩾ ∥¯x

∥}，

= (x

, ¯x

) 表示 (x

, ¯x

)

，且 ¯x

= (x

, x

, . . . , x

, )。

1.2.2 拉格朗日对偶问题

为得到上述问题的对偶形式，将 x

∈ K

转化为



j=2

− ¯x

⩽ 0及x

⩾ 0

对 u

⩾ 0, i ∈ I，有





j=2

− ¯x



= −







j=2

(−u



我们设

= (u

, −u

, . . . , u

)

∈ R

显然 s

∈ K

，且





j=2

− x



= −s

i ∈ I

http://www.ma-xy.com 5 http://www.ma-xy.com

http://www.ma-xy.com

1.2 模型规范化及其基本理论第一章二阶椎规划

于是原问题的 Lagrange 对偶函数为

θ(s

, y) = inf





i=1

−



i=1

+ y



b −



i=1



= inf





i=1

− s

− A

+ b



其中：y ∈ R

。当 c

− s

− A

y = 0 时，θ(s

, y) = b

y，故对偶问题可描述为

max b

s.t.







y + s

= c

i ∈ I

∈ K

这里，s

为松弛变量，y ∈ R

为决策变量。

令

K = K

× K

× ··· × K

A = (A

, A

, ··· , A

) ∈ R

m×n

C = (c

, c

, ··· , c

) ∈ R

x = (x

, x

, ··· , x

) ∈ K

s = (s

, s

, ··· , s

) ∈ K

n = n − 1 + n

+ ··· + n

则原二阶锥规划及其对偶问题可简写为如下形式

min{c

x|Ax = b, x ∈ K}

max{b

y|A

y + s = c, s ∈ K}

注：假设 A 是行满秩的，即 rank(A) = m, m ⩽ n。

二阶锥规划 (SOCP) 介于线性规划和半正定规划之间，属于凸优化问题。目标函数是线性函

数，约束是一个仿射空间和有限个二阶锥的笛卡尔积交空间。

1.2.3 二阶锥规划的研究进展

todo: 未完成：引入最优化基础.docx 的 5-5.2。

1.2.4 最优化条件及对偶定理

作为研究二阶锥规划的代数基础，欧几里得约当 (Jordan) 代数显示了它独有的功效。1994 年

Faraut 和 Koranyi 在《Analysis on Symmetric Cones》中指出：Jordan 代数使线性规划、半定规划

和二阶锥规划有了统一的理论基础。Alizadeh 和 Goldfard 在《second-order-conc programming》

http://www.ma-xy.com 6 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.2 模型规范化及其基本理论

中提出了针对二阶锥规划的 Jordan 代数，指出对它们的理解可使人们观察到二阶锥规划问题的

所有方面：从对偶性、互补性到非退化条件，最终到内点法的设计与分析。下面给出论文中的一些

结论，为了书写方便，令 K = K

。对于任意的 x = (x

, ¯x) ∈ R ×R

n−1

和 s = (s

, ¯s) ∈ R ×R

n−1

，

与二阶锥 K 相伴的 Jordan 积定义为

x ◦ s = (x

s, x

¯s + s

¯x)

对上述的 Jordan 积 (R

, ◦)，有如下性质

：

(1) 对 ∀α, β ∈ R，有分配律

x ◦ (αy + βz) = αx ◦ y + βx ◦ z

(αy + βz) ◦ x = αy ◦ x + βz ◦ x

(2) x ◦ s = s ◦ x；

(3) 设向量 e 为唯一的单位元，e = (1, 0, . . . , 0)

∈ R

x ◦ e = e ◦ x = x

(4) 令 x

= x ◦ x，则 ∀s ∈ R

，有 x ◦ (x

◦ s) = x

◦ (x ◦ s)。

定义 (向量特征值) ∀x = (x

, ¯x) ∈ R × R

n−1

，有

− 2x

x + (x

+ ∥¯x∥

)e = 0

我们称多项式

P (λ, x) = λ

− 2x

λ + (x

− ∥¯x∥

) = 0

为 x 的特征多项式，并且称特征多项式的两个根 λ

(x) = x

− ∥¯x∥ 和 λ

(x) = x

+ ∥¯x∥ 为 x 的

特征值。

对 ∀x ∈ R

，易证明下面的等式成立

x =

− ∥¯x∥)



−

¯x

∥¯x∥



+ ∥¯x∥)



¯x

∥¯x∥



注：Jordan 积’◦’ 一般不满足结合律，即 ∀x, y, z ∈ R

。

(x ◦ y) ◦ z = x ◦ (y ◦ z)

但在内积定义下，结合律成立

⟨

x, y ◦ z

⟩

⟨

x ◦ y, z

⟩

http://www.ma-xy.com 7 http://www.ma-xy.com

http://www.ma-xy.com

1.2 模型规范化及其基本理论第一章二阶椎规划

定义 (特征值分解) ∀x = (x

, ¯x) ∈ R × R

n−1

，其特征值分解为

x = λ

(x)u

(1)

+ λ

(x)u

(2)

其中：特征值 λ

(x) = x

− ∥¯x∥, λ

(x) = x

+ ∥¯x∥。特征向量 (i = 1, 2)

(i)













1 − (−1)

¯x

∥¯x∥



¯x = 0



1 − (−1)



¯x = 0

这里，w ∈ R

n−1

是满足 ∥w∥ = 1 的任意向量。

易知

x ∈ K ⇔ λ

(x) ⩾ λ

(x) ⩾ 0

x ∈ intK ⇔ λ

(x) ⩾ λ

(x) > 0

注意到，u

(1)

, u

(2)

属于 K，但不属于 intK。此外

(1)

◦ u

(2)

= 0, u

(1)

+ u

(2)

= e, ∥u

(1)

∥ = ∥u

(2)

∥ =

√

(1)

◦

(1)

, u

(2)

◦

(2)

利用向量的特征值分解，可以定义

¬绝对值：|x| = |λ

(x)|u

(1)

+ |λ

(x)|u

(2)

, ∀x ∈ K;

平方：x

= λ

(x)

(1)

+ λ

(x)

(2)

;

®平方根：

√

x =



(x)u

(1)



(x)u

(2)

¯逆：x

−1

= λ

(x)

−1

(1)

+ λ

(x)

−1

(2)

。

容易证明下列关系式成立

|x| =

√

, x

= x ◦ x, (

√

= x

并且，如果 x

−1

存在，则称 x 可逆，且满足 x ◦ x

−1

= e。

对任意的 x = (x, ¯x) ∈ R × R

n−1

，其行列式和迹分别定义为

det(x) = λ

(x)λ

(x) = x

− ∥¯x∥

Tr(x) = λ

(x) + λ

(x) = 2x

对任意的 x = (x, ¯x) ∈ R × R

n−1

，定义对称矩阵



x ¯x

¯x x



∈ R

n×n

其中：I 为 n − 1 × n − 1 的单位矩阵。有

x ◦ s = s ◦ x = L

s = L

x = L

http://www.ma-xy.com 8 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.2 模型规范化及其基本理论

这里，当且仅当 x ∈ K(x ∈ intK) 时，L

是半正定矩阵 (正定矩阵)。此外，如果 x ∈ intK，那

么矩阵 L

可逆：

−1

det(x)



−¯x

det(x)

I +

¯x¯x



上面分析了 K 为单一二阶锥的情况，所有结论可平行推广到 K = K

×K

×···K

的情

形。令 x = (x

···x

)，s = (s

···s

)，x

, s

∈ K

，i = (1, 2, ··· , r)，则

(1) x ◦ s = (x

◦ s

, ··· , x

◦ s

)；

(2) L

= diag(L

, L

, ··· , L

)；

(3) Tr(x) =



i=1

Tr(x

) =



i=1

[λ

) + λ

)]；

(4) det(x) =



i=1

det(x

) =



i=1

) + λ

)；

(5) x 的特征值具有 2r 个 (含多重特征值，由 x

, ··· , x

的特征值构成)；

(6) 如果 x

∈ intK

，则 x

−1

= (x

−1

, ··· , x

−1

)。

上面介绍了一些欧几里得约当 (Jordan) 代数在二阶锥问题中的一些具体理论。下面，我们

利用这些理论来分析二阶锥规划最优性条件及对偶理论。并在此基础上介绍一些最优化算法。

弱对偶定理

设

和

(

y, s

)

分别为二阶锥规划原问题和对偶问题的可行解，则对偶间隙为

x − b

y = x

s ⩾ 0

强对偶定理如果二阶锥原问题和对偶问题均存在严格可行解，则原问题和对偶问题存在最优解

∗

和 (y

∗

, s

∗

)，并且 p

∗

= c

∗

= b

∗

= d

∗

。这里：p

∗

, d

∗

为原始问题 (P) 和对偶问题 (D) 的最

优解。

半强对偶定理如果原问题存在严格可行解，并且其目标函数值在可行域内有下界，则对偶问题

可解，且 p

∗

= d

∗

。

互补条件对 ∀x = (x

···x

) ∈ K, s = (s

···s

) ∈ K，x

∈ K

, s

∈ K

, i = 1, 2, ··· , r，使

s = 0，当且仅当 x

◦ s

= 0，即

(i) x

= x

+ ¯x

¯s

= 0

(ii) x

¯s

+ s

¯x

= 0

KKT 条件 - 最优化条件假设原问题和对偶问题存在严格可行解，则 (x, y, s) 是其最优解的充

要条件是

Ax = b x ∈ K

y + s = c s ∈ K

x ◦ s = 0

http://www.ma-xy.com 9 http://www.ma-xy.com

http://www.ma-xy.com

1.3 最优化算法第一章二阶椎规划

1.3 最优化算法

内点算法是求解二阶锥规划最有效的方法之一。内点法要求初始搜索点在可行域内 (如何选

取 x

？)。2004 年 Zhou 和 Toh 在《Polynomiality of an inexact infeasile interior point algorithm for

semidente Programming》中提出一种求解半定规划的非精确不可行内点算法，此方法可推广到

二阶锥规划中，但其初始点的选取受到某个最优解的限制。1996 年，Nemirovskii 和 Scheinberg 在

《Extension of Karmarkar’s algorithm onto convex quadratically constrained quadratic problems》

中证明了线性规划的原始对偶内点法可推广到二阶锥规划中。1994 年 Adler 和 Alizadeh 研究了

求解半定规划和二阶锥规划统一的原始—对偶方法，提出了适用于二阶锥规划的搜索方向。2000

年，Monteiro 和 Tsudiya 介绍了确定二阶锥规划 AHO 搜索方向的牛顿方程组，给出了沿 AHO

方向的二阶锥规划的预估—校正算法的多项式收敛性。

1.3.1 原始 - 对偶内点算法

内点法通常称为严格可行内点算法，因为算法所产生的所有迭代点都严格可行，其基本思想

是：在可行域内选取中心路径的一个领域，算法始终追踪在这个邻域内。原始—对偶内点法的基

本思想是：在中心路径附近取一个初始点，然后求一个搜索方向使对偶间隙能够减小。

记原始规划和对偶规划的可行解与严格可行解为

F (P ) = {x|Ax = b, x ∈ K}

F (D) = {(y, s)|A

y + s = c, s ∈ K}

(P ) = {x|Ax = b, x ∈ intK}

(D) = {(y, s)|A

y + s = c, s ∈ intK}

假设：F

(P ) × F

(D) = 0，且 A 的行向量是线性无关的。由强对偶定理可知，P 和 D 都存在

最优解，且最优值相等。此外，解 P 和 D 等价于求解 KKT 条件

Ax = b x ∈ K

y + s = c s ∈ K

x ◦ s = 0

定义向量值函数 F : R × R

× R → R

2n+m

F (x, y, s) =







Ax − b

y + s − c

x ◦ s







则有 F (x, y, s) = 0。把 KKT 条件加以扰动，有

Ax = b x ∈ K

y + s = c s ∈ K

x ◦ s = µe

http://www.ma-xy.com 10 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.3 最优化算法

上述方程称为中心路径方程。

已证明，上述方程对任意 µ > 0 都有唯一解 (x(µ), y(µ), s(µ))，当 µ 取遍所有正数时，这些

解的轨迹称为中心路径。在中心路径方程中，分别以 x + ∆x, y + ∆y, s + ∆s 代替 x, y, s，并去

掉含 ∆x, ∆s 的非线性项，得到

A∆x = r

= b − Ax

∆y + ∆s = r

= c − A

y − s

∆s + L

∆x = µe − L

上式又可以写成矩阵形式







A 0 0

0 A

0 L













∆x

∆y

∆s



















解上述方程，即可得到搜索方向 (∆x, ∆y, ∆s)

∆y = (AL

−1

)[r

+ AL

−1

− r

)]

∆s = r

− A

∆y

∆x = −L

−1

∆s − r

)

在此基础上，我们给出中心路径邻域的概念：

= diag(L

, ··· , L

)



¯x



对 ∀x, s ∈ R

，定义



− ∥¯x

∥



¯x

I +

¯x



= diag(T

, ··· , T

)

= (w

, ··· , w

) = T

且

= L

= T

−1

) = w

− ∥¯w

∥

) = w

− ∥¯w

∥

http://www.ma-xy.com 11 http://www.ma-xy.com

http://www.ma-xy.com

1.3 最优化算法第一章二阶椎规划

对 ∀(x, s) ⊂ intK × intK，定义距离如下

(x, s) =

√

2∥W

− µe∥

∞

(

x, s

) =

max

i=1,2,...,r

j=1,2

−j

) − µ|

给定常数 β ∈ (0, 1)，定义中心路径的邻域为

(β) = {(x, s) ∈ F

(P ) × F

(D)|d

(x, s) ⩽ βµ} β = γ τ = µ

∞

(β) = {(x, s) ∈ F

(P ) × F

(D)|d

∞

(x, s) ⩽ βµ}

显然，d

∞

(x, s) ⩽ d

(x, s)，所以 N

(β) ⊂ N

∞

(β)。下面，给出基于 AHO 搜索方向与路径跟踪内

点法：

step1. 初始化。

路径参数 β ∈ (0,

)，δ ∈ (0, 1)，满足

φ(β

+ δ

)

(1 − 3β)

⩽



1 −

√



令 σ = 1 −

√

，ε ∈ (0, 1)。初始点 (x

, y

, s

) ∈ N(β)

置 k := 0。

step2. 计算搜索方向 (∆x

, ∆y

, ∆s

)。计算 µ

，若 µ

⩽ ε，则终止；否则，转到 step3。

step3. 计算步长 α。

= max{α ∈ (0, 1)|(x

(α

′

), y

(α

′

), s

(α

′

)) ∈ N(β), ∀α ∈ (0, α

′

]}

其中：(x

(α

′

), y

(α

′

), s

(α

′

)) = (x

, y

, s

) + α(∆x

, ∆y

, ∆s

)。

step4. 求点 (x

k+1

, y

k+1

, s

k+1

)

k+1

, y

k+1

, s

k+1

) = (x

, y

, s

) + α

(∆x

, ∆y

, ∆s

)

置 k := k + 1，转到 step2。

在上面的原始 - 对偶内点算法中，选取不同的搜索方向和中心路径邻域就产生了不同的算

法。

1.3.2 非精确不可行内点算法

定义不可行中心路径：

S = {(x, y, s) ∈ K × R

× K|F (x, y, s) = 0}

= {(x, y, s) ∈ intK × R

× intK|x

s ⩽ ε, ∥r

∥ ⩽ ε, ∥r

∥ ⩽ ε}

C = {(x, y, s) ∈ intK × R

× intK|r

= (µ/µ

, r

= (µ/µ

, x ◦ s = µe}

http://www.ma-xy.com 12 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.3 最优化算法

毫无疑问：S 是 KKT 条件 F = 0 的解集，S

是 F = 0 的 ε 近似解集。称 C 为 (x

, y

, s

) 为

不可行中心路径，其中

> 0 µ =

> 0 K

= intK

定义不可行中心路径 C 的邻域

N(β, µ) = {(x, y, s) ∈ intK × R

× intK|d

(x, s) =

√

2∥W

− µe∥ ⩽ βµ}

给定当前点 (x, y, s) ∈ intK×R

×intK，基于 AHO 方向的原始-对偶内点算法通常取下列方程

组的解是 (dx, dy, ds) = (∆x, ∆y, ∆s) 为牛顿方向

A∆x = b − Ax

∆y + ds = c − A

y − s

∆x + L

∆s = µe − L

我们取下面方程组的解 (∆x, ∆y, ∆s) 为非精确搜索方向

A∆x = b − Ax + ρφ

∆y + ∆s = c − A

y − s + ρφ¯c

∆x + L

∆s = (1 − y)µe − L

其中：ρ ∈ (0, 1)，η ∈ (0, 1)，

b = Ax

− b，¯c = Ay

− s

− c。

这里，初始点 (x

, y

, s

) 取 x

= s

= ξe, 0 < ξ < 1 是一个常数。下面，给出非精确不可行

内点算法。

step1. 初始化。

β ∈ (0,

)，ρ ∈ (0, 1)，0 < τ < 1−ρ < η < 1，φ = 1，x

= s

= ξe, 0 < ξ < 1，µ

= ξ

。

并且 (φ

, µ, x

, y

, z

) ∈ N(β, µ

)，容许误差 ε > 0，置 k := 0。

step2. 求非精确搜索方向 (∆x

, ∆y

, ∆s

)。

step3. 计算 α

φ(α) = (1 − 2α)φ

µ(α) = (1 − ηα)µ

= max{¯α ∈ (0, 1)|(φ(α), µ(α), x

(α), y

(α), s

(α)) ∈ N, ∀α ⊂ (0, ¯α]}

其中：(x

(α), y

(α), s

(α)) = (x

, y

, s

) + α(∆x

, ∆y

, ∆s

)。

step4. 求点 (x

k+1

, y

k+1

, s

k+1

)

k+1

, y

k+1

, s

k+1

) = (x

, y

, s

) + α

(∆x

, ∆y

, ∆s

))

k+1

= (1 − τα

)φ

k+1

= (1 − ηα

)µ

若 φ

k+1

⩽ ε，终止迭代；否则置 k := k + 1，返回 step2。

http://www.ma-xy.com 13 http://www.ma-xy.com

http://www.ma-xy.com

1.3 最优化算法第一章二阶椎规划

算法性质：

¬设 (x

, y

, s

) ∈ N，选取 β ∈ (0,

)，0 < ρ < 1，0 < τ < 1 − ρ < η <

1−5β

1+2

√

2r−3β

，假定

(∆x

, ∆y

, ∆s

) 为非精确方程的解，且满足 ∆

, ∆s

⩾ 0，令 ¯α = (1 − 2

√

2τ − η)β/4τ

，则

当 α ∈ (0, ¯α] 时，有 (φ(α), µ(α), x

(α), y

(α), s

(α)) ∈ N。

多项式收敛性。设 {(x

, y

, s

)} 为算法产生的序列，且 ∆

∆s

⩾ 0。令 ϵ > 0，β ∈ (0,

)，

ρ ∈ (0, 1)。如果 0 < τ < 1 −ρ < η <

1−5β

1+2

√

2r−3β

，则算法至多经过 K = O(

√

rlnε

−1

) 次迭代终止。

1.3.3

预估校正算法

1996 年 Miao 提出了关于线性规划的两个不可行内点预估—校正算法。预估方向分别采

用了牛顿方向和欧拉方向，每次迭代算法需要接两个线性方程组。算法是全局收敛的，且有

O(n ln(1/ε)) 迭代复杂性界。n 为线性规划中自变量 x 的维数。而且预估方向是牛顿方向的算法

在最优解存在的假设下还具有 Q - 二阶收敛性。

step1. 初始化。

ε > 0, β ∈ (0,

]，γ 是一个与 β 相关的常数。取 (x

, y

, s

) ∈ N (β, µ

)，µ

)

，置

k := 0。

step2.(确定预估方向) 求如下方程组得到预估方向 (∆x

, ∆y

, ∆s

)。

A∆x

= r

∆y

+ ∆s

= r

∆x

+ L

∆s

= −L

牛顿方向

∆x

+ L

∆s

= −µ

e 欧拉方向

step3. 确定步长 α

(x(α), y(α), s(α)) = (x

, y

, s

) + α(∆x

, ∆y

, ∆s

)

= max{α ∈ [0, 1]| ∥L

(α)s(α) − (1 − α)µ

e∥ ⩽ Γβ(1 − α)µ

}

x(α), s(α) ∈ K × K

令 (ˆx

, ˆy

, ˆs

) = (x

, y

, s

) + α

(∆x

, ∆y

, ∆s

)。

step4. 确定搜索方向。

如果 α

= 1，则停止迭代，(ˆx

, ˆy

, ˆs

) 为最优解，否则求解如下方程组，得到校正方向

(∆x

, ∆y

, ∆s

)

∆

= 0

∆y

+ ∆s

= 0

∆x

∆s

= (1 − α

)µ

e −

ˆs

http://www.ma-xy.com 14 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.3 最优化算法

step5. 求 (x

k+1

, y

k+1

, s

k+1

)。

k+1

, y

k+1

, s

k+1

) = (ˆx

, ˆy

, ˆs

) + (∆x

, ∆y

, ∆s

)

k+1

若 (x

k+1

, y

k+1

, s

k+1

) ∈ S

，终止迭代；否则置 k := k + 1，返回 step2。

算法收敛性：

1. 序列 {x

, y

, s

} 的任意聚点都属于解集；

2. 序列 {(x

)

· s

}, {r

}Q-线性收敛到零；

3. 序列 {(x

)

· s

}, {r

}Q-二次收敛到零。

注：二阶锥规划的二阶锥约束虽是用凸点锥，但在顶点处不光滑。

1.3.4 基于核函数的原始-对偶内定算法

原始-对偶内点法的基本思想是：首先选取中心路径上的一个初始值，然后寻求一个使对偶

间隙逐渐见效的搜索方向，再在该搜索方向上确定一个合适的步长，使得迭代点仍是二阶锥规划

问题的严格可行解。下面，我们用一个核函数来确定搜索方向。

定义 (核函数) 称单变量函数 φ : R

→ R

为一个核函数，如果 φ 满足

′

(1) = φ(1) = 0

′′

(

)

lim

t→0

φ(t) = lim

t→∞

φ(t) = ∞

显然，φ 是严格凸的并且在 t = 1 处取极小值 φ(1) = 0。目前，已有文献研究的核函数的增

长项大部分是二次的。例如：

φ(t) =

p+1

− 1

p(p + 1)

+ φ

(t) t ⩾ 0

其中：φ

(t) 为核函数的阻碍项，且 p ⩾ 1，这里，函数增长项设为 p + 1 ⩾ 2。

下面，我们给出一个新的线性增长项核函数

φ(t) = t − 1 +

σ (t

−1

−1)

− 1) t > 0, σ ⩾ 1

其中：φ(t) 的增长项 t − 1 是线性的。

我们先来补充一下基础内容，然后再介绍算法。前面，我们定义了 K = K

, x = (x

, ¯x) ∈ R

，

其对称矩阵为



¯x

¯x x



∈ R

n×n

http://www.ma-xy.com 15 http://www.ma-xy.com

http://www.ma-xy.com

1.3 最优化算法第一章二阶椎规划

其中：I 为 n − 1 × n − 1 单位矩阵。记矩阵 L

的最小特征值与最大特征值



为 λ

, λ

，则有

(x) = x

− ∥¯x∥

(x) = x

+ ∥¯x∥

易知

x ∈ K ⇔ λ

(x) ⩾ λ

(x) ⩾ 0

x ∈ intK ⇔ λ

(x) ⩾ λ

(x) > 0

引理设 x, s ∈ R

，有

(x + s) ⩾ max{λ

(x) −

√

2∥s∥, λ

(x) −

√

2∥x∥}

另外，记特征值 λ

, λ

min

≜ λ

对应的特征向量为 u

(1)

, u

(2)

，Tr(x) 为迹，det(x) 为行列式。

迹函数 Tr(x) 有如下性质：对 ∀x, s ∈ R

，有

Tr(x ◦ s) = 2x

Tr(x ◦ x) = 2∥x∥

引理设 x, y, z ∈ K，有

Tr((x ◦ s) ◦ z) = Tr(x ◦ (y ◦ z))

引理设 x ∈ R

, s ∈ K，有

(x)Tr(s) ⩽ Tr(x ◦ s) ⩽ λ

(x)Tr(s)

利用向量 x 的特征值分解，我们可以将任意实值函数 ϕ(t) : R

→ R

扩展到 intK 到 K

的映射：

定义设 ϕ : R

→ R

且 x ∈ R

，向量 u

(1)

, u

(2)

为特征向量，定义向量值函数 ϕ(x) 如下

ϕ(x) = ϕ(λ

(x))u

(1)

+ ϕ(λ

(x))u

(2)

x ∈ intK

即

ϕ(x) =











ϕ(λ

(x)) + ϕ(λ

(x))

ϕ(λ

(x)) + ϕ(λ

(x))

¯x

∥¯x∥

¯x = 0

(ϕ(λ

(x), 0, ··· , 0)) ¯x = 0

引理设 ϕ : R

→ R

且 x ∈ intK，则 ϕ(x) ∈ K。



注：前面已经定义了 λ

max

= λ

, λ

min

= λ

。

http://www.ma-xy.com 16 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.3 最优化算法

引理设 ϕ : R

→ R

是二次可微的，如果 ϕ

′′

(t) 是单调下降的，则有

(x)(ϕ

′′

(t)) = ϕ

′′

(λ

(x)) x ∈ intK

当讨论的空间为 R

时，φ(·)φ

′

(·) 表示向量值函数；当讨论的空间为 R 时，φ(·)φ

′

(·) 表示单

变量函数。易知

′

(t) = 1 −

σ( t

−1

−1)

′′

(t) =

(σ + 2t)e

σ (t

−1

−1)

φ(1) = φ

′

(1) = 0

lim

t→0

φ(t) = lim

t→∞

φ(t) = +∞

并且 φ(t) 是严格凸的。

基于 φ(t)，定义 intK 上一个实值障碍函数 ψ(x) 如下：

ψ(x) = Tr(φ(x)) = 2(φ(x))

= φ(λ

(x)) + φ(λ

(x)) x ∈ intK

这里，(φ(x))

表示向量 φ(x) 的第一个分量。

因为对于任意的 t > 0，都有 φ(t) ⩾ 0，并且 λ

(x) ⩾ λ

(x) > 0(x ∈ intK)，所以有

ψ(x) ⩾ 0(x ∈ intK)。此外，因为 φ(t) = 0，当且仅当 t = 1，所以 ψ(x) = 0。当且仅当

(x) = λ

(x) = 1，即当且仅当 x = e。同理，ψ

′

(x) = 0 当且仅当 φ

′

(λ

(x)) = φ

′

(λ

(x)) = 0，

即当且仅当 λ

(x) = λ

(x) = 1。这是因为核函数 φ(t) 是严格凸并且在 t = 1 处取得最小值。归

纳起来，可写为

ψ(x) = 0 ⇔ φ(x) = 0 ⇔ φ

′

(x) = 0 ⇔ x = e

引理 ∀x ∈ intK，ψ(x) 是非负和严格凸的并且在 x = e 处取得极小值。

令 x(t) = (x

(t), . . . , x

(t)) 为 t 的函数，用 x

′

(t) 表示 x 关于 t 的导数，即

′

(t) = (x

′

(t), x

′

(t) . . . , x

′

(t))

则有

(x(t) ◦ s(t)) = x

′

(t) ◦ s(t) + x(t) ◦ s

′

(t)

Tr(φ(x(t))) = Tr(φ

′

(x(t)) ◦ x

′

(t))

将上述理论推广到 K = K

× K

× ··· × K

上，函数 φ(x) 和 ψ(x) 的定义分别是

φ(x) = (φ(x

), ··· , φ(x

))

ψ(x) =



i=1

ψ(x

) =



i=1

Tr(φ(x

))

http://www.ma-xy.com 17 http://www.ma-xy.com

http://www.ma-xy.com

1.3 最优化算法第一章二阶椎规划

而 φ

′

(x) 定义为

′

(x) = (φ

′

), φ

′

), . . . , φ

′

))

新的搜索方向

带扰动 µ 的 KKT 方程为

Ax = b x ∈ K

y + s = c s ∈ K

s = µe

利用牛顿法，得到关于搜索方向 (∆x, ∆y, ∆s) 的方程组：

A∆x = 0 x ∈ K

∆y + ∆s = 0 s ∈ K

∆s + L

∆x = µe − L

当且仅当 AL

−1

非奇异时，上述方程组有唯一的解，但这个条件通常很难满足，即使

A 是满秩的。主要原因在于 L

和 L

通常不相等。我们对上述方程组进行一定的变换，然

后再求解。下面，我们采用NT-换算方法来进行处理。

对任意的 x

, x

∈ intK

以及 i ∈ J = {1, 2, . . . , r}，定义 NT-换算矩阵 W

如下



)

− ∥(¯s)

)∥

)

− ∥(¯x)

∥



(¯s)

= (¯s

¯s

) = w

−1

, ¯s

)

(¯x)

= (¯x

¯x

) = w

, ¯x

)

= (ζ

) = (¯x

+ ¯s

¯s

−

¯x

)

Γ(ζ

)

, β

Γ(ζ

)

Γ(ζ

) =



(ζ

)

− (

)

= w



I +

1+α



引理 (1) (1) w

= (w

)

−1

；(2) Tr(w

◦ (w

)

−1

) = Tr(x

◦ s

)；(3) det((w

) =

−1

det(x

)，det((w

)

−1

) = λ

−1

det(s

)，λ



det

(

)

det(x

)

；(4) x

∈ K

(intK

) ⇔ W

∈

(intK

)。

定义

√



)

−1

√



i ∈ J

http://www.ma-xy.com 18 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.3 最优化算法

引理 ∀i ∈ J，有

det((v

)

) = det(x

) det(s

)

µTr((v

)

) = Tr(x

◦ s

)

进一步，定义

W = diag(w

, w

, ··· , w

)

则

v = (v

, v

, ··· , v

) =

W x

√

令

A =

−1

√

，dx =

W ∆x

√

，ds =

−1

∆s

√

，则原方程组变为

Adx = 0

∆y + ds = 0

L(W

−1

v)W ds + L(W v)W

−1

dx = e − L(W

−1

v)W v

上述方程组可能不存在解，为克服这一缺点，将第三个等式换为

L(v)ds + L(v)dx = e − L(v)v

即

ds + dx = e − L(v)

−1

e − v = v

−1

− v

因此，方程组变为

Adx = 0

∆y + ds = 0

ds + dx = v

−1

− v (1.1)

因为

正定，故上述方程组有唯一解。注意到，如果采用典型的对数障碍函数

φ(t) =

− 1

− log t

则 −φ

′

(t) = t

−1

− t，从而有 −φ

′

(v) = v

−1

− v。

下面，将 (1.1) 式右边替换为 −φ

′

(v)。这里 φ(t) 为核函数，因此我们的搜索方程为

Adx = 0

∆y + ds = 0

ds + dx = −φ

′

(v)

http://www.ma-xy.com 19 http://www.ma-xy.com

http://www.ma-xy.com

1.3 最优化算法第一章二阶椎规划

上述方程组有唯一解，求解完方程组后，由NT-换算有

∆x =

√

µW

−1

∆s =

√

µW ds

由

ψ(x) = 0 ⇔ φ(x) = 0 ⇔ φ

′

(x) = 0 ⇔ x = e

易知

ψ(v) = 0 ⇔ φ(v) = 0 ⇔ φ

′

(v) = 0 ⇔ v = e

由方程组，我们有

ds = −

∆y

dx = −∆y

Adx = 0

即 dx, ds 是正定的。因此，当且仅当 φ

′

(v) = 0，当且仅当 v = e 有 dx = ds = 0。

引理 φ

′

(v) = 0，当且仅当 x ◦ s = µe。

由上述引理知，如果 (x, y, s) = (x(µ), y(µ), s(µ))，则 (∆x, ∆y, ∆s) 是非零的。沿此搜索方

向，利用先搜索技术确定步长 α

，即可得到更新点。

步长 α

的选取

设 W

为 K

的自同构，并满足 W

= (W

)

−1

。定义

√

)

−1

√

∆x

√

)

−1

∆s

√

则有

+ αx

) =

√

µ(v

+ αd

)

−1

+ αs

) =

√

µ(v

+ αd

)

由引理 1 可知

det(v

+ αd

) det(v

+ αd

) = det(x

+ α∆x

) det(s

+ α∆s

)

µTr((v

+ αd

) ◦ (v

+ αd

)) = Tr((x

+ α∆x

) ◦ (s

+ α∆s

))

另一方面，设 W

是 K

的自同构，并满足 W

= (W

)

−1

。定义

√

)

−1

√

http://www.ma-xy.com 20 http://www.ma-xy.com

http://www.ma-xy.com

第一章二阶椎规划 1.3 最优化算法

其中：x

= x

+ α∆x

，s

= s

+ α∆s

。

由引理 1 可知

det((v

)

) = det(x

+ α∆x

) det(s

+ α∆s

)

µTr((v

)

) = Tr((v

+ αd

) ◦ (v

+ α∆d

))

引理如果 x, s, z ∈ intK，满足

det(z

) = det(x) det(s)

Tr(z

) = Tr(x ◦ s)

则有

ψ(z) ⩽

(ψ(x) + ψ(s))

由上述引理，我们有

(

) ⩽

(ψ(v

+ αd

) + ψ(v

+ αd

))

将上述不等式两边关于 i 求和，有

ψ(v

) ⩽

(ψ(v + αd

) + ψ(v + αd

))

定义 ψ(v) 的改变量为

f(α) = ψ(v

) − ψ(v)

定义

(α) =

(ψ(v + αdx) + ψ(v + αds)) − ψ(v)

则 f(α) ⩽ f

(α)。易知 f(0) = f

(0) = 0，因为 f

(α) 是凸的 (但 f(α) 不一定是凸的)。

将 f

(α) 关于 α 求导

′

(α) =

Tr(φ

′

(v + αdx) ◦ dx + φ

′

(v + αds) ◦ ds)

′

(0) =

Tr(φ

′

(v) ◦ (dx + ds)) = −

Tr(φ

′

◦ φ

′

) = −2δ(v)

将 f

(α) 关于 α 二次求导

′′

(α) =

Tr(φ

′′

(v + αdx) ◦ (dx ◦ ds) + φ

′′

(v + αds) ◦ (ds ◦ ds))

为简化分析，定义

(v) = min{λ

)|i ∈ J}

(v) = max{λ

)|i ∈ J}

http://www.ma-xy.com 21 http://www.ma-xy.com

http://www.ma-xy.com

1.3 最优化算法第一章二阶椎规划

注意到，如果 f

(α) ⩽ 0，那么新的迭代点严格可行，这是因为当新的迭代点趋向于可行域边界

时，f

(α) 将趋向于无界。

显然，理想的步长是使 f

(α) 最小的 α。下面，我们给出一个默认 (缺省) 步长

引理

′′

(α) ⩽ 2δ

′′

(λ

(v) − 2αδ)

引理如果 α 满足

−φ

′

(λ

(v) − 2αδ) + φ

′

(λ

(v)) ⩽ 2δ (1.2)

则有 f

′

(α) ⩽ 0

引理设 ρ : [0 , ∞) → (0, 1] 是函数 −

′

(t) 在 (0, 1] 上的反函数，则满足 (1.2) 式的步长 α

的最大值为

¯α =

ρ(δ) − ρ(2δ)

2δ

引理

¯α ⩾

′′

(ρ(2δ))

引理如果 α 满足 0 < α ⩽ ¯α，则有

f(α) ⩽ −αδ

定义 t = ρ(2δ)，由 ρ 的定义可知

−φ

′

(t) = 4δ =

σ (t

−1

−1)

− 1

从而有

σ (t

−1

−1)

= t

(4δ + 1)

进而

−1

= 1 +

log t +

log(4δ + 1)

因为 0 < t ⩽ 1，所以

−1

⩽ 1 +

log(4δ + 1)

因此，可得

¯α ⩾

′′

(t)

(σ + 2t)e

σ( t

−1

−1)

⩾

(σ + 2)(4δ + 1)(1 +

log(4δ + 1))

定义缺省步长为 ˜α

˜α =

(σ + 2)(4δ + 1)(1 +

log(4δ + 1))

http://www.ma-xy.com 22 http://www.ma-xy.com