精读西瓜书(第六章-支持向量机)-支持向量回归

现在我们来考虑回归问题. 给定训练样本 , , 希望学得一个回归模型, 使得与尽可能接近, 和是待确定的模型参数.
对样本 , 传统回归模型通常直接基于模型输出与真实输出之间的差别来计算损失, 当且仅当与完全相同时, 损失才为零. 与此不同, 支持向量回归(Support Vector Regression, 简称SVR)假设我们能容忍与之间最多有的偏差, 即仅当与之间的差别绝对值大于时才计算损失. 如下图, 这相当于以为中心, 构建了一个宽度为的间隔带, 若训练样本落入此间隔带, 则认为是被预测正确的.
于是, SVR问题可形式化为:
其中为正则化常数, 是 - 不敏感损失 ( - insensitive loss )函数:
引入松弛变量和 , 可重写为:

- 通过引入拉格朗日乘子 , 由拉格朗日乘子法可得到拉格朗日函数:

再令 , 对和的偏导为零可得:
将式带入, 即可得到SVR的对偶问题:
上述过程中满足KKT条件, 即要求:
可以看出, 当且仅当时能取非零值, 当且仅当时能取非零值. 换言之, 仅当样本不落入 - 间隔带中, 相应的和才能取非零值. 此外, 约束和不能同时成立, 因此和中至少有一个为零. 则SVR的解形如:
能使的样本即为SVR的支持向量, 他们必须落在 - 间隔带之外. 显然, SVR的支持向量仅是训练样本的一部分, 即其解仍具有稀疏性. 由KKT条件可看出, 对每个样本都有且 . 于是, 在得到后, 若 , 则必有进而有:
因此, 在求解得到后, 理论上来说, 可任意选取满足的样本求得 . 实践中长采用一种更鲁棒的办法: 选取多个(或所有)满足条件的样本求解后取平均值. 若考虑特征映射形式, 相应的, 得到:
则SVR可表示为: