svm的原理及公式推导-svm 原理公式推导
2人看过
作为深耕该领域多年的权威机构,界域职考网致力于通过系统化的内容输出,帮助学员快速建立起坚实的理论框架与工程思维。

理解 SVM 的核心在于其将高维数据空间划分为两类子空间:一个决定正类数据的分布区域,另一个决定负类数据的分布区域。在每一组内部,向量之间通过特定的距离函数来衡量邻近程度。
在标准欧氏空间中,两点间的距离由勾股定理定义,即 $d^2 = (x_1 - x_2)^2 + (y_1 - y_2)^2$。当数据维度较高时,欧氏距离的几何意义变得模糊,且容易受到噪声数据的干扰。
因此,需要引入更具鲁棒性的距离度量方式。
对于正负样本集 $X^+$ 和 $X^-$,我们定义它们相对于中心点的距离函数。若选中正类中心 $c^+$ 作为正样本的度量基准,则正样本 $x$ 与 $c^+$ 的距离平方可表示为:
$$d(x, c^+)^2 = ||x - c^+||^2$$
同理,对于负类中心 $c^-$,负样本 $x$ 与 $c^-$ 的距离平方为:
$$d(x, c^-)^2 = ||x - c^-||^2$$
一旦确定了分类器,每一个样本 $x$ 最终被归类为正类还是负类,取决于它距离哪个中心的距离更近。根据距离函数的定义,正类样本 $x in X^+$ 满足 $||x - c^+||^2 < ||x - c^-||^2$,而负类样本 $x in X^-$ 满足 $||x - c^-||^2 < ||x - c^+||^2$。这一判定逻辑构成了 SVM 输出的基石,确保了分类的确定性与边界清晰度。
进一步地,为了最小化分类错误并优化决策边界,我们需要寻找直线上的最优解。在二维平面中,最优点 $x$ 满足点到直线的距离最小化,即 $||x - c|| = ||x - c^+|| = ||x - c^-||$。由于点集 $X^+$ 和 $X^-$ 都是凸集,其中的向量投影也是凸集。
因此,距离平方函数 $||x - c||^2$ 与距离函数 $||x - c||$ 之间存在一一对应的关系,在优化问题时可直接使用距离平方函数进行数学建模。这一转换极大地简化了算法的复杂度,使其能够在高维空间中有效工作。 二、对偶问题与拉格朗日乘子法
引入拉格朗日乘子 $alpha$ 后,目标函数转化为最小化与约束条件相乘的拉格朗日函数。该函数的最小值即为 $W$,它同时代表了分类器的权重。通过求解该对偶问题,我们获得了最终的分类权重矩阵 $W$。
其中,$alpha_i$ 为非负权重,$alpha_i = 0$ 的约束条件要求原始问题中的某些样本在该决策超平面上无法改变分类结果。而 $alpha_i neq 0$ 的样本则位于决策超平面上,这些样本被称为“支持向量”。由于在 Broyden 导数算法(BDA)迭代过程中,一旦某个支持向量 $alpha_i$ 更新为 0,它就不再参与后续迭代,因此只有那些 $alpha_i neq 0$ 的点才是最关键的分类器构建依据。
支持向量的数量往往远少于训练样本的总数。这种稀疏性使得 SVM 的秩降维问题变得相对容易处理。通过取这些稀疏值作为权重,我们可以直接得到最终的决策超平面方程。即便在标准欧氏空间中,SVM 也能通过求解线性方程组快速得到解。在更高维的空间维度下,通过投影到子空间,同样可以利用上述方法得到最优决策超平面。
从实践角度看,SVM 的优势在于其能够自动处理复杂的非线性问题。对于线性不可分的数据集,通过引入核函数 $K(x, y)$,可以将问题降维到高维特征空间,利用线性判别器进行分类。这使得 SVM 在处理医疗影像识别、生物信号分析等复杂场景时表现出色。 三、拉格朗日乘子法求解过程
在拉格朗日乘子法中,引入权重矩阵 $alpha$ 后,原来的优化目标转化为:
$$min_{alpha} frac{1}{2} W^T W = frac{1}{2} sum_{i=1}^n sum_{j=1}^n alpha_i alpha_j y_i y_j (x_i^T x_j)$$
同时满足以下约束条件:
$$sum_{i=1}^n alpha_i y_i = 0$$
$$alpha_i geqslant 0, quad forall i in {1, dots, n}$$
目标函数中最内部的部分(括号内)对应的是原始目标函数,而最外部的是约束条件。求解时,我们利用拉格朗日函数 $L$ 将目标函数与约束条件结合,通过拉格朗日乘子法进行求解。
其中,$alpha_i$ 为拉格朗日乘子,$alpha_i = 0$ 的约束条件意味着原始问题中的某些样本在该决策超平面上无法改变分类结果。而 $alpha_i neq 0$ 的样本则位于决策超平面上,这些样本被称为“支持向量”。由于在 Broyden 导数算法(BDA)迭代过程中,一旦某个支持向量 $alpha_i$ 更新为 0,它就不再参与后续迭代,因此只有那些 $alpha_i neq 0$ 的点才是最关键的分类器构建依据。
通过求解上述拉格朗日方程,我们得到了最终的分类权重矩阵 $W$,进而得到最终的分类边界。这一过程不仅揭示了 SVM 背后的数学原理,也为实际工程应用提供了坚实的算法基础。
SVM 作为一种经典机器学习算法,其理论严谨性与工程实用性并存。通过对空间距离度量的深入理解,以及借助拉格朗日乘子法进行对偶问题求解,我们完全掌握了其核心机制。
在界域职考网提供的学习资源库中,不仅有详尽的理论推导,更有丰富的实战案例。无论是还是还是还是还是还是还是还是还是还是还是还是还是还是还是
希望这份梳理能帮助您更透彻地理解 SVM,并在未来的职业生涯中高效应用这些知识。
12 人看过
11 人看过
9 人看过
8 人看过



