支持向量机（SVM）原理详解

线性SVM通过寻找最优超平面，最大化类别之间的间隔，适用于线性可分的数据集。非线性SVM通过核函数将数据映射到高维空间，适用于线性不可分的数据集。软间隔SVM通过引入松弛变量，允许部分样本点位于间隔内，增强了模型的鲁棒性。SVM在分类和回归任务中表现出色，是机器学习中的重要算法之一。

六月五日

1483人浏览 · 2025-02-26 20:49:20

六月五日 · 2025-02-26 20:49:20 发布

支持向量机（SVM）原理详解

1. 引言

支持向量机（Support Vector Machine, SVM）是一种强大的监督学习算法，广泛应用于分类和回归任务。其核心思想是通过寻找最优超平面，最大化类别之间的间隔（Margin），从而实现分类。

2. 线性支持向量机

2.1 基本概念

对于线性可分的数据集，SVM的目标是找到一个超平面：
$w^\top x + b = 0$
使得两类样本之间的间隔最大化。

2.2 间隔（Margin）

间隔定义为两个类别最近样本点到超平面的距离之和：
$\text{Margin} = \frac{2}{\|w\|}$

2.3 优化问题

SVM的优化目标是最大化间隔，等价于最小化 $∥w∥\|w\|$ ：
$\min_{w, b} \frac{1}{2} \|w\|^2$
约束条件：
$y_i (w^\top x_i + b) \geq 1, \quad \forall i$

2.4 拉格朗日对偶

通过引入拉格朗日乘子 $αi\alpha_i$ ，将原问题转化为对偶问题：
$\max_{\alpha} \sum_{i=1}^n \alpha_i - \frac{1}{2} \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j x_i^\top x_j$
约束条件：
$\sum_{i=1}^n \alpha_i y_i = 0, \quad \alpha_i \geq 0$

3. 非线性支持向量机

3.1 核函数（Kernel Function）

对于非线性可分的数据集，SVM通过核函数将数据映射到高维空间，使其在高维空间中线性可分。

3.2 常见核函数

线性核：
$K(x_i, x_j) = x_i^\top x_j$
多项式核：
$K(x_i, x_j) = (x_i^\top x_j + c)^d$
径向基核（RBF）：
$K(x_i, x_j) = \exp(-\gamma \|x_i - x_j\|^2)$

3.3 优化问题

引入核函数后，对偶问题变为：
$\max_{\alpha} \sum_{i=1}^n \alpha_i - \frac{1}{2} \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j K(x_i, x_j)$

4. 软间隔支持向量机

4.1 基本概念

对于线性不可分的数据集，SVM引入松弛变量 $ξi\xi_i$ ，允许部分样本点位于间隔内。

4.2 优化问题

$\min_{w, b, \xi} \frac{1}{2} \|w\|^2 + C \sum_{i=1}^n \xi_i$
约束条件：
$y_i (w^\top x_i + b) \geq 1 - \xi_i, \quad \xi_i \geq 0$

其中 $C$ 为惩罚参数，控制误分类的惩罚力度。

5. 实现示例

5.1 线性SVM实现（Python）

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载数据集
iris = load_iris()
X, y = iris.data, iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 构建线性SVM模型
clf = SVC(kernel='linear')
clf.fit(X_train, y_train)

# 预测
y_pred = clf.predict(X_test)

# 评估
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

5.2 非线性SVM实现（Python）

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载数据集
iris = load_iris()
X, y = iris.data, iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 构建非线性SVM模型（使用RBF核）
clf = SVC(kernel='rbf', gamma='scale')
clf.fit(X_train, y_train)

# 预测
y_pred = clf.predict(X_test)

# 评估
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

6. 总结

线性SVM通过寻找最优超平面，最大化类别之间的间隔，适用于线性可分的数据集。

非线性SVM通过核函数将数据映射到高维空间，适用于线性不可分的数据集。

软间隔SVM通过引入松弛变量，允许部分样本点位于间隔内，增强了模型的鲁棒性。

SVM在分类和回归任务中表现出色，是机器学习中的重要算法之一。

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

EM-Core自动驾驶类脑世界模型——全域客观认知底座（V1.0 正式版）

本文档为 EM-Core 自动驾驶认知系统的核心认知底座规范，是 ECC 认知大脑开展推理、预判、决策的**唯一客观依据**。本模型与 MLNF-Mem 记忆中枢完全物理解耦，作为漏斗外侧独立挂载的外置模块（ad-44）运行，仅通过 `WM_QUERY` 标准消息向 ECC-01 情境解析模块和 ECC-03 因果推理模块提供风险向量与属性查询服务，不参与记忆晋升、遗忘或行为决策。适用于全场景自动

脑启社区

Python实现生物启发的脉冲神经元模型

在类脑计算与神经形态工程实践中，与的平衡始终是核心挑战。主流深度学习框架（如 PyTorch/TensorFlow）虽能高效模拟人工神经网络，但对等关键生物机制支持薄弱。本文不走“黑盒拟合”路线，而是基于与，构建一个轻量、可调试、符合皮层微环路结构特征的脉冲神经元模块，并完整实现带空间约束的 STDP 学习规则。