支持向量机的分类思想-电子发烧友网

前言

支持向量机是一种经典的机器学习算法，在小样本数据集的情况下有非常广的应用，我觉得，不懂支持向量机不算是入门机器学习。本篇循序渐进的讲解了支持向量机的分类思想，希望对您有帮助。

1. 函数间隔和几何间隔

2. 支持向量机的分类思想

3. 总结

1. 函数间隔和几何间隔

为了能够更好的阐述支持向量机的分类思想，需要理解函数间隔和几何间隔的定义。

1. 点到超平面的距离

假设超平面方程：

点到平面的距离：

由上式可得：没有分类信息，而函数间隔和几何间隔不仅包含了距离信息，还包含了分类信息。

2. 函数间隔和几何间隔

对于给定的训练数据集T，正样本和负样本分别为+1和-1，我们对式（1.1）稍微进行了修改：

(1). 点到平面的距离不作规范化处理，得：

(2). 去掉绝对值符号，并乘以标记结果y0，得：

d2表达式就是函数间隔的定义，有两层含义：大小表示点P0到超平面的距离，正负表示点P0是否正确分类，若d<0，分类错误；反之，则分类正确。

因此，我们定义点到超平面的函数间隔为：

接着定义训练数据集T的函数间隔是所有样本点(xi,yi)的函数间隔的最小值，即：

其中，

但是，若成比例的增加超平面参数w和b，超平面没有改变，但是函数间隔却成比例的增加了，这是不符合理论的，因此，需要对函数间隔进行规范化，得：

(1.7)式就是几何间隔的定义，几何间隔的值是确定的。

2. 支持向量机的分类思想

1. 感知机和logistic回归的分类思想

感知机的损失函数为所有误分类点到超平面的距离之和：

无误分类点时，损失函数为0，满足模型分类条件的超平面有无数个，如下图：

初始超平面为l1，误分类点为红色框，最小化式（2.1）有无穷多个满足损失函数为0的超平面，如上图的l2~ln，然而，最佳分类超平面只有一个，即支持向量机所对应的超平面。

假设logistic回归的模型是，logistic回归的损失函数：

简单分析（2.2）式的分类思想：

(1).当yi=1时，损失函数简化为：

若要使损失函数越小越好，则xi的值越大越好，如下图：

图2.1

当往箭头方向移动时，损失函数逐渐变小。

(2). 当yi=0时，损失函数简化为：

若要使损失函数越小越好，则xi的值越小越好，如下图：

当往箭头方向移动时，损失函数逐渐变小。

2. 支持向量机的分类思想

支持向量机结合了感知机和logistic回归分类思想，假设训练样本点(xi,yi)到超平面H的几何间隔为γ(γ>0)，由上节定义可知，几何间隔是点到超平面最短的距离，如下图的红色直线：

用logisitic回归模型分析几何间隔：

因此，当γ越大时，损失函数越小，结果为正样本的概率也越大。

因此，感知机的分类思想是最大化点到超平面的几何间隔，这个问题可以表示为下面的约束最优化问题：

根据几何间隔和函数间隔的关系，得几何间隔的约束最优化问题：

函数间隔是样本点到超平面的最短距离，因此，令函数间隔为常数1，那么其他样本点到超平面的距离都大于1，且最大化和最小化是等价的。于是就得到下面的最优化问题：

由(2.8)式和(2.9)式，解得最优解w*,b*，易知最优超平面到正负样本的几何间隔相等（请理解几何间隔的含义，然后仔细回想整个分类过程，就会得到这个结论）。

3. 总结

本文结合了感知机和logistic回归的分类思想来推导支持向量机的最优化问题，即最大间隔分离超平面。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

函数

函数

+关注

关注
3

文章
4329

浏览量
62576
机器学习

机器学习

+关注

关注
66

文章
8408

浏览量
132576

原文标题：支持向量机（一）：支持向量机的分类思想

文章出处：【微信号：AI_shequ，微信公众号：人工智能爱好者社区】欢迎添加关注！文章转载请注明出处。

基于支持向量机的分类问题

小菜鸟一枚，有哪位大神能提供部分基于支持向量积的分类鉴别问题的MATLAB编码，思路过程，不胜感激

发表于 04-03 18:54

如何用支持向量机分类器识别手写字体

sklearn实例-用支持向量机分类器（SVC）识别手写字体

发表于 06-11 17:02

基于概率投票策略的多类支持向量机及应用

传统的支持向量机是基于两类问题提出的，如何将其有效地推广至多类分类仍是一个研究的热点问题。在分析比较现有支持

发表于 04-01 08:53 •12次下载

改进的支持向量机特征选择算法

针对采用支持向量机进行分类的特征子集选择问题，提出一种改进的基于梯度向量的特征评测算法。该算法在核特征空间中，利用数据点到

发表于 04-03 08:38 •19次下载

基于多分类支持向量机的隐写域盲检测

提出一种区分隐写域(包括像素域、DCT域、DWT域)的盲检测方法，构造图像特征向量，建立一个多分类的支持向量机，根据特征

发表于 04-20 09:32 •14次下载

特征加权支持向量机

该文针对现有的加权支持向量机(WSVM)和模糊支持向量机(FSVM)只考虑样本重要性而没有考虑特

发表于 11-21 11:15 •15次下载

基于改进支持向量机的货币识别研究

首先，预抽取支持向量以减少训练样本数量，大大缩减训练时间；然后，用缩减后的样本对改进后的分类支持向量机

发表于 12-14 14:57 •14次下载

基于形态小波范数熵和支持向量机的电能质量分类研究

基于形态小波范数熵和支持向量机的电能质量分类研究_李梦诗

发表于 01-07 18:21 •0次下载

大样本支持向量机分类策略研究_胡红宇

大样本支持向量机分类策略研究_胡红宇

发表于 03-19 11:28 •0次下载

多分类孪生支持向量机研究进展

孪生支持向量机因其简单的模型、快速的训练速度和优秀的性能而受到广泛关注．该算法最初是为解决二分类问题而提出的。不能直接用于解决现实生活中普遍存在的多

发表于 12-19 11:32 •0次下载

多核学习支持向量机应用音乐流派自动分类

针对不同特征向量下选择最优核函数的学习方法问题，将多核学习支持向量机（ MK-SVM）应用于音乐流派自动分类中，提出了将最优核函数进行加权组

发表于 01-09 15:25 •2次下载

如何从零推导支持向量机

支持向量机（SVM）是一个非常经典且高效的分类模型。但是，支持向量

发表于 06-10 08:00 •1次下载

OpenCV机器学习SVM支持向量机的分类程序免费下载

本文档的主要内容详细介绍的是OpenCV机器学习SVM支持向量机的分类程序免费下载。

发表于 10-09 11:45 •5次下载

什么是支持向量机什么是支持向量

支持向量机，英文为Support Vector Machine，简称SV机（论文中一般简称SVM）。它是一种监督式学习的方法，它广泛的应用于统计分

发表于 01-28 16:01 •2.2w次阅读

支持向量机寻找最优分类超平面的优化问题

根据，在线性可分情况下，支持向量机寻找最优分类超平面的优化问题

发表于 05-11 11:13 •1597次阅读