![人工智能辅助药物设计](https://wfqqreader-1252317822.image.myqcloud.com/cover/158/50871158/b_50871158.jpg)
3.2 间隔与支持向量
给定训练样本集,分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,划分超平面是指将训练集分隔开来的直线,它将不同类别的样本分开,但能将训练样本分开的划分超平面可能有很多,如图3-1所示。
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00422.jpg?sign=1738924421-UY2r9iI31oaZO9guub5qgl1TpCBC89cR-0-776d2e26e7269f0a66813112482493ac)
图3-1 存在多个划分超平面将两类训练样本分开
从图3-1可以看出,位于两类训练样本“正中间”的划分超平面(图3-1中黑色加粗的直线)就是我们要找的划分超平面,因为该划分超平面对训练样本局部扰动的“容忍”性最好。例如,由于训练集的局限性或噪声因素,训练集外的样本可能比图3-1中的训练样本更接近两个类的分隔界,这将使许多划分超平面出现错误,而黑色加粗的超平面受影响最小。换言之,这个划分超平面所产生的分类结果的鲁棒性最好,对未见示例的泛化能力也最强。
对于一个数据点,离超平面越远,其最后的预测结果越可信,因此需要寻找到一些离超平面最近的点,确保它们离超平面的距离尽可能远,这些点到划分超平面的距离称为间隔。离划分超平面最近的那些点称为支持向量,因此寻找划分超平面的问题便转化为寻找最大间隔的问题。
在样本空间中,划分超平面可通过式(3-1)的线性方程来描述,即
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00429.jpg?sign=1738924421-x60mTh4vubp1oMrTXjFA6XDxxnc8XUVM-0-61aee8da2aba274bc2450c32a63e18dc)
(3-1)
其中,为法向量,决定了超平面的方向;b为位移项,决定了超平面与原点之间的距离。若将超平面记为
,那么样本空间中任意点x到超平面
的距离可写为
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00450.jpg?sign=1738924421-Ds45F9t9pLqaikQ4l2tEDISDachKJOjZ-0-67a6ce395f961ae9c709861dc8c7cb81)
(3-2)
假设超平面能将训练样本正确分类,那么对于
,若
,则有
;若
,则有
。
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00506.jpg?sign=1738924421-ZDs5PtadIcKqkVM1dlaPCYXles5iRaqT-0-ab658dbd9ee8b67d12da6c60c211e700)
(3-3)
如图3-2所示,每个样本点对应一个特征向量,距离超平面最近的这几个训练样本点(支持向量)使式(3-3)的等号成立,两个异类支持向量到超平面的距离之和为
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00514.jpg?sign=1738924421-QI76BflMT9CQLjmDHcT7XSpofaH6dDXf-0-eb0abc258720a6ca2b8e07492cb54692)
(3-4)
它被称为“间隔”(margin)。
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00515.jpg?sign=1738924421-ef5q95Zu4po4vemntvap8B6u6yCEZE9G-0-f80afd056289fe2a30de76a28052dc5c)
图3-2 支持向量与间隔
寻找具有“最大间隔”(maximum margin)的划分超平面,就是要找到能满足式(3-3)中约束的参数和
,使得式(3-4)所示的
最大。
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx551.jpg?sign=1738924421-PZNy8R4S9gxqoNoOTUhXoEE1Pb28cRdt-0-475a6497dcc448c49e6f7f097bc11f0e)
(3-5)
显然,为了最大化间隔,仅需最大化,这等价于最小化
。于是,式(3-5)可以重写为式(3-6),即
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx565.jpg?sign=1738924421-vsj81gatR7DBoTWV3b0dkPOPjKFx6STo-0-cd09f2da241deb9a9063d0f39e6d26a0)
(3-6)
这就是支持向量机的基本型。