【机器学习】求解过程快速又简单的最小二乘支持向量机LSSVM二分类

最小二乘支持向量机（LSSVM）是一种简单的支持向量机（SVM）。

artzers

10335人浏览 · 2016-08-24 01:14:40

artzers · 2016-08-24 01:14:40 发布

　　最小二乘支持向量机（LSSVM）是一种简单的支持向量机（SVM）。普通的SVM的表达形式为

a r g m i n Φ (w) = 1 2 w T w + C \sum i ξ i s u b j e c t t o d i (w T x i + b) - (1 - ξ i) \geq 0, ξ i \geq 0

di <script type="math/tex" id="MathJax-Element-2">d_i</script>是标准答案，取值为1和-1,

xi <script type="math/tex" id="MathJax-Element-3">x_i</script>是样本。

　　LSSVM的表达形式为

a r g m i n Φ (w) = 1 2 w T w + 1 2 γ \sum i e 2 i s u b j e c t t o d i (w T x i + b) - (1 - e i) = 0

ei <script type="math/tex" id="MathJax-Element-5">e_i</script>和

ξi <script type="math/tex" id="MathJax-Element-6">\xi_i</script>本质上是一回事，但是没有明确限定

ei <script type="math/tex" id="MathJax-Element-7">e_i</script>必须大于等于0。我们的约束条件是一个等式，如果

(wTxi+b)>1 <script type="math/tex" id="MathJax-Element-8">(w^Tx_i+b)>1</script>，那么

ei <script type="math/tex" id="MathJax-Element-9">e_i</script>可以是负数，不过

ei <script type="math/tex" id="MathJax-Element-10">e_i</script>还是需要被约束的。

　　传统SVM中，约束条件是不等式，离分离超平面近的元素向量是支持向量，强烈地影响分离平面的计算，离超平面远的向量影响比较小；因此如果分离集合之间的边界不清晰，会影响计算结果。

　　而LSSVM中，约束条件是等式，因此，离分离超平面近和远的元素向量都会对分离平面的计算产生影响，分离平面不如传统SVM精准；而且一旦产生相当数量的大的离群点，会严重影响分离平面的计算。LSSVM的最终结果，近似于将两个分离集合的所有元素到分离平面的距离，都限定在 1±η <script type="math/tex" id="MathJax-Element-11">1\pm\eta</script>， η <script type="math/tex" id="MathJax-Element-12">\eta</script>是可接受误差，通过限制 ei <script type="math/tex" id="MathJax-Element-13">e_i</script>逼近0来实现。LSSVM通过在对偶式中添加一个 ei <script type="math/tex" id="MathJax-Element-14">e_i</script>的平方来限制 ei <script type="math/tex" id="MathJax-Element-15">e_i</script>逼近0。

　　求解LSSVM比SVM要简单的多。引入拉格朗日算子，有

J = 1 2 w T w + 1 2 γ \sum i e 2 i - \sum i α i [d i (w T x i + b) - (1 - e i)]

\partial J \partial w = w - \sum i α i d i x i = 0 \to w = \sum i α i d i x i (1)

\partial J \partial b = - \sum i α i d i = 0 (2)

\partial J \partial e i = γ e i - α i = 0 (3)

\partial J \partial α i = d i (w T x i + b) - (1 - e i) = 0 (4)

w,b,e=[e1...en],α=[α1...αn] <script type="math/tex" id="MathJax-Element-21">w,b,e=[e_1...e_n],\alpha=[\alpha_1...\alpha_n]</script>等向量看做整体，由（1）（3）令

zi=dixi,Z=[z1...zn],D=[d1...dn]，w=ZαT,e=γ−1α <script type="math/tex" id="MathJax-Element-22">z_i=d_ix_i,Z=[z_1...z_n],D=[d_1...d_n]，w=Z\alpha^T,e=\gamma^{-1}\alpha</script>，代入（4）得到：

Z α T z i + b d i + γ - 1 α i = 1 (5)

[0 D T - D Z T Z + γ - 1 I] [b α T] = [0 I]

α,b <script type="math/tex" id="MathJax-Element-25">\alpha,b</script>。其中b是一个数字，因此与矩阵向量相乘的位置无所谓；

ZTZ <script type="math/tex" id="MathJax-Element-26">Z^TZ</script>是根据矩阵组成形式来给出的；

w <script type="math/tex" id="MathJax-Element-27">w</script>通过(1)计算得到。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【信创-k8s】海光/兆芯+银河麒麟V10离线部署k8s1.31.8+kubesphere4.1.3

介于V4优秀的LuBan架构，核心组件非常少，资源占用也显著降低，同时带来众多功能和便利性。：使用海光3350/兆芯开先KX-5000芯片，麒麟V10 SP3操作系统，以及Containerd 1.7.13、Kubernetes v1.31.8、KubeSphere v4.1.3等软件版本。原创编写，详细记录了从环境准备到平台验证的完整流程，为信创环境下的Kubernetes与KubeSphere

2048 AI社区

从狂热到深耕：一个AI从业者的智能体创业心路历程

2048 AI社区

MCP：从被动响应到自主执行的自动化协议

AI正突破传统代码生成边界，向全流程智能调度演进。MCP（Model Context Protocol）作为开放协议，为AI与工具建立统一接口，实现跨模型、跨工具的复杂流程编排。其核心价值在于生态复用、安全可控和上下文感知，通过客户端-服务器架构让AI自主调用API完成从代码检查到性能优化的全流程。相比Function Call的单次调用，MCP支持多工具串联和本地数据处理，将重塑前端开发模式——

2048 AI社区

所有评论(0)

查看更多评论

artzers

@lpsl1882

已为社区贡献2条内容