线性分类器
• 9 min read • 1746 words
Tags: Ma-Le
Categories: Machine Learning
线性分类器
1. 前置概念
- 提供 个样本,每个样本具有 个特征。这些样本表示为 维空间的特征向量。
- 决策边界:我们的分类器划分出的边界,将属于这个类别的样本和不属于这个边界的样本划分开。
- 决策函数:一个将 映射到标量的函数 :
对于这样的决策函数,决策边界为 。这是一个 维的曲面。
2. 线性分类器的决策边界
对于一个线性分类器 ,由前面的决策边界定义 ,它的决策边界为:
这个平面 有如下的性质:平面上的任意两点 的连线与 正交:
因此 也被称作 的法向量。
同时,如果 为单位向量的话,决策函数 还代表了 到面 的有符号距离这一特征。假设 与 的夹角为 ,则 到 (经过原点且法向量为 的平面) 的距离可以如下计算:
而 到 的距离为 ,因此 到 的有方向距离为 。这个距离的正负表示我们对 的类别的判断;这个距离的绝对值大小表示我们做出这个判断的把握。
3. 质心分类器
质心分类器是一个简单的线性分类器。它计算出属于一个类别的质心 和不属于这个类别的质心 ,然后使用两者连线的中垂面作为决策边界。根据前面的决策边界表达式,有:
Total words: 1746
Comments