作者:J-cha0 | 来源:互联网 | 2023-09-18 17:11
一、K近邻算法二、K近邻模型k近邻法使用的模型实际上对应于对特征空间的划分。模型由三个基本要素——距离度量、k值的选择和分类决策规则决定。2.1模型2.2距离度量例题ÿ
一、K近邻算法
二、K近邻模型
k近邻法使用的模型实际上对应于对特征空间的划分。模型由三个基本要素——距离度量、k值的选择和分类决策规则决定。
2.1 模型
2.2 距离度量
例题:距离度量使用Lp距离进行计算。
下面给出上述计算的做法,便于理解
L1(X1,X3)= 6 = 3+3
L2(X1,X3)= 4.24 = (3的平方+3的平方)开根号
L3(X1,X3)= 3.78 = (3的3次方+3的3次方)开根号3
L4(X1,X3)= 3.57 = (3的4次方+3的4次方)开根号4
2.3 K值的选择
通常采用交叉验证法选取最优的K值
2.4 分类决策规则
三、kd树
3.1 构造kd树
例题:kd树构造
下面给出上述计算的做法,便于理解
- 构建根结点,此时切分维度为x轴(即数据的第一维度),上述集合在x轴从小到大排序为(2,3),(4,7),(5,4),(7,2),(8,1),(9,6);中值为(7,2);(2,3),(4,7),(5,4)挂在(7,2)结点的左子树;(8,1),(9,6)挂在(7,2)结点的右子树。
- 构建(7,2)结点的左子树,点集合(2,3),(4,7),(5,4),此时切分维度为y轴(即数据的第二维度),中值为(5,4)。接着按x轴切分,(2,3)挂在(5,4结点)的左子树,(4,7)挂在(5,4)结点的右子树。
- 构建(7,2)结点的右子树,点集合(8,1),(9,6),此时切分维度为y轴,中值为(9,6)。接着按x轴切分,(8,1)挂在(9,6)结点的左子树。至此k-d tree构建完成。
3.2 搜索kd树
例题:搜索kd树
下面给出上述计算的做法,便于理解
1.找到包含S的叶结点D,因为最近邻点肯定在以S为圆心的圆内。
2.上退回D的父结点B和B的父结点F搜索最近邻。由图可知,结点B中只有结点D与S最近,而F与圆不相交,所以不存在最近邻点。
3.上退回根结点A,由图可知,A与圆不相交,所以不存在最近邻点。
4.向下搜索根节点A的另一个结点G。由图可知,而G与圆不相交,所以不存在最近邻点。
5.向下搜索结点C,发现C和圆相交,且相交点在圆内为实例点E。由图可知,E比D距离S更近,最后,得到E是点S的最近邻点。
四 、K近邻的概要