我觉得PPT有点乱,所以在这里整理一下。
在本文中, 基于模糊等价矩阵聚类分析方法建立模糊矩阵建立模糊相似矩阵数据预处理——数据标准化平移-极差变换(0-1区间变换)平移-标准差变换)维数消除)模糊相似矩阵的建立相似系数法数积法角度余弦法相关系数法指数相似系数法最大最小最小距离法建立绝对值倒数法绝对值减数法绝对值指数法直接距离法主观评价法模糊等价矩阵相似关系-等价关系聚类(求动态聚类图)直接基于模糊相似矩阵聚类
基于模糊等价矩阵的聚类分析方法
主要有三个步骤:
制作模糊矩阵,制作模糊等价矩阵聚类(求出动态聚类图),分别介绍如下
将模糊矩阵设为U=u 1,u 2,…,u n U={u_1,u_2,…,u_n } U=u1,u 2,…,un作为整个分类对象,各分类对象用一系列数据表示。
u=u_I=ui={xI1,x i 2,x i m x_{i1},x_{i2},x_{im} xi1,x i 2,xim }
问题是如何建立对象u i、u j u_i、u_j ui和uj之间的相似关系,其中I,j [ 1,n] i,j(in[1,n ] i,j [ 1,n ]
创建模糊相似矩阵创建模糊相似矩阵时的注意事项:
r i j
主要过程如下
数据预处理——数据标准化设论域 U ={x1, x2, …, xn } 为待聚类对象,每个对象由 m 个指标表示其性状: x i = x_i= xi={ x i 1 , x i 2 , . . . , x i m x_{i1},x_{i2}, ..., x_{im} xi1,xi2,...,xim}
将原始数据矩阵中的元素通过适当的变换压缩到 [0, 1] 上。
有如下两种常用的方法
平移-极差变换(变换至0-1区间) 平移-标准差变换(消除量纲)值得一提的是,这种方法不一定会把原始数据矩阵中的元素压缩到 [0, 1] 上
值得一提的是这里的标准差是总体标准差,而不是样本标准差。
其中M为一适当选择的正数,满足
此时, r i j ∈ [ − 1 , 1 ] r_{ij} \in [-1, 1] rij∈[−1,1],若存在 r i j <0 r_{ij} <0 rij<0,令所有 r i j ′ = ( 1 + r i j ) / 2 r_{ij}&#x27;=(1+r_{ij})/2 rij′=(1+rij)/2 使得 r i j ′ ∈ [ 0 , 1 ] r_{ij}&#x27; \in [0, 1] rij′∈[0,1]
夹角余弦法 相关系数法 指数相似系数法指数相似系数法中一行表示一个样本的多个属性。
最大最小法 算数平均最小法 几何平均最小法
上述三种方法要求 xij>0,否则也要作适当变换。
r i j = 1 − c ∗ d ( x i , x j ) r_{ij}=1-c*d(x_i, x_j) rij=1−c∗d(xi,xj)
海明距离
欧式距离
sqdzx距离
专家直接给出相似度,专家数为 N,r_{ij}(k)表示第 k 个专家给出的 i 与 j 的相似度, a i j ( k ) a_{ij}(k) aij(k)为专家的自信度。
一般采用平方法来求传递闭包,也就是模糊等价矩阵
计算次数如下:
模糊相似矩阵 5×5
k = [log25]+1=2+1=3
最坏情况下, R − > R 2 − > R 4 − > R 8 , 计 算 到 R 8 R -> R^2 -> R^4 -> R^8,计算到R^8 R−>R2−>R4−>R8,计算到R8
对传递闭包依次取截关系
直接基于模糊相似矩阵聚类建立模糊相似矩阵 R 后,求其传递闭包 t® 计算量较大。
若直接从 R 出发,进行聚类,会怎么样?