热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

属性重要性的举例(定性数据聚类)

近日在解决一组定性数据的聚类问题,看文献时觉得论文中“基于属性重要性的定性数据聚类方法“举例不太容易理解(尤其是对我这种不喜欢看数学公式的人),所以写了这篇以备忘。1.基础

       近日在解决一组定性数据的聚类问题,看文献时觉得论文中“基于属性重要性的定性数据聚类方法“举例不太容易理解(尤其是对我这种不喜欢看数学公式的人),所以写了这篇以备忘。

1.基础知识

粗糙集和等价关系可参考:

https://blog.csdn.net/windmxf/article/details/2288540(粗糙集理解之一:基本概念)点击打开链接

2.属性重要性

对于一个信息系统S={U,Q,V,f},一个属性C对于总属性Q的重要性体现在没有这个属性,由等价关系划分出的类族有多大差异。差异越大,属性C越重要。

3.例子


考虑所有属性时得到聚类结果为:{1, 23, 30, 31}、{2, 28}、{3}、{4, 15, 29, 33}、{5, 21}、{6, 16}、{7, 8}、{9, 10, 11, 22, 32}、{12, 17, 25}、{13, 27}、{14, 29}、{18, 20, 34}、{24}、{26}。基数一共是cardU=34

计算属性I的属性重要性:

对除属性I外其他属性进行聚类 ,得到结果与考虑所有属性时相同,此时的cardPOSQ-{I}(Q)=34

属性重要性=γQ(Q)-γQ-{I}(Q)=1-cardPOSQ-{I}(Q)/cardU=0

计算属性II的属性重要性:

对除属性I外其他属性进行聚类 ,得到结果为:{1, 3, 18, 20, 23, 30, 31, 34}、{2, 28}、{4}、{5, 21}、{6}、{7, 8}、{9, 10, 11, 22, 24, 32}、{12, 17, 25}{13, 27}{14, 19}、{15, 29, 33}、{16}、{26}。加粗为聚类结果与上面相同的。相同集合的基数为14

cardPOSQ-{II}(Q)=34-14=20

属性重要性=γQ(Q)-γQ-{II}(Q)=1-cardPOSQ-{II}(Q)/cardU=1-20/34=0.412


参考文献:

基于属性重要性的定性数据聚类分析及应用_朱建平

定性数据的聚类方法及其应用探析_曾玉钰


推荐阅读
  • 本文基于对相关论文和开源代码的研究,详细介绍了LOAM(激光雷达里程计与建图)的工作原理,并对其关键技术进行了分析。 ... [详细]
  • 本文详细记录了在基于Debian的Deepin 20操作系统上安装MySQL 5.7的具体步骤,包括软件包的选择、依赖项的处理及远程访问权限的配置。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 本文探讨了如何像程序员一样思考,强调了将复杂问题分解为更小模块的重要性,并讨论了如何通过妥善管理和复用已有代码来提高编程效率。 ... [详细]
  • python的交互模式怎么输出名文汉字[python常见问题]
    在命令行模式下敲命令python,就看到类似如下的一堆文本输出,然后就进入到Python交互模式,它的提示符是>>>,此时我们可以使用print() ... [详细]
  • 火星商店问题:线段树分治与持久化Trie树的应用
    本题涉及编号为1至n的火星商店,每个商店有一个永久商品价值v。操作包括每天在指定商店增加一个新商品,以及查询某段时间内某些商店中所有商品(含永久商品)与给定密码值的最大异或结果。通过线段树分治和持久化Trie树来高效解决此问题。 ... [详细]
  • Java 中的 BigDecimal pow()方法,示例 ... [详细]
  • 本文总结了汇编语言中第五至第八章的关键知识点,涵盖间接寻址、指令格式、安全编程空间、逻辑运算指令及数据重复定义等内容。通过详细解析这些内容,帮助读者更好地理解和应用汇编语言的高级特性。 ... [详细]
  • 探讨如何高效使用FastJSON进行JSON数据解析,特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 本文详细介绍了如何使用Maven高效管理多模块项目,涵盖项目结构设计、依赖管理和构建优化等方面。通过具体的实例和配置说明,帮助开发者更好地理解和应用Maven在复杂项目中的优势。 ... [详细]
  • 本文介绍了如何在具备多个IP地址的FTP服务器环境中,通过动态地址端口复用和地址转换技术优化网络配置。重点讨论了2Mb/s DDN专线连接、Cisco 2611路由器及内部网络地址规划。 ... [详细]
  • 深入理解Cookie与Session会话管理
    本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息,以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制,解释其原理及应用场景。 ... [详细]
  • 本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误,并提供了解决方案。 ... [详细]
  • CentOS7源码编译安装MySQL5.6
    2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网:https:www.cmake.org如此时最新 ... [详细]
author-avatar
书友56759136
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有