热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SAS数据分析之聚类分析

具体的题目我。。。找不到了,但我先把这次SAS的代码放上来,如果我没记错的话,本次实验应该是从国家统计局上搜集了全国各大省份的一些资料,但。。。。忘记具体是什么资料了,这不重要,主要目的就是利用SAS软件对数据做聚类分析,然后我们根据得到的结果来产生我们想要得到的信息。

data a;
input province $ x1 x2 x3 [email protected]@;
cards;
北京	238372	27376	659.03	115.66
天津	84047	18181	314.66	52.05
河北	138840	155071	762.14	282.6
山西	88125	121958	465.34	158.33
				
辽宁	178270	98147	836.04	179.7
吉林	59503	57870	340.89	115.82
黑龙江	85931	88720	510.59	179.99
				
上海	304322	31395	860.15	93.48
江苏	364330	118086	1519.84	245.79
浙江	312065	119009	1059.39	167.54

;
run;
proc cluster data=a method=ward std
outtree=eco1 pseudo;
id province;
run;

这便是简单聚类的代码,根据需求的不同,大家可以按照需求来使用不同的聚类方法。
SAS数据分析之聚类分析
SAS数据分析之聚类分析
SAS数据分析之聚类分析
以上是我们用的一类聚类方法,下面将给出另一类。

data examp632(type=distance);
   input  x1-x10;
   cards;
0    1.5460    1.6190    1.7754    0.9285    1.8145    1.6432    0.6607    1.5522    1.1759
    1.5460         0    1.4745    1.0386    1.2358    0.4667    0.7056    2.2067    2.9756    2.4932
    1.6190    1.4745         0    0.6057    0.6925    1.2547    0.8486    2.0659    2.2850    1.7694
    1.7754    1.0386    0.6057         0    0.9324    0.7019    0.3331    2.3440    2.7623    2.2396
    0.9285    1.2358    0.6925    0.9324         0    1.2541    0.9282    1.4264    1.8713    1.3541
    1.8145    0.4667    1.2547    0.7019    1.2541         0    0.4062    2.4625    3.1072    2.5986
    1.6432    0.7056    0.8486    0.3331    0.9282    0.4062         0    2.2579    2.7995    2.2815
    0.6607    2.2067    2.0659    2.3440    1.4264    2.4625    2.2579         0    1.0544    0.8796
    1.5522    2.9756    2.2850    2.7623    1.8713    3.1072    2.7995    1.0544         0    0.5228
    1.1759    2.4932    1.7694    2.2396    1.3541    2.5986    2.2815    0.8796    0.5228         0

;
proc print data=examp632;
run;
proc cluster data=examp632 method=ward;
   var x1-x10;
   proc tree horizontal;
   run; 

不再做过多描述,直接把聚类图象放给大家对比
SAS数据分析之聚类分析
对比两种方法,很容易发现两种方法产生的聚类方法并不一致,这并不代表聚类中出现了错误。
在聚类中,我们是按照类与类之间的距离来做聚类的,a与d两类之间的距离最近,则在本轮聚类中,a、d则天然归于一类,但由于类与类间距离的计算方式并不唯一,有欧式距离,也有其他的距离计算方法,这便导致了不同方法聚类中可能出现结论不同的结果,这种情况不用过多在意,选取最适合的方法即可。
写得不好,请各位谅解,有错误之处敬请指正。


推荐阅读
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • Java序列化对象传给PHP的方法及原理解析
    本文介绍了Java序列化对象传给PHP的方法及原理,包括Java对象传递的方式、序列化的方式、PHP中的序列化用法介绍、Java是否能反序列化PHP的数据、Java序列化的原理以及解决Java序列化中的问题。同时还解释了序列化的概念和作用,以及代码执行序列化所需要的权限。最后指出,序列化会将对象实例的所有字段都进行序列化,使得数据能够被表示为实例的序列化数据,但只有能够解释该格式的代码才能够确定数据的内容。 ... [详细]
  • 猜字母游戏
    猜字母游戏猜字母游戏——设计数据结构猜字母游戏——设计程序结构猜字母游戏——实现字母生成方法猜字母游戏——实现字母检测方法猜字母游戏——实现主方法1猜字母游戏——设计数据结构1.1 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • 本文介绍了一道网络流题目hdu4888 Redraw Beautiful Drawings的解题思路。题目要求以行和列作为结点建图,并通过最大流算法判断是否有解以及是否唯一。文章详细介绍了建图和算法的过程,并强调在dfs过程中要进行回溯。 ... [详细]
  • PDO MySQL
    PDOMySQL如果文章有成千上万篇,该怎样保存?数据保存有多种方式,比如单机文件、单机数据库(SQLite)、网络数据库(MySQL、MariaDB)等等。根据项目来选择,做We ... [详细]
  • EzPP 0.2发布,新增YAML布局渲染功能
    EzPP发布了0.2.1版本,新增了YAML布局渲染功能,可以将YAML文件渲染为图片,并且可以复用YAML作为模版,通过传递不同参数生成不同的图片。这个功能可以用于绘制Logo、封面或其他图片,让用户不需要安装或卸载Photoshop。文章还提供了一个入门例子,介绍了使用ezpp的基本渲染方法,以及如何使用canvas、text类元素、自定义字体等。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 开源Keras Faster RCNN模型介绍及代码结构解析
    本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]
author-avatar
王诗昀彦廷
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有