找到更好的聚类后的分类Sklearn

作者：放ch养奶牛 | 来源：互联网 | 2023-09-14 09:49

我使用kmeans对数据进行分类。然后我发现了更好的k聚类，它使用Elbow方

我使用kmeans对数据进行分类。

然后我发现了更好的k聚类，它使用Elbow方法和轮廓来验证决策。

那么现在我该如何分类数据并绘制dist图表？

您能帮我吗？

这是我的代码。

import pandas as pd import seaborn as sns from sklearn.datasets import load_iris from sklearn.cluster import KMeans from sklearn import preprocessing import matplotlib.pyplot as plt from sklearn.metrics import silhouette_score %matplotlib inline df_diabetes = pd.read_csv('diabetes.csv') #Deletando a coluna "Classe" df_noclass = df_diabetes.drop('Classe',axis=1) df_noclass.head() nomes = df_diabetes_noclass.columns valores = df_diabetes_noclass.values escala_min_max = preprocessing.MinmaxScaler() valores_normalizados = escala_min_max.fit_transform(valores) df_diabetes_normalizado = pd.DataFrame(valores_normalizados) df_diabetes_normalizado.columns = nomes df_diabetes_normalizado.head(5) sse = {} for k in range(1,10): kmeans = KMeans(n_clusters=k,max_iter=1000).fit(data) df_diabetes_normalizado["clusters"] = kmeans.labels_ sse[k] = kmeans.inertia_ plt.figure(figsize=(14,9)) plt.plot(list(sse.keys()),list(sse.values())) plt.xlabel("Numero de Clusters") plt.ylabel("SSE") plt.show() X = df_diabetes_normalizado y = df_diabetes_normalizado for n_cluster in range(2,11): kmeans = KMeans(n_clusters=n_cluster).fit(X) label = kmeans.labels_ sil_coeff = silhouette_score(X,label,metric='euclidean') print("Para n_clusters={},O Coeficiente de silueta é {}".format(n_cluster,sil_coeff))

我现在需要对数据进行分类，并创建如下图所示的图。

找到更好的聚类后的分类-Sklearn

如果要预测新数据属于哪个群集，则需要使用预测方法：

kmeans.predict(newData)

这是predict方法的文档链接：

https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#sklearn.cluster.KMeans.predict

推荐阅读

case
探索阿里云RDS中MySQL的高效压缩存储引擎TokuDB应用

在过去，我曾使用过自建MySQL服务器中的MyISAM和InnoDB存储引擎（也曾尝试过Memory引擎）。今年初，我开始转向阿里云的关系型数据库服务，并深入研究了其高效的压缩存储引擎TokuDB。TokuDB在数据压缩和处理大规模数据集方面表现出色，显著提升了存储效率和查询性能。通过实际应用，我发现TokuDB不仅能够有效减少存储成本，还能显著提高数据处理速度，特别适用于高并发和大数据量的场景。 ... [详细]

蜡笔小新 2024-11-04 11:36:52
byte
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
go
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
join
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
grid
JavaAwtSwing笔记之 JComponent JLabel 的 setBorder(Border 边框) 用例

JComponentJLabel的setBorder前言用例2205262241前言setBorder(Border边框)实现自JComponentjava.awt.Insets ... [详细]

蜡笔小新 2024-11-12 13:48:19
go
如何将Python与Excel高效结合：常用操作技巧解析

本文深入探讨了如何将Python与Excel高效结合，涵盖了一系列实用的操作技巧。文章内容详尽，步骤清晰，注重细节处理，旨在帮助读者掌握Python与Excel之间的无缝对接方法，提升数据处理效率。 ... [详细]

蜡笔小新 2024-11-11 15:18:30
version
PTArchiver工作原理详解与应用分析

PTArchiver工作原理及其应用分析本文详细解析了PTArchiver的工作机制，探讨了其在数据归档和管理中的应用。PTArchiver通过高效的压缩算法和灵活的存储策略，实现了对大规模数据的高效管理和长期保存。文章还介绍了其在企业级数据备份、历史数据迁移等场景中的实际应用案例，为用户提供了实用的操作建议和技术支持。 ... [详细]

蜡笔小新 2024-11-11 13:40:49
sum
基于Net Core 3.0与Web API的前后端分离开发：Vue.js在前端的应用

本文介绍了如何使用Net Core 3.0和Web API进行前后端分离开发，并重点探讨了Vue.js在前端的应用。后端采用MySQL数据库和EF Core框架进行数据操作，开发环境为Windows 10和Visual Studio 2019，MySQL服务器版本为8.0.16。文章详细描述了API项目的创建过程、启动步骤以及必要的插件安装，为开发者提供了一套完整的开发指南。 ... [详细]

蜡笔小新 2024-11-11 10:58:21
function
WordPress Duplicator 0.4.4 版本存在跨站脚本攻击漏洞分析

在对WordPress Duplicator插件0.4.4版本的安全评估中，发现其存在跨站脚本（XSS）攻击漏洞。此漏洞可能被利用进行恶意操作，建议用户及时更新至最新版本以确保系统安全。测试方法仅限于安全研究和教学目的，使用时需自行承担风险。漏洞编号：HTB23162。 ... [详细]

蜡笔小新 2024-11-10 13:16:43
function
全面覆盖的前端开发面试题集锦（附详尽解答）

本文汇集了我在网络上搜集以及在实际面试中遇到的前端开发面试题目，并附有详细解答。无论是初学者还是有一定经验的开发者，都应深入理解这些问题背后的原理，通过系统学习和透彻研究，逐步形成自己的知识体系和技术框架。 ... [详细]

蜡笔小新 2024-11-09 16:51:53
go
【源自百度知识】批处理技术详解与应用

本文详细介绍了批处理技术的基本概念及其在实际应用中的重要性。首先，对简单的批处理内部命令进行了概述，重点讲解了Echo命令的功能，包括如何打开或关闭回显功能以及显示消息。如果没有指定任何参数，Echo命令会显示当前的回显设置。此外，文章还探讨了批处理技术在自动化任务执行、系统管理等领域的广泛应用，为读者提供了丰富的实践案例和技术指导。 ... [详细]

蜡笔小新 2024-11-09 10:19:25
node.js
[label][IDE] Building Node.js Applications Using WebStorm

WebStorm 是一款强大的集成开发环境，支持多种现代 Web 开发技术，包括 Node.js、CoffeeScript、TypeScript、Dart、Jade、Sass、LESS 和 Stylus。它为开发者提供了丰富的功能和工具，帮助高效构建和调试复杂的 Node.js 应用程序。 ... [详细]

蜡笔小新 2024-11-07 19:58:31
grid
利用 Python 中的 Altair 库实现数据抖动的水平剥离分析

利用 Python 中的 Altair 库实现数据抖动的水平剥离分析 ... [详细]

蜡笔小新 2024-11-02 12:39:54
go
在VSCode中添加自定义外部命令

通过将常用的外部命令集成到VSCode中，可以提高开发效率。本文介绍如何在VSCode中配置和使用自定义的外部命令，从而简化命令执行过程。 ... [详细]

蜡笔小新 2024-11-13 16:57:15
go
稀疏直接法视觉里程计中的特征点优化：基于光度误差最小化的灰度图像线性插值技术

在稀疏直接法视觉里程计中，通过优化特征点并采用基于光度误差最小化的灰度图像线性插值技术，提高了定位精度。该方法通过对空间点的非齐次和齐次表示进行处理，利用RGB-D传感器获取的3D坐标信息，在两帧图像之间实现精确匹配，有效减少了光度误差，提升了系统的鲁棒性和稳定性。 ... [详细]

蜡笔小新 2024-10-31 13:24:59

放ch养奶牛

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章