热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【阿旭机器学习实战】【19】如何在不减少分辨率的情况下降低图片存储空间?KMeans算法进行图片颜色点分类存储

【阿旭机器学习实战】系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流。本文使用无监督学习算法K-means聚类算法通过对图





【阿旭机器学习实战】系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流。


本文使用无监督学习算法K-means聚类算法通过对图片颜色点进行聚类的方式,达到降低图片存储空间的目的



对于KMeans聚类算法原理的介绍,请参考之前的博文《【阿旭机器学习实战】【16】KMeans算法介绍及实战:利用KMeans进行足球队分类》




目录


  • 前言
  • 1. 加载图片及特征处理
  • 2. 进行KMeans聚类建模
  • 3. 使用算法对原始图片进行聚类
  • 4. 展示原始图片与使用64个聚类中心聚类后的图片
  • 5. 图片存储方式



前言

在如今的互联网时代,网络上充满了海量的数据,当然也包括很多图片。因此图像压缩技术对于压缩图像和减少存储空间变得至关重要。

本文我们将使用无监督学习算法K-means聚类算法通过对图片颜色点进行聚类的方式,达到降低图片存储空间的目的

图像由称为像素的几个强度值组成。在彩色图像中, 每个像素为3个字节, 每个像素包含RGB(红-蓝-绿)值, 该值具有红色强度值, 然后是蓝色, 然后是绿色强度值。

具体方法如下:


  1. 使用K均值聚类算法将图片相似的颜色归为不同的” k”个聚类(例如k = 64),每个簇质心(RGB值)代表其各自簇的RGB颜色空间中的颜色矢量。

  2. 根据Kmeans算法找出图片上每个像素点对应的簇质心(RGB值)的标号值。

  3. 图片存储时,我们只需存储每个像素的标签编号, 并保留每个聚类中心的颜色向量的记录,根据编号及这个聚类中心颜色向量就可以告诉该像素所属的集群,即RGB值。

由上述存储方式可以看出,图片单个像素点的存储由RGB的3个字节,变为了只需存储一个标签编号的数字。存储空间只需原来的30%左右。


1. 加载图片及特征处理

from sklearn import datasets
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

# 加载图片
china = datasets.load_sample_image("china.jpg")
plt.imshow(china)

在这里插入图片描述

china.dtype

dtype('uint8')

china.shape

(427, 640, 3)

# 除以255,将像素点的值变为0-1之间
china = china/255

h,w,d = china.shape

# 把像素点展开
img_array = china.reshape((h*w,d))

img_array.shape

(273280, 3)

# 把像素点随机打乱
from sklearn.utils import shuffle
img_array_shuffle = shuffle(img_array,random_state=0)

plt.imshow(img_array_shuffle.reshape((h,w,d)))

在这里插入图片描述


2. 进行KMeans聚类建模

from sklearn.cluster import KMeans
# 用64个聚类来划分这些像素点
km = KMeans(n_clusters=64,random_state=0)

# 仅用前1000个像素点进行模型训练
km.fit(img_array_shuffle[:1000])

KMeans(algorithm='auto', copy_x=True, init='k-means++', max_iter=300,
n_clusters=64, n_init=10, n_jobs=1, precompute_distances='auto',
random_state=0, tol=0.0001, verbose=0)

# 表示这1000个样本对应的聚类标签,展示前100个标签编号
km.labels_[:100]

array([22, 36, 8, 56, 38, 42, 22, 31, 7, 2, 55, 31, 62, 21, 52, 43, 31,
18, 2, 4, 31, 56, 21, 2, 15, 5, 6, 49, 57, 13, 5, 21, 21, 3,
21, 47, 21, 2, 47, 32, 5, 42, 5, 33, 45, 56, 5, 57, 2, 38, 47,
6, 50, 50, 27, 62, 56, 57, 30, 28, 6, 5, 26, 24, 58, 44, 8, 21,
58, 60, 10, 56, 31, 10, 41, 5, 62, 41, 22, 6, 38, 25, 57, 36, 28,
21, 49, 2, 21, 48, 14, 15, 57, 22, 47, 63, 47, 2, 41, 34])

# # 用聚类中心点的颜色来代表这个聚类的颜色,展示前10个聚类中心
km.cluster_centers_[:10]

array([[0.62570806, 0.60261438, 0.53028322],
[0.15546218, 0.1557423 , 0.12829132],
[0.82063983, 0.89896801, 0.98462332],
[0.42039216, 0.43843137, 0.2227451 ],
[0.69527105, 0.74994233, 0.76516724],
[0.92174422, 0.9556336 , 0.99514194],
[0.07058824, 0.0754637 , 0.0508744 ],
[0.28205128, 0.26395173, 0.19638009],
[0.46509804, 0.43372549, 0.36901961],
[0.71328976, 0.41960784, 0.31851852]])

3. 使用算法对原始图片进行聚类

# 用km模型去对原图进行聚类
labels = km.predict(img_array)

创建一个函数用于重新合成图片

def recreate_img(centers,labels,h,w):
# 行数的作用是将每个像素点的值,用对应编号的聚类中心代替
# 按照h和w创建一个空白图片
img = np.zeros((h,w,3))
# 通过for循环,遍历img中每一个点,并且从labels中取出下标对应的聚类重新给img赋值
label_index = 0
for i in range(h):
for j in range(w):
img[i][j] = centers[labels[label_index]]
label_index += 1
return img

img_re = recreate_img(km.cluster_centers_, labels, h, w)

4. 展示原始图片与使用64个聚类中心聚类后的图片

plt.figure(figsize=(12,6))
axes1 = plt.subplot(121)
axes1.imshow(china)
axes1.set_title("Instaces")
axes2 = plt.subplot(122)
axes2.imshow(img_re)
axes2.set_title("64 colors,K-Means")

Text(0.5,1,'64 colors,K-Means')

在这里插入图片描述


5. 图片存储方式
  1. 存储上面的图片每个像素点对应的聚类编号:labels, 形状为:(273280,)
  2. 存储每个聚类编号对应聚类中心RGB值:km.cluster_centers_。形状为:(64, 3)

依据以上labels与km.cluster_centers_,我们即可还原出聚类之后的图片。相对于原始数据存储量降低了60%以上。

如果内容对你有帮助,感谢记得点赞+关注哦!



欢迎关注我的公众号:阿旭算法与机器学习,共同学习交流。
更多干货内容持续更新中…








推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
  • 本文介绍了贝叶斯垃圾邮件分类的机器学习代码,代码来源于https://www.cnblogs.com/huangyc/p/10327209.html,并对代码进行了简介。朴素贝叶斯分类器训练函数包括求p(Ci)和基于词汇表的p(w|Ci)。 ... [详细]
  • 本文介绍了如何使用MATLAB调用摄像头进行人脸检测和识别。首先需要安装扩展工具,并下载安装OS Generic Video Interface。然后使用MATLAB的机器视觉工具箱中的VJ算法进行人脸检测,可以直接调用CascadeObjectDetector函数进行检测。同时还介绍了如何调用摄像头进行人脸识别,并对每一帧图像进行识别。最后,给出了一些相关的参考资料和实例。 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • IjustinheritedsomewebpageswhichusesMooTools.IneverusedMooTools.NowIneedtoaddsomef ... [详细]
  • 本文介绍了Swing组件的用法,重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联,可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法,并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]
  • 欢乐的票圈重构之旅——RecyclerView的头尾布局增加
    项目重构的Git地址:https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集:http:www.jianshu.comno ... [详细]
  • 十大经典排序算法动图演示+Python实现
    本文介绍了十大经典排序算法的原理、演示和Python实现。排序算法分为内部排序和外部排序,常见的内部排序算法有插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。文章还解释了时间复杂度和稳定性的概念,并提供了相关的名词解释。 ... [详细]
author-avatar
一根吃兔子的萝卜
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有