热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python查找重复数据_在pythonndarray中查找重复行的索引

我编写了for循环以枚举包含n行28x28像素值的多维ndarray。在我在寻找每一行被复制的索引和没有冗余的重复的索引。在我发现了这个代码here(感谢unutbu)并修改了它以

我编写了for循环以枚举包含n行28x28像素值的多维ndarray。在

我在寻找每一行被复制的索引和没有冗余的重复的索引。在

我发现了这个代码here(感谢unutbu)并修改了它以读取ndarray,它70%的时间都能工作,但是30%的时间它会将错误的图像识别为重复的。在

如何改进它来检测正确的行?在def overlap_same(arr):

seen = []

dups = collections.defaultdict(list)

for i, item in enumerate(arr):

for j, orig in enumerate(seen):

if np.array_equal(item, orig):

dups[j].append(i)

break

else:

seen.append(item)

return dups

例如,返回重叠同一(列车)返回:

^{pr2}$

在matplotlib上绘制一些正确案例的示例可以得到:fig = plt.figure()

a=fig.add_subplot(1,2,1)

plt.imshow(train[35])

a.set_title('train[35]')

a=fig.add_subplot(1,2,2)

plt.imshow(train[1815])

a.set_title('train[1815]')

plt.show

哪个是正确的

但是:fig = plt.figure()

a=fig.add_subplot(1,2,1)

plt.imshow(train[3208])

a.set_title('train[3208]')

a=fig.add_subplot(1,2,2)

plt.imshow(train[4426])

a.set_title('train[4426]')

plt.show

不正确,因为它们不匹配

样本数据(列车[:3])array([[[-0.5 , -0.5 , -0.5 , ..., 0.48823529,

0.5 , 0.17058824],

[-0.5 , -0.5 , -0.5 , ..., 0.48823529,

0.5 , -0.0372549 ],

[-0.5 , -0.5 , -0.5 , ..., 0.5 ,

0.47647059, -0.24509804],

...,

[-0.49215686, 0.34705883, 0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

[-0.31176472, 0.44901961, 0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

[-0.11176471, 0.5 , 0.49215686, ..., -0.5 ,

-0.5 , -0.5 ]],

[[-0.24509804, 0.2764706 , 0.5 , ..., 0.5 ,

0.25294119, -0.36666667],

[-0.5 , -0.47254902, -0.02941176, ..., 0.20196079,

-0.46862745, -0.5 ],

[-0.49215686, -0.5 , -0.5 , ..., -0.47647059,

-0.5 , -0.49607843],

...,

[-0.49215686, -0.49607843, -0.5 , ..., -0.5 ,

-0.5 , -0.49215686],

[-0.5 , -0.5 , -0.26862746, ..., 0.13137256,

-0.46470588, -0.5 ],

[-0.30000001, 0.11960784, 0.48823529, ..., 0.5 ,

0.28431374, -0.24117647]],

[[-0.5 , -0.5 , -0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

[-0.5 , -0.5 , -0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

[-0.5 , -0.5 , -0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

...,

[-0.5 , -0.5 , -0.5 , ..., 0.48431373,

0.5 , 0.31568629],

[-0.5 , -0.49215686, -0.5 , ..., 0.49215686,

0.5 , 0.04901961],

[-0.5 , -0.5 , -0.5 , ..., 0.04117647,

-0.17450981, -0.45686275]]], dtype=float32)



推荐阅读
  • 学习SLAM的女生,很酷
    本文介绍了学习SLAM的女生的故事,她们选择SLAM作为研究方向,面临各种学习挑战,但坚持不懈,最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想,同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • Spring源码解密之默认标签的解析方式分析
    本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断,区分默认命名空间和自定义命名空间,并采用不同的解析方式。其中,bean标签的解析最为复杂和重要。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]
  • WhenIusepythontoapplythepymysqlmoduletoaddafieldtoatableinthemysqldatabase,itdo ... [详细]
  • Java各个版本新特性及Lambda表达式简介
    本文介绍了Java各个版本的新特性,包括接口的默认方法和Lambda表达式。接口的默认方法允许给接口添加非抽象的方法实现,使用default关键字。Lambda表达式提供了更简洁的语法,可以替代传统的匿名对象的方式。同时,还介绍了Lambda表达式在排序中的应用。 ... [详细]
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • 本文介绍了作者在开发过程中遇到的问题,即播放框架内容安全策略设置不起作用的错误。作者通过使用编译时依赖注入的方式解决了这个问题,并分享了解决方案。文章详细描述了问题的出现情况、错误输出内容以及解决方案的具体步骤。如果你也遇到了类似的问题,本文可能对你有一定的参考价值。 ... [详细]
  • HDFS2.x新特性
    一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]
author-avatar
vipB时代_959
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有