当前位置: 开发笔记 > 编程语言 > 正文

python查找重复数据_在pythonndarray中查找重复行的索引

作者：vipB时代_959 | 来源：互联网 | 2023-08-26 10:12

我编写了for循环以枚举包含n行28x28像素值的多维ndarray。在我在寻找每一行被复制的索引和没有冗余的重复的索引。在我发现了这个代码here(感谢unutbu)并修改了它以

我编写了for循环以枚举包含n行28x28像素值的多维ndarray。在

我在寻找每一行被复制的索引和没有冗余的重复的索引。在

我发现了这个代码here(感谢unutbu)并修改了它以读取ndarray&＃xff0c;它70%的时间都能工作&＃xff0c;但是30%的时间它会将错误的图像识别为重复的。在

如何改进它来检测正确的行&＃xff1f;在def overlap_same(arr):

seen &＃61; []

dups &＃61; collections.defaultdict(list)

for i, item in enumerate(arr):

for j, orig in enumerate(seen):

if np.array_equal(item, orig):

dups[j].append(i)

break

else:

seen.append(item)

return dups

例如&＃xff0c;返回重叠同一(列车)返回&＃xff1a;

^{pr2}$

在matplotlib上绘制一些正确案例的示例可以得到&＃xff1a;fig &＃61; plt.figure()

a&＃61;fig.add_subplot(1,2,1)

plt.imshow(train[35])

a.set_title(&＃39;train[35]&＃39;)

a&＃61;fig.add_subplot(1,2,2)

plt.imshow(train[1815])

a.set_title(&＃39;train[1815]&＃39;)

plt.show

哪个是正确的

但是&＃xff1a;fig &＃61; plt.figure()

a&＃61;fig.add_subplot(1,2,1)

plt.imshow(train[3208])

a.set_title(&＃39;train[3208]&＃39;)

a&＃61;fig.add_subplot(1,2,2)

plt.imshow(train[4426])

a.set_title(&＃39;train[4426]&＃39;)

plt.show

不正确&＃xff0c;因为它们不匹配

样本数据(列车[&＃xff1a;3])array([[[-0.5 , -0.5 , -0.5 , ..., 0.48823529,

0.5 , 0.17058824],

[-0.5 , -0.5 , -0.5 , ..., 0.48823529,

0.5 , -0.0372549 ],

[-0.5 , -0.5 , -0.5 , ..., 0.5 ,

0.47647059, -0.24509804],

...,

[-0.49215686, 0.34705883, 0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

[-0.31176472, 0.44901961, 0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

[-0.11176471, 0.5 , 0.49215686, ..., -0.5 ,

-0.5 , -0.5 ]],

[[-0.24509804, 0.2764706 , 0.5 , ..., 0.5 ,

0.25294119, -0.36666667],

[-0.5 , -0.47254902, -0.02941176, ..., 0.20196079,

-0.46862745, -0.5 ],

[-0.49215686, -0.5 , -0.5 , ..., -0.47647059,

-0.5 , -0.49607843],

...,

[-0.49215686, -0.49607843, -0.5 , ..., -0.5 ,

-0.5 , -0.49215686],

[-0.5 , -0.5 , -0.26862746, ..., 0.13137256,

-0.46470588, -0.5 ],

[-0.30000001, 0.11960784, 0.48823529, ..., 0.5 ,

0.28431374, -0.24117647]],

[[-0.5 , -0.5 , -0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

[-0.5 , -0.5 , -0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

[-0.5 , -0.5 , -0.5 , ..., -0.5 ,

-0.5 , -0.5 ],

...,

[-0.5 , -0.5 , -0.5 , ..., 0.48431373,

0.5 , 0.31568629],

[-0.5 , -0.49215686, -0.5 , ..., 0.49215686,

0.5 , 0.04901961],

[-0.5 , -0.5 , -0.5 , ..., 0.04117647,

-0.17450981, -0.45686275]]], dtype&＃61;float32)

推荐阅读

c语言
学习SLAM的女生，很酷

本文介绍了学习SLAM的女生的故事，她们选择SLAM作为研究方向，面临各种学习挑战，但坚持不懈，最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想，同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]

蜡笔小新 2023-12-14 17:55:18
utf-8
Python3中选择文件对话框的格式打开和保存图片

本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数，可以方便地选择要打开或保存的图片文件，并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]

蜡笔小新 2023-12-14 17:46:55
string
Spring源码解密之默认标签的解析方式分析

本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断，区分默认命名空间和自定义命名空间，并采用不同的解析方式。其中，bean标签的解析最为复杂和重要。 ... [详细]

蜡笔小新 2023-12-14 17:24:50
include
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
main
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
object
使用 Ubuntu 中的 Python 获取浏览器历史记录

使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]

蜡笔小新 2023-12-14 08:57:59
main
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
main
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
main
python创建一个窗口_等一个大佬啊要求用python创建一个窗口，窗口按钮功能是创建一个球体或立方体。明天上课之前交给我...

展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]

蜡笔小新 2023-12-13 16:26:09
format
使用pymysql的Python无法向mysql数据库中的表添加字段

WhenIusepythontoapplythepymysqlmoduletoaddafieldtoatableinthemysqldatabase,itdo ... [详细]

蜡笔小新 2023-12-12 13:45:10
function
Java各个版本新特性及Lambda表达式简介

本文介绍了Java各个版本的新特性，包括接口的默认方法和Lambda表达式。接口的默认方法允许给接口添加非抽象的方法实现，使用default关键字。Lambda表达式提供了更简洁的语法，可以替代传统的匿名对象的方式。同时，还介绍了Lambda表达式在排序中的应用。 ... [详细]

蜡笔小新 2023-12-12 10:54:01
string
Python高级之网络编程及TCP/IP协议簇的OSI七层模型介绍

本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容，主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]

蜡笔小新 2023-12-14 18:16:27
string
解决Mac上无法使用localhost连接mysql的问题

本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题，并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别，指出了使用socket方式连接导致连接失败的原因。此外，还提供了相关链接供读者深入了解。 ... [详细]

蜡笔小新 2023-12-13 17:48:58
string
开发笔记：解决播放框架内容安全策略设置不起作用的问题

本文介绍了作者在开发过程中遇到的问题，即播放框架内容安全策略设置不起作用的错误。作者通过使用编译时依赖注入的方式解决了这个问题，并分享了解决方案。文章详细描述了问题的出现情况、错误输出内容以及解决方案的具体步骤。如果你也遇到了类似的问题，本文可能对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-13 16:03:19
string
HDFS2.x新特性

一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]

蜡笔小新 2023-12-13 13:52:40

vipB时代_959

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章