如何比较来自两个不同数据帧的列并保留第一个数据帧中的值？

作者：一只幸福的汪星人 | 来源：互联网 | 2023-08-31 12:04

我有两个不同大小的数据框。它们都有四列：单词、x、y和z。但是，在加入这两个数据帧时，我想保留相似单词的x、y、z值。保留df1中不存在但df2中存在的词。

我有两个不同大小的数据框。它们都有四列：单词、x、y 和 z。

但是，在加入这两个数据帧时，我想保留相似单词的 x、y、z 值。保留 df1 中不存在但 df2 中存在的词。

我尝试使用，pd.merge但这将保留两个值并且仅保留相似的单词。如果我使用，pd.concat我必须删除类似的元素，但不会来自第一个数据帧。

样本

df1 = pd.DataFrame({'Words': ['aardvark', 'abalone', 'abandon'], 'x': [0.999, 0.888, 0.777], 'y': [0.999, 0.888, 0.777], 'z': [0.999, 0.888, 0.777]}) df2 = pd.DataFrame({'Words': ['aaaaahh', 'aardvark', 'abalone', 'abandon', 'zoo', 'zoom', 'zucchini'], 'x': [0.199, 0.111, 0.222, 0.333, 0.232, 0.842, 0.945], 'y': [0.929, 0.111, 0.222, 0.333, 0.112, 0.62, 0.265], 'z': [0.993, 0.111, 0.222, 0.333, 0.212, 0.344, 0.745]}) # Expected output df_res = pd.DataFrame({'Words': ['aaaaahh', 'aardvark', 'abalone', 'abandon', 'zoo', 'zoom', 'zucchini'], 'x': [0.199, 0.999, 0.888, 0.777, 0.232, 0.842, 0.945], 'y': [0.929, 0.999, 0.888, 0.777, 0.112, 0.62, 0.265], 'z': [0.993, 0.999, 0.888, 0.777, 0.212, 0.344, 0.745]})

我试过的

import pandas as pd # Merge df_res = pd.merge(df1, df2, on='Word', how='inner') # Concat df_cOncat= pd.concat(objs=[df1, df2], ignore_index=True) df_cOncat= pd.drop_duplicates(subset=['Word'], keep=False, ignore_index=True) # Compare d_res = d1[(d1['Word'] != d1['Word'])] ValueError: Can only compare identically-labeled Series objects

回答

您可以使用df.appendto 附加df1到df2，然后是drop_duplicates， with keep='last'， thensort_index和reset_index：

>>> (df2.append(df1) .drop_duplicates('Words', keep='last') .sort_index() .reset_index(drop=True)) Words x y z 0 aaaaahh 0.199 0.929 0.993 1 aardvark 0.999 0.999 0.999 2 abalone 0.888 0.888 0.888 3 abandon 0.777 0.777 0.777 4 zoo 0.232 0.112 0.212 5 zoom 0.842 0.620 0.344 6 zucchini 0.945 0.265 0.745

推荐阅读

object
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
shell
十大经典排序算法动图演示+Python实现

本文介绍了十大经典排序算法的原理、演示和Python实现。排序算法分为内部排序和外部排序，常见的内部排序算法有插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。文章还解释了时间复杂度和稳定性的概念，并提供了相关的名词解释。 ... [详细]

蜡笔小新 2023-12-10 19:28:59
include
vue使用

关键词： ... [详细]

蜡笔小新 2023-12-14 19:14:56
include
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
include
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
php
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
php
scrapy存入excel时，excel文件被反复擦除重写。文件大小始终不超过100k，请问这种情况改如何解决

怀疑是每次都在新建文件，具体代码如下 ... [详细]

蜡笔小新 2023-12-13 17:53:49
php
python创建一个窗口_等一个大佬啊要求用python创建一个窗口，窗口按钮功能是创建一个球体或立方体。明天上课之前交给我...

展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]

蜡笔小新 2023-12-13 16:26:09
copy
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
copy
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
copy
使用n3-charts绘制以日期为x轴的数据

本文介绍了如何使用n3-charts绘制以日期为x轴的数据，并提供了相应的代码示例。通过设置x轴的类型为日期，可以实现对日期数据的正确显示和处理。同时，还介绍了如何设置y轴的类型和其他相关参数。通过本文的学习，读者可以掌握使用n3-charts绘制日期数据的方法。 ... [详细]

蜡笔小新 2023-12-10 00:19:21
usb
如何使用MATLAB调用摄像头进行人脸检测和识别

本文介绍了如何使用MATLAB调用摄像头进行人脸检测和识别。首先需要安装扩展工具，并下载安装OS Generic Video Interface。然后使用MATLAB的机器视觉工具箱中的VJ算法进行人脸检测，可以直接调用CascadeObjectDetector函数进行检测。同时还介绍了如何调用摄像头进行人脸识别，并对每一帧图像进行识别。最后，给出了一些相关的参考资料和实例。 ... [详细]

蜡笔小新 2023-12-09 08:56:44
php
包含vb.net同时运行的词条

vb.net不用多线程如何同时运行两个过程？不用多线程？即使用多线程，也不会是“同时”执行，题主只要略懂一些计算机编译原理就能明白了。不用多线程更不可能让两个过程同步执行了。不过可 ... [详细]

蜡笔小新 2023-10-17 18:18:35
client
IT十八掌作业_java基础第21天_mysql

感谢大家对IT十八掌大数据的支持，今天的作业如下：1.实践PreparedStament的CRUD操作。2.对比Statement和PreparedStatement的大批量操作耗时?(1 ... [详细]

蜡笔小新 2023-10-17 17:53:34
php
pythonMatplotlib(二)

Matplotlib+pandas作图一、对csv文件进行提取ruixi.csv对上述表格进行提取并做图画出图像二、对.xlsx进行提取:rui ... [详细]

蜡笔小新 2023-10-17 15:51:22

一只幸福的汪星人

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章