Pythonpandas–特别合并/替换

作者：手浪用户2502884343 | 来源：互联网 | 2023-10-11 20:49

对于pandas操作来说,我有两个这样的数据帧：importpandasaspddfpd.DataFrame({'name':['a',&#

对于pandas操作来说,我有两个这样的数据帧：

import pandas as pd df = pd.DataFrame({'name': ['a','a','b','b','c','c'], 'id':[1,2,1,2,1,2], 'val1':[0,0,0,0,0,0],'val2':[0,0,0,0,0,0],'val3':[0,0,0,0,0,0]}) id name val1 val2 val3 0 1 a 0 0 0 1 2 a 0 0 0 2 1 b 0 0 0 3 2 b 0 0 0 4 1 c 0 0 0 5 2 c 0 0 0 subdf = pd.DataFrame({'name': ['a','b','c'], 'id':[1,1,2],'val1':[0.3,0.4,0.7], 'val2':[4,5,4]} id name val1 val2 0 1 a 0.3 4 1 1 b 0.4 5 2 2 c 0.7 4

我想获得输出：

id name val1 val2 val3 0 1 a 0.3 4 0 1 2 a 0.0 0 0 2 1 b 0.4 5 0 3 2 b 0.0 0 0 4 1 c 0.0 0 0 5 2 c 0.7 4 0

但我没有抓住替换的例子,只是添加了我看到的教程中的列/行！

解决方法:

这需要几个步骤,在匹配的列上留下merge,这将创建“x”和“y”,其中存在冲突：

In [25]: merged = df.merge(subdf, on=['id', 'name'], how='left') merged Out[25]: id name val1_x val2_x val3 val1_y val2_y 0 1 a 0 0 0 0.3 4 1 2 a 0 0 0 NaN NaN 2 1 b 0 0 0 0.4 5 3 2 b 0 0 0 NaN NaN 4 1 c 0 0 0 NaN NaN 5 2 c 0 0 0 0.7 4 In [26]: # take the values that of interest from the clashes merged['val1'] = np.max(merged[['val1_x', 'val1_y']], axis=1) merged['val2'] = np.max(merged[['val2_x', 'val2_y']], axis=1) merged Out[26]: id name val1_x val2_x val3 val1_y val2_y val1 val2 0 1 a 0 0 0 0.3 4 0.3 4 1 2 a 0 0 0 NaN NaN 0.0 0 2 1 b 0 0 0 0.4 5 0.4 5 3 2 b 0 0 0 NaN NaN 0.0 0 4 1 c 0 0 0 NaN NaN 0.0 0 5 2 c 0 0 0 0.7 4 0.7 4 In [27]: # drop the additional columns merged = merged.drop(labels=['val1_x', 'val1_y','val2_x', 'val2_y'], axis=1) merged Out[27]: id name val3 val1 val2 0 1 a 0 0.3 4 1 2 a 0 0.0 0 2 1 b 0 0.4 5 3 2 b 0 0.0 0 4 1 c 0 0.0 0 5 2 c 0 0.7 4

另一种方法是在“id”和“name”上对df进行排序,然后调用update：

In [30]: df = df.sort(columns=['id','name']) subdf = subdf.sort(columns=['id','name']) df.update(subdf) df Out[30]: id name val1 val2 val3 0 1 a 0.3 4 0 2 2 c 0.7 4 0 4 1 c 0.0 0 0 1 1 b 0.4 5 0 3 2 b 0.0 0 0 5 2 c 0.0 0 0

推荐阅读

import
Python 中使用 PyPDF2 在内存里高效合并 PDF 文件

本文探讨了如何利用 Python 的 PyPDF2 库在内存中高效地合并多个 PDF 文件，并讨论了相关的内存管理问题及优化策略。 ... [详细]

蜡笔小新 2024-12-17 18:39:12
import
Python——对象自省

对象自省自省在计算机编程领域里，是指在运行时判断一个对象的类型和能力。dir能够返回一个列表，列举了一个对象所拥有的属性和方法。my_list[ ... [详细]

蜡笔小新 2024-12-23 12:55:35
import
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
js
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
text
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
text
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
text
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
import
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
import
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
import
Python 使用 xlrd 库读取 Excel 文件

本文介绍如何使用 Python 的 xlrd 库读取 Excel 文件，并将其数据处理后存储到数据库中。通过实际案例，详细讲解了文件路径、合并单元格处理等常见问题。 ... [详细]

蜡笔小新 2024-12-24 17:29:27
import
开发笔记:9.八大排序

开发笔记:9.八大排序 ... [详细]

蜡笔小新 2024-12-24 01:20:47
text
springMVC JRS303验证

springMVC JRS303验证 ... [详细]

蜡笔小新 2024-12-20 09:07:39
text
Go+ 中的上下文处理指南

本文详细介绍 Go+ 编程语言中的上下文处理机制，涵盖其基本概念、关键方法及应用场景。Go+ 是一门结合了 Go 的高效工程开发特性和 Python 数据科学功能的编程语言。 ... [详细]

蜡笔小新 2024-12-28 11:05:31
go
基于Node.js、Express、MongoDB和Socket.io的实时聊天应用开发

本文详细介绍了使用Node.js、Express、MongoDB和Socket.io构建的实时聊天应用程序。涵盖项目结构、技术栈选择及关键依赖项的配置。 ... [详细]

蜡笔小新 2024-12-22 15:31:28
utf-8
JSON 解析失败问题排查

在PHP后端开发中遇到一个难题：通过第三方类文件发送短信功能返回的JSON字符串无法解析。本文将探讨可能的原因并提供解决方案。 ... [详细]

蜡笔小新 2024-12-21 18:39:23

手浪用户2502884343

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章