当前位置: 开发笔记 > 编程语言 > 正文

pythondataframe模糊匹配_在两列pythondataframe之间的范围内搜索特定值

作者：爱的伤痕累2602882347_111 | 来源：互联网 | 2023-10-12 20:13

Asofwritingthis,thecurrentstablereleaseisv0.21.df0pd.read_csv(‘file1.csv’)df1pd.read_csv(‘

As of writing this, the current stable release is v0.21.

df0 = pd.read_csv(&＃8216;file1.csv&＃8217;)

df1 = pd.read_csv(&＃8216;file2.csv&＃8217;)

df0

Car Mileage

0 A 8

1 B 6

2 C 10

df1

Score Mileage(Min) Mileage(Max)

0 1 1 3

1 2 4 6

2 3 7 9

3 4 10 12

4 5 13 15

要查找分数,请通过调用IntervalIndex.from_tuples使用pd.IntervalIndex.这应该非常快-

v = df1.loc[:, &＃8216;Mileage(Min)&＃8217;:&＃8217;Mileage(Max)&＃8217;].apply(tuple, 1).tolist()

idx = pd.IntervalIndex.from_tuples(v, closed=&＃8217;both&＃8217;) # you can also use `from_arrays`

df0[&＃8216;Score&＃8217;] = df1.iloc[idx.get_indexer(df0.Mileage.values), &＃8216;Score&＃8217;].values

df0

Car Mileage Score

0 A 8 3

1 B 6 2

2 C 10 4

here概述了其他创建IntervalIndex的方法.

df0.to_csv(&＃8216;file3.csv&＃8217;)

这是我在这里所做的概述.

>首先,读入CSV文件

>使用pd.IntervalIndex构建间隔索引树.因此,搜索现在的复杂度是对数的.

>使用idx.get_indexer查找树中每个值的索引

>使用索引在df1中找到得分值,并将其分配回df0.请注意,我称.values,否则,分配回来时这些值将不对齐.

>将结果写回CSV

请注意,IntervalIndex是v0.20中的新功能,因此,如果您使用的是较旧的版本,请确保使用

pip install &＃8211;upgrade pandas

推荐阅读

settings
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
runtime
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
go
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
runtime
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
list
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
list
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
runtime
XNA 3.0 游戏编程：从 XML 文件加载数据

本文介绍如何在 XNA 3.0 游戏项目中从 XML 文件加载数据。我们将探讨如何将 XML 数据序列化为二进制文件，并通过内容管道加载到游戏中。此外，还会涉及自定义类型读取器和写入器的实现。 ... [详细]

蜡笔小新 2024-12-27 11:39:44
input
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
bit
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
char
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
list
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
merge
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
list
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
go
360SRC安全应急响应：从漏洞提交到修复的全过程

本文详细介绍了360SRC平台处理一起关键安全事件的过程，涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例，展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]

蜡笔小新 2024-12-27 11:10:05
go
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13

爱的伤痕累2602882347_111

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章