使用pd.merge进行表连接，出现多余行的问题

作者：Larry_He | 来源：互联网 | 2023-08-22 17:42

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接，左表保持不变，匹配

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。
表1 论文出版物信息&＃xff08;存在空值&＃xff09;
表2 出版物指标信息
利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接&＃xff0c;左表保持不变&＃xff0c;匹配右表的行&＃xff08;合并后右表肯能存在空值&＃xff09;。

paperPublicationIndicator &＃61; pd.merge(paperPublication,publicationIndicator,how&＃61;&＃39;left&＃39;,left_on&＃61;&＃39;出版物&＃39;,right_on&＃61;&＃39;名称&＃39;,sort&＃61;False)

结果发现连接后表多出来13行。进行探究发现是表2出版物指标信息中存在出版物A-指标1&＃xff0c;出版物A-指标2这样的出版物重复行。记性匹配后会出现&＃xff1a;

出版物名称指标出版物A 出版物A 指标1 出版物A 出版物A 指标2 #多余的行

这里选择预先删除表2出版物指标中的重复出版物信息。

publicationIndicator.drop_duplicates(subset&＃61;[&＃39;名称&＃39;],keep&＃61;&＃39;first&＃39;,inplace&＃61;True)

这样结果就没有问题了。

推荐阅读

tree
使用在线工具jsonschema2pojo根据json生成java对象

本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具，用户只需将json字符串复制到输入框中，即可自动将其转换成java对象。该工具还能解析列表式的json数据，并将嵌套在内层的对象也解析出来。本文以请求github的api为例，展示了使用该工具的步骤和效果。 ... [详细]

蜡笔小新 2023-12-13 21:23:45
string
Incorrect implementation of List field deserialization

Problemexplanation: ... [详细]

蜡笔小新 2023-10-16 21:42:08
string
OrbitDBPeer 2 Peer Database using CRDTs

2019独角兽企业重金招聘Python工程师标准Apeer-to-peerdatabaseforthedecentralizedwebOrbitDBisaserverless ... [详细]

蜡笔小新 2023-10-16 15:17:57
tree
abaqus用python开发gui界面_AbaqusGUI程序开发指南Python语言

序言n前言nn第一章概述1n1．1简单插件实例——创建带孔板有限元模型2n1．2Abaqus图形界面程序开发的意义10nn第二章Python语言基础11 ... [详细]

蜡笔小新 2023-10-16 14:57:07
int
poj1182 食物链（并查集经典题）

食物链TimeLimit:1000MSMemoryLimit:10000KTotalSubmissions:124632Accepted:38129Description动物王 ... [详细]

蜡笔小新 2023-10-16 13:32:30
string
基于halcon的特征匹配实例

特征匹配原图模板识别图代码结果原图模板识别图代码*这个例子在图片数据库中查找文章的页面。*第一步是训练不同的页面并创建模型。*然后搜索未知图像并检测出正确的文章页面。*请注意& ... [详细]

蜡笔小新 2023-10-13 08:58:05
hash
第八章元组与集合

目录一、元组二、集合三、集合的数学操作四、集合的相关操作五、集合间的关系六、列表、元组、集合、字典区别一、元组元组是python内置的数据结构之一， ... [详细]

蜡笔小新 2023-10-12 07:20:20
go
学习python课程第六天

一.元祖类型 (tuple)1.什么是元祖?用途:用于存放多个值,当存放的多个值只有读的需求没有改变的需求时,用元祖最合适.定义方式:在()内用逗号分隔开的多个任意类型的值t(1, ... [详细]

蜡笔小新 2023-10-11 22:40:59
go
有没有一种方法可以在反应/观察中使用嵌套的reactPoll来绘制依赖于DB和UI更改的图

对于我当前的需求，我需要绘制一些我从mongodb中获取的数据的图表，并且我正在使用reactPo ... [详细]

蜡笔小新 2023-10-11 18:49:23
tree
steps/train_mono.sh

定义拓扑结构、参数初始化$gmm-init-mono--shared-phones$langphonessets.int--train-feats$featssubset-fe ... [详细]

蜡笔小新 2023-10-11 13:39:20
int
Python 集合(set) 介绍

集合set集合是可变的容器集合内的数据对象都是唯一的（不能重复多次的）集合是无序的存储结构，集合中的数据没有先后关系集合内的元素必须是不可 ... [详细]

蜡笔小新 2023-10-11 12:32:45
string
【leetcode】solution in java——Easy1

转载请注明原文地址：http:www.cnblogs.comygj0930p6409067.html1：HammingdistanceTheHammin ... [详细]

蜡笔小新 2023-10-11 12:18:12
go
Exists与Not执行

引子：Question:CanyoutellmewhatthedifferenceoftwoSQLstatementsatperformanceofexecution ... [详细]

蜡笔小新 2023-10-11 10:23:46
go
如何提取数据框中另一个行中不存在的行

如何提取数据框中 ... [详细]

蜡笔小新 2023-10-10 23:08:43
go
Barabási–Python中的阿尔伯特模型

我正在尝试使用 ... [详细]

蜡笔小新 2023-10-10 19:47:38

Larry_He

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章