热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

pandas将df赋值到另一个df_为pandasdf添加标签,然后将df连接到另一个df现在标签是一个列表给出了什么?...

我有两个需要连接的csv文件。我在两个csv文件中读取了pandasdfs。一个有col标签,另一个没有。我将标签添加到需要它们的df,然后连接两个df

我有两个需要连接的csv文件。我在两个csv文件中读取了pandas dfs。一个有col标签,另一个没有。我将标签添加到需要它们的df,然后连接两个dfs。连接工作正常,但我添加的标签看起来像个别列表或其他东西。我无法弄清楚python正在做什么,特别是当你打印标签和df时,它看起来都很好。称之为这种方法。

我能够通过在读取csv时将col标签添加到csv来解决问题。然后它工作正常。称这种方法为二。方法一是怎么回事?

以下代码和结果。

接近一个

#read in the vectors as a pandas df vec

vecs=pd.read_csv(os.path.join(path,filename), header=None)

#label the feature vectors v1-vn and attach to the df

endrange=features+1

string='v'

vecnames=[string + str(i) for i in range(1,endrange)]

vecs.columns = [vecnames]

print('\nvecnames')

display(vecnames) #they look ok here

display(vecs.head()) #they look ok here

#read in the IDs and phrases as a pandas df

recipes=pd.read_csv(os.path.join(path,'2a_2d_id_all_recipe_forms.csv'))

print('\nrecipes file - ids and recipe phrases')

display(recipes.head())

test=pd.concat([recipes, vecs], axis=1)

print('\ncol labels for vectors look like lists!')

display(test.head())

方法一的结果:

['v1',

'v2',

'v3',

'v4',

'v5',

'v6',

'v7',

'v8',

'v9',

'v10',

'v11',

'v12',

'v13',

'v14',

'v15',

'v16',

'v17',

'v18',

'v19',

'v20',

'v21',

'v22',

'v23',

'v24',

'v25']

接近两个

当我读取未标记的文件时,通过将col标签添加到csv,它可以正常工作。为什么呢?

#label the feature vectors v1-vn and attach to the df

endrange=features+1

string='v'

vecnames=[string + str(i) for i in range(1,endrange)]

#read in the vectors as a pandas df and label the cols

vecs=pd.read_csv(os.path.join(path,filename), names=vecnames, header=None)

#read in the IDs and phrases as a pandas df

recipes=pd.read_csv(os.path.join(path,'2a_2d_id_all_recipe_forms.csv'))

test=pd.concat([recipes, vecs], axis=1)

print('\ncol labels for vectors as expected')

display(test.head())

方法二的结果



推荐阅读
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 本文介绍如何使用Python进行文本处理,包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图,展示文本数据的可视化分析方法。 ... [详细]
  • Python处理Word文档的高效技巧
    本文详细介绍了如何使用Python处理Word文档,涵盖从基础操作到高级功能的各种技巧。我们将探讨如何生成文档、定义样式、提取表格数据以及处理超链接和图片等内容。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文介绍了如何在Python中使用join()方法将列表中的元素连接成一个字符串。join()方法允许用户指定分隔符,从而灵活地生成所需格式的字符串。此外,我们还将探讨一些实际应用中的注意事项和技巧。 ... [详细]
  • 本文详细介绍了MicroATX(也称Mini ATX)和MATX主板规格,探讨了它们的结构特点、应用场景及对电脑系统成本和性能的影响。同时,文章还涵盖了相关操作系统的实用技巧,如蓝牙设备图标删除、磁盘管理等。 ... [详细]
  • 本文详细介绍如何在VSCode中配置自定义代码片段,使其具备与IDEA相似的代码生成快捷键功能。通过具体的Java和HTML代码片段示例,展示配置步骤及效果。 ... [详细]
  • 本文提供了一系列Python编程基础练习题,涵盖了列表操作、循环结构、字符串处理和元组特性等内容。通过这些练习题,读者可以巩固对Python语言的理解并提升编程技能。 ... [详细]
  • 本文介绍如何使用 Python 的 xlrd 库读取 Excel 文件,并将其数据处理后存储到数据库中。通过实际案例,详细讲解了文件路径、合并单元格处理等常见问题。 ... [详细]
  • 对象自省自省在计算机编程领域里,是指在运行时判断一个对象的类型和能力。dir能够返回一个列表,列举了一个对象所拥有的属性和方法。my_list[ ... [详细]
  • Kubernetes 持久化存储与数据卷详解
    本文深入探讨 Kubernetes 中持久化存储的使用场景、PV/PVC/StorageClass 的基本操作及其实现原理,旨在帮助读者理解如何高效管理容器化应用的数据持久化需求。 ... [详细]
  • 历经三十年的开发,Mathematica 已成为技术计算领域的标杆,为全球的技术创新者、教育工作者、学生及其他用户提供了一个领先的计算平台。最新版本 Mathematica 12.3.1 增加了多项核心语言、数学计算、可视化和图形处理的新功能。 ... [详细]
  • 本文旨在探讨如何利用决策树算法实现对男女性别的分类。通过引入信息熵和信息增益的概念,结合具体的数据集,详细介绍了决策树的构建过程,并展示了其在实际应用中的效果。 ... [详细]
author-avatar
_Rongrise
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有