如何计算列熊猫数据框中列表的平均值

作者：liangpengtao | 来源：互联网 | 2023-09-09 15:25

我有数据看起来像这样data={col1:[[(1,22),(1.5,20),(3,32),(2,21)],[(2,24

我有数据看起来像这样

data={"col1":[ [(1,22),(1.5,20),(3,32),(2,21)], [(2,24),(2.5,22)], [(6,12),(1.3,18),(5,21)], [(4,25),(5,33),(7,21),(2,30)]], "name":["A","B","C","F"]} df=pd.DataFrame.from_dict(data) print(df)

我想表示每行（列出）两个不同的 colls 中的第一个和第二个数字，因此对于第一个单元格，我将获得包含 (1+1.5+3+2)4 的新 coll 和一个具有 22 的 col +20+32+21/4

我做了类似的事情，但它的循环看起来很乱

for i in df["col1"]: mean_list = [] for first_numb in i: mean_list.append(first_numb[0])

任何的想法？

回答

我们可以尝试exploding从爆炸列创建一个新的数据帧，然后计算mean上level=0

e = df['col1'].explode() df[['m1', 'm2']] = pd.DataFrame([*e], index=e.index).mean(level=0)

list理解的替代方法

df[['m1', 'm2']] = pd.DataFrame([[sum(t) / len(t) for t in zip(*l)] for l in df['col1']], index=df.index)

col1 name m1 m2 0 [(1, 22), (1.5, 20), (3, 32), (2, 21)] A 1.875 23.75 1 [(2, 24), (2.5, 22)] B 2.250 23.00 2 [(6, 12), (1.3, 18), (5, 21)] C 4.100 17.00 3 [(4, 25), (5, 33), (7, 21), (2, 30)] F 4.500 27.25

性能检查

# Sample df with 40000 rows df = pd.concat([df] * 10000, ignore_index=True) %%timeit e = df['col1'].explode() pd.DataFrame([*e], index=e.index).mean(level=0) # 107 ms ± 1 ms per loop (mean ± std. dev. of 7 runs, 10 loops each) %%timeit pd.DataFrame([[sum(t) / len(t) for t in zip(*l)] for l in df['col1']], index=df.index) # 50.5 ms ± 582 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

推荐阅读

loops
43.Word Break（看字符串是否由词典中的单词组成）

Level： Medium题目描述：Givenanon-emptystringsandadictionarywordDictcontainingalistofnon-emptyw ... [详细]

蜡笔小新 2024-11-19 20:43:23
get
fleaframedb使用之JPA封装介绍

flea,frame,db,使用,之 ... [详细]

蜡笔小新 2024-11-20 12:00:16
get
UE4 中的距离场技术详解

本文将深入探讨 Unreal Engine 4 (UE4) 中的距离场技术，包括其原理、实现细节以及在渲染中的应用。距离场技术在现代游戏引擎中用于提高光照和阴影的效果，尤其是在处理复杂几何形状时。文章将结合具体代码示例，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-19 18:21:03
get
Spring Boot使用AJAX从数据库读取数据异步刷新前端表格

　　近期项目需要是实现一个通过筛选选取所需数据刷新表格的功能，因为表格只占页面的一小部分，不希望整个也页面都随之刷新，所以首先想到了使用AJAX来实现。　　以下介绍解决方法（请忽视 ... [详细]

蜡笔小新 2024-11-19 10:11:02
get
算法解析：最大连续子数组和

本文将探讨一个经典算法问题——最大连续子数组和。我们将从问题定义出发，逐步深入理解其背后的逻辑，并通过实例分析加深理解。 ... [详细]

蜡笔小新 2024-11-21 20:21:35
get
Python算法实践：多维缩放技术的应用

本文介绍了多维缩放（MDS）技术，这是一种将高维数据映射到低维空间的方法，通过保持原始数据间的关系，以便于可视化和分析。文章详细描述了MDS的原理和实现过程，并提供了Python代码示例。 ... [详细]

蜡笔小新 2024-11-21 20:04:27
get
解决iOS应用推送通知错误：未找到有效aps-environment权限

在尝试加载支持推送通知的iOS应用程序的Ad Hoc构建时，遇到了‘no valid aps-environment entitlement found for application’的错误提示。本文将探讨此错误的原因及多种可能的解决方案。 ... [详细]

蜡笔小新 2024-11-21 19:26:31
instance
Go从入门到精通系列视频之go编程语言密码学哈希算法（二）

Go从入门到精通系列视频之go编程语言密码学哈希算法（二） ... [详细]

蜡笔小新 2024-11-21 10:55:36
get
深入解析 org.apache.jena.atlas.lib.ByteBufferLib 的 acopyArray 方法

本文详细介绍了 Java 中 org.apache.jena.atlas.lib.ByteBufferLib 类下的 acopyArray 方法，并提供了多个实际应用中的代码示例，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-11-21 10:26:11
get
PostgreSQL与MySQL的语法差异详解

本文详细介绍了PostgreSQL与MySQL在SQL语法上的主要区别，包括如何使用COALESCE替代IFNULL、金额格式化的方法、别名处理以及日期处理等关键点。 ... [详细]

蜡笔小新 2024-11-21 07:40:22
get
Vue3中如何提高开发效率

小编给大家分享一下Vue3中如何提高开发效率，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获， ... [详细]

蜡笔小新 2024-11-20 15:33:07
stream
linux网络子系统分析（二）—— 协议栈分层框架的建立

目录一、综述二、INET的初始化2.1INET接口注册2.2抽象实体的建立2.3代码细节分析2.3.1socket参数三、其他协议3.1PF_PACKET3.2P ... [详细]

蜡笔小新 2024-11-20 15:21:14
stream
Windows环境下Apache频繁崩溃的解决方案

本文探讨了在Windows系统中运行Apache服务器时频繁出现崩溃的问题，并提供了多种可能的解决方案和建议。错误日志显示多个子进程因达到最大请求限制而退出。 ... [详细]

蜡笔小新 2024-11-20 13:07:27
get
使用TensorFlow实现Top-K准确率计算的神经网络案例

本文通过一个具体的实例，介绍如何利用TensorFlow框架来计算神经网络模型在多分类任务中的Top-K准确率。代码中包含了随机种子设置、模拟预测结果生成、真实标签生成以及准确率计算等步骤。 ... [详细]

蜡笔小新 2024-11-20 12:37:13
fetch
Elasticsearch 分页查询策略详解

本文详细介绍了Elasticsearch中的分页查询机制，包括基本的分页查询流程、'from-size'浅分页与'scroll'深分页的区别及应用场景，以及两者在性能上的对比。 ... [详细]

蜡笔小新 2024-11-20 10:33:23

liangpengtao

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章