python教程分享一文详解Python如何优雅地对数据进行分组

作者：龙争虎斗石榴agj | 来源：互联网 | 2023-05-17 18:16

假设我们有这样一种数据：data [ ("apple", 30), ("apple", 35), ("apple&q

假设我们有这样一种数据：

data = [      ("apple", 30), ("apple", 35),      ("apple", 32), ("pear", 60),      ("pear", 32), ("pear", 60),      ("banana", 102), ("banana", 104)  ]    # 我们希望变成如下格式  """  [('apple', [30, 35, 32]),    ('pear', [60, 32, 60]),    ('banana', [102, 104])]  """

如果是你的话，你会怎么做呢？很容易想到的一种解决方案是构造一个字典：

data = [      ("apple", 30), ("apple", 35),      ("apple", 32), ("pear", 60),      ("pear", 32), ("pear", 60),      ("banana", 102), ("banana", 104)  ]    data_dict = {}  for name, count in data:      if name not in data_dict:          data_dict[name] = []      data_dict[name].append(count)  print(data_dict)  """  {'apple': [30, 35, 32],    'pear': [60, 32, 60],    'banana': [102, 104]}  """  print(list(data_dict.items()))  """  [('apple', [30, 35, 32]),    ('pear', [60, 32, 60]),    ('banana', [102, 104])]  """

这种方案完全没有问题，不过我们还可以写的更优雅一些，也就是使用字典的 setdefault 方法：

data = [      ("apple", 30), ("apple", 35),      ("apple", 32), ("pear", 60),      ("pear", 32), ("pear", 60),      ("banana", 102), ("banana", 104)  ]    data_dict = {}  for name, count in data:      # setdefault(k, v) 含义如下      # 当 k 不存在时，将 k: v 设置在字典中，并返回 v      # 当 k 存在时，直接返回 k 对应值      data_dict.setdefault(name, []).append(count)    print(list(data_dict.items()))  """  [('apple', [30, 35, 32]),    ('pear', [60, 32, 60]),    ('banana', [102, 104])]  """

setdefault 是一个非常方便的方法，但是使用频率却不怎么高，或者说该方法不太让人喜欢。主要是每次调用都要给一个初始值，比如代码中的空列表 []。另外这里的初始值可以任意，如果你希望添加的时候还能实现去重效果，那么就将空列表换成空集合即可。

或者我们还可以使用 defaultdict，它位于 collections 模块中。

from collections import defaultdict    data = [      ("apple", 30), ("apple", 35),      ("apple", 32), ("pear", 60),      ("pear", 32), ("pear", 60),      ("banana", 102), ("banana", 104)  ]    # 里面接收一个 callable  # 当访问的 k 不存在时，返回 callable 调用之后的值  data_dict1 = defaultdict(list)  for name, count in data:      data_dict1[name].append(count)    print(list(data_dict1.items()))  """  [('apple', [30, 35, 32]),    ('pear', [60, 32, 60]),    ('banana', [102, 104])]  """    # 也可以指定为 set  data_dict2 = defaultdict(set)  for name, count in data:      data_dict2[name].add(count)    print(list(data_dict2.items()))  """  [('apple', {32, 35, 30}),    ('pear', {32, 60}),    ('banana', {104, 102})]  """

总的来说，defaultdict 和字典的 setdefault 方法非常类似，我们使用 setdefault 即可。

当然啦，关于分组，还有一种特殊情况，就是词频统计。假设我们想统计可迭代对象中，每个元素出现的次数该怎么做呢？

data = ["apple", "apple", "apple",          "pear", "pear", "pear",          "banana", "banana"]    data_dict = {}  for item in data:      # 此处不能使用 setdefault，因为它是函数      # .setdefault(item, 0) += 1 是不符合语法规则的      if item not in data_dict:          data_dict[item] = 0      data_dict[item] += 1    print(data_dict)  """  {'apple': 3, 'pear': 3, 'banana': 2}  """    # 或者使用 defaultdict  from collections import defaultdict  data_dict = defaultdict(int)  for item in data:      data_dict[item] += 1  print(data_dict)  """  defaultdict(,               {'apple': 3, 'pear': 3, 'banana': 2})  """

然而说到词频统计，我们还可以使用 collections 下的 counter 类。

from collections import counter    data = ["apple", "apple", "apple",          "pear", "pear", "pear",          "banana", "banana"]    data_dict = counter(data)  # 直接搞定，counter 已经包含了我们之前的逻辑  print(data_dict)  """  counter({'apple': 3, 'pear': 3, 'banana': 2})  """  # counter 继承 dict，除了支持字典操作之外  # 还提供了很多其它操作，其中一个就是 most_common  # 用于选择出现频率最高的几个元素  print(data_dict.most_common(2))  """  [('apple', 3), ('pear', 3)]  """

还是很简单的。

到此这篇关于一文详解python如何优雅地对数据进行分组的文章就介绍到这了,更多相关python数据分组内容请搜索<编程笔记>以前的文章或继续浏览下面的相关文章希望大家以后多多支持<编程笔记>！

需要了解更多python教程分享一文详解Python如何优雅地对数据进行分组，都可以关注python教程分享栏目&＃8212;编程笔记

推荐阅读

编程
Python3中选择文件对话框的格式打开和保存图片

本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数，可以方便地选择要打开或保存的图片文件，并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]

蜡笔小新 2023-12-14 17:46:55
java
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
java
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
testing
如何从列表中删除所有零？

本文介绍了如何使用python从列表中删除所有的零，并将结果以列表形式输出，同时提供了示例格式。 ... [详细]

蜡笔小新 2023-12-13 13:02:00
python3
python3怎样中文转换编码

这篇文章给大家分享的是有关python3怎样中文转换编码的内容。小编觉得挺实用的，因此分享给大家做个参考。一起跟随小编过来看看吧。示例：处理 ... [详细]

蜡笔小新 2023-09-24 08:01:17
python3
浅谈Python3中打开文件的方式(With open)

浅谈Python3中打开文件的方式(With open)-目录0.背景知识1.常规方式：读取文件-----open()2.推荐方式：读取文件-----WithOpen1).读取方式 ... [详细]

蜡笔小新 2023-09-23 12:43:45
python3
Python3怎么获取文件属性

这篇文章给大家分享的是有关Python3怎么获取文件属性的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。os.stat(path ... [详细]

蜡笔小新 2023-09-23 12:27:42
python3
Python Flask学习之安装SQL,python3,Pycharm（网上下载安装即可）

1，下载时更改pypi源。可以额外安装虚拟化环境：pipinstall-ihttp:pypi.douban.comsimple--trusted-hos ... [详细]

蜡笔小新 2023-09-18 12:10:16
python3
python教程分享python人物视频背景替换实现虚拟空间穿梭

引言近期网上这位卖蜂蜜的小伙鬼畜挺火的，大家质疑背景造假，这里我就带着大家实现“背景造假”（ps:原视频小伙是在真实场景拍摄的）准备工作在实现该功能之前，我 ... [详细]

蜡笔小新 2023-09-15 13:06:32
case
我与python约个会：12程序编程基础6：选择和循环

正常情况下，我们完成一件事情的过程中，可能会存在多种条件限制如：用户去ATM机取钱->输入取款密码->输入正确，取钱成功|输入错误，退卡。这样的情况下，需要根据不同的条件，执行不同的逻 ... [详细]

蜡笔小新 2023-09-14 11:43:12
format
C#学习教程：在Console中工作但在Windows窗体中不工作的异步代码分享

本文分享了一个关于在C#中使用异步代码的问题，作者在控制台中运行时代码正常工作，但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机，但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]

蜡笔小新 2023-12-14 15:56:00
case
Java猜拳小游戏代码

本文介绍了一个Java猜拳小游戏的代码，通过使用Scanner类获取用户输入的拳的数字，并随机生成计算机的拳，然后判断胜负。该游戏可以选择剪刀、石头、布三种拳，通过比较两者的拳来决定胜负。 ... [详细]

蜡笔小新 2023-12-14 15:39:08
loops
python创建一个窗口_等一个大佬啊要求用python创建一个窗口，窗口按钮功能是创建一个球体或立方体。明天上课之前交给我...

展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]

蜡笔小新 2023-12-13 16:26:09
python3
python教程分享Python获取时光网电影数据的实例代码

一、前言有时候觉得电影真是人类有史以来最伟大的发明，我喜欢看电影，看电影可以让我们增长见闻，学习知识。从某种角度上而言，电影凭借自身独有的魅力大大延长了人类的”寿命&r ... [详细]

蜡笔小新 2023-09-23 17:00:11
python3
在win10利用Python3.6编写批量下载图片的小程序

importurllib.requestimportos#用于获取煎蛋网页面的函数defurl_open(url):requrllib.request.Request(url) ... [详细]

蜡笔小新 2023-09-14 10:04:58

龙争虎斗石榴agj

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章