如何在R中使用带空参数的group_by（）？

作者：扫地僧2502896033 | 来源：互联网 | 2023-10-12 20:46

我正在编写一个函数，该函数根据某些分组（g1和g2）计算变量的平均值。我希望

我正在编写一个函数，该函数根据某些分组（g1和g2）计算变量的平均值。我希望该函数在用户只想计算各组平均值的情况下进行处理，因此group参数将为空。
我想要使用tidyverse的解决方案。

假设以下内容：

y = 1:4 g1 = c('a','a','b','b') g2 = c(1,2,1,2) MyData = data.frame(g1,g2,y) MyFun = function(group){ group_sym = syms(group) MyData %>% group_by(!!!group_sym) %>% summarise(mean = mean(y)) } # this works well MyFun(group = c('g1','g2'))

现在假设我想要所有组中y的均值。我希望该功能能够处理类似的

MyFun(group = '')

或

MyFun(group = NULL)

因此，理想情况下，我希望group参数为空/ null，因此不会对MyData进行分组。一种解决方案是在函数的开头添加一个条件，以检查参数是否为空以及是否为TRUE，而不使用group_by编写摘要。但这并不优雅，我的实际代码比仅仅几行要长得多。

有什么主意吗？

1）使用{{...}}并使用g1代替'g1'：

MyFun = function(group) { MyData %>% group_by({{group}}) %>% summarise(mean = mean(y)) %>% ungroup } MyFun(g1) ## # A tibble: 2 x 2 ## g1 mean ## ## 1 a 1.5 ## 2 b 3.5 MyFun() ## # A tibble: 1 x 1 ## mean ## ## 1 2.5

2）这种方法在问题中使用'g1'。

MyFun = function(group) { group <- if (missing(group)) 'All' else sym(group) MyData %>% group_by(!!group) %>% summarise(mean = mean(y)) %>% ungroup } MyFun('g1') ## # A tibble: 2 x 2 ## g1 mean ## ## 1 a 1.5 ## 2 b 3.5 MyFun() ## # A tibble: 1 x 2 ## `"All"` mean ## ## 1 All 2.5

3）这也起作用，并提供与（2）相同的输出。

MyFun = function(...) { group <- if (...length()) syms(...) else 'All' MyData %>% group_by(!!!group) %>% summarise(mean = mean(y)) %>% ungroup } MyFun('g1') MyFun()
,

另一种方法是在丢失分组的情况下在数据中创建一个伪造的分组（名为“ across_group”）。

MyFun = function(group) { if (missing(group)) MyData$across_group = 1 group <- if (missing(group)) syms('across_group') else syms(group) MyData %>% group_by(!!!group) %>% summarise(mean = mean(y)) %>% ungroup } MyFun() # A tibble: 1 x 2 across_group mean 1 1 2.5

function
sum

推荐阅读

sum
深入理解 React 和 TypeScript 中的 HOC 与上下文

本文探讨了如何在 React 和 TypeScript 中使用高阶组件（HOC）来消耗上下文，并详细解释了相关类型定义和实现细节。 ... [详细]

蜡笔小新 2024-12-27 16:40:27
java
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
java
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
random
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新 2024-12-26 11:29:15
php
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
php
开源软件：新时代的商业机遇与挑战

在哈佛大学商学院举行的Cyberposium大会上，专家们深入探讨了开源软件的崛起及其对企业市场的影响。会议指出，开源软件不仅为企业提供了新的增长机会，还促进了软件质量的提升和创新。 ... [详细]

蜡笔小新 2024-12-27 14:49:56
version
C#中获取进程主窗口句柄的实现方法

本文介绍了如何在C#中启动一个应用程序，并通过枚举窗口来获取其主窗口句柄。当使用Process类启动程序时，我们通常只能获得进程的句柄，而主窗口句柄可能为0。因此，我们需要使用API函数和回调机制来准确获取主窗口句柄。 ... [详细]

蜡笔小新 2024-12-27 03:39:09
main
Splay Tree 区间操作优化

本文详细介绍了使用Splay Tree进行区间操作的实现方法，包括插入、删除、修改、翻转和求和等操作。通过这些操作，可以高效地处理动态序列问题，并且代码实现具有一定的挑战性，有助于编程能力的提升。 ... [详细]

蜡笔小新 2024-12-26 18:47:12
sum
统计R中过去指定天数内ID的出现频率

本文介绍如何在R中计算过去特定天数内每个组ID的出现次数，并提供详细的代码示例和解释。 ... [详细]

蜡笔小新 2024-12-26 18:37:07
main
优化Kafka流状态存储查询的最佳实践

本文探讨了如何优化和正确配置Kafka Streams应用程序以确保准确的状态存储查询。通过调整配置参数和代码逻辑，可以有效解决数据不一致的问题。 ... [详细]

蜡笔小新 2024-12-26 18:17:14
php
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
sum
解析与处理 JSON 中的空数组

本文探讨了如何在编程中正确处理包含空数组的 JSON 对象，提供了详细的代码示例和解决方案。 ... [详细]

蜡笔小新 2024-12-26 16:33:40
main
长春大学软件工程：二叉排序树实验报告

本实验主要探讨了二叉排序树（BST）的基本操作，包括创建、查找和删除节点。通过具体实例和代码实现，详细介绍了如何使用递归和非递归方法进行关键字查找，并展示了删除特定节点后的树结构变化。 ... [详细]

蜡笔小新 2024-12-26 15:32:56
php
PHP 5.5.0rc1 发布：深入解析 Zend OPcache

2013年5月9日，PHP官方发布了PHP 5.5.0rc1和PHP 5.4.15正式版，这两个版本均支持64位环境。本文将详细介绍Zend OPcache的功能及其在Windows环境下的配置与测试。 ... [详细]

蜡笔小新 2024-12-26 12:56:20
int
MATLAB中的类别数组：存储和操作有限类别的数据

类别数组（categorical array）是MATLAB中用于存储有限类别数据的一种特殊数组类型。它不仅提供对非数值数据的高效存储和操作，还保留了原有类别的名称，使数据处理更加直观便捷。此外，类别数组可以与表格（table）数据类型结合使用，以实现更复杂的数据分析。 ... [详细]

蜡笔小新 2024-12-26 10:32:58

扫地僧2502896033

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章