作者:扫地僧2502896033 | 来源:互联网 | 2023-10-12 20:46
我正在编写一个函数,该函数根据某些分组(g1和g2)计算变量的平均值。我希望该函数在用户只想计算各组平均值的情况下进行处理,因此group参数将为空。
我想要使用tidyverse的解决方案。
假设以下内容:
y = 1:4
g1 = c('a','a','b','b')
g2 = c(1,2,1,2)
MyData = data.frame(g1,g2,y)
MyFun = function(group){
group_sym = syms(group)
MyData %>%
group_by(!!!group_sym) %>%
summarise(mean = mean(y))
}
# this works well
MyFun(group = c('g1','g2'))
现在假设我想要所有组中y的均值。我希望该功能能够处理类似的
MyFun(group = '')
或
MyFun(group = NULL)
因此,理想情况下,我希望group参数为空/ null,因此不会对MyData进行分组。一种解决方案是在函数的开头添加一个条件,以检查参数是否为空以及是否为TRUE,而不使用group_by编写摘要。但这并不优雅,我的实际代码比仅仅几行要长得多。
有什么主意吗?
1)使用{{...}}
并使用g1
代替'g1'
:
MyFun = function(group) {
MyData %>%
group_by({{group}}) %>%
summarise(mean = mean(y)) %>%
ungroup
}
MyFun(g1)
## # A tibble: 2 x 2
## g1 mean
##
## 1 a 1.5
## 2 b 3.5
MyFun()
## # A tibble: 1 x 1
## mean
##
## 1 2.5
2)这种方法在问题中使用'g1'
。
MyFun = function(group) {
group <- if (missing(group)) 'All' else sym(group)
MyData %>%
group_by(!!group) %>%
summarise(mean = mean(y)) %>%
ungroup
}
MyFun('g1')
## # A tibble: 2 x 2
## g1 mean
##
## 1 a 1.5
## 2 b 3.5
MyFun()
## # A tibble: 1 x 2
## `"All"` mean
##
## 1 All 2.5
3)这也起作用,并提供与(2)相同的输出。
MyFun = function(...) {
group <- if (...length()) syms(...) else 'All'
MyData %>%
group_by(!!!group) %>%
summarise(mean = mean(y)) %>%
ungroup
}
MyFun('g1')
MyFun()
,
另一种方法是在丢失分组的情况下在数据中创建一个伪造的分组(名为“ across_group”)。
MyFun = function(group) {
if (missing(group)) MyData$across_group = 1
group <- if (missing(group)) syms('across_group') else syms(group)
MyData %>%
group_by(!!!group) %>%
summarise(mean = mean(y)) %>%
ungroup
}
MyFun()
# A tibble: 1 x 2
across_group mean
1 1 2.5