热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

R语言:多重for循环的加速问题

博客来源于我的语雀专栏:R语言语雀更多内容同步更新请关注我的语雀:令平子语雀R多重for循环的加速问题?-COS论坛|统计之都|统计与数据


博客来源于我的语雀专栏:R 语言 · 语雀


更多内容同步更新请关注我的语雀:令平子 · 语雀


R多重for循环的加速问题? - COS论坛 | 统计之都 | 统计与数据科学论坛

使用多核并行运行:如何解决R语言循环慢的问题 - 开发技术 - 亿速云

R语言如何多线程 - 简书


方法一:参数整合成数据框或使用“apply”

不必要多重循环,可以像楼上一样将所有参数的组合构成一个参数的数据框(参考expand.grid())。这样对参数数据框做一层循环或者apply一次就够了,然后就可以并行了

a = rep(1:3,each=2)
b = rep(5:6,times=3)
dataframe = data.frame('a'=a,'b'=b)
dataframe
apply(dataframe, 1, function(x){
a1 = x[[1]]
b1 =x[[2]]
return(c(a1,b1))
})

方法二:使用多核

至于速度可以网上找找提速的小技巧,我推荐别用原生r,用Microsoft r可以默认使用多核(避免原生r语言写多核的麻烦)。

步骤:


  1. 查看电脑核数:parallel::detectCores()
  2. 多线程计算

setwd("C:\\Users\\siyuanmao\\Documents\\imdada\\0-渠道投放和新人券联动模型\\测算")
options(scipen=3) ##取消科学计数法
channel_ad_ios_data<-seq(0,50000,5000)
channel_ad_android_data<-seq(0,100000,10000)
library(parallel)
func <- function(n){#n&#61;1
result_data<-read.csv("发券方案.csv",stringsAsFactors&#61;FALSE)
total_coupon_solution_data<-read.csv("结果表框架.csv",stringsAsFactors&#61;FALSE)
coupon_solution_data<-subset(result_data,solution&#61;&#61; paste(&#39;方案&#39;,n,sep&#61;""))

for (i in 1:11){#i&#61;3
coupon_solution_data$channel_ad_cost[3]<-5000*(i-1)

for (j in 1:11){#j&#61;5
coupon_solution_data$channel_ad_cost[4]<-10000*(j-1)
solution_mark<-paste(&#39;方案&#39;,n,i,j,sep&#61;"-")
coupon_solution_data$solution<-solution_mark

total_coupon_solution_data<-rbind(total_coupon_solution_data,coupon_solution_data)
}
}
print(solution_mark)
return(total_coupon_solution_data)
}
#func(10)
system.time({
x <- 1:7776
cl <- makeCluster(4) # 初始化四核心集群
results <- parLapply(cl,x,func) # lapply的并行版本
res.df <- do.call(&#39;rbind&#39;,results) # 整合结果
stopCluster(cl) # 关闭集群
})
df&#61;as.data.frame(res.df)

报错1&#xff1a;Error in checkForRemoteErrors(val) :

3 nodes produced errors; first error: object &#39;tvp.var&#39; not found

r - Error in check for remote errors (val): 5 nodes produced an error: object not found - Stack Overflow


方法三&#xff1a;使用 foreach 包

除了parallel包以外&#xff0c;还有针对并行for循环的foreach包&#xff0c;foreach()的使用也与parLapply()类似&#xff0c;两个功能也类似&#xff0c;其中遇到的问题也类似。

#定义计算幂函数
square <- function(x)
{
return(x^2)
}
# 参数中的combine就是整合结果的函数&#xff0c;可以是c&#xff0c;可以是rbind&#xff0c;也可以是&#43;等
results &#61; foreach(x &#61; c(1:3),.combine &#61; &#39;c&#39;) %do% square(x)
#结果
> results
[1] 1,4,9
# 注意并行情况的时候&#xff0c;需要与parallel包进行配合&#xff0c;引入library(doParallel)。同时%do%需要改成%dopar%。另外与parallel包不一样的是&#xff0c;需要多加一句registerDoParallel(cl)来注册核进行使用。
#定义计算幂函数
square <- function(x)
{
return(x^2)
}
# 参数中的combine就是整合结果的函数&#xff0c;可以是c&#xff0c;可以是rbind&#xff0c;也可以是&#43;等
cl <- makeCluster(4)
registerDoParallel(cl)
results &#61; foreach(x &#61; c(1:100000),.combine &#61; &#39;c&#39;) %dopar% square(x)
stopCluster(cl)
# 上一级环境中变量的引入
# 同parallel包并行计算前需要clusterExport()来引入全局变量一样&#xff0c;foreach也同样需要声明&#xff0c;不同的是&#xff0c;foreach声明方式直接写在foreach()的参数export里边。
#定义计算幂函数
base &#61; 2
square <- function(x)
{
return(x^base)
}
cl <- makeCluster(4)
registerDoParallel(cl)
results &#61; foreach(x &#61; c(1:100000),.combine &#61; &#39;c&#39;,.export &#61;&#39;base&#39; ) %dopar% square(x)
stopCluster(cl)

经测发现&#xff1a;


  • makecluster的核数与耗时的关系&#xff0c;在迭代次数较少时&#xff0c;成正比&#xff1b;次数较多时&#xff0c;成反比&#xff08;待验证&#xff09;

 



推荐阅读
  • CF:3D City Model(小思维)问题解析和代码实现
    本文通过解析CF:3D City Model问题,介绍了问题的背景和要求,并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景,每个网格单元可以作为建筑的基础,建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路,并给出了相应的代码实现供读者参考。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 本文讨论了使用差分约束系统求解House Man跳跃问题的思路与方法。给定一组不同高度,要求从最低点跳跃到最高点,每次跳跃的距离不超过D,并且不能改变给定的顺序。通过建立差分约束系统,将问题转化为图的建立和查询距离的问题。文章详细介绍了建立约束条件的方法,并使用SPFA算法判环并输出结果。同时还讨论了建边方向和跳跃顺序的关系。 ... [详细]
  • 本文介绍了一种划分和计数油田地块的方法。根据给定的条件,通过遍历和DFS算法,将符合条件的地块标记为不符合条件的地块,并进行计数。同时,还介绍了如何判断点是否在给定范围内的方法。 ... [详细]
  • 本文详细介绍了Java中vector的使用方法和相关知识,包括vector类的功能、构造方法和使用注意事项。通过使用vector类,可以方便地实现动态数组的功能,并且可以随意插入不同类型的对象,进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下,使用vector类是一个很好的选择。 ... [详细]
  • 如何自行分析定位SAP BSP错误
    The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • HDU 2372 El Dorado(DP)的最长上升子序列长度求解方法
    本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法,通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]
  • 本文介绍了OC学习笔记中的@property和@synthesize,包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • 本文介绍了多因子选股模型在实际中的构建步骤,包括风险源分析、因子筛选和体系构建,并进行了模拟实证回测。在风险源分析中,从宏观、行业、公司和特殊因素四个角度分析了影响资产价格的因素。具体包括宏观经济运行和宏经济政策对证券市场的影响,以及行业类型、行业生命周期和行业政策对股票价格的影响。 ... [详细]
  • 本文介绍了P1651题目的描述和要求,以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术,将问题转化为求解差值的问题,并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
author-avatar
杜亮亮喜欢2602936263
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有