当前位置: 开发笔记 > 编程语言 > 正文

R语言：多重for循环的加速问题

作者：杜亮亮喜欢2602936263 | 来源：互联网 | 2023-08-19 18:55

博客来源于我的语雀专栏：R语言语雀更多内容同步更新请关注我的语雀：令平子语雀R多重for循环的加速问题？-COS论坛|统计之都|统计与数据

博客来源于我的语雀专栏&＃xff1a;R 语言 · 语雀

更多内容同步更新请关注我的语雀&＃xff1a;令平子 · 语雀

R多重for循环的加速问题&＃xff1f; - COS论坛 | 统计之都 | 统计与数据科学论坛

使用多核并行运行&＃xff1a;如何解决R语言循环慢的问题 - 开发技术 - 亿速云

R语言如何多线程 - 简书

方法一&＃xff1a;参数整合成数据框或使用“apply”

不必要多重循环&＃xff0c;可以像楼上一样将所有参数的组合构成一个参数的数据框&＃xff08;参考expand.grid()&＃xff09;。这样对参数数据框做一层循环或者apply一次就够了&＃xff0c;然后就可以并行了

a &＃61; rep(1:3,each&＃61;2) b &＃61; rep(5:6,times&＃61;3) dataframe &＃61; data.frame(&＃39;a&＃39;&＃61;a,&＃39;b&＃39;&＃61;b) dataframe apply(dataframe, 1, function(x){ a1 &＃61; x[[1]] b1 &＃61;x[[2]] return(c(a1,b1)) })

方法二&＃xff1a;使用多核

至于速度可以网上找找提速的小技巧&＃xff0c;我推荐别用原生r&＃xff0c;用Microsoft r可以默认使用多核&＃xff08;避免原生r语言写多核的麻烦&＃xff09;。

步骤&＃xff1a;

查看电脑核数&＃xff1a;parallel::detectCores()
多线程计算

setwd("C:\\Users\\siyuanmao\\Documents\\imdada\\0-渠道投放和新人券联动模型\\测算") options(scipen&＃61;3) ##取消科学计数法 channel_ad_ios_data<-seq(0,50000,5000) channel_ad_android_data<-seq(0,100000,10000) library(parallel) func <- function(n){#n&＃61;1 result_data<-read.csv("发券方案.csv",stringsAsFactors&＃61;FALSE) total_coupon_solution_data<-read.csv("结果表框架.csv",stringsAsFactors&＃61;FALSE) coupon_solution_data<-subset(result_data,solution&＃61;&＃61; paste(&＃39;方案&＃39;,n,sep&＃61;"")) for (i in 1:11){#i&＃61;3 coupon_solution_data$channel_ad_cost[3]<-5000*(i-1) for (j in 1:11){#j&＃61;5 coupon_solution_data$channel_ad_cost[4]<-10000*(j-1) solution_mark<-paste(&＃39;方案&＃39;,n,i,j,sep&＃61;"-") coupon_solution_data$solution<-solution_mark total_coupon_solution_data<-rbind(total_coupon_solution_data,coupon_solution_data) } } print(solution_mark) return(total_coupon_solution_data) } #func(10) system.time({ x <- 1:7776 cl <- makeCluster(4) # 初始化四核心集群 results <- parLapply(cl,x,func) # lapply的并行版本 res.df <- do.call(&＃39;rbind&＃39;,results) # 整合结果 stopCluster(cl) # 关闭集群 }) df&＃61;as.data.frame(res.df)

报错1&＃xff1a;Error in checkForRemoteErrors(val) :

3 nodes produced errors; first error: object &＃39;tvp.var&＃39; not found

r - Error in check for remote errors (val): 5 nodes produced an error: object not found - Stack Overflow

方法三&＃xff1a;使用 foreach 包

除了parallel包以外&＃xff0c;还有针对并行for循环的foreach包&＃xff0c;foreach()的使用也与parLapply()类似&＃xff0c;两个功能也类似&＃xff0c;其中遇到的问题也类似。

#定义计算幂函数 square <- function(x) { return(x^2) } # 参数中的combine就是整合结果的函数&＃xff0c;可以是c&＃xff0c;可以是rbind&＃xff0c;也可以是&＃43;等 results &＃61; foreach(x &＃61; c(1:3),.combine &＃61; &＃39;c&＃39;) %do% square(x) #结果 > results [1] 1,4,9 # 注意并行情况的时候&＃xff0c;需要与parallel包进行配合&＃xff0c;引入library(doParallel)。同时%do%需要改成%dopar%。另外与parallel包不一样的是&＃xff0c;需要多加一句registerDoParallel(cl)来注册核进行使用。 #定义计算幂函数 square <- function(x) { return(x^2) } # 参数中的combine就是整合结果的函数&＃xff0c;可以是c&＃xff0c;可以是rbind&＃xff0c;也可以是&＃43;等 cl <- makeCluster(4) registerDoParallel(cl) results &＃61; foreach(x &＃61; c(1:100000),.combine &＃61; &＃39;c&＃39;) %dopar% square(x) stopCluster(cl) # 上一级环境中变量的引入 # 同parallel包并行计算前需要clusterExport()来引入全局变量一样&＃xff0c;foreach也同样需要声明&＃xff0c;不同的是&＃xff0c;foreach声明方式直接写在foreach()的参数export里边。 #定义计算幂函数 base &＃61; 2 square <- function(x) { return(x^base) } cl <- makeCluster(4) registerDoParallel(cl) results &＃61; foreach(x &＃61; c(1:100000),.combine &＃61; &＃39;c&＃39;,.export &＃61;&＃39;base&＃39; ) %dopar% square(x) stopCluster(cl)

经测发现&＃xff1a;

makecluster的核数与耗时的关系&＃xff0c;在迭代次数较少时&＃xff0c;成正比&＃xff1b;次数较多时&＃xff0c;成反比&＃xff08;待验证&＃xff09;

推荐阅读

require
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
string
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
java
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
string
差分约束系统求解House Man跳跃问题的思路与方法

本文讨论了使用差分约束系统求解House Man跳跃问题的思路与方法。给定一组不同高度，要求从最低点跳跃到最高点，每次跳跃的距离不超过D，并且不能改变给定的顺序。通过建立差分约束系统，将问题转化为图的建立和查询距离的问题。文章详细介绍了建立约束条件的方法，并使用SPFA算法判环并输出结果。同时还讨论了建边方向和跳跃顺序的关系。 ... [详细]

蜡笔小新 2023-12-14 11:49:51
string
油田地块的划分和计数方法

本文介绍了一种划分和计数油田地块的方法。根据给定的条件，通过遍历和DFS算法，将符合条件的地块标记为不符合条件的地块，并进行计数。同时，还介绍了如何判断点是否在给定范围内的方法。 ... [详细]

蜡笔小新 2023-12-14 09:18:20
java
Java中vector的使用详解

本文详细介绍了Java中vector的使用方法和相关知识，包括vector类的功能、构造方法和使用注意事项。通过使用vector类，可以方便地实现动态数组的功能，并且可以随意插入不同类型的对象，进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下，使用vector类是一个很好的选择。 ... [详细]

蜡笔小新 2023-12-13 14:14:39
string
如何自行分析定位SAP BSP错误

The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]

蜡笔小新 2023-12-14 19:58:05
java
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
string
HDU 2372 El Dorado（DP）的最长上升子序列长度求解方法

本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法，通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]

蜡笔小新 2023-12-14 15:08:18
java
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
string
Open judge C16H: Magical Balls 快速幂+逆元问题解析

本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法，并给出了问题的解析和解决方法。详细介绍了问题的背景和规则，并给出了相应的算法解析和实现步骤。通过本文的解析，读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]

蜡笔小新 2023-12-14 12:03:27
string
多因子选股模型在实际中的构建步骤及影响因素分析

本文介绍了多因子选股模型在实际中的构建步骤，包括风险源分析、因子筛选和体系构建，并进行了模拟实证回测。在风险源分析中，从宏观、行业、公司和特殊因素四个角度分析了影响资产价格的因素。具体包括宏观经济运行和宏经济政策对证券市场的影响，以及行业类型、行业生命周期和行业政策对股票价格的影响。 ... [详细]

蜡笔小新 2023-12-13 22:34:00
string
P1651 塔 (动态规划) 的最大高度计算方法

本文介绍了P1651题目的描述和要求，以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术，将问题转化为求解差值的问题，并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]

蜡笔小新 2023-12-13 19:52:19
string
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
string
《数据结构》学习笔记3——串匹配算法性能评估

本文主要讨论串匹配算法的性能评估，包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库，可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n)，通过随机取出长度为m的子串作为模式P，在文本T中进行匹配，统计平均复杂度。对于成功和失败的匹配分别进行测试，分析其平均复杂度。详情请参考相关学习资源。 ... [详细]

蜡笔小新 2023-12-13 16:16:05

杜亮亮喜欢2602936263

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章