在Linux命令中使用多个CPU核心

作者：指尖的烟味让我清醒7758_371 | 来源：互联网 | 2023-07-21 07:36

这里有一个普遍的问题：你曾经想要统计一个非常大的列表(上百兆)，或者检索文本信息，又或者一些其他无法并行运行的操作。你的CPU可能有4个核

这里有一个普遍的问题&＃xff1a;你曾经想要统计一个非常大的列表(上百兆)&＃xff0c;或者检索文本信息&＃xff0c;又或者一些其他无法并行运行的操作。你的CPU可能有4个核心或者更多&＃xff0c;但是我们使用的工具却是像grep、bzip2、wc、awk、sed等命令&＃xff0c;这些都只使用单线程和单个CPU核心。

借用卡通人物Cartman的话&＃xff0c;“我该如何才能使用这些内核”?

这就需要通过使用GNU Parallel&＃xff0c;来使用所有的CPU核心。它让我们所有的CPU核心做map-reduce的神奇操作&＃xff0c;而且这还要借助很少用到的-pipes参数(也叫做-spreadstdin)。我保证这样你的负载就会均衡地分配到所有核心上。

bzip2

bzip2比gzip有更好的压缩效果&＃xff0c;但它太慢了。放弃折腾吧&＃xff0c;我们现在有技术解决这个问题。取代这种使用办法&＃xff1a;

cat bigfile.bin | bzip2 --best > compressedfile.bz2 而改为

cat bigfile.bin | parallel --pipe --recend &＃39;&＃39; -k bzip2 --best > compressedfile.bz2 特别对于bzip2命令&＃xff0c;GNU Parallel在多核CPU上显著地快于单核。你一不留神&＃xff0c;它就执行完成了。
GREP

如果你有一个超大的文本文件需要被检索&＃xff0c;那么就不应该这样使用&＃xff1a;

grep pattern bigfile.txt 而是

cat bigfile.txt | parallel --pipe grep &＃39;pattern&＃39;
抑或是

cat bigfile.txt | parallel --block 10M --pipe grep &＃39;pattern&＃39;
第二条命令使用了--block 10M参数&＃xff0c;通过这个参数可以表示你希望每个CPU核心处理多少行数据。 AWK

这里有一个如何使用awk来计算一个非常大的文件的例子&＃xff0c;原来我们使用&＃xff1a;

cat rands20M.txt | awk &＃39;{s&＃43;&＃61;$1} END {print s}&＃39;
而现在&＃xff1a;

cat rands20M.txt | parallel --pipe awk \&＃39;{s&＃43;&＃61;\$1} END {print s}\&＃39; | awk &＃39;{s&＃43;&＃61;$1} END {print s}&＃39;
这里面用到了更多的东西。在parallel中的-pipe参数将cat的输出分成多个块传递给awk&＃xff0c;形成许多子操作计算&＃xff0c;这些子计算结果通过第二个管道传给同一个的awk&＃xff0c;然后给出最终结果。第一个awk有三个反斜线&＃xff0c;这是为了GNU Parallel调用awk的需要。 WC

想要使用超级并行来计算一个文件的行数吗&＃xff1f;那么就不要再这样使用了&＃xff1a;

wc -l bigfile.txt 而是&＃xff1a;

cat bigfile.txt | parallel --pipe wc -l | awk &＃39;{s&＃43;&＃61;$1} END {print s}&＃39;
这是一种相当巧妙的方法&＃xff1a;我们先映射出大量的wc -l的调用&＃xff0c;生成子运算&＃xff0c;然后通过第二个管道传给awk&＃xff0c;把它们加起来。 SED

想要使用sed在一个极大的文件中做大量替换么&＃xff1f;那么就不应该这样使用&＃xff1a;

sed s^old^new^g bigfile.txt
而是

cat bigfile.txt | parallel --pipe sed s^old^new^g
... ... 然后可以使用pipe把输出存储到指定的文件中。

原文地址&＃xff1a;http://www.rankfocus.com/use-cpu-cores-linux-commands/

推荐阅读

cmd
GPS 校验和代码_Linux recovery 移除签名校验

原创作者：王锐，多年Linux系统、龙芯平台移植与优化研发经验，LinuxContributor、Mozillian。背景某个设备配套的刷 ... [详细]

蜡笔小新 2024-09-29 12:43:54
shell
Linux提权之suid篇

Linux提权之suid篇不知攻，焉知防一个在安服路上摸索的大三生，记录平时学习笔记suid前言：1.只有可以执行的二进制程序文件才 ... [详细]

蜡笔小新 2024-09-29 19:32:58
shell
aix和linux脚本,AIX系统资源监控SHELL脚本

#!usrbinkshPATHusrbin:bin:usrsbinexportPATHtime$(date%F)rq$(perl-eusePOSIXqw(strftime);pr ... [详细]

蜡笔小新 2024-09-29 18:57:04
int
想搞清楚zlib,minizip,infozip,libbzip2这些库之间的关系.

是不是zlib是这些库的压缩算法的实现库，而这么多库它们只是在打包的时候使用了zlib进行压缩而已.而具体的打包格式就有ZIP，BZIP2,GZ之分?但是在我们在用gz压缩时候通常之前 ... [详细]

蜡笔小新 2024-09-29 17:00:30
shell
在linux shell脚本中root切换到普通用户执行脚本或命令

需求：安装deb包，设置程序安装后启动，不需要root权限启动程序|不能用root权限启动其他开机启动选项方法：root临时降低权限secUser`whoami| ... [详细]

蜡笔小新 2024-09-28 16:50:50
cmd
解决Docker中volume的权限问题的方法

在Docker中，将主机目录挂载到容器中作为volume使用时，常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法，包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法，可以避免在使用Docker时出现无写权限的情况。 ... [详细]

蜡笔小新 2023-12-14 18:48:02
shell
Java程序员必会的40个Linux命令！

你知道的越多，不知道的就越多，业余的像一棵小草！你来，我们一起精进！你不来，我和你的竞争对手一起 ... [详细]

蜡笔小新 2023-10-17 09:11:59
shell
shell编程08AWK

文章目录一、awk简介二、awk的两种形式语法格式1options：2command：三、awk工作原理四、记录与字段相关内部变量：五、格式化输出：printf函数六、awk模式和 ... [详细]

蜡笔小新 2023-10-16 19:22:34
client
动手写一个OpenVPN的wrapper来优化OpenVPN性能

动手写一个OpenVPN的wrapper来优化OpenVPN性能 ... [详细]

蜡笔小新 2023-10-16 10:09:43
int
Linux操作系统中的七种武器

Linux是一套免费使用和***传播的类UNIX操作系统，主要用于基于Intel x86系列CPU的计算机上。Linux系统是由全世界各地的成千上万的程序员合适的方式定制自己的Li ... [详细]

蜡笔小新 2024-09-29 07:15:05
int
linux系统关掉网卡命令_如何关闭Linux系统？

linux系统关掉网卡命令IamnewtoLinuxandIhaveinstalledsomeLinuxdistributions.Itrytolearnbashcommands. ... [详细]

蜡笔小新 2024-09-29 04:10:28
int
默认和非默认监听配置

一、如果使用默认的1521端口，让实例自动注册到该监听上，那么local_listener无需设置，listener.ora文件按照正常方 ... [详细]

蜡笔小新 2024-09-28 12:04:51
int
TLB 缓存延迟刷新漏洞 CVE201818281 解析

TLB 缓存延迟刷新漏洞 CVE201818281 解析 ... [详细]

蜡笔小新 2024-09-27 17:53:48
int
如何设计一个秒杀系统(各方面都写的很到位)

1.Overview1.1并发读写秒杀要解决的主要问题是：并发读与并发写。并发读的优化理念是尽量减少用户到服务端来读数据，或者让他 ... [详细]

蜡笔小新 2024-09-27 11:20:00
select
pdb连接数_案例分享|Oracle 11g RAC 数据库连接数过高处理办法

作者|JiekeXu来源|JiekeXu之路(ID:JiekeXu_IT)转载请联系授权|(微信ID：xxq1426321293)大家好，我是Jieke ... [详细]

蜡笔小新 2023-10-16 15:21:01

指尖的烟味让我清醒7758_371

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章