怎么在Linux系统通过命令行生成随机文件

作者：稻米屋321 | 来源：互联网 | 2024-10-18 16:39

这篇文章将为大家详细讲解有关怎么在Linux系统通过命令行生成随机文件，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可

这篇文章将为大家详细讲解有关怎么在Linux系统通过命令行生成随机文件，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

1.当你不需要关心随机文件的内容，只需一个固定大小的文件

Solaris、Mac OS X等Unix系统中mkfile指令，可以产生指定大小的文件，而Linux上则没有
例子：mkfile -n 160g test1
Linux可以用dd指令，/dev/zero是一个特别的文件描述符可以通过它返回null值
例子：dd if=/dev/zero of=test.file count=1024 bs=1024
产生count * bs字节的文件，1M
此方法生成随机文件的好处在于效率高（产生1G文件大概1s）,创建的文件大小精确到字节
坏处也有
使用null字符来填充文件内容，文件统计时没有行（wc -l test.file为0）

2.当你不需要关心随机文件的内容，但期望测试文件能有统计的行

将/dev/zero改为/dev/urandom，/dev/urandom是linux下的随机数生成器

关于/dev/urandom跟/dev/random两者的区别就不在此详细讨论，大概就是，前者是不受系统interrupts的限制，即使没有足够的interrupt它也能通过随机数生成器产生足够的输出值；而后者如果用在dd上，它不能被ctrl+c或者kill -9中断，如果ds的值较大时，产生的随机值不足而长期占用CPU。虽然说/dev/random产生的随机数会更随机些，但与dd混用还是建议用/dev/urandom效率更高。

缺点跟/dev/zero比当然是效率会更低些了，生成个100Mb的文件需要10秒左右，而且文件并没有可读的内容，一般的情况基本上是满足了。

漏了说句，dd是linux与unix都支持的指令。

3.当你关心文件的随机内容行数，而不关心内容是否有所重复

这里的思路就是找一个参照文件（比如说2行），将文件重新定向到新的文件，再mv覆盖保存，外加一个for循环。（n为循环次数，产生的文件行为2^（n+1））

例子:假设先建立一个file.txt文件，里面含有Hello 和 World两行
for i in {1..n}; do cat file.txt file.txt > file2.txt && mv file2.txt file.txt; done

由于是阶乘，n=20左右已经是200W行，效率会下降地比较厉害

4.当你关心随机文件的内容，而不想出现重复内容行情况

这种情况下系统的指令应该是不能满足了，或者可以通过操作系统的指令写一大串脚本也可以达到，但不建议这么做，因为可读性和维护性考虑，你应该要引入Ruby或者Python类的脚本语言帮忙了
但还是要借助些系统的东西来帮忙

思路：/usr/share/dict/words里面有记录一些单词，一共235886行，每行一个单词
可以从里面挑选一些作为文件的内容
加循环达到我们想要的随机文件要求

举例：ruby -e &＃39;a=STDIN.readlines;X.times do; b=[];Y.times do; b< file.txt

X为随机文件需要的行数，Y为从words中读取的单词，虽说组合成一句的命令，还是可以读懂的；从标准输入中重复读取Y个单词，写入到b列表中，然后再通过join空格连接内容写入到标准输出文件file.txt中

这样基本很少会有重复的行了，而且生成的效率与其他方法对比还是可以的，10秒生成100Mb文件。欢迎大家讨论。

关于“怎么在Linux系统通过命令行生成随机文件”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。

推荐阅读

install
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
int
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
install
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39
int
深入探讨CPU虚拟化与KVM内存管理

本文详细介绍了现代服务器架构中的CPU虚拟化技术，包括SMP、NUMA和MPP三种多处理器结构，并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景，帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]

蜡笔小新 2024-12-25 19:15:51
ip
深入解析网络存储技术

本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储（DAS）、网络附加存储（NAS）和存储区域网络（SAN）的特点，帮助读者理解不同存储方式的优势与局限性。 ... [详细]

蜡笔小新 2024-12-24 10:38:34
char
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
utf-8
掌握远程执行Linux脚本和命令的技巧

本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令，帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释，让初学者也能轻松上手。 ... [详细]

蜡笔小新 2024-12-26 19:47:05
string
深入理解Shell脚本编程

本文详细介绍了Shell脚本编程的基础概念、语法结构及其在操作系统中的应用。通过具体的示例代码，帮助读者掌握如何编写和执行Shell脚本。 ... [详细]

蜡笔小新 2024-12-25 06:58:01
string
CentOS 7 磁盘与文件系统管理指南

本文详细介绍了磁盘的基本结构、接口类型、分区管理以及文件系统格式化等内容，并提供了实际操作步骤，帮助读者更好地理解和掌握 CentOS 7 中的磁盘与文件系统管理。 ... [详细]

蜡笔小新 2024-12-28 10:58:44
case
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
ip
macOS系统及其关键功能解析

本文详细介绍了macOS系统的核心组件，包括如何管理其安全特性——系统完整性保护（SIP），并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说，了解这些信息有助于更好地管理和优化系统性能。 ... [详细]

蜡笔小新 2024-12-26 18:05:04
char
文件描述符、文件句柄与打开文件之间的关联解析

本文详细探讨了文件描述符、文件句柄和打开文件之间的关系，通过具体示例解释了它们在操作系统中的作用及其相互影响。 ... [详细]

蜡笔小新 2024-12-26 14:00:46
char
PHP中去除换行符的多种方法及应用场景

本文将详细介绍在PHP中去除换行符的各种方法，并结合实际应用场景进行说明。通过本文，您将了解如何根据不同操作系统的特点，选择最合适的换行符处理方式。 ... [详细]

蜡笔小新 2024-12-25 19:30:22
char
如何在Linux系统中运行PHP脚本

本文将详细介绍如何在Linux操作系统中执行PHP脚本，包括环境配置、命令使用及验证方法。对于需要在Linux环境下开发或部署PHP应用的用户来说，这是一篇非常实用的文章。 ... [详细]

蜡笔小新 2024-12-25 17:00:00
char
Linux中Diff命令的详细使用指南

本文介绍Linux中的Diff命令，该命令用于逐行对比两个文本文件，展示它们之间的差异。通过系统性检查，它能有效标识出文件间所有不同的行，无需事先对文件进行排序。 ... [详细]

蜡笔小新 2024-12-23 14:53:00

稻米屋321

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章