当前位置: 开发笔记 > 编程语言 > 正文

linux文件内容频率,LinuxAwk：来自一个文本文件的单词频率,如何输出到myFile.txt？...

作者：付帅sz_702 | 来源：互联网 | 2023-09-18 18:42

给定.txt文件,这些文件之间用空格分隔,例如：ButwhereisEsopethehollyBastardButwhereis和Awk函数：catpa

给定.txt文件,这些文件之间用空格分隔,例如&＃xff1a;

But where is Esope the holly Bastard

But where is

和Awk函数&＃xff1a;

cat /pathway/to/your/file.txt | tr &＃39; &＃39; &＃39;\n&＃39; | sort | uniq -c | awk &＃39;{print $2"&＃64;"$1}&＃39;

我在控制台中得到以下输出&＃xff1a;

1 Bastard

1 Esope

1 holly

1 the

2 But

2 is

2 where

如何进入打印到myFile.txt中&＃xff1f;

我实际上有300.000行,近200万个单词.最好将结果输出到文件中.

编辑&＃xff1a;使用的答案(通过&＃64;Sudo_O)&＃xff1a;

$awk &＃39;{a[$1]&＃43;&＃43;}END{for(k in a)print a[k],k}&＃39; RS&＃61;" |\n" myfile.txt | sort > myfileout.txt

解决方法:

您的管道效率不是很高,您应该用awk来完成整个工作&＃xff1a;

awk &＃39;{a[$1]&＃43;&＃43;}END{for(k in a)print a[k],k}&＃39; RS&＃61;" |\n" file > myfile

如果要按排序顺序输出&＃xff1a;

awk &＃39;{a[$1]&＃43;&＃43;}END{for(k in a)print a[k],k}&＃39; RS&＃61;" |\n" file | sort > myfile

管道给出的实际输出为&＃xff1a;

$tr &＃39; &＃39; &＃39;\n&＃39;

Bastard&＃64;1

But&＃64;2

Esope&＃64;1

holly&＃64;1

is&＃64;2

the&＃64;1

where&＃64;2

注意&＃xff1a;在这里使用cat是没有用的,我们只能使用

$tr &＃39; &＃39; &＃39;\n&＃39;

1 Bastard

2 But

1 Esope

1 holly

2 is

1 the

2 where

我们可以再次排序以sed删除前导空格&＃xff1a;

$tr &＃39; &＃39; &＃39;\n&＃39;

1 Bastard

1 Esope

1 holly

1 the

2 But

2 is

2 where

但是就像我在一开始提到的那样,让awk处理它&＃xff1a;

$awk &＃39;{a[$1]&＃43;&＃43;}END{for(k in a)print a[k],k}&＃39; RS&＃61;" |\n" file | sort

1 Bastard

1 Esope

1 holly

1 the

2 But

2 is

2 where

标签&＃xff1a;frequency-analysis,linux,shell,awk,word-frequency

来源&＃xff1a; https://codeday.me/bug/20191013/1905844.html

推荐阅读

install
MySQL数据库备份与恢复实践

本文档详细介绍了2017年8月31日关于MySQL数据库备份与恢复的教学内容，包括MySQL日志功能、备份策略、备份工具及实战演练。 ... [详细]

蜡笔小新 2024-12-12 13:25:48
install
全能终端工具推荐：高效、免费、易用

介绍一款备受好评的全能型终端工具——MobaXterm，它不仅功能强大，而且完全免费，适合各类用户使用。 ... [详细]

蜡笔小新 2024-12-16 21:02:15
install
SaltStack部署实践（4）JOB管理与Returns模块

目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]

蜡笔小新 2024-12-22 18:53:43
export
嵌入式开发环境搭建与文件传输指南

本文详细介绍了如何为嵌入式应用开发搭建必要的软硬件环境，并提供了通过串口和网线两种方式将文件传输到开发板的具体步骤。适合Linux开发初学者参考。 ... [详细]

蜡笔小新 2024-12-22 13:38:48
install
Python 工具推荐 | PyHubWeekly 第二十一期：提升命令行体验的五大工具

本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具，涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]

蜡笔小新 2024-12-21 14:45:11
install
Symfony框架的安装与使用指南

Symfony是一个功能强大的PHP框架，以其依赖注入（DI）特性著称。许多流行的PHP框架如Drupal和Laravel的核心组件都基于Symfony构建。本文将详细介绍Symfony的安装方法及其基本使用。 ... [详细]

蜡笔小新 2024-12-21 14:17:36
export
主调|大侠_重温C++

主调|大侠_重温C++ ... [详细]

蜡笔小新 2024-12-20 20:43:56
export
深入理解Linux进程管理

本文详细介绍了Linux系统中的进程管理函数，涵盖了获取进程ID、用户ID、创建子进程、信号处理等关键操作。通过这些函数，开发者可以更好地控制和管理进程行为。 ... [详细]

蜡笔小新 2024-12-20 12:52:24
export
Mac系统下实现NTFS格式的原生读写支持

本文介绍了如何在Mac操作系统中实现对NTFS文件系统的完整读写功能，包括必要的软件安装步骤和配置方法。 ... [详细]

蜡笔小新 2024-12-17 20:08:26
rsa
2018-2019学年第六周《Java数据结构与算法》学习总结

本文总结了2018-2019学年第六周在《Java数据结构与算法》课程中的学习内容，重点介绍了非线性数据结构——树的相关知识及其应用。 ... [详细]

蜡笔小新 2024-12-22 16:43:19
rsa
SQL数据库面试题解析

本文深入探讨了SQL数据库中常见的面试问题，包括如何获取自增字段的当前值、防止SQL注入的方法、游标的作用与使用、索引的形式及其优缺点，以及事务和存储过程的概念。通过详细的解答和示例，帮助读者更好地理解和应对这些技术问题。 ... [详细]

蜡笔小新 2024-12-22 14:43:35
export
CentOS 7.6环境下Prometheus与Grafana的集成部署指南

本文旨在提供一套详细的步骤，指导读者如何在CentOS 7.6操作系统上成功安装和配置Prometheus 2.17.1及Grafana 6.7.2-1，实现高效的数据监控与可视化。 ... [详细]

蜡笔小新 2024-12-20 10:05:02
export
解决Shell脚本中'syntax error: operand expected'错误

本文介绍了一种监控网络接口速率的Shell脚本，重点分析了其中出现的语法错误，并提供了详细的修正方法。该脚本旨在实时监测网络接口的上传和下载速度。 ... [详细]

蜡笔小新 2024-12-19 18:25:34
jsp
在Kubernetes集群中部署Kuboard

本文详细介绍了如何在Kubernetes（简称k8s）环境中部署Kuboard，包括必要的命令和步骤，帮助用户顺利完成安装。 ... [详细]

蜡笔小新 2024-12-15 19:01:19
byte
如何在Unix中使用ls -lsh命令仅输出文件大小

本文探讨了如何使用ls -lsh命令排除总大小输出，仅显示文件大小的方法，并提供了几种实现这一目标的解决方案。 ... [详细]

蜡笔小新 2024-12-15 09:42:12

付帅sz_702

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章