热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

linux怎么去重统计

需要使用命令有sort,uniq,sort主要功能是排序,uniq主要功能是实现相邻文本行的去重。以test.ext文件为例,$sorttest.txt|uniq-c;完成对文本行进行去重并统计重复次数(uniq加-c)
linux命令行提供了非常强大的文本处理功能,组合利用linux命令能实现好多强大的功能。本文这里举例说明如何利用Linux命令行进行文本按行去重并按重复次数排序。主要用到的命令有sort,uniq和cut。其中,sort主要功能是排序,uniq主要功能是实现相邻文本行的去重,cut可以从文本行中提取相应的文本列(简单地说,就是按列操作文本行)。

文本行去重并按重复次数排序

例:

首先,对文本行进行去重并统计重复次数(uniq命令加-c选项可以实现对重复次数进行统计)。

$ sort test.txt | uniq -c 
2 Apple and Nokia. 
4 Hello World. 
1 I wanna buy an Apple device. 
1 My name is Friendfish. 
2 The Iphone of Apple company.

对文本行按重复次数进行排序。

sort -n可以识别每行开头的数字,并按其大小对文本行进行排序。默认是按升序排列,如果想要按降序要加-r选项(sort -rn)。

$ sort test.txt | uniq -c | sort -rn 
4 Hello World. 
2 The Iphone of Apple company. 
2 Apple and Nokia. 
1 My name is Friendfish.

每行前面的删除重复次数。

cut命令可以按列操作文本行。可以看出前面的重复次数占8个字符,因此,可以用命令cut -c 9- 取出每行第9个及其以后的字符。

$ sort test.txt | uniq -c | sort -rn | cut -c 9- 
Hello World. 
The Iphone of Apple company. 
Apple and Nokia. 
My name is Friendfish. 
I wanna buy an Apple device.

以上就是linux怎么去重统计的详细内容,更多请关注其它相关文章!


推荐阅读
  • 在VS2013中编译FFMPEG时遇到的问题及解决方案
    在使用VS2013编译旧版本FFMPEG库时遇到了一些问题,因为官方并未提供预编译的LIB和DLL文件。由于对Linux环境不熟悉,只能在Windows环境下进行配置和编译。具体步骤如下:首先,下载FFMPEG的源代码;然后,安装必要的编译工具和依赖项;接着,配置Visual Studio 2013的项目设置;最后,解决编译过程中出现的各种错误和警告。通过这些步骤,最终成功编译出所需的FFMPEG库文件。 ... [详细]
  • 苹果与华为智能手机性能全面对比分析 ... [详细]
  • 如何恢复已删除的QQ聊天记录?多种实用技巧分享
    如何恢复已删除的QQ聊天记录?尽管微信已成为主流即时通讯工具,但仍有大量用户依赖QQ进行日常沟通,积累了大量的聊天记录,其中不乏珍贵的回忆。如果不慎删除了这些记录,可以通过多种实用技巧进行恢复,例如利用云备份、第三方恢复软件或系统自带的恢复功能等方法。本文将详细介绍这些方法的具体操作步骤,帮助用户轻松找回丢失的聊天记录。 ... [详细]
  • 本文介绍了一种简化版的在线购物车系统,重点探讨了用户登录和购物流程的设计与实现。该系统通过优化界面交互和后端逻辑,提升了用户体验和操作便捷性。具体实现了用户注册、登录验证、商品浏览、加入购物车以及订单提交等功能,旨在为用户提供高效、流畅的购物体验。 ... [详细]
  • MySQL:不仅仅是数据库那么简单
    MySQL不仅是一款高效、可靠的数据库管理系统,它还具备丰富的功能和扩展性,支持多种存储引擎,适用于各种应用场景。从简单的网站开发到复杂的企业级应用,MySQL都能提供强大的数据管理和优化能力,满足不同用户的需求。其开源特性也促进了社区的活跃发展,为技术进步提供了持续动力。 ... [详细]
  • 修复一个 Bug 竟耗时两天?真的有那么复杂吗?
    修复一个 Bug 竟然耗费了两天时间?这背后究竟隐藏着怎样的复杂性?本文将深入探讨这个看似简单的 Bug 为何会如此棘手,从代码层面剖析问题根源,并分享解决过程中遇到的技术挑战和心得。 ... [详细]
  • 教育类应用程序:提升学习效率的专业工具
    2019年,多家独角兽企业高薪聘请Python工程师,这引发了对高效学习工具的关注。以Duolingo为例,其“边玩边学”的模式为语言学习提供了新思路。类似地,错题本作为一种有效的学习方法,能够帮助学生记录和复习易错题目,从而提高学习效率。教育类应用程序通过整合这些先进的学习策略和技术手段,正逐渐成为提升学生学习效果的重要工具。 ... [详细]
  • 如何在快手上查询他人的身份资料
    在快手上,通过他人的ID无法直接获取其真实身份信息。平台出于隐私保护考虑,仅允许用户查看自己的身份资料。若想通过快手ID查找特定用户,可按以下步骤操作:首先打开快手应用,在主页中... ... [详细]
  • 在iOS平台上,应用的流畅操作体验一直备受赞誉。然而,过去开发者往往将更多精力集中在功能实现上,而对性能优化的关注相对较少。本文深入探讨了iOS应用性能优化的关键要点与实践方法,旨在帮助开发者提升应用的响应速度、降低功耗,并改善整体用户体验。通过具体案例分析和技术解析,文章提供了实用的优化策略,包括代码层面的改进、资源管理优化以及界面渲染效率的提升等。 ... [详细]
  • Weex组件间及Weex与H5页面参数传递详解 ... [详细]
  • 腾讯优图技术突破,人脸识别准确率跃升至99.80%新高
    近日,腾讯优图实验室在国际知名的人脸识别基准测试LFW中取得重大突破,其在无约束条件下的人脸验证测试中,准确率达到了前所未有的99.80%。这一成就标志着人脸识别技术在复杂环境下的应用迈上了新台阶,为未来的智能安防、身份认证等领域提供了强有力的技术支持。 ... [详细]
  • 在iOS开发领域,针对不同屏幕尺寸的适配一直是开发者关注的重点。本文聚焦于iPhone 6/6 Plus的适配策略,特别是通过AutoLayout技术在淘宝客户端中的实际应用案例,为开发者提供了一套系统而有效的解决方案。文章不仅详细解析了AutoLayout的工作原理,还结合具体实例,探讨了如何利用这一工具实现界面元素的灵活布局,确保应用在各种设备上都能保持良好的用户体验。这对于正面临多设备适配挑战的iOS开发者来说,无疑是一份宝贵的参考资料。 ... [详细]
  • 近日,我开发的首个 Flutter 应用在首次发布后便获得了苹果官方的精品推荐。尽管仅此一次,但这一认可极大地激励了我。当时我只是注意到应用的数据出现了显著增长,直到今天才意识到原来是得到了 App Store 的推荐。这对我来说是一个重要的里程碑,也是对 Flutter 开发潜力的肯定。 ... [详细]
  • 红米Note 5与红米Note 5A全面对比评测:性能、配置及用户体验分析
    本文将对红米Note 5和红米Note 5A进行全面对比评测,涵盖性能、配置及用户体验等多个方面。通过对两款手机的详细分析,帮助用户了解它们各自的优缺点,从而选择更适合自己的机型。 ... [详细]
  • 【深度解析】基于用户体验五大维度全面剖析微信读书应用
    本文从用户体验的五个核心维度——视觉呈现、交互框架、战略目标、功能范围和信息结构,对微信读书应用进行了全面剖析。随着互联网的迅猛发展,知识更新的速度也在不断加快,这使得用户对于阅读应用的需求和期望越来越高。通过对这些维度的深入分析,本文旨在揭示微信读书在提升用户体验方面的优势与不足,为未来的优化提供参考。 ... [详细]
author-avatar
Resolve
愿你的生活,既有软肋又有盔甲!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有