当前位置: 开发笔记 > 运维 > 正文

使用sed或awk从字符串中删除前导和尾随数字，同时保留2个数字

作者：A梁仔乀 | 来源：互联网 | 2023-07-23 19:21

我有一个包含以下行的文件：353451word2423157anotherword7412yetanother13262andherese

我有一个包含以下行的文件：

353451word2423157 anotherword 7412yetanother1 3262andherese123anotherline4359013 5342512354325324523andherese123anotherline45913 532453andherese123anotherline413

我想去掉大部分前导和尾随数字（0-9），同时仍然保留 2 个前导和尾随数字，如果有的话......

澄清一下，对于上面的列表，预期的输出是：

51word24 anotherword 12yetanother1 62andherese123anotherline43 23andherese123anotherline45 53andherese123anotherline41

首选工具是 sed 或 awk，但欢迎任何其他建议...

我试过类似的东西sed 's/[0-9]+$//' | sed 's/^[0-9]+//'，但显然这会去除所有前导和尾随数字......

回答

你可以试试这个sed：

sed -E 's/^[0-9]+([0-9]{2})|([0-9]{2})[0-9]+$/12/g' file 51word24 anotherword 12yetanother1 62andherese123anotherline43 23andherese123anotherline45 53andherese123anotherline41

命令详情：

^[0-9]+([0-9]{2}): 匹配开头的 1+ 个数字，如果后面是 2 个数字（在一个组中捕获）并替换为组 #1 中的 2 个数字。

([0-9]{2})[0-9]+$: 如果前面有 2 位数字（在一组中捕获），则匹配末尾的 1+ 位数字，并替换为组 #2 中的 2 位数字。

awk
文件

推荐阅读

文件
如何从BAM文件绘制ATAC-seq插入片段长度分布图？

在ATAC-seq数据处理中，插入片段长度的分布图是一个重要的质量控制指标，它能反映出核小体的周期性排列。本文将详细介绍如何从BAM文件中提取并绘制这些数据。 ... [详细]

蜡笔小新 2024-11-20 22:35:16
nginx
深入理解Awk文本处理工具

Awk是一款功能强大的文本分析与处理工具，尤其在数据解析和报告生成方面表现突出。它通过读取由换行符分隔的记录，并按照指定的字段分隔符来划分和处理这些记录，从而实现复杂的数据操作。 ... [详细]

蜡笔小新 2024-11-23 09:44:24
服务器
Git配置及常用命令详解

本文介绍了如何在不同操作系统上安装Git，以及一些基本和高级的Git操作，包括项目初始化、文件状态检查、版本控制、分支管理、标签处理、版本回退等，并简要提及了开源许可协议的选择。 ... [详细]

蜡笔小新 2024-11-19 19:52:34
容器
华为鲲鹏平台适配的Redis Docker镜像构建指南

本文详细介绍如何在华为鲲鹏平台上构建和使用适配ARM架构的Redis Docker镜像，解决常见错误并提供优化建议。 ... [详细]

蜡笔小新 2024-11-19 15:04:08
服务器
使用Shell脚本高效部署MHA高可用集群

本文介绍了如何利用Shell脚本高效地部署MHA（MySQL High Availability）高可用集群。通过详细的脚本编写和配置示例，展示了自动化部署过程中的关键步骤和注意事项。该方法不仅简化了集群的部署流程，还提高了系统的稳定性和可用性。 ... [详细]

蜡笔小新 2024-11-10 10:15:46
shell
精选Linux经典著作在数字图书馆展出

数字图书馆近期展出了一批精选的Linux经典著作，这些书籍虽然部分较为陈旧，但依然具有重要的参考价值。如需转载相关内容，请务必注明来源：小文论坛（http://www.xiaowenbbs.com）。 ... [详细]

蜡笔小新 2024-11-08 10:55:29
容器
jquery java 文件上传_jQuery文件上传

插件描述：这是一个文件上传的展示，看很多插件，并不满意就自己写了一个，可能兼容性不是很好，没有准确进行测试过& ... [详细]

蜡笔小新 2024-11-26 16:41:31
服务器
精选Eclipse插件概览

本文介绍了多种Eclipse插件，包括XML Schema Infoset Model (XSD)、Graphical Editing Framework (GEF)、Eclipse Modeling Framework (EMF)等，涵盖了从Web开发到图形界面编辑的多个方面。 ... [详细]

蜡笔小新 2024-11-26 16:20:20
server
Nagios可视化插件开发指南 —— 配置详解

本文详细介绍了Nagios监控系统的配置过程，包括数据库的选择与安装、Nagios插件的安装及配置文件的解析。同时，针对常见的配置错误提供了具体的解决方法。 ... [详细]

蜡笔小新 2024-11-26 16:13:46
tomcat
Struts2框架构建指南

本文详细介绍了如何使用Struts2（版本2.3.16.3）构建Web应用，包括必要的依赖库添加、配置文件设置以及简单的示例代码。Struts2是Apache软件基金会下的一个开源框架，用于简化Java Web应用程序的开发。 ... [详细]

蜡笔小新 2024-11-26 16:08:50
linux
如何在VMware中为Ubuntu虚拟机扩展硬盘空间

当Ubuntu虚拟机的存储空间不足时，可以通过VMware轻松地为其添加新的硬盘。本文详细介绍了从关闭虚拟机、添加新硬盘到分区、格式化及挂载整个过程的操作步骤。 ... [详细]

蜡笔小新 2024-11-26 15:46:04
服务器
基于Workman的PHP即时通讯系统：支持单聊、群聊、视频会议及实时音视频功能

本文介绍了如何使用Workman框架构建一个功能全面的即时通讯系统，该系统不仅支持一对一聊天、群组聊天，还集成了视频会议和实时音视频通话功能，同时提供了红包发送等附加功能。 ... [详细]

蜡笔小新 2024-11-26 15:42:43
服务器
优化Selenium并行测试中的AutoIT实例管理

本文探讨了如何在使用Cucumber JVM和Selenium WebDriver进行自动化测试时，有效地管理AutoIT实例，特别是在并行测试环境中处理文件上传的问题。 ... [详细]

蜡笔小新 2024-11-26 15:30:47
linux
Python CSV Writer 的行尾字符问题

本文探讨了Python的csv模块在不同操作系统上生成文件时，默认使用DOS风格的行尾字符（即''）的问题，并提供了如何修改这一行为的方法。 ... [详细]

蜡笔小新 2024-11-26 15:10:07
linux
如何使用迅雷影音的嗅探功能

迅雷影音是一款广受欢迎的多媒体播放及下载软件，以其高效的下载速度和个人文件管理功能著称。本文将详细介绍如何启用并使用迅雷影音中的嗅探功能，帮助用户快速找到并下载所需的视频和音频资源。 ... [详细]

蜡笔小新 2024-11-26 14:15:55

A梁仔乀

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章