用错误的编码替换部分文件名

作者：海天豆浆 | 来源：互联网 | 2023-09-15 18:17

需要一些指导来解决这一问题。在多个子文件夹中有10000个文件，这些子文件夹中

需要一些指导来解决这一问题。在多个子文件夹中有10000个文件，这些子文件夹中的编码已被破坏。通过ls命令，我看到了一个名为'F'$'\ 366''ljesedel.pdf'的文件名，该文件名的开头和结尾均包含'。那只是瑞典语单词åäö错误的一个例子，在这个例子中应该是'Följesedel.pdf'。如果我跑步
＃>查找。
然后我看到这样的文件列表：
./F?ljesedel.pdf

编码不同。到底如何解决这个问题？最明显的方法：

myvar='$'\366'' char="ö" find . -name *$myvar* -exec rename 's/$myvar/ö' {} \;

和其他可能的方法失败了，因为
找。 -name由于找不到它？而不是“真实”字符“'$'\ 366”“

任何建议或指导将不胜感激。

第一个问题是终端需要什么样的编码。确保它是UTF-8。

然后，您需要查找实际文件名包含的字节，而不仅仅是显示它的内容。您可以使用如下的perl oneliner来执行此操作，在包含文件的目录中运行：

perl -E'opendir my $dh,"."; printf "%s: %vX\n",$_,$_ for grep { m/jesedel\.pdf/ } readdir $dh'

这将输出解释为UTF-8字节（如果已将终端设置为该字节）的文件名，然后输出其实际包含的十六进制字节。

使用您可以确定您的搜索模式。您的替换必须是ö的UTF-8编码表示形式，如果您的终端设置为默认值，它将默认作为命令参数的一部分。

我不是专家-但这可能不是文件名（它似乎保存正确的Unicode文件名）的问题-但是ls（和许多其他实用程序）向终端显示名称的方式

通过将终端字符编码设置为Unicode，我能够显示正确的名称。另外我还注意到GUI程序（文件管理器等）能够显示正确的文件名。

Gnome终端：“终端..设置字符编码-Unicode UTF8

对于许多实用程序而言，“选择”这些文件（例如REGEXP，通配符）仍然是一个挑战。在少数情况下，您将必须使用“ *”模式选择那些字符。如果这是一个主要问题，则仅考虑使用Ascii-可以使用“ o”代替“ö”。不确定这是否可以接受。

推荐阅读

install
CentOS安装Python2.7.2的步骤和注意事项

本文介绍了在CentOS上安装Python2.7.2的详细步骤，包括下载、解压、编译和安装等操作。同时提供了一些注意事项，以及测试安装是否成功的方法。 ... [详细]

蜡笔小新 2023-12-12 13:54:31
runtime
spark登陆后闪一下就不见了，问题解决了。

这个问题困扰了我两天，卸载Dr.COM客户端（我们学校上网要装这个客户端登陆服务器，以后只能在网页里输入用户名和密码了），问题解决了。问题的现象：在实验室机台式机上安装openfire和sp ... [详细]

蜡笔小新 2023-10-17 16:47:14
go
解决Docker中volume的权限问题的方法

在Docker中，将主机目录挂载到容器中作为volume使用时，常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法，包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法，可以避免在使用Docker时出现无写权限的情况。 ... [详细]

蜡笔小新 2023-12-14 18:48:02
install
Linux下Perl的安装及第一个程序运行

本文介绍了在Linux下安装Perl的步骤，并提供了一个简单的Perl程序示例。同时，还展示了运行该程序的结果。 ... [详细]

蜡笔小新 2023-12-13 18:29:11
uml
【shell】网络处理：判断IP是否在网段、两个ip是否同网段、IP地址范围、网段包含关系

本文介绍了使用shell脚本判断IP是否在同一网段、判断IP地址是否在某个范围内、计算IP地址范围、判断网段之间的包含关系的方法和原理。通过对IP和掩码进行与计算，可以判断两个IP是否在同一网段。同时，还提供了一段用于验证IP地址的正则表达式和判断特殊IP地址的方法。 ... [详细]

蜡笔小新 2023-12-12 11:19:14
io
如何使用readlink获取文件的完整路径？

本文介绍了使用readlink命令获取文件的完整路径的简单方法，并提供了一个示例命令来打印文件的完整路径。共有28种解决方案可供选择。 ... [详细]

蜡笔小新 2023-12-09 17:28:17
install
Linux虚拟化部署中的VLAN配置方法详解

本文详细介绍了在Linux虚拟化部署中进行VLAN配置的方法。首先要确认Linux系统内核是否已经支持VLAN功能，然后配置物理网卡、子网卡和虚拟VLAN网卡的关系。接着介绍了在Linux配置VLAN Trunk的步骤，包括将物理网卡添加到VLAN、检查添加的VLAN虚拟网卡信息以及重启网络服务等。最后，通过验证连通性来确认配置是否成功。 ... [详细]

蜡笔小新 2023-12-09 03:55:11
install
什么的发明使研制着能够成功研制微型计算机,05年大学计算机基础期末试卷B.pdf...

浙江大学2005–2006学年秋冬季学期《大学计算机基础》课程期末考试试卷开课学院：计算中心，考试形式：闭卷，允许带入场考试 ... [详细]

蜡笔小新 2023-10-17 20:38:02
go
zabbix中文乱码的问题

在使用zabbix时，有时候会出现中文乱码的问题，如下：因为zabbix自身对中文简体的支持不完善，需要我们手动的去上传新的字体进行替换：1、在windows获取字体库文件在Windows上的 ... [详细]

蜡笔小新 2023-10-17 18:05:53
utf-8
python开发技术详解pdf_python开发技术详解（一）

python是一门简单灵动的语言。从今天开始我要每天都做笔记，每天都要写博客记录我所想，我所学到的。笔记提纲：1，pyt ... [详细]

蜡笔小新 2023-10-17 17:19:36
install
NETBpm的安装

NetBPM的安装还是比较简单的，有比较详细的文档。1.当然是先下载运行程序了，netbpm-0.8.3.1.zip，官方网站ÿ ... [详细]

蜡笔小新 2023-10-17 10:56:49
io
Java消息队列Spring整合ActiveMq我是小强zz

1、概述首先和大家一起回顾一下Java消息服务，在我之前的博客《Java消息队列-JMS概述》中，我为大家分析了：然后在另一篇博客《Java消息队列-ActiveMq实战》中 ... [详细]

蜡笔小新 2023-10-17 10:34:08
io
/bin/sh^M: bad interpreter: No such file or directory

（1）使用vi工具vitest.sh（2）利用如下命令查看文件格式:setff或:setfileformat可以看到如下信息 ... [详细]

蜡笔小新 2023-10-17 10:06:17
utf-8
【BP靶场portswigger服务端10】XML外部实体注入（XXE注入）9个实验（全）

前言：介绍：博主：网络安全领域狂热爱好者（承诺在CSDN永久无偿分享文章）。殊荣：CSDN网络安 ... [详细]

蜡笔小新 2023-10-17 09:48:47
utf-8
Java程序员必会的40个Linux命令！

你知道的越多，不知道的就越多，业余的像一棵小草！你来，我们一起精进！你不来，我和你的竞争对手一起 ... [详细]

蜡笔小新 2023-10-17 09:11:59

海天豆浆

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章