热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Zsh开发指南(第三篇字符串处理之转义字符和格式化输出)

导读上一篇讲了zsh的常用字符串操作,这篇开始讲更为琐碎的转义字符和格式化输出相关内容。包括转义字符、引号、print、printf的使用等等。其中很多内容没有必要记忆,作为手册参

导读

上一篇讲了 zsh 的常用字符串操作,这篇开始讲更为琐碎的转义字符和格式化输出相关内容。包括转义字符、引号、print、printf 的使用等等。其中很多内容没有必要记忆,作为手册参考即可。

转义字符

转义字符是很多编程语言中都有的概念,它主要解决某些字符因为没有对应键盘按键无法直接输出、字符本身有特殊含义(比如 \")或者显示不直观(比如难以区别多个空格和一个 tab)等问题。

最常用的转义字符是 \n(换行)、\r(回车)、\t(tab)。

直接用 echoprint 或者 printf 内置命令都可以正常输出转义字符,但包括转义字符的字符串需要用引号(单双引号都可以)扩起来。

% echo 'Hello\n\tWorld'
Hello
World

常用转义字符对照表,不常用的可以去查 ASCII 码表,然后使用 \xnn(如 \x14)。

转义字符含义ASCII 码值(十六进制)
n换行0a
r回车0d
ttab09
\\\5c
\``60
\xnn取决于 nnnn

可以用 hexdump 命令查看字符的 ASCII 码值。

% echo ab= | hexdump -C
00000000 61 62 3d 0a |ab=.|
00000004

还有一些字符是可选转义(通常有特殊含义的字符都是如此)的,比如空格、"'*~$&()[]{};? 等等,即如果在引号里边则无需转义(即使转义也不出错,转义方法都说前边加一个 \),但如果在引号外边则需要转义。谨慎起见,包含半角符号的字符串全部用引号包含即可,可以避免不必要的麻烦。

可以这样检查一个字符在空格外是否需要转义,输出的字符中前边带 \ 的都是需要的。

% str='~!@#$%^&*()_+-={}|[]:;<>?,./"'
# -r 选项代表忽略字符串中的转义符合
# ${(q)str} 功能是为字符串中的特殊符号添加转义符号
% print -r ${(q)str}
\~\!@\#\$%\^\&\*\(\)_+-=\{\}\|\[\]:\;\<\>\?,./\"

单引号

单引号的左右主要是为了避免字符串里的特殊字符起作用。在单引号中,只有一个字符需要转义,转义符号 \ 。所以如果字符串里包含特殊符号时,最好使用单引号包含起来,避免不必要的麻烦。但是单引号里不能再有单引号,即使加转义符号也不行,如果字符串需要包含单引号,可以使用这几种方法。

# 用双引号包含
% echo "a'b"
a'b
# 用转义符号
% echo a\'b
a'b
# 同时使用单引号和转义符号,用于包含单引号和其他特殊符号的场景
% echo 'a"\'\''b*?'
a"\'b*?

双引号

双引号的作用类似单引号,但没有单引号那么严格,有些特殊字符在双引号里可以继续起作用。

# 以使用变量
% str=abc
% echo "$str"
abc
# 可以使用 $( ) 运行命令
% echo "$(ls)"
git
tmp
# 可以使用 ` ` 运行命令,不建议在脚本里使用 ` `
% echo "`date`"
Mon Aug 28 09:49:11 CST 2017
# 可以使用 $(( )) 计算数值
% echo "$(( 1 + 2 ))"
3
# 可以使用 $[ ] 计算数值
% echo "$[1 + 2]"
3

简单说,$ 加各种东西的用法在双引号里都是可以正常使用的,而其他特殊符号(比如 *?>)的功能通常不可用。

反引号

反引号是用来运行命令的,它会返回命令结果,以便保存到变量等等。

% str=`ls`
% echo $str
git
tmp
# 完全可以用 $( ) 取代
% str=$(ls)
% echo $str
git
tmp

反引号的功能和 $( ) 功能基本一样,但 $( ) 可以嵌套,而反引号不可以,而且反引号看起来更费事,某些字体中的反引号和单引号差别不大。所以在脚本里不建议使用反引号。

print 命令用法

print 是类似 echo 的内部命令(echo 命令很简单,不作介绍),但功能比 echo 强大很多。完全可以使用 print 代替 echo。

不加参数的 print 和 echo 的功能基本一样,但如果字符串里包含转义字符,某些情况可能不一致。如果需要输出转义字符,尽量统一使用 print,避免不一致导致的麻烦。

% print 'Line\tone\n\Line\ttwo'
Line one
Line two
# echo 的输出和 print 不一致
% echo 'Line\tone\n\Line\ttwo'
Line one
\Line two

print 有很多参数,在 zsh 里输入 print &#8211; 然后按 tab 即可查看选项帮助(如果没有效果,需要配置 .zshrc 里的补全选项,网上有很多现成的配置)。

# - 后直接按 tab,C 是补全上去的
% print -C
-- option --
-C -- print arguments in specified number of columns
-D -- substitute any arguments which are named directories using ~ notation
-N -- print arguments separated and terminated by nulls
...

print 命令选项功能介绍

这里以常用程度的顺序依次介绍所有的选项,另外文末有“print 选项列表”方便查询。

-l 用于分行输出字符串。

# 每个字符串一行,字符串是用空格隔开的
% print -l aa bb
aa
bb
# 也可以接数组,数组相关的内容之后会讲到
# 命令后的多个字符串都可以用数组取代,效果是相同的
% array=(aa bb)
% print -l $array
aa
bb

-n 用于不在输出内容的末尾自动添加换行符(echo 命令也有这个用法)。

% print abc
abc
# 这个 % 高亮显示,代表这一行末尾没有换行符
% print -n abc
abc%

-m 用于只输出匹配到的字符串。

% print -m "aa*" aabb abc aac
aabb aac

-o/-O/-i 用于对字符串排序。

# print -o 对字符串升序排列
% print -o a d c 1 b g 3 s
1 3 a b c d g s
# print -O 对字符串降序排列
% print -O a d c 1 b g 3 s
s g d c b a 3 1
# 加 -i 参数后,对大小写不敏感
% print -oi A B C a c A B C
A a A B B C c C
# 不加 -i 的话小写排在大写的前面
% print -o A B C a c A B C
a A A B B c C C

-r 用于不对字符串进行转义。print 默认是会对转义字符进行转义的,加 -r 后会原样输出。

% print -r '\n'
\n

-c 用于将字符串按列输出。如果对自动决定的列数不满意,可以用 -C 指定列数。

% print -c a bbbbb ccc ddddd ee ffffff gg hhhhhh ii jj kk
a ccc ee gg ii kk
bbbbb ddddd ffffff hhhhhh jj

-C 用于按指定列数输出字符串。

# 从上到下
% print -C 3 a bb ccc dddd ee f
a ccc ee
bb dddd f
% print -C 3 a bb ccc dddd ee f g
a dddd g
bb ee
ccc f
# 加 -a 后,改成从左向右
% print -a -C 3 a bb ccc dddd ee f g
a bb ccc
dddd ee f
g

-D 用于将符合条件的路径名转化成带 ~ 的格式,~ 是家目录。

% print -D /home/goreliu/git
~/git
# mine 是这样定义的 hash -d mine='/mnt/c/mine'
% print -D /mnt/c/mine
~mine

-N 用于将输出的字符串以 \x00(null)分隔,而不是空格。这样可能方便处理包含空格的字符串,xargs 等命令也可以接受以 \x00 分隔的字符串。

% print -N aa bb cc
aabbcc%
% print -N aa bb cc | hexdump -C
00000000 61 61 00 62 62 00 63 63 00 |aa.bb.cc.|
00000009

-x 用于将行首的 tab 替换成空格。-x 是将行首的 tab 展开成空格,- x 后的参数是一个 tab 对应的空格数。

% print -x 2 '\t\tabc' | hexdump -C
00000000 20 20 20 20 61 62 63 0a | abc.|
00000008
% print -x 4 '\t\tabc' | hexdump -C
00000000 20 20 20 20 20 20 20 20 61 62 63 0a | abc.|
0000000c

-X 用于将所有的 tab 替换成空格。注意不是简单地替换成空格。比如每行有一个 tab,-X 8,那么如果 tab 前(到行首或者上一个 tab)有 5 个字符,就补全 3 个空格,凑够 8,这么做是为了对齐每一列的。但如果前边有 8 个或者 8 个以上字符,那么依然是一个 tab 替换成 8 个字符,因为 tab 不能凭空消失,一定要转成至少一个空格才行。如果没理解就自己多试试找规律吧。

% print -X 2 'ab\t\tabc' | hexdump -C
00000000 61 62 20 20 20 20 61 62 63 0a |ab abc.|
0000000a
% print -X 4 'ab\t\tabc' | hexdump -C
00000000 61 62 20 20 20 20 20 20 61 62 63 0a |ab abc.|
0000000c

-u 用于指定 fd 输出。print 默认输出到 fd 1,即 stdout,可以指定成其他 fd(2 是 stderr,其他的可以运行 ls -l /proc/$$/fd 查看。

% print -u 2 good
good
# 和重定向输出效果一样
% print good >&2

-v 用于把输出内容保存到变量。

# 和 str="$(print aa bb cc)" 效果一样
% print -v str aa bb cc
% echo $str
aa bb cc

-s/-S 用于把字符串保存到历史记录。

% print -s ls -a
% history | tail -n 1
2222 ls -a
# -S 也类似,但需要用引号把命令引起来
% print -S "ls -a"
% history | tail -n 1
2339 ls -a

-z 用于把字符串输出到命令行编辑区。

# _是光标位置
% print -z aa bb cc
% aa bb cc_

-f 用于按指定格式化字符串输出,同 printf,用法见“printf 命令用法”。

-P 用于输出带颜色和特殊样式的字符串,见“输出带颜色和特殊样式的字符串”。

-b 用于辨认出 bindkey 中的转义字符串,bindkey 是 Zle 的快捷键配置内容,写脚本用不到,不作介绍。

-R 用于模拟 echo 命令,只支持 -n 和 -e 选项,通常用不到。

printf 命令用法

printf 命令很像 c 语言的 printf 函数,用于输出格式化后的字符串。

# 输出末尾的 % 代表该行末尾没有换行符
# printf 不会在输出末尾添加换行符
# 为了避免误解,之后的例子省略该符号
% printf ":%d %f:" 12 34.56
:12 34.560000:%

printf 的第一个参数是格式化字符串,在 zsh 里输入 printf % 后按 tab,可以看到所有支持的用法。下面只举几个比较常用的例子。

# 整数 浮点数 字符串
% printf "%d %f %s" 12 12.34 abcd
12 12.340000 abcd%
# 取小数点后几位
% printf "%.1f" 12.34
12.3
# 科学计数法输出浮点数
% printf "%e" 12.34
1.234000e+01
# 将十进制数字转成十六进制输出
% printf "%x" 12
c
# 补齐空格或者0
% printf "%5d\n%05d" 12 12
12
00012

我把完整的格式贴在这里,方便搜索。

-- print format specifier --
-- leave one space in front of positive number from signed conversion
- -- left adjust result
. -- precision
' -- thousand separators
* -- field width in next argument
# -- alternate form
% -- a percent sign
+ -- always place sign before a number from signed conversion
0 -- zero pad to length
b -- as %s but interpret escape sequences in argument
c -- print the first character of the argument
E e -- double number in scientific notation
f -- double number
G g -- double number as %f or %e depending on size
i d -- signed decimal number or with leading " numeric value of following character
n -- store number of printed bytes in parameter specified by argument
o -- unsigned octal number
q -- as %s but shell quote result
s -- print the argument as a string
u -- unsigned decimal number
X x -- unsigned hexadecimal number, letters capitalized as x

输出带颜色和特殊样式的字符串

用 zsh 的 print -P 可以方便地输出带颜色和特殊样式的字符串,不用再和 \033[41;36;1m 之类莫名其妙的字符串打交道了。

# %B 加粗 %b 取消加粗
# %F{red} 前景色 %f 取消前景色
# %K{red} 背景色 %k 取消背景色
# %U 下滑线 %u 取消下滑线
# %S 反色 %s 取消反色
#
# black or 0 red or 1
# green or 2 yellow or 3
# blue or 4 magenta or 5
# cyan or 6 white or 7
# 显示加粗的红色 abc
% print -P '%B%F{red}abc'
abc
# 没覆盖到的功能可以用原始的转义符号,可读性比较差
# 4[0-7] 背景色
# 3[0-7] 前景色
# 0m 正常 1m 加粗 2m 变灰 3m 斜体 4m 下滑钱 5m 闪烁 6m 快速闪烁 7m 反色
# 显示闪烁的红底绿字 abc
% print "\033[41;32;5mabc\033[0m"
abc

print 选项列表

为了方便查询,我把 print 的选项列表放在这里。

选项功能参数
-C按列输出列数
-D替换路径成带 ~ 的版本
-N使用 x00 作为字符串的间隔
-O降序排列
-P输出颜色和特殊样式
-R模拟 echo 命令
-S放命令放入历史命令文件(要加引号)
-X替换所有 tab 为空格tab 对应空格数
-a和 -c/-C 一起使用时,改为从左到右
-b识别出 bindkey 转义字符串
-c按列输出(自动决定列数)
-f同 printf
-i和 -o/-O 一起用时,大小写不敏感排序
-l使用换行符作为字符串分隔符
-m只输出匹配的字符串匹配模式字符串
-n不自动添加最后的换行符
-o升序排列
-r不处理转义字符
-s放命令放入历史命令文件(不加引号)
-u指定 fd 输出fd 号
-v把内容保存到变量变量名
-x替换行首的 tab 为空格tab 对应空格数
-z把内容放置到命令行编辑区

参考

http://zsh.sourceforge.net/Gu&#8230;

本文不再更新,全系列文章在此更新维护:github.com/goreliu/zshguide

付费解决 Windows、Linux、Shell、C、C++、AHK、Python、Javascript、Lua 等领域相关问题,灵活定价,欢迎咨询,微信 ly50247。


推荐阅读
  • PyCharm下载与安装指南
    本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境(IDE),涵盖Windows、macOS和Linux系统,同时提供详细的安装步骤及配置建议。 ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 技术日志:Ansible的安装及模块管理详解 ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • Python 工具推荐 | PyHubWeekly 第二十一期:提升命令行体验的五大工具
    本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具,涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]
  • 从 Windows 转向 Mac 的开发者指南:必备技巧与工具
    本文旨在帮助从 Windows 转向 Mac 的开发者们,提供一系列实用的技巧和工具,确保过渡过程顺畅。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • Linux 系统启动故障排除指南:MBR 和 GRUB 问题
    本文详细介绍了 Linux 系统启动过程中常见的 MBR 扇区和 GRUB 引导程序故障及其解决方案,涵盖从备份、模拟故障到恢复的具体步骤。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • CentOS7源码编译安装MySQL5.6
    2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网:https:www.cmake.org如此时最新 ... [详细]
  • 本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先,通过change事件监听用户选择的省份,并动态加载对应的城市列表。其次,详细讲解了使用Validation插件进行表单验证的方法,包括内置规则、自定义规则及实时验证功能。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 掌握远程执行Linux脚本和命令的技巧
    本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令,帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释,让初学者也能轻松上手。 ... [详细]
  • 本文将详细介绍Linux系统中的两种主要软件包类型——二进制包和源码包,探讨它们的特点、优势及局限性,帮助读者更好地理解和使用Linux软件包管理系统。 ... [详细]
  • 在开发过程中,我最初也依赖于功能全面但操作繁琐的集成开发环境(IDE),如Borland Delphi 和 Microsoft Visual Studio。然而,随着对高效开发的追求,我逐渐转向了更加轻量级和灵活的工具组合。通过 CLIfe,我构建了一个高度定制化的开发环境,不仅提高了代码编写效率,还简化了项目管理流程。这一配置结合了多种强大的命令行工具和插件,使我在日常开发中能够更加得心应手。 ... [详细]
author-avatar
Yao2502880171
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有