热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

linux命令:sort

一、作用sort是Linux命令。主要用于排序文件、对已排序的文件进行合并,并检查文件以确定它们是否已排序。sort命令对File参数指定的文件中的行排序&


一、作用

sort是Linux命令。
  主要用于排序文件对已排序的文件进行合并,并检查文件以确定它们是否已排序
  sort 命令对 File 参数指定的文件中的行排序,并将结果写到标准输出。如果 File 参数指定多个文件,那么 sort 命令将这些文件连接起来,并当作一个文件进行排序。-(减号)代替文件名指定标准输入。如果您不指定任何文件名,那么该命令对标准输入排序。可以使用 -o 标志指定输出文件。
  如果不指定任何标志,sort 命令基于当前语言环境的整理顺序对输入文件的所有行排序。


二、语法


1、语法

sort [-bcdfimMnr][-o<输出文件>][-t<分隔字符>][&#43;<起始栏位>-<结束栏位>][--help][--verison][文件][-k field1[,field2]]

sort [options] [files]

2、默认情况

默认情况下&#xff0c;它接受STDIN的输入&#xff0c;但当文件名作为参数提供时&#xff0c;它可以对文件进行排序&#xff0c;还可以进行数字排序。
  可以通过在终端中键入Sort来调用Sort命令。然后&#xff0c;它将提示输入标准输入。输入STDIN后&#xff0c;输入ctrl&#43;d标记输入结束

以下输出显示按字母顺序重新排列来自STDIN的输入数据&#xff1a;

[root&#64;localhost test]# sort
cappa
beta
delta
theta
alpha
alpha
beta
cappa
delta
theta

3、sort命令将许多不同的域按不同的列顺序分类。sort命令的操作可以分为3种模式&#xff1a;

&#xff08;1&#xff09;排序模式&#xff1a;对输入文件进行排序&#xff0c;是默认的模式。
&#xff08;2&#xff09;合并模式&#xff1a;对两个已排序的文件进行合并。需要指定“-m”选项。
&#xff08;3&#xff09;检查模式&#xff1a;测试给定的输入文件是否已排序。需要指定“-c”选项。


4、sort命令的一般格式为

sort –cmu –o output_file [other options] &#43;pos1 &#43;pos2 input_files

sort有许多不同的选项&#xff0c;这些选项基本可以分为三类&#xff1a;
&#xff08;1&#xff09;sort的操作模式选项&#xff1a;就是用于指定sort工作模式的选项&#xff0c;只有“-c”和“-m”两个。
&#xff08;2&#xff09;sort的数据排序选项&#xff1a;这些选项将影响输出行的排列序列&#xff0c;可以是针对整体或特殊键值字段设定的。
&#xff08;3&#xff09;sort的字段设定与输出选项&#xff1a;与输出和字段有关的选项。


5、参数说明


参数说明
-b忽略每行前面开始出的空格字符
-c检查文件是否已经按照顺序排序
-d排序时&#xff0c;处理英文字母、数字及空格字符外&#xff0c;忽略其他的字符
-f排序时&#xff0c;将小写字母视为大写字母
-i排序时&#xff0c;除了040至176之间的ASCII字符外&#xff0c;忽略其他的字符
-m将几个排序好的文件进行合并
-M将前面3个字母依照月份的缩写进行排序
-n依照数值的大小排序
-u意味着是唯一的(unique)&#xff0c;输出的结果是去完重了的
-o<输出文件>将排序后的结果存入指定的文件
-r以相反的顺序来排序
-t<分隔字符>指定排序时所用的栏位分隔字符
&#43;<起始栏位>-<结束栏位>以指定的栏位来排序&#xff0c;范围由起始栏位到结束栏位的前一栏位
–help显示帮助
–version显示版本信息
[-k field1[,field2]]按指定的列进行排序

注意&#xff1a;
  在linux中经常会看到stdin&#xff0c;stdoutstderr&#xff0c;这3个可以称为终端&#xff08;Terminal&#xff09;标准输入&#xff08;standard input&#xff09;&#xff0c;标准输出&#xff08; standard out&#xff09;标准错误输出&#xff08;standard error&#xff09;


三、应用实例

应用实例部分参考自&#xff1a;《linux sort命令详解》


1、对文件排序

默认情况下&#xff0c;sort将所有字符视为字符串数字字符也被视为字符
  首先&#xff0c;我们创建一个包含要排序的数字数据的文件。以下命令创建一个包含数字数据的文件“numeric.txt”&#xff1a;

[root&#64;localhost test]# cat > numeric.txt
01
10
25
83
502
111

现在&#xff0c;让我们对文件’numeric.txt’进行如下排序&#xff1a;

[root&#64;localhost test]# sort numeric.txt
01
10
111
25
502
83

上面显示的输出不是我们通常期望的。当然&#xff0c;111大于25&#xff0c;502也大于83。但是如果你仔细看&#xff0c;这些数字是按字典顺序排列的
  例如&#xff0c;对于111和25&#xff0c;比较第一个字符&#xff0c;1在2之前。因此&#xff0c;111置于25之前
  现在让我们检查一下&#xff0c;当内容是字母或单词时&#xff0c;它是如何排序的。以下文件“wordlist.txt”包含以大写和小写开头的单词&#xff0c;并显示排序列表&#xff1a;

[root&#64;localhost test]# sort wordlist.txt
Aeroplane
ant
apple
bark
born
Box
Cat
tom

2、排序选项


选项说明
sort -n对文件进行数字排序
sort -u抑制重复先前键的行
sort -k按列号对表进行排序
sort -t SEP使用提供的分隔符来标识字段
sort -M根据指定的日历月进行排序
sort -b忽略行开头的空格
sort -r按相反顺序排序
sort -o输出到新文件

&#xff08;1&#xff09;对文件进行数字排序&#xff08;-n选项&#xff09;

如果我们想对文件中的内容进行数字排序&#xff0c;可以使用-n选项。
在以下示例中&#xff0c;“numeric.txt”文件包含数字&#xff0c;数据按数字顺序排序&#xff1a;

[root&#64;localhost test]# sort -n numeric.txt
01
10
25
83
111
502

要反转文件中的数字&#xff0c;请使用-nr选项的组合。如下&#xff1a;

[root&#64;localhost test]# sort -nr numeric.txt
502
111
83
25
10
01

&#xff08;2&#xff09;排序并删除重复行&#xff08;-u选项&#xff09;

要对文件中的重复行进行排序和删除&#xff0c;请使用-u选项。第一个命令将使用cat命令列出文件duplicate.txt的内容&#xff0c;第二个命令将使用-u选项删除重复行
例子&#xff1a;

[root&#64;localhost test]# cat duplicate.txt
hello
linux
lInux
Linux
raghu
world
zzz
zzz

“duplicate.txt”文件中删除了可以看到重复行的示例输出&#xff1a;

[root&#64;localhost test]# sort -u duplicate.txt
hello
linux
lInux
Linux
raghu
world
zzz

&#xff08;3&#xff09;排序并忽略大小写&#xff08;-f选项&#xff09;

与许多其他Linux和Unix工具一样&#xff0c;sort命令默认情况下区分大小写。但是如果我们需要忽略大小写&#xff0c;我们可以使用-f或–ignore-case选项。
  例如&#xff0c;在“duplicate.txt”中&#xff0c;在不同的情况下有三个单词“linux”的实例。默认情况下&#xff0c;它们都使用-u选项打印。这意味着它们对于sort命令不是唯一的。
但如果我们使用-f选项&#xff0c;它将被忽略&#xff0c;如下所示&#xff1a;

[root&#64;localhost test]# sort -f -u duplicate.txt
hello
linux
raghu
world
zzz

&#xff08;4&#xff09;按列排序&#xff08;-k选项&#xff09;

sort命令可以使用-k选项使用列号对任何表进行排序。例如&#xff0c;使用“-k3”对表中的第三列进行排序。
让我们考虑一下&#xff0c;在“人口.txt”文件中有一个目录如下&#xff1a;

[root&#64;localhost test]# cat population.txt
Kids 500 India
Youth 400 England
Senior 600 USA
Junior 9000 Australia
Pensioners 650 China

在下面的示例中&#xff0c;我们使用population.txt文件中的第2列对表进行排序&#xff1a;

[root&#64;localhost test]# sort -k2 population.txt
Youth 400 England
Kids 500 India
Senior 600 USA
Pensioners 650 China
Junior 9000 Australia

&#xff08;5&#xff09;对多列进行排序

在某些情况下&#xff0c;可能需要使用多列对表进行排序。让我们以一个包含多列数据的文件为例。
文件“columns.txt”后面包含多个列&#xff0c;如下所示&#xff1a;

[root&#64;localhost test]# cat columns.txt
version1.2 10 25
version1.2 30 50
version1.1 10 30
version1.1 40 50
version1.2 40 50
version1.1 10 20
version1.1 5 8

现在检查命令以按数字顺序对列1、2和3进行排序。

[root&#64;localhost test]# sort -k1,1 -k2,2n -k3,3n columns.txt
version1.1 5 8
version1.1 10 20
version1.1 10 30
version1.1 40 50
version1.2 10 25
version1.2 30 50
version1.2 40 50

&#xff08;6&#xff09;按列字段分隔符排序&#xff08;分隔符-t选项&#xff09;

默认情况下&#xff0c;列的分隔符是空格或制表符。但我们可以在排序中使用-t或–field分隔符选项来使用自定义分隔符。
  让我们举一个例子&#xff0c;使用冒号&#xff08;&#xff1a;&#xff09;作为分隔符&#xff0c;并使用“/etc/passwd”文件进行排序。
如果要根据UID对/etc/passwd文件进行排序&#xff0c;请使用以下命令&#xff1a;

[root&#64;localhost test]# sort -n -t &#39;:&#39; -k3 /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
news:x:9:13:news:/etc/news:
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
<---output truncated--->

&#xff08;7&#xff09;按月排序&#xff08;-M选项&#xff09;

使用-M选项可以按月排序。如果文件包含月份&#xff0c;请按月份对命令顺序进行排序。
例如&#xff0c;“months.txt”文件包含月份名称列表。

[root&#64;localhost test]# cat months.txt
sep
august
july
dec
feb
may
jan

现在我们将使用-M选项按月对“months.txt”文件进行排序。

[root&#64;localhost test]# sort -M months.txt
jan
feb
may
july
august
sep
dec

&#xff08;8&#xff09;对人类可读的数字进行排序&#xff08;-h选项&#xff09;

排序可以使用-h或–human numeric Sort选项对人类可读的数字进行排序&#xff0c;如2K、5G、3M。
例如&#xff0c;下面的文件列出了人类可读的数字&#xff1a;

[root&#64;localhost test]# cat human_numeric.txt
4G
2K
3M
1G
34K
52M
200M

下面的命令使用-h选项来比较和排序人类可读的数字。

[root&#64;localhost test]# sort -h human_numeric.txt
2K
34K
3M
52M
200M
1G
4G

&#xff08;9&#xff09;检查排序输入&#xff08;-c选项&#xff09;

sort命令可以检查输入是否已排序&#xff0c;或者是否未使用-c选项。如果未排序&#xff0c;则返回第一个未排序的行。

[root&#64;localhost test]# sort -c /etc/passwd
sort: /etc/passwd:2: disorder: daemon:x:1:1:daemon:/usr/sbin:/bin/sh

排序后的输入不打印任何内容&#xff1a;

[root&#64;localhost test]# sort /etc/passwd | sort -c
$ echo $?
0

&#xff08;10&#xff09;使用其他命令排序

[root&#64;localhost test]# tail /etc/passwd | sort
altair:x:1001:1001:Altair Ibn La Ahad,,,,:/home/altair:/bin/bash
bind:x:120:132::/var/cache/bind:/bin/false
dnsmasq:x:121:65534:dnsmasq,,,:/var/lib/misc:/bin/false
mysql:x:115:129:MySQL Server,,,:/nonexistent:/bin/false
postfix:x:105:126::/var/spool/postfix:/bin/false
raghu:x:1000:1000:raghu,,,:/home/raghu:/bin/bash
smmsp:x:119:131:Mail Submission Program,,,:/var/lib/sendmail:/bin/false
smmta:x:118:130:Mail Transfer Agent,,,:/var/lib/sendmail:/bin/false
sshd:x:117:65534::/var/run/sshd:/usr/sbin/nologin
statd:x:116:65534::/var/lib/nfs:/bin/false

可以使用-r选项反转排序。

[root&#64;localhost test]# du -h | sort -h






推荐阅读
author-avatar
假爱多慌乱
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有