1、sar 命令行的常用格式:
sar [options] [-A] [-o file] t [n]
在命令行中,t和n 两个参数组合起来定义采样间隔和次数,t为采样间隔,是必须有的参数,n为采样次数,是可选的,默认值是1,-o file表示将命令结果以二进制格式存放在文件中,file 在此处不是关键字,是文件名。
options 为命令行选项,sar命令的选项很多,下面只列出常用选项:
-A:所有报告的总和。
-u:CPU利用率
-v:进程、i节点、文件和锁表状态。
-d:硬盘使用报告。
-r:没有使用的内存页面和硬盘块。
-g:串口I/O的情况。
-b:缓冲区使用情况。
-a:文件读写情况。
-c:系统调用情况。
-R:进程的活动情况。
-y:终端设备活动情况。
-w:系统交换活动。
例子1:采样CPU利用率,1秒钟采样一次,总共采集5次。
-bash-3.00$ sar -u 1 5
SunOS racdb1 5.10 Generic_142909-17 sun4u 03/01/2012
14:04:57 %usr %sys %wio %idle
14:04:58 8 2 0 90
14:04:59 8 1 0 91
14:05:00 8 1 0 91
14:05:01 10 2 0 88
14:05:02 9 1 0 90
Average 9 1 0 90
上面是solaris中执行命令看见的输出,下面是hp unix中看到的输出:
$ sar -u 1 5
HP-UX psmsdb01 B.11.31 U ia64 03/01/12
13:52:08 %usr %sys %wio %idle
13:52:09 1 0 4 95
13:52:10 1 0 4 95
13:52:11 0 1 5 94
13:52:12 1 1 4 94
13:52:13 1 0 4 95
Average 1 0 4 95
%usr:CPU处在用户模式下的时间百分比。
%sys:CPU处在系统模式下的时间百分比。
%wio:CPU等待输入输出完成时间的百分比。
%idle:CPU空闲时间百分比。
在所有的显示中,我们应主要注意%wio和%idle,%wio的值过高,表示硬盘存在I/O瓶颈,%idle值高,表示CPU较空闲,如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,此时应加大内存容量。%idle值如果持续低于10,那么系统的CPU处理能力相对较低,表明系统中最需要解决的资源是CPU。
例子2:观察核心表的状态,每1秒采样一次,连续采样5次。
$ sar -v 1 5
HP-UX psmsdb01 B.11.31 U ia64 03/01/12
14:06:06 text-sz ov proc-sz ov inod-sz ov file-sz ov
14:06:07 N/A N/A 543/4096 0 1753/862170 0 11565/126976 0
14:06:08 N/A N/A 545/4096 0 1756/862170 0 11582/126976 0
14:06:09 N/A N/A 547/4096 0 1765/862170 0 11618/126976 0
14:06:10 N/A N/A 547/4096 0 1765/862170 0 11618/126976 0
14:06:11 N/A N/A 549/4096 0 1767/862170 0 11625/126976 0
-bash-3.00$ sar -v 1 5
SunOS racdb1 5.10 Generic_142909-17 sun4u 03/01/2012
14:06:18 proc-sz ov inod-sz ov file-sz ov lock-sz
14:06:19 371/30000 0 157620/157620 0 8887/8887 0 0/0
14:06:20 371/30000 0 157620/157620 0 8887/8887 0 0/0
14:06:21 371/30000 0 157620/157620 0 8887/8887 0 0/0
14:06:22 372/30000 0 157620/157620 0 8908/8908 0 0/0
14:06:23 372/30000 0 157620/157620 0 8910/8910 0 0/0
proc-sz:目前核心中正在使用或分配的进程表的表项数,由核心参数MAX-PROC控制。
inod-sz:目前核心中正在使用或分配的i节点表的表项数,由核心参数MAX-INODE控制。
file-sz: 目前核心中正在使用或分配的文件表的表项数,由核心参数MAX-FILE控制。
ov:溢出出现的次数。
Lock-sz:目前核心中正在使用或分配的记录加锁的表项数,由核心参数MAX-FLCKRE控制。
显示内容表示,核心使用完全正常,三个表没有出现溢出现象,核心参数不需调整,如果出现溢出时,要调整相应的核心参数,将对应的表项数加大。
例子3:报告设备使用情况,每1秒采样一次,连续采样1次。
$ sar -d 1 1
HP-UX psmsdb01 B.11.31 U ia64 03/01/12
14:14:43 device %busy avque r+w/s blks/s avwait avserv
14:14:44 disk807 5.00 0.50 6 12224 0.00 7.72
disk808 15.00 0.50 22 44224 0.00 6.92
disk812 3.00 0.50 4 6208 0.00 5.92
disk826 5.00 0.50 6 12032 0.00 7.76
disk834 12.00 0.50 16 32768 0.00 7.44
显示内容包括:
device: sar命令正在监视的块设备的名字。
%busy: 设备忙时,传送请求所占时间的百分比。
avque: 队列站满时,未完成请求数量的平均值。
r+w/s: 每秒传送到设备或从设备传出的数据量。
blks/s: 每秒传送的块数,每块512字节。
avwait: 队列占满时传送请求等待队列空闲的平均时间。
avserv: 完成传送请求所需平均时间(毫秒)。
在显示的内容中,disk807是硬盘的名字,%busy的值比较小,说明用于处理传送请求的有效时间太少,文件系统效率不高,一般来讲,%busy值高些,avque值低些,文件系统的效率比较高,如果%busy和avque值相对比较太太高,说明硬盘传输速度太慢,需调整。
例子4:每1秒采样一次,连续采样5次,报告缓冲区的使用情况
$ sar -b 1 5
HP-UX psmsdb01 B.11.31 U ia64 03/01/12
14:20:42 bread/s lread/s %rcache bwrit/s lwrit/s %wcache pread/s pwrit/s
14:20:43 0 1 100 13 2 0 37 25
14:20:44 0 49 100 2 14 86 37 15
14:20:45 0 1 100 15 1 0 43 2
14:20:46 0 6 100 16 13 0 37 1
14:20:47 0 15 100 6 19 68 40 1
Average 0 14 100 10 10 8765239200 39 9
显示内容包括:
bread/s: 每秒从硬盘读入系统缓冲区buffer的物理块数。
lread/s: 平均每秒从系统buffer读出的逻辑块数。
%rcache: 在buffer cache中进行逻辑读的百分比。
bwrit/s: 平均每秒从系统buffer向磁盘所写的物理块数。
lwrit/s: 平均每秒写到系统buffer逻辑块数。
%wcache: 在buffer cache中进行逻辑写的百分比。
pread/s: 平均每秒请求物理读的次数。
pwrit/s: 平均每秒请求物理写的次数。
在显示的内容中,最重要的是%rcache和%wcache两列,它们的值体现着buffer的使用效率,%rcache的值小于90或者%wcache的值低于65,应适当增加系统buffer的数量,buffer数量由核心参数NBUF控制,使%rcache达到90左右,%wcache达到80左右。但buffer参数值的多少影响I/O效率,增加buffer,应在较大内存的情况下,否则系统效率反而得不到提高。