要了解一个web服务器的运行状态,就得从日志文件入手,Apache提供了很好的日志控制机制给开发人员和运维人员使用。Apache中的日志分为两种:一种是记录apache运行错误的错误日志,还有一种是运行过程中的访问日志。
错误日志
错误日志是由apache核心模块mod_core提供的,用来记录apache服务器产生的错误信息,比如:模块装载错误,CGI脚本错误等,通常这种日志默认是打开的,你不必专门去维护错误日志,因为这种日志一般很小。
ErrorLog
可以通过ErrorLog指令来指定错误日志的存放位置,其格式如下:
ErrorLog file-path|syslog[:facility]
当file-path不是以“/”开头时,指的是相对于ServerRoot目录(conf和logs所在目录)的文件名;如果是以"/"开头,指的是存放错误文件的绝对路径。
当file-path是以"|"开头时,表示错误日志需要通过管道先由一个程序来处理。
如果系统支持,你还可以用syslog替代文件名,采用系统日志机制来记录错误日志。
LogLevel
还可以用LogLevel指令来指定错误级别,其格式如下:
LogLevel level
Apache中提供了8种level,分别是:
emerg:紧急(系统无法使用)
alert:必须立即采取措施
crit:致命情况
error:错误情况
warn:警告情况
notice:一般重要情况
info:普通信息
debug:调试信息
默认是warn,这时debug、info级别的日志是不会记录在日志文件中的,如果是初期调试,可以设置为debug便于排错,线上环境还是用warn比较合理。
访问日志
访问日志是由apache的mod_log_config模块来实现的,该模块提供了三个指令:TransferLog指令用来指定日志文件,LogFormat指令用来定义日志格式,CustomLog指令可以同时完成指定日志文件和定义日志格式。TransferLog和CustomLog指令在每个服务器上都可以被多次使用,以便将同一个请求记录到多个文件中。
LogFormat
其格式如下:
LogFormat format|nickname [nickname]
有两种形式:
1、带一个参数,供后面的TransferLog使用,如
LogFormat "%h %l %u %t \"%r\" %>s %b"
Transferlog logs/acccess_log
2、另一种是带两个参数,为日志格式起一个别名,供后面的CustomLog指令直接使用,如
LogFormat "%h %l %u %t \"%r\" %>s %b" common
CustomLog logs/acccess_log common
Logformat 指令参数请参考(http://www.phpchina.com/resource/manual/apache/mod/mod_log_config.html#formats)
CustomLog
其格式如下:
CustomLog file|pipe format|nickname [env=[!]environment-variable]
第一部分是一个文件名,也可以是一个管道(类似ErrorLog),第二部分是日志格式,如果未指定则采用默认的日志格式,第三部分是记录日志的条件,比如
SetEnvIf Request_URI \.gif$ gif-image
CustomLog gif-requests.log common env=gif-image
CustomLog nongif-requests.log common env=!gif-image
如果请求的是一个gif文件,则记录到gif-requests.log文件中,否则记录到nongif-requests.log文件中
TransferLog
其格式如下:
TransferLog file|pipe
与CustomLog类似,可以指定文件也可以指定管道,不同的是不能指定日志格式,采用最近的LogFormat指令指定的日志格式,如果没有,则使用通用日志格式。
实例分析
httpd.conf中的有以下日志文件配置
ErrorLog "|/opt/xxx/install/cronolog/sbin/cronolog /home/admin/yyy/logs/cronolog/%Y/%m/%Y-%m-%d-error_log"
LogLevel warn
LogFormat "%h %D %{X_READTIME}i %t \"%m http://%V%U%q\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
SetEnvIf Remote_Addr "127\.0\.0\.1" dontlog
SetEnvIf Request_URI "^/robots\.txt$" dontlog
SetEnvIf Request_URI "\.swf$" dontlog
SetEnvIf Request_URI "\.gif$" dontlog
SetEnvIf Request_URI "\.jpg$" dontlog
SetEnvIf Request_URI "\.ico$" dontlog
SetEnvIf Request_URI "\.jpeg$" dontlog
SetEnvIf Request_URI "\.bmp$" dontlog
SetEnvIf Request_URI "\.png$" dontlog
SetEnvIf Request_URI "\.js$" dontlog
SetEnvIf Request_URI "\.css$" dontlog
SetEnvIf Request_URI "\.wav$" dontlog
SetEnvIf Request_URI "\.swf$" dontlog
SetEnvIf Request_URI "home/css" dontlog
SetEnvIf Request_URI "/auction/auto/*" dontlog
SetEnvIf Request_URI "/auction/associate_categories.htm*" dontlog
SetEnvIf Request_URI "/auction/latest_visit.htm*" dontlog
CustomLog "|/opt/xxx/install/cronolog/sbin/cronolog /home/admin/cai/logs/cronolog/%Y/%m/%Y-%m-%d-xxx-access_log" combined env=!dontlog
可以得知:
1、错误日志首先被管道程序cronolog处理,cronolog是一个开源工具,可以按照用户自己的要求来随意分割日志文件(参考其官网:http://cronolog.org/),这里是将错误文件按天分割,按年月来分目录存储。
2、日志级别为warn
3、定义了一个组合日志格式,其别名叫combined
%h 远端主机
%D 服务器处理本请求所用时间,以微秒为单位
%{X_READTIME}i 访问的时间点,格式为04/Mar/2013:23:59:59
%t 时间,用普通日志时间格式(标准英语格式)
%m 请求的方法 比如get/post
%V 根据UseCanonicalName指令设定的服务器名称。
%U 请求的URL路径,不包含查询字符串。
%q 查询字符串(若存在则由一个”?“引导,否则返回空串)
%>s 状态码
%b 以CLF格式显示的除HTTP头以外传送的字节数,也就是当没有字节传送时显示’-‘而不是0。
%{Referer}i 访问来源
%{User-Agent}i 记录客户端信息,如操作系统、浏览器版本之类的
4、定义了一个变量dontlog,当请求地址中包含图片、js脚本等信息时,这个变量有值
5、同错误日志一样,访问日志也被cronolog处理,采用的是combined定义的日志格式且在dontlog不存在的时候才记录。
参考资料 1、http://httpd.apache.org/docs/trunk/logs.html
2、http://cronolog.org/