squid日志分析Webalizer
16.7.1 安装Webalizer
《网络服务搭建、配置与管理大全:Linux版》第16章代理服务器的配置与应用 主要介绍Squid Server的安装、基本配置和高级配置,代理客户端的配置,访问控制应用实例,以及Squid日志管理。本节为大家介绍安装Webalizer。
AD:
16.7.1 安装Webalizer
1.源代码安装方式
Webalizer的安装过程如下:
访问Webalizer的下载地址http://www.webalizer.org/download.html,如图16-33所示,单击"The Complete source distribution"栏目中的"Tar/Gzip archive"超链接下载"webalizer-2.20-01-src.tgz"安装文件,当前最新的稳定版本为2.20-01,文件大小为525KB。
|
(点击查看大图)图16-33 下载Webalizer |
[[email protected] ~]# tar zxvf webalizer-2.20-01-src.tgz |
[[email protected] ~]# cd webalizer-2.20-01 |
[[email protected] webalizer-2.20-01]#./configure |
[[email protected] webalizer-2.20-01]# make --with-language=chinese |
[[email protected] webalizer-2.20-01]# cp Webalizer /usr/sbin/ |
恭喜你,至此,Webalizer的安装工作成功完成,可以进行下一步的配置工作了。
2.RPM包安装方式
以RPM包方式安装Webalizer的过程如下:
可以使用下面的命令检查系统是否已经安装了Webalizer,如图16-34所示。
[[email protected] ~]#rpm -qa|grep webalizer |
|
图16-34 检查Webalizer是否安装 |
webalizer-2.01_10-11.i386.rpm (位于第2张安装盘中) |
[[email protected] ~]# rpm -ivh webalizer-2.01_10-11.i386.rpm |
16.7.2 配置Webalizer
《网络服务搭建、配置与管理大全:Linux版》第16章代理服务器的配置与应用 主要介绍Squid Server的安装、基本配置和高级配置,代理客户端的配置,访问控制应用实例,以及Squid日志管理。本节为大家介绍配置Webalizer。
AD:
16.7.2 配置Webalizer
我们可以通过命令行配置Webalizer,也可以通过配置文件进行配置。下面将重点介绍使用配置文件进行配置,该方法使用形式比较直观,使用比较普遍。
Webalizer的配置文件的路径是"/etc/webalizer.conf",它有一个对应的模板文件/etc/webalizer.conf.sample。在一般情况下,该配置文件的默认参数配置都能满足一定的应用需要,可以直接使用。接下来以实例的方式给大家介绍如何配置该文件。
使用vi编辑Webalizer配置文件。
[[email protected] ~]# vi /etc/webalizer.conf |
设置访问日志的存放路径。
将系统默认值:
LogFile /var/log/httpd/access_log |
LogFile /var/log/squid/access.log |
设置访问日志的格式类型。
将格式类型参数:
LogType clf |
LogType squid |
设置报表输出目录。
从默认值:
OutputDir /var/www/html/usages |
修改为Squid的统计报表保存目录。
使用crontab命令让Webalizer每天生成Squid的当日流量统计分析。
[[email protected] ~]# crontab -e |
21 0 * * * /usr/bin/webalizer -c /etc/webalizer.conf |
Squid日志管理知识
Squid是Linux下一个缓存Internet数据的代理服务器软件,其接收用户的下载申请,并自动处理所下载的数据。在网络环境下,本地网络管理员经常可以通过Squid来代理访问互联网上的很多资源,因而对其进行日志审核和管理具有重大意义。
Squid日志管理的功能比较强大。通过查看相关日志文件,用户可以实时、准确地了解代理服务器的访问记录、Cache的存储状况、Cache的访问记录等许多有用的信息,从而高效地对代理服务器进行管理。
Squid最重要的日志文件就是访问日志,其访问路径为"/var/log/squid/access.log"。该日志文件记录了客户使用代理服务器的许多有用信息,包括使用时间、请求的内容、客户端信息等。该文件的格式如下:
time eclapsed remotehost code/status bytes |
可以看到,该日志文件的记录共包含10个字段,每个字段的含义如表16-4所示。
表16-4 字段的含义
字 段 | 描 述 |
time | 记录客户访问代理服务器的时间,从1970年 1月1日到访问时所经历的秒数,精确到毫秒 |
eclapsed | 记录处理缓存所花费的时间,以毫秒计数 |
remotehost | 记录访问客户端的IP地址或者域名 |
code/status | 结果信息编码/状态信息编码,如TCP_MISS/205 |
bytes | 缓存字节数 |
method | HTTP请求方法:GET或者POST |
URL | 访问的目的地址的URL,如www.sina.com.cn |
rfc931 | 默认的,暂未使用 |
peerstatus/peerhost | 缓存级别/目的IP地址,如DIRECT/211.163.21.19 |
type | 缓存对象类型,如text/html |
#cd /var/log/squid |
16.7.3 应用Webalizer查看Squid网络流量日志
《网络服务搭建、配置与管理大全:Linux版》第16章代理服务器的配置与应用 主要介绍Squid Server的安装、基本配置和高级配置,代理客户端的配置,访问控制应用实例,以及Squid日志管理。本节为大家介绍应用Webalizer查看Squid网络流量日志。
AD:
16.7.3 应用Webalizer查看Squid网络流量日志
Webalizer可以将大量的Squid日志信息综合起来进行统计,得出可视化的显示结果供网络管理员或者网络用户进行参考和评价Squid服务器的使用情况,对于做出相应的决策有相当的参考价值。
在使用过程中需要注意:由于该软件的使用结果都是通过Web页面来显示的,所以与Web服务器的联系比较紧密。下面给出该软件结合Squid服务器的使用示例。在通常情况下,配置好该软件之后,启动Web服务器(只有启动该服务器才能通过Web页面来查看日志统计的详细情况)和该软件即可。
[[email protected] ~]# service httpd start |
|
(点击查看大图)图16-35 查看流量统计信息 |
图16-35中给出了流量分析的示意图及一些数据说明,可以通过单击图中"Summary by Month"表格的"Jul 2005"超链接,来显示更详细的统计分析数据。通过分析和查看这些统计图表的结果,用户可以清楚地知道Squid代理服务器使用的细节情况,并可以根据显示情况来对服务器做出适当的调整和优化。
使用Webalizer还有一个需要注意的问题是:通常并不需要每个用户都有权限来查看代理服务器的流量情况,否则对于系统来说是不安全的。非法用户为了掩盖自己非法使用代理服务器的目的,可以对流量统计情况的结果进行修改、删除等操作。所以,我们需要使用访问控制策略来对上述分析图表的查看权限进行控制,可以在Apache的主配置文件/etc/htpd/conf/httpd.conf中进行认证和授权配置,如下所示:
< Directory "/var/www/html/usage"> |
[[email protected] ~]# mkdir /var/www/passwd |
[[email protected] ~]# chown apache.apache admin |