热门标签 | HotTags
当前位置:  开发笔记 > 开放平台 > 正文

巧用EXCEL分析网站日志

站长们都知道网站日志分析的重要性,但是当拿到网站日志后,面对里面一行行的代码,看的眼花缭乱却无从下手。今天我就给大家介绍一种用EXCEL表格详细分析日志的方法,希望对大

站长们都知道网站日志分析的重要性,但是当拿到网站日志后,面对里面一行行的代码,看的眼花缭乱却无从下手。今天我就给大家介绍一种用EXCEL表格详细分析日志的方法,希望对大家有所帮助。

首先我们新建一个EXCEL文件,将日志文件导入到EXCEL表格中。

在数据—>导入外部数据—>导入数据,打开选取数据源框,如下图

 

 

然后找到网站日志所在目录,在下方的“文件类型(T)”处选择所有文件,这样你的日志文件就会显示出来了。

 

 

选择你要查看的网站日志,直接打开文本导入向导。这里需要注意的是第一步,在请选择合适的文件类型处选择“分隔符号”,如下图

 

 

选好后直接下一步,进入文本向导第二步,这里需要注意的是分割符号处要把对勾全部去掉。

 

 

之后就一路下一步,直至完成。

将日志导入成功之后,剩下的工作就是分析了。

举个例子来说,我们想查看百度蜘蛛抓取了多少个页面。我们在EXCEL表格中选择数据—>筛选—>自动筛选,这样会在表格第一行出现一个带下拉框的小箭头,点击这个小箭头,选择“自定义”,打开“自定义自动筛选方式”,在第一行左边框选择“等于”,右边填写“*Baiduspder*”,确定就可以了。

 

 

这样我们看到的就是百度蜘蛛抓取的所有内容了。

对于一些稍微大一点的网站,百度蜘蛛抓取的内容也很多,看起来还是不方便,怎么办?呵呵,我们可以继续筛选啊。将上面筛选出来的结果复制到另一个表格中(如Sheet2中)。采取同样的方法继续筛选。比如你的网站有一个新闻栏目/news/,你想看看/news/这个栏目被百度抓取了多少次。方法依旧,选择数据—>筛选—>自动筛选,在第一行下拉框中选择“自定义”,在“自定义自动筛选方式”中上面左边框选择“等于”,右边输入“*/news/*”,这样就可以筛选出栏目/news/被抓取了那些页面以及被抓取的次数。如果有很多栏目,可以依次筛选。这样的话你就可以一目了然的看到每个栏目被抓取的内容和次数。如果有些栏目抓取次数明显偏少的话,你就需要有针对性的对这些栏目进行优化了。这就是我们分析日志的目的。当对某些栏目进行优化后,过一段时间(最少一个月),我们依然采取这样的方法,看看优化的这些栏目抓取量是否上升。这也是我们检测优化效果很实用的方法。

当然了,我们通过EXCEL还可以筛选出很多我们需要的数据。比如可以筛选出某个ip地址的用户共浏览了多少个页面,都浏览的那些页面。这对于网站布局和页面设计都很重要。再比如可以查看某个搜索引擎的某个蜘蛛共抓取了多少个页面,抓取了哪些页面,抓取频率等待。长时间观察的话,你会发现很多蜘蛛抓取的规律,甚至能反推出蜘蛛的抓取规则。更多数据还请大家根据自己的需求来分析,这里就不做赘述了。总之,我们可以很方便的使用EXCEL表格从网站日志中筛选出我们需要的内容。


推荐阅读
  • 在Windows系统上安装VMware Workstation 2022的详细步骤
    本文将详细介绍如何在Windows系统上安装VMware Workstation 2022。包括从官方网站下载软件、选择合适的版本以及安装过程中的关键步骤。此外,还将提供一些激活密钥供参考。 ... [详细]
  • 360SRC安全应急响应:从漏洞提交到修复的全过程
    本文详细介绍了360SRC平台处理一起关键安全事件的过程,涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例,展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • 通过与阿里云的合作,牛客网成功解决了跨国视频面试中的网络卡顿问题,为求职者和面试官提供了更加流畅的沟通体验。 ... [详细]
  • 本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询,并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率,还简化了代码逻辑。 ... [详细]
  • 揭秘:为何我的网名是老紫竹
    本文详细解释了作者为何选择“老紫竹”作为网名,从个人喜好到网络经历,以及与紫竹植物的渊源。 ... [详细]
  • 本文将深入探讨PHP编程语言的基本概念,并解释PHP概念股的含义。通过详细解析,帮助读者理解PHP在Web开发和股票市场中的重要性。 ... [详细]
  • 本文介绍了一种有效的方法来检测硬盘上的视频文件是否损坏或存在缺帧问题。虽然一些常见的搜索引擎并未提供专门的工具,但通过使用FFmpeg等专业软件,可以全面验证各种视频格式的数据完整性,包括较为古老的AVI格式。 ... [详细]
  • 本次考试于2016年10月25日上午7:50至11:15举行,主要涉及数学专题,特别是斐波那契数列的性质及其在编程中的应用。本文将详细解析考试中的题目,并提供解题思路和代码实现。 ... [详细]
  • 爱奇艺视频下载指南
    随着百度在视频领域的不断扩展,爱奇艺的内容库日益丰富,涵盖了大量新番动画、电影、电视剧和综艺节目。本文将详细介绍如何通过爱奇艺客户端下载视频,帮助用户轻松实现离线观看。 ... [详细]
  • TCP长连接设备管理平台:架构与功能概览
    本文介绍了基于TCP长连接的设备管理平台的设计理念、技术选型及主要功能模块。最初,项目旨在实现简单的协议测试,但随着需求扩展,逐步演变为一个完整的前后端分离系统。 ... [详细]
  • 脑机接口(BCI)技术正逐步将科幻变为现实,从帮助听障人士恢复听力到使瘫痪者重新站立,甚至可能将多年的学习过程压缩至瞬间。本文探讨了这一前沿技术的现状、挑战及其未来前景。 ... [详细]
  • 本文介绍了一种解决二元可满足性(2-SAT)问题的方法。通过具体实例,详细解释了如何构建模型、应用算法,并提供了编程实现的细节和优化建议。 ... [详细]
  • Python入门:第一天准备与安装
    本文详细介绍了Python编程语言的基础知识和安装步骤,帮助初学者快速上手。涵盖Python的特点、应用场景以及Windows环境下Python和PyCharm的安装方法。 ... [详细]
  • 自己用过的一些比较有用的css3新属性【HTML】
    web前端|html教程自己用过的一些比较用的css3新属性web前端-html教程css3刚推出不久,虽然大多数的css3属性在很多流行的浏览器中不支持,但我个人觉得还是要尽量开 ... [详细]
author-avatar
兴添刚
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有