如何通过查看网站日志分析数据?

发布时间:2022-06-07 点击:1063
对于一名网站seo优化人员来说,懂得数据分析是非常必要的,想要提升你的网站,首先得有蜘蛛过来抓取才可以,你的网站都没有蜘蛛前来抓取谈何排名呢?那如何查看蜘蛛是否过来抓取我们的网站呢?这就是今天小编为大家分享的主题:如何通过查看网站日志分析数据?
一、网站日志的概念
网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件,确切的讲,应该是服务器日志。网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录。通过网站日志可以清楚的得知用户在什么ip、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。
二、网站日志的存放位置
一般,空间提供商控制面板都有下载网站日志的功能,对于小白来说简单易用,只要点击下载即可。不需要通过ftp去查找文件,当然如果熟练之后,也可以在网站程序中去查找和下载文件。文件一般都是以.log结尾的。
三、查看网站日志的意义:
1、查看访问网站的用户ip、访问页面、停留时间、访问日期等等
2、查看搜索引擎蜘蛛都访问网站那些页面,返回码是什么
3、找出404页面,找出出问题的其他页面,包括死连链接
4、发觉百度蜘蛛每天固定时间来访问网站,那么就可以在固定时间更新网站。
5、访问的页面,有参数(代表动态页面,或者中文url),三个以上参数的路径不利于优化,那么就有必要写进robots.txt。
6、返回码是不正常的,就有必要处理,让页面恢复正常访问,不能恢复正常访问的死链接,建立txt文档,向百度站长平台提交。
7、404页面可以被百度收录,那么就尽量去恢复网站访问
四、网站日志文件里面的记录怎么看
网上有很多日志分析软件,比如光年日志分析、爱站工具包等
原始访问日志每一行就是类似以下的记录:
117.26.203.167 - - [02/may/2011:01:57:44 -0700] get/index.php http/1.1
500 19967 - mozilla/4.0 (compatible; msie 8.0;windows nt 5.1; trident/4.0;
asktbcs-st/5.11.3.15590; .net clr 2.0.50727; alexa toolbar)
下面我们来说说这一行记录的意思:
117.26.203.167(这是访客或者机器人的ip)
[02/may/2011:01:57:44 -0700](这是访客访问该资源的时间)
get/index.php
http/1.1(根据http/1.1协议抓取(域名下)/index.php这个页面(get表示服务器动作);)
500 19967 (500是服务器响应状态码,不同的状态码代表不同的意思,具体请阅读 http
状态代码;19967表示抓取了19967个字节;)
mozilla/4.0 (compatible; msie 8.0;windows nt 5.1; trident/4.0;
asktbcs-st/5.11.3.15590; .net clr 2.0.50727; alexa toolbar)(表示访问者使用火狐浏览器及alexa
toolbar等访问端信息)
13764226382
 发送短信