热门标签 | HotTags
当前位置:  开发笔记 > 开放平台 > 正文

再谈百度蜘蛛抓取首页返回200064状态码问题

最近我的站快照老是不更新,查看网站日志的蜘蛛访问,发现内页蜘蛛抓取都正常,唯独首页会出现蜘蛛返回200064,要么就是301064(因为www和没有www的做了跳转)于是我搜索相关资料

最近我的站快照老是不更新,查看网站日志的蜘蛛访问,发现内页蜘蛛抓取都正常,唯独首页会出现蜘蛛返回200 0 64,要么就是301 0 64(因为www和没有www的做了跳转)于是我搜索相关资料并分析了该状态码,网上都众说纷纭,先总结一下大致的问题吧。

先说一下200 0 64状态码的意思。

200表示正在访问该页面了,但出现64说明抓取的大小不正常,这种不光是蜘蛛会出现,用户访问也会出现的,意思抓取到一般中途放弃了。比如你自己打开该页面,但没等加载完就关闭了,就会出现64的状态!

关于百度蜘蛛会出现200 0 64的问题总结:

1、比较常见的情况是网站未更新。

(这种说法是说不通的,蜘蛛衡量页面是否更新是根据页面大小来的,只要你页面有变化,大小肯定会不一样的!所以这条可以排除!)

2、内容质量差,大多为采集信息,原创内容少!

(这个也有可能,但是我的是小说站,地球人都知道小说站几乎不存在什么‘原创’了,而且我的站内页也都是正常200 0 0,要说不是原创,内页内容才是真正的不原创内容了!所以说这一条也不成立,就算有影响,也影响不大!)

3、一部分人说这是K站前兆,出现次数多了会扔入百度沙盒等。

(我可以斩钉截铁的说这个完全是扯蛋,百度官方也明确给出了答复,200 0 64不是K前兆,对网站没有影响!当然有没有影响要看自己判断了,我个人觉得该状态码出现次数多了,虽说不会K站,但多多少少会有些影响的!)

4、网站启用了GZIP压缩,导致蜘蛛抓取内容不正常!

(这个问题比较常见,一般是出现在GIZP压缩设置上,关于这点大家可以搜GZIP压缩能让蜘蛛正常抓取的设置!)

5、页面优化过度!(经过一个多星期的观察,我的站问题应该是与这个有关)

这个情况有很多种,比如更换了标题关键词,修改了底部信息,改动了框架等,都有可能会影响这个问题!我的站就是因为改动了页面底部信息,即使我在没有改动原来框架的情况下,额外加了一个div层,都会出现这种情况。

所以遇到类似问题的站长们,可以参考一下以上几点问题,早日解决你的困扰!

我个人给出的建议是,网站首页尽量多放原创内容,如果可以,尽量不需要修改页面框架内容,即使一个额外链接,多少都会影响的!出现这种问题了,也不要着急乱改,慢慢来,不然只会适得其反!另外,希望大家多转载让更多站长们知道吧,网上虽说也很多类似的文章,但都不够全面,我也废了好大的功夫才解决。

文章由笔趣阁www.bqg5200.com,转载请注明出处。

 

推荐阅读
author-avatar
手机用户2502921455
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有