详细内容

网站日志返回值304意味着什么?

image.png

常常会遇到站长们抱怨蜘蛛抓回回码总是处于304状态,并且抓到越来越少的问题。为自己的用户体验,搜索引擎会想方设法提高检索调用率、准确性、新鲜度,这就使得搜索引擎必须把大部分精力集中在拥有高质量内容源的网站上。尽管如此,搜索结果的质量才会与搜索引擎的搜索体验更为一致。

于是我们联想到:搜索引擎爬虫将更偏爱内容源频繁更新的网站。对站点进行频繁的抓取是通过在指定时间内对站点获取所返回的状态代码。如果一个站点保持[304:没有改变]的状态,那么该站点在某一段时间里可能会减少抓取站点的次数。反之,如果网站改变的频率很高,每抓一次就能得到新版本,那么日积月累,网站的爬虫率就会上升。

不管是抓取少还是304,这是一种现象,并不是问题的原因,假设站点返回200,就可以达到提高排名带来流量的目的么?相反,你会想到304产生的原因吗?改写304对网站目标会产生什么影响?不可忽略整体目标,重过程细节,200要想解决304问题。

304状态是怎样产生的?

为提高网站访问速度,服务器对先前访问过的部分页面设置缓存机制,当客户端在这里请求这些页面时,服务器就会根据缓存内容判断页面是否与之前相同,如果同样则直接返回304,此时客户端调用缓存内容,无需二次下载,就可以说304从某种角度上降低服务器带宽,从而提高了网络带宽。

304状态是什么?

1、网页更新周期长或者没有更新。

2、纯粹的静态页面或者强制生成静态html。

304状态处理思想?

1、首先对304页进行细分,到底返回的304页到底是什么类型的?是否应返回304页?

2这些页面是如何生成的呢?存在更新机制吗?升级机制与蜘蛛抓取站点的频率一致吗?

3、网页更新区的位置是否合理?页面主要内容的承载区是否存在。

出现过多的304状态码将导致下列问题:

1、网站快照停止。

2、减少收录。

3、重量减少。

那么,如何减少304返回的代码?

据我所知,内容更新的第一个方面是迎合百度蜘蛛,分析日志,记录蜘蛛的访问时间,你可以得到蜘蛛访问的频率,然后在此基础上,更新文章:必须是原创+重印,不能纯粹收集。重印还需要更新更好的优质资源。等蜘蛛到这儿来就可以吃了。因此返回更多200标准代码。

第二呢,最好多添加一些互动版块,现在网站上基本上都是这样做了,比如评论,留言等等,大网站更新起来变化可能不大,但有了这些互动,用户就会在上面发一些内容,网站也会有很多新的东西。