网站抓取频次和页面收录的关系?在百度搜索资源平台看到网站的抓取频次挺高的,但为什么更新的页面不能被及时收录呢,新上的页面不仅收录慢,而且收录还少!所以请问下,网站抓取频次和页面收录到底 有什么关系,为什么抓取频次高但页面收录慢?
严格来说,网站抓取频次和页面收录没有直接的关系。要说清楚这个问题,需要了解两个方面的内容,下面具体说说。
1.页面被抓取不等于页面会被收录
百度搜索蜘蛛将页面内容抓取,这不等于就必须会建库,抓取内容后百度搜索会对内容进行初步审核,质量不过关的会直接被过滤掉。而那些通过初步审核的页面,才会被建库,而后才有 可能体现到网站索引里。有个情况需要知道,页面添加到索引后,使用SITE命令不一定能查到出来。
如果网站抓取频次更多的在这些质量不高的页面,那很显然网站收录是不会有明显增加的,这就是网站抓取频次高但是页面收录低的原因之一。
2.蜘蛛抓取的是已经被收录的页面
有时候可能会出现这种情况,网站抓取频次很多,但是抓取对象绝大部分是已经被收录的内容,而那些新更新的页面没有或者说极少数被抓取到,那么新页面的收录数自然也就少了。
需要注意,百度抓取并不是完全针对新页面,对于那些有更新,百度搜索认为值得更新百度快照的页面,蜘蛛也是会去抓取的。所以,如果遇到百度抓取频次高但新页面收录低的情况,需要去 分析网站日志,看看新页面是否已经被抓取,若是没有抓取到,即便内容质量再高,也是不会被收录的。
总结,页面被收录的前提是被蜘蛛抓取到,但被抓取后不等于一定会被收录。所以,想要提高网站收录,需要抓到两点,首先确保被蜘蛛成功抓取,其次是确保内容质量,如果能做到这两 点,网站页面收录就不是问题,这就是网站抓取频次和页面收录的关系。
关于页面收录的问题,推荐阅读网站收录一般需要多久,文章被收录又被删除的原因,从关键词排名分析页面不被收录的原因,如何让页面被搜索引擎蜘蛛抓取等文章。
关于网站抓取频次和页面收录的关系,大家要注意一个问题,蜘蛛抓取是页面收录的前提,网站页面只有被抓取了才有可能被收录。但是页面被抓取不等于一定会收录,所以单单从抓取频次来分析收录,是不合理的。
再回到网站优化的基础上来,如果网站能够提供有价值的内容,那么无论是抓取频次还是页面收录,都将不是问题。