搜外问答上有朋友提到这样的问题:网站文章收录了,但是显示是12小时前怎么回事?对此表示不理解,这其实就是百度更新页面的机制,本文简单解释下。
首次收录的时间
比如上图,第一个显示是20小时前,第二个显示是23小时前。这种通常是就是文章发布的时间,为了让大家更加直观的看到,再把文章发布时间的截图附上。
大家可以去计算下,就知道这个20小时前就是12月26晚上的8点左右。
注意:本文的编辑时间是27日下午3点20多,但会在28日上午7点多发布!所以,大家在看到这篇文章的时候,不要按本文发布的时间去算!
这种算法其实很简单,百度搜索在抓取页面的时候,会提取页面上所有有价值的信息,这其中就包括了时间戳!这个时间戳还是挺重要的,百度搜索在判断原创出处的时候会参考,但不会保证都准确!我们在制作页面模板的时候,尽量还是把时间因子加上。
注意,这里有个时间混乱的问题!比如说某篇文章的发布时间时间今天,但这个页面上还有个时间是2021年啥时候,这种情况下,百度搜索可能会使用2021年这个时间戳,那文章收录的时间可能显示2021的,还不是今天的!
后续更新后的时间
百度搜索在收录页面之后,会对这些已经收录的页面不定期的抓取和更新,会根据某些规则来更新这个页面时间。这时候这个时间就不是页面发布的时间了,而是百度更新页面的那个时间,之前这种叫做百度快照更新,但现在百度已经取消快照展示了,但时间因子还是在的。
再看个例子,夫唯学院的这个页面,这里显示收录时间是2023年8月10日,但实际的时间是啥时候呢?再去给大家截个图出来。
可以看到,这篇文章的发布时间是2019年4月了!
从这个案例可以看出,我们在site上看到的这个百度收录时间并不是文章原本发布的时间,而是百度搜索更新页面的时间。
关于百度显示页面收录时间的问题,本文通过两个案例给大家做了具体的解释,相信大家应该能够有所了解。
事实上,我们不需要过多关注这个时间问题,那些更新了时间的页面不等于权重就高!在具体的SEO当中,只需要页面被收录即可!