近期在百度站长论坛的站长学院中,百度lee发布了一篇帖子:浅谈404问题。主要内容是围绕网站为什么要设置404页面,及在页面不存在时,返回404状态码的重要性。今天,Q猪就404问题,简单做一下研究。
问题一、为什么会出现404错误
分析:正常情况下,当用户访问网站上的页面时,如果页面不存在,服务器就会返回404状态码。
问题二、为什么要添加404页面
分析:用户访问网站页面,如果该页面不存在,服务器就会自动返回一个错误页面,通常这样的页面时没有内容的,如:
所以,为什么需要制作一张404页面,在出现页面不存在时,可以在服务器中设置,返回设计好的404页面,告诉用户该页面不存在,并指导用户返回,其他页面。
问题三、404问题对搜索引擎的重要性
分析:在网站日志中可以看到,搜索引擎在爬行网站时,正常页面返回的都是200状态码,如果网站因为某些原因,页面暂时打不开,服务器会返回503状态码,只有当页面不存在,服务器才会返回404错误。
搜索引擎在爬行网站时,如果返回的是503状态码,蜘蛛会在短期内,多次爬行该页面,如果一段时间以后,该页面恢复了,搜索引擎就会正常抓取,如果返回的还是503,搜索引擎就会在一段时间以后,删除索引库中关于网页的链接地址。
如果页面确实不存在,或者永远无法打开,服务器需要返回404错误,当搜索引擎爬行该页面,得到404状态码以后,就会直接将页面链接地址从索引库中删除。
之所以强调,服务器返回404错误的重要性,主要是因为,当网站内出现,大量页面无法访问时(比如链接地址错误,或者页面已删除),用户访问这些地址时,出现的往往都是设计好的404页面。
如果这时,返回的是200状态码,搜索引擎就会认为,网站内存在大量的重复页面,当这种页面出现多次,就有可能受到搜索引擎的惩罚,这也是为什么我们强调,网站内,需要去除重复内容的重要性。
如果网站被攻击,或者其他什么原因,而存在大量垃圾页面时,最安全的做法是:
1、及时删除相关垃圾页面,并做404处理;
2、制作符合要求的死链sitemap;
3、登录百度站长平台,进入死链提交工具提交死链sitemap。
关于网站服务器如何设置404错误的问题,Q猪会在下一章中讨论。本文由Q猪文学站(http://www.qzread.com/)原创发布,转载请注明出处。