【填坑】老域名百度模拟抓取失败问题解决方案
近期有学员反馈他的域名使用百度模拟抓取的时候一直显示失败,试了N种方法都不行。而最近几天我上站的时候也遇到了相同的问题,百度后台验证的时候是可以通过的,正常情况下是模拟抓取也是可以通过的,但是模拟抓取失败。
因为用的是老米,点击抓取详情的时候发现百度抓取的还是原来域名的IP地址。
因为我知道百度为了提升爬虫的访问效率,有自己的DNS服务器,所以我就点击了更新IP,但是试了N次都不行。以前的经验是基本点击更新了就是OK的。
接着我就主动提交了整站的网址和sitemap地图,结果第二天再模拟抓取的时候就已经是正常的了。
结论,只要是主动提交可以提交成功以及sitemap的数据可以正常被百度提取,那么后续的百度抓取就是没有问题的。所以大家遇到相同的问题的时候可以尝试主动提交以及提交sitemap来更新你的IP。
那么会出现这种问题的都会发生在哪些阶段呢?
- 域名更换服务器IP的时候会出现
- 老玉米新上线的时候会遇到
这里还有一个注意的点,那就是针对百度的,由于sitemap的提交是有限制的,似乎每个站点就100份,每份50000条,所以基本一个站也就500万,因此最好是每一份都提交够50000条。当然了,小站点就不用关注这些。
因为神马的sitemap提交限额是10000条,当然了评级越高数量越多,所以有些egg pain,这种情况只能是每个搜索引擎单独提交了。
THE END
0
二维码
海报
【填坑】老域名百度模拟抓取失败问题解决方案
近期有学员反馈他的域名使用百度模拟抓取的时候一直显示失败,试了N种方法都不行。而最近几天我上站的时候也遇到了相同的问题,百度后台验证的时候是可以通过……