智能小程序官方教你三步轻松解除百度蜘蛛封禁

来源:中网互动    浏 览:316    2022-06-30 15:43:14
近期收到一些开发者反馈,为什么网站或智能小程序资源的内容非常优质,但是没有查询到百度蜘蛛抓取记录,或在百度搜索中没有得到收录和展现?
有可能是部分网站或智能小程序存在封禁百度蜘蛛的情况,导致百度蜘蛛无法正常抓取,所以无法在百度搜索中正常收录和展现。
常见的封禁行为包括robots封禁、封禁百度UA、封禁百度IP等。
如何验证网站和智能小程序是否存在封禁百度蜘蛛的情况?快来按照以下方法自查吧~
1、自查robots.txt文件
首先,开发者们先查看robots.txt文件,是否存在封禁记录。一般robots.txt文件放置在网站根目录下~
【建议方案】如果存在robots封禁的情况,请开发者们及时修改或者删除robots.txt文件。
2、自查是否封禁百度UA
如果开发者们自查robots.txt文件无异常,可以进一步排查是否存在封禁百度UA情况。
1执行代码进行自查
执行以下命令进行排查:
curl--head--user-agent'Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)'--requestGET'xxxxxxx'
xxxxxxx为网站域名,如:http://www.abc.com
注意:如果站点正常,不存在封禁百度UA的情况,则其返回码是200,如出现其他返回码为异常。
2变更浏览器进行UA验证
通过观察站点资源在其他浏览器是否得到正常的抓取和收录,来判断网站是否有封禁百度UA的情况。
【建议方案】查看网站反爬虫策略,进行策略调整,解除百度UA封禁;或者针对百度UA添加策略白名单。
3、自查是否存在IP封禁
如果以上验证均无异常,开发者们则可以排查是否存在IP封禁的情况。
常见的IP封禁,源自网站的防火墙系统配置,需要查看防火墙配置系统后台,检查是否存在百度蜘蛛的IP级别封禁措施。
【建议方案】查看网站反爬虫策略,进行策略调整,解除百度IP封禁。
版权声明: 原创
分享
咨询热线
0592-3503555

周一至周五 8:30-18:00

在线咨询
联系我们

手机:13666085526

传真:0592-3503377

邮件:yeweiwei@xm12t.com

地址:厦门市思明区软件园二期观日路30号之七107室

客服
我要咨询
咨询信息提交成功后,我们会尽快安排专职顾问与您联系,请注意接听,谢谢
公司名:
所在城市:
* 您的称呼:
* 您的手机号:

您可点击 在线咨询 获取详情,专业客服将与您实时沟通。

咨询热线 0592-3503555