如何判断真假百度蜘蛛?教你轻松识别真假蜘蛛的几种方法

时间:2022年06月02日

/

来源:网络

/

编辑:佚名

 什么是真假百度蜘蛛?
  百度抓取你的网站页面一定会用一种程序去抓取对吧,这种程序就叫做百度蜘蛛,百度蜘蛛类似一个正 常的访客,拥有着自己的独立IP,而且还会留下浏览轨迹,我们通过蜘蛛日志是可以看到百度蜘蛛抓取轨迹 的,当然了百度蜘蛛也是可以作假的,因为需要躲避一些安全防御的屏蔽,所以伪装成了百度抓取,来破坏采集攻击你的站点。
比如AWVS扫描网站
在文件头加Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
可以绕过狗,waf等另外如果很容易吧对方扫死的话,可以在第一项limit number…..,这里是最大的并发连接数默认是10,可以改低为2-5
某些WAF对访问请求时间太快会进行拦截,可以进行延迟发包,在Delay between 默认是0,改为1-5
假蜘蛛例子:
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /favicon.ico HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /customized/1.gif HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /src/images/logo.png HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /customized/logo.gif HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /help/images/f1.gif HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /customized/1.gif HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /src/images/logo.png HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /LICENSE.txt HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /images/adm/left_menus1.gif HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:57 +0800] "GET /admin/editor/xheditor_skin/default/img/tag-h4.gif HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:58 +0800] "GET /imageslzcms/logo.gif HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:58 +0800] "GET /_skins/201209/images/logo.jpg HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:58 +0800] "GET /images/luzhu.gif HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
114.108.219.8 - - [31/May/2022:13:14:58 +0800] "GET /images/lzbg12.gif HTTP/1.1" 404 2856 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"
  百度蜘蛛
  假百度蜘蛛有什么意图?
  意图的核心就是破坏你的网站,可能是来盗取你站点文章的,也可能是来寻找你网站漏洞的,攻击破坏 你站点让你站点打不开,也可能是来偷取你的网站源码的,总之就是想尽办法来破坏你的站点。
  怎么发现假百度蜘蛛?
  这个我们通过网站日志分析,可以看到有一些蜘蛛在抓取你网站中根本就没有的文件,其用意就是在测 试你当前网站是否有这种漏洞,正常百度蜘蛛是不会这样进行抓取的,所以我们可以80%的断定这个蜘蛛是 一个假蜘蛛,当然也不能完全肯定,我们可以用下面的两个方法进行判断到底是真假。
蜘蛛日志发现假蜘蛛
  蜘蛛日志发现假蜘蛛
  怎么判断真假百度蜘蛛?
  1,利用我们本地cmd命令来判断
  第一种是非常简单的,我们直接点击电脑左下角的开始->运行->输入cmd就可以进入到一个命令窗口 ,然后输入:nslookup ip (举例:nslookup 116.78.225.167)然后点击回车,如果你可以看到窗口中 出现当前指令“name:baiduspider”就证明是真百度蜘蛛,否则就是假的。
cmd判断假蜘蛛
cmd判断真蜘蛛
  2,利用ip138进行判断(强烈推荐)
  第二种更加简单了,我们访问ip138.com,然后直接输入我们当前需要验证的蜘蛛IP,如果验证中出现 “百度蜘蛛”这四个字证明是真蜘蛛,如果没有出现就一定是假蜘蛛了,这个方法非常的简单实用,推荐大 家使用。
IP138判断假蜘蛛
IP138判断真蜘蛛
  如何处理这些假百度蜘蛛?
  如果你发现了假蜘蛛,我希望你一定要屏蔽这个蜘蛛否则这个IP会一直寻找你网站的漏洞,我们这也是在做网站安全维护,任何黑客想黑你站点,必须有一个IP进来,我们如果直接杜绝了这种IP,也就杜绝了黑 你站点的黑客,所以这一点还是非常重要的。
1、大家可以安装网站防御软件,比如说云锁、安全狗,waf,直接屏蔽这种IP就可以了。
2、如果是nginx可以设置deny 114.108.219.8;
3、如果是阿里云服务器,云服务器->网络与安全->ECS安全组->安全组规则->入方向->手动添加规则
全部拒绝 114.108.219.8/32即可!

4、网站可以用插件或者代码屏蔽恶意ip

 
猜你需要

豫ICP备2021026617号-1  豫公网安备:41172602000185   Copyright © 2021-2028 www.78moban.com/ All Rights Reserved

本站作品均来自互联网,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如有侵犯您的版权,请联系 1565229909#qq.com(把#改成@),我们将立即处理。