网站日志UA中baiduboxapp是什么
时间:2023年10月14日
/来源:网络
/编辑:佚名
今天在分析网站日志的时候,发现一个ip段流量很大。一开始我以为是恶意扫描,结果在ua(UserAgent)里发现了一段baiduboxapp。这是百度蜘蛛吗?还是假爬虫?先看一下完整的ua。
okhttp/3.11.0 SP-engine/2.80.0 Dalvik/2.1.0 (Linux; U; Android 13; LGE-AN20 Build/HONORLGE-AN20) baiduboxapp/13.42.5.10 (Baidu; P1 13)
‘ Mozilla/5.0(Linux;安卓10;米8 Build/qkq 1 . 190828.002;wv) AppleWebKit/537.36 (KHTML,像壁虎一样)版本/4.0 Chrome/76 . 0 . 3809 . 89 Mobile Safari/537.36 T7/12.3 SP-engine/2.25 . 0 baiduboxapp/12.3 . 0.11(百度;P1 10)纳巴尔/1.0 ‘
查询后,找到这个
baiduboxapp蜘蛛
Baiduboxapp可能确实是百度蜘蛛,但是经过nslookup的查询,并不是百度蜘蛛。发生了什么事?我有点头晕。
有必要弄清楚是不是蜘蛛。如果不是蜘蛛,那就浪费服务器资源了,继续查。
经过大量调查,这部分属于正常用户。使用百度APP访问网页时,会经过百度服务器的代理,所以日志中会显示代理ip,并不是用户的真实ip。而使用手机自带浏览器访问,每次访问的ip都是用户真实的ip。
如果网站有https,那么使用百度APP访问网页不会被百度服务器代理,但还是会有baiduboxapp。
暂时不知道百度APP使用代理ip的目的,也没必要获取用户隐私。百度APP不是把权限都给你了吗?
注:baiduboxapp不代表没有问题。有时候可能是假爬虫,比如下图。
网站日志UA中baiduboxapp是什么
这种对网址的恶意搜索已经很明显了。直接屏蔽IP就行了。
okhttp/3.11.0 SP-engine/2.80.0 Dalvik/2.1.0 (Linux; U; Android 13; LGE-AN20 Build/HONORLGE-AN20) baiduboxapp/13.42.5.10 (Baidu; P1 13)
‘ Mozilla/5.0(Linux;安卓10;米8 Build/qkq 1 . 190828.002;wv) AppleWebKit/537.36 (KHTML,像壁虎一样)版本/4.0 Chrome/76 . 0 . 3809 . 89 Mobile Safari/537.36 T7/12.3 SP-engine/2.25 . 0 baiduboxapp/12.3 . 0.11(百度;P1 10)纳巴尔/1.0 ‘
查询后,找到这个
baiduboxapp蜘蛛
Baiduboxapp可能确实是百度蜘蛛,但是经过nslookup的查询,并不是百度蜘蛛。发生了什么事?我有点头晕。
有必要弄清楚是不是蜘蛛。如果不是蜘蛛,那就浪费服务器资源了,继续查。
经过大量调查,这部分属于正常用户。使用百度APP访问网页时,会经过百度服务器的代理,所以日志中会显示代理ip,并不是用户的真实ip。而使用手机自带浏览器访问,每次访问的ip都是用户真实的ip。
如果网站有https,那么使用百度APP访问网页不会被百度服务器代理,但还是会有baiduboxapp。
暂时不知道百度APP使用代理ip的目的,也没必要获取用户隐私。百度APP不是把权限都给你了吗?
注:baiduboxapp不代表没有问题。有时候可能是假爬虫,比如下图。
网站日志UA中baiduboxapp是什么
这种对网址的恶意搜索已经很明显了。直接屏蔽IP就行了。
新闻资讯 更多
- 【建站知识】查询nginx日志状态码大于400的请求并打印整行04-03
- 【建站知识】Python中的logger和handler到底是个什么?04-03
- 【建站知识】python3拉勾网爬虫之(您操作太频繁,请稍后访问)04-03
- 【建站知识】xpath 获取meta里的keywords及description的方法04-03
- 【建站知识】python向上取整以50为界04-03
- 【建站知识】scrapy xpath遇见乱码解决04-03
- 【建站知识】scrapy爬取后中文乱码,解决word转为html 时cp1252编码问题04-03
- 【建站知识】scrapy采集—爬取中文乱码,gb2312转为utf-804-03