热门标签：公益活动快闪感恩节商业计划工作总结

首页 > 文章资讯 > 站长教程 > 建站知识 > apache httpclient php,宝塔面板Nginx防火墙拦截Apache-HttpClient访问是怎么回事？Apache-HttpClient是什么？

apache httpclient php,宝塔面板Nginx防火墙拦截Apache-HttpClient访问是怎么回事？Apache-HttpClient是什么？

时间：2023年06月04日

/

来源：网络

/

编辑：佚名

apache httpclient php,宝塔面板Nginx防火墙拦截Apache-HttpClient访问是怎么回事？Apache-HttpClient是什么？
今天服务器出了点问题，重装了宝塔面板和LNMP(Nginx/MySQL/PHP)环境，这才不到 10 分钟，日志里面就出现了下面这种提示。。
日志大概有几千条，目前，谁能明确的说一下这到底是什么东西？为什么会一直在请求一个页面？
125.123.121.82 [2019-09-11 19:36:06] "UA aisoa.cn/post-2186.html" "-" "Apache-HttpClient/4.4.1 (Java/1.6.0_45)" "(HTTrack|Apache-HttpClient|harvest|audit|dirbuster|pangolin|nmap|sqln|hydra|Parser|libwww|BBBike|sqlmap|w3af|owasp|Nikto|fimap|havij|zmeu|BabyKrokodil|netsparker|httperf|bench| SF/)"
27.29.89.136 [2019-09-11 19:36:06] "UA aisoa.cn/post-2186.html" "-" "Apache-HttpClient/4.4.1 (Java/1.6.0_45)" "(HTTrack|Apache-HttpClient|harvest|audit|dirbuster|pangolin|nmap|sqln|hydra|Parser|libwww|BBBike|sqlmap|w3af|owasp|Nikto|fimap|havij|zmeu|BabyKrok
Apache HttpClient是一个传输库。它在客户端，发送和接收Http消息。它提供了最新，功能丰富且高效的实现，符合最新的Http标准。
Apache HttpClient简介
HttpClient 是 Apache Jakarta Common 下的子项目，用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。HttpClient 已经应用在很多的项目中，比如 Apache Jakarta 上很著名的另外两个开源项目 Cactus 和 HTMLUnit 都使用了 HttpClient。
HttpClient 相比传统 JDK 自带的 URLConnection，增加了易用性和灵活性，它不仅是客户端发送 HTTP 请求变得容易，而且也方便了开发人员测试接口（基于 HTTP 协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握 HttpClient 是很重要的必修内容，掌握 HttpClient 后，相信对于 HTTP 协议的了解会更加深入。
如何屏蔽Apache HttpClient？
User-Agent 即用户代理，简称“UA”，它是一个特殊字符串头。网站服务器通过识别 “UA”来确定用户所使用的操作系统版本、CPU 类型、浏览器版本等信息。而网站服务器则通过判断 UA 来给客户端发送不同的页面。
我们知道，网络爬虫使用程序代码来访问网站，而非人类亲自点击访问，因此爬虫程序也被称为“网络机器人”。绝大多数网站都具备一定的反爬能力，禁止网爬虫大量地访问网站，以免给网站服务器带来压力。即将要讲解的 User-Agent 就是反爬策略的第一步。
网站通过识别请求头中 User-Agent 信息来判断是否是爬虫访问网站。如果是，网站首先对该 IP 进行预警，对其进行重点监控，当发现该 IP 超过规定时间内的访问次数，将在一段时间内禁止其再次访问网站。
通过User-Agent屏蔽Apache HttpClient
方法：
宝塔面板 – 网站 – 设置 – 配置文件，第八行添加以下代码：

#禁止Scrapy等工具的抓取
if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {
return 403;
}
#禁止指定UA及UA为空的访问
if ($http_user_agent ~* "FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|Bytespider|Ezooms|Googlebot|JikeSpider|SemrushBot|^$" ) {
return 403;
}
#禁止非GET|HEAD|POST方式的抓取
if ($request_method !~ ^(GET|HEAD|POST)$) {
return 403;
}

新闻资讯更多

猜你需要

热门文章

最新标签

行业动态文章合集 cms技术教程文章合集热门话题焦点资讯文章合集搞笑囧图幽默文章合集手机教程文章合集人际关系技巧文章合集求职指南文章合集职场礼仪文章合集

热门合集

关于我们 | 联系我们 | 版权声明 | 帮助中心

豫ICP备2021026617号-1 豫公网安备：41172602000185 Copyright © 2021-2028 www.78moban.com/ All Rights Reserved

本站作品均来自互联网，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如有侵犯您的版权，请联系 1565229909#qq.com（把#改成@），我们将立即处理。