scrapy采集—爬取中文乱码,gb2312转为utf-8
有段时间没怎么使用scrapy了,最近采集一个网页,发现网页编码是gb2312,
一开始就取搜索了下,发现各种操作都有,有在settings中设置
# FEED_EXPORT_ENCODING = 'utf-8'

更新时间:2024-04-03

阅读( 6

编辑:佚名

linux清理vda1中deleted的文件
清理vda1
使用 df -h 命令查看 发现/dev/vdal 已经百分百
使用 du -sh * 命令查看占用比较大的文件或目录,看了三遍发现最大的就是30多M,百分之就是都是几十K,根本不可能满阿

更新时间:2024-04-03

阅读( 4

编辑:佚名

网站日志出现Cookie: mstshash=Administr原因与解决方法
今天一位朋友用的“discuz”论坛程序,结果今天查看日志的时候发现了如下提示:
我朋友随意网上查了一下,说这串代码是“远程代码执行漏洞”的特征,然后就怀

更新时间:2024-04-03

阅读( 92

编辑:佚名

nginx匹配url中包含Cookie: mstshash=Administr进行拒绝访问
nginx匹配url进行拒绝访问
复制代码
server {
#获取url完整请求
set $URL $scheme://$http_host$request_uri;
#根据获取的URL匹配一些限制字符,满足条件拒绝访

更新时间:2024-04-03

阅读( 2

编辑:佚名

发现一个扫描pbootcms漏洞的样本
是通过python爬取网站是不是有漏洞样本,扫描的ip是香港的。
样本如下:
154.89.4.7 - - [03/Apr/2024:07:30:11 +0800] "GET /{pboot:if((\x22file_put_co\x22.\x22ntents\x22)

更新时间:2024-04-03

阅读( 16

编辑:佚名

php怎么向上取整以5为界
php中如何向上取整以5为界?
public function test(){
$number = 52093;
var_dump( $this->roundNumberVariant( ( int ) $number ) );
}
private function roundNu

更新时间:2024-04-02

阅读( 1

编辑:佚名

如何去除宝塔面板操作上的二次验证?
用过宝塔的朋友应该都会发现,现在宝塔面板有些鸡肋的功能,删除文件、删除数据库、删除站点等操作都需要做计算题!不仅加了几秒的延时等待,还无法跳过!这时候就会有朋友在想,如何

更新时间:2024-04-02

阅读( 2

编辑:佚名

宝塔面板迁移系统盘/www到数据盘/home
如果是纯净系统还没安装宝塔面板,直接连接终端不墨迹,命令搞起来:
第一步:进入data目录(data是数据盘名称,有很多是home,你的数据盘名称是什么就用那么名称替换data就好)
cd /home

更新时间:2024-04-02

阅读( 1

编辑:佚名

redis 指定db库导入导出数据
最近根据之前的项目重新改编一个新的项目,发现上一个项目的搭建者,把一些区域权限和划分放在redis上存储,因此不得不照搬过来,所以搜索一下相关如何做的
发现一个比较简单的做法

更新时间:2024-04-02

阅读( 3

编辑:佚名

TW模板如何转LECMS ?
1、$tw 改成 $cfg
2、$tw_var 改成 $cfg_var
3、内容页浏览量 不再使用js,直接 {$gdata[views]} (新版本2.0.4)

更新时间:2024-03-31

阅读( 8

编辑:佚名

豫ICP备2021026617号-1  豫公网安备:41172602000185   Copyright © 2021-2028 www.78moban.com/ All Rights Reserved

本站作品均来自互联网,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如有侵犯您的版权,请联系 1565229909#qq.com(把#改成@),我们将立即处理。