PHP 正则匹配网站body部分
时间:2023年10月04日
/来源:网络
/编辑:佚名
要匹配网站的 <body> 标签及其内部内容,你可以使用以下正则表达式:
$pattern = '/<body[^>]*>(.*?)<\/body>/is';
该正则表达式匹配 <body> 标签及其内部内容,其中 .*? 表示非贪婪匹配任意字符。
以下是一个示例代码:
// 获取目标 URL 的 HTML 内容
$html = file_get_contents('https://example.com');
// 匹配 body 部分
$pattern = '/<body[^>]*>(.*?)<\/body>/is';
if (preg_match($pattern, $html, $matches)) {
// 输出 body 内容
echo $matches[1];
} else {
echo '没有找到 body';
}
在上述代码中,我们使用 preg_match() 函数来匹配 <body> 标签及其内部内容,并输出匹配结果。如果没有找到 <body> 标签,则输出“没有找到 body”。
$pattern = '/<body[^>]*>(.*?)<\/body>/is';
该正则表达式匹配 <body> 标签及其内部内容,其中 .*? 表示非贪婪匹配任意字符。
以下是一个示例代码:
// 获取目标 URL 的 HTML 内容
$html = file_get_contents('https://example.com');
// 匹配 body 部分
$pattern = '/<body[^>]*>(.*?)<\/body>/is';
if (preg_match($pattern, $html, $matches)) {
// 输出 body 内容
echo $matches[1];
} else {
echo '没有找到 body';
}
在上述代码中,我们使用 preg_match() 函数来匹配 <body> 标签及其内部内容,并输出匹配结果。如果没有找到 <body> 标签,则输出“没有找到 body”。
新闻资讯 更多
- 【建站知识】查询nginx日志状态码大于400的请求并打印整行04-03
- 【建站知识】Python中的logger和handler到底是个什么?04-03
- 【建站知识】python3拉勾网爬虫之(您操作太频繁,请稍后访问)04-03
- 【建站知识】xpath 获取meta里的keywords及description的方法04-03
- 【建站知识】python向上取整以50为界04-03
- 【建站知识】scrapy xpath遇见乱码解决04-03
- 【建站知识】scrapy爬取后中文乱码,解决word转为html 时cp1252编码问题04-03
- 【建站知识】scrapy采集—爬取中文乱码,gb2312转为utf-804-03