file_get_contents网页抓取 - 代码天地

file_get_contents网页抓取

其他 2019-03-21 08:40:54 阅读次数: 0

首先我有一个me.html页面，内容如下：

复制PHP内容到剪贴板

PHP代码:

//<html>
//<body>
//    <span id=txt>
//    这里就是我想得到的内容！<br>
//    By:dx_andy<br>
//    </span id=t>
//</body>
//</html>

好好分析一下，上面的代码就可以知道，在要得到的内容上下有一组唯一的标签。即//<span id=txt> //</span id=t>

由此你就可以写一个正则把这个标签前的字符串替换为空，把这个标签后的替换为空，只留下中间自己想要的内容。

代码如下：

复制PHP内容到剪贴板

PHP代码:

//
//<?php
//$file="me.html";
//$str=file_get_contents($file);
//$str=preg_replace("/((.|/n|/r|/t)*)(<span id=txt>)((.|/n|/r|/t)*)//(<//span id=t>)/","//4",$str);
//echo $str;
//?>

但是如果你要打开的文件不是自己编辑的，最后一个（</span id=t>）标签网页上都写为</span>所以你要匹配的字符串就不唯一了。在这种情况下就会出错！

猜你喜欢

转载自blog.csdn.net/guocuifang655/article/details/3973271

file_get_contents网页抓取

curl 和 file_get_contents 抓取网页乱码的解决之道

file_get_contents函数抓取url为空的原因

file_get_contents函数

file_get_contents的用法

file_get_contents('php://input')

file_get_contents可能导致的出错

file_get_contents("php://input")

file_get_contents 函数证书问题

file_get_contents 多参数

file_get_contents("php://input")的用法

PHP file_get_contents函数

file_get_contents函数高级应用

file_get_contents分段读取文件

file_get_contents("php://input")用法

CG CTF file_get_contents

php file_get_contents与file_put_contents

使用file_get_contents()和curl()抓取网络资源的效率对比

【PHP】使用 file_get_contents() 发送 GET、POST 请求

PHP中file_get_contents函数抓取https地址出错的解决方法(两种方法)

【转】file_get_contents("php://input")的使用方法

file_get_contents url请求/传输数据

PHP中file_get_contents高級用法实例

防超时的file_get_contents改造函数

cURL和file_get_contents实现模拟post请求

PHP 使用 file_get_contents 接收 POST 的資料

file_get_contents('php://input') 和POST的区别

使用file_get_contents函数需要注意的地方

php用file_get_contents、fsockopen发送http请求

file_get_contents爬了一个坑

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)