1、先来一个最简单的cURL爬虫实例,抓取百度首页
<?php
$ch=curl_init();//初始化一个cURL会话
curl_setopt($ch,CURLOPT_URL,"http://www.baidu.com/");//设置这个会话的URL(这里要注意url地址要写成http,写成https会抓取空白,原因后面会说)
curl_exec($ch);//执行这个会话
curl_close($ch);//释放这个会话
?>
2、再进一步学习
这里将抓取到的百度首页中的“百度”替换成“PHP”输出
<?php
$ch = curl_init(); // 初始化
curl_setopt($ch, CURLOPT_URL, "http://www.baidu.com/"); // 设置访问网页的URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 执行之后不直接打印出来
$output=curl_exec($ch); // 执行
curl_close($ch); // 关闭cURL
echo str_replace("百度","PHP",$output);
?>