C#是如何做爬虫的 - 代码天地

C#是如何做爬虫的

其他 2018-06-29 18:34:28 阅读次数: 2

//创建URL，并创建请求
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
//携带cookie
request.CookieContainer = CookieContainer;
//发送请求，并获取HTML
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
Stream stream = response.GetResponseStream();
//读取流
StreamReader streamreader = new StreamReader(stream, Encoding.GetEncoding("gb2312"));
string html = streamreader.ReadToEnd();
streamreader.Close();
response.Close();

if (string.IsNullOrEmpty(html)) return;

接下来就可以做各种信息的提取了，正则表达式.......该不骤是针对静态网页的

//匹配分组数据

string regex = "div class=\"mls\">.*href=\"(?<url>[^\"]*)\">(?<title>[^<]*介绍)</a>";

MatchCollection mces = RegexUtil.GetGroupByRegex(html, regex);
if (mces == null || mces.Count <= 0) return;
//抓取网页的所有数据
foreach (Match m in mces)
{

猜你喜欢

转载自blog.csdn.net/cxlhuihui/article/details/80689494

C#是如何做爬虫的

C#之下如何做定时

如何做科研？

如何做研究

如何做EDA？

如何做采访？

如何做需求

如何做笔记

如何做PPT

如何做馒头

C++小白如何做简单游戏

如何做笔记 or 笔记该如何做？

如何做SVN迁移

如何做技术总监

团队如何做计划？

如何做1:1

iOS如何做优化

如何做需求分析

如何做产品经理

如何做junit测试

SEO应当如何做

如何做研究？【转载】

技术架构如何做？

“免费”的项目如何做？

dubbo如何做限流?

如何做facebook营销

如何做性能测试

菜鸟如何做分享

如何做函数的图像

如何做论文报告

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)