Node完成简单爬虫

编写好node代码,终端运行node app.js后

页面显示json数据

[    

    {   "title":"【活动+视频】北京1月12日Node Party活动",        "href":"/topic/5c1760337ec239239ff579a2"  }, 

    {   "title":"送几本《Node.js开发实战》",        "href":"/topic/5c2edce13898674067a7b103"   }

]

首先介绍两个库

superagent 是个 http 方面的库,可以发起 get 或 post 请求

cheerio 一个 Node.js 版的 jquery,用来从网页中以 css selector 取数据,使用方式跟 jquery 一样的

开始写我们的爬虫

1.新建一个文件夹lesson,进去之后 npm init

$ mkdir lesson

$ cd lesson 

$ npm init

2.安装node依赖包

$ npm i --save express superagent cheerio

3.编写爬虫代码

3781695-fd6d09ac25ecbad5.png

4.终端运行

node app.js

进阶:输出包括主题的作者

需要重新查看页面的元素哦,附上代码仅供参考


3781695-1e489debedfa9e4b.png

猜你喜欢

转载自blog.csdn.net/weixin_34242509/article/details/87552803