Node.js简单实现爬虫 - 代码天地

Node.js简单实现爬虫

其他 2021-03-26 19:46:05 阅读次数: 0

在实现Node.js获取数据之前，先要了解什么是爬虫。

什么是爬虫

使用数据请求一段内容，然后将这段内容做数据清洗，最后在通过后端服务器发送到前台页面。

安装cheerio依赖包

安装命令是：npm install cheerio。
cheerio的功能是用来操作dom元素的，可以将request返回来的数据转换成可供dom操作的数据。
在这里插入图片描述

引入并使用

在这里插入图片描述
本文中，我们将要以京东的导航栏为例。
首先进入谷歌浏览器，右键选择“检测”，然后选择“Network”,就可以得到请求数据的网址：https://www.jd.com/。

数据请求使用get（），第一个参数位请求数据的地址，第二个参数为回调函数。
在这里插入图片描述
添加错误事件并把具体输出

头部请求

最后我们建立一个静态服务器

在终端中输入 node jd.js 再进入http://localhost:8000 这样我们完成了对导航栏数据的获取。

猜你喜欢

转载自blog.csdn.net/zhanleibo/article/details/90244866

Node.js简单实现爬虫

简单介绍Node.js实现爬虫

Node.js实现单页面爬虫

node.js爬虫

Node.js实现简单的爬取

Node.js简易爬虫

50行实现Node.js多进程分页爬虫

简单易学！使用 Node.js 编写爬虫，跟着教程一步步实现！

Node.js的简单介绍

Node.js简单操作

node.js简单介绍

node.js 的简单介绍

node.js 的简单应用

node.js 简单使用

Node.js简单学习

node.js简单记录

Node.js 实现简单的接口服务器

node.js 实现简单前后端交互

Node.js 路由映射和简单例子实现

node.js 实现简单的文件上传功能

【简】Node.js实现简单数据返回！！！

简单几行代码，实现Node.js程序发邮件。

node.js简单登录注册功能实现

基于node.js的爬虫框架 node-crawler简单尝试

Node实现简单爬虫

Node.js实现WebSocket

node.js 爬虫乱码问题 cheerio

node.js爬虫，牛刀小试

node.js 爬虫动态代理ip

node.js入门（一）爬虫

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)