使用node写一个爬虫(原来使用node.js做爬虫如此简单!) - 代码天地

使用node写一个爬虫(原来使用node.js做爬虫如此简单!)

其他 2018-12-30 03:08:16 阅读次数: 0

npm中有一个crawler模块是专门用来爬取数据的,可以上别人的网站爬取的数据保存在数据库中,代码使用过程如下:

// 导入模块 mysql
const mysql=require('mysql');
// 导入模块 Crawler
const Crawler=require('Crawler');
//创建数据库连接
var connection = mysql.createConnection({
    host     : 'localhost',
    user     : 'root',
    password : 'root',
    database : 'test'
  });
   
//实例化爬虫对象
let num=0;

var c = new Crawler({
    maxConnections : 10,
    // This will be called for each crawled page
    callback : function (error, res, done) {
        if(error){
            console.log(error);
        }else{
            var $ = res.$;
            // $ is Cheerio by default
            $('#feed-main-list li').each((index,element)=>{
            // 标题
            let title=$(element).find('.z-feed-title a').text();
            
            let content=$(element).find('.z-feed-img img').attr('src');
            
            var post  = {title,content};
            connection.query('INSERT INTO smzdm26 SET ?', post, function (error, results, fields) {
            if (error) throw error;
            num++;
            console.log("已插入"+num+"条数据");
  });
            })
  
   

        }
        done();
    }
});


 // 爬取数据
// Queue just one URL, with default callback

for(let i=0;i<5000;i++){
c.queue('https://post.smzdm.com/p'+i);
}

效果图:
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/xiaodi520520/article/details/85340634

使用node写一个爬虫(原来使用node.js做爬虫如此简单!)

用node.js从零开始去写一个简单的爬虫

使用Node.js写一个简单的api接口

一个Node.js的小爬虫

用node.js写的第一个爬虫

一起来使用node.js制作一个小视频吧

使用 Node.js爬虫入门学习

使用最基础的Node，创建一个简单的node.js应用

node.js爬虫

node.js使用教程——安装、第一个node.js、

使用 Node.js 写一个代码生成器

node.js做的一个简单爬虫,适合菜鸟级新手,针对无防爬措施的网站

Node.js简单实现爬虫

简单介绍Node.js实现爬虫

使用node写爬虫入门

使用Node.js + MongoDB实现一个简单的日志分析系统

使用node.js搭建一个简单的本地服务器

使用Node.js开发一个简单的图片服务器

使用Node.js简单创建一个服务器

使用Node.js做一个简单的图片上传web

使用Node.js搭建一个简单的http服务器

Node.js爬取妹子图-crawler爬虫的使用

使用Node.js搭建数据爬虫crawler

使用ExcelJS快速处理Node.js爬虫数据

简单易学！使用 Node.js 编写爬虫，跟着教程一步步实现！

node.js 简单使用

基于Node.js实现一个小小的爬虫

node.js入门（一）爬虫

使用html写一个android关于界面，事情原来可以如此简单

使用Node.js的express框架搭建一个简单项目并且添加了一个路由

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)