node.js 刷csdn博客访问量

身为一名前端技术人员利用node刷一下博客的访问量应该不过分吧···

  • 导入npm包
    request以 npm 包的形式提供,是一个简单的 HTTP 客户端,通过它可方便地实现 HTTP 请求,可以用来请求网页;
    cherrio是用来分析dom结构的(Nodejs版本的jquery);
const request = require('request')
const cheerio = require('cheerio')
  • 获取博客数据,并记录博客地址
// 当前页码,这个可以自定义也可以从页面抓取,这里我就不赘述了
let indexPage = 1
// 博客地址 + /article/list/ + 页码  表示当前网页
let url = 'https://blog.csdn.net/weixin_45266125/article/list/' + indexPage
// 获取博客主页
request(url, (error, response, body) => {
    if (!error && response.statusCode === 200) {
      	// 获取html文档
        let $ = cheerio.load(body)
        // 计算总页数
        let allCount = $('#blog_statistics li span').first().text() || 20
        let page = parseInt(allCount) / 20
        let pageStr = page.toString()
        // 不能被整除
        if (pageStr.indexOf('.') > 0) {
            page = parseInt(pageStr.split('.')[0]) + 1
        }
        // 返回的json数据
        let data = {}
        // 文章集合
        let articles = []
        data.allPages = page
        data.currentPage = parseInt(indexPage)
        // 博客主页列表网址存在 .article-list h4 a 标签中,这个随时可能变
        $('.article-list h4 a').each((ins, el) => {
            let article = {} // 每篇文章的字典
            $(el).find(".article-type").remove()
            // 获取文本去除空格以及回车换行
            let text = ($(el).text().replace(/\ +/g,"")).replace(/[\r\n]/g,"")
            // 获取博客网址
            let url = ($(el).attr('href').replace(/\ +/g,"")).replace(/[\r\n]/g,"")
            // title太长可以隐藏
            if (text.length > 20){
                text = text.substring(0, 20).concat('...')
            }
            article.title = text
            article.url = url
            articles.push(article)
        })
        data.articles = articles
        // 执行函数,开启定时任务,请求博客
        intervalArticle(articles)
    } else {
      	// 返回的json数据
        let data = {}
        data.msg = '爬取失败'
    }
})
  • 设置定时任务,不停随机刷博客浏览量
let intervalArticle = urls => {
    var count = 0 // 刷了多少次
    var len = urls.length // 需要刷的文章篇数
    var co = 0 // 为了循环刷新

    setInterval(function() {
        count = count + 1
        // 随机生成0~len的数字,可以按顺序刷,也可以随机刷
        // co = Math.floor(Math.random() * len)
        // 请求博客地址
        request(urls[co].url, function (error, response, body) {
            if (!error && response.statusCode === 200) {
                // console.log(`浏览量:${count} , 文章:${urls[co].title} , 加载次数:${ parseInt((count + len) / len) }`)
            }
        })
        ++co
        if (co === len) {
            co = 0
        }
    }, 60000)
}
  • 将上述文件导入node启动文件,运行就可以了,也可以放到服务器,这样就可以一直刷了^ - ^
发布了25 篇原创文章 · 获赞 4 · 访问量 123万+

猜你喜欢

转载自blog.csdn.net/weixin_45266125/article/details/104004185