[小工具][Python爬虫]一键完整备份你的Csdn博客文章(支持Markdown,HTML,文中图片)

前言

一直想将自己的Csdn博客完整地备份到本地,以免一些老文章以后落得个404(打不开)的下场。

每家的博客或多或少都有一些博客备份的功能(例如简书在设置中能够打包自己的所有md文章,但是不支持图片导出)。

然而Csdn在这方面一直做的不够好,好几次想做备份,都想不到好的解决方案,无奈只能寻求Github的帮助。最近,在众多杂七杂八的库中,终于让我找到了一个接近完美的解决方案:CAB-Tool。

本工具出自他人之手,我只修复了一个小Bug,由于工具确实能够完整备份我的260+博客,没有出现账号异常或者是中途中断的情况,故诚心推荐给有需要之人,也希望大家可以完善工具,多提issue和pull request。

CAB-Tool

Github地址:

https://github.com/SnailMann/CAB-Tool

简介

摘自 README.md

CAB Tool 就是csdn-article-backp-tool,只是我有点懒,不想打这么长,还能顺便装的一手好逼 (狗头)

功能:

  • 支持批量备份markdown语法写的csdn博客
  • 支持备份博客图片(兼容markdown语法,html语法)
  • 支持两种使用方式,便于没有python基础的同学使用

注意:

  • 目前不支持备份私密文章,只能备份自己的公开文章
  • 需要登录账户密码(markdown编辑器的爬取需要cookies)
  • CAB Tool 直接爬取的是csdn markdown编辑器的文本,备份的文本与编辑器上无异

使用

方式一

如果你是没有任何python基础的同学,或是懒得安装py环境。没有关系,这里也是支持小白式运行的

  • 点击cab-tool releases,下载cabtool.exe的最新版本
  • 双击运行cabtool.exe就好啦

方式二

第一步

  • 把项目克隆本地git clone [email protected]:SnailMann/CAB-Tool.git
  • 确保本地有python3的环境, 并且可以使用pip安装依赖
  • 进入项目目录,命令行输入pip install -r requirements.txt,使用pip安装py项目的必要依赖

第二步

  • 打开setting.yaml配置文件
  • 按照yaml规范填写CSDN的账号密码
  • 按照yaml规范在download-path填写本地导出地址,不填默认为D:\csdn-blog-backup
  • 按照yaml规范在download-img填写是否开启图片备份 TrueFalse
  • 按照yaml规范在sleep-time填写备份文章的时间间隔,单位是s,默认是1s。若非有需要,不建议改动

第三步

  • 确认配置无误后
  • 项目路径打开命令行,输入py main.py

效果

在这里插入图片描述

在这里插入图片描述

完整备份了230+markdown:

在这里插入图片描述

后记

如果大家还发现什么好用的,好玩的工具,都可以推荐给我试试,哈哈哈哈。

关注我

我目前是一名后端开发工程师。主要关注后端开发,数据安全,网络爬虫,物联网,边缘计算等方向。

微信:yangzd1102

Github:@qqxx6661

个人博客:

原创博客主要内容

  • Java知识点复习全手册
  • Leetcode算法题解析
  • 剑指offer算法题解析
  • SpringCloud菜鸟入门实战系列
  • SpringBoot菜鸟入门实战系列
  • 爬虫相关技术文章
  • 后端开发相关技术文章

个人公众号:Rude3Knife

个人公众号:Rude3Knife

如果文章对你有帮助,不妨收藏起来并转发给您的朋友们~

发布了259 篇原创文章 · 获赞 136 · 访问量 38万+

猜你喜欢

转载自blog.csdn.net/qqxx6661/article/details/98473601