简单爬虫获取博客园里的网页并转化成pdf文件 - 代码天地

简单爬虫获取博客园里的网页并转化成pdf文件

其他 2020-10-17 11:09:42 阅读次数: 0

import pdfkit
import requests
import os
url='https://www.cnblogs.com/yychuyu/p/13619923.html'
a=requests.get(url)
b=open(r'./良许Linux.html','w',encoding="utf-8")
b.write(a.text)
b.close()
# a=pdfkit.configuration(wkhtmltopdf="C:/Program Files/wkhtmltopdf/bin/wkhtmltopdf.exe")
try:
    if not os.path.exists('./良许Linux.pdf'):
         pdfkit.from_file('./良许Linux.html', './良许Linux.pdf')
    else:
        print("文件已存在！")
except:
    pass

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/liaoqingjian/article/details/108429721

简单爬虫获取博客园里的网页并转化成pdf文件

pdf转化成swf文件

MD格式的文件转化成PDF

office转化成PDF

html转化成PDF

java 获取小程序码并转化成base64传给客户端

小程序获取用户位置并转化成真实描述文字

使用js获取当前时间，并转化成数据库接受的时间格式

Gson使用google的JsonReader读取Json文件并转化成对象

网页转化成pdf，网页转换图片，wkhtmltopdf，wkhtmltoimage使用小结

将加密的pdf转化成word

js获取当前时间并转化成年月日时分秒格式

PPT怎么转化成PDF， PPT转PDF文件的方法是什么

Linux纯文本文件转化成为PDF文件格式

知网的caj格式怎么转化成pdf格式?两个方法简单快捷！

bag 包文件转化成pcd

读取本地文件转化成MultipartFile

将url转化成file文件

java 将cad文件转化成pdf或图片，实现在线预览

如何把HTML页面（带Iframe）页面转化成mht或pdf格式的文件？

需要获取二进制文件转化成文本文件的程序

ajax--将获取到的文件内的数据转化成json格式并使用---输入提示

Tips: JQuery 多元素选择并转化成数组

使用python读取csv并转化成list of list的方法

递归将字典嵌套排序并转化成字符串

python3提取mysql数据并转化成字典数组

提取tsv数据并转化成json——致找不出怎么提取tsv文件中数据的五小时

fastjson将jsonstr 转化成json 对象并获取数据

利用pandas实现json文件转化成csv文件

Android 学习笔记 - mdb文件转化成txt文件

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)