【python】打卡学习第四天-pdfplumber模块


活动地址:CSDN21天学习挑战赛

学习的最大理由是想摆脱平庸,早一天就多一份人生的精彩;迟一天就多一天平庸的困扰。各位小伙伴,如果您:
想系统/深入学习某技术知识点…
一个人摸索学习很难坚持,想组团高效学习…
想写博客但无从下手,急需写作干货注入能量…
热爱写作,愿意让自己成为更好的人…

欢迎参与CSDN学习挑战赛,成为更好的自己,请参考活动中各位优质专栏博主的免费高质量专栏资源(这部分优质资源是活动限时免费开放喔~),按照自身的学习领域和学习进度学习并记录自己的学习过程。您可以从以下3个方面任选其一着手(不强制),或者按照自己的理解发布专栏学习作品,参考如下:

**

学习日记

**
1,学习知识点

pdfplumber块

metadata和pages

2,学习遇到的问题

api没接触过

3,学习的收获

pdfplumber块的api使用

4,实操

pages类

属性

page_number:页码

width:页面宽度

height:页面高度

objects/charts/lines/rects/curves/figures/images:各种pdf对象

方法

extract_text:全文本

extract_words:全单词

extract_tables:页面表格

to_image:可视化观察

close:处理缓存

模块api相关

  1. pdfplumber.metadata
  2. pdfplumber.pages

速记:s记为string,将数据转换为字符串的方法。

猜你喜欢

转载自blog.csdn.net/qq_34217861/article/details/126294938