PDF文件格式学习笔记

参考该博客 博主 https://blog.csdn.net/steve_cui/article/details/81910632

https://blog.51cto.com/antivirusjo/2054410还有这个

PDF文件是一种编程形式的文档格式,它所有显示的内容,都是通过相应的操作符进行绘制的。
PDF文件是由对象集合组成的,包括:boolean(布尔型),numberic(数值型),string(字符串型),name(名字型),array(数组型),dictionary(字典型),stream(数据流型),null(空类型), indirect(间接型)。
在这里插入图片描述
文件头 ,也就是文件的第一行范围为%PDF -1.0到%PDF -1.8开头 每个pdf版本不同 遵循的规范不同
1.7最常见
PDF加密方式目前为三种:
1、口令加密
2、证书加密
3、Adobe LiveCycle Rights Management
Document Information(文档信息)字典,用来保存PDF在元数据中的文档信息的字典

Catalog文档目录:是一个字典,它引用定义PDF文件的其他对象。基本上,Catalog就像是可以找到有关PDF文件的每个信息的中心。作为字典,它由各种键组成。

页面树(page tree): 页面树是用于描述PDF文件中页面的结构的名称。它有两种类型的节点 - 页面树节点和页面对象。PDF文件中的每个页面都表示为Page对象。这些对象中的每一个在页面树中称为“叶子”节点。

PDF PageLabel 页面标签可用于描述页面的页码。允许非连续页面编号,可以看为页面添加任意标签(例如在文档的开头包含罗马数字)。PageLabel对象可用于指定要使用的编号样式(例如,大写或小写罗马,十进制等),第一页的起始编号以及要预先附加到的任意前缀每个数字(例如,“A-”生成“A-1”,“A-2”,“A-3”等。

又在百度上看见好东西 拷过来就完事了 奥利给
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述下面是一个最简单的pdf 创建txt写下以下内容 然后改为pdf

%PDF−1.4
1 0 obj
<< /Type /Catalog
/Outlines 2 0 R
/Pages 3 0 R
>>
endobj
2 0 obj
<< /Type /Outlines
/Count 0
>>
endobj
3 0 obj
<< /Type /Pages
/Kids [4 0 R]
/Count 1
>>
endobj
4 0 obj
<< /Type /Page
/Parent 3 0 R
/MediaBox [0 0 612 792]
/Contents 5 0 R
/Resources << /ProcSet 6 0 R
/Font << /F1 7 0 R >>
>>
>>
endobj
5 0 obj
<< /Length 73 >>
stream
BT
/F1 24 Tf
100 100 Td
(Hello World) Tj
ET
endstream
endobj
6 0 obj
[/PDF /Text]
endobj
7 0 obj
<< /Type /Font
/Subtype /Type1
/Name /F1
/BaseFont /Helvetica
/Encoding /MacRomanEncoding
>>
endobj
xref
0 8
0000000000 65535 f
0000000009 00000 n
0000000074 00000 n
0000000120 00000 n
0000000179 00000 n
0000000364 00000 n
0000000466 00000 n
0000000496 00000 n
trailer
<< /Size 8
/Root 1 0 R
>>
startxref
625
%%EOF

显示内容
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

未完待续

猜你喜欢

转载自blog.csdn.net/qq_43045569/article/details/104738117
今日推荐