PDF学习四:词法

说明:

本文介绍PDF词法基本概念,目标是需要大家掌握PDF中词法基本概念。

Token:

标记或记号。由常规字符组成。一个或多个tokens组合成更高级的语法实体,对象。

例如:Sum=3+2

字符集 Character Set

  1. 常规字符 regular

除了空格符和分隔符,其他所有的字符都是指常规字符。这些字符包括 ASCII 字符集外的 8 位二进制字符。

注意:PDF 有区分大小写的。大写字母跟小写字母被看成是不同。

2. 分隔符 delimiter

分隔符(, ), <, >, [, ], {, }, /,和  %  是特殊符。它们将各个语法实体划分成诸如串,数组,名称,和注释等等。这些字符终止前面的实体同时又不属于这个实体。

3. 空格符 white-space

空格符隔开语法结构,例如将名称和数字分开 /Font1 1 0 R

所有的空格符的解析是相同的。(这些空格符并不在注释,字符串和流中)

回车和行末填充符也被称作是换行符,被看作是行末标识(EOL)。回车符和行末填充符的组合被看成是一个行末标识。

4. 注释 Comments

以百分号(%)开头出现在串和流以外称为注释。

注释由百分号和行末字符(EOL)之间的所有字符组成,包含常规字符,分隔符,空格和Tab字符。PDF忽略注释,将他们看作是简单的空格字符。

一个注解把位于它前后的Token(标识)分隔开;如下PDF片段:

abc% comment { /% ) blah blah blah

123 在语法意义上标识abc和123是等同的。

注释没有任何意义(除了%PDF-n.m和%%EOF表示文件头和尾)。PDF应用程序不需要在编辑PDF文件时保存注释。

微信公众号关注


猜你喜欢

转载自blog.csdn.net/u012632138/article/details/80772799