用Ghostscript合并PDF

这个需求的场景是需要将多个 PDF 合并成一个,并且加上目录。

核心命令

其中 $TOC 是目录文件。某些情况下,pdfwrite 无法正常生产 PDF,可以用 ps2write 先生成 ps 文件,再转换成 PDF:

目录

pdfmark 目录的基本结构如下:

  • /Title 表示标题名称,如果含空格,应用括号括起来
  • /Count 标题下的分支数目,若无分支,则为 0。若大于 0,则此标题下对应数量的标题会被视为此标题的子标题
  • /Page 表示页码
  • /OUT 输出格式

以上 Title 分别为 第一章 .. 第五章。需要注意的是中文标题需要带有 BOM 的 UTF-16BE 编码,在 Python 中,核心代码如下:

PDF合法性判断

通过 pdfinfo 来判断是否是合法的 PDF。

参考资料

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注