Skip to content
Back to Blog
device-usecase-privacy

PDF/A 与 PDF 在法律文件中的应用:到底该用哪一个?

2026-05-17 9 min read

PDF 与 PDF/A 的核心区别

标准的 PDF 是一个灵活的容器。它可以嵌入 JavaScript、链接到外部资源、播放多媒体,甚至可以引用托管在远程服务器上的字体。虽然这种灵活性对于交互式演示文稿来说非常棒,但对于法律文件而言,却是一个巨大的隐患。一份依赖外部字体服务器的 PDF,十年后当软件环境发生变化时,可能看起来会完全不同,甚至根本无法打开。 PDF/A 是 PDF 的一个 ISO 标准化子集,专为一件事而设计:长期归档。这里的“A”字面意思就是“Archive”(存档)。它最初于 2005 年作为 ISO 19005-1 发布,后来通过 ISO 19005-2 (PDF/A-2, 2011) 和 ISO 19005-3 (PDF/A-3, 2012) 进行了更新。其核心要求是绝对的自包含性。完美渲染文档所需的每一种字体、颜色配置文件和元数据都必须嵌入文件内部。不允许有任何外部依赖。没有例外。 这意味着 PDF/A 文件被剥离了某些功能。它不能包含 JavaScript,不能链接到外部 URL 来获取资源,不能使用会阻止文件打开的加密方式,并且必须包含嵌入的 ICC 颜色配置文件。文件还必须包含 XMP 元数据——一个结构化的 XML 块,用以标识其符合 PDF/A 标准并说明其符合哪个一致性级别。如果违反了这些规则中的任何一条,无论文件名怎么说,这个文件都不是一个有效的 PDF/A。 对于一家律师事务所来说,一份需要在 2045 年仍能被检索和阅读的合同,这种自包含性的要求并非官僚主义的繁文缛节——这正是其全部意义所在。

你所在的司法管辖区到底要求哪个 PDF/A 级别?

PDF/A 并不是单一的格式。它有三个主要版本,前两个版本(PDF/A-1 和 PDF/A-2)又分为不同的一致性级别:“a”代表可访问(accessible),“b”代表基本(basic)。PDF/A-3 增加了一个用于 Unicode 的“u”级别。向法院或监管机构提交错误的一致性级别可能会导致你的文件被驳回,所以你需要知道他们期望的是哪一种。 PDF/A-1b 是法律文件提交中最常见的要求。它保证了文档的视觉外观在任何兼容的查看器中都能得到保留。但是,它不要求有可访问性标签或逻辑阅读顺序。要实现这些,你需要 PDF/A-1a,该级别强制要求完整的标签、明确的阅读顺序和正确的 Unicode 映射,以使文档完全可搜索。 那么法院到底要求什么呢?使用 CM/ECF 系统的美国联邦法院通常接受标准 PDF,但对某些文件越来越多地要求使用 PDF/A。在欧洲,人权法院自 2014 年起就要求使用 PDF/A-1b。德国的电子司法系统(ERV)则强制要求提交的文件为 PDF/A-2b。英国的法院服务机构推荐使用 PDF/A,但尚未为所有文件类型确定统一的标准。 在转换任何文件之前,请查阅你所在司法管辖区的具体技术要求。法院网站通常会在“电子文件提交要求”或“执业指引”等标题下公布这些规则。如果不确定,就默认使用 PDF/A-1b。它的软件支持最广泛,历史记录也最长,如果你找不到具体规定,这是最稳妥的选择。

转换法律文件为 PDF/A 时的常见陷阱

转换过程充满了陷阱,这些陷阱会悄无声息地创建一个看起来像 PDF/A 但实际上无法通过验证的文件。知道去哪里找这些问题是你在提交前发现它们的关键。 字体嵌入是头号元凶。任何与 Word 文档打过交道的人都知道,它喜欢引用像 Calibri 这样的系统字体,但并不会真正嵌入它们。当你从 Word 导出为 PDF 时,文件可能嵌入字体,也可能没有。诀窍是前往“文件 > 导出 > 创建 PDF/XPS”,点击“选项”,然后勾选“符合 ISO 19005-1 (PDF/A)”的复选框。这会告诉 Word 嵌入字体并禁用不兼容的功能。对于简单的文档,这通常能行得通,但如果你使用了自定义字体,而该字体的许可证禁止嵌入,你可能还是会遇到麻烦。 透明度效果是另一个常见的麻烦。最初的 PDF/A-1 标准完全不允许透明度。如果你的文档中有一个带透明背景的徽标,一个简单的转换要么会失败,要么会以可能改变文档外观的方式将图像拼合。这也是许多从业者转向支持透明度的 PDF/A-2 的一个重要原因。 颜色配置文件可能导致细微但致命的验证失败。一个有效的 PDF/A 需要为所有颜色内容嵌入 ICC 颜色配置文件。一个使用 RGB 颜色但没有 sRGB 配置文件的文档会自动验证失败。大多数现代转换工具都能处理这个问题,但如果你在使用像 Ghostscript 这样的命令行工具,你必须使用类似“-sColorConversionStrategy=sRGB”这样的标志来明确设置输出配置文件。 最后,加密是绝对的禁忌。PDF/A 禁止任何限制打开或阅读文件的加密。如果你的源文件受密码保护,你必须在开始转换之前就移除该保护。

CocoConvert 如何处理 PDF/A 转换——及其局限性

CocoConvert 支持将 Word (.docx)、Excel (.xlsx)、PowerPoint (.pptx) 等常见格式以及 JPEG、PNG 和 TIFF 等图像转换为 PDF/A-1b 和 PDF/A-2b。我们的处理流程旨在自动处理字体嵌入、颜色配置文件注入和 XMP 元数据标记。对于一个使用系统字体的标准 Word 合同,生成的文件通常能顺利通过验证。 但在将其用于关键的法庭文件之前,你需要了解这个工具的局限性。最重要的限制是,CocoConvert 目前不会验证自己的输出。它执行转换,但不会进行最终的一致性检查。你必须始终使用像 veraPDF 或 Adobe Acrobat Pro 的印前检查(Preflight)这样的独立工具来亲自验证输出文件。千万不要跳过这一步。我是说真的。 第二个问题出现在处理复杂文档时。CocoConvert 可能会在处理包含 Word OLE 对象或有严格嵌入限制的字体文件时遇到困难。在这些情况下,转换可能在技术上成功了,但生成的 PDF/A 可能会替换字体,从而改变文档的外观。对于法律工作来说,任何视觉上的改变都是一个潜在的问题。 CocoConvert 目前还不支持 PDF/A-3。这个版本允许嵌入其他文件,比如像 ZUGFeRD 这样的电子发票标准中使用的 XML 数据。如果你所在的司法管辖区要求使用 PDF/A-3,你需要使用其他工具,比如 Adobe Acrobat Pro。 对于将标准合同和信函常规转换为 PDF/A-1b 或 PDF/A-2b,CocoConvert 是一个快速有效的选择。但对于复杂的诉讼文件或有非常具体技术规则的提交,可以将我们的输出作为初稿,但在提交前务必进行严格验证。

转换机密法律文件时的隐私考量

法律文件充满了特权通信、个人数据和商业机密。将它们上传到任何在线服务(包括 CocoConvert)都需要对隐私风险进行清醒的评估。 CocoConvert 在我们的服务器上处理你的文件,然后将其删除。转换后文件的下载链接在 24 小时后失效,之后文件将从我们的存储中被永久清除。所有数据都通过加密连接(TLS 1.2 或更高版本)传输。对于一个信誉良好的在线服务来说,这些都是可靠的标准做法。 即使有这些措施,有些文件也绝不应该接触第三方在线服务。律师-客户特权通信、受保护令约束的文件、密封的法庭文件,以及受 GDPR 或 HIPAA 约束的数据,都不适合进行在线转换,除非你的律所与服务提供商签订了特定的数据处理协议(DPA)。CocoConvert 目前不提供 DPA,这使得它不适合处理受欧盟 GDPR 监管的个人数据。 对于这些高度敏感的文件,唯一负责任的方法是在你自己的机器上进行本地转换。Adobe Acrobat Pro 可以直接保存为 PDF/A-1b 或 PDF/A-2b。LibreOffice(7.x 及以上版本)通过其“导出为 PDF”对话框提供了一种免费的实现方式。即使是 Microsoft Word 365 也可以使用 ISO 合规选项导出为 PDF/A-1b。 隐私风险并非只是理论上的。2023 年,几家律师事务所就因为使用了一些会将上传内容保留用于模型训练的 AI 文档工具而惹上了麻烦。在上传任何客户文件之前,务必阅读任何工具的服务条款和隐私政策。

在提交前验证 PDF/A 合规性

创建一个你*认为*是 PDF/A 的文件,和创建一个真正能通过验证的文件是两码事。任何曾盯着法庭文件提交系统发来的神秘拒收通知的人都懂这种痛苦。这些系统越来越多地使用自动验证器,它们会退回不合规的文件,而且常常不解释问题出在哪里。 因此,你需要一个可靠的验证工具。黄金标准是 veraPDF。它免费、开源,由 PDF 协会和开放保存基金会维护。你可以作为桌面应用运行,也可以从命令行运行。一个简单的命令,如“verapdf --flavour 1b your-document.pdf”,就会生成一份详细的报告,指出每一条失败的规则及其对应的 ISO 条款编号。这能准确地告诉你需要修复什么。 Adobe Acrobat Pro 的印前检查(Preflight)工具是业界的另一个重量级选手。打开文档,进入“工具 > 印刷制作 > 印前检查”,然后选择正确的 PDF/A 配置文件来运行检查。Acrobat 会给你一个错误和警告列表,比如“字体未嵌入”或“PDF/A-1 中不允许透明度”——这些都是关于如何在源文档中修复问题的明确指示。 这是我给所有律师事务所的硬性建议:将验证作为你们文件提交流程中的强制步骤。在律师助理或助手将任何文件发送给法院之前,他们必须用 veraPDF 运行一遍并记录结果。这只需要 30 秒,却能让你免去绝大多数的拒收和合规性麻烦。 如果文件验证失败,不要只是重新导出然后指望好运。那只会让你白费功夫,头疼不已。找出具体的失败原因,修复源文件,重新转换,然后再次验证。

按文件类型划分的实用建议

不要把所有法律文件都一视同仁,那样既浪费时间又浪费精力。为正确的工作使用正确的格式会更有效率。这里有一份实用指南。 对于需要长期保存的合同和协议(比如七年或更久),使用 PDF/A-1b 或 PDF/A-2b。如果文档有透明度效果或来自现代设计程序,选择 PDF/A-2b。在归档文件之前,务必对其进行验证。 对于法庭文件,你必须遵守该法院文件提交系统的具体技术规则。查看美国联邦法院的本地规则;有些仍然接受标准 PDF,而另一些则要求 PDF/A。对于大多数欧洲法院,除非另有说明,PDF/A-1b 是最稳妥的选择。 证据开示文件是一个特例,通常由双方商定的 ESI(电子存储信息)协议来规定。该协议可能会指定可搜索的 PDF、PDF/A,甚至是原生格式。严格遵守协议。如果协议要求你提供原生文件,就不要转换为 PDF/A。 内部文件,如合同草稿、备忘录和研究笔记,不需要是 PDF/A 格式。标准 PDF 完全够用。实际上,默认将所有东西都转换为 PDF/A 是个坏主意。这会使文件变大(因为嵌入了资源),并且会去除一些你可能希望在内部草稿中使用的有用功能,比如密码保护。 用作证据的扫描文件需要一个文本层才能被搜索。这意味着在转换之前或期间需要运行 OCR。CocoConvert 可以对扫描的 PDF 进行 OCR,但对于关键证据,你必须验证 OCR 的输出。自动 OCR 并不完美;在清晰的扫描件上,它可能有 1-3% 的字符错误率,而在质量差的副本上,错误率会高得多。在提交前,务必审阅文本层。