Skip to content
Back to Blog
format-comparisons

PDF vs. DOCX: Welches Format zur Archivierung?

2026-05-17 9 min read

Die Frage ist komplizierter, als sie aussieht

Archivierung scheint einfach. Ein Format auswählen, die Datei speichern, fertig. Aber bei echter Archivierung geht es nicht nur darum, Bytes zu speichern. Es geht darum zu garantieren, dass ein Dokument in zehn, zwanzig oder fünfzig Jahren von einem Menschen oder einer Maschine geöffnet, gelesen und verstanden werden kann. PDF und DOCX sind allgegenwärtig, werden weithin unterstützt und sind beide für die Langzeitspeicherung auf eine Weise mit gravierenden Mängeln behaftet, über die nur selten gesprochen wird. Die Wahl zwischen ihnen läuft darauf hinaus, was du eigentlich bewahren willst: das endgültige, unveränderliche Aussehen eines Dokuments oder seinen editierbaren Inhalt und seine Struktur. Das sind grundlegend verschiedene Ziele. Sie zu verwechseln ist die Ursache der meisten Archivierungskatastrophen. Ein rechtsgültiger Vertrag, ein veröffentlichter Bericht, eine gescannte Rechnung und ein Manuskriptentwurf haben alle unterschiedliche Anforderungen. Bevor du einfach im Standardformat deiner Software speicherst, musst du verstehen, was jedes Format tatsächlich bewahrt, was es verwirft und was die Profis empfehlen.

Was PDF wirklich bewahrt (und was nicht)

1993 entwickelte Adobe das PDF, um ein Problem zu lösen: Wie kann man ein Dokument versenden und garantieren, dass es auf jedem Bildschirm exakt gleich aussieht. Dieses Problem wurde brillant gelöst. Ein PDF bettet Schriftarten ein, fixiert die Seitengeometrie und legt Farben geräteunabhängig fest. Jeder, der schon einmal mit einem streikenden Drucker oder einem verpfuschten PowerPoint-Export zu kämpfen hatte, weiß, wie wertvoll das ist. Öffne ein gut gemachtes PDF aus dem Jahr 1999 in einem Browser von 2025, und es wird genauso aussehen. Diese visuelle Treue ist der Grund, warum Gerichte, Regierungen und Verlage es übernommen haben. Aber es gibt einen Haken: Nicht alle PDFs sind gleich. Ein schneller Export aus Word ist meilenweit von einer für die Archivierung erstellten PDF/A-1b-Datei entfernt. Die PDF/A-Familie – ein ISO-Standard (19005) – ist eine strengere Untergruppe von PDF. Sie verbietet Funktionen, die langfristige Abhängigkeiten schaffen, wie eingebettetes JavaScript, Verschlüsselung, externe Schriftarten-Links und komplexe Transparenz. Wenn du Adobe Acrobat Pro hast, versuch mal, ein schickes Marketing-PDF als PDF/A zu speichern. Der Validierungsprozess wird wahrscheinlich Dutzende von Fehlern melden. Der grundlegende Kompromiss ist folgender: PDF bewahrt das Aussehen, nicht die Bedeutung. Eine Tabelle in einem PDF ist oft nur eine Ansammlung von Textfragmenten, die auf einem Raster positioniert sind. Ein Screenreader oder ein Data-Scraping-Tool sieht Kauderwelsch, keine Zeilen und Spalten. Für Barrierefreiheit oder Datenextraktion ist ein einfaches PDF eine Sackgasse. Spätere Standards wie PDF/A-2a und PDF/A-3a versuchen dies durch Hinzufügen einer getaggten Struktur zu beheben, aber die Erstellung eines korrekt getaggten, barrierefreien PDFs erfordert ernsthafte, bewusste Anstrengung. Das passiert nie zufällig.

Was DOCX wirklich bewahrt (und was nicht)

DOCX ist ein XML-basiertes Format, standardisiert als ECMA-376 und ISO/IEC 29500, das Dokumenteninhalte als strukturiertes Markup in einem ZIP-Container speichert. Auf dem Papier klingt das perfekt für die Archivierung – offene Standards, reines XML, kein geheimer Binärcode. In der Realität ist es ein Chaos. DOCX ist großartig darin, die semantische Struktur zu bewahren, die PDF auslöscht. Es kennt den Unterschied zwischen dem Stil 'Überschrift 2' und einfach nur großem, fettgedrucktem Text. Es bewahrt Tabellenstrukturen, nachverfolgte Änderungen, Kommentare und Metadaten. Diese strukturellen Informationen sind unglaublich wertvoll für Barrierefreiheit und Datenverarbeitung. Das Problem ist die Komplexität. Die ECMA-376-Spezifikation ist über 6.000 Seiten lang. Eine 6.000-seitige Spezifikation ist kein klarer Standard; sie ist eine offene Einladung für unterschiedliche Interpretationen. Folglich implementieren keine zwei Anwendungen sie identisch. Eine in Word 2019 erstellte DOCX-Datei wird in LibreOffice 7.6, Google Docs oder sogar Word 2013 anders dargestellt. Komplexe Funktionen wie SmartArt, einige Gleichungen oder benutzerdefinierte XML-Bindungen gehen oft kaputt oder verschwinden, wenn du das Microsoft-Ökosystem verlässt. Dann gibt es da noch das Schriftartenproblem. Wenn dein DOCX eine Schriftart wie Calibri verwendet und die Maschine, die es im Jahr 2077 öffnet, diese nicht hat, wird das gesamte Dokumentenlayout neu umbrochen. Zeilenumbrüche verschieben sich, Seitenzahlen ändern sich und im Text verankerte Bilder wandern. DOCX hat keinen zuverlässigen Mechanismus zum Einbetten von Schriftarten, wie es PDF hat. Also, was ist das Fazit? Es ist ein fantastisches Format, um editierbare Inhalte und Strukturen zu bewahren. Es ist ein Glücksspiel, wenn es darum geht, das visuelle Layout zu erhalten.

Was Archivierungsstandards tatsächlich empfehlen

Im Zweifelsfall schau dir an, was die Profis machen. Mehrere große Archiveinrichtungen haben hierzu klare Leitlinien veröffentlicht. Das Programm 'Sustainability of Digital Formats' der Library of Congress gibt PDF/A-1 eine hohe Nachhaltigkeitsbewertung und lobt die ISO-Standardisierung und die in sich geschlossene Natur des Formats. DOCX erhält eine 'mäßige' Bewertung, wobei explizit auf die Abhängigkeit von Schriftarten und die Komplexität der Spezifikation als Risiken hingewiesen wird. Das Nationalarchiv des Vereinigten Königreichs (The National Archives of the United Kingdom) ist noch direkter: PDF/A für abgeschlossene Unterlagen verwenden und DOCX für Unterlagen akzeptieren, die editierbar bleiben müssen. Die Vorschriften der US-Regierung zur Aktenverwaltung (36 CFR Part 1236) verweisen ebenfalls auf PDF/A für dauerhafte elektronische Unterlagen. Der Konsens ist eindeutig: Wenn du ein fertiggestelltes Dokument wie einen unterzeichneten Vertrag, einen veröffentlichten Bericht oder ein ausgefülltes Formular archivierst, ist PDF/A die einzig professionell vertretbare Wahl. Wenn du ein Arbeitsdokument wie eine Richtlinienvorlage oder ein Manuskript in Überarbeitung archivierst, ist DOCX sinnvoller, aber es ist ratsam, es mit einem Plain-Text- oder HTML-Export als Backup zu kombinieren. Einige Institutionen machen beides: Sie archivieren ein PDF/A für die offizielle Aufzeichnung und ein DOCX als Arbeitskopie. Das ist nicht redundant; es ist einfach bewährte Praxis und dient zwei unterschiedlichen, aber gleich wichtigen Zwecken. Das absolut Schlimmste, was du tun kannst – und das ist in kleineren Organisationen üblich – ist, Standard-PDFs (nicht PDF/A) oder undokumentierte DOCX-Dateien zu archivieren und einfach auf das Beste zu hoffen. Ohne die Strenge des PDF/A-Standards ist die Langlebigkeit eine Vermutung, keine Garantie.

Konvertieren zwischen Formaten: Wo CocoConvert ins Spiel kommt

Wie passt CocoConvert also in diesen Archivierungsworkflow? Wir kümmern uns sowohl um die Konvertierung von DOCX zu PDF als auch von PDF zu DOCX, aber es ist wichtig, genau zu sagen, was unsere Tools tun. Wenn du auf unserer Plattform ein DOCX in ein PDF umwandelst, erhältst du ein Standard-PDF. Das visuelle Layout wird wunderbar beibehalten – Schriftarten, Abstände, Tabellen und Bilder werden alle übernommen. Allerdings ist die Ausgabedatei nicht automatisch eine PDF/A-konforme Datei. Um das klarzustellen: Wir bieten derzeit keine PDF/A-Zertifizierung als Teil der Konvertierung an. Wenn du eine zertifizierte PDF/A-1b- oder PDF/A-2a-Datei für die formelle Archivierung benötigst, musst du einen zusätzlichen Schritt machen. Du musst die Ausgabedatei mit einem Tool wie Adobe Acrobat Pro (Datei > Speichern unter > PDF für Archivierung) oder dem Open-Source-Validator VeraPDF validieren und konvertieren. Für viele tägliche Aufgaben, wie das Teilen eines Berichts mit einem Kunden, ist ein Standard-PDF völlig ausreichend. Für die regulierte Archivierung ist dieser zusätzliche Konformitätsschritt nicht verhandelbar. Die andere Richtung, von PDF zu DOCX, ist der knifflige Teil. CocoConvert verwendet fortschrittliche optische Zeichenerkennung (OCR) und Layoutanalyse, um ein strukturiertes Dokument wiederherzustellen. Die Ergebnisse hängen vollständig von der Quelldatei ab. Ein sauberes, textbasiertes PDF, das aus Word erstellt wurde, lässt sich ziemlich gut in ein DOCX zurückkonvertieren, wobei Überschriften, Absätze und Tabellen intakt bleiben. Aber ein gescanntes Dokument, ein PDF mit komplexen Spalten oder eines mit interaktiven Formularen wird ein DOCX erzeugen, das erhebliche manuelle Nachbearbeitung erfordert. Das ist kein Problem von CocoConvert, es ist ein Problem des PDF-Formats. Es spiegelt den fundamentalen Informationsverlust wider, der auftritt, wenn ein Dokument für die Darstellung als PDF vereinfacht wird. Kein Konverter kann auf magische Weise eine Struktur wiederherstellen, die das PDF-Format selbst verworfen hat.

Praktischer Entscheidungsrahmen: Welches Format für welche Situation

Vergiss die Theorie. Hier ist ein praktischer Leitfaden, um das richtige Format für die richtige Aufgabe zu wählen. Für Rechts- und Compliance-Dokumente – Verträge, behördliche Einreichungen, Gerichtsdokumente – verwende PDF/A-1b oder PDF/A-2b. Das ist nicht verhandelbar. Diese Dokumente müssen unveränderlich und visuell fixiert sein. In Word, nutze Datei > Exportieren > PDF/XPS-Dokument erstellen und aktiviere in den Optionen das Kontrollkästchen 'ISO 19005-1-kompatibel (PDF/A)'. Validiere dann die Ausgabedatei mit einem Tool wie VeraPDF, bevor du sie ablegst. Für interne Arbeitsdokumente – Richtlinienentwürfe, Verfahrenshandbücher, Vorlagen – behalte das DOCX als primäres Archivformat, aber exportiere bei jeder Hauptversion einen PDF-Snapshot und speichere beides. Verwende ISO-8601-Datumsangaben in deinen Dateinamen (z. B. `policy-draft-2026-05-17.docx`). Das macht deine Versionshistorie klar und unabhängig von anfälligen Dateisystem-Metadaten. Für gescannte Papierdokumente – Rechnungen, historische Briefe, ausgefüllte Papierformulare – ist PDF/A mit einer eingebetteten OCR-Textebene die richtige Wahl. Das Bild wird exakt erhalten, und die OCR-Ebene macht den Inhalt durchsuchbar, ohne die visuelle Aufzeichnung zu verändern. Für Forschungsdaten oder strukturierte Inhalte – Tabellenkalkulationen, Datenbanken, Datensätze – ist weder PDF noch DOCX das richtige primäre Format. Das ist eine häufige Falle. Du brauchst CSV, XML oder JSON, zusammen mit einem Datenwörterbuch, das die Felder erklärt. Ein PDF oder DOCX kann eine für Menschen lesbare Zusammenfassung sein, aber es darf nicht die einzige Archivkopie sein. Zuletzt noch ein Wort zur Dateigröße. Ein DOCX mit vielen eingebetteten Bildern kann leicht 50–100 MB erreichen. Ein PDF desselben Dokuments mit Komprimierung ist vielleicht nur 8–15 MB groß. Bei Archiven mit hohem Volumen summiert sich dieser Unterschied schnell. PDF/A erlaubt Komprimierung, einschließlich JPEG 2000 unter dem PDF/A-2-Standard.

Das ehrliche Fazit

Hier ist das ehrliche Fazit. Für die Archivierung von finalisierten Dokumenten gewinnt PDF/A. Nicht weil PDF ein perfektes Format ist, sondern weil der PDF/A-Standard von Grund auf entwickelt wurde, um das Archivierungsproblem zu lösen. Es hat sich in dreißig Jahren bei Institutionen durchgesetzt. Gerichte akzeptieren es, Nationalarchive schreiben es vor, und der ISO-Standard bietet ein klares, eindeutiges Ziel für die Konformität. DOCX ist die richtige Wahl, wenn du Editierbarkeit und semantische Struktur benötigst und bereit bist zu akzeptieren, dass die visuelle Darstellung sich im Laufe der Zeit und zwischen verschiedenen Anwendungen verschieben kann. Das schlimmstmögliche Ergebnis ist, die Archivierung als Nebensache zu behandeln. Einfach ein Standard-PDF ohne PDF/A-Konformität oder ein DOCX zu speichern, ohne zu notieren, welche Software es erstellt hat, und einfach anzunehmen, dass es 2046 noch lesbar sein wird, ist ein Rezept für das Scheitern. Formate altern. Software verschwindet. Der wichtigste Teil deines Archivs ist vielleicht nicht die Datei selbst, sondern die Metadaten, die du miterfasst: Erstellungsdatum, Softwareversion, Autor, Revisionsverlauf. Egal, welches Format du wählst, füge eine einfache README-Datei hinzu. Dokumentiere, was die Datei ist, wann du sie erstellt hast und welches Tool du verwendet hast. Diese fünf Minuten Arbeit heute können dir oder einem zukünftigen Archivar tagelanges Kopfzerbrechen ersparen. Unser Ziel bei CocoConvert ist es, den Schritt der Dateikonvertierung schnell und zuverlässig zu erledigen. Aber die entscheidenden letzten Schritte – die Validierung der Konformität und die Dokumentation der Metadaten – liegen bei dir. Wir finden es besser, das klar zu sagen, als zu viel zu versprechen, was ein Konvertierungstool allein leisten kann.