Skip to content
Back to Blog
format-comparisons

DOCX vs. DOC: Warum Microsoft den Wechsel vollzog

2026-05-17 8 min read

Ein Format, das 20 Jahre hielt – und warum das ein Problem war

Das .doc-Format, 1983 mit Word für DOS eingeführt, war über zwei Jahrzehnte lang das Standardformat von Microsoft für die Textverarbeitung. Als Office 2003 auf den Markt kam, waren .doc-Dateien einfach überall. Sie lagen auf Firmenservern, Regierungssystemen, Universitätsnetzwerken und natürlich auf heimischen Computern. Das Format funktionierte, schleppte aber ernsthaften Ballast aus seiner langen Geschichte mit sich. Das Kernproblem des Formats war seine Undurchsichtigkeit. Eine .doc-Datei ist ein proprietärer binärer Blob, eine Struktur, die nur Microsoft wirklich verstand. Das war ein Albtraum für Drittanbieter-Entwickler. Jeder, der Software entwickeln wollte, die .doc-Dateien lesen oder schreiben konnte, musste die Spezifikation per Reverse-Engineering nachbauen – ein mühsamer Prozess, der unweigerlich zu Kompatibilitätsfehlern, verstümmelten Formatierungen und Datenverlust führte. Jahrelang kämpften WordPerfect, LibreOffice und Google Docs einen aussichtslosen Kampf, um eine perfekte .doc-Kompatibilität zu erreichen. Die Sicherheit war ein weiteres großes Problem. Da .doc-Dateien leistungsstarke VBA-Makros in diesem undurchsichtigen Binärcontainer einbetten konnten, hatten Antiviren-Tools und E-Mail-Filter Schwierigkeiten, sie zuverlässig zu überprüfen. Dieser Designfehler trug dazu bei, die Makroviren-Ausbrüche der späten 1990er Jahre zu befeuern. Der Melissa-Virus von 1999, der schätzungsweise eine Million Computer infizierte, verbreitete sich so effektiv, weil es einfach war, seinen bösartigen Code in einem scheinbar harmlosen Dokument zu verstecken. Zu Beginn des neuen Jahrtausends wuchs der Druck. Regierungen und große Unternehmen, darunter die Europäische Kommission und mehrere US-Bundesbehörden, begannen öffentlich zu hinterfragen, ob proprietäre Binärformate für die langfristige Archivierung öffentlicher Dokumente geeignet seien. Microsoft brauchte eine glaubwürdige, offene Antwort.

Was DOCX unter der Haube wirklich ist

Als Microsoft mit Office 2007 das DOCX-Format einführte, war das nicht nur eine neue Endung für eine alte Datei. Es war eine komplette Neuerfindung, die auf einer Spezifikation namens Open Packaging Conventions (OPC) basierte, die wiederum auf ZIP-Kompression beruht. Das ist nicht nur eine Randnotiz – es ist der Schlüssel zum Verständnis, warum DOCX in jeder Hinsicht besser ist. Hier ist ein Trick: Nimm eine beliebige .docx-Datei, benenne sie so um, dass sie auf .zip endet, und öffne sie. Du wirst eine Standard-Ordnerstruktur sehen. Darin findest du XML-Dateien, ein _rels-Verzeichnis für die Beziehungszuordnungen und ein word/-Unterverzeichnis, das das eigentliche Dokument enthält. Der Haupttext befindet sich in word/document.xml. Formatvorlagen sind in word/styles.xml definiert. Bilder werden als separate Dateien in word/media/ gespeichert, und Metadaten wie Autor und Erstellungsdatum stehen in docProps/core.xml. Diese Architektur hat tiefgreifende praktische Vorteile. Das XML ist menschenlesbar, was bedeutet, dass ein Entwickler die document.xml in einem Texteditor öffnen und den Inhalt und die Struktur des Dokuments klar erkennen kann. Diese Transparenz machte es für Google, Apple, LibreOffice und unzählige andere Anbieter wesentlich einfacher, eine zuverlässige DOCX-Unterstützung zu entwickeln. Das war ein Wendepunkt für die Interoperabilität. Und weil Bilder und andere Inhalte als getrennte Dateien im ZIP-Container gespeichert sind, zerstört eine Beschädigung in einem Teil des Pakets nicht zwangsläufig das gesamte Dokument. Eine beschädigte .doc-Datei ist oft ein Totalverlust; eine beschädigte .docx-Datei lässt sich häufig von Hand reparieren. Die ZIP-Kompression selbst ist ebenfalls unglaublich effektiv. Ein Geschäftsbericht, der als .doc-Datei 450 KB groß ist, kann als .docx auf nur 180–220 KB schrumpfen. Für Organisationen, die Millionen von Dokumenten speichern, ist diese Reduzierung der Speicherkosten um über 50 % alles andere als trivial.

Der Kompatibilitäts-Übergang: Was Microsoft richtig und falsch gemacht hat

Microsoft wusste, dass sie keinen harten Schnitt erzwingen konnten. Office 2007 wurde mit einem Kompatibilitätspaket ausgeliefert, das es Nutzern von Office 2003 und XP ermöglichte, DOCX-Dateien zu öffnen und zu speichern. Das Unternehmen behielt .doc auch als „Speichern unter“-Option bei, und du findest die Auswahl „Word 97-2003-Dokument (.doc)“ auch heute noch in den neuesten Versionen von Microsoft 365. Trotzdem war der Übergang chaotisch. Organisationen, die Office 2003 auf Windows XP einsetzten – eine riesige Nutzerbasis im Jahr 2007 – mussten ihre IT-Abteilung dazu bringen, dieses Kompatibilitätspaket manuell zu installieren. E-Mail-Systeme in Unternehmen blockierten .docx-Anhänge als unbekannte Dateitypen, bis die Administratoren ihre Sicherheitsrichtlinien aktualisierten. Die ersten paar Jahre der DOCX-Einführung verursachten eine Menge Helpdesk-Tickets. Es gab auch echte Probleme mit der Feature-Parität. Einige alte .doc-Funktionen ließen sich einfach nicht sauber auf das neue OOXML-Schema abbilden. Komplexe Feldcodes, alte Zeichnungsobjekte (insbesondere die aus der VML-Zeichnungsebene) und Dokumente, die über viele Word-Versionen hinweg bearbeitet wurden, sammelten oft Formatierungsmarotten an, die nur unvollkommen konvertiert wurden. Jeder, der schon einmal eine alte .doc-Datei in einer modernen Word-Version geöffnet hat, kennt diesen gelben Kompatibilitätswarnbalken. Ein Klick auf Datei > Informationen > Konvertieren entfernt die Warnung, kann aber bei komplexen Layouts auch den Textfluss leicht verändern oder Tabellendimensionen durcheinanderbringen. Bei den meisten Dokumenten – einem durchschnittlichen Brief, Bericht oder Angebot – verläuft die Konvertierung nahtlos. Aber bei Dokumenten mit präzisen Seitenlayouts, die überlappende Textfelder und eingebettete alte Objekte enthalten, musst du die konvertierte Datei testen. Du kannst nicht einfach davon ausgehen, dass es geklappt hat.

Dateigröße, Korruptionsrisiko und Langzeitarchivierung

Der Größenvorteil von DOCX gegenüber DOC ist real, aber er variiert. Textlastige Dokumente werden massiv komprimiert. Bei Dokumenten, die hauptsächlich aus eingebetteten Bildern bestehen, ist der Effekt nicht so groß. Das liegt daran, dass JPEGs und PNGs bereits komprimiert sind, bevor sie überhaupt in den ZIP-Container gelangen. Ein 10-seitiger Bericht mit einem Diagramm kann von 380 KB (.doc) auf 160 KB (.docx) schrumpfen. Ein 10-seitiges Dokument mit 15 hochauflösenden Screenshots schrumpft möglicherweise nur von 8,2 MB auf 7,9 MB. Wie sie mit Beschädigungen umgehen, ist ein viel krasserer Unterschied. Da eine .doc-Datei ein einziger binärer Datenstrom ist, kann ein fehlerhafter Sektor auf einer Festplatte oder eine unterbrochene Netzwerkverbindung während des Speicherns die gesamte Datei unlesbar machen. Die eingebaute Wiederherstellungsfunktion von Word für .doc-Dateien ist ein reiner Rateversuch, der nach binären Mustern sucht, die er erkennt. Die Beschädigung einer DOCX-Datei hingegen ist granular. Word kann oft eine beschädigte .docx-Datei öffnen und den gesamten Text aus der document.xml wiederherstellen, selbst wenn die Bilder oder Formatvorlagen verloren sind. Du kannst sogar eine manuelle Reparatur versuchen, indem du die Datei als ZIP öffnest und das XML selbst herausholst. Aber für die Langzeitarchivierung, um das klarzustellen: Keines der beiden Formate ist die richtige Wahl. Der offizielle Standard für die Aufbewahrung von Dokumenten ist PDF/A (ISO 19005), das Schriften einbettet, aktive Inhalte entfernt und speziell für den zukunftssicheren Zugriff konzipiert ist. Wenn du Verträge, juristische Dokumente oder öffentliche Unterlagen archivierst, ist der korrekte Arbeitsablauf, sie in DOCX fertigzustellen und dann nach PDF/A zu exportieren. Man archiviert nicht das bearbeitbare Format. CocoConvert kann deine DOCX-zu-PDF-Konvertierungen übernehmen, aber bei Dokumenten mit komplexen Makros musst du diese Elemente zuerst in Word bereinigen, um ein sauberes Ergebnis zu erhalten.

Sicherheitsunterschiede, die wirklich zählen

Die meisten Leute glauben, DOCX sei von Natur aus sicherer als DOC. Sie haben nur zur Hälfte recht. Die Nuance ist hier wichtig. Der sichere Teil stimmt: Reguläre .docx-Dateien können keine VBA-Makros enthalten. Microsoft hat klugerweise eine separate, eindeutige Dateiendung, .docm, für makrofähige Dokumente geschaffen. Diese einfache Trennung macht es für E-Mail-Filter und Sicherheitssoftware trivial, Dateien zu identifizieren und zu blockieren, die ausführbaren Code enthalten könnten. Das war eine kluge Designentscheidung in der OOXML-Spezifikation. Aber DOCX-Dateien sind nicht völlig harmlos. Sie können externe Beziehungen enthalten – Links, die auf entfernte Ressourcen verweisen und diese beim Öffnen des Dokuments laden. Eine geschickt gestaltete .docx-Datei kann einen Verweis auf den Server eines Angreifers in ihrem _rels-Verzeichnis verstecken. Wenn ein Benutzer die Datei öffnet, kann Word eine ausgehende HTTP-Anfrage stellen und dabei potenziell die IP-Adresse und die Windows-Anmeldeinformationen des Benutzers über die NTLM-Authentifizierung preisgeben. Dieser Angriff, bekannt als Remote Template Injection, wurde in realen Kampagnen gegen hochrangige Ziele wie Journalisten und Aktivisten eingesetzt. Microsoft hat das Schlimmste davon mit Patches und seiner Funktion „Geschützte Ansicht“ gemildert, die heruntergeladene Dokumente in einer sicheren Sandbox öffnet. Der zugrunde liegende Mechanismus bleibt jedoch bestehen. Die Lektion ist einfach: Du solltest .docx-Dateien aus unbekannten Quellen weiterhin mit Misstrauen behandeln. Öffne sie in der Geschützten Ansicht oder, noch besser, konvertiere sie vor dem Teilen in PDF. Bei .doc-Dateien ist das Risiko noch höher, da das undurchsichtige Binärformat die Analyse erschwert und die Ausführung alter Makros eine bekannte Bedrohung darstellt.

Wann du immer noch mit DOC-Dateien arbeiten musst

Obwohl DOCX seit fast zwei Jahrzehnten der Standard ist, werden .doc-Dateien nicht verschwinden. Rechtsabteilungen haben oft riesige Bibliotheken mit Vorlagen im .doc-Format, weil ihre teuren Dokumentenmanagementsysteme – Plattformen wie iManage oder OpenText aus der Mitte der 2000er Jahre – dafür entwickelt und nie aktualisiert wurden. Einige Regierungsbehörden schreiben für behördliche Einreichungen immer noch .doc vor. Und wie jeder weiß, der schon einmal einen alten Server aufgeräumt hat, sammeln sich .doc-Dateien über die Jahre wie digitales Sediment an. Das Öffnen einer .doc-Datei in einer modernen Word-Version ist normalerweise problemlos. Word 2016, 2019, 2021 und Microsoft 365 kommen alle gut damit zurecht, auch wenn sie den Kompatibilitätsmodus-Banner anzeigen. LibreOffice Writer leistet ebenfalls gute Arbeit, kann aber bei Dokumenten mit komplexen nachverfolgten Änderungen von mehreren Autoren Schwierigkeiten haben. Die eigentliche Herausforderung ist die Stapelkonvertierung. Einen Ordner mit 200 .doc-Dateien aus dem Jahr 2004 in moderne .docx- oder PDF-Dateien umzuwandeln, kann Kopfschmerzen bereiten. Du könntest den Makro-Rekorder von Word verwenden, aber dafür musst du Word installiert haben und dich ein wenig mit VBA auskennen. Hier kommt ein Tool wie CocoConvert ins Spiel, das die Konvertierung von .doc zu DOCX und .doc zu PDF ohne eine lokale Office-Lizenz erledigt. Es ist perfekt für den Einsatz auf einem Linux-Server oder in einer gemischten Umgebung. Der einzige Haken sind die echten Grenzfälle: Dokumente mit aufwendigen VBA-Makros, eingebetteten OLE-Objekten wie uralten Excel-Diagrammen oder Revisionsverläufen, die bis zu Word 95 zurückreichen. Diese Dateien benötigen oft die ursprüngliche Word-Anwendung, um korrekt dargestellt zu werden.

Das richtige Format für deinen Workflow auswählen

Für die meisten Leute ist die Entscheidung einfach: Nutze .docx. Es ist der moderne Standard, der von jeder relevanten Textverarbeitung auf dem Planeten unterstützt wird. Seine offene XML-Struktur befreit dich von der Abhängigkeit vom proprietären Format eines einzigen Anbieters. Wenn du heute ein neues Dokument erstellst, gibt es absolut keinen guten Grund, es als .doc-Datei zu speichern. Die Wahl wird nur dann kompliziert, wenn du gezwungen bist, mit einem bestimmten Altsystem zu arbeiten. Wenn das E-Filing-System eines Gerichts ausdrücklich .doc verlangt, dann speicherst du als .doc. Wenn das Dokumentenmanagementsystem deines Unternehmens bekannte Fehler bei nachverfolgten Änderungen in DOCX hat, dann bleibst du bei dem, was funktioniert, bis es behoben ist. Das Format, das du wählst, wird davon bestimmt, wohin die Datei geht, nicht nur von deiner persönlichen Vorliebe. Denk bei der Konvertierung zwischen Formaten daran, dass die Komplexität des Dokuments der größte Faktor ist. Ein einfaches Anschreiben oder ein einseitiges Memo wird fehlerfrei konvertiert. Ein komplexer 50-seitiger Bericht mit verschachtelten Tabellen, benutzerdefinierten Formatvorlagen, die auf anderen benutzerdefinierten Vorlagen basieren, und einer Menagerie von Zeichnungsobjekten ist weitaus fragiler. Vertrau mir bei diesem Punkt: Öffne immer die konvertierte Datei und scrolle komplett durch, bevor du sie an jemanden Wichtiges schickst. Letztendlich, wenn dein Ziel die endgültige Verteilung ist, solltest du die DOC-vs.-DOCX-Debatte komplett umgehen und PDF verwenden. Ein PDF bewahrt dein Layout perfekt, ist auf jedem Gerät anzeigbar und ist das, was deine Empfänger für ein fertiges Dokument tatsächlich wollen. Der beste Workflow ist klar: Behalte deine bearbeitbare Masterkopie in DOCX, verteile die endgültige Version als PDF und konvertiere nur dann zwischen bearbeitbaren Formaten, wenn ein bestimmtes System dich dazu zwingt.