Skip to content
Back to Blog
format-comparisons

DOCX vs DOC : Pourquoi Microsoft a fait la transition

2026-05-17 8 min read

Un format qui a duré 20 ans — et pourquoi c'était un problème

Le format .doc, introduit avec Word pour DOS en 1983, a été le format de traitement de texte par défaut de Microsoft pendant plus de deux décennies. À l'époque d'Office 2003, les fichiers .doc étaient absolument partout. On les trouvait sur les serveurs d'entreprise, les systèmes gouvernementaux, les réseaux universitaires et, bien sûr, les ordinateurs personnels. Le format fonctionnait, mais il traînait un lourd héritage de sa longue histoire. Le principal problème du format était son opacité. Un fichier .doc est un « blob » binaire propriétaire, une structure que seul Microsoft comprenait vraiment. Cela a créé un cauchemar pour les développeurs tiers. Quiconque voulait créer un logiciel capable de lire ou d'écrire des fichiers .doc devait faire de la rétro-ingénierie sur la spécification, un processus pénible qui menait inévitablement à des bugs de compatibilité, des mises en forme brouillées et des pertes de données. Pendant des années, WordPerfect, LibreOffice et Google Docs se sont tous battus en vain pour atteindre une fidélité parfaite avec le .doc. La sécurité était un autre problème majeur. Comme les fichiers .doc pouvaient intégrer de puissantes macros VBA à l'intérieur de ce conteneur binaire opaque, les antivirus et les filtres d'e-mails peinaient à les inspecter de manière fiable. Cette faille de conception a contribué à alimenter les épidémies de virus macro de la fin des années 1990. Le virus Melissa en 1999, qui a infecté environ un million d'ordinateurs, s'est propagé si efficacement parce qu'il était facile de cacher son code malveillant dans un document d'apparence innocente. Au début du nouveau millénaire, la pression montait. Les gouvernements et les grandes entreprises, y compris la Commission européenne et plusieurs agences fédérales américaines, ont commencé à se demander publiquement si les formats binaires propriétaires étaient adaptés à l'archivage à long terme des documents publics. Microsoft se devait d'apporter une réponse crédible et ouverte.

Ce qu'est vraiment un DOCX sous le capot

Quand Microsoft a lancé le DOCX avec Office 2007, ce n'était pas juste une nouvelle extension pour un ancien fichier. C'était une refonte complète basée sur une spécification appelée Open Packaging Conventions (OPC), qui est elle-même basée sur la compression ZIP. Ce n'est pas une simple anecdote, c'est la clé pour comprendre tout ce qui rend le DOCX meilleur. Voici une astuce : prends n'importe quel fichier .docx, renomme-le avec l'extension .zip, et ouvre-le. Tu verras une arborescence de dossiers standard. À l'intérieur, tu trouveras des fichiers XML, un répertoire _rels pour les mappages de relations, et un sous-répertoire word/ contenant le document lui-même. Le texte principal se trouve dans word/document.xml. Les styles sont définis dans word/styles.xml. Les images sont stockées en tant que fichiers distincts dans word/media/, et les métadonnées comme l'auteur et la date de création sont dans docProps/core.xml. Cette architecture a de profonds avantages pratiques. Le XML est lisible par un humain, ce qui signifie qu'un développeur peut ouvrir document.xml dans un éditeur de texte et voir le contenu et la structure du document mis à nu. Cette transparence a rendu la création d'un support DOCX fiable beaucoup plus facile pour Google, Apple, LibreOffice et d'innombrables autres éditeurs. Ça a changé la donne en matière d'interopérabilité. Et comme les images et autres ressources sont stockées en tant que fichiers distincts dans le conteneur ZIP, la corruption d'une partie du paquet ne détruit pas nécessairement tout le document. Un .doc corrompu est souvent une perte totale ; un .docx corrompu peut fréquemment être réparé à la main. La compression ZIP elle-même est aussi incroyablement efficace. Un rapport d'activité de 450 Ko en .doc peut se réduire à seulement 180–220 Ko en .docx. Pour les organisations qui stockent des millions de documents, cette réduction de plus de 50 % des coûts de stockage est tout sauf anodine.

La transition de compatibilité : ce que Microsoft a réussi et raté

Microsoft savait qu'il ne pouvait pas imposer une rupture nette. Office 2007 a été livré avec un pack de compatibilité, permettant aux utilisateurs d'Office 2003 et XP d'ouvrir et d'enregistrer des fichiers DOCX. L'entreprise a également conservé le .doc comme option « Enregistrer sous », et on peut toujours trouver le choix de format « Document Word 97-2003 (.doc) » dans les dernières versions de Microsoft 365. Pourtant, la transition a été chaotique. Les organisations utilisant Office 2003 sur Windows XP — une base d'utilisateurs énorme en 2007 — devaient demander à leur service informatique d'installer manuellement ce pack de compatibilité. Les systèmes de messagerie d'entreprise bloquaient les pièces jointes .docx en tant que type de fichier inconnu jusqu'à ce que les administrateurs mettent à jour leurs politiques de sécurité. Les deux premières années d'adoption du DOCX ont généré beaucoup de tickets au support technique. Il y avait aussi de réels problèmes de parité des fonctionnalités. Certaines fonctionnalités héritées du .doc ne se transposaient tout simplement pas bien au nouveau schéma OOXML. Les codes de champ complexes, les anciens objets de dessin (surtout ceux de la couche de dessin VML) et les documents modifiés sur de nombreuses versions de Word accumulaient souvent des bizarreries de mise en forme qui se convertissaient imparfaitement. Quiconque a déjà ouvert un vieux .doc dans une version moderne de Word a vu cette barre d'avertissement de compatibilité jaune. Cliquer sur Fichier > Informations > Convertir supprime l'avertissement, mais cela peut aussi subtilement réagencer le texte ou déformer les dimensions des tableaux dans des mises en page complexes. Pour la plupart des documents — une lettre, un rapport ou une proposition lambda — la conversion est transparente. Mais pour les documents construits avec des mises en page précises impliquant des zones de texte superposées et des objets hérités incorporés, tu dois tester le fichier converti. Tu ne peux pas simplement supposer que ça a fonctionné.

Taille des fichiers, risque de corruption et archivage à long terme

L'avantage de taille du DOCX sur le DOC est réel, mais il varie. Les documents riches en texte bénéficient d'une compression massive. Pour les documents qui sont principalement des images intégrées, c'est moins le cas. C'est parce que les JPEG et les PNG sont déjà compressés avant même d'entrer dans le conteneur ZIP. Un rapport de 10 pages avec un graphique pourrait passer de 380 Ko (.doc) à 160 Ko (.docx). Un document de 10 pages rempli de 15 captures d'écran haute résolution pourrait ne passer que de 8,2 Mo à 7,9 Mo. La façon dont ils gèrent la corruption est une différence beaucoup plus marquée. Comme un fichier .doc est un flux binaire unique, un seul secteur défectueux sur un disque ou une connexion réseau interrompue pendant un enregistrement peut rendre tout le fichier illisible. La récupération intégrée de Word pour les .doc est une tentative au mieux, qui scanne les motifs binaires qu'il reconnaît. La corruption d'un DOCX, en revanche, est granulaire. Word peut souvent ouvrir un .docx endommagé et récupérer tout le texte de document.xml même si les images ou les styles ont disparu. Tu peux même tenter une réparation manuelle en ouvrant le fichier comme un ZIP et en extrayant le XML toi-même. Mais pour l'archivage à long terme, soyons clairs : aucun des deux formats n'est le bon choix. La norme officielle pour la conservation des documents est le PDF/A (ISO 19005), qui intègre les polices, supprime le contenu actif et est spécialement conçu pour un accès pérenne. Si tu archives des contrats, des documents juridiques ou des archives publiques, le bon flux de travail consiste à finaliser en DOCX puis à exporter en PDF/A. On n'archive pas le format modifiable. CocoConvert peut gérer tes conversions de DOCX en PDF, mais pour les documents avec des macros complexes, tu devras d'abord résoudre ces éléments dans Word pour obtenir un résultat propre.

Les différences de sécurité qui comptent vraiment

La plupart des gens pensent que le DOCX est intrinsèquement plus sûr que le DOC. Ils n'ont qu'à moitié raison. La nuance est importante ici. La partie sur la sécurité est vraie : les fichiers .docx ordinaires ne peuvent pas contenir de macros VBA. Microsoft a intelligemment créé une extension distincte, .docm, pour les documents contenant des macros. Cette simple séparation permet aux filtres de messagerie et aux logiciels de sécurité d'identifier et de bloquer très facilement les fichiers qui pourraient contenir du code exécutable. C'était un choix de conception intelligent dans la spécification OOXML. Mais les fichiers DOCX ne sont pas entièrement inoffensifs. Ils peuvent contenir des relations externes — des liens qui pointent vers des ressources distantes et les chargent à l'ouverture du document. Un .docx astucieusement conçu peut cacher une référence au serveur d'un attaquant dans son répertoire _rels. Lorsqu'un utilisateur ouvre le fichier, Word peut effectuer une requête HTTP sortante, ce qui peut potentiellement divulguer l'adresse IP de l'utilisateur et ses identifiants Windows via l'authentification NTLM. Cette attaque, connue sous le nom d'injection de modèle distant, a été utilisée dans des campagnes réelles contre des cibles de grande valeur comme des journalistes et des militants. Microsoft a atténué le pire de ce problème avec des correctifs et sa fonctionnalité de Mode Protégé, qui ouvre les documents téléchargés dans un bac à sable (sandbox) sécurisé. Le mécanisme sous-jacent, cependant, demeure. La conclusion est simple : tu dois toujours traiter les fichiers .docx de sources inconnues avec méfiance. Ouvre-les en Mode Protégé, ou mieux encore, convertis-les en PDF avant de les partager. Avec les fichiers .doc, le risque est encore plus élevé car le format binaire opaque rend l'analyse plus difficile et l'exécution de macros héritées est une menace connue.

Quand faut-il encore travailler avec des fichiers DOC

Même si le DOCX est le format par défaut depuis près de deux décennies, les fichiers .doc ne sont pas près de disparaître. Les services juridiques ont souvent d'immenses bibliothèques de modèles au format .doc car leurs coûteux systèmes de gestion de documents — des plateformes comme iManage ou OpenText du milieu des années 2000 — ont été conçus pour ce format et n'ont jamais été mis à jour. Certaines agences gouvernementales exigent encore le .doc pour les dépôts réglementaires. Et comme le sait quiconque a déjà fait le ménage sur un vieux serveur, les fichiers .doc s'accumulent comme des sédiments numériques au fil des ans. Ouvrir un fichier .doc dans une version moderne de Word est généralement sans douleur. Word 2016, 2019, 2021 et Microsoft 365 les gèrent tous bien, même s'ils affichent la bannière du mode de compatibilité. LibreOffice Writer fait également un travail compétent, bien qu'il puisse avoir du mal avec les documents qui ont un suivi des modifications complexe de plusieurs auteurs. Le vrai défi, c'est la conversion par lots. Transformer un dossier de 200 fichiers .doc de 2004 en fichiers .docx ou PDF modernes peut être un casse-tête. Tu pourrais utiliser l'enregistreur de macros de Word, mais cela nécessite d'avoir Word installé et de connaître un peu de VBA. C'est là qu'un outil comme CocoConvert entre en jeu, gérant la conversion de .doc en DOCX et de .doc en PDF sans nécessiter de licence Office locale. C'est parfait pour une utilisation sur un serveur Linux ou dans un environnement mixte. Le seul hic concerne les vrais cas limites : les documents avec de lourdes macros VBA, des objets OLE intégrés comme d'anciens graphiques Excel, ou des historiques de révision remontant à Word 95. Ces fichiers ont souvent besoin de l'application Word d'origine pour être traités correctement.

Choisir le bon format pour ton flux de travail

Pour la plupart des gens, la décision est simple : il faut utiliser le .docx. C'est le standard moderne, pris en charge par tous les traitements de texte pertinents de la planète. Sa structure XML ouverte te libère de l'enfermement dans le format propriétaire d'un seul fournisseur. Si tu crées un nouveau document aujourd'hui, il n'y a absolument aucune bonne raison de l'enregistrer en tant que fichier .doc. Le choix ne se complique que lorsque tu es forcé de travailler avec un système hérité spécifique. Si le système de dépôt en ligne d'un tribunal exige explicitement du .doc, alors tu enregistres en .doc. Si le système de gestion de documents de ton entreprise a des bugs connus avec le suivi des modifications en DOCX, alors tu t'en tiens à ce qui fonctionne jusqu'à ce que ce soit corrigé. Le format que tu choisis est dicté par la destination du fichier, pas seulement par ta préférence personnelle. Lors de la conversion entre formats, n'oublie pas que la complexité du document est le facteur le plus important. Une simple lettre de motivation ou une note d'une page se convertira sans aucun problème. Un rapport complexe de 50 pages avec des tableaux imbriqués, des styles personnalisés basés sur d'autres styles personnalisés, et une ménagerie d'objets de dessin est beaucoup plus fragile. Fais-moi confiance sur ce point : ouvre toujours le fichier converti et fais-le défiler en entier avant de l'envoyer à quelqu'un d'important. Au final, si ton objectif est la distribution finale, tu devrais complètement éviter le débat DOC vs. DOCX et utiliser le PDF. Un PDF préserve parfaitement ta mise en page, est lisible sur n'importe quel appareil, et c'est ce que tes destinataires veulent vraiment pour un document finalisé. Le meilleur flux de travail est clair : garde ta copie maîtresse modifiable en DOCX, distribue la version finale en PDF, et ne convertis entre formats modifiables que lorsqu'un système spécifique t'y oblige.