Skip to content
Back to Blog
format-comparisons

DOCX vs. DOC: Por qué Microsoft hizo el cambio

2026-05-17 8 min read

Un formato que duró 20 años, y por qué eso fue un problema

El formato .doc, introducido con Word para DOS en 1983, fue el formato de procesamiento de textos por defecto de Microsoft durante más de dos décadas. Para cuando llegó Office 2003, los archivos .doc estaban por todas partes. Vivían en servidores corporativos, sistemas gubernamentales, redes universitarias y, por supuesto, en los ordenadores de casa. El formato funcionaba, pero arrastraba una pesada carga de su larga historia. El problema principal del formato era su opacidad. Un archivo .doc es un bloque de datos binario y propietario, una estructura que solo Microsoft entendía realmente. Esto creó una pesadilla para los desarrolladores de terceros. Cualquiera que quisiera crear software capaz de leer o escribir archivos .doc tenía que aplicar ingeniería inversa a la especificación, un proceso penoso que inevitablemente llevaba a errores de compatibilidad, formatos corruptos y pérdida de datos. Durante años, WordPerfect, LibreOffice y Google Docs libraron una batalla perdida para lograr una fidelidad perfecta con .doc. La seguridad era otro problema importante. Como los archivos .doc podían incrustar potentes macros de VBA dentro de ese opaco contenedor binario, a las herramientas antivirus y los filtros de correo electrónico les costaba inspeccionarlos de forma fiable. Este fallo de diseño contribuyó a alimentar los brotes de virus de macros de finales de los 90. El virus Melissa en 1999, que infectó a aproximadamente un millón de ordenadores, se propagó con tanta eficacia porque era fácil ocultar su código malicioso dentro de un documento de apariencia inocente. A principios del nuevo milenio, la presión aumentaba. Gobiernos y grandes empresas, incluyendo la Comisión Europea y varias agencias federales de EE. UU., comenzaron a cuestionar públicamente si los formatos binarios propietarios eran adecuados para los registros públicos a largo plazo. Microsoft necesitaba una respuesta creíble y abierta.

Qué es realmente un DOCX por dentro

Cuando Microsoft lanzó DOCX con Office 2007, no fue solo una nueva extensión para un archivo antiguo. Fue una reinvención completa construida sobre una especificación llamada Open Packaging Conventions (OPC), que a su vez se basa en la compresión ZIP. Esto no es una simple anécdota, es la clave para entender todo lo que hace que DOCX sea mejor. Aquí tienes un truco: coge cualquier archivo .docx, cámbiale el nombre para que termine en .zip y ábrelo. Verás una estructura de carpetas estándar. Dentro, encontrarás archivos XML, un directorio _rels para las asignaciones de relaciones y un subdirectorio word/ que contiene el documento real. El texto principal reside en word/document.xml. Los estilos se definen en word/styles.xml. Las imágenes se almacenan como archivos separados en word/media/, y los metadatos como el autor y la fecha de creación están en docProps/core.xml. Esta arquitectura tiene profundos beneficios prácticos. El XML es legible para humanos, lo que significa que un desarrollador puede abrir document.xml en un editor de texto y ver el contenido y la estructura del documento al descubierto. Esta transparencia facilitó enormemente a Google, Apple, LibreOffice y un sinfín de otros proveedores la creación de un soporte fiable para DOCX. Fue un cambio radical para la interoperabilidad. Y como las imágenes y otros activos se almacenan como archivos discretos dentro del contenedor ZIP, la corrupción en una parte del paquete no destruye necesariamente todo el documento. Un .doc dañado suele ser una pérdida total; un .docx dañado a menudo se puede reparar manualmente. La propia compresión ZIP también es increíblemente eficaz. Un informe de negocios que ocupa 450 KB como archivo .doc podría reducirse a solo 180-220 KB como .docx. Para las organizaciones que almacenan millones de documentos, esa reducción de más del 50% en los costes de almacenamiento es cualquier cosa menos trivial.

La transición de compatibilidad: los aciertos y errores de Microsoft

Microsoft sabía que no podía forzar un corte drástico. Office 2007 se distribuyó con un paquete de compatibilidad que permitía a los usuarios de Office 2003 y XP abrir y guardar archivos DOCX. La compañía también mantuvo .doc como una opción de "Guardar como", y todavía puedes encontrar la opción "Documento de Word 97-2003 (.doc)" en las últimas versiones de Microsoft 365. Aun así, la transición fue un lío. Las organizaciones que usaban Office 2003 en Windows XP —una base de usuarios enorme en 2007— tuvieron que pedir a su departamento de TI que instalara manualmente ese paquete de compatibilidad. Los sistemas de correo corporativo bloqueaban los adjuntos .docx como tipos de archivo desconocidos hasta que los administradores actualizaban sus políticas de seguridad. Los primeros dos años de la adopción de DOCX generaron muchos tickets de soporte técnico. También hubo problemas reales de paridad de funciones. Algunas características heredadas de .doc simplemente no se correspondían limpiamente con el nuevo esquema OOXML. Los códigos de campo complejos, los objetos de dibujo antiguos (especialmente los de la capa de dibujo VML) y los documentos editados en muchas versiones de Word a menudo acumulaban peculiaridades de formato que se convertían de forma imperfecta. Cualquiera que haya abierto un .doc antiguo en una versión moderna de Word ha visto esa barra amarilla de advertencia de compatibilidad. Hacer clic en Archivo > Información > Convertir elimina la advertencia, pero también puede sutilmente alterar el flujo del texto o estropear las dimensiones de las tablas en diseños complejos. Para la mayoría de los documentos —una carta, un informe o una propuesta promedio— la conversión es perfecta. Pero para documentos construidos con diseños de página precisos que involucran cuadros de texto superpuestos y objetos heredados incrustados, debes probar el archivo convertido. No puedes simplemente asumir que funcionó.

Tamaño de archivo, riesgo de corrupción y archivado a largo plazo

La ventaja de tamaño de DOCX sobre DOC es real, pero varía. Los documentos con mucho texto experimentan una compresión masiva. Los documentos que son principalmente imágenes incrustadas, no tanto. Esto se debe a que los JPEG y PNG ya están comprimidos antes de entrar en el contenedor ZIP. Un informe de 10 páginas con un gráfico podría reducirse de 380 KB (.doc) a 160 KB (.docx). Un documento de 10 páginas lleno de 15 capturas de pantalla de alta resolución podría pasar de 8.2 MB a solo 7.9 MB. La forma en que manejan la corrupción es una diferencia mucho más marcada. Dado que un archivo .doc es un único flujo binario, un sector defectuoso en un disco o una conexión de red interrumpida durante el guardado pueden hacer que todo el archivo sea ilegible. La recuperación integrada de Word para .doc es una conjetura de mejor esfuerzo, escaneando en busca de patrones binarios que reconoce. La corrupción de DOCX, por otro lado, es granular. A menudo, Word puede abrir un .docx dañado y recuperar todo el texto de document.xml, incluso si las imágenes o los estilos se han perdido. Incluso puedes intentar una reparación manual abriendo el archivo como un ZIP y extrayendo el XML tú mismo. Pero para el archivado a largo plazo, seamos claros: ninguno de los dos formatos es la opción correcta. El estándar oficial para la preservación de documentos es PDF/A (ISO 19005), que incrusta las fuentes, elimina el contenido activo y está diseñado específicamente para un acceso a prueba de futuro. Si estás archivando contratos, documentos legales o registros públicos, el flujo de trabajo correcto es finalizar en DOCX y luego exportar a PDF/A. No se archiva el formato editable. CocoConvert puede gestionar tus conversiones de DOCX a PDF, pero para documentos con macros complejas, necesitarás resolver esos elementos en Word primero para obtener un resultado limpio.

Diferencias de seguridad que de verdad importan

La mayoría de la gente cree que DOCX es inherentemente más seguro que DOC. Solo tienen razón a medias. El matiz aquí es importante. La parte segura es cierta: los archivos .docx normales no pueden contener macros de VBA. Microsoft creó inteligentemente una extensión separada y distinta, .docm, para los documentos habilitados para macros. Esta simple separación hace que sea trivial para los filtros de correo electrónico y el software de seguridad identificar y bloquear archivos que podrían contener código ejecutable. Fue una decisión de diseño inteligente en la especificación OOXML. Pero los archivos DOCX no son completamente benignos. Pueden contener relaciones externas: enlaces que apuntan a recursos remotos y los cargan cuando se abre el documento. Un .docx hábilmente diseñado puede ocultar una referencia al servidor de un atacante en su directorio _rels. Cuando un usuario abre el archivo, Word puede realizar una solicitud HTTP saliente, lo que podría filtrar la dirección IP del usuario y las credenciales de Windows a través de la autenticación NTLM. Este ataque, conocido como inyección de plantillas remotas, se ha utilizado en campañas del mundo real contra objetivos de alto valor como periodistas y activistas. Microsoft ha mitigado lo peor de esto con parches y su función de Vista protegida, que abre los documentos descargados en un entorno seguro y aislado. Sin embargo, el mecanismo subyacente permanece. La conclusión es simple: todavía debes tratar los archivos .docx de fuentes desconocidas con sospecha. Ábrelos en Vista protegida o, mejor aún, conviértelos a PDF antes de compartirlos. Con los archivos .doc, el riesgo es aún mayor porque el formato binario opaco dificulta el análisis y la ejecución de macros heredadas es una amenaza conocida.

Cuándo todavía necesitas trabajar con archivos DOC

Aunque DOCX ha sido el estándar durante casi dos décadas, los archivos .doc no van a desaparecer. Los departamentos legales a menudo tienen vastas bibliotecas de plantillas en formato .doc porque sus costosos sistemas de gestión de documentos —plataformas como iManage u OpenText de mediados de los 2000— se construyeron para él y nunca se actualizaron. Algunas agencias gubernamentales todavía exigen .doc para presentaciones regulatorias. Y como sabe cualquiera que haya limpiado un servidor antiguo, los archivos .doc se acumulan como sedimento digital a lo largo de los años. Abrir un archivo .doc en una versión moderna de Word suele ser sencillo. Word 2016, 2019, 2021 y Microsoft 365 los manejan bien, incluso si muestran el aviso del modo de compatibilidad. LibreOffice Writer también hace un trabajo competente, aunque puede tener dificultades con documentos que tienen un control de cambios complejo de múltiples autores. El verdadero desafío es la conversión por lotes. Convertir una carpeta de 200 archivos .doc de 2004 a archivos .docx o PDF modernos puede ser un dolor de cabeza. Podrías usar la grabadora de macros de Word, pero eso requiere tener Word instalado y saber un poco de VBA. Aquí es donde una herramienta como CocoConvert resulta útil, manejando la conversión de .doc a DOCX y de .doc a PDF sin necesidad de una licencia local de Office. Es perfecta para usar en un servidor Linux o en un entorno mixto. El único problema son los casos realmente extremos: documentos con muchas macros de VBA, objetos OLE incrustados como gráficos antiguos de Excel o historiales de revisión que se remontan a Word 95. Esos archivos a menudo necesitan la aplicación original de Word para resolverse correctamente.

Elegir el formato adecuado para tu flujo de trabajo

Para la mayoría de la gente, la decisión es simple: usa .docx. Es el estándar moderno, compatible con todos los procesadores de texto relevantes del planeta. Su estructura XML abierta te libera de estar atado al formato propietario de un solo proveedor. Si estás creando un documento nuevo hoy, no hay absolutamente ninguna buena razón para guardarlo como un archivo .doc. La elección solo se complica cuando te ves obligado a trabajar con un sistema heredado específico. Si el sistema de presentación electrónica de un tribunal exige explícitamente .doc, entonces guardas como .doc. Si el sistema de gestión de documentos de tu empresa tiene errores conocidos con el control de cambios de DOCX, entonces te quedas con lo que funciona hasta que se arregle. El formato que eliges viene dictado por el destino del archivo, no solo por tu preferencia personal. Al convertir entre formatos, recuerda que la complejidad del documento es el factor más importante. Una simple carta de presentación o un memorando de una página se convertirán sin problemas. Un complejo informe de 50 páginas con tablas anidadas, estilos personalizados basados en otros estilos personalizados y una colección de objetos de dibujo es mucho más frágil. Confía en mí en esto: siempre abre el archivo convertido y revísalo de principio a fin antes de enviárselo a alguien importante. En última instancia, si tu objetivo es la distribución final, deberías evitar por completo el debate de DOC vs. DOCX y usar PDF. Un PDF conserva tu diseño perfectamente, se puede ver en cualquier dispositivo y es lo que tus destinatarios realmente quieren para un documento finalizado. El mejor flujo de trabajo es claro: mantén tu copia maestra editable en DOCX, distribuye la versión final en PDF y solo convierte entre formatos editables cuando un sistema específico te obligue a hacerlo.