Skip to content
Back to Blog
informational

¿Qué son los metadatos de un archivo? (Y por qué deberías eliminarlos antes de compartir)

2026-05-17 9 min de lectura

Qué son realmente los metadatos de un archivo

Cada archivo que creas tiene dos partes: el contenido que ves y una capa secreta de datos que la mayoría del software añade automáticamente. Esta capa oculta son los metadatos: información estructurada sobre el archivo, no lo que hay en el archivo. El nombre viene del griego 'meta', que significa 'acerca de'. Así que son, literalmente, datos sobre los datos. Una foto JPEG no son solo píxeles; también contiene metadatos EXIF que detallan el modelo de la cámara, el objetivo, la velocidad de obturación, el ISO y, lo más importante, las coordenadas GPS exactas de donde la tomaste. Un documento de Word almacena silenciosamente tu nombre, tu empresa (de tu licencia de Office), cuántos minutos pasaste editando e incluso un historial de texto eliminado. El formato cambia según el tipo de archivo. Las imágenes suelen usar los estándares EXIF (Exchangeable Image File Format) e IPTC (International Press Telecommunications Council). Los PDF tienen sus propias propiedades y también usan XMP (Extensible Metadata Platform). Los archivos de Office como DOCX y XLSX son en realidad archivos ZIP, y guardan los metadatos en un archivo XML llamado core.xml en su interior. Los archivos de audio usan etiquetas ID3 para almacenar la carátula del álbum y la información de la pista. Los archivos de video usan una mezcla de datos a nivel de contenedor (MOV, MP4) y de códec. Nada de esto es una conspiración. Los ingenieros de software añaden metadatos por buenas razones: las aplicaciones de fotos los usan para ordenar tus imágenes por fecha y lugar, y tu reproductor de música necesita las etiquetas ID3 para mostrar la carátula del álbum. El problema empieza cuando estos archivos salen de su entorno original y viajan mucho más allá de su contexto inicial.

Los campos de datos específicos que pueden exponerte

Seamos claros: no todos los metadatos son un problema. Saber que un archivo se guardó a 96 DPI es una trivialidad inútil. Pero algunos campos de metadatos comunes tienen serias consecuencias para la privacidad y la seguridad. Las coordenadas GPS en las fotos son el ejemplo más famoso. Saca una foto con tu iPhone con los servicios de localización activados, y iOS incrustará tu latitud y longitud precisas en las etiquetas EXIF del archivo. Publica esa foto en internet, y cualquiera con una herramienta gratuita como ExifTool o Jeffrey's Exif Viewer puede averiguar dónde vives, trabajas o pasas el rato. Esto no es hipotético. En 2012, un periodista de Vice encontró el escondite de John McAfee en Guatemala en parte analizando los datos GPS de una foto publicada con una entrevista. Los campos de autor y organización en los archivos de Office se extraen de tu licencia de software. Si redactas un contrato, el XML interno del archivo listará tu nombre completo y tu empresa. Si se lo envías a la otra parte en una negociación, sabrán exactamente quién escribió el primer borrador y cuándo. El historial de revisiones y el control de cambios son otro campo minado, que puede exponer texto eliminado, comentarios privados y los nombres de todos los editores. Ha habido casos famosos de bufetes de abogados que enviaron a la parte contraria documentos con toda su estrategia revelada accidentalmente en el control de cambios. En los PDF, el bloque XMP puede contener el software utilizado para crear el archivo (revelando tu sistema operativo y nivel de parches a un atacante), el autor e incluso la ruta original del archivo, como `C:\Users\sarah.johnson\Documents\ClientProposals\AcmeCorp_draft3.pdf`. Esa ruta por sí sola revela el nombre de un empleado y la estructura interna de tus carpetas. Y no olvides las vistas previas en miniatura incrustadas. En algunas imágenes RAW y archivos de Office antiguos, estas pueden mostrar una instantánea del documento en una etapa anterior, lo que significa que el contenido que creías haber borrado podría seguir siendo visible.

Quién lee realmente los metadatos de los archivos (y cómo)

Podrías pensar que leer metadatos requiere algún tipo de habilidad de hacker. No es así. Hay herramientas gratuitas y comunes que lo hacen ridículamente fácil. ExifTool de Phil Harvey es el estándar de oro; funciona en todos los sistemas operativos principales y lee metadatos de más de cien formatos de archivo. Simplemente escribe 'exiftool nombrearchivo.jpg' en una terminal y lo verás todo. Para quienes prefieren una interfaz gráfica, existen envoltorios y herramientas basadas en navegador como Jimpl.com o MetaPicz que te permiten subir una foto y ver sus datos al instante. Para los documentos de Office, es aún más sencillo. No necesitas ningún software especial. Simplemente renombra un archivo .docx a .zip, abre el archivo comprimido y navega hasta el archivo docProps/core.xml con un editor de texto plano. Los datos en bruto están ahí mismo. Entonces, ¿quién se dedica a mirar esto? Más gente de la que crees. Los periodistas comprueban cada documento que reciben de sus fuentes. Los abogados usan los metadatos como prueba en los tribunales; las marcas de tiempo EXIF se han utilizado para demostrar cuándo se tomó realmente una foto, echando por tierra el testimonio de un testigo. Los espías corporativos los usan para mapear la organización de un competidor. Las fuerzas del orden dependen mucho de ellos. El asesino en serie BTK fue identificado a principios de los 2000 en parte porque un disquete que envió a la policía contenía metadatos en un documento de Word eliminado que apuntaban a la 'Iglesia Luterana de Cristo' y a un usuario llamado 'Dennis': el asesino, Dennis Rader. No pretendo ser alarmista. La mayoría de la gente que comparte una receta no corre peligro. Pero el riesgo aumenta con la sensibilidad del contenido. Un freelancer que envía su portafolio a un nuevo cliente tiene un perfil de riesgo diferente al de alguien que comparte una foto familiar en un chat privado.

Cómo eliminar los metadatos antes de compartir

Vayamos a lo práctico. Aquí te explico cómo puedes eliminar los metadatos de tus archivos, plataforma por plataforma. Es más fácil de lo que crees. **Para imágenes en Windows:** Haz clic derecho en el archivo, ve a Propiedades y luego a la pestaña Detalles. En la parte inferior, haz clic en 'Quitar propiedades e información personal'. Esto te permite crear una copia limpia y se encarga de la mayoría de los datos EXIF, aunque a veces puede pasar por alto las etiquetas XMP. **Para imágenes en macOS:** No te fíes de la aplicación Vista Previa integrada; es conocida por ser mala en esto. La mejor opción es ImageOptim, una herramienta gratuita y de código abierto que elimina a fondo los datos EXIF, IPTC y XMP, a la vez que comprime el archivo. Alternativamente, puedes exportar desde la aplicación Fotos, pero primero asegúrate de haber desactivado los datos de ubicación en Fotos > Preferencias > iCloud > desactivando 'Incluir información de ubicación para los ítems publicados'. **Para archivos de Word y Excel:** Antes de enviar cualquier cosa externamente, acostúmbrate a ir a Archivo > Información > Comprobar si hay problemas > Inspeccionar documento. El Inspector de documento encontrará y te ofrecerá eliminar comentarios, revisiones, información del autor y otros datos ocultos. Esto es esencial. Solo ten en cuenta que eliminar el historial de revisiones es permanente, así que guarda una copia maestra para ti si la necesitas. **Para PDF:** Cualquiera que haya luchado con un PDF rebelde sabe que tienen vida propia. Para los metadatos, la solución más robusta es la función Redactar > Desinfectar documento en la versión de pago de Adobe Acrobat Pro. Si no tienes Acrobat, una solución decente es 'imprimir' el archivo a un nuevo PDF, ya que la impresora de PDF integrada de macOS elimina la mayoría de los metadatos, pero no siempre todos. **Usando CocoConvert:** Cuando conviertes un archivo usando CocoConvert, como pasar un DOCX a PDF o un JPEG a PNG, el proceso elimina de forma natural la mayoría de los metadatos originales. Estamos construyendo un archivo completamente nuevo, por lo que cosas como los datos GPS de EXIF y los campos de autor de Word no se transfieren. Piensa en ello como un efecto secundario beneficioso, no como una función de seguridad dedicada. Para archivos realmente sensibles, usa primero un desinfectante específico. Somos una herramienta de conversión, no una herramienta forense, y queremos ser honestos al respecto.

Qué elimina (y qué no) la conversión

Dado que CocoConvert es un conversor de archivos, seamos específicos sobre lo que sucede con los metadatos durante un trabajo. Cuando conviertes un JPEG a PNG, creamos un nuevo archivo PNG a partir de los píxeles de origen. PNG tiene su propia forma de almacenar metadatos (en bloques tEXt, iTXt y zTXt), pero no copiamos los datos EXIF originales en ellos. En la práctica, esto significa que las coordenadas GPS, el modelo de la cámara y la información del objetivo de tu JPEG desaparecen en el PNG final. Lo mismo ocurre con las conversiones de JPEG a WebP. Cuando conviertes un DOCX a PDF, estamos generando el PDF a partir del aspecto final y renderizado del documento. El campo de autor en el nuevo PDF generalmente listará el software de conversión, no el autor original de Word. Todos tus controles de cambios e historial de revisiones se aplanan y desaparecen, porque un PDF solo representa ese estado final único. Pero hay algunas trampas. La principal son los archivos incrustados. Si tu documento de Word de origen contiene una foto insertada con sus propios datos EXIF, esa foto podría conservar sus metadatos cuando se incruste dentro del PDF final. Por lo tanto, el PDF aún podría contener datos GPS de esa imagen en particular. Además, esto debería ser obvio, pero lo diremos de todos modos: la conversión no elimina información sensible del contenido de tu archivo. Si tu dirección está escrita en el documento, seguirá estando allí. Eso es contenido, no metadatos. Para los archivos de audio, convertir un MP3 a AAC con CocoConvert no copia las etiquetas ID3 por defecto. En resumen: la conversión con CocoConvert es una excelente primera línea de defensa que reduce significativamente la exposición de metadatos para el uso diario. Simplemente no lo confundas con una herramienta de desinfección dedicada y de alta seguridad.

Los metadatos en contextos profesionales y legales

Si trabajas en derecho, finanzas, sanidad u otra industria regulada, los metadatos no son solo un experimento mental sobre privacidad, son un campo minado de cumplimiento normativo. Bajo la ley HIPAA, por ejemplo, los metadatos pueden ser parte de la información de salud protegida (PHI). Un escáner médico podría tener datos GPS que apunten a una clínica y una etiqueta de artista con el nombre del paciente. Esa combinación es PHI, incluso si la imagen en sí está anonimizada. La Oficina de Derechos Civiles del HHS exige específicamente que se consideren los metadatos al desidentificar registros. En procedimientos legales, los metadatos son totalmente detectables. La Regla Federal de Procedimiento Civil 34 en los EE. UU. cubre toda la información almacenada electrónicamente (ESI), y los tribunales han confirmado repetidamente que los metadatos son parte de esa ESI. Si te ordenan preservar documentos para un litigio y eliminas los metadatos, eso es destrucción de pruebas. Es un error desastroso que puede hacerte perder el caso. Para los periodistas y sus fuentes, esto no es teórico; es una cuestión de seguridad física. Por eso existen herramientas como SecureDrop, utilizada por la Freedom of the Press Foundation, The New York Times y The Guardian: eliminan automáticamente los metadatos de los envíos para proteger a las fuentes. Si eres una fuente, debes asumir que cada archivo que envías está etiquetado con tu identidad a menos que lo hayas limpiado personalmente. En el mundo de las fusiones y adquisiciones corporativas, los metadatos en una sala de datos pueden revelar estrategias de negociación, valoraciones privadas e identidades de asesores. Las contrapartes inteligentes buscan esta información sin dudarlo. Los principales bufetes de abogados ahora tratan la revisión de metadatos como un paso obligatorio para cualquier transacción. Para la mayoría de nosotros, las implicaciones profesionales son menores. Pero el principio es el mismo: sabe lo que tus archivos dicen de ti antes de que escapen a tu control.

Una lista de comprobación práctica antes de compartir cualquier archivo

No necesitas memorizar cada regla oscura. Para el 99% de las situaciones, esta lista de comprobación práctica es todo lo que necesitas antes de hacer clic en 'enviar' o 'subir'. **1. Identifica el tipo de archivo y sus riesgos de metadatos.** Solo recuerda los más importantes. Las fotos pueden tener datos GPS. Los documentos de Office pueden tener historial de autor y revisiones. Los PDF pueden tener datos de autor y rutas de creación. Los archivos de audio llevan etiquetas ID3. Los archivos de video llevan GPS, modelo del dispositivo y marcas de tiempo de creación. **2. Evalúa tu audiencia.** ¿Para quién es esto? Enviar una foto familiar a tu madre es de bajo riesgo. Publicar una foto en un foro público o enviar una propuesta a un nuevo cliente es de mayor riesgo. Adecúa tu esfuerzo a la amenaza real. **3. Usa la herramienta adecuada para el trabajo.** En Windows, usa el eliminador de propiedades integrado o ImageOptim en Mac. Para archivos de Office, ejecuta el Inspector de documento. Para PDF, usa la función de Desinfectar de Acrobat o vuelve a imprimir a PDF. Para trabajos masivos o cambios de formato, el proceso de conversión de CocoConvert eliminará incidentalmente la mayoría de los metadatos específicos del formato como un subproducto. **4. Verifica el resultado.** Después de eliminar o convertir, comprueba el resultado. En Windows, haz clic derecho > Propiedades > Detalles. En Mac, ábrelo en Vista Previa y ve a Herramientas > Mostrar Inspector > EXIF. Usa ExifTool desde la línea de comandos para un volcado completo: 'exiftool -all nombrearchivo.jpg'. No asumas que la eliminación funcionó, confírmalo. **5. Recuerda que el contenido no son metadatos.** Esto es crucial. Ninguna herramienta eliminará tu número de seguridad social si lo has escrito en el documento. Eso es un problema de contenido, y necesitas revisar las partes visibles de tu archivo por separado. **6. Para situaciones de alto riesgo, usa herramientas dedicadas.** MAT2 (Metadata Anonymisation Toolkit 2) es una herramienta de código abierto utilizada por profesionales de la seguridad que maneja docenas de formatos de archivo y es más exhaustiva que la mayoría de las opciones de consumo. Está disponible en Linux y a través del sistema operativo Tails, que está diseñado para casos de uso de alto riesgo. Los metadatos no son malos. Son una característica útil que se convirtió en un problema cuando nuestros archivos comenzaron a viajar por el mundo con solo hacer clic en un botón. Entender lo que llevan tus archivos y tomarte 30 segundos para limpiarlos antes de compartirlos es un pequeño hábito que mejora drásticamente tu privacidad.