Skip to content
Back to Blog
informational

Que sont les métadonnées de fichier ? (Et pourquoi tu devrais les supprimer avant de partager)

2026-05-17 9 min de lecture

Les métadonnées de fichier, c'est quoi au juste ?

Chaque fichier que tu crées a deux parties : le contenu que tu vois, et une couche secrète de données que la plupart des logiciels ajoutent automatiquement. Cette couche cachée, ce sont les métadonnées : des informations structurées sur le fichier, pas sur ce qu'il y a *dans* le fichier. Le nom vient du grec « meta », qui signifie « à propos de ». Ce sont donc littéralement des données sur les données. Une photo JPEG, ce n'est pas juste des pixels ; elle contient aussi des métadonnées EXIF détaillant le modèle de l'appareil photo, l'objectif, la vitesse d'obturation, la sensibilité ISO et, le plus important, les coordonnées GPS exactes de l'endroit où tu l'as prise. Un document Word enregistre discrètement ton nom, le nom de ton entreprise (issu de ta licence Office), combien de minutes tu as passé à l'éditer, et même un historique du texte supprimé. Le format change en fonction du type de fichier. Les images utilisent souvent les standards EXIF (Exchangeable Image File Format) et IPTC (International Press Telecommunications Council). Les PDF ont leurs propres propriétés et utilisent aussi le XMP (Extensible Metadata Platform). Les fichiers Office comme les DOCX et XLSX sont en fait des archives ZIP, et ils stockent les métadonnées dans un fichier XML appelé core.xml à l'intérieur. Les fichiers audio utilisent des balises ID3 pour conserver la pochette de l'album et les infos sur la piste. Les fichiers vidéo utilisent un mélange de données au niveau du conteneur (MOV, MP4) et au niveau du codec. Rien de tout ça n'est un complot. Les ingénieurs logiciels ajoutent des métadonnées pour de bonnes raisons : les applications de photo s'en servent pour trier tes images par date et par lieu, et ton lecteur de musique a besoin des balises ID3 pour afficher la pochette de l'album. Le problème commence quand ces fichiers quittent le nid et voyagent bien au-delà de leur contexte d'origine.

Les données précises qui peuvent te trahir

Soyons clairs : toutes les métadonnées ne sont pas un problème. Savoir qu'un fichier a été enregistré à 96 DPI est une information sans intérêt. Mais certains champs de métadonnées courants ont de sérieuses conséquences sur la vie privée et la sécurité. Les coordonnées GPS dans les photos en sont l'exemple le plus célèbre. Prends une photo avec ton iPhone avec les services de localisation activés, et iOS intègre ta latitude et ta longitude précises dans les balises EXIF du fichier. Publie cette photo en ligne, et n'importe qui avec un outil gratuit comme ExifTool ou Jeffrey's Exif Viewer peut découvrir où tu habites, travailles ou passes ton temps. Ce n'est pas une hypothèse. En 2012, un journaliste de Vice a trouvé la cachette de John McAfee au Guatemala en partie en analysant les données GPS d'une photo publiée avec une interview. Les champs « auteur » et « organisation » dans les fichiers Office sont tirés de ta licence logicielle. Si tu rédiges un contrat, le fichier XML interne listera ton nom complet et ton entreprise. Envoie ça à la partie adverse dans une négociation, et ils sauront exactement qui a rédigé la première version et quand. L'historique des révisions et le suivi des modifications sont un autre champ de mines, pouvant exposer du texte supprimé, des commentaires privés et le nom de tous les éditeurs. Des cabinets d'avocats ont tristement envoyé à la partie adverse des documents qui révélaient accidentellement toute leur stratégie dans le suivi des modifications. Pour les PDF, le bloc XMP peut contenir le logiciel utilisé pour créer le fichier (révélant ton OS et son niveau de correctifs à un attaquant), l'auteur, et même le chemin du fichier d'origine, comme `C:\Users\sarah.johnson\Documents\ClientProposals\AcmeCorp_draft3.pdf`. Ce chemin à lui seul révèle le nom d'un employé et la structure de tes dossiers internes. Et n'oublie pas les aperçus miniatures intégrés. Dans certaines images RAW et d'anciens fichiers Office, ceux-ci peuvent montrer un instantané du document à un stade antérieur, ce qui signifie qu'un contenu que tu pensais avoir supprimé pourrait être encore visible.

Qui lit vraiment les métadonnées (et comment ?)

Tu penses peut-être que lire les métadonnées demande des compétences de hacker. Ce n'est pas le cas. Des outils gratuits et courants rendent la chose ridiculement facile. ExifTool de Phil Harvey est la référence absolue ; il fonctionne sur tous les principaux systèmes d'exploitation et lit les métadonnées de plus d'une centaine de formats de fichiers. Il suffit de taper 'exiftool filename.jpg' dans un terminal, et tu verras tout. Pour ceux qui préfèrent une interface graphique, il existe des wrappers et des outils en ligne comme Jimpl.com ou MetaPicz qui te permettent de télécharger une photo et de voir ses données instantanément. Pour les documents Office, c'est encore plus simple. Tu n'as même pas besoin de logiciel spécial. Il suffit de renommer un fichier .docx en .zip, d'ouvrir l'archive et de naviguer jusqu'au fichier docProps/core.xml avec un éditeur de texte brut. Les données brutes sont juste là. Alors, qui regarde vraiment ? Plus de gens que tu ne le penses. Les journalistes vérifient chaque document qu'ils reçoivent de leurs sources. Les avocats utilisent les métadonnées comme preuve au tribunal ; les horodatages EXIF ont été utilisés pour prouver quand une photo a réellement été prise, torpillant le témoignage d'un témoin. Les espions d'entreprise s'en servent pour cartographier l'organisation d'un concurrent. Les forces de l'ordre s'en servent énormément. Le tueur en série BTK a été identifié au début des années 2000 en partie parce qu'une disquette qu'il avait envoyée à la police contenait des métadonnées dans un document Word supprimé qui pointaient vers « Christ Lutheran Church » et un utilisateur nommé « Dennis » — le tueur, Dennis Rader. Le but n'est pas d'être alarmiste. La plupart des gens qui partagent une recette ne sont pas en danger. Mais le risque augmente avec la sensibilité du contenu. Un freelance qui envoie son portfolio à un nouveau client a un profil de risque différent de celui de quelqu'un qui partage une photo de famille dans une discussion privée.

Comment supprimer les métadonnées avant de partager

Passons à la pratique. Voici comment tu peux supprimer les métadonnées de tes fichiers, plateforme par plateforme. C'est plus facile que tu ne le penses. **Pour les images sur Windows :** Fais un clic droit sur le fichier, va dans Propriétés, puis dans l'onglet Détails. En bas, clique sur « Supprimer les propriétés et les informations personnelles ». Cela te permet de créer une copie propre et gère la plupart des données EXIF, mais il peut parfois manquer les balises XMP. **Pour les images sur macOS :** Ne te fie pas à l'application Aperçu intégrée ; elle est notoirement mauvaise pour ça. Le meilleur choix est ImageOptim, un outil gratuit et open-source qui supprime en profondeur les données EXIF, IPTC et XMP tout en compressant le fichier. Alternativement, tu peux exporter depuis l'application Photos, mais assure-toi d'abord d'avoir désactivé les données de localisation sous Photos > Préférences > iCloud > décoche « Inclure les informations de localisation pour les éléments publiés ». **Pour les fichiers Word et Excel :** Avant d'envoyer quoi que ce soit à l'extérieur, prends l'habitude d'aller dans Fichier > Informations > Vérifier l'absence de problèmes > Inspecter le document. L'Inspecteur de document trouvera et proposera de supprimer les commentaires, les révisions, les informations sur l'auteur et d'autres données cachées. C'est essentiel. Sache simplement que la suppression de l'historique des révisions est permanente, alors garde une copie maîtresse pour toi si tu en as besoin. **Pour les PDF :** Quiconque s'est déjà battu avec un PDF récalcitrant sait qu'ils ont une vie propre. Pour les métadonnées, la solution la plus robuste est la fonction Biffer > Nettoyer le document dans la version payante d'Adobe Acrobat Pro. Si tu n'as pas Acrobat, une bonne alternative est d'« imprimer » le fichier vers un nouveau PDF, car l'imprimante PDF intégrée de macOS supprime la plupart des métadonnées, mais pas toujours toutes. **Avec CocoConvert :** Quand tu convertis un fichier avec CocoConvert, comme transformer un DOCX en PDF ou un JPEG en PNG, le processus se débarrasse naturellement de la plupart des métadonnées d'origine. Nous créons un tout nouveau fichier, donc les données comme les coordonnées GPS EXIF et les champs d'auteur de Word ne sont pas reportées. Considère ça comme un effet secondaire bénéfique, pas comme une fonctionnalité de sécurité dédiée. Pour les fichiers vraiment sensibles, utilise d'abord un outil de nettoyage dédié. Nous sommes un outil de conversion, pas un outil d'investigation numérique, et nous tenons à être honnêtes à ce sujet.

Ce que la conversion supprime (et ce qu'elle ne supprime pas)

Puisque CocoConvert est un convertisseur de fichiers, soyons précis sur ce qu'il advient des métadonnées pendant une conversion. Quand tu convertis un JPEG en PNG, nous créons un nouveau fichier PNG à partir des pixels source. Le format PNG a sa propre façon de stocker les métadonnées (dans des blocs tEXt, iTXt et zTXt), mais nous n'y copions pas les données EXIF d'origine. En pratique, cela signifie que les coordonnées GPS, le modèle de l'appareil photo et les informations sur l'objectif de ton JPEG ont disparu dans le PNG final. Il en va de même pour les conversions de JPEG en WebP. Quand tu convertis un DOCX en PDF, nous générons le PDF à partir de l'apparence finale et rendue du document. Le champ « auteur » dans le nouveau PDF indiquera généralement le logiciel de conversion, et non l'auteur original de Word. Tout ton suivi des modifications et ton historique de révision sont aplatis et disparaissent, car un PDF ne représente que cet état final unique. Mais il y a quelques pièges. Le principal, ce sont les fichiers intégrés. Si ton document Word source contient une photo insérée avec ses propres données EXIF, cette photo pourrait conserver ses métadonnées lorsqu'elle est intégrée dans le PDF final. Le PDF pourrait donc toujours contenir les données GPS de cette seule image. Aussi, ça devrait être évident, mais on va le dire quand même : la conversion ne supprime pas les informations sensibles du *contenu* de ton fichier. Si ton adresse est écrite dans le document, elle y sera toujours. Ça, c'est du contenu, pas des métadonnées. Pour les fichiers audio, la conversion d'un MP3 en AAC avec CocoConvert ne copie pas les balises ID3 par défaut. En résumé : la conversion avec CocoConvert est une excellente première ligne de défense qui réduit considérablement l'exposition aux métadonnées pour un usage quotidien. Simplement, ne la confonds pas avec un outil de nettoyage dédié à la haute sécurité.

Les métadonnées dans les contextes professionnels et juridiques

Si tu travailles dans le droit, la finance, la santé ou un autre secteur réglementé, les métadonnées ne sont pas juste un exercice de pensée sur la vie privée, c'est un champ de mines en matière de conformité. Selon la loi HIPAA, par exemple, les métadonnées peuvent faire partie des informations de santé protégées (PHI). Un scanner médical peut contenir des données GPS pointant vers une clinique, et une balise « artiste » avec le nom du patient. Cette combinaison constitue une PHI, même si l'image elle-même est anonymisée. Le Bureau des droits civils du HHS exige spécifiquement que les métadonnées soient prises en compte lors de l'anonymisation des dossiers. Dans les procédures judiciaires, les métadonnées sont entièrement communicables. La Règle fédérale de procédure civile 34 aux États-Unis couvre toutes les informations stockées électroniquement (ESI), et les tribunaux ont confirmé à plusieurs reprises que les métadonnées font partie de ces ESI. Si on te demande de conserver des documents pour un litige et que tu supprimes les métadonnées, c'est une destruction de preuve. C'est une erreur désastreuse qui peut te faire perdre le procès. Pour les journalistes et leurs sources, ce n'est pas théorique ; c'est une question de sécurité physique. C'est pourquoi des outils comme SecureDrop, utilisé par la Freedom of the Press Foundation, le New York Times et The Guardian, existent : ils suppriment automatiquement les métadonnées des soumissions pour protéger les sources. Si tu es une source, tu dois partir du principe que chaque fichier que tu envoies est marqué de ton identité, à moins que tu ne l'aies personnellement nettoyé. Dans le monde des fusions et acquisitions d'entreprises, les métadonnées dans une data room peuvent révéler des stratégies de négociation, des évaluations privées et l'identité des conseillers. Les contreparties intelligentes recherchent absolument ces informations. Les grands cabinets d'avocats considèrent désormais la revue des métadonnées comme une étape obligatoire pour toute transaction. Pour la plupart d'entre nous, les enjeux professionnels sont moins élevés. Mais le principe est le même : sache ce que tes fichiers disent de toi avant qu'ils ne quittent ton contrôle.

Une checklist pratique avant de partager n'importe quel fichier

Tu n'as pas besoin de mémoriser chaque règle obscure. Pour 99 % des situations, cette checklist pratique est tout ce dont tu as besoin avant de cliquer sur « envoyer » ou « télécharger ». **1. Identifie le type de fichier et ses risques liés aux métadonnées.** Retiens juste les principaux. Les photos peuvent avoir des données GPS. Les documents Office peuvent avoir un auteur et un historique de révision. Les PDF peuvent avoir des données d'auteur et des chemins de création. Les fichiers audio transportent des balises ID3. Les fichiers vidéo transportent des données GPS, le modèle de l'appareil et des horodatages de création. **2. Évalue ton public.** C'est pour qui ? Envoyer une photo de famille à ta mère est peu risqué. Publier une photo sur un forum public ou envoyer une proposition à un nouveau client est plus risqué. Adapte ton effort à la menace réelle. **3. Utilise le bon outil pour la tâche.** Sur Windows, utilise l'outil de suppression de propriétés intégré ou ImageOptim sur Mac. Pour les fichiers Office, lance l'Inspecteur de document. Pour les PDF, utilise la fonction Nettoyer d'Acrobat ou ré-imprime en PDF. Pour les tâches en masse ou les changements de format, le processus de conversion de CocoConvert supprimera incidemment la plupart des métadonnées spécifiques au format comme effet secondaire. **4. Vérifie le résultat.** Après avoir supprimé ou converti, vérifie le résultat. Sur Windows, fais un clic droit > Propriétés > Détails. Sur Mac, ouvre dans Aperçu et va dans Outils > Afficher l'inspecteur > EXIF. Utilise ExifTool depuis la ligne de commande pour un vidage complet : 'exiftool -all filename.jpg'. Ne pars pas du principe que la suppression a fonctionné — confirme-le. **5. Rappelle-toi que le contenu n'est pas une métadonnée.** C'est crucial. Aucun outil ne supprimera ton numéro de sécurité sociale si tu l'as tapé dans le document. C'est un problème de contenu, et tu dois revoir les parties visibles de ton fichier séparément. **6. Pour les situations à haut risque, utilise des outils dédiés.** MAT2 (Metadata Anonymisation Toolkit 2) est un outil open-source utilisé par les professionnels de la sécurité qui gère des dizaines de formats de fichiers et est plus complet que la plupart des options grand public. Il est disponible sur Linux et via le système d'exploitation Tails, qui est conçu pour les cas d'utilisation à haut risque. Les métadonnées ne sont pas maléfiques. C'est une fonctionnalité utile qui est devenue un handicap lorsque nos fichiers ont commencé à parcourir le monde en un clic. Comprendre ce que tes fichiers transportent — et prendre 30 secondes pour les nettoyer avant de les partager — est une petite habitude qui améliore considérablement ta vie privée.

Que sont les métadonnées de fichier ? (Et pourquoi tu devrais les supprimer avant de partager) | CocoConvert Blog