Skip to content
Back to Blog
informational

O que são metadados de arquivos? (E por que você deveria removê-los antes de compartilhar)

2026-05-17 9 min read

O que realmente são os metadados de arquivos

Todo arquivo que você cria tem duas partes: o conteúdo que você vê e uma camada secreta de dados que a maioria dos softwares adiciona automaticamente. Essa camada oculta são os metadados — informações estruturadas sobre o arquivo, não o que está no arquivo. O nome vem do grego 'meta', que significa 'sobre'. Portanto, são literalmente dados sobre dados. Uma foto JPEG não é apenas um conjunto de pixels; ela também contém metadados EXIF que detalham o modelo da câmera, a lente, a velocidade do obturador, o ISO e — o mais importante — as coordenadas exatas de GPS de onde você a tirou. Um documento do Word armazena silenciosamente seu nome, sua empresa (a partir da sua licença do Office), quantos minutos você passou editando e até mesmo um histórico de texto excluído. O formato muda dependendo do tipo de arquivo. Imagens frequentemente usam os padrões EXIF (Exchangeable Image File Format) e IPTC (International Press Telecommunications Council). PDFs têm suas próprias propriedades e também usam o XMP (Extensible Metadata Platform). Arquivos do Office como DOCX e XLSX são, na verdade, arquivos ZIP, e armazenam metadados em um arquivo XML chamado core.xml dentro deles. Arquivos de áudio usam tags ID3 para guardar a arte do álbum e informações da faixa. Arquivos de vídeo usam uma mistura de dados no nível do contêiner (MOV, MP4) e no nível do codec. Nada disso é uma conspiração. Os engenheiros de software adicionam metadados por bons motivos: aplicativos de fotos os usam para organizar suas imagens por data e local, e seu reprodutor de música precisa das tags ID3 para mostrar a capa do álbum. O problema começa quando esses arquivos saem do ninho e viajam para muito além de seu contexto original.

Os campos de dados específicos que podem expor você

Sejamos claros: nem todos os metadados são um problema. Saber que um arquivo foi salvo a 96 DPI é uma curiosidade inútil. Mas alguns campos de metadados comuns têm sérias consequências para a privacidade e a segurança. As coordenadas de GPS em fotos são o exemplo mais famoso. Tire uma foto no seu iPhone com os Serviços de Localização ativados, e o iOS incorpora sua latitude e longitude precisas nas tags EXIF do arquivo. Poste essa foto online, e qualquer pessoa com uma ferramenta gratuita como o ExifTool ou o Jeffrey's Exif Viewer pode descobrir onde você mora, trabalha ou passa o tempo. Isso não é hipotético. Em 2012, um jornalista da Vice encontrou o esconderijo de John McAfee na Guatemala em parte analisando os dados de GPS de uma foto publicada com uma entrevista. Os campos de autor e organização em arquivos do Office são extraídos da sua licença de software. Se você redigir um contrato, o XML interno do arquivo listará seu nome completo e empresa. Envie isso para a outra parte em uma negociação, e eles saberão exatamente quem escreveu o primeiro rascunho e quando. O histórico de revisões e as alterações controladas são outro campo minado, podendo expor texto excluído, comentários privados e os nomes de todos os editores. Escritórios de advocacia já enviaram, por engano, documentos para a parte contrária com toda a sua estratégia revelada nas alterações controladas. Para PDFs, o bloco XMP pode conter o software usado para criar o arquivo (revelando seu sistema operacional e nível de atualização para um invasor), o autor e até mesmo o caminho original do arquivo, como `C:\Users\sarah.johnson\Documents\ClientProposals\AcmeCorp_draft3.pdf`. Apenas esse caminho já entrega o nome de um funcionário e a estrutura interna de suas pastas. E não se esqueça das miniaturas de visualização incorporadas. Em algumas imagens RAW e arquivos mais antigos do Office, elas podem mostrar um instantâneo do documento de um estágio anterior, o que significa que um conteúdo que você pensou ter excluído ainda pode estar visível.

Quem realmente lê metadados de arquivos (e como)

Você pode pensar que ler metadados exige algum tipo de habilidade de hacker. Não exige. Ferramentas gratuitas e comuns tornam isso ridiculamente fácil. O ExifTool de Phil Harvey é o padrão ouro; ele roda em todos os principais sistemas operacionais e lê metadados de mais de cem formatos de arquivo. Basta digitar 'exiftool nomedoarquivo.jpg' em um terminal, e você verá tudo. Para quem prefere uma interface gráfica, existem wrappers e ferramentas baseadas em navegador como Jimpl.com ou MetaPicz que permitem que você envie uma foto e veja seus dados instantaneamente. Para documentos do Office, é ainda mais simples. Você nem precisa de software especial. Apenas renomeie um arquivo .docx para .zip, abra o arquivo compactado e navegue até o arquivo docProps/core.xml com um editor de texto simples. Os dados brutos estão ali. Então, quem está realmente olhando? Mais gente do que você imagina. Jornalistas verificam todos os documentos que recebem de fontes. Advogados usam metadados como prova em tribunais; carimbos de data/hora EXIF já foram usados para provar quando uma foto foi realmente tirada, derrubando o testemunho de uma testemunha. Espiões corporativos os usam para mapear a organização de um concorrente. A polícia depende muito deles. O assassino em série BTK foi identificado no início dos anos 2000 em parte porque um disquete que ele enviou à polícia continha metadados em um documento do Word excluído que apontava para a 'Christ Lutheran Church' e um usuário chamado 'Dennis' — o assassino, Dennis Rader. Isso não é para ser alarmista. A maioria das pessoas que compartilha uma receita não está em perigo. Mas o risco aumenta com a sensibilidade do conteúdo. Um freelancer enviando um portfólio para um novo cliente tem um perfil de risco diferente de alguém compartilhando uma foto de família em um chat privado.

Como remover metadados antes de compartilhar

Vamos ser práticos. Veja como você pode remover metadados de seus arquivos, plataforma por plataforma. É mais fácil do que você pensa. **Para imagens no Windows:** Clique com o botão direito no arquivo, vá em Propriedades e, em seguida, na aba Detalhes. Na parte inferior, clique em 'Remover Propriedades e Informações Pessoais'. Isso permite que você crie uma cópia limpa e lida com a maioria dos dados EXIF, embora às vezes possa deixar passar tags XMP. **Para imagens no macOS:** Não confie no aplicativo Pré-Visualização (Preview) integrado; ele é notoriamente ruim nisso. A melhor escolha é o ImageOptim, uma ferramenta gratuita e de código aberto que remove completamente dados EXIF, IPTC e XMP, ao mesmo tempo que comprime o arquivo. Alternativamente, você pode exportar do aplicativo Fotos, mas primeiro certifique-se de ter desativado os dados de localização em Fotos > Preferências > iCloud > desmarcando 'Incluir informações de localização para itens publicados'. **Para arquivos do Word e Excel:** Antes de enviar qualquer coisa externamente, crie o hábito de ir em Arquivo > Informações > Verificar se há problemas > Inspecionar Documento. O Inspetor de Documentos encontrará e oferecerá a remoção de comentários, revisões, informações do autor e outros dados ocultos. Isso é essencial. Apenas esteja ciente de que a remoção do histórico de revisões é permanente, então salve uma cópia mestre para si mesmo, se precisar. **Para PDFs:** Qualquer pessoa que já lutou com um PDF teimoso sabe que eles têm vida própria. Para metadados, a solução mais robusta é a função Redigir > Limpar Documento no Adobe Acrobat Pro pago. Se você não tiver o Acrobat, uma boa alternativa é 'imprimir' o arquivo para um novo PDF, já que a impressora de PDF integrada do macOS remove a maioria dos metadados, mas nem sempre todos. **Usando o CocoConvert:** Quando você converte um arquivo usando o CocoConvert, como transformar um DOCX em PDF ou um JPEG em PNG, o processo naturalmente descarta a maior parte dos metadados originais. Estamos construindo um arquivo totalmente novo, então coisas como dados de GPS EXIF e campos de autor do Word não são transferidos. Pense nisso como um efeito colateral benéfico, não um recurso de segurança dedicado. Para arquivos verdadeiramente sensíveis, use primeiro um higienizador dedicado. Somos uma ferramenta de conversão, não uma ferramenta forense, e queremos ser honestos sobre isso.

O que a conversão remove (e o que não remove)

Como o CocoConvert é um conversor de arquivos, vamos ser específicos sobre o que acontece com os metadados durante um trabalho. Quando você converte um JPEG para PNG, criamos um novo arquivo PNG a partir dos pixels de origem. O PNG tem sua própria maneira de armazenar metadados (em blocos tEXt, iTXt e zTXt), mas não copiamos os dados EXIF originais para eles. Na prática, isso significa que as coordenadas de GPS, o modelo da câmera e as informações da lente do seu JPEG desaparecem no PNG final. O mesmo vale para conversões de JPEG para WebP. Quando você converte um DOCX para PDF, estamos gerando o PDF a partir da aparência final e renderizada do documento. O campo de autor no novo PDF geralmente listará o software de conversão, não o autor original do Word. Todas as suas alterações controladas e o histórico de revisões são achatados e desaparecem, porque um PDF representa apenas aquele estado final. Mas existem algumas armadilhas. A principal são os arquivos incorporados. Se o seu documento do Word de origem contiver uma foto inserida com seus próprios dados EXIF, essa foto pode manter seus metadados quando for incorporada ao PDF final. Portanto, o PDF ainda pode conter dados de GPS daquela foto específica. Além disso, isso deve ser óbvio, mas vamos dizer mesmo assim: a conversão não remove informações sensíveis do conteúdo do seu arquivo. Se o seu endereço estiver digitado no documento, ele ainda estará lá. Isso é conteúdo, não metadados. Para arquivos de áudio, converter um MP3 para AAC com o CocoConvert não copia as tags ID3 por padrão. A conclusão é: a conversão com o CocoConvert é uma ótima primeira linha de defesa que reduz significativamente a exposição de metadados para o uso diário. Apenas não a confunda com uma ferramenta de higienização dedicada e de alta segurança.

Metadados em contextos profissionais e jurídicos

Se você trabalha em direito, finanças, saúde ou outra indústria regulamentada, os metadados não são apenas um experimento mental sobre privacidade — são um campo minado de conformidade. Sob a HIPAA, por exemplo, os metadados podem fazer parte das informações de saúde protegidas (PHI). Um exame médico pode ter dados de GPS apontando para uma clínica e uma tag de artista com o nome do paciente. Essa combinação é PHI, mesmo que a imagem em si seja anonimizada. O Escritório de Direitos Civis do HHS exige especificamente que os metadados sejam considerados ao desidentificar registros. Em processos judiciais, os metadados são totalmente passíveis de descoberta. A Regra Federal de Processo Civil 34 nos EUA abrange todas as informações armazenadas eletronicamente (ESI), e os tribunais confirmaram repetidamente que os metadados fazem parte dessa ESI. Se você for instruído a preservar documentos para um litígio e remover os metadados, isso é espoliação de provas. É um erro desastroso que pode fazer você perder o caso. Para jornalistas e suas fontes, isso não é teórico; é uma questão de segurança física. É por isso que existem ferramentas como o SecureDrop, usado pela Freedom of the Press Foundation, The New York Times e The Guardian — elas removem automaticamente os metadados dos envios para proteger as fontes. Se você é uma fonte, deve presumir que todo arquivo que envia está marcado com sua identidade, a menos que você o tenha limpado pessoalmente. No mundo das fusões e aquisições corporativas, os metadados em uma sala de dados podem revelar estratégias de negociação, avaliações privadas e identidades de consultores. As contrapartes inteligentes absolutamente procuram por essas informações. Grandes escritórios de advocacia agora tratam a revisão de metadados como uma etapa obrigatória para qualquer transação. Para a maioria de nós, os riscos profissionais são menores. Mas o princípio é o mesmo: saiba o que seus arquivos estão dizendo sobre você antes que eles saiam do seu controle.

Uma lista de verificação prática antes de compartilhar qualquer arquivo

Você não precisa memorizar todas as regras obscuras. Para 99% das situações, esta lista de verificação prática é tudo o que você precisa antes de clicar em 'enviar' ou 'fazer upload'. **1. Identifique o tipo de arquivo e seus riscos de metadados.** Apenas lembre-se dos principais. Fotos podem ter dados de GPS. Documentos do Office podem ter histórico de autor e revisões. PDFs podem ter dados de autor e caminhos de criação. Arquivos de áudio carregam tags ID3. Arquivos de vídeo carregam GPS, modelo do dispositivo e carimbos de data/hora de criação. **2. Avalie seu público.** Para quem é isso? Enviar uma foto de família para sua mãe é de baixo risco. Postar uma foto em um fórum público ou enviar uma proposta para um novo cliente é de maior risco. Adeque seu esforço à ameaça real. **3. Use a ferramenta certa para o trabalho.** No Windows, use o removedor de propriedades integrado ou o ImageOptim no Mac. Para arquivos do Office, execute o Inspetor de Documentos. Para PDFs, use a função Limpar do Acrobat ou imprima novamente para PDF. Para trabalhos em lote ou mudanças de formato, o processo de conversão do CocoConvert removerá incidentalmente a maioria dos metadados específicos do formato como um subproduto. **4. Verifique o resultado.** Após remover ou converter, verifique o resultado. No Windows, clique com o botão direito > Propriedades > Detalhes. No Mac, abra no Pré-Visualização e vá para Ferramentas > Mostrar Inspetor > EXIF. Use o ExifTool na linha de comando para um despejo completo: 'exiftool -all nomedoarquivo.jpg'. Não presuma que a remoção funcionou — confirme. **5. Lembre-se de que conteúdo não é metadados.** Isso é crucial. Nenhuma ferramenta removerá seu número de CPF se você o digitou no documento. Isso é um problema de conteúdo, e você precisa revisar as partes visíveis do seu arquivo separadamente. **6. Para situações de alto risco, use ferramentas dedicadas.** O MAT2 (Metadata Anonymisation Toolkit 2) é uma ferramenta de código aberto usada por profissionais de segurança que lida com dezenas de formatos de arquivo e é mais completa do que a maioria das opções para o consumidor. Está disponível no Linux e através do sistema operacional Tails, que é projetado para casos de uso de alto risco. Metadados não são malignos. São um recurso útil que se tornou uma vulnerabilidade quando nossos arquivos começaram a viajar pelo mundo com o clique de um botão. Entender o que seus arquivos carregam — e levar 30 segundos para limpá-los antes de compartilhar — é um pequeno hábito que melhora drasticamente sua privacidade.