Skip to content
Back to Blog
informational

फ़ाइल मेटाडेटा क्या है? (और शेयर करने से पहले आपको इसे क्यों हटाना चाहिए)

2026-05-17 9 min read

फ़ाइल मेटाडेटा असल में क्या है

आप जो भी फ़ाइल बनाते हैं उसके दो हिस्से होते हैं: वह सामग्री जो आप देखते हैं, और डेटा की एक गुप्त परत जिसे ज़्यादातर सॉफ़्टवेयर अपने आप जोड़ देते हैं। यह छिपी हुई परत ही मेटाडेटा है—फ़ाइल के बारे में संरचित जानकारी, न कि फ़ाइल के अंदर क्या है। यह नाम ग्रीक शब्द 'मेटा' से आया है, जिसका अर्थ है 'के बारे में'। तो यह सचमुच डेटा के बारे में डेटा है। एक JPEG फ़ोटो सिर्फ़ पिक्सेल नहीं होती; इसमें EXIF मेटाडेटा भी होता है जिसमें कैमरा मॉडल, लेंस, शटर स्पीड, ISO और—सबसे महत्वपूर्ण—वह सटीक GPS निर्देशांक होता है जहाँ आपने इसे लिया था। एक Word दस्तावेज़ चुपचाप आपका नाम, आपकी कंपनी (आपके Office लाइसेंस से), आपने संपादन में कितने मिनट बिताए, और यहाँ तक कि हटाए गए टेक्स्ट का इतिहास भी संग्रहीत करता है। फ़ाइल के प्रकार के आधार पर प्रारूप बदलता है। छवियाँ अक्सर EXIF (Exchangeable Image File Format) और IPTC (International Press Telecommunications Council) मानकों का उपयोग करती हैं। PDF की अपनी प्रॉपर्टीज़ होती हैं और वे XMP (Extensible Metadata Platform) का भी उपयोग करती हैं। DOCX और XLSX जैसी Office फ़ाइलें वास्तव में ZIP आर्काइव होती हैं, और वे मेटाडेटा को अंदर core.xml नामक XML फ़ाइल में संग्रहीत करती हैं। ऑडियो फ़ाइलें एल्बम आर्ट और ट्रैक की जानकारी रखने के लिए ID3 टैग का उपयोग करती हैं। वीडियो फ़ाइलें कंटेनर-स्तर (MOV, MP4) और कोडेक-स्तर के डेटा का मिश्रण उपयोग करती हैं। यह कोई साज़िश नहीं है। सॉफ़्टवेयर इंजीनियर अच्छे कारणों से मेटाडेटा जोड़ते हैं: फ़ोटो ऐप्स इसका उपयोग आपकी तस्वीरों को तारीख और स्थान के अनुसार छाँटने के लिए करते हैं, और आपके म्यूज़िक प्लेयर को एल्बम आर्ट दिखाने के लिए ID3 टैग की आवश्यकता होती है। मुश्किल तब खड़ी होती है जब ये फ़ाइलें अपने मूल दायरे से बाहर निकलकर कहीं और पहुँच जाती हैं।

वे विशिष्ट डेटा फ़ील्ड जो आपकी जानकारी उजागर कर सकते हैं

चलिए स्पष्ट करते हैं: सारा मेटाडेटा समस्या नहीं है। यह जानना कि एक फ़ाइल 96 DPI पर सहेजी गई थी, एक बेकार की जानकारी है। लेकिन कुछ सामान्य मेटाडेटा फ़ील्ड के गंभीर गोपनीयता और सुरक्षा परिणाम होते हैं। फ़ोटो में GPS निर्देशांक इसका सबसे प्रसिद्ध उदाहरण है। अपने iPhone पर लोकेशन सेवाएँ चालू करके एक फ़ोटो लें, और iOS आपकी सटीक अक्षांश और देशांतर को फ़ाइल के EXIF टैग में एम्बेड कर देता है। उस फ़ोटो को ऑनलाइन पोस्ट करें, और ExifTool या Jeffrey's Exif Viewer जैसे मुफ़्त टूल वाला कोई भी व्यक्ति यह पता लगा सकता है कि आप कहाँ रहते हैं, काम करते हैं, या घूमते हैं। यह कोई काल्पनिक बात नहीं है। 2012 में, एक वाइस पत्रकार ने ग्वाटेमाला में जॉन मैकेफी का ठिकाना आंशिक रूप से एक साक्षात्कार के साथ प्रकाशित एक फ़ोटो में GPS डेटा का विश्लेषण करके पाया था। Office फ़ाइलों में लेखक और संगठन फ़ील्ड आपके सॉफ़्टवेयर लाइसेंस से लिए जाते हैं। यदि आप एक अनुबंध का मसौदा तैयार करते हैं, तो फ़ाइल की आंतरिक XML में आपका पूरा नाम और कंपनी सूचीबद्ध होगी। इसे बातचीत में दूसरी पार्टी को भेजें, और वे ठीक-ठीक जानते हैं कि पहला मसौदा किसने और कब लिखा था। संशोधन इतिहास और ट्रैक किए गए परिवर्तन एक और बारूदी सुरंग हैं, जो संभावित रूप से हटाए गए टेक्स्ट, निजी टिप्पणियों और हर संपादक के नामों को उजागर कर सकते हैं। यह एक जाना-माना तथ्य है कि लॉ फ़र्मों ने गलती से विरोधी वकील को ऐसे दस्तावेज़ भेज दिए हैं, जिनमें ट्रैक किए गए बदलावों में उनकी पूरी रणनीति उजागर हो गई थी। PDF के लिए, XMP ब्लॉक में फ़ाइल बनाने के लिए उपयोग किया गया सॉफ़्टवेयर (जो एक हमलावर को आपके OS और पैच स्तर का खुलासा करता है), लेखक, और यहाँ तक कि मूल फ़ाइल पथ भी हो सकता है, जैसे `C:\Users\sarah.johnson\Documents\ClientProposals\AcmeCorp_draft3.pdf`। यह पथ अकेले एक कर्मचारी का नाम और आपकी आंतरिक फ़ोल्डर संरचना बता देता है। और एम्बेडेड थंबनेल प्रीव्यू को न भूलें। कुछ RAW छवियों और पुरानी Office फ़ाइलों में, ये दस्तावेज़ के एक पुराने चरण का स्नैपशॉट दिखा सकते हैं, जिसका अर्थ है कि जो सामग्री आपने सोची थी कि हटा दी गई है, वह अभी भी दिखाई दे सकती है।

फ़ाइल मेटाडेटा असल में कौन पढ़ता है (और कैसे)

आपको शायद लगता होगा कि मेटाडेटा पढ़ने के लिए किसी तरह के हैकर कौशल की ज़रूरत होती है। ऐसा बिल्कुल नहीं है। मुफ़्त, सामान्य टूल इसे हास्यास्पद रूप से आसान बना देते हैं। फिल हार्वे का ExifTool इसका स्वर्ण मानक है; यह हर प्रमुख OS पर चलता है और सौ से अधिक फ़ाइल स्वरूपों से मेटाडेटा पढ़ता है। बस एक टर्मिनल में 'exiftool filename.jpg' टाइप करें, और आपको सब कुछ दिखाई देगा। जो लोग GUI पसंद करते हैं, उनके लिए रैपर और ब्राउज़र-आधारित टूल जैसे Jimpl.com या MetaPicz हैं जो आपको एक फ़ोटो अपलोड करने और उसका डेटा तुरंत देखने देते हैं। Office दस्तावेज़ों के लिए, यह और भी सरल है। आपको किसी विशेष सॉफ़्टवेयर की आवश्यकता ही नहीं है। बस एक .docx फ़ाइल का नाम बदलकर .zip करें, आर्काइव खोलें, और एक सादे टेक्स्ट एडिटर के साथ docProps/core.xml फ़ाइल पर जाएँ। कच्चा डेटा वहीं होता है। तो वास्तव में कौन देख रहा है? जितने लोगों की आप कल्पना कर सकते हैं, उससे कहीं ज़्यादा। पत्रकार स्रोतों से प्राप्त हर दस्तावेज़ की जाँच करते हैं। वकील मेटाडेटा को अदालती सबूत के रूप में उपयोग करते हैं; EXIF टाइमस्टैम्प का उपयोग यह साबित करने के लिए किया गया है कि एक फ़ोटो वास्तव में कब ली गई थी, जिससे एक गवाह की गवाही को ध्वस्त कर दिया गया। कॉर्पोरेट जासूस इसका उपयोग एक प्रतियोगी के संगठन का नक्शा बनाने के लिए करते हैं। कानून प्रवर्तन इस पर बहुत अधिक निर्भर करता है। 2000 के दशक की शुरुआत में BTK सीरियल किलर की पहचान आंशिक रूप से इसलिए हुई क्योंकि उसने पुलिस को जो फ्लॉपी डिस्क भेजी थी, उसमें एक हटाए गए Word दस्तावेज़ में मेटाडेटा था जो 'क्राइस्ट लूथरन चर्च' और 'डेनिस' नामक एक उपयोगकर्ता की ओर इशारा करता था—जो हत्यारा, डेनिस रेडर था। इसका मतलब आपको डराना नहीं है। एक रेसिपी साझा करने वाले अधिकांश लोग खतरे में नहीं हैं। लेकिन सामग्री की संवेदनशीलता के साथ जोखिम बढ़ता है। एक नए क्लाइंट को पोर्टफोलियो भेजने वाले फ्रीलांसर का जोखिम प्रोफ़ाइल एक निजी चैट पर परिवार की तस्वीर साझा करने वाले किसी व्यक्ति से अलग होता है।

शेयर करने से पहले मेटाडेटा कैसे हटाएं

चलिए, अब व्यावहारिक बात करते हैं। यहाँ बताया गया है कि आप अपनी फ़ाइलों से मेटाडेटा कैसे हटा सकते हैं, प्लेटफ़ॉर्म-दर-प्लेटफ़ॉर्म। यह आपके विचार से कहीं ज़्यादा आसान है। **Windows पर छवियों के लिए:** फ़ाइल पर राइट-क्लिक करें, प्रॉपर्टीज़ पर जाएँ, फिर विवरण टैब पर। सबसे नीचे, 'गुण और व्यक्तिगत जानकारी निकालें' पर क्लिक करें। यह आपको एक साफ़ प्रतिलिपि बनाने देता है और अधिकांश EXIF डेटा को संभालता है, हालांकि यह कभी-कभी XMP टैग को छोड़ सकता है। **macOS पर छवियों के लिए:** अंतर्निहित प्रीव्यू ऐप पर भरोसा न करें; यह इस काम में कुख्यात रूप से खराब है। सबसे अच्छा विकल्प ImageOptim है, एक मुफ़्त और ओपन-सोर्स टूल जो EXIF, IPTC और XMP डेटा को पूरी तरह से हटा देता है और साथ ही फ़ाइल को कंप्रेस भी करता है। वैकल्पिक रूप से, आप फ़ोटोज़ ऐप से निर्यात कर सकते हैं, लेकिन पहले सुनिश्चित करें कि आपने फ़ोटोज़ > प्रेफ़रेंसेज़ > iCloud > 'प्रकाशित आइटम के लिए स्थान की जानकारी शामिल करें' को बंद कर दिया है। **Word और Excel फ़ाइलों के लिए:** बाहर कुछ भी भेजने से पहले, फ़ाइल > जानकारी > समस्याओं की जाँच करें > दस्तावेज़ का निरीक्षण करें पर जाने की आदत डालें। दस्तावेज़ निरीक्षक टिप्पणियों, संशोधनों, लेखक की जानकारी और अन्य छिपे हुए डेटा को ढूंढेगा और हटाने की पेशकश करेगा। यह आवश्यक है। बस ध्यान रखें कि संशोधन इतिहास को हटाना स्थायी है, इसलिए यदि आपको इसकी आवश्यकता है तो अपने लिए एक मास्टर कॉपी सहेजें। **PDF के लिए:** जिस किसी ने भी एक ज़िद्दी PDF से जूझना पड़ा है, वह जानता है कि उनकी अपनी ही एक दुनिया होती है। मेटाडेटा के लिए, सबसे मज़बूत समाधान पेड Adobe Acrobat Pro में Redact > Sanitize Document फ़ंक्शन है। यदि आपके पास Acrobat नहीं है, तो एक अच्छा समाधान फ़ाइल को एक नए PDF में 'प्रिंट' करना है, क्योंकि macOS का अंतर्निहित PDF प्रिंटर अधिकांश, लेकिन हमेशा नहीं, सभी मेटाडेटा को हटा देता है। **CocoConvert का उपयोग करना:** जब आप CocoConvert का उपयोग करके किसी फ़ाइल को बदलते हैं, जैसे DOCX को PDF में या JPEG को PNG में बदलना, तो प्रक्रिया स्वाभाविक रूप से अधिकांश मूल मेटाडेटा को हटा देती है। हम एक बिल्कुल नई फ़ाइल बना रहे हैं, इसलिए EXIF GPS डेटा और Word लेखक फ़ील्ड जैसी चीज़ें आगे नहीं ले जाई जाती हैं। इसे एक फ़ायदेमंद साइड-इफ़ेक्ट समझें, न कि कोई समर्पित सुरक्षा सुविधा। वास्तव में संवेदनशील फ़ाइलों के लिए, पहले एक समर्पित सैनिटाइज़र का उपयोग करें। हम एक रूपांतरण उपकरण हैं, फोरेंसिक उपकरण नहीं, और हम इस बारे में ईमानदार रहना चाहते हैं।

कन्वर्ज़न क्या हटाता है (और क्या नहीं)

चूंकि CocoConvert एक फ़ाइल कनवर्टर है, आइए इस बारे में विशिष्ट हों कि एक काम के दौरान मेटाडेटा का क्या होता है। जब आप एक JPEG को PNG में बदलते हैं, तो हम स्रोत पिक्सेल से एक नई PNG फ़ाइल बनाते हैं। PNG का मेटाडेटा संग्रहीत करने का अपना तरीका है (tEXt, iTXt, और zTXt चंक्स में), लेकिन हम मूल EXIF डेटा को उनमें कॉपी नहीं करते हैं। व्यवहार में, इसका मतलब है कि आपके JPEG से GPS निर्देशांक, कैमरा मॉडल और लेंस की जानकारी अंतिम PNG में चली जाती है। यही बात JPEG-to-WebP रूपांतरणों के लिए भी सच है। जब आप एक DOCX को PDF में बदलते हैं, तो हम दस्तावेज़ के अंतिम, प्रस्तुत रूप से PDF उत्पन्न कर रहे हैं। नई PDF में लेखक फ़ील्ड आमतौर पर रूपांतरण सॉफ़्टवेयर को सूचीबद्ध करेगा, न कि Word से मूल लेखक को। आपके सभी ट्रैक किए गए परिवर्तन और संशोधन इतिहास समतल हो जाते हैं और चले जाते हैं, क्योंकि एक PDF केवल उस एक अंतिम स्थिति का प्रतिनिधित्व करता है। लेकिन इसमें कुछ ख़तरे भी हैं। सबसे बड़ा ख़तरा एम्बेडेड फ़ाइलें हैं। यदि आपके स्रोत Word दस्तावेज़ में अपने EXIF डेटा के साथ एक डाली गई फ़ोटो है, तो वह फ़ोटो अंतिम PDF के अंदर एम्बेड होने पर अपना मेटाडेटा बनाए रख सकती है। तो PDF में अभी भी उस एक तस्वीर से GPS डेटा हो सकता है। इसके अलावा, यह बात शायद आपको पता होगी, लेकिन हम फिर भी इसे कहेंगे: रूपांतरण आपकी फ़ाइल की सामग्री से संवेदनशील जानकारी नहीं हटाता है। यदि आपका पता दस्तावेज़ में टाइप किया गया है, तो वह वहीं रहेगा। वह सामग्री है, मेटाडेटा नहीं। ऑडियो फ़ाइलों के लिए, CocoConvert के साथ एक MP3 को AAC में बदलने पर डिफ़ॉल्ट रूप से ID3 टैग कॉपी नहीं होते हैं। लब्बोलुआब यह है: CocoConvert के साथ रूपांतरण एक बेहतरीन पहली रक्षा पंक्ति है जो रोज़मर्रा के उपयोग के लिए मेटाडेटा एक्सपोज़र को काफ़ी कम कर देती है। बस इसे एक समर्पित, उच्च-सुरक्षा सैनिटाइज़ेशन टूल समझने की गलती न करें।

पेशेवर और कानूनी संदर्भों में मेटाडेटा

यदि आप कानून, वित्त, स्वास्थ्य सेवा, या किसी अन्य विनियमित उद्योग में काम करते हैं, तो मेटाडेटा केवल एक गोपनीयता का विचार-प्रयोग नहीं है—यह अनुपालन की एक बारूदी सुरंग है। उदाहरण के लिए, HIPAA के तहत, मेटाडेटा संरक्षित स्वास्थ्य जानकारी (PHI) का हिस्सा हो सकता है। एक मेडिकल स्कैन में एक क्लिनिक की ओर इशारा करने वाला GPS डेटा हो सकता है, और रोगी के नाम के साथ एक कलाकार टैग हो सकता है। वह संयोजन PHI है, भले ही छवि स्वयं गुमनाम हो। HHS ऑफ़िस फ़ॉर सिविल राइट्स विशेष रूप से यह आवश्यक करता है कि रिकॉर्ड को डी-आइडेंटिफ़ाई करते समय मेटाडेटा पर विचार किया जाए। कानूनी कार्यवाही में, मेटाडेटा पूरी तरह से खोजा जा सकता है। अमेरिका में नागरिक प्रक्रिया का संघीय नियम 34 सभी इलेक्ट्रॉनिक रूप से संग्रहीत जानकारी (ESI) को कवर करता है, और अदालतों ने बार-बार पुष्टि की है कि मेटाडेटा उस ESI का हिस्सा है। यदि आपको मुकदमेबाजी के लिए दस्तावेज़ों को संरक्षित करने के लिए कहा जाता है और आप मेटाडेटा हटा देते हैं, तो यह सबूतों का विनाश है। यह एक विनाशकारी ग़लती है जिसके कारण आप केस हार सकते हैं। पत्रकारों और उनके स्रोतों के लिए, यह सैद्धांतिक नहीं है; यह शारीरिक सुरक्षा का मामला है। यही कारण है कि SecureDrop जैसे उपकरण, जिनका उपयोग फ़्रीडम ऑफ़ द प्रेस फ़ाउंडेशन, द न्यूयॉर्क टाइम्स और द गार्डियन द्वारा किया जाता है, मौजूद हैं—वे स्रोतों की सुरक्षा के लिए सबमिशन से मेटाडेटा को स्वचालित रूप से हटा देते हैं। यदि आप एक स्रोत हैं, तो आपको यह मान लेना चाहिए कि आपके द्वारा भेजी गई हर फ़ाइल आपकी पहचान के साथ टैग की गई है जब तक कि आपने इसे व्यक्तिगत रूप से साफ़ नहीं किया हो। कॉर्पोरेट विलय और अधिग्रहण की दुनिया में, एक डेटा रूम में मेटाडेटा बातचीत की रणनीतियों, निजी मूल्यांकनों और सलाहकार की पहचान को उजागर कर सकता है। चतुर प्रतिपक्ष निश्चित रूप से इस जानकारी की तलाश करते हैं। प्रमुख लॉ फ़र्में अब किसी भी लेनदेन के लिए मेटाडेटा समीक्षा को एक अनिवार्य कदम मानती हैं। हम में से अधिकांश के लिए, पेशेवर दांव कम हैं। लेकिन सिद्धांत वही है: यह जानें कि आपकी फ़ाइलें आपके नियंत्रण से बाहर जाने से पहले आपके बारे में क्या कह रही हैं।

कोई भी फ़ाइल शेयर करने से पहले एक व्यावहारिक चेकलिस्ट

आपको हर छोटा-मोटा नियम याद रखने की ज़रूरत नहीं है। 99% स्थितियों के लिए, 'भेजें' या 'अपलोड' करने से पहले यह व्यावहारिक चेकलिस्ट ही काफ़ी है। **1. फ़ाइल प्रकार और उसके मेटाडेटा जोखिमों को पहचानें।** बस बड़े वाले याद रखें। फ़ोटो में GPS डेटा हो सकता है। Office दस्तावेज़ों में लेखक और संशोधन इतिहास हो सकता है। PDF में लेखक डेटा और निर्माण पथ हो सकते हैं। ऑडियो फ़ाइलें ID3 टैग ले जाती हैं। वीडियो फ़ाइलें GPS, डिवाइस मॉडल और निर्माण टाइमस्टैम्प ले जाती हैं। **2. अपने दर्शकों का आकलन करें।** यह किसके लिए है? अपनी माँ को परिवार की तस्वीर भेजना कम जोखिम वाला है। एक सार्वजनिक फ़ोरम पर एक तस्वीर पोस्ट करना या एक नए क्लाइंट को एक प्रस्ताव भेजना अधिक जोखिम वाला है। जितना बड़ा ख़तरा हो, उतनी ही सावधानी बरतें। **3. काम के लिए सही टूल का उपयोग करें।** Windows पर, अंतर्निहित प्रॉपर्टी रिमूवर या Mac पर ImageOptim का उपयोग करें। Office फ़ाइलों के लिए, दस्तावेज़ निरीक्षक चलाएँ। PDF के लिए, Acrobat के सैनिटाइज़ फ़ंक्शन का उपयोग करें या PDF में फिर से प्रिंट करें। थोक नौकरियों या प्रारूप परिवर्तनों के लिए, CocoConvert की रूपांतरण प्रक्रिया एक उप-उत्पाद के रूप में अधिकांश प्रारूप-विशिष्ट मेटाडेटा को संयोग से हटा देगी। **4. आउटपुट की पुष्टि करें।** हटाने या बदलने के बाद, परिणाम की जाँच करें। Windows पर, राइट-क्लिक करें > गुण > विवरण। Mac पर, प्रीव्यू में खोलें और टूल्स > शो इंस्पेक्टर > EXIF पर जाएँ। पूरी जानकारी के लिए कमांड लाइन से ExifTool का उपयोग करें: 'exiftool -all filename.jpg'। यह मानकर न चलें कि डेटा हट गया होगा - इसकी पुष्टि करें। **5. याद रखें कि सामग्री मेटाडेटा नहीं है।** यह महत्वपूर्ण है। कोई भी टूल आपका सामाजिक सुरक्षा नंबर नहीं हटाएगा यदि आपने इसे दस्तावेज़ में टाइप किया है। यह एक सामग्री समस्या है, और आपको अपनी फ़ाइल के दृश्य भागों की अलग से समीक्षा करने की आवश्यकता है। **6. उच्च-दांव वाली स्थितियों के लिए, समर्पित उपकरणों का उपयोग करें।** MAT2 (मेटाडेटा एनोनिमाइजेशन टूलकिट 2) एक ओपन-सोर्स टूल है जिसका उपयोग सुरक्षा पेशेवरों द्वारा किया जाता है जो दर्जनों फ़ाइल स्वरूपों को संभालता है और अधिकांश उपभोक्ता विकल्पों की तुलना में अधिक संपूर्ण है। यह Linux पर और Tails ऑपरेटिंग सिस्टम के माध्यम से उपलब्ध है, जिसे उच्च-जोखिम वाले उपयोग के मामलों के लिए डिज़ाइन किया गया है। मेटाडेटा कोई बुरी चीज़ नहीं है। यह एक उपयोगी सुविधा है जो एक देनदारी बन गई जब हमारी फ़ाइलें एक बटन के क्लिक पर दुनिया भर में यात्रा करने लगीं। यह समझना कि आपकी फ़ाइलें क्या ले जाती हैं—और उन्हें साझा करने से पहले साफ़ करने के लिए 30 सेकंड का समय लेना—एक छोटी सी आदत है जो आपकी गोपनीयता में नाटकीय रूप से सुधार करती है।