Skip to content
Back to Blog
format-comparisons

DOCX बनाम DOC: माइक्रोसॉफ्ट ने यह बदलाव क्यों किया

2026-05-17 8 min read

एक फॉर्मेट जो 20 साल चला—और यह एक समस्या क्यों थी

.doc फॉर्मेट, जिसे 1983 में Word for DOS के साथ पेश किया गया था, दो दशकों से अधिक समय तक माइक्रोसॉफ्ट का डिफ़ॉल्ट वर्ड प्रोसेसिंग फॉर्मेट था। जब तक Office 2003 आया, .doc फाइलें हर जगह थीं। वे कॉर्पोरेट सर्वर, सरकारी सिस्टम, विश्वविद्यालय नेटवर्क और निश्चित रूप से, घरेलू कंप्यूटरों पर मौजूद थीं। यह फॉर्मेट काम करता था, लेकिन इसके लंबे इतिहास का गंभीर बोझ भी इसके साथ था। इस फॉर्मेट की मुख्य समस्या इसकी अपारदर्शिता थी। एक .doc फ़ाइल एक प्रोप्राइटरी बाइनरी ब्लॉब है, एक ऐसी संरचना जिसे केवल माइक्रोसॉफ्ट ही सही मायने में समझता था। इसने थर्ड-पार्टी डेवलपर्स के लिए एक दुःस्वप्न पैदा कर दिया। जो कोई भी ऐसा सॉफ़्टवेयर बनाना चाहता था जो .doc फ़ाइलों को पढ़ या लिख सके, उसे स्पेसिफिकेशन को रिवर्स-इंजीनियर करना पड़ता था, जो एक दर्दनाक प्रक्रिया थी जिसके कारण अनिवार्य रूप से कम्पैटिबिलिटी बग, गड़बड़ फॉर्मेटिंग और डेटा हानि होती थी। सालों तक, WordPerfect, LibreOffice, और Google Docs सभी ने完璧 .doc फिडेलिटी हासिल करने के लिए एक हारी हुई लड़ाई लड़ी। सुरक्षा एक और बड़ा मुद्दा था। चूंकि .doc फाइलें उस अपारदर्शी बाइनरी कंटेनर के अंदर शक्तिशाली VBA मैक्रोज़ एम्बेड कर सकती थीं, इसलिए एंटीवायरस टूल और ईमेल फिल्टर को विश्वसनीय रूप से उनकी जांच करने में संघर्ष करना पड़ता था। इस डिज़ाइन की खामी ने 1990 के दशक के अंत में मैक्रो वायरस के प्रकोप को बढ़ावा देने में मदद की। 1999 में मेलिसा वायरस, जिसने अनुमानित दस लाख कंप्यूटरों को संक्रमित किया था, इतनी प्रभावी ढंग से फैला क्योंकि इसके दुर्भावनापूर्ण कोड को एक सामान्य दिखने वाले दस्तावेज़ के अंदर छिपाना आसान था। नई सहस्राब्दी तक, दबाव बढ़ रहा था। यूरोपीय आयोग और कई अमेरिकी संघीय एजेंसियों सहित सरकारों और बड़े उद्यमों ने सार्वजनिक रूप से यह सवाल करना शुरू कर दिया कि क्या प्रोप्राइटरी बाइनरी फॉर्मेट लंबी अवधि के सार्वजनिक रिकॉर्ड के लिए उपयुक्त थे। माइक्रोसॉफ्ट को एक विश्वसनीय, खुले जवाब की जरूरत थी।

DOCX असल में अंदर से क्या है

जब माइक्रोसॉफ्ट ने Office 2007 के साथ DOCX लॉन्च किया, तो यह सिर्फ एक पुरानी फ़ाइल के लिए एक नया एक्सटेंशन नहीं था। यह ओपन पैकेजिंग कन्वेंशंस (OPC) नामक एक स्पेसिफिकेशन पर बनाया गया एक पूर्ण पुनर्निर्माण था, जो खुद ZIP कम्प्रेशन पर आधारित है। यह सिर्फ एक सामान्य जानकारी नहीं है - यह समझने की कुंजी है कि DOCX को क्या बेहतर बनाता है। यहाँ एक ट्रिक है: किसी भी .docx फ़ाइल को लें, उसका नाम बदलकर अंत में .zip कर दें, और उसे खोलें। आपको एक मानक फ़ोल्डर संरचना दिखाई देगी। अंदर, आपको XML फाइलें, रिलेशनशिप मैपिंग के लिए एक _rels डायरेक्टरी, और वास्तविक दस्तावेज़ रखने वाली एक word/ सबडायरेक्टरी मिलेगी। मुख्य टेक्स्ट word/document.xml में रहता है। स्टाइल word/styles.xml में परिभाषित होते हैं। छवियाँ word/media/ में अलग फाइलों के रूप में संग्रहीत होती हैं, और लेखक और निर्माण तिथि जैसे मेटाडेटा docProps/core.xml में होते हैं। इस आर्किटेक्चर के गहरे व्यावहारिक लाभ हैं। XML मानव-पठनीय है, जिसका अर्थ है कि एक डेवलपर document.xml को टेक्स्ट एडिटर में खोल सकता है और दस्तावेज़ की सामग्री और संरचना को स्पष्ट रूप से देख सकता है। इस पारदर्शिता ने Google, Apple, LibreOffice और अनगिनत अन्य विक्रेताओं के लिए विश्वसनीय DOCX समर्थन बनाना बहुत आसान बना दिया। यह इंटरऑपरेबिलिटी के लिए एक क्रांतिकारी बदलाव था। और क्योंकि छवियाँ और अन्य संपत्तियाँ ZIP कंटेनर के अंदर अलग-अलग फाइलों के रूप में संग्रहीत होती हैं, इसलिए पैकेज के एक हिस्से में खराबी होने पर यह जरूरी नहीं कि पूरा दस्तावेज़ नष्ट हो जाए। एक खराब .doc फ़ाइल अक्सर पूरी तरह से नष्ट हो जाती है; जबकि एक खराब .docx को अक्सर हाथ से ठीक किया जा सकता है। ZIP कम्प्रेशन अपने आप में भी अविश्वसनीय रूप से प्रभावी है। एक व्यावसायिक रिपोर्ट जो .doc फ़ाइल के रूप में 450 KB की है, .docx के रूप में सिकुड़कर केवल 180–220 KB तक रह सकती है। लाखों दस्तावेज़ों को संग्रहीत करने वाले संगठनों के लिए, भंडारण लागत में 50%+ की यह कमी मामूली बात नहीं है।

कम्पैटिबिलिटी का दौर: माइक्रोसॉफ्ट ने क्या सही और क्या गलत किया

माइक्रोसॉफ्ट जानता था कि वह अचानक से सब कुछ बंद नहीं कर सकता। Office 2007 एक कम्पैटिबिलिटी पैक के साथ आया, जिससे Office 2003 और XP के उपयोगकर्ता DOCX फाइलें खोल और सहेज सकते थे। कंपनी ने .doc को “Save As” विकल्प के रूप में भी रखा, और आप अभी भी Microsoft 365 के नवीनतम संस्करणों में “Word 97-2003 Document (.doc)” फॉर्मेट का विकल्प पा सकते हैं। फिर भी, यह बदलाव आसान नहीं था। Windows XP पर Office 2003 चलाने वाले संगठनों को - जो 2007 में एक बहुत बड़ा उपयोगकर्ता आधार था - उस कम्पैटिबिलिटी पैक को मैन्युअल रूप से इंस्टॉल करने के लिए IT विभाग की मदद लेनी पड़ी। कॉर्पोरेट ईमेल सिस्टम ने .docx अटैचमेंट को अज्ञात फ़ाइल प्रकारों के रूप में तब तक ब्लॉक किया जब तक कि एडमिनिस्ट्रेटर्स ने अपनी सुरक्षा नीतियों को अपडेट नहीं कर दिया। DOCX को अपनाने के शुरुआती कुछ वर्षों में बहुत सारे हेल्प डेस्क टिकट बने। फीचर समानता की भी वास्तविक समस्याएं थीं। कुछ पुराने .doc फीचर नए OOXML स्कीमा में ठीक से मैप नहीं होते थे। जटिल फ़ील्ड कोड, पुराने ड्रॉइंग ऑब्जेक्ट्स (विशेषकर VML ड्रॉइंग लेयर वाले), और Word के कई संस्करणों में संपादित किए गए दस्तावेज़ों में अक्सर फॉर्मेटिंग की ऐसी अजीबोगरीब समस्याएँ जमा हो जाती थीं जो अपूर्ण रूप से परिवर्तित होती थीं। जिस किसी ने भी आधुनिक Word में एक पुरानी .doc फ़ाइल खोली है, उसने वह पीली कम्पैटिबिलिटी चेतावनी पट्टी देखी होगी। File > Info > Convert पर क्लिक करने से चेतावनी हट जाती है, लेकिन यह जटिल लेआउट में टेक्स्ट को सूक्ष्म रूप से बदल सकता है या टेबल के आयामों को बिगाड़ सकता है। अधिकांश दस्तावेज़ों के लिए—जैसे आपका औसत पत्र, रिपोर्ट, या प्रस्ताव—यह रूपांतरण निर्बाध होता है। लेकिन सटीक पेज लेआउट वाले दस्तावेज़ों के लिए, जिनमें ओवरलैपिंग टेक्स्ट बॉक्स और एम्बेडेड पुराने ऑब्जेक्ट्स शामिल हैं, आपको परिवर्तित फ़ाइल का परीक्षण करना होगा। आप बस यह नहीं मान सकते कि यह काम कर गया।

फ़ाइल का आकार, खराबी का जोखिम, और दीर्घकालिक संग्रह

DOC की तुलना में DOCX का आकार का लाभ वास्तविक है, लेकिन यह अलग-अलग होता है। टेक्स्ट-प्रधान दस्तावेज़ों में भारी कम्प्रेशन होता है। जिन दस्तावेज़ों में ज्यादातर एम्बेडेड छवियाँ होती हैं, उनमें उतना नहीं होता। ऐसा इसलिए है क्योंकि JPEG और PNG फाइलें ZIP कंटेनर में आने से पहले ही कंप्रेस्ड होती हैं। एक चार्ट वाली 10-पृष्ठ की रिपोर्ट का आकार 380 KB (.doc) से घटकर 160 KB (.docx) हो सकता है। 15 उच्च-रिज़ॉल्यूशन स्क्रीनशॉट से भरी 10-पृष्ठ की फ़ाइल का आकार शायद 8.2 MB से केवल 7.9 MB तक ही कम होगा। वे खराबी को कैसे संभालते हैं, यह एक बहुत बड़ा अंतर है। चूंकि एक .doc फ़ाइल एक सिंगल बाइनरी स्ट्रीम होती है, इसलिए ड्राइव पर एक खराब सेक्टर या सहेजने के दौरान नेटवर्क कनेक्शन टूटने से पूरी फ़ाइल अपठनीय हो सकती है। Word की .doc के लिए अंतर्निहित रिकवरी एक सर्वोत्तम-प्रयास अनुमान है, जो उन बाइनरी पैटर्न को स्कैन करती है जिन्हें वह पहचानता है। दूसरी ओर, DOCX में खराबी छोटे-छोटे हिस्सों तक सीमित रहती है। Word अक्सर एक क्षतिग्रस्त .docx को खोल सकता है और document.xml से सारा टेक्स्ट पुनर्प्राप्त कर सकता है, भले ही छवियाँ या स्टाइल चले गए हों। आप फ़ाइल को ZIP के रूप में खोलकर और XML को स्वयं निकालकर मैन्युअल मरम्मत का प्रयास भी कर सकते हैं। लेकिन दीर्घकालिक संग्रह के लिए, स्पष्ट रूप से कहें: दोनों में से कोई भी फॉर्मेट सही विकल्प नहीं है। दस्तावेज़ों को संरक्षित करने का आधिकारिक मानक PDF/A (ISO 19005) है, जो फ़ॉन्ट्स को एम्बेड करता है, सक्रिय सामग्री को हटा देता है, और विशेष रूप से भविष्य में भी पहुंच के लिए डिज़ाइन किया गया है। यदि आप अनुबंध, कानूनी फाइलिंग, या सार्वजनिक रिकॉर्ड संग्रहीत कर रहे हैं, तो सही वर्कफ़्लो है कि DOCX में अंतिम रूप दें और फिर PDF/A में निर्यात करें। आप संपादन योग्य फॉर्मेट को संग्रहीत नहीं करते हैं। CocoConvert आपके DOCX-से-PDF रूपांतरणों को संभाल सकता है, लेकिन जटिल मैक्रोज़ वाले दस्तावेज़ों के लिए, आपको एक साफ़ परिणाम प्राप्त करने के लिए पहले Word में उन तत्वों को हल करना होगा।

सुरक्षा में वे अंतर जो वास्तव में मायने रखते हैं

अधिकांश लोग मानते हैं कि DOCX स्वाभाविक रूप से DOC से अधिक सुरक्षित है। वे केवल आधे सही हैं। यहाँ की बारीकी महत्वपूर्ण है। सुरक्षित वाला हिस्सा सच है: नियमित .docx फाइलों में VBA मैक्रोज़ नहीं हो सकते। माइक्रोसॉफ्ट ने समझदारी से मैक्रो-सक्षम दस्तावेज़ों के लिए एक अलग, विशिष्ट एक्सटेंशन, .docm बनाया। यह सरल पृथक्करण ईमेल फिल्टर और सुरक्षा सॉफ़्टवेयर के लिए उन फ़ाइलों को पहचानना और ब्लॉक करना आसान बना देता है जिनमें निष्पादन योग्य कोड हो सकता है। यह OOXML स्पेसिफिकेशन में एक स्मार्ट डिज़ाइन विकल्प था। लेकिन DOCX फाइलें पूरी तरह से हानिरहित नहीं हैं। इनमें बाहरी संबंध हो सकते हैं - ऐसे लिंक जो दूरस्थ संसाधनों की ओर इशारा करते हैं और दस्तावेज़ खोले जाने पर उन्हें लोड करते हैं। एक चालाकी से तैयार की गई .docx फ़ाइल अपनी _rels डायरेक्टरी में एक हमलावर के सर्वर का संदर्भ छिपा सकती है। जब कोई उपयोगकर्ता फ़ाइल खोलता है, तो Word एक आउटबाउंड HTTP अनुरोध कर सकता है, जो संभावित रूप से NTLM प्रमाणीकरण के माध्यम से उपयोगकर्ता का IP पता और Windows क्रेडेंशियल्स लीक कर सकता है। यह हमला, जिसे रिमोट टेम्पलेट इंजेक्शन के रूप में जाना जाता है, पत्रकारों और कार्यकर्ताओं जैसे उच्च-मूल्य वाले लक्ष्यों के खिलाफ वास्तविक दुनिया के अभियानों में इस्तेमाल किया गया है। माइक्रोसॉफ्ट ने पैच और अपने प्रोटेक्टेड व्यू फीचर के साथ इसके सबसे बुरे हिस्से को कम किया है, जो डाउनलोड किए गए दस्तावेज़ों को एक सुरक्षित सैंडबॉक्स में खोलता है। हालांकि, अंतर्निहित तंत्र बना हुआ है। निष्कर्ष सरल है: आपको अभी भी अज्ञात स्रोतों से .docx फ़ाइलों को संदेह के साथ देखना चाहिए। उन्हें प्रोटेक्टेड व्यू में खोलें, या इससे भी बेहतर, साझा करने से पहले उन्हें PDF में परिवर्तित करें। .doc फ़ाइलों के साथ, जोखिम और भी अधिक है क्योंकि अपारदर्शी बाइनरी फॉर्मेट विश्लेषण को कठिन बनाता है और पुराने मैक्रो का निष्पादन एक ज्ञात खतरा है।

जब आपको अभी भी DOC फाइलों के साथ काम करने की आवश्यकता हो

भले ही DOCX लगभग दो दशकों से डिफ़ॉल्ट रहा है, .doc फाइलें कहीं नहीं जा रही हैं। कानूनी विभागों के पास अक्सर .doc फॉर्मेट में टेम्पलेट्स की विशाल लाइब्रेरी होती है क्योंकि उनके महंगे दस्तावेज़ प्रबंधन सिस्टम—जैसे 2000 के दशक के मध्य के iManage या OpenText जैसे प्लेटफ़ॉर्म—इसी के लिए बनाए गए थे और उन्हें कभी अपग्रेड नहीं किया गया। कुछ सरकारी एजेंसियां अभी भी नियामक फाइलिंग के लिए .doc को अनिवार्य करती हैं। और जैसा कि कोई भी जिसने कभी पुराना सर्वर साफ किया है, जानता है, .doc फाइलें वर्षों से डिजिटल तलछट की तरह जमा हो जाती हैं। Word के आधुनिक संस्करण में .doc फ़ाइल खोलना आमतौर पर आसान होता है। Word 2016, 2019, 2021, और Microsoft 365 सभी उन्हें अच्छी तरह से संभालते हैं, भले ही वे कम्पैटिबिलिटी मोड बैनर दिखाते हों। LibreOffice Writer भी एक सक्षम काम करता है, हालांकि यह उन दस्तावेज़ों के साथ संघर्ष कर सकता है जिनमें कई लेखकों द्वारा किए गए जटिल ट्रैक किए गए परिवर्तन हों। असली चुनौती बैच रूपांतरण है। 2004 की 200 .doc फ़ाइलों के एक फ़ोल्डर को आधुनिक .docx या PDF फ़ाइलों में बदलना सिरदर्द हो सकता है। आप Word के मैक्रो रिकॉर्डर का उपयोग कर सकते हैं, लेकिन इसके लिए Word इंस्टॉल होना और थोड़ा VBA जानना आवश्यक है। यहीं पर CocoConvert जैसा टूल काम आता है, जो स्थानीय Office लाइसेंस की आवश्यकता के बिना .doc-से-DOCX और .doc-से-PDF रूपांतरण को संभालता है। यह एक Linux सर्वर पर या मिश्रित वातावरण में उपयोग के लिए एकदम सही है। एकमात्र समस्या असली एज केस के साथ है: भारी VBA मैक्रोज़ वाले दस्तावेज़, पुराने Excel चार्ट जैसे एम्बेडेड OLE ऑब्जेक्ट्स, या Word 95 तक फैले संशोधन इतिहास। उन फ़ाइलों को अक्सर खुद को सही ढंग से सुलझाने के लिए मूल Word एप्लिकेशन की आवश्यकता होती है।

अपने वर्कफ़्लो के लिए सही फॉर्मेट चुनना

अधिकांश लोगों के लिए, निर्णय सरल है: .docx का उपयोग करें। यह आधुनिक मानक है, जो दुनिया के हर प्रासंगिक वर्ड प्रोसेसर द्वारा समर्थित है। इसकी खुली XML संरचना आपको किसी एक विक्रेता के प्रोप्राइटरी फॉर्मेट में बंधे रहने से मुक्त करती है। यदि आप आज एक नया दस्तावेज़ बना रहे हैं, तो इसे .doc फ़ाइल के रूप में सहेजने का कोई अच्छा कारण नहीं है। चुनाव केवल तब जटिल हो जाता है जब आपको किसी विशिष्ट पुराने सिस्टम के साथ काम करने के लिए मजबूर किया जाता है। यदि किसी अदालत का ई-फाइलिंग सिस्टम स्पष्ट रूप से .doc की मांग करता है, तो आप .doc के रूप में सहेजते हैं। यदि आपकी कंपनी के दस्तावेज़ प्रबंधन प्रणाली में DOCX के ट्रैक किए गए परिवर्तनों के साथ ज्ञात बग हैं, तो आप उसके साथ बने रहते हैं जो काम करता है जब तक कि इसे ठीक नहीं किया जाता। आप जो फॉर्मेट चुनते हैं वह इस बात से तय होता है कि फ़ाइल कहाँ जा रही है, न कि केवल आपकी व्यक्तिगत पसंद से। फॉर्मेट के बीच रूपांतरण करते समय, याद रखें कि दस्तावेज़ की जटिलता सबसे बड़ा कारक है। एक साधारण कवर लेटर या एक-पृष्ठ का मेमो बिना किसी त्रुटि के परिवर्तित हो जाएगा। नेस्टेड टेबल, अन्य कस्टम स्टाइल पर बने कस्टम स्टाइल, और ड्रॉइंग ऑब्जेक्ट्स के एक मिश्रण के साथ एक जटिल 50-पृष्ठ की रिपोर्ट बहुत अधिक नाजुक होती है। इस पर मेरा विश्वास करें: किसी भी महत्वपूर्ण व्यक्ति को भेजने से पहले हमेशा परिवर्तित फ़ाइल खोलें और पूरी फ़ाइल को स्क्रॉल करके देखें। अंततः, यदि आपका लक्ष्य अंतिम वितरण है, तो आपको DOC बनाम DOCX बहस को पूरी तरह से दरकिनार कर देना चाहिए और PDF का उपयोग करना चाहिए। एक PDF आपके लेआउट को पूरी तरह से संरक्षित करता है, किसी भी डिवाइस पर देखा जा सकता है, और यही वह है जो आपके प्राप्तकर्ता वास्तव में एक तैयार दस्तावेज़ के लिए चाहते हैं। सबसे अच्छा वर्कफ़्लो स्पष्ट है: अपनी संपादन योग्य मास्टर कॉपी DOCX में रखें, अंतिम संस्करण PDF में वितरित करें, और केवल तभी संपादन योग्य फॉर्मेट के बीच रूपांतरण करें जब कोई विशिष्ट सिस्टम आपको मजबूर करे।

DOCX बनाम DOC: माइक्रोसॉफ्ट ने यह बदलाव क्यों किया | CocoConvert Blog