Skip to content
Back to Blog
format-comparisons

DOCX vs DOC:Microsoftがフォーマットを切り替えた理由

2026-05-17 読了時間: 約8分

20年続いたフォーマット――そして、それがなぜ問題だったのか

1983年にWord for DOSと共に導入された.doc形式は、20年以上にわたってMicrosoftのデフォルトのワープロ形式でした。Office 2003が登場する頃には、.docファイルは文字通りどこにでもありました。企業のサーバー、政府のシステム、大学のネットワーク、そしてもちろん、個人のコンピューターにも。この形式は機能しましたが、その長い歴史からくる深刻な負の遺産を抱えていました。 この形式の核心的な問題は、その不透明さでした。 .docファイルはプロプライエタリなバイナリの塊であり、その構造を本当に理解しているのはMicrosoftだけでした。これはサードパーティの開発者にとっては悪夢でした。.docファイルを読み書きできるソフトウェアを構築したい人は誰でも、仕様をリバースエンジニアリングする必要がありましたが、これは必然的に互換性のバグ、文字化け、データの損失につながる苦痛なプロセスでした。長年にわたり、WordPerfect、LibreOffice、Google Docsはすべて、完璧な.docの忠実性を達成するために勝ち目のない戦いを繰り広げてきました。 セキュリティもまた大きな問題でした。 .docファイルはその不透明なバイナリコンテナ内に強力なVBAマクロを埋め込むことができたため、ウイルス対策ツールやメールフィルターがそれらを確実に検査するのに苦労しました。この設計上の欠陥は、1990年代後半のマクロウイルスの大発生を助長しました。1999年に推定100万台のコンピューターに感染したMelissaウイルスは、一見無害な文書の中に悪意のあるコードを隠すのが簡単だったために、非常に効果的に拡散したのです。 新千年紀に入る頃には、圧力が高まっていました。欧州委員会やいくつかの米国連邦機関を含む政府や大企業は、プロプライエタリなバイナリ形式が長期的な公的記録に適しているかどうかを公に疑問視し始めました。Microsoftには、信頼できるオープンな答えが必要だったのです。

DOCXの正体:その仕組み

MicrosoftがOffice 2007でDOCXを発表したとき、それは単に古いファイルに新しい拡張子を付けただけではありませんでした。それは、Open Packaging Conventions(OPC)と呼ばれる仕様に基づいて構築された完全な再発明であり、OPC自体はZIP圧縮に基づいています。これは単なる豆知識ではありません。DOCXがなぜ優れているのかを理解するための、まさに鍵となるポイントなのです。 ちょっとした裏技があります。.docxファイルの拡張子を.zipに変更して開いてみてください。標準的なフォルダー構造が表示されるはずです。中には、XMLファイル、リレーションシップマッピング用の_relsディレクトリ、そして実際の文書を保持するword/サブディレクトリがあります。メインのテキストはword/document.xmlにあり、スタイルはword/styles.xmlで定義されています。画像はword/media/に個別のファイルとして保存され、作成者や作成日などのメタデータはdocProps/core.xmlにあります。 このアーキテクチャには、非常に実用的な利点があります。XMLは人間が読める形式なので、開発者はdocument.xmlをテキストエディタで開いて、文書の内容と構造をありのままに見ることができます。この透明性により、Google、Apple、LibreOffice、その他無数のベンダーが信頼性の高いDOCXサポートを構築することが格段に容易になりました。これは相互運用性にとって画期的なことでした。そして、画像やその他のアセットはZIPコンテナ内に個別のファイルとして保存されるため、パッケージの一部が破損しても、必ずしも文書全体が破壊されるわけではありません。破損した.docはしばしば完全な損失となりますが、破損した.docxは手作業で修復できることがよくあります。 ZIP圧縮自体も非常に効果的です。ビジネスレポートが.docファイルで450KBだったものが、.docxではわずか180〜220KBにまで縮小するかもしれません。何百万もの文書を保存している組織にとって、その50%以上のストレージコスト削減は決して些細なことではありません。

互換性の移行:Microsoftが正しくやったこと、間違ったこと

Microsoftは、いきなり切り捨てることはできないとわかっていました。Office 2007には互換機能パックが同梱され、Office 2003やXPのユーザーがDOCXファイルを開いたり保存したりできるようになりました。同社はまた、「名前を付けて保存」の選択肢として.docを残し、最新版のMicrosoft 365でも「Word 97-2003 文書 (.doc)」という形式を選べます。 それでも、移行は混乱を極めました。2007年当時、巨大なユーザーベースであったWindows XP上でOffice 2003を運用していた組織は、IT部門にその互換機能パックを手動でインストールしてもらう必要がありました。企業のメールシステムは、管理者がセキュリティポリシーを更新するまで、.docxの添付ファイルを未知のファイルタイプとしてブロックしました。DOCX導入後の最初の数年間は、多くのヘルプデスクへの問い合わせを生み出しました。 また、実際の機能パリティの問題もありました。一部の古い.docの機能は、新しいOOXMLスキーマにうまくマッピングされませんでした。複雑なフィールドコード、古い描画オブジェクト(特にVML描画レイヤーからのもの)、そして多くのWordバージョンにわたって編集された文書は、しばしば不完全に変換される書式の癖を蓄積していました。最新のWordで古い.docファイルを開いたことがある人なら、あの黄色い互換性警告バーを見たことがあるでしょう。「ファイル」>「情報」>「変換」をクリックすると警告は消えますが、複雑なレイアウトではテキストが微妙に再配置されたり、表の寸法が崩れたりすることがあります。 ほとんどの文書、つまり平均的な手紙、レポート、提案書などでは、変換はシームレスです。しかし、重なり合うテキストボックスや埋め込まれた古いオブジェクトを含む、精密なページレイアウトで作成された文書の場合は、変換後のファイルをテストしなければなりません。ただうまくいったと決めつけることはできないのです。

ファイルサイズ、破損リスク、そして長期保存

DOCXがDOCよりもサイズ面で有利なのは事実ですが、その度合いは様々です。テキスト中心の文書では大幅な圧縮が見られます。しかし、ほとんどが埋め込み画像である文書では、それほどでもありません。これは、JPEGやPNGはZIPコンテナに入る前にすでに圧縮されているためです。グラフが1つ入った10ページのレポートは、380 KB (.doc)から160 KB (.docx)に縮小するかもしれません。しかし、高解像度のスクリーンショットが15枚詰まった10ページの文書は、8.2 MBから7.9 MBにしか減らないかもしれません。 破損への対処法は、はるかに明確な違いがあります。.docファイルは単一のバイナリストリームなので、ドライブの不良セクタが1つあったり、保存中にネットワーク接続が切れたりするだけで、ファイル全体が読み取れなくなる可能性があります。Wordに組み込まれている.docの回復機能は、認識できるバイナリパターンをスキャンする、いわばベストエフォートの推測にすぎません。一方、DOCXの破損は粒度が細かいです。Wordは破損した.docxを開き、画像やスタイルが失われてもdocument.xmlからすべてのテキストを回復できることがよくあります。ZIPとしてファイルを開き、自分でXMLを取り出すことで手動修復を試みることさえ可能です。 しかし、長期保存という点では、はっきり言っておきましょう。どちらのフォーマットも正解ではありません。文書を保存するための公式な標準はPDF/A (ISO 19005)であり、これはフォントを埋め込み、アクティブコンテンツを取り除き、将来にわたってアクセスできるように特別に設計されています。契約書、法的書類、公的記録をアーカイブする場合は、DOCXで最終版を作成し、その後PDF/Aにエクスポートするのが正しいワークフローです。編集可能なフォーマットをアーカイブするべきではありません。CocoConvertはDOCXからPDFへの変換を処理できますが、複雑なマクロを含む文書の場合は、きれいな結果を得るためにまずWordでそれらの要素を解決する必要があります。

本当に重要なセキュリティの違い

ほとんどの人はDOCXがDOCよりも本質的に安全だと信じています。その認識は、半分正しく、半分間違っています。ここでのニュアンスは重要です。 安全だという部分は本当です。通常の.docxファイルにはVBAマクロを含めることができません。Microsoftは賢明にも、マクロ有効文書のために.docmという別の明確な拡張子を作成しました。この単純な分離により、メールフィルターやセキュリティソフトウェアが実行可能コードを含む可能性のあるファイルを特定し、ブロックすることが非常に簡単になります。これはOOXML仕様における賢明な設計判断でした。 しかし、DOCXファイルも完全に無害というわけではありません。これらは外部リンクを含むことができます。つまり、文書が開かれたときにリモートリソースを指し示し、それを読み込むリンクです。巧妙に作られた.docxは、その_relsディレクトリに攻撃者のサーバーへの参照を隠すことができます。ユーザーがファイルを開くと、Wordは外部へのHTTPリクエストを送信し、NTLM認証を介してユーザーのIPアドレスやWindowsの資格情報が漏洩する可能性があります。この攻撃はリモートテンプレートインジェクションとして知られ、ジャーナリストや活動家のような価値の高い標的に対する実際の攻撃キャンペーンで使用されてきました。 Microsoftはパッチと、ダウンロードした文書を安全なサンドボックスで開く「保護ビュー」機能で、この最悪の事態を緩和してきました。しかし、根本的なメカニズムは残っています。教訓は単純です。未知のソースからの.docxファイルは、依然として疑ってかかるべきです。保護ビューで開くか、さらに良いのは、共有する前にPDFに変換することです。.docファイルの場合、不透明なバイナリ形式が分析を困難にし、古いマクロの実行が既知の脅威であるため、リスクはさらに高くなります。

今でもDOCファイルを扱う必要がある場合

DOCXがデフォルトになってから20年近く経ちますが、.docファイルがなくなる気配はありません。法務部門は、2000年代半ばのiManageやOpenTextのような高価な文書管理システムが.doc用に構築され、アップグレードされなかったため、.doc形式の膨大なテンプレートライブラリを保有していることがよくあります。一部の政府機関は、規制当局への提出書類に依然として.docを義務付けています。そして、古いサーバーを整理したことがある人なら誰でも知っているように、.docファイルは長年にわたってデジタルの堆積物のように蓄積されていくのです。 最新バージョンのWordで.docファイルを開くのは、通常は問題ありません。Word 2016、2019、2021、そしてMicrosoft 365はすべて、互換モードのバナーが表示されるとしても、うまく処理してくれます。LibreOffice Writerもまずまずの仕事をしてくれますが、複数の作成者による複雑な変更履歴がある文書には苦戦することがあります。 本当の課題は一括変換です。2004年製の.docファイルが200個入ったフォルダーを、現代的な.docxやPDFファイルに変えるのは頭痛の種になり得ます。Wordのマクロレコーダーを使うこともできますが、それにはWordがインストールされていて、VBAの知識が多少必要です。ここでCocoConvertのようなツールが役立ちます。ローカルにOfficeライセンスがなくても、.docからDOCX、.docからPDFへの変換を処理できます。Linuxサーバーや混合環境での使用に最適です。唯一の注意点は、真の例外的なケースです。大量のVBAマクロ、古いExcelグラフのような埋め込みOLEオブジェクト、あるいはWord 95まで遡る改訂履歴を持つ文書です。これらのファイルは、正しく整理するために元のWordアプリケーションが必要になることがよくあります。

自分のワークフローに合ったフォーマットの選び方

ほとんどの人にとって、決断は単純です。.docxを使いましょう。これは現代の標準であり、地球上のすべての主要なワープロソフトでサポートされています。そのオープンなXML構造は、単一ベンダーのプロプライエタリな形式に縛られることからあなたを解放してくれます。今日新しい文書を作成するのであれば、それを.docファイルとして保存する正当な理由はまったくありません。 選択が複雑になるのは、特定のレガシーシステムで作業せざるを得ない場合だけです。裁判所の電子申請システムが明確に.docを要求するなら、.docで保存します。会社の文書管理システムにDOCXの変更履歴に関する既知のバグがあるなら、それが修正されるまで機能する方で我慢します。どの形式を選ぶかは、単にあなたの個人的な好みではなく、そのファイルがどこに行くかによって決まるのです。 フォーマット間で変換する際は、文書の複雑さが最大の要因であることを忘れないでください。単純なカバーレターや1ページのメモは完璧に変換されます。しかし、入れ子になった表、他のカスタムスタイルに基づいて構築されたカスタムスタイル、そして様々な描画オブジェクトが混在する複雑な50ページのレポートは、はるかに脆いものです。これは信じてください。変換したファイルは、必ず開いて全体をスクロールし、重要な人に送る前に確認してください。 最終的に、あなたの目標が最終的な配布であるならば、DOC対DOCXの議論は完全に避けて、PDFを使用すべきです。PDFはレイアウトを完璧に保持し、どんなデバイスでも表示でき、完成した文書として受け手が本当に求めているものです。最適なワークフローは明確です。編集可能なマスターコピーはDOCXで保持し、最終版はPDFで配布し、特定のシステムに強制された場合にのみ編集可能なフォーマット間で変換するのです。