informational

EPUBとは何か？オープンな電子書籍標準を解説

2026-05-17 9 min read

基本のキ：EPUBの正体とは

EPUBはElectronic Publicationの略ですが、その実体はデジタル書籍の世界標準フォーマットです。これはオープンな形式で、2017年にIDPFから引き継いで以降、現在はWorld Wide Web Consortium（W3C）によって管理されています。本質的に、.epubファイルは単なるZIPアーカイブです。中には、現代のウェブページを構成する要素、つまりテキスト用のHTML、スタイル用のCSS、画像、そしてそれら全てを電子書籍リーダーでどうまとめるかを指示するいくつかのXMLファイルが入っています。 EPUBとPDFのような形式との決定的な違いは、リフロー型のレイアウトです。これがEPUBの最大の強み。テキストは、6インチの小さなKoboでも、広々としたiPadでも、巨大なデスクトップモニターでも、どんな画面にも合わせて自動的に折り返され、リサイズされます。読者側でコントロールできるんです。フォントサイズ、書体、行間、背景色まで変更でき、本はそれに合わせて適応します。スキャンされたPDFのように単語を静的な画像としてではなく、実際のテキストとして保存するため、400ページの小説がわずか500KBの小さなファイルになることもあります。このフォーマットは時間とともに進化してきました。2007年のEPUB 2が基礎を築き、その後EPUB 3が登場しました。EPUB 3は2011年に最初に策定され、2023年にはバージョン3.3に更新されるなど、最近までアップデートが続いています。この現代的なバージョンは、HTML5、CSS3、インタラクティブ機能のためのJavaScript、複雑な数式のためのMathML、さらには音声や動画の埋め込みまで、多くのウェブ技術を取り入れました。また、ARIAランドマークのような強力なアクセシビリティ機能も導入されました。ほとんどの現代的なデバイスやアプリはEPUB 3を問題なく扱えますが、古い電子書籍リーダーの中には、シンプルなテキスト表示のためにEPUB 2にフォールバックするものもまだ見られます。ここで一つはっきりさせておきましょう。EPUBはMOBIやAZW3とは違います。これらはAmazonのKindle独自フォーマットです。Amazonで本を買えば、そのエコシステムにロックされたファイルが手に入ります。Kobo、Google Playブックス、Apple Books、あるいはほとんどの独立系書店から本を買えば、手に入るのはEPUBです。

EPUBファイルの中身：構造を解き明かす

面白いトリックがあります。どんな.epubファイルでもいいので、拡張子を.zipに変えて展開してみてください。すると、完璧に整理されたフォルダ構造が見つかるはずです。まず一番上に、必ず`mimetype`というファイルがあります。この小さなファイルには`application/epub+zip`という一行だけが含まれており、アーカイブの先頭に、しかも非圧縮で配置されなければなりません。これにより、ソフトウェアはファイルの中を掘り下げることなく、瞬時にEPUBファイルだと認識できるのです。次に、`META-INF`フォルダの中を見てみましょう。`container.xml`というファイルがあります。このファイルの唯一の役割は、メインのパッケージドキュメント（通常は`content.opf`や`package.opf`という名前）を指し示すことです。このOPFファイルは、本の「中枢神経系」です。すべてのコンテンツファイルのマスターリストであり、章の読む順番を定義し、タイトル、著者、言語、ISBN、出版日、出版社といった重要なメタデータをすべて保持しています。本の実際のコンテンツ、つまりテキストや画像は、通常`OEBPS`や`Content`と呼ばれるフォルダに収められています。ここには、各章ごとのXHTMLファイル、本の見た目をコントロールするCSSファイル、そして画像用のディレクトリがあります。また、`toc.ncx`ファイル（古いEPUB 2リーダー用）と`nav.xhtml`ファイル（現代のEPUB 3用）も見つかるはずです。この2つのファイルが、電子書籍リーダーで章の間をジャンプするために使う目次機能を提供しています。では、なぜこの構造が重要なのでしょうか？それは、EPUBが壊れても、自分で直せることが多いからです。ファイルがうまく開かずにがっかりした経験がある人なら、このもどかしさは分かるでしょう。EPUBなら、ボンネットを開けて中を覗けます。アーカイブを開き、問題のあるXHTMLファイルを見つけ、テキストエディタでコードを修正し、すべてを再圧縮（`mimetype`を最初に非圧縮で入れるのを忘れずに！）してから、拡張子を.epubに戻すだけです。これには本当の満足感があります。W3CのEPUBCheckのような無料ツールを使えば、問題を引き起こしているファイルと行番号を正確に特定することさえできます。開発者にとって、このオープンな構造はEPUBを非常に柔軟なものにしています。カスタムフォントを追加したい？ `.woff2`ファイルをアーカイブに放り込み、標準的な`@font-face`ルールを使ってCSSから呼び出すだけです。

EPUB vs. PDF：正しいフォーマットの選び方

EPUB対PDFの議論は古典的ですが、これは誤った前提に基づいています。これらは本当の意味で競合するものではなく、全く異なる仕事のために設計されたツールなのです。どちらかが「優れている」わけではなく、それぞれが得意な状況が違うだけです。 PDFは、固定されたビジュアルレイアウトを維持することに特化しています。2段組の学術論文、光沢のある雑誌の見開き、記入が必要な公的書類などを思い浮かべてください。これらはPDFでなければなりません。ページの寸法は固定され、フォントは埋め込まれ、画面で見るドキュメントはプリンターから出てくるものと全く同じです。この静的で予測可能な点が、PDFの存在意義そのものです。一方、EPUBはあらゆる画面での読みやすさを最優先します。小説、長文記事、スマートフォンで読む必要のあるマニュアルなどはEPUBに最適です。リフローするテキストのおかげで、読者は視認性を高めるためにフォントを24ptまで大きくでき、単語はそれに合わせて再配置されます。PDFでこれを試してみてください。ピンチ、ズーム、そして水平スクロールの悪夢に陥り、読書どころではなくなります。時には、プラットフォームが選択を決定づけます。iOSやmacOSのApple BooksはEPUBのために作られています。PDFを「開く」ことはできますが、フォント制御、ナイトモード、デバイス間の同期といった最高の読書機能はすべて失われます。AmazonのKindleエコシステムはその逆です。ネイティブのEPUBサポートを完全に放棄しました。EPUBをAZW3に変換するか、Amazonのサーバー上で変換を行う「Send to Kindle」サービスを利用するしかありません。アクセシビリティに関しては、よくできたEPUB 3に勝るものはありません。スクリーンリーダーは、本のセマンティックなHTML構造を利用して、章、見出し、またはランドマークごとにナビゲートできます。「タグ付きPDF」も理論的にはこれが可能ですが、現実にはそのタグ付けが壊れていたり、全くなかったりすることが多いです。EPUB Accessibility 1.1仕様は、出版社が目指すべき明確な基準を提供しています。唯一の例外は、固定レイアウトEPUBです。この形式は存在しますが、リーダーのサポート状況は地雷原のようなものです。私からのアドバイスですか？ピクセルパーフェクトなレイアウトが絶対に必要な場合は、PDFを使い、できる限りアクセシブルにすることです。EPUBに、そのために作られていない役割を無理に押し付けようとしないでください。

DRM、配布、そして「オープン」が本当に意味すること

EPUBが「オープンスタンダード」であると言うとき、それはその設計図が誰でも自由に使用できることを意味します。仕様は公開されており、実装に費用はかからず、単一の企業が所有しているわけでもありません。だからこそ、EPUBアプリの健全なエコシステムが栄えてきたのです。パワーユーザー向けのCalibreやThorium Readerから、Apple、Google、Koboの標準アプリ、さらにはLinux向けのFoliateのようなニッチな選択肢まで、非常に幅広い選択肢があります。しかし、「オープンフォーマット」は「DRMフリー」を意味するわけではありません。これは極めて重要な違いです。出版社や小売業者は、販売前にEPUBファイルにデジタル著作権管理（DRM）の層を被せることが頻繁にあります。最も一般的なシステムはAdobeのADEPT DRMで、OverDriveやLibbyを介して公共図書館から借りた電子書籍によく見られます。KoboやAppleも独自のDRMを持っています。結果として得られるファイルは中身はEPUBですが、ロックされており、認証されたデバイスとアプリでしか開くことができません。ファイル変換において、DRMは越えられない壁です。CocoConvertは保護されていないEPUBをPDF、DOCX、HTMLなどの形式に簡単に変換できます。しかし、DRMで保護されたファイルには手出しできませんし、するつもりもありません。変換を可能にするためにDRMを解除しようとすることは、米国のDMCAやEUの著作権指令のような法律の下で違法です。DRM付きの本を所有していて、別のデバイスで読みたい場合、法的に許された選択肢は、ストアがDRMフリーのダウンロードを提供しているか確認するか、単にその小売業者が指定するアプリを使用することだけです。良いニュースは、DRMフリーのEPUBが皆さんが思うより一般的だということです。Tor BooksやO'Reillyのような大手出版社は、DRMフリーのファイルを販売することで評判を築いてきました。ほとんどのオープンアクセスの学術出版社も同様です。また、SmashwordsやHumble Bundleのようなストアや、著者のウェブサイトから直接購入することでも見つけられます。これらこそが、あなたが本当に所有しているファイルです。バックアップを取り、変換し、好きなアプリで、永遠に読むことができます。

EPUBファイルの作成と編集

EPUBをゼロから作成するのは、使うツール次第で、望むだけシンプルにも複雑にもなります。基本的なHTMLに慣れている人にとって、無料でオープンソースのエディタであるSigilは定番の出発点です。ビジュアルインターフェースと、エラーを検出するための内蔵バリデータがあります。macOSの自己出版作家たちは、有料アプリのVellumを絶賛することが多いです。テンプレートから美しくフォーマットされた本を作成できますが、$199.99という高価な値札がついています。そして多くの作家がすでに使っているScrivenerは、`ファイル > コンパイル`メニューから直接原稿をEPUB 3にコンパイルできます。開発者やテクニカルライターには、独自の強力なツールセットがあります。Pythonのドキュメントの多くを支えるエンジンであるSphinxは、HTMLやPDFを生成するのと同じくらい簡単にEPUB 3ファイルを生成できます。そして、ドキュメント変換の「スイスアーミーナイフ」であるPandocがあります。これは、`pandoc input.docx -o output.epub --epub-cover-image=cover.jpg`のようなシンプルなコマンドライン命令で、Markdown、DOCX、LaTeXなど、ほとんど何からでもEPUBを作成できます。既存のEPUBを編集するのは、面白いところです。フォーマットがおかしかったり、章の順序が間違っていたりするファイルがある場合、Sigilを使って中を覗くことができます。そのブックブラウザはファイル構造全体を表示し、特定の問題を修正するためにXHTMLやCSSファイルに直接飛び込むことができます。Calibreにも同様の機能を提供する強力な電子書籍エディタがあります。しかし、メタデータだけを微調整するなら、Calibreのメインインターフェースに勝るものはありません。著者名の修正、シリーズタグの追加、出版年の訂正は、右クリック一つですぐにできます。ISBNを使って正しいメタデータを自動的に取得することさえでき、これは大幅な時間節約になります。ただし、注意してください。子供向けの絵本や複雑な雑誌のレイアウトのような、固定レイアウトのEPUBを編集しようとしているなら、かなりの挑戦が待っています。これらのファイルは、単純なビジュアルエディタでは解きほぐせない複雑なCSSやJavaScriptを使用していることがよくあります。すべてを壊さずに変更を加えるには、EPUBの仕様とウェブ開発に関する深い理解が必要です。

EPUBファイルの変換：うまくいくこと、いかないこと

EPUBファイルの変換は一般的な作業ですが、結果の質は、何を何に変換するかに完全に依存します。すべてに当てはまる万能なプロセスではありません。 EPUBからPDFへの変換は、特にテキスト中心の本の場合、たいてい安全な選択です。CocoConvertのようなツールは、EPUBのコンテンツをきれいにページ分けされたPDFにレンダリングし、小説やレポートの印刷やアーカイブに最適です。しかし、より複雑なファイルでは問題が発生します。EPUB 3ファイルの凝ったCSSレイアウト、埋め込まれていないフォント、JavaScriptベースのインタラクティブ機能は、静的なPDFへの変換過程で失われます。レイアウトが崩れることさえあり、手動での修正が必要になるかもしれません。 EPUBをDOCXファイルに変えるのは、編集のためにテキストをMicrosoft Wordに取り込む最良の方法です。変換によって、見出し、段落、太字や斜体、基本的な画像といった本質的な構造は保持されますが、それだけです。凝ったCSS、ドロップキャップ、カスタムレイアウトがそのまま残ることは期待しないでください。結果として得られるDOCXファイルは、完成されたフォーマット済みの文書ではなく、きれいで編集可能な下書きと考えるのが最善です。 PDFからEPUBへの変換は、断然最も難しい変換で、まさに「結果は人それぞれ」な状況です。もしPDFがWordのようなテキストベースのソースからエクスポートされたものなら、CocoConvertのようなコンバーターはテキストをきれいに抽出し、使えるEPUBに構造化できることが多いです。しかし、スキャンされたPDF、つまりページの画像の集まりである場合は、はるかに険しい道のりになります。これには、それらの画像をテキストに戻すための光学文字認識（OCR）が必要で、このプロセスは決して完璧ではありません。CocoConvertのOCRは優れていますが、その精度はスキャンの質にかかっています。鮮明な300DPIのスキャンであっても、98%の文字認識精度は、300ページの本に何十もの誤字脱字があることを意味し、それらを見つけて修正しなければなりません。最後に、HTMLからEPUBへの変換は通常は簡単ですが、一つ大きな注意点があります。「ゴミを入れれば、ゴミが出てくる」ということです。もしソースが、よく構造化されたウェブ記事のような、クリーンでセマンティックなHTMLであれば、EPUBの章に美しくマッピングされます。もしコンバーターに、インラインスタイルやテーブルで構築されたレイアウトが絡み合ったぐちゃぐちゃなHTMLを与えれば、その先にはぐちゃぐちゃに絡み合ったEPUBが出来上がるだけです。

EPUBのアクセシビリティと標準の現状

アクセシビリティこそ、EPUB 3が真価を発揮する分野であり、間違いなくこのフォーマットの最も重要な特徴です。ウェブ標準を基盤に構築されているため、セマンティックなHTML5要素（`nav`、`aside`など）、支援技術向けのARIAロール、画像の適切なaltテキスト、そして論理的な読み上げ順序を定義するメタデータをサポートしています。これにより、スクリーンリーダーはページ上の視覚的なレイアウトに従うだけでなく、著者が意図した通りに本をナビゲートできるのです。これは単なるベストプラクティスの緩やかな集まりではありません。公式のEPUB Accessibility 1.1仕様（2023年5月時点でW3C勧告）が、具体的な要件を定めています。アクセシブルなEPUBは、完全な目次、論理的な読み上げ順序、altテキスト、そして適切な色のコントラストを持たなければなりません。準拠する出版社は、WCAG 2.1 AAのような特定の基準を満たしていることを証明するメタデータをファイルに埋め込むことさえできます。しかし、現実の世界では、EPUBのアクセシビリティの質は玉石混交です。マケラシュ条約や欧州アクセシビリティ法（2025年6月に完全施行）のような法的・規制上の圧力のおかげで、主要な学術出版社や商業出版社はかなり改善されました。しかし、特に小規模な出版社や自己出版の著者による膨大な数の本が、altテキストの欠落、読み上げ順序の未宣言、不完全なナビゲーションといった明白なアクセシビリティの穴を抱えたままリリースされています。仕様は、それが実装されてこそ意味があるのです。これらの機能を必要とする読者にとって、アプリの選択は重要です。デスクトップでは、無料のThorium Readerがアクセシビリティのゴールドスタンダードであり、テキスト読み上げ、文章のハイライト、ARIAランドマークによるナビゲーションを優れた形でサポートしています。モバイルでは、iOSのApple BooksがVoiceOverスクリーンリーダーと併用した場合に、アクセシブルなEPUBの機能を非常によく反映します。この取り組みはまだ終わっていません。W3CのEPUBワーキンググループは、現在も積極的に標準の開発を続けています。現在、彼らはオーディオブックのサポート改善、スクリプトの使用に関するより明確なガイダンスの提供、そして固定レイアウトのアクセシビリティという厄介な問題に取り組んでいます。特に最後の問題は手ごわい難問であり、仕様にはまだ完璧な解決策がありません。

← Browse all articles