Qu'est-ce que l'EPUB ? Le standard ouvert du livre numérique
Les bases : ce qu'est vraiment l'EPUB
EPUB signifie « Electronic Publication », mais en réalité, c'est un standard universel pour les livres numériques. C'est un format ouvert, aujourd'hui géré par le World Wide Web Consortium (W3C) depuis qu'il a pris le relais de l'IDPF en 2017. Au fond, un fichier .epub n'est rien d'autre qu'une archive ZIP. À l'intérieur, tu trouveras les briques d'une page web moderne : du HTML pour le texte, du CSS pour le style, des images et quelques fichiers XML pour orchestrer comment tout s'assemble dans ta liseuse. La différence clé entre l'EPUB et un format comme le PDF, c'est sa mise en page redistribuable (reflowable). C'est son super-pouvoir. Le texte s'adapte et se redimensionne automatiquement pour s'ajuster à n'importe quel écran, que ce soit un petit Kobo de 6 pouces, un iPad spacieux ou un immense écran d'ordinateur. En tant que lecteur, tu as le contrôle. Tu peux changer la taille de la police, la typographie, l'espacement et même la couleur de fond, et le livre s'adapte tout simplement. Comme il stocke le texte en tant que texte réel — et non comme des images statiques de mots comme un PDF scanné — un roman de 400 pages peut ne peser que 500 Ko. Le format a évolué avec le temps. L'EPUB 2, datant de 2007, a posé les fondations. Puis est arrivé l'EPUB 3, finalisé pour la première fois en 2011 et mis à jour aussi récemment que la version 3.3 en 2023. Cette version moderne a apporté une tonne de technologies web : HTML5, CSS3, JavaScript pour l'interactivité, MathML pour les équations complexes, et même l'intégration audio et vidéo. Il a aussi introduit de puissantes fonctionnalités d'accessibilité comme les points de repère ARIA. Bien que la plupart des appareils et applications modernes gèrent très bien l'EPUB 3, tu trouveras encore de vieilles liseuses qui se rabattent sur l'EPUB 2 pour un simple rendu de texte. Mettons une chose au clair : EPUB n'est pas la même chose que MOBI ou AZW3. Ce sont les formats propriétaires d'Amazon pour le Kindle. Achète un livre sur Amazon, et tu obtiens un fichier verrouillé dans leur écosystème. Achète-le chez Kobo, Google Play Livres, Apple Books ou presque n'importe quelle librairie indépendante, et tu recevras un EPUB.
À l'intérieur d'un fichier EPUB : la structure expliquée
Voici une astuce sympa : prends n'importe quel fichier .epub, change son extension en .zip, et décompresse-le. Ce que tu trouveras à l'intérieur est une structure de dossiers parfaitement organisée. Tout en haut, tu verras toujours un fichier nommé `mimetype`. Ce minuscule fichier ne contient qu'une seule ligne — `application/epub+zip` — et il doit être le tout premier élément de l'archive, non compressé. Cela permet aux logiciels de reconnaître instantanément le fichier comme un EPUB sans avoir à fouiller dedans. Ensuite, regarde dans le dossier `META-INF`. Tu y trouveras un fichier `container.xml`. Son unique rôle est de pointer vers le document principal du paquet, généralement appelé `content.opf` ou `package.opf`. Ce fichier OPF est le système nerveux central du livre. C'est une liste maîtresse de chaque fichier de contenu, il définit l'ordre de lecture des chapitres et contient toutes les métadonnées cruciales : titre, auteur, langue, ISBN, date de publication et éditeur. Le contenu réel du livre — le texte et les images — se trouve dans un dossier, habituellement nommé `OEBPS` ou `Content`. C'est là que tu trouveras les fichiers XHTML individuels pour chaque chapitre, les fichiers CSS qui contrôlent l'apparence du livre, et un répertoire pour les images. Tu remarqueras aussi un fichier `toc.ncx` (pour les anciennes liseuses EPUB 2) et un fichier `nav.xhtml` (pour l'EPUB 3 moderne). Ces deux fichiers alimentent la table des matières que tu utilises pour naviguer entre les chapitres sur ta liseuse. Alors, pourquoi cette structure est-elle importante ? Parce que si un EPUB est corrompu, tu peux souvent le réparer toi-même. Quiconque a déjà été vaincu par un fichier capricieux connaît cette frustration. Avec l'EPUB, tu peux soulever le capot. Il suffit d'ouvrir l'archive, de trouver le mauvais fichier XHTML, de corriger le code dans un éditeur de texte, puis de tout re-zipper (en n'oubliant pas de mettre `mimetype` en premier, non compressé !) avant de le renommer en .epub. Il y a une vraie satisfaction à cela. Tu peux même utiliser des outils gratuits comme EPUBCheck du W3C pour identifier le fichier exact et le numéro de ligne qui pose problème. Pour les développeurs, cette structure ouverte est aussi ce qui rend l'EPUB si flexible. Tu veux ajouter une police personnalisée ? Il suffit de glisser un fichier `.woff2` dans l'archive et de l'appeler depuis ton CSS avec une règle `@font-face` standard.
EPUB vs. PDF : choisir le bon format
Le débat EPUB contre PDF est un classique, mais il repose sur une fausse prémisse. Ce ne sont pas vraiment des concurrents ; ce sont des outils conçus pour des tâches complètement différentes. L'un n'est pas « meilleur » que l'autre — ils excellent simplement dans des contextes différents. Le PDF, c'est avant tout la préservation d'une mise en page visuelle fixe. Pense aux articles universitaires à deux colonnes, aux doubles pages de magazines sur papier glacé ou aux formulaires administratifs qui doivent être remplis. Ceux-ci *doivent* être des PDF. Les dimensions de la page sont verrouillées, les polices sont intégrées, et le document que tu vois à l'écran est exactement ce qui sortira de l'imprimante. Cette prévisibilité statique est la raison d'être du PDF. L'EPUB, d'un autre côté, priorise la lisibilité sur n'importe quel écran. Les romans, les articles de fond et les manuels que tu dois lire sur ton téléphone sont parfaits pour l'EPUB. Son texte redistribuable signifie qu'un lecteur peut augmenter la police à 24pt pour une meilleure visibilité, et les mots se réorganisent simplement pour s'adapter. Essaye ça avec un PDF, et tu es coincé dans un cauchemar de pincements, de zooms et de défilements horizontaux qui rend la lecture impossible. Parfois, la plateforme fait le choix pour toi. Apple Books sur iOS et macOS est conçu pour l'EPUB ; bien qu'il puisse *ouvrir* un PDF, tu perds toutes les meilleures fonctionnalités de lecture comme le contrôle des polices, le mode nuit et la synchronisation entre appareils. L'écosystème Kindle d'Amazon est à l'opposé. Il a complètement abandonné le support natif de l'EPUB. Tu dois soit convertir tes EPUB en AZW3, soit utiliser le service « Envoyer vers Kindle », qui effectue la conversion sur les serveurs d'Amazon. En matière d'accessibilité, un EPUB 3 bien conçu est imbattable. Les lecteurs d'écran peuvent utiliser la structure HTML sémantique du livre pour naviguer par chapitre, titre ou point de repère. Bien qu'un « PDF balisé » puisse théoriquement le faire, dans le monde réel, ce balisage est souvent cassé ou totalement absent. La spécification EPUB Accessibility 1.1 donne aux éditeurs une norme claire à viser. La seule exception est l'EPUB à mise en page fixe. Bien que le format existe, le support par les liseuses est un champ de mines. Mon conseil ? Si tu as absolument besoin d'une mise en page au pixel près, reste sur le PDF et rends-le aussi accessible que possible. N'essaie pas de forcer l'EPUB dans un rôle pour lequel il n'a pas été conçu.
DRM, distribution et ce que « ouvert » signifie vraiment
Quand on dit que l'EPUB est un « standard ouvert », cela signifie que son plan est librement utilisable par tous. La spécification est publique, son implémentation ne coûte rien, et aucune entreprise ne le possède. C'est pourquoi un écosystème sain d'applications EPUB a prospéré. Tu as un large éventail de choix, des outils pour utilisateurs avancés comme Calibre et Thorium Reader aux applications intégrées d'Apple, Google et Kobo, en plus d'options de niche comme Foliate pour Linux. Mais « format ouvert » ne signifie pas « sans DRM ». C'est une distinction cruciale. Les éditeurs et les revendeurs enveloppent fréquemment leurs fichiers EPUB dans une couche de gestion des droits numériques (DRM) avant de les vendre. Le système le plus courant est le DRM ADEPT d'Adobe, que tu trouveras sur les ebooks empruntés dans les bibliothèques publiques via OverDrive ou Libby. Kobo et Apple ont aussi leurs propres DRM propriétaires. Le fichier résultant est toujours un EPUB sous le capot, mais il est verrouillé et ne peut être ouvert que sur des appareils autorisés avec des applications autorisées. Pour la conversion de fichiers, le DRM est un mur infranchissable. CocoConvert peut facilement convertir des EPUB non protégés vers et depuis les formats PDF, DOCX, HTML et autres. Mais il ne peut pas, et ne touchera pas, un fichier protégé par DRM. Tenter de supprimer un DRM pour permettre la conversion est illégal en vertu de lois comme le DMCA aux États-Unis et la directive de l'UE sur le droit d'auteur. Si tu possèdes un livre avec DRM et que tu veux le lire sur un autre appareil, tes seules options légales sont de vérifier si le magasin propose un téléchargement sans DRM ou d'utiliser simplement l'application désignée par le revendeur. La bonne nouvelle, c'est que les EPUB sans DRM sont plus courants que tu ne le penses. De grands éditeurs comme Tor Books et O'Reilly ont bâti leur réputation sur la vente de fichiers sans DRM. La plupart des éditeurs universitaires en libre accès le font aussi. Tu peux également en trouver sur des boutiques comme Smashwords et Humble Bundle, ou en achetant directement sur le site web d'un auteur. Ce sont les fichiers que tu possèdes vraiment — tu peux les sauvegarder, les convertir et les lire dans n'importe quelle application de ton choix, pour toujours.
Créer et modifier des fichiers EPUB
Créer un EPUB à partir de zéro peut être aussi simple ou aussi complexe que tu le souhaites, selon tes outils. Pour ceux qui sont à l'aise avec le HTML de base, l'éditeur gratuit et open-source Sigil est le point de départ classique ; il dispose d'une interface visuelle et d'un validateur intégré pour détecter les erreurs. Les auteurs auto-publiés sur macOS ne jurent souvent que par Vellum, une application payante qui produit des livres magnifiquement formatés à partir de modèles, bien qu'elle ait un prix conséquent de 199,99 $. Et de nombreux écrivains utilisent déjà Scrivener, qui peut compiler un manuscrit directement en EPUB 3 depuis son menu `Fichier > Compiler`. Les développeurs et les rédacteurs techniques ont leur propre ensemble d'outils puissants. Sphinx, le moteur derrière une grande partie de la documentation de Python, peut générer un fichier EPUB 3 aussi facilement qu'il génère du HTML ou un PDF. Et puis il y a Pandoc, le couteau suisse de la conversion de documents. Il peut créer un EPUB à partir de presque n'importe quoi — Markdown, DOCX, LaTeX — avec une simple instruction en ligne de commande comme `pandoc input.docx -o output.epub --epub-cover-image=cover.jpg`. La modification d'un EPUB existant est là où les choses deviennent intéressantes. Si tu as un fichier avec une mise en forme bancale ou des chapitres dans le mauvais ordre, tu peux utiliser Sigil pour soulever le capot. Son explorateur de livre te montre toute la structure du fichier, te permettant de plonger dans le fichier XHTML ou CSS spécifique pour corriger le problème directement. Calibre dispose également d'un puissant éditeur d'ebook qui offre des fonctionnalités similaires. Cependant, pour simplement ajuster les métadonnées, rien ne vaut l'interface principale de Calibre. Corriger le nom d'un auteur, ajouter une étiquette de série ou rectifier une année de publication se fait en un clic droit. Il peut même récupérer automatiquement les métadonnées correctes en utilisant un ISBN, ce qui est un gain de temps considérable. Sois prévenu, cependant : si tu essaies de modifier un EPUB à mise en page fixe, comme un livre d'images pour enfants ou une mise en page de magazine complexe, un sacré défi t'attend. Ces fichiers utilisent souvent du CSS et du JavaScript complexes qui ne peuvent pas être démêlés avec un simple éditeur visuel. Tu auras besoin d'une compréhension approfondie de la spécification EPUB et du développement web pour apporter des modifications sans tout casser.
Convertir des fichiers EPUB : ce qui fonctionne et ce qui ne fonctionne pas
La conversion de fichiers EPUB est une tâche courante, mais la qualité du résultat dépend entièrement de ce que tu convertis et vers quel format. Ce n'est pas un processus universel. Convertir un EPUB en PDF est généralement une valeur sûre, surtout pour les livres axés sur le texte. Un outil comme CocoConvert rendra le contenu de l'EPUB en un PDF propre et paginé, parfait pour imprimer ou archiver des romans et des rapports. Le processus se complique avec des fichiers plus complexes. Les mises en page CSS sophistiquées, les polices non intégrées et toute interactivité basée sur JavaScript d'un fichier EPUB 3 seront perdues lors de la traduction vers un PDF statique. La mise en page pourrait même être cassée, t'obligeant à la nettoyer manuellement. Transformer un EPUB en fichier DOCX est le meilleur moyen de récupérer le texte dans Microsoft Word pour l'éditer. La conversion préservera la structure essentielle — titres, paragraphes, gras et italique, images de base — mais c'est à peu près tout. Ne t'attends pas à ce que le CSS fantaisiste, les lettrines ou les mises en page personnalisées survivent au voyage. La meilleure façon de voir le fichier DOCX résultant est comme un brouillon propre et modifiable, pas un document finalisé et formaté. Passer du PDF à l'EPUB est de loin la conversion la plus difficile, une situation où les résultats peuvent vraiment varier. Si le PDF a été exporté à partir d'une source textuelle comme Word, un convertisseur comme CocoConvert peut souvent extraire le texte proprement et le structurer en un EPUB utilisable. Mais si tu as un PDF scanné — qui n'est qu'une collection d'images de pages — le parcours sera beaucoup plus rude. Cela nécessite une reconnaissance optique de caractères (OCR) pour retransformer ces images en texte, un processus qui n'est jamais parfait. L'OCR de CocoConvert est bon, mais sa précision dépend de la qualité du scan. Même avec un scan net de 300 DPI, une précision de 98 % des caractères signifie encore des dizaines de fautes de frappe dans un livre de 300 pages que tu devras trouver et corriger. Enfin, convertir du HTML en EPUB est généralement simple, avec une grande mise en garde : si tu lui donnes n'importe quoi, tu obtiendras n'importe quoi. Si ta source est du HTML propre et sémantique — comme un article web bien structuré — elle se transposera magnifiquement en chapitres EPUB. Si tu donnes au convertisseur un enchevêtrement de HTML avec des styles en ligne et des mises en page construites à partir de tableaux, tu obtiendras un EPUB désordonné et enchevêtré à l'autre bout.
Accessibilité de l'EPUB et état actuel du standard
L'accessibilité est le domaine où l'EPUB 3 brille vraiment, et c'est sans doute la caractéristique la plus importante du format. En s'appuyant sur les standards du web, il prend en charge les éléments sémantiques HTML5 (`nav`, `aside`, etc.), les rôles ARIA pour les technologies d'assistance, le texte alternatif approprié pour les images, et des métadonnées qui définissent un ordre de lecture logique. Cela garantit qu'un lecteur d'écran navigue dans le livre comme l'auteur l'a prévu, et non en suivant simplement la mise en page visuelle de la page. Il ne s'agit pas seulement d'un ensemble de bonnes pratiques. La spécification officielle EPUB Accessibility 1.1 (une recommandation du W3C depuis mai 2023) énonce des exigences concrètes. Un EPUB accessible doit avoir une table des matières complète, un ordre de lecture logique, du texte alternatif et un contraste de couleurs approprié. Les éditeurs conformes peuvent même intégrer des métadonnées dans le fichier pour certifier qu'ils respectent une norme spécifique, comme WCAG 2.1 AA. Dans le monde réel, cependant, la qualité de l'accessibilité des EPUB est très disparate. Les grands éditeurs universitaires et commerciaux se sont beaucoup améliorés, grâce à la pression légale et réglementaire exercée par des initiatives comme le Traité de Marrakech et l'Acte européen sur l'accessibilité (entré pleinement en vigueur en juin 2025). Mais un grand nombre de livres, en particulier ceux des petites maisons d'édition et des auteurs auto-publiés, sont encore publiés avec des lacunes flagrantes en matière d'accessibilité : texte alternatif manquant, ordre de lecture non déclaré et navigation incomplète. La spécification n'a de valeur que si elle est appliquée. Pour les lecteurs qui ont besoin de ces fonctionnalités, le choix de l'application est important. Sur ordinateur, le lecteur gratuit Thorium Reader est la référence en matière d'accessibilité, avec un excellent support pour la synthèse vocale, le surlignage de phrases et la navigation par points de repère ARIA. Sur mobile, Apple Books sur iOS fait un très bon travail en respectant les fonctionnalités d'accessibilité de l'EPUB lorsqu'il est utilisé avec le lecteur d'écran VoiceOver. Le travail n'est pas terminé. Le groupe de travail EPUB du W3C continue de développer activement le standard. Actuellement, ils se concentrent sur l'amélioration du support pour les livres audio, la fourniture de directives plus claires sur l'utilisation des scripts, et la résolution du problème épineux de l'accessibilité de la mise en page fixe. Ce dernier est un vrai casse-tête, et la spécification n'a pas encore de solution parfaite.