¿Qué es EPUB? El estándar abierto para libros electrónicos
Lo básico: Qué es realmente un EPUB
EPUB son las siglas de Electronic Publication (publicación electrónica), pero en realidad es un estándar universal para libros digitales. Es un formato abierto, gestionado ahora por el World Wide Web Consortium (W3C) desde que tomaron el relevo del IDPF en 2017. En el fondo, un archivo .epub no es más que un archivo ZIP. Dentro, encontrarás los componentes básicos de una página web moderna: HTML para el texto, CSS para el estilo, imágenes y algunos archivos XML que organizan cómo se une todo en tu lector de libros electrónicos. La diferencia clave entre un EPUB y algo como un PDF es su diseño fluido (reflowable). Este es su superpoder. El texto se ajusta y redimensiona automáticamente para adaptarse a cualquier pantalla, ya sea un pequeño Kobo de 6 pulgadas, un espacioso iPad o un enorme monitor de escritorio. Como lector, tú tienes el control. Puedes cambiar el tamaño de la fuente, el tipo de letra, el espaciado e incluso el color de fondo, y el libro simplemente se adapta. Como almacena el texto como texto real —no como imágenes estáticas de palabras, como un PDF escaneado—, una novela de 400 páginas puede ocupar un minúsculo archivo de 500 KB. El formato ha evolucionado con el tiempo. EPUB 2, de 2007, sentó las bases. Luego llegó EPUB 3, finalizado por primera vez en 2011 y actualizado tan recientemente como la versión 3.3 en 2023. Esta versión moderna trajo consigo un montón de tecnologías web: HTML5, CSS3, JavaScript para la interactividad, MathML para ecuaciones complejas e incluso audio y vídeo incrustados. También introdujo potentes funciones de accesibilidad como los puntos de referencia ARIA. Aunque la mayoría de los dispositivos y aplicaciones modernos manejan EPUB 3 sin problemas, todavía encontrarás algunos lectores electrónicos más antiguos que recurren a EPUB 2 para la representación de texto simple. Dejemos una cosa clara: EPUB no es lo mismo que MOBI o AZW3. Esos son los formatos propietarios de Kindle de Amazon. Si compras un libro en Amazon, obtienes un archivo bloqueado en su ecosistema. Si lo compras en Kobo, Google Play Libros, Apple Books o casi cualquier librería independiente, lo que obtienes es un EPUB.
Un vistazo al interior de un archivo EPUB: explicación de su estructura
Aquí tienes un truco genial: coge cualquier archivo .epub, cámbiale la extensión a .zip y extráelo. Lo que encontrarás dentro es una estructura de carpetas perfectamente organizada. Justo al principio, siempre verás un archivo llamado `mimetype`. Este diminuto archivo contiene una sola línea —`application/epub+zip`— y tiene que ser lo primero que haya en el archivo, sin comprimir. Esto permite que el software reconozca al instante el archivo como un EPUB sin tener que rebuscar en él. A continuación, mira dentro de la carpeta `META-INF`. Encontrarás un archivo `container.xml`. Su único trabajo es apuntar al documento principal del paquete, que normalmente se llama `content.opf` o `package.opf`. Este archivo OPF es el sistema nervioso central del libro. Es una lista maestra de todos los archivos de contenido, define el orden de lectura de los capítulos y contiene todos los metadatos cruciales: título, autor, idioma, ISBN, fecha de publicación y editorial. El contenido real del libro —el texto y las imágenes— reside en una carpeta, normalmente llamada `OEBPS` o `Content`. Aquí es donde encontrarás los archivos XHTML individuales para cada capítulo, los archivos CSS que controlan la apariencia del libro y un directorio para las imágenes. También verás un archivo `toc.ncx` (para los lectores EPUB 2 más antiguos) y un archivo `nav.xhtml` (para los modernos EPUB 3). Estos dos archivos alimentan la tabla de contenidos que usas para saltar entre capítulos en tu lector electrónico. ¿Y por qué importa esta estructura? Porque si un EPUB está roto, a menudo puedes arreglarlo tú mismo. Cualquiera que haya sido derrotado por un archivo defectuoso conoce la frustración. Con un EPUB, puedes abrir el capó. Solo tienes que abrir el archivo, encontrar el XHTML defectuoso, arreglar el código en un editor de texto y volver a comprimirlo todo (¡recuerda poner `mimetype` primero y sin comprimir!) antes de renombrarlo de nuevo a .epub. Hacerlo produce una gran satisfacción. Incluso puedes usar herramientas gratuitas como EPUBCheck del W3C para localizar el archivo y el número de línea exactos que causan el problema. Para los desarrolladores, esta estructura abierta es también lo que hace que EPUB sea tan flexible. ¿Quieres añadir una fuente personalizada? Simplemente suelta un archivo `.woff2` en el archivo y llámalo desde tu CSS usando una regla `@font-face` estándar.
EPUB vs. PDF: eligiendo el formato correcto
El debate EPUB vs. PDF es un clásico, pero se basa en una premisa falsa. No son realmente competidores; son herramientas diseñadas para trabajos completamente diferentes. Ninguno es 'mejor' que el otro, simplemente destacan en contextos distintos. El PDF se centra en preservar un diseño visual fijo. Piensa en artículos académicos a dos columnas, en las páginas de una revista satinada o en formularios gubernamentales que hay que rellenar. Estos *deben* ser PDF. Las dimensiones de la página están bloqueadas, las fuentes están incrustadas y el documento que ves en pantalla es exactamente el que saldrá de la impresora. Esa previsibilidad estática es la razón de ser del PDF. El EPUB, por otro lado, prioriza la legibilidad en cualquier pantalla. Novelas, artículos largos y manuales que necesitas leer en tu teléfono son perfectos para EPUB. Su texto fluido permite que un lector suba la fuente a 24pt para una mejor visibilidad, y las palabras simplemente se reorganizan para encajar. Intenta hacer eso con un PDF y te verás atrapado en una pesadilla de pellizcar, hacer zoom y desplazarte horizontalmente que hace imposible la lectura. A veces, la plataforma elige por ti. Apple Books en iOS y macOS está diseñado para EPUB; aunque puede *abrir* un PDF, pierdes todas las mejores funciones de lectura como los controles de fuente, el modo nocturno y la sincronización entre dispositivos. El ecosistema Kindle de Amazon es lo contrario. Ha abandonado por completo el soporte nativo de EPUB. O tienes que convertir tus EPUB a AZW3 o usar el servicio Send to Kindle, que realiza la conversión en los servidores de Amazon. En cuanto a la accesibilidad, un EPUB 3 bien hecho es imbatible. Los lectores de pantalla pueden usar la estructura semántica HTML del libro para navegar por capítulo, encabezado o punto de referencia. Aunque un 'PDF etiquetado' puede hacer esto en teoría, en el mundo real, ese etiquetado suele estar roto o ni siquiera existe. La especificación EPUB Accessibility 1.1 da a los editores un estándar claro al que aspirar. La única excepción es el EPUB de diseño fijo. Aunque el formato existe, el soporte de los lectores es un campo de minas. ¿Mi consejo? Si necesitas un diseño perfecto al píxel, quédate con el PDF y hazlo tan accesible como puedas. No intentes forzar al EPUB a un papel para el que no fue diseñado.
DRM, distribución y qué significa realmente 'abierto'
Cuando decimos que EPUB es un 'estándar abierto', significa que el modelo es de uso libre para cualquiera. La especificación es pública, implementarla no cuesta nada y ninguna empresa es su dueña. Por eso ha florecido un ecosistema saludable de aplicaciones para EPUB. Tienes una enorme variedad de opciones, desde herramientas para usuarios avanzados como Calibre y Thorium Reader hasta las aplicaciones integradas de Apple, Google y Kobo, además de opciones de nicho como Foliate para Linux. Pero 'formato abierto' no significa 'libre de DRM'. Esta es una distinción crucial. Los editores y las tiendas a menudo envuelven sus archivos EPUB en una capa de gestión de derechos digitales (DRM) antes de venderlos. El sistema más común es el DRM ADEPT de Adobe, que encontrarás en los libros electrónicos prestados de bibliotecas públicas a través de OverDrive o Libby. Kobo y Apple también tienen su propio DRM propietario. El archivo resultante sigue siendo un EPUB por debajo, pero está bloqueado y solo se puede abrir en dispositivos y aplicaciones autorizados. Para la conversión de archivos, el DRM es un muro infranqueable. CocoConvert puede convertir fácilmente archivos EPUB sin protección a y desde PDF, DOCX, HTML y otros formatos. Pero no puede, y no tocará, un archivo protegido por DRM. Intentar eliminar el DRM para permitir la conversión es ilegal bajo leyes como la DMCA en EE. UU. y la Directiva de Derechos de Autor de la UE. Si tienes un libro con DRM y quieres leerlo en un dispositivo diferente, tus únicas opciones legales son ver si la tienda ofrece una descarga sin DRM o simplemente usar la aplicación designada por el vendedor. La buena noticia es que los EPUB sin DRM son más comunes de lo que crees. Grandes editoriales como Tor Books y O'Reilly han construido su reputación vendiendo archivos sin DRM. La mayoría de las editoriales académicas de acceso abierto también lo hacen. También puedes encontrarlos en tiendas como Smashwords y Humble Bundle, o comprando directamente desde el sitio web de un autor. Estos son los archivos que realmente posees: puedes hacer copias de seguridad, convertirlos y leerlos en cualquier aplicación que elijas, para siempre.
Crear y editar archivos EPUB
Crear un EPUB desde cero puede ser tan simple o tan complejo como quieras, dependiendo de tus herramientas. Para aquellos que se sientan cómodos con HTML básico, el editor gratuito y de código abierto Sigil es el punto de partida clásico; tiene una interfaz visual y un validador incorporado para detectar errores. Los autores que se autopublican en macOS a menudo confían ciegamente en Vellum, una aplicación de pago que produce libros con un formato precioso a partir de plantillas, aunque tiene un precio considerable de 199,99 USD. Y muchos escritores ya usan Scrivener, que puede compilar un manuscrito directamente a EPUB 3 desde su menú `Archivo > Compilar`. Los desarrolladores y escritores técnicos tienen su propio conjunto de herramientas potentes. Sphinx, el motor detrás de gran parte de la documentación de Python, puede generar un archivo EPUB 3 con la misma facilidad que genera HTML o un PDF. Luego está Pandoc, la navaja suiza de la conversión de documentos. Puede crear un EPUB a partir de casi cualquier cosa —Markdown, DOCX, LaTeX— con una simple instrucción de línea de comandos como `pandoc input.docx -o output.epub --epub-cover-image=cover.jpg`. Editar un EPUB existente es donde las cosas se ponen interesantes. Si tienes un archivo con un formato raro o capítulos en el orden incorrecto, puedes usar Sigil para meterle mano. Su explorador de libros te muestra toda la estructura del archivo, permitiéndote sumergirte en el archivo XHTML o CSS específico para solucionar el problema directamente. Calibre también tiene un potente editor de libros electrónicos que ofrece funciones similares. Sin embargo, para solo ajustar los metadatos, nada supera a la interfaz principal de Calibre. Corregir el nombre de un autor, añadir una etiqueta de serie o rectificar un año de publicación está a un simple clic derecho. Incluso puede obtener los metadatos correctos automáticamente usando un ISBN, lo que es un ahorro de tiempo masivo. Pero ten cuidado: si intentas editar un EPUB de diseño fijo, como un libro infantil ilustrado o el complejo diseño de una revista, te enfrentas a un desafío. Estos archivos a menudo utilizan CSS y JavaScript intrincados que no se pueden desenredar con un simple editor visual. Necesitarás un profundo conocimiento de la especificación EPUB y del desarrollo web para hacer cambios sin romperlo todo.
Convertir archivos EPUB: qué funciona y qué no
Convertir archivos EPUB es una tarea común, pero la calidad del resultado depende por completo de qué estás convirtiendo y a qué formato. No es un proceso universal. Convertir de EPUB a PDF suele ser una apuesta segura, especialmente para libros centrados en el texto. Una herramienta como CocoConvert renderizará el contenido del EPUB en un PDF limpio y paginado, perfecto para imprimir o archivar novelas e informes. El proceso se complica con archivos más complejos. Los diseños CSS elaborados, las fuentes no incrustadas y cualquier interactividad basada en JavaScript de un archivo EPUB 3 se perderán en la traducción a un PDF estático. El diseño podría incluso romperse, requiriendo que lo arregles manualmente. Convertir un EPUB en un archivo DOCX es la mejor manera de llevar el texto a Microsoft Word para editarlo. La conversión preservará la estructura esencial —encabezados, párrafos, negritas y cursivas, imágenes básicas—, pero eso es todo. No esperes que los CSS elegantes, las letras capitales o los diseños personalizados sobrevivan al viaje. La mejor manera de pensar en el archivo DOCX resultante es como un borrador limpio y editable, no como un documento final y formateado. Pasar de PDF a EPUB es, de lejos, la conversión más difícil, una verdadera situación en la que los resultados pueden variar. Si el PDF fue exportado desde una fuente basada en texto como Word, un conversor como CocoConvert a menudo puede extraer el texto limpiamente y estructurarlo en un EPUB usable. Pero si tienes un PDF escaneado —que es solo una colección de imágenes de páginas—, te espera un viaje mucho más accidentado. Esto requiere Reconocimiento Óptico de Caracteres (OCR) para convertir esas imágenes de nuevo en texto, un proceso que nunca es perfecto. El OCR de CocoConvert es bueno, pero su precisión depende de la calidad del escaneo. Incluso con un escaneo nítido de 300 DPI, una precisión de caracteres del 98% sigue significando docenas de erratas en un libro de 300 páginas que tendrás que encontrar y corregir. Finalmente, convertir de HTML a EPUB suele ser sencillo, con una gran advertencia: si entra basura, sale basura. Si tu fuente es HTML limpio y semántico —como un artículo web bien estructurado—, se mapeará maravillosamente en capítulos de EPUB. Si le das al conversor un desastre de HTML enredado con estilos en línea y diseños construidos con tablas, obtendrás un EPUB desastroso y enredado al final.
La accesibilidad de EPUB y el estado actual del estándar
La accesibilidad es donde EPUB 3 realmente brilla, y es posiblemente la característica más importante del formato. Al basarse en estándares web, admite elementos semánticos de HTML5 (`nav`, `aside`, etc.), roles ARIA para tecnologías de asistencia, texto alternativo adecuado para las imágenes y metadatos que definen un orden de lectura lógico. Esto asegura que un lector de pantalla navegue por el libro como el autor pretendía, no simplemente siguiendo el diseño visual de la página. No se trata solo de una colección informal de buenas prácticas. La especificación oficial EPUB Accessibility 1.1 (una Recomendación del W3C desde mayo de 2023) establece los requisitos concretos. Un EPUB accesible debe tener una tabla de contenidos completa, un orden de lectura lógico, texto alternativo y un contraste de color adecuado. Los editores que cumplen con la norma pueden incluso incrustar metadatos en el archivo para certificar que cumplen un estándar específico, como WCAG 2.1 AA. En el mundo real, sin embargo, la calidad de la accesibilidad de los EPUB es muy variable. Las grandes editoriales académicas y comerciales han mejorado mucho, gracias a la presión legal y regulatoria de iniciativas como el Tratado de Marrakech y la Ley Europea de Accesibilidad (que entró en pleno vigor en junio de 2025). Pero una gran cantidad de libros, especialmente de editoriales más pequeñas y autores autopublicados, todavía se lanzan con flagrantes agujeros de accesibilidad: falta de texto alternativo, ningún orden de lectura declarado y navegación incompleta. La especificación es tan buena como su implementación. Para los lectores que necesitan estas funciones, la elección de la aplicación es importante. En el escritorio, el gratuito Thorium Reader es el estándar de oro para la accesibilidad, con un excelente soporte para texto a voz, resaltado de frases y navegación por puntos de referencia ARIA. En el móvil, Apple Books en iOS hace un muy buen trabajo al respetar las funciones de accesibilidad de EPUB cuando se usa con el lector de pantalla VoiceOver. El trabajo no ha terminado. El grupo de trabajo de EPUB del W3C sigue desarrollando activamente el estándar. Ahora mismo, se están centrando en mejorar el soporte para audiolibros, proporcionar una guía más clara sobre el uso de scripts y abordar el espinoso problema de la accesibilidad en el diseño fijo. Este último es un hueso especialmente duro de roer, y la especificación aún no tiene una solución perfecta.