Skip to content
Back to Blog
informational

¿Qué es el audio PCM? El formato detrás de WAV y AIFF

2026-05-17 9 min read

PCM no es un formato de archivo, es un método

Aclaremos un error común. Cuando ves un archivo WAV o AIFF, no estás viendo un 'archivo PCM'. PCM no es un formato de archivo en absoluto. Significa Modulación por Impulsos Codificados (Pulse-Code Modulation), el proceso fundamental para convertir sonido analógico en datos digitales. WAV y AIFF son solo los contenedores, las envolturas que contienen ese audio codificado en PCM. El proceso es sencillo. Una forma de onda analógica se muestrea miles de veces por segundo. Luego, la amplitud de cada muestra se mide y se le asigna un número. Esto crea un largo flujo de números que pueden reconstruir el sonido original con alta fidelidad. Esto es lo opuesto a formatos como MP3 o AAC. Esos formatos utilizan matemáticas ingeniosas para desechar datos de audio que creen que no escucharás, haciendo los archivos más pequeños. PCM es brutalmente honesto: lo conserva todo. Sin atajos. Una grabación estéreo de 10 segundos con calidad de CD (frecuencia de muestreo de 44.100 Hz, profundidad de 16 bits, estéreo) siempre será 10 × 44.100 × 2 bytes × 2 canales, lo que equivale a aproximadamente 1,76 MB de datos sin procesar. Esta distinción no es solo académica; es el lenguaje del audio profesional. Cuando un editor de video pide 'audio sin comprimir', se refiere a PCM. Cuando un ingeniero de masterización exige 'archivos fuente sin pérdidas', se refiere a PCM. Es la base del audio profesional, incluso si el término en sí permanece entre bastidores, rara vez apareciendo en iconos de archivo o menús de exportación.

Frecuencia de muestreo y profundidad de bits: los dos números que definen la calidad de PCM

Dos números definen la calidad de cualquier archivo de audio PCM: la frecuencia de muestreo y la profundidad de bits. Los ves en todas partes en el software de audio, y entender lo que significan es clave para evitar errores costosos en tus proyectos. La frecuencia de muestreo, medida en Hertz (Hz), te dice cuántas 'instantáneas' de la señal de audio se toman por segundo. Según el teorema de Nyquist, necesitas una frecuencia de muestreo al menos el doble de la frecuencia más alta que deseas grabar. Dado que el oído humano alcanza su límite alrededor de los 20.000 Hz, nació el estándar de CD de 44.100 Hz, lo que proporciona un margen de seguridad sobre el mínimo de 40.000 Hz. Verás otras tasas comunes: 44.100 Hz (CD, streaming), 48.000 Hz (producción de video), 88.200 Hz y 96.000 Hz (audio de alta resolución), e incluso 192.000 Hz para trabajos de archivo. Usar 48.000 Hz para un podcast no es un error, pero tendrás que volver a muestrearlo más tarde si quieres grabarlo en un CD junto con otras pistas de 44.100 Hz. La profundidad de bits tiene que ver con la precisión. Determina cuántos niveles de volumen posibles puede tener cada muestra. Un archivo de 16 bits ofrece 65.536 pasos. Un archivo de 24 bits ofrece la asombrosa cifra de 16.777.216 pasos. Esto se traduce directamente en rango dinámico, la diferencia entre los sonidos más silenciosos y los más fuertes posibles. 16 bits te da aproximadamente 96 dB de rango; 24 bits proporciona 144 dB. Ese margen adicional es la razón por la que los profesionales graban a 24 bits: puedes capturar sonidos silenciosos sin subir la ganancia y arriesgarte a generar ruido, para luego entregar el producto final a 16 bits. No cometas el error común de convertir descuidadamente un archivo de 48.000 Hz / 24 bits a 44.100 Hz / 16 bits. La calidad del algoritmo de conversión de frecuencia de muestreo (SRC) lo es todo. Un mal algoritmo llenará tu audio con desagradables artefactos de aliasing. Cualquiera que haya lidiado con un muestreo a la baja granulado y con problemas de fase conoce este dolor. Las herramientas profesionales como iZotope RX o Adobe Audition usan SRC de alta calidad por defecto. CocoConvert aplica algoritmos estándar que son perfectamente adecuados para la web y el podcasting, pero seré franco: si estás preparando un máster de música comercial, necesitas usar software de masterización dedicado. Sin excepciones.

WAV vs. AIFF: dos contenedores, un códec

Los dos contenedores principales para PCM son WAV y AIFF. WAV, una creación de Microsoft e IBM, apareció con Windows 3.1 en 1991. El AIFF de Apple es incluso más antiguo, creado en 1988 y basado en un formato anterior de Electronic Arts. Ambos fueron construidos para contener audio PCM sin comprimir. Para todos los propósitos prácticos, un WAV estéreo de 44.100 Hz / 16 bits y su equivalente AIFF son idénticos en sonido porque los datos PCM sin procesar en su interior son los mismos. Entonces, ¿cuál es la diferencia? Es principalmente histórica y estructural. WAV usa un orden de bytes little-endian, mientras que AIFF usa big-endian. Esto importaba en los días de los Mac PowerPC y los PC x86, pero al software actual le da igual y maneja ambos sin problemas. La diferencia más relevante son los metadatos. WAV tiene la extensión BWF (Broadcast Wave Format), una herramienta potente para trabajos de cine y televisión que incrusta datos críticos de código de tiempo y escena. AIFF tiene sus propios fragmentos de metadatos, y una variante llamada AIFF-C puede, técnicamente, contener audio comprimido, aunque casi nunca lo verás en la práctica. Aquí tienes el resumen práctico: las aplicaciones de Windows se inclinan por WAV. Logic Pro de Apple usa AIFF por defecto. Las herramientas de video profesionales como Premiere Pro y DaVinci Resolve aceptan ambos sin problema. ¿Mi consejo? Si le envías audio a un cliente y no estás seguro de lo que usa, envía un WAV. Es lo más parecido a un estándar universal. Solo recuerda, uno no es 'mejor' que el otro en términos de calidad de sonido cuando ambos contienen los mismos datos PCM lineales.

Dónde reside realmente el audio PCM en tu flujo de trabajo

Podrías sorprenderte de la frecuencia con la que ya estás trabajando con audio PCM. Es el caballo de batalla invisible de la mayoría de los flujos de trabajo multimedia. Saber dónde reside te ayuda a decidir cuándo convertir y, lo que es igual de importante, cuándo dejar las cosas como están. En la producción de video, el audio dentro de archivos de video profesionales como MXF, ProRes y DNxHD es casi siempre PCM de 48.000 Hz / 24 bits. Esa exportación final desde Premiere Pro (Archivo > Exportar > Medios) es un momento crítico: el editor elige si mantener el PCM impecable o comprimirlo a algo como AAC. Para grandes emisoras como la BBC (bajo R/68) o plataformas de streaming como Netflix, no hay elección: sus especificaciones de entrega exigen PCM. En el estudio de música, todo es PCM. Los DAW como Ableton Live, Logic Pro y Pro Tools viven y respiran de él. Ableton Live 11, por ejemplo, graba por defecto en formato WAV de punto flotante de 32 bits a la frecuencia de muestreo de tu proyecto (configurada en Preferencias > Audio). Esta variante especial de PCM utiliza números de punto flotante, lo que da a los ingenieros un enorme margen de seguridad durante la mezcla y evita la saturación. Una vez que la mezcla está hecha, esos archivos se convierten a PCM entero estándar de 16 o 24 bits para la entrega final. Para el almacenamiento a largo plazo, el PCM es el rey. Los archivos, las bibliotecas y las emisoras eligen PCM WAV o AIFF porque son a prueba de futuro. No hay un códec propietario que pueda quedar obsoleto. Un MP3 hecho en 2001 podría sonar diferente a uno hecho con un codificador de 2024, pero un archivo PCM de 1991 es idéntico bit a bit hoy. Por eso la Biblioteca del Congreso confía en el PCM WAV para la preservación de audio. Incluso en el lado del consumidor, está ahí. Si ripeas un CD usando el 'Codificador AIFF' en Music.app de Apple, obtendrás archivos AIFF PCM. Si usas Windows Media Player para ripear a WAV, obtendrás WAV PCM. En ambos casos, has creado una copia perfecta y sin pérdidas del disco.

Conversión de audio PCM: qué cambia y qué no

Cambiar entre formatos PCM, como de WAV a AIFF, es solo cambiar la caja en la que viene el audio. Los datos de audio en sí no se modifican. Es una operación completamente sin pérdidas, ya sea que uses CocoConvert o cualquier otra herramienta. Puedes convertir un archivo de WAV a AIFF y viceversa mil veces con cero pérdida de calidad. Pasar de PCM a un formato comprimido como MP3, AAC u OGG Vorbis es una calle de sentido único. Es un proceso con pérdidas. El codificador utiliza modelos psicoacústicos para desechar datos que asume que no echarás de menos. A altas tasas de bits (como MP3 de 320 kbps o AAC de 256 kbps), la mayoría de la gente no notará la diferencia. Pero a tasas de bits más bajas, 128 kbps o menos, empezarás a escuchar artefactos feos, especialmente en sonidos agudos como los platillos. Ese daño es permanente. No puedes recuperarlo. Convertir ese MP3 de nuevo a un archivo WAV solo te da un archivo grande que contiene el mismo audio dañado. Sí, CocoConvert puede convertir un MP3 de nuevo a un WAV. La operación es técnicamente válida y el archivo funcionará. Pero seamos claros: esto no mejora la calidad. La calidad de audio sigue limitada por el MP3 original. Solo estás poniendo audio con calidad de 128 kbps en un archivo mucho más grande. La única buena razón para hacer esto es por compatibilidad, si estás trabajando con software o hardware antiguo que exige archivos WAV. Nunca lo hagas pensando que estás 'recuperando' calidad perdida. Cuando cambias la frecuencia de muestreo o la profundidad de bits de un archivo PCM, la calidad del software de conversión se vuelve crítica. Pasar de 96.000 Hz a 44.100 Hz, por ejemplo, requiere un filtro de paso bajo para evitar el aliasing, y diferentes herramientas hacen esto con diferentes grados de éxito. Para cualquier cosa que requiera una escucha crítica, realmente deberías usar software de audio dedicado con un algoritmo SRC de primer nivel.

Variantes de PCM que encontrarás: Float, LPCM y DPCM

El PCM básico no es el único tipo que existe. Te encontrarás con algunas variaciones, y es bueno saber qué son y cuándo importan. La variante más importante para los productores modernos es el PCM de punto flotante de 32 bits (también llamado IEEE 754 float). En lugar de enteros, almacena los valores de las muestras como números de punto flotante. Esto es algo importantísimo dentro de un DAW como Ableton Live, Pro Tools o FL Studio porque permite que los niveles de audio superen el máximo sin saturar, lo que te da una flexibilidad increíble durante una mezcla. Estos archivos son más grandes que el PCM entero de 24 bits (4 bytes por muestra frente a 3 bytes), y aunque la mayoría del software moderno puede reproducirlos, casi siempre los convertirás a un archivo entero de 24 o 16 bits para la entrega final. Podrías ver el término LPCM, que significa PCM Lineal. No dejes que te confunda; es solo un nombre más específico para el PCM estándar que hemos estado discutiendo, donde los pasos de volumen son todos iguales. La parte 'Lineal' está ahí para distinguirlo de las variantes logarítmicas de PCM como la codificación A-law y μ-law (mu-law) utilizadas en telefonía. Esos son ingeniosos esquemas de compresión utilizados para comprimir el habla humana en pequeñas muestras de 8 bits. Si alguna vez recibes un archivo .au extraño o un WAV de un sistema telefónico, podría ser uno de estos. Necesitarás convertirlo a PCM lineal WAV estándar antes de poder editarlo, algo que CocoConvert puede manejar. Finalmente, está DPCM y su primo ADPCM. Estos son formatos de compresión ligeros que almacenan la *diferencia* entre las muestras de audio en lugar del valor completo. Encontrarás ADPCM en algunos audios de videojuegos y archivos multimedia antiguos. Aunque tiene 'PCM' en el nombre, no es sin pérdidas. Los archivos WAV IMA ADPCM, por ejemplo, sonarán notablemente menos nítidos que un archivo PCM lineal verdadero con la misma frecuencia de muestreo y profundidad de bits.

Eligiendo la configuración PCM correcta para casos de uso comunes

Los números más grandes no siempre son mejores. Elegir la configuración PCM correcta se trata de ser inteligente: adapta tu formato a tu destino final y mantén la calidad donde importa. Para la distribución de música a plataformas de streaming (Spotify, Apple Music, Tidal): Mantente en 44.100 Hz. Entrega un WAV estéreo de 16 bits para la entrega estándar, o un WAV de 44.100 Hz / 24 bits si buscas un nivel de alta resolución. Enviar a Spotify un archivo de 96.000 Hz no tiene sentido; su pipeline de codificación interno acepta hasta 44.100 Hz / 16 bits, por lo que no ganas nada. El nivel Lossless de Apple Music es más flexible, aceptando archivos de 24 bits a 44.100 Hz o 48.000 Hz. Para producción y emisión de video: Este es fácil. Usa PCM de 48.000 Hz / 24 bits. De forma consistente. Es el estándar global. Al trabajar en 48k de principio a fin, evitas cualquier conversión de frecuencia de muestreo desagradable cuando tu audio se sincroniza finalmente con el video, que casi universalmente funciona a 48.000 Hz. Para podcasting y contenido de voz: Un WAV de 44.100 Hz / 16 bits es más que suficiente. Tu anfitrión simplemente lo volverá a codificar a MP3 o AAC de todos modos, así que tu trabajo es darle a su codificador el mejor material fuente posible para trabajar. Grabar un podcast a 192.000 Hz es un puro exceso y no ofrece ningún beneficio al oyente. Para archivo y preservación: Un WAV PCM de 96.000 Hz / 24 bits es el punto óptimo. Captura una enorme cantidad de detalles sin dejar de ser práctico desde la perspectiva del almacenamiento. La Biblioteca del Congreso y la mayoría de los archivos nacionales especifican este rango por una razón. Para conversiones diarias —cambiar de WAV a AIFF, ajustar la frecuencia de muestreo o crear archivos comprimidos para la entrega— CocoConvert hace el trabajo correctamente en tu navegador. No se necesitan instalaciones. Pero para trabajos altamente especializados, como SRC de grado de masterización o procesamiento por lotes de archivos de emisión con preservación de metadatos BWF, necesitas recurrir a las herramientas profesionales: iZotope RX o Adobe Audition. Parte de ser un profesional es saber qué herramienta usar para cada trabajo y comprender los límites de cualquier herramienta, incluida esta.