Skip to content
Back to Blog
informational

Was ist PCM Audio? Das Format hinter WAV und AIFF

2026-05-17 9 min read

PCM ist kein Dateiformat – es ist eine Methode

Lass uns ein häufiges Missverständnis ausräumen. Wenn du eine WAV- oder AIFF-Datei siehst, siehst du keine „PCM-Datei“. PCM ist überhaupt kein Dateiformat. Es steht für Puls-Code-Modulation, den grundlegenden Prozess, analoge Töne in digitale Daten umzuwandeln. WAV und AIFF sind nur die Container, die Hüllen, die dieses PCM-kodierte Audio enthalten. Der Prozess ist unkompliziert. Eine analoge Wellenform wird tausende Male pro Sekunde abgetastet. Dann wird die Amplitude jedes Samples gemessen und eine Zahl zugewiesen. Dies erzeugt einen langen Zahlenstrom, der den Originalklang mit hoher Wiedergabetreue rekonstruieren kann. Das ist das Gegenteil von Formaten wie MP3 oder AAC. Diese Formate verwenden clevere Mathematik, um Audiodaten zu verwerfen, von denen sie glauben, dass du sie nicht hören wirst, wodurch die Dateien kleiner werden. PCM ist brutal ehrlich: Es behält alles. Keine Abkürzungen. Eine 10-sekündige Stereoaufnahme in CD-Qualität (44.100 Hz Abtastrate, 16 Bit Tiefe, Stereo) wird immer 10 × 44.100 × 2 Bytes × 2 Kanäle sein, was etwa 1,76 MB Rohdaten entspricht. Diese Unterscheidung ist nicht nur akademisch; es ist die Sprache des professionellen Audios. Wenn ein Video-Editor nach „unkomprimiertem Audio“ fragt, meint er PCM. Wenn ein Mastering-Ingenieur „verlustfreie Quelldateien“ verlangt, meint er PCM. Es ist das Fundament des professionellen Audios, auch wenn der Begriff selbst im Hintergrund bleibt und selten auf Dateisymbolen oder Exportmenüs erscheint.

Abtastrate und Bittiefe: Die zwei Zahlen, die die PCM-Qualität definieren

Zwei Zahlen definieren die Qualität jeder PCM-Audiodatei: Abtastrate und Bittiefe. Du siehst sie überall in Audio-Software, und zu verstehen, was sie bedeuten, ist der Schlüssel, um teure Fehler in deinen Projekten zu vermeiden. Die Abtastrate, gemessen in Hertz (Hz), sagt dir, wie viele Momentaufnahmen des Audiosignals pro Sekunde gemacht werden. Gemäß dem Nyquist-Theorem benötigst du eine Abtastrate, die mindestens doppelt so hoch ist wie die höchste Frequenz, die du aufnehmen möchtest. Da das menschliche Gehör bei etwa 20.000 Hz seine Grenze erreicht, entstand der 44.100 Hz CD-Standard, der einen sicheren Spielraum über dem Minimum von 40.000 Hz bietet. Du wirst andere gängige Raten sehen: 44.100 Hz (CD, Streaming), 48.000 Hz (Videoproduktion), 88.200 Hz und 96.000 Hz (High-Res-Audio) und sogar 192.000 Hz für Archivierungsarbeiten. Die Verwendung von 48.000 Hz für einen Podcast ist kein Fehler, aber du musst ihn später neu sampeln, wenn du ihn zusammen mit anderen 44.100 Hz-Tracks auf eine CD brennen möchtest. Bittiefe dreht sich alles um Präzision. Sie bestimmt, wie viele mögliche Lautstärkestufen jedes Sample haben kann. Eine 16-Bit-Datei bietet 65.536 Schritte. Eine 24-Bit-Datei bietet unglaubliche 16.777.216 Schritte. Dies übersetzt sich direkt in den Dynamikbereich – den Unterschied zwischen den leisesten und lautesten möglichen Klängen. 16 Bit geben dir etwa 96 dB Bereich; 24 Bit bieten 144 dB. Dieser zusätzliche Headroom ist der Grund, warum Profis mit 24 Bit aufnehmen: Du kannst leise Klänge aufnehmen, ohne den Gain hochzudrehen und Rauschen zu riskieren, und das Endprodukt dann mit 16 Bit liefern. Mach nicht den häufigen Fehler, eine 48.000 Hz / 24-Bit-Datei gedankenlos auf 44.100 Hz / 16-Bit zu konvertieren. Die Qualität des Abtastratenkonvertierungs- (SRC) Algorithmus ist alles entscheidend. Ein schlechter Algorithmus wird dein Audio mit unangenehmen Aliasing-Artefakten übersäen. Jeder, der schon einmal mit einem körnigen, phasenverschobenen Downsample zu kämpfen hatte, kennt diesen Schmerz. Professionelle Tools wie iZotope RX oder Adobe Audition verwenden standardmäßig hochwertige SRC. CocoConvert wendet Standardalgorithmen an, die für Web und Podcasting völlig in Ordnung sind, aber ich sage es dir ganz offen: Wenn du ein kommerzielles Musikmaster vorbereitest, musst du spezielle Mastering-Software verwenden. Keine Ausnahmen.

WAV vs. AIFF: Zwei Container, ein Codec

Die beiden Hauptcontainer für PCM sind WAV und AIFF. WAV, eine Kreation von Microsoft und IBM, kam 1991 mit Windows 3.1. Apples AIFF ist noch älter, wurde 1988 erstellt und basiert auf einem früheren Electronic Arts-Format. Beide wurden entwickelt, um unkomprimiertes PCM-Audio zu speichern. Für alle praktischen Zwecke sind eine 44.100 Hz / 16-Bit Stereo-WAV und ihr AIFF-Äquivalent klanglich identisch, da die rohen PCM-Daten darin dieselben sind. Was ist also der Unterschied? Es ist hauptsächlich historisch und strukturell. WAV verwendet Little-Endian-Byte-Reihenfolge, während AIFF Big-Endian verwendet. Das spielte früher, zu Zeiten von PowerPC Macs und x86 PCs, eine Rolle, aber die heutige Software kümmert sich nicht darum und verarbeitet beides problemlos. Der relevantere Unterschied sind Metadaten. WAV hat die BWF (Broadcast Wave Format)-Erweiterung, ein Kraftpaket für Film- und TV-Arbeiten, das kritische Timecode- und Szenendaten einbettet. AIFF hat seine eigenen Metadaten-Chunks, und eine Variante namens AIFF-C kann technisch komprimiertes Audio enthalten, obwohl du das in der Praxis fast nie sehen wirst. Hier ist die praktische Aufschlüsselung: Windows-Apps neigen zu WAV. Apples Logic Pro verwendet standardmäßig AIFF. Professionelle Video-Tools wie Premiere Pro und DaVinci Resolve akzeptieren beide problemlos. Mein Rat? Wenn du Audio an einen Kunden sendest und nicht sicher bist, was er verwendet, sende eine WAV-Datei. Es ist das Nächste, was einem universellen Standard nahekommt. Denk einfach daran, dass das eine nicht „besser“ ist als das andere in Bezug auf die Klangqualität, wenn beide dieselben linearen PCM-Daten enthalten.

Wo PCM-Audio tatsächlich in deinem Workflow lebt

Du wirst vielleicht überrascht sein, wie oft du bereits mit PCM-Audio arbeitest. Es ist das unsichtbare Arbeitspferd der meisten Medien-Workflows. Zu wissen, wo es lebt, hilft dir zu entscheiden, wann du konvertieren solltest und, ebenso wichtig, wann du die Dinge so lassen solltest, wie sie sind. In der Videoproduktion ist das Audio in professionellen Videodateien wie MXF, ProRes und DNxHD fast immer 48.000 Hz / 24-Bit PCM. Dieser finale Export aus Premiere Pro (File > Export > Media) ist ein kritischer Moment: Der Editor wählt, ob er das makellose PCM behalten oder es zu etwas wie AAC komprimieren möchte. Für große Sender wie die BBC (unter R/68) oder Streamer wie Netflix gibt es keine Wahl – ihre Liefervorgaben erfordern PCM. Im Musikstudio ist alles PCM. DAWs wie Ableton Live, Logic Pro und Pro Tools leben und atmen es. Ableton Live 11 beispielsweise nimmt standardmäßig im 32-Bit Float WAV-Format mit der Abtastrate deines Projekts auf (eingestellt unter Preferences > Audio). Diese spezielle PCM-Variante verwendet Gleitkommazahlen, was Ingenieuren während des Mixings enormen Headroom bietet und Clipping verhindert. Sobald der Mix fertig ist, werden diese Dateien für die finale Veröffentlichung auf standardmäßiges 16-Bit oder 24-Bit Integer-PCM konvertiert. Für die Langzeitspeicherung ist PCM König. Archive, Bibliotheken und Sender wählen PCM WAV oder AIFF, weil es zukunftssicher ist. Es gibt keinen proprietären Codec, der obsolet werden kann. Eine 2001 erstellte MP3-Datei mag anders klingen als eine mit einem 2024er Encoder erstellte, aber eine PCM-Datei von 1991 ist heute Bit für Bit identisch. Deshalb vertraut die Library of Congress auf PCM WAV für die Audioarchivierung. Auch auf der Konsumentenseite ist es präsent. Wenn du eine CD mit dem „AIFF Encoder“ in Apples Music.app rippst, erhältst du PCM AIFF-Dateien. Wenn du den Windows Media Player verwendest, um nach WAV zu rippen, erhältst du PCM WAV. In beiden Fällen hast du eine perfekte, verlustfreie Kopie der Disc erstellt.

PCM-Audio konvertieren: Was sich ändert und was nicht

Der Wechsel zwischen PCM-Formaten, wie WAV zu AIFF, ändert nur die Verpackung des Audios. Die Audiodaten selbst bleiben unberührt. Es ist ein vollständig verlustfreier Vorgang, egal ob du CocoConvert oder ein anderes Tool verwendest. Du kannst eine Datei tausendmal von WAV zu AIFF und zurück konvertieren, ohne Qualitätsverlust. Der Übergang von PCM zu einem komprimierten Format wie MP3, AAC oder OGG Vorbis ist eine Einbahnstraße. Es ist ein verlustbehafteter Prozess. Der Encoder verwendet psychoakustische Modelle, um Daten zu verwerfen, von denen er annimmt, dass du sie nicht vermissen wirst. Bei hohen Bitraten (wie 320 kbps MP3 oder 256 kbps AAC) werden die meisten Leute keinen Unterschied hören. Aber bei niedrigeren Bitraten, 128 kbps und darunter, wirst du anfangen, hässliche Artefakte zu hören, besonders bei scharfen Klängen wie Becken. Dieser Schaden ist dauerhaft. Du kannst ihn nicht rückgängig machen. Die Konvertierung dieser MP3-Datei zurück in eine WAV-Datei gibt dir nur eine große Datei, die dasselbe beschädigte Audio enthält. Ja, CocoConvert kann eine MP3 zurück in eine WAV konvertieren. Der Vorgang ist technisch gültig und die Datei wird funktionieren. Aber lass uns klar sein: Dies verbessert die Qualität nicht. Die Audioqualität ist immer noch durch die ursprüngliche MP3 begrenzt. Du steckst nur 128 kbps Qualitätsaudio in eine viel größere Datei. Der einzige gute Grund, dies zu tun, ist die Kompatibilität, wenn du mit alter Software oder Hardware arbeitest, die WAV-Dateien erfordert. Tu es niemals in dem Glauben, dass du verlorene Qualität „wiederherstellst“. Wenn du die Abtastrate oder Bittiefe einer PCM-Datei änderst, wird die Qualität der Konvertierungssoftware entscheidend. Zum Beispiel erfordert der Übergang von 96.000 Hz auf 44.100 Hz einen Tiefpassfilter, um Aliasing zu verhindern, und verschiedene Tools tun dies mit unterschiedlichem Erfolg. Für alles, was kritisches Hören erfordert, solltest du wirklich spezielle Audio-Software mit einem erstklassigen SRC-Algorithmus verwenden.

PCM-Varianten, denen du begegnen wirst: Float, LPCM und DPCM

Einfaches PCM ist nicht die einzige Variante da draußen. Du wirst auf einige Variationen stoßen, und es ist gut zu wissen, was sie sind und wann sie wichtig sind. Die wichtigste Variante für moderne Produzenten ist 32-Bit Float PCM (auch IEEE 754 Float genannt). Anstelle von Ganzzahlen speichert es Sample-Werte als Gleitkommazahlen. Das ist ein riesiger Vorteil in einer DAW wie Ableton Live, Pro Tools oder FL Studio, da es ermöglicht, dass Audiopegel über das Maximum hinausgehen, ohne tatsächlich zu clippen, was dir unglaubliche Flexibilität während eines Mixes gibt. Diese Dateien sind größer als 24-Bit Integer-PCM (4 Bytes pro Sample vs. 3 Bytes), und obwohl die meisten modernen Programme sie abspielen können, wirst du sie fast immer für die endgültige Lieferung auf eine 24-Bit oder 16-Bit Integer-Datei herunterkonvertieren. Du könntest den Begriff LPCM sehen, der für Linear PCM steht. Lass dich davon nicht beirren; es ist nur ein spezifischerer Name für das Standard-PCM, das wir besprochen haben, bei dem die Lautstärkestufen alle gleich sind. Der Teil „Linear“ ist da, um es von logarithmischen PCM-Varianten wie A-Law und μ-Law (Mu-Law)-Kodierung zu unterscheiden, die in der Telefonie verwendet werden. Das sind clevere Komprimierungsschemata, die verwendet werden, um menschliche Sprache in winzige 8-Bit-Samples zu quetschen. Wenn du jemals eine seltsame .au-Datei oder eine WAV von einem Telefonsystem erhältst, könnte es eine davon sein. Du musst sie in standardmäßiges lineares PCM WAV konvertieren, bevor du sie bearbeiten kannst, was CocoConvert handhaben kann. Schließlich gibt es DPCM und seinen Verwandten ADPCM. Dies sind leichte Komprimierungsformate, die die *Differenz* zwischen Audiosamples speichern, anstatt den vollständigen Wert. Du findest ADPCM in einigen Videospiel-Audios und älteren Multimedia-Dateien. Obwohl es „PCM“ im Namen hat, ist es nicht verlustfrei. IMA ADPCM WAV-Dateien zum Beispiel klingen merklich weniger knackig als eine echte lineare PCM-Datei mit derselben Abtastrate und Bittiefe.

Die richtigen PCM-Einstellungen für gängige Anwendungsfälle wählen

Größere Zahlen sind nicht immer besser. Die Wahl der richtigen PCM-Einstellungen bedeutet, klug zu sein: Passe dein Format an dein endgültiges Ziel an und bewahre die Qualität dort, wo es zählt. Für die Musikdistribution an Streaming-Plattformen (Spotify, Apple Music, Tidal): Bleibe bei 44.100 Hz. Liefere eine 16-Bit Stereo-WAV für die Standardlieferung, oder eine 44.100 Hz / 24-Bit WAV, wenn du eine Hi-Res-Ebene anstrebst. Spotify eine 96.000 Hz-Datei zu senden, ist sinnlos; ihre interne Kodierungspipeline akzeptiert bis zu 44.100 Hz / 16-Bit, du gewinnst also nichts. Apples Lossless-Tier ist flexibler und akzeptiert 24-Bit-Dateien bei entweder 44.100 Hz oder 48.000 Hz. Für Videoproduktion und Broadcast: Das ist einfach. Verwende 48.000 Hz / 24-Bit PCM. Konsequent. Es ist der globale Standard. Indem du von Anfang bis Ende in 48k arbeitest, vermeidest du unangenehme Abtastratenkonvertierungen, wenn dein Audio schließlich mit dem Video synchronisiert wird, das fast universell mit 48.000 Hz läuft. Für Podcasting und Sprachinhalte: 44.100 Hz / 16-Bit WAV ist mehr als ausreichend. Dein Host wird es sowieso in MP3 oder AAC re-enkodieren, also ist es deine Aufgabe, ihrem Encoder das bestmögliche Ausgangsmaterial zu geben. Einen Podcast mit 192.000 Hz aufzunehmen, ist reiner Overkill und bietet dem Hörer keinerlei Vorteile. Für Archivierung und Konservierung: 96.000 Hz / 24-Bit PCM WAV trifft den Sweet Spot. Es erfasst eine enorme Menge an Details und bleibt gleichzeitig aus Speichersicht praktisch. Die Library of Congress und die meisten nationalen Archive geben diesen Bereich aus gutem Grund an. Für alltägliche Konvertierungen – WAV zu AIFF tauschen, Abtastrate anpassen oder komprimierte Dateien für die Lieferung erstellen – erledigt CocoConvert die Arbeit direkt in deinem Browser. Keine Installationen erforderlich. Aber für hochspezialisierte Arbeiten, wie SRC in Mastering-Qualität oder die Stapelverarbeitung von Broadcast-Dateien mit BWF-Metadaten-Erhaltung, musst du zum Toolkit des Profis greifen: iZotope RX oder Adobe Audition. Ein Teil davon, ein Profi zu sein, ist zu wissen, welches Tool für die Aufgabe zu verwenden ist, und die Grenzen jedes Tools zu verstehen, einschließlich dieses.