Skip to content
Back to Blog
informational

Apa Itu Audio PCM? Format di Balik WAV dan AIFF

2026-05-17 9 min read

PCM Bukanlah Format File — Itu Adalah Sebuah Metode

Mari kita luruskan kesalahpahaman umum. Ketika kamu melihat file WAV atau AIFF, kamu tidak sedang melihat 'file PCM'. PCM sama sekali bukan format file. Ini adalah singkatan dari Pulse-Code Modulation, proses mendasar untuk mengubah suara analog menjadi data digital. WAV dan AIFF hanyalah wadah, pembungkus yang menampung audio yang dikodekan PCM itu. Prosesnya mudah dipahami. Gelombang analog disampel ribuan kali per detik. Kemudian, amplitudo setiap sampel diukur dan diberi nomor. Ini menciptakan aliran angka yang panjang yang dapat merekonstruksi suara asli dengan fidelitas tinggi. Ini adalah kebalikan dari format seperti MP3 atau AAC. Format-format itu menggunakan matematika cerdas untuk membuang data audio yang mereka kira tidak akan kamu dengar, sehingga file menjadi lebih kecil. PCM sangat jujur: ia menyimpan semuanya. Tanpa jalan pintas. Rekaman stereo 10 detik dengan kualitas CD (sample rate 44.100 Hz, bit depth 16-bit, stereo) akan selalu berukuran 10 × 44.100 × 2 byte × 2 saluran, yang berjumlah sekitar 1,76 MB data mentah. Perbedaan ini bukan hanya akademis; ini adalah bahasa audio profesional. Ketika seorang editor video meminta 'audio tanpa kompresi,' yang mereka maksud adalah PCM. Ketika seorang mastering engineer menuntut 'file sumber lossless,' yang mereka maksud adalah PCM. Ini adalah dasar dari audio profesional, meskipun istilah itu sendiri tetap di balik layar, jarang muncul di ikon file atau menu ekspor.

Sample Rate dan Bit Depth: Dua Angka yang Menentukan Kualitas PCM

Dua angka menentukan kualitas setiap file audio PCM: sample rate dan bit depth. Kamu melihatnya di mana-mana dalam software audio, dan memahami artinya adalah kunci untuk menghindari kesalahan mahal dalam proyekmu. Sample rate, diukur dalam Hertz (Hz), memberitahumu berapa banyak rekaman sesaat dari sinyal audio yang diambil per detik. Menurut teorema Nyquist, kamu memerlukan sample rate setidaknya dua kali lipat dari frekuensi tertinggi yang ingin kamu rekam. Karena pendengaran manusia mencapai puncaknya sekitar 20.000 Hz, standar CD 44.100 Hz lahir, memberikan margin aman di atas minimum 40.000 Hz. Kamu akan melihat rate umum lainnya: 44.100 Hz (CD, streaming), 48.000 Hz (produksi video), 88.200 Hz dan 96.000 Hz (audio resolusi tinggi), dan bahkan 192.000 Hz untuk pekerjaan arsip. Menggunakan 48.000 Hz untuk podcast bukanlah kesalahan, tetapi kamu harus melakukan resampling nanti jika ingin membakarnya ke CD bersama dengan track 44.100 Hz lainnya. Bit depth adalah tentang presisi. Ini menentukan berapa banyak level volume yang mungkin dimiliki setiap sampel. File 16-bit menawarkan 65.536 langkah. File 24-bit menawarkan 16.777.216 langkah yang mencengangkan. Ini berkorelasi langsung dengan dynamic range—perbedaan antara suara paling hening dan paling keras yang mungkin. 16-bit memberimu sekitar 96 dB dynamic range; 24-bit menyediakan 144 dB. Headroom ekstra itulah mengapa para profesional merekam pada 24-bit: kamu bisa menangkap suara hening tanpa menaikkan gain dan berisiko noise, lalu menghasilkan produk akhir pada 16-bit. Jangan membuat kesalahan umum dengan sembarangan mengkonversi file 48.000 Hz / 24-bit menjadi 44.100 Hz / 16-bit. Kualitas algoritma konversi sample rate (SRC) adalah segalanya. Algoritma yang buruk akan memenuhi audionya dengan artefak aliasing yang tidak menyenangkan. Siapa pun yang pernah bergulat dengan downsample yang kasar dan berfasa tahu rasa sakit ini. Alat profesional seperti iZotope RX atau Adobe Audition menggunakan SRC berkualitas tinggi secara default. CocoConvert menerapkan algoritma standar yang sangat baik untuk web dan podcasting, tetapi saya akan terus terang: jika kamu mempersiapkan master musik komersial, kamu harus menggunakan software mastering khusus. Tanpa pengecualian.

WAV vs. AIFF: Dua Wadah, Satu Codec

Dua wadah utama untuk PCM adalah WAV dan AIFF. WAV, ciptaan Microsoft dan IBM, hadir bersama Windows 3.1 pada tahun 1991. AIFF milik Apple bahkan lebih tua, dibuat pada tahun 1988 dan berdasarkan format Electronic Arts sebelumnya. Keduanya dibangun untuk menampung audio PCM tanpa kompresi. Untuk semua tujuan praktis, WAV stereo 44.100 Hz / 16-bit dan AIFF yang setara adalah identik dalam suara karena data PCM mentah di dalamnya sama. Jadi apa bedanya? Kebanyakan historis dan struktural. WAV menggunakan urutan byte little-endian, sedangkan AIFF menggunakan big-endian. Ini penting di zaman PowerPC Mac dan PC x86, tetapi software modern saat ini tidak peduli dan menangani keduanya tanpa masalah. Perbedaan yang lebih relevan adalah metadata. WAV memiliki ekstensi BWF (Broadcast Wave Format), sebuah kekuatan besar untuk pekerjaan film dan TV yang menyematkan data timecode dan adegan yang penting. AIFF memiliki chunk metadata sendiri, dan varian yang disebut AIFF-C secara teknis dapat menampung audio terkompresi, meskipun kamu hampir tidak pernah menemukan itu di lapangan. Berikut analisis praktisnya: Aplikasi Windows cenderung ke WAV. Logic Pro milik Apple secara default menggunakan AIFF. Alat video profesional seperti Premiere Pro dan DaVinci Resolve dengan senang hati menerima keduanya. Saran saya? Jika kamu mengirim audio ke klien dan kamu tidak yakin apa yang mereka gunakan, kirimkan WAV. Ini adalah hal yang paling mendekati standar universal. Ingat saja, yang satu tidak 'lebih baik' dari yang lain dalam hal kualitas suara ketika keduanya menampung data PCM linear yang sama.

Di Mana Audio PCM Sebenarnya Berada dalam Alur Kerjamu

Kamu mungkin terkejut seberapa sering kamu sudah bekerja dengan audio PCM. Ini adalah kuda pekerja tak terlihat dari sebagian besar alur kerja media. Mengetahui di mana ia berada membantumu memutuskan kapan harus mengkonversi dan, yang sama pentingnya, kapan harus membiarkan semuanya. Dalam produksi video, audio di dalam file video profesional seperti MXF, ProRes, dan DNxHD hampir selalu PCM 48.000 Hz / 24-bit. Ekspor akhir dari Premiere Pro (File > Export > Media) adalah momen krusial: editor memilih apakah akan menyimpan PCM murni atau mengkompresinya menjadi sesuatu seperti AAC. Untuk penyiar besar seperti BBC (di bawah R/68) atau streamer seperti Netflix, tidak ada pilihan—spesifikasi pengiriman mereka menuntut PCM. Di studio musik, semuanya adalah PCM. DAW seperti Ableton Live, Logic Pro, dan Pro Tools hidup dan bernapas dengannya. Ableton Live 11, misalnya, secara default merekam dalam format WAV float 32-bit pada sample rate proyekmu (diatur di Preferences > Audio). Varian PCM khusus ini menggunakan angka floating-point, yang memberi para engineer headroom besar selama mixing dan mencegah clipping. Setelah mix selesai, file-file itu dikonversi menjadi PCM integer 16-bit atau 24-bit standar untuk rilis akhir. Untuk penyimpanan jangka panjang, PCM adalah raja. Arsip, perpustakaan, dan penyiar memilih PCM WAV atau AIFF karena tahan masa depan. Tidak ada codec proprietary yang bisa usang. MP3 yang dibuat pada tahun 2001 mungkin terdengar berbeda dari yang dibuat dengan encoder 2024, tetapi file PCM dari tahun 1991 identik bit-per-bit hari ini. Itulah mengapa Library of Congress mempercayakan PCM WAV untuk pengarsipan audio. Bahkan di sisi konsumen, itu ada. Jika kamu merobek CD menggunakan 'AIFF Encoder' di Music.app Apple, kamu akan mendapatkan file PCM AIFF. Jika kamu menggunakan Windows Media Player untuk merobek ke WAV, kamu akan mendapatkan PCM WAV. Dalam kedua kasus, kamu telah membuat salinan disc yang sempurna dan lossless.

Mengkonversi Audio PCM: Apa yang Berubah dan Apa yang Tidak

Beralih antar format PCM, seperti WAV ke AIFF, hanyalah mengubah kotak tempat audio itu berada. Data audio itu sendiri tidak tersentuh. Ini adalah operasi yang sepenuhnya lossless, apakah kamu menggunakan CocoConvert atau alat lainnya. Kamu bisa mengubah file dari WAV ke AIFF dan kembali seribu kali tanpa kehilangan kualitas sedikit pun. Beranjak dari PCM ke format terkompresi seperti MP3, AAC, atau OGG Vorbis adalah jalan satu arah. Ini adalah proses lossy. Encoder menggunakan model psikoakustik untuk membuang data yang diasumsikan tidak akan kamu lewatkan. Pada bitrate tinggi (seperti MP3 320 kbps atau AAC 256 kbps), kebanyakan orang tidak akan mendengar perbedaan. Tetapi pada bitrate rendah, 128 kbps dan di bawahnya, kamu akan mulai mendengar artefak yang jelek, terutama pada suara tajam seperti simbal. Kerusakan itu permanen. Kamu tidak bisa mengembalikannya. Mengkonversi MP3 itu kembali ke file WAV hanya memberimu file besar yang berisi audio yang rusak yang sama. Ya, CocoConvert dapat mengkonversi MP3 kembali ke WAV. Operasi ini secara teknis valid dan file akan berfungsi. Tapi mari kita perjelas: ini tidak meningkatkan kualitas. Kualitas audio masih dibatasi oleh MP3 asli. Kamu hanya memasukkan audio berkualitas 128 kbps ke dalam file yang jauh lebih besar. Satu-satunya alasan baik untuk melakukan ini adalah untuk kompatibilitas, jika kamu bekerja dengan software atau hardware lama yang membutuhkan file WAV. Jangan pernah melakukannya dengan berpikir kamu 'memulihkan' kualitas yang hilang. Ketika kamu mengubah sample rate atau bit depth dari file PCM, kualitas software konversi menjadi sangat penting. Beranjak dari 96.000 Hz menjadi 44.100 Hz, misalnya, memerlukan filter low-pass untuk mencegah aliasing, dan alat yang berbeda melakukan ini dengan tingkat keberhasilan yang bervariasi. Untuk apa pun yang membutuhkan pendengaran yang kritis, kamu benar-benar harus menggunakan software audio khusus dengan algoritma SRC kelas atas.

Varian PCM yang Akan Kamu Temui: Float, LPCM, dan DPCM

PCM biasa bukan satu-satunya varian di luar sana. Kamu akan menemukan beberapa variasi, dan baik untuk mengetahui apa itu dan kapan mereka penting. Varian paling penting bagi produser modern adalah PCM float 32-bit (juga disebut IEEE 754 float). Alih-alih bilangan bulat, ia menyimpan nilai sampel sebagai angka floating-point. Ini adalah masalah besar di dalam DAW seperti Ableton Live, Pro Tools, atau FL Studio karena memungkinkan level audio untuk 'melebihi' maksimum tanpa benar-benar clipping, memberimu fleksibilitas luar biasa selama mixing. File-file ini lebih besar dari PCM integer 24-bit (4 byte per sampel vs. 3 byte), dan meskipun sebagian besar software modern dapat memutarnya, kamu hampir selalu mengkonversinya menjadi file integer 24-bit atau 16-bit untuk pengiriman akhir. Kamu mungkin melihat istilah LPCM, singkatan dari Linear PCM. Jangan biarkan itu membingungkanmu; itu hanya nama yang lebih spesifik untuk PCM standar yang telah kita diskusikan, di mana langkah-langkah volume semuanya sama. Bagian 'Linear' ada di sana untuk membedakannya dari varian PCM logaritmik seperti pengkodean A-law dan μ-law (mu-law) yang digunakan dalam teleponi. Itu adalah skema kompresi cerdas yang digunakan untuk memadatkan ucapan manusia ke dalam sampel 8-bit yang kecil. Jika kamu pernah mendapatkan file .au aneh atau WAV dari sistem telepon, itu mungkin salah satu dari ini. Kamu perlu mengkonversinya ke WAV PCM linear standar sebelum kamu bisa mengeditnya, yang merupakan sesuatu yang dapat ditangani CocoConvert. Terakhir, ada DPCM dan kerabatnya ADPCM. Ini adalah format kompresi ringan yang menyimpan *perbedaan* antara sampel audio alih-alih nilai penuh. Kamu akan menemukan ADPCM di beberapa audio video game dan file multimedia lama. Meskipun memiliki 'PCM' dalam namanya, itu tidak lossless. File IMA ADPCM WAV, misalnya, akan terdengar jauh kurang jernih daripada file PCM linear sejati pada sample rate dan bit depth yang sama.

Memilih Pengaturan PCM yang Tepat untuk Kasus Penggunaan Umum

Angka yang lebih besar tidak selalu lebih baik. Memilih pengaturan PCM yang tepat adalah tentang bersikap cerdas: sesuaikan formatmu dengan tujuan akhir dan pertahankan kualitas di tempat yang penting. Untuk distribusi musik ke platform streaming (Spotify, Apple Music, Tidal): Tetap gunakan 44.100 Hz. Sediakan WAV stereo 16-bit untuk pengiriman standar, atau WAV 44.100 Hz / 24-bit jika kamu menargetkan tingkatan hi-res. Mengirim file 96.000 Hz ke Spotify tidak ada gunanya; pipeline encoding internal mereka menerima hingga 44.100 Hz / 16-bit, jadi kamu tidak mendapatkan apa-apa. Tingkatan Lossless Apple Music lebih fleksibel, menerima file 24-bit pada 44.100 Hz atau 48.000 Hz. Untuk produksi video dan penyiaran: Yang ini mudah. Gunakan PCM 48.000 Hz / 24-bit. Secara konsisten. Ini adalah standar global. Dengan bekerja di 48k dari awal hingga akhir, kamu menghindari konversi sample rate yang tidak menyenangkan ketika audio akhirnya disinkronkan dengan video, yang hampir secara universal berjalan pada 48.000 Hz. Untuk podcasting dan konten suara: WAV 44.100 Hz / 16-bit sudah lebih dari cukup. Host-mu hanya akan meng-re-encode-nya ke MP3 atau AAC, jadi tugasmu adalah memberikan materi sumber terbaik kepada encoder mereka untuk dikerjakan. Merekam podcast pada 192.000 Hz adalah berlebihan dan tidak menawarkan manfaat apa pun bagi pendengar. Untuk pengarsipan dan pelestarian: WAV PCM 96.000 Hz / 24-bit adalah pilihan yang tepat. Ini menangkap detail dalam jumlah besar sambil tetap praktis dari perspektif penyimpanan. Library of Congress dan sebagian besar arsip nasional menetapkan rentang ini dengan alasan. Untuk konversi sehari-hari—mengganti WAV ke AIFF, menyesuaikan sample rate, atau membuat file terkompresi untuk pengiriman—CocoConvert menyelesaikan pekerjaan dengan benar di browser-mu. Tidak perlu instalasi. Tetapi untuk pekerjaan yang sangat khusus, seperti SRC kelas mastering atau pemrosesan batch file siaran dengan pelestarian metadata BWF, kamu perlu menggunakan perangkat profesional: iZotope RX atau Adobe Audition. Bagian dari menjadi seorang profesional adalah mengetahui alat mana yang harus digunakan untuk pekerjaan itu, dan memahami batasan setiap alat, termasuk yang satu ini.