Skip to content
Back to Blog
informational

PCMオーディオとは? WAVとAIFFの裏にあるフォーマット

2026-05-17 9 min read

PCMはファイル形式ではない — それは『方法』です

よくある誤解を解き明かしましょう。WAVやAIFFファイルを見ても、それは「PCMファイル」ではありません。PCMはそもそもファイル形式ではないのです。これはPulse-Code Modulation(パルス符号変調)の略で、アナログ音声をデジタルデータに変換する基本的なプロセスを指します。WAVやAIFFは、そのPCMエンコードされたオーディオを格納するための単なる「コンテナ」、つまり「ラッパー」に過ぎません。 そのプロセスはシンプルです。アナログ波形は1秒間に何千回もサンプリングされます。そして、各サンプルの振幅が測定され、数値が割り当てられます。これにより、元のサウンドを高い忠実度で再構築できる数値の長いストリームが生成されます。 これはMP3やAACのような形式とは対照的です。これらの形式は、聞こえないと判断されるオーディオデータを巧みな計算で破棄し、ファイルを小さくします。PCMは極めて正直です。すべてを保持します。近道はありません。CD品質(44,100 Hzサンプルレート、16ビット深度、ステレオ)の10秒間のステレオ録音は、常に10 × 44,100 × 2バイト × 2チャンネルとなり、約1.76 MBの生データになります。 この違いは単なる学術的なものではありません。プロのオーディオの世界では共通言語なのです。ビデオエディターが「非圧縮オーディオ」を求める場合、それはPCMを意味します。マスタリングエンジニアが「ロスレスのソースファイル」を要求する場合も、PCMを指しています。用語自体が舞台裏に隠れ、ファイルアイコンやエクスポートメニューに表示されることはほとんどありませんが、プロオーディオの基盤なのです。

サンプルレートとビット深度:PCMの品質を定義する2つの数値

あらゆるPCMオーディオファイルの品質を定義する2つの数値、それがサンプルレートとビット深度です。オーディオソフトウェアではどこでもこれらを目にしますし、その意味を理解することが、プロジェクトで費用のかかるミスを避けるための鍵となります。 サンプルレートはヘルツ(Hz)で測定され、1秒間にオーディオ信号の「スナップショット」が何回撮影されるかを示します。ナイキストの定理によると、記録したい最高周波数の少なくとも2倍のサンプルレートが必要です。人間の聴覚は最大約20,000 Hzなので、40,000 Hzの最低限度に対して安全なマージンを与える44,100 HzのCD標準が生まれました。他にも一般的なレートとして、44,100 Hz(CD、ストリーミング)、48,000 Hz(ビデオ制作)、88,200 Hzと96,000 Hz(ハイレゾオーディオ)、さらにはアーカイブ作業用の192,000 Hzなどがあります。ポッドキャストに48,000 Hzを使用するのは間違いではありませんが、他の44,100 Hzのトラックと一緒にCDに焼きたい場合は、後でリサンプリングする必要があります。 ビット深度は精度に関するものです。これは、各サンプルが持つことができる音量レベルの数を決定します。16ビットファイルは65,536段階を提供します。24ビットファイルは驚異的な16,777,216段階を提供します。これはダイナミックレンジ、つまり最も静かな音と最も大きな音の間の差に直接結びつきます。16ビットは約96 dBのレンジを提供し、24ビットは144 dBを提供します。この追加のヘッドルームこそが、プロが24ビットで録音する理由です。ゲインを上げすぎてノイズのリスクを冒すことなく静かな音をキャプチャし、最終製品を16ビットで納品できるのです。 48,000 Hz / 24ビットファイルを44,100 Hz / 16ビットに不用意に変換するというよくある間違いを犯さないでください。サンプルレート変換(SRC)アルゴリズムの品質がすべてです。質の悪いアルゴリズムは、オーディオを不快なエイリアシングアーティファクトで汚染します。ざらざらした、位相のずれたダウンサンプルに苦しんだことのある人なら、この苦痛を知っているでしょう。iZotope RXやAdobe Auditionのようなプロフェッショナルツールは、デフォルトで高品質なSRCを使用しています。CocoConvertはウェブやポッドキャストには全く問題ない標準アルゴリズムを適用していますが、はっきり言わせてください。もしあなたが商業音楽のマスタリングを準備しているなら、専用のマスタリングソフトウェアを使う必要があります。例外はありません。

WAV vs. AIFF: 2つのコンテナ、1つのコーデック

PCMの主要な2つのコンテナはWAVとAIFFです。WAVはMicrosoftとIBMが開発し、1991年のWindows 3.1と共に登場しました。AppleのAIFFはさらに古く、1988年に作成され、以前のElectronic Artsの形式に基づいています。どちらも非圧縮PCMオーディオを格納するために作られました。実用上、44,100 Hz / 16ビットステレオWAVとそのAIFF版は、内部の生PCMデータが同じであるため、音質は同一です。 では、違いは何でしょうか? 主に歴史的および構造的なものです。WAVはリトルエンディアンのバイトオーダーを使用し、AIFFはビッグエンディアンを使用します。これはPowerPC Macやx86 PCの時代には重要でしたが、今日のソフトウェアは気にすることなく、どちらも問題なく処理します。より関連性の高い違いはメタデータです。WAVにはBWF(Broadcast Wave Format)拡張機能があり、これは映画やテレビの作業において重要なタイムコードやシーンデータを埋め込むことができる強力な機能です。AIFFには独自のメタデータチャンクがあり、AIFF-Cと呼ばれる派生形は技術的には圧縮オーディオを格納できますが、実際にはほとんど見かけることはありません。 実用的な内訳は次のとおりです。WindowsアプリはWAVを好みます。AppleのLogic ProはAIFFをデフォルトとしています。Premiere ProやDaVinci Resolveのようなプロのビデオツールは、どちらも問題なく受け入れます。私からのアドバイスですか? クライアントにオーディオを送る際、相手が何を使っているか分からない場合は、WAVを送ってください。これはユニバーサルスタンダードに最も近いものです。ただし、どちらも同じリニアPCMデータを保持している場合、音質に関してどちらか一方が「優れている」ということはないことを覚えておいてください。

ワークフローでPCMオーディオが実際に存在する場所

すでにPCMオーディオを扱っている頻度に驚くかもしれません。それはほとんどのメディアワークフローにおいて、目に見えない縁の下の力持ちです。それがどこに存在するかを知ることで、いつ変換し、そして同じくらい重要なことですが、いつそのままにしておくべきかを判断できるようになります。 ビデオ制作では、MXF、ProRes、DNxHDのようなプロフェッショナルなビデオファイル内のオーディオは、ほとんどの場合48,000 Hz / 24ビットPCMです。Premiere Proからの最終エクスポート(ファイル > エクスポート > メディア)は重要な瞬間です。編集者は、手つかずのPCMを維持するか、AACのような形式に圧縮するかを選択します。BBC(R/68に基づく)のような主要な放送局や、Netflixのようなストリーマーにとって、選択の余地はありません。彼らの納品仕様はPCMを要求するからです。 音楽スタジオでは、すべてがPCMです。Ableton Live、Logic Pro、Pro ToolsのようなDAWは、PCMと共に生きています。例えば、Ableton Live 11は、プロジェクトのサンプルレート(環境設定 > オーディオで設定)で32ビットフロートWAV形式で録音することをデフォルトとしています。この特殊なPCMバリアントは浮動小数点数を使用しており、ミキシング中にエンジニアに途方もないヘッドルームを与え、クリッピングを防ぎます。ミックスが完了すると、これらのファイルは最終リリース用に標準の16ビットまたは24ビット整数PCMに変換されます。 長期保存には、PCMが王様です。アーカイブ、図書館、放送局は、将来性があるためPCM WAVまたはAIFFを選択します。廃れる可能性のある独自のコーデックはありません。2001年に作成されたMP3は2024年のエンコーダーで作成されたものとは異なる音質になるかもしれませんが、1991年のPCMファイルは今日でもビット単位で同一です。だからこそ、米国議会図書館はオーディオ保存にPCM WAVを信頼しているのです。 消費者側でも、それは存在します。AppleのMusic.appで「AIFFエンコーダ」を使ってCDをリッピングすると、PCM AIFFファイルが得られます。Windows Media Playerを使ってWAVにリッピングすると、PCM WAVが得られます。どちらの場合も、ディスクの完璧なロスレスコピーを作成したことになります。

PCMオーディオの変換:何が変わり、何が変わらないのか

WAVからAIFFへのように、PCM形式を切り替えることは、オーディオが収められている「箱」を変えるだけのことです。オーディオデータ自体は手つかずです。CocoConvertであろうと他のツールであろうと、完全にロスレスな操作です。ファイルをWAVからAIFFへ、そしてまた元に戻すことを千回繰り返しても、品質の損失は全くありません。 PCMからMP3、AAC、OGG Vorbisのような圧縮形式への変換は、一方通行の道です。これはロッシーなプロセスです。エンコーダーは心理音響モデルを使用して、聞き逃すであろうと仮定するデータを破棄します。高ビットレート(320 kbps MP3や256 kbps AACなど)では、ほとんどの人は違いを聞き分けられないでしょう。しかし、128 kbps以下の低ビットレートでは、特にシンバルのような鋭い音で、不快なアーティファクトが聞こえ始めるでしょう。その損傷は永久的なものです。元に戻すことはできません。そのMP3をWAVファイルに戻しても、同じ損傷したオーディオを含む大きなファイルができるだけです。 はい、CocoConvertはMP3をWAVに変換できます。この操作は技術的に有効であり、ファイルも機能します。しかし、はっきりさせておきましょう。これは品質を向上させるものではありません。オーディオ品質は依然として元のMP3に制限されます。単に128 kbps品質のオーディオを、はるかに大きなファイルに入れているだけです。これを行う唯一の正当な理由は、古いソフトウェアやハードウェアがWAVファイルを要求する場合の互換性のためです。失われた品質を「回復」していると思ってこれを行うことは絶対に避けてください。 PCMファイルのサンプルレートやビット深度を変更する場合、変換ソフトウェアの品質が重要になります。例えば、96,000 Hzから44,100 Hzに下げる場合、エイリアシングを防ぐためにローパスフィルターが必要であり、異なるツールはこれを様々な成功度合いで行います。クリティカルなリスニングが必要なものについては、最高級のSRCアルゴリズムを備えた専用のオーディオソフトウェアを使用すべきです。

遭遇するPCMバリアント:フロート、LPCM、DPCM

単なる「バニラ」PCMだけがすべてではありません。いくつかのバリエーションに遭遇するでしょう。それらが何であるか、そしていつ重要になるかを知っておくと良いでしょう。 現代のプロデューサーにとって最も重要なバリアントは、32ビットフロートPCM(IEEE 754フロートとも呼ばれます)です。これは整数ではなく、サンプルの値を浮動小数点数として格納します。Ableton Live、Pro Tools、FL StudioのようなDAW内では、これは非常に重要です。なぜなら、オーディオレベルが実際にクリッピングすることなく最大値を超えても「オーバー」することを可能にし、ミキシング中に信じられないほどの柔軟性を提供するからです。これらのファイルは24ビット整数PCMよりも大きく(1サンプルあたり4バイト対3バイト)、ほとんどの最新ソフトウェアで再生できますが、最終納品時にはほぼ必ず24ビットまたは16ビットの整数ファイルに変換します。 LPCMという用語を目にすることもあるでしょう。これはLinear PCMの略です。惑わされないでください。これは、音量ステップがすべて等しい、これまで説明してきた標準的なPCMをより具体的に呼ぶ名称に過ぎません。「リニア」という部分は、電話で使用されるA-lawやμ-law(ミューロー)エンコーディングのような対数PCMバリアントと区別するためにあります。これらは人間の音声を小さな8ビットサンプルに圧縮するために使用される巧妙な圧縮方式です。もし奇妙な.auファイルや電話システムからのWAVファイルを受け取った場合、それがこれらのいずれかである可能性があります。編集する前に標準的なリニアPCM WAVに変換する必要がありますが、これはCocoConvertで処理できます。 最後に、DPCMとその仲間であるADPCMがあります。これらは、オーディオサンプルの完全な値ではなく、その「差分」を格納する軽量な圧縮形式です。ADPCMは一部のビデオゲームオーディオや古いマルチメディアファイルで見られます。名前に「PCM」と入っていても、ロスレスではありません。例えば、IMA ADPCM WAVファイルは、同じサンプルレートとビット深度の真のリニアPCMファイルよりも明らかに鮮明さに欠けるでしょう。

一般的な用途に応じた適切なPCM設定の選択

数値が大きいほど常に良いとは限りません。適切なPCM設定を選択することは、賢くあることです。最終的な配信先に形式を合わせ、重要な場所で品質を維持しましょう。 ストリーミングプラットフォーム(Spotify、Apple Music、Tidal)への音楽配信の場合:44,100 Hzにこだわりましょう。標準的な納品には16ビットステレオWAVを、ハイレゾティアを狙う場合は44,100 Hz / 24ビットWAVを納品します。Spotifyに96,000 Hzのファイルを送るのは無意味です。彼らの内部エンコーディングパイプラインは最大44,100 Hz / 16ビットまでしか受け付けないため、何も得られません。Apple Musicのロスレスティアはより柔軟で、44,100 Hzまたは48,000 Hzのいずれかの24ビットファイルを受け入れます。 ビデオ制作と放送の場合:これは簡単です。48,000 Hz / 24ビットPCMを使用してください。一貫して。それが世界標準です。最初から最後まで48kで作業することで、オーディオが最終的にビデオと同期される際に、厄介なサンプルレート変換を避けることができます。ビデオはほぼ普遍的に48,000 Hzで動作しますから。 ポッドキャストや音声コンテンツの場合:44,100 Hz / 16ビットWAVで十分です。あなたのホストは結局、それをMP3かAACに再エンコードするだけなので、あなたの仕事は彼らのエンコーダーに最高のソース素材を提供することです。ポッドキャストを192,000 Hzで録音するのは全くのやりすぎであり、リスナーには何のメリットもありません。 アーカイブと保存の場合:96,000 Hz / 24ビットPCM WAVが最適な選択肢です。膨大な量の詳細をキャプチャしつつ、ストレージの観点からも実用的です。米国議会図書館やほとんどの国立公文書館がこの範囲を指定しているのには理由があります。 日常的な変換、例えばWAVからAIFFへの入れ替え、サンプルレートの調整、納品用の圧縮ファイルの作成などには、CocoConvertがブラウザ上で適切に処理してくれます。インストールは不要です。しかし、マスタリンググレードのSRCやBWFメタデータ保存を伴う放送ファイルのバッチ処理のような高度に専門的な作業には、iZotope RXやAdobe Auditionといったプロのツールキットに手を伸ばす必要があります。プロであることの一部は、仕事に適したツールを知り、このツールを含め、あらゆるツールの限界を理解することです。