Skip to content
Back to Blog
format-comparisons

MP3 vs AAC vs Opus: 最新オーディオコーデック比較

2026-05-17 9 min read

コーデック選びが、実は重要な理由

ほとんどの人は、フォントを選ぶようにオーディオフォーマットを選びがちです。つまり、最初に見慣れた選択肢を選んで、それで終わりにしてしまうのです。MP3があまりにも長い間デフォルトだったため、「オーディオフォーマット」といえばMP3しかないように思われがちですが、どのコーデックを選ぶかは、実は大きな影響を及ぼします。ファイルサイズ、低ビットレートでの音質、デバイスの互換性、さらにはストリーミングのコストまで、MP3、AAC、Opusのどれを選ぶかによって劇的に変わるのです。 具体的な例を挙げましょう。4分間のポップソングを128kbpsのMP3でエンコードすると、約3.7MBになります。同じ曲を128kbpsのAACファイルにすると、同じ容量でありながら、音質は著しくクリアに聞こえます。これは160〜192kbpsのMP3に匹敵するほどです。さらに、わずか96kbpsのOpusにエンコードすると、多くの場合、両者を上回る音質でありながら、ファイルサイズは2.8MBほどに収まります。この差は、何千ものトラックを管理する場合でも、ポッドキャストネットワークを運営する場合でも、不安定なモバイル接続でオーディオをストリーミングする場合でも、あっという間に積み重なっていきます。 この記事では、これら3つのコーデックの現実世界での違いを徹底的に解説します。それぞれのコーデックがどの分野で優れているかを探り、変換時に使用すべき具体的な設定も紹介します。目的は、たった一つの勝者を決めることではありません。なぜなら、そんなものは存在しないからです。目的は、あなたのプロジェクトに最適な選択をするための知識を提供することです。

MP3: 引退を拒むコーデック

MP3(MPEG-1 Audio Layer III)は1993年に標準化され、90年代後半には世界を席巻しました。その特許は2017年にようやく失効し、完全に無料で使用できるようになりました。この自由さと、30年にわたるハードウェアおよびソフトウェアのサポートこそが、MP3が今なおデジタルオーディオの世界で避けて通れない存在である理由です。 技術的には、MP3は音響心理学モデルを利用して、人間の耳が最も聞き逃しやすい音声情報を「捨てる」仕組みになっています。これには、より大きな音に隠された音、約16kHz以上の非常に高い周波数、一部の過渡的なディテールなどが含まれます。高ビットレート(256〜320kbps)では、ほとんどの人がほとんどの機材で完璧な音質だと感じます。しかし、128kbpsまで落とすと、その違いが聞こえ始めます。ドラムのプリエコーや、シンバルのわずかな「渦を巻くような」質感に一度気づいてしまうと、もう元には戻れません。 エンコードには、可変ビットレート(VBR)を使いましょう。同じファイルサイズであれば、ほぼ常に固定ビットレート(CBR)よりも優れた品質を提供します。LAMEエンコーダーのV0プリセット(平均220〜260kbps)は、注意深く聴いても音源との違いが分からないレベルです。V2(平均170〜210kbps)は、日常的な使用において品質とサイズのバランスが非常に優れています。CBRを使うべき唯一の場面は、古いカーステレオや一部のフィットネストラッカーなど、それを要求するレガシーなハードウェアの場合です。その場合は、192kbpsが無難な選択でしょう。 では、MP3の弱点はどこにあるのでしょうか?低ビットレートでは「ジョイントステレオ」モードがステレオイメージを劣化させることがあり、128kbpsを下回ると、最新のコーデックに比べて品質は崖から転げ落ちるように劣化します。また、ギャップレス再生にネイティブで対応していないため、ライブアルバムやDJミックスを聴く人にとっては常に悩みの種です。

AAC: MP3の後継者として、その役割をほぼ果たしたコーデック

MP3の正式な後継として開発されたAAC(Advanced Audio Coding)は、1997年に標準化されました。しかし、もし大きな後押しがなければ、無名のまま埋もれていたかもしれません。そのきっかけとなったのが、2003年にAppleがiTunes StoreにAACを採用したことです。この動きによって、AACはメインストリームでの地位を確立しました。今日、AACはApple Music、YouTubeの音声、そしてほとんどのデジタル放送で標準となっています。 AACの開発者たちは、MP3からいくつかの賢明なアップグレードを行いました。このコーデックは最大48のオーディオチャンネルをサポートし(MP3は実質的にステレオに限定されます)、より効率的なフィルターバンクを使用し、低ビットレートでもステレオ情報をはるかにインテリジェントに処理します。その証拠は、実際に聴いてみれば明らかです。Hydrogenaudioのようなコミュニティが実施したブラインドテストでは、128kbpsのAACは、同じビットレートのMP3よりも一貫して音質が良く、オリジナル音源に近いと評価されています。 AACは万能というわけではなく、いくつかのプロファイルがあります。AAC-LC(Low Complexity)は音楽や一般的なオーディオの主力であり、iTunesとYouTubeの両方で使われています。非常に低いビットレート(32〜64kbps)向けには、HE-AAC(High Efficiency)がスペクトル帯域複製(Spectral Band Replication)という巧妙な技術を使って高周波を再構築し、スピーチやラジオのストリーミングに最適です。HE-AAC v2はさらに一歩進んで、パラメトリックステレオ(Parametric Stereo)により、24〜32kbpsという驚異的なビットレートで実用的な音声品質を絞り出します。 自分の音楽用には、256kbpsのAAC-LC(Appleの標準)を使えば、一般的なコンシューマー向け機材では可逆音源と区別するのはほぼ不可能です。ポッドキャストには、96〜128kbpsのモノラルが最適なターゲットです。しかし、AACのアキレス腱はライセンス問題です。未だに特許で保護されているため、一部のオープンソースLinuxディストリビューションではデフォルトで含まれておらず、一部の組み込みシステムの開発者は法的な問題を避けるために単純に採用を見送っています。

Opus: もっと評価されるべき技術の結晶

Opusは、2012年にIETFによって標準化された(RFC 6716)、オープンでロイヤリティフリーのコーデックです。Xiph.OrgとMozillaの人々によって開発され、音声用のSILK(Skype由来)と音楽用のCELTという2つの異なる技術を巧みに組み合わせています。その結果、ハイブリッドな強力コーデックが生まれました。6kbpsの非常にクリアな狭帯域音声から、510kbpsの高忠実度ステレオ音楽まで対応可能で、しかもアルゴリズム遅延を信じられないほど低く(最小2.5ms)抑えています。 ビットあたりの品質は驚異的です。公式なリスニングテストでは、96kbpsのOpusは、音楽において128kbpsのAAC-LCと同等かそれ以上の性能を一貫して示しています。64kbpsでは、Opusは96kbpsのAACとさえ競合します。これは、些細な、学術的な違いではありません。大規模な帯域幅やストレージにお金を払っている人にとっては、これは莫大な節約につながります。 では、なぜOpusはどこにでもあるわけではないのでしょうか?一言で言えば、互換性です。iOSではサードパーティのライブラリなしではネイティブサポートがなく、Androidでもバージョン5.0以前はサポートされていませんでした。ポータブルHi-Fiプレーヤーからカーステレオ、スマートTVに至るまで、ほとんどの専用音楽プレーヤーはOpusファイルを再生できません。そのため、不特定のデバイスにオーディオを配布する場合、デフォルトとして使うにはリスクがあります。しかし、サーバーサイドの処理、ウェブ配信、あるいは再生環境を自分でコントロールできる内部ワークフローにおいてはどうでしょうか?率直に言って、Opusを使うべきです。低〜中ビットレートにおいては、これが最適なツールです。

直接対決: 品質、ビットレート、ファイルサイズ

曖昧な主張は抜きにして、公開されているリスニングテストやエンコーダーのベンチマークから得られた具体的な数値を見ていきましょう。以下の数値は、リファレンスエンコーダー(MP3にはLAME 3.100、AACにはAppleのAACエンコーダー、Opusにはlibopus)を使用し、典型的なステレオ音楽を対象としています。 非常に低い64kbpsのステレオでは、MP3は金属的なリバーブや不明瞭なパーカッションといった、耳障りなアーティファクトだらけです。AAC-LCは、カジュアルなリスニングにはかろうじて許容できるレベルです。ここではOpusが議論の余地なくチャンピオンであり、ほとんどのリスナーが96kbpsのMP3と同等の良さと評価しています。 128kbpsのステレオに上がると、状況は変わります。MP3はまずまずの品質になりますが、トランスペアレント(原音と区別がつかないレベル)ではありません。AAC-LCは、ほとんどの音楽でトランスペアレントに非常に近くなります。しかしOpusは、大多数のリスナーと素材にとって、事実上トランスペアレントです。192kbpsに達すると、これら3つの違いは、一般的なコンシューマー向け機材ではもはや学術的な議論のレベルになります。 60分間のオーディオファイルのサイズで比較すると、128kbpsのMP3は約55MBです。128kbpsのAAC-LCファイルは同じサイズですが、音質はより優れています。96kbpsのOpusファイルは、128kbpsのAACファイルと同等の知覚品質を提供しながら、サイズはわずか約41MBです。 スピーチ(話し声)の場合、その差はさらに広がります。48kbpsモノラルのHE-AACは、しっかりとしたポッドキャスト品質の音声を生成します。Opusは、わずか32kbpsのモノラルで同等かそれ以上の結果を出すことができます。10時間のオーディオブックで言えば、これは216MBと144MBの差、つまり品質を落とさずに33%の削減になります。 最後に、絶対に破ってはいけないルールが一つあります。非可逆フォーマット間のトランスコーディングは、音質を台無しにする最悪の行為です。MP3をAACやOpusに変換しても、MP3エンコーダーによってすでに捨てられた情報を取り戻すことはできません。音割れした96kbpsのMP3を渡されて「これ、いい音にして」と頼まれたことがある人なら、この苦しみは分かるはずです。品質が重要なら、常にWAV、FLAC、AIFFのような可逆(ロスレス)ソースから始めましょう。

あなたのユースケースに最適なコーデックの選び方

どのコーデックが最適かは、抽象的なラボテストで最高点を取ったものではなく、完全にあなたの配布先に依存します。選び方は以下の通りです。 エンドユーザーが自分のライブラリ(Bandcampのダウンロード、個人のコレクション、車用のUSBドライブなど)で使うために音楽を配布する場合、MP3を使いましょう。高品質なVBRファイル(LAME V0)か320kbpsのCBRが最善の策です。再生デバイスをコントロールできない場合、他のコーデックが持つわずかな品質向上よりも、普遍的な互換性が優先されます。 ポッドキャストや話し言葉のコンテンツには、96kbpsのAAC-LCモノラルがスイートスポットです。Apple Podcasts、Spotify、Pocket Castsといった主要プラットフォームが完璧に処理できる、広く互換性のある選択肢です。聴衆にAppleユーザーが多い場合、AACはネイティブな選択肢であり、美しく再生されます。 ウェブやブラウザでオーディオをストリーミングする場合、160kbps以下のどのビットレートにおいても、WebMコンテナに入ったOpusが技術的には明確な勝者です。ただし、もし分析データが古いiOS Safariユーザーが聴衆の重要な部分を占めていることを示しているなら、彼らのためにAACやMP3のフォールバックを用意することを忘れないでください。 オーディオのアーカイブに関しては、答えはシンプルです。非可逆フォーマットは絶対に使わないこと。マスターはFLACやWAVファイルとして保存し、必要に応じて配信用フォーマットにエンコードしてください。CocoConvertを使えば、FLACからMP3、FLACからAAC、FLACからOpusへの変換が可能で、可逆マスターからこれらの配信用ファイルを生成できます。 音声通信やリアルタイムオーディオに関しては、答えはOpus一択です。以上。その低遅延性と、音声ビットレート(6〜32kbps)での驚異的な効率こそが、DiscordからWhatsAppまで、あらゆる主要なVoIPアプリがOpusを使用している理由です。MP3やAACは、そもそもこのような用途のために作られていません。 ビデオゲームのオーディオアセットの世界では、UnityとUnreal Engineの両方のワークフローでAACが一般的な選択肢です。Opusも勢いを増しており、Unity 2019.3以降ではネイティブでサポートされています。MP3も使えますが、現代のゲームエンジンにおいてAACに対する実質的な利点はありません。

CocoConvertでフォーマットを変換する

変換の準備はできましたか?CocoConvertはMP3、AAC(M4Aコンテナ)、Opus(OGGまたはWebMコンテナ)に対応しており、ビットレート設定も完全にカスタマイズ可能です。 FLACファイルをAACに変換するのは簡単です。ソースファイルをアップロードし、出力としてM4Aを選択し、ビットレートを選びます。音楽には256kbpsのAAC-LCが優れたデフォルト設定です。音声には96kbpsのモノラルにすれば、スピーチの品質をほとんど損なうことなくファイルサイズを半分にできます。CocoConvertは標準のAAC-LCプロファイルを使用し、80kbps以下のビットレートではHE-AACが利用可能です。 Opusの場合は、出力としてOGG OpusまたはWebM Opusのいずれかを選択します。音楽には96kbps、音声には32〜48kbpsのビットレートを推奨します。当社のエンコードはリファレンス実装であるlibopusによって処理されるため、コマンドラインツールで得られるものと同一の品質が保証されます。 そして定番のMP3については、フォーマットを選択した後、VBRとCBRのどちらかを選びます。固定の192kbps CBRよりも、V2品質レベル(平均約190kbps)のVBRを強くお勧めします。同等の品質で、平均ファイルサイズをわずかに小さくできます。 いくつかの制限事項について、正直にお話ししておきましょう。CocoConvertは現在、マルチチャンネルサラウンドサウンドのエンコードには対応していません。バッチ変換はProアカウント向けの機能で、無料ユーザーは一度に1ファイルに制限されています。非常に大きなファイル(500MB以上)の場合、接続が遅いとアップロードがタイムアウトする可能性があるため、先にオーディオをセグメントに分割するのが良い回避策です。また、CocoConvertはオーディオのノーマライズやラウドネスターゲティング(LUFS)は行いません。それが必要な場合は、変換の前後にFFmpegやAuphonicのようなツールでオーディオを処理する必要があります。 インターフェースのフォーマット推奨機能は、最大限の互換性を確保するためにMP3をデフォルトとしていますが、設定パネルで完全にコントロールできます。唯一の正解というものはありませんが、この記事で紹介した数値やユースケースが、あなたのワークフローに合った正しい判断を下す助けになるはずです。