プロファイル H.264/AVC
には多数の符号化ツールがあるが、全てのアプリケーションで全てのツールが必要とされている訳ではない。例えば、洗練されたエラー耐性ツールはデータロス
や破壊が非常に少ないネットワークでは重要ではない。全てのアプリケーションに全ツールのサポートを強制した場合、無駄に複雑なアプリケー
ションが出て来てしまうだろう。このため、符号化ツールのサブセットが定義された。これをプロファイルと呼ぶ。
デコーダでサポートするサブセット(プロファイル)はどれか一つだけでも自由だし、複数や全てサポートしても自由だ。H.264/AVC最初の規
格では、以下の三つのプロファイルが定義され、最新版でもそのまま残っている。:
Baseline (BP) Extended (XP) Main
(MP) Baseline
profile(BP)がサポートするのは I およびPスライス、一部の高度なエラー耐性ツール(FMO,
ASO, RS)、そしてCAVLC。B、SP、SIスライス、インターレース符号化ツール、CABAC
エントロピー符号化はサポートしない。Extended profile(XP)
はBaselineのスーパーセットで、上記にB、SP、SIスライス、インターレース符号化ツール、そして、データパーティショニング(DP)によるエ
ラー耐性の向上を加えたもの。CABACはサポート外。Main profile(MP) がサポートするのは
I、P、Bスライス、、インターレース符号化ツール、CAVLCとCABAC。高度なエラー耐性ツール(FMO, ASO, RS,
DP)やSP、SIスライスはサポート外。
本稿執筆時点(*2004/08月*)では、
Baseline Profile はビデオ会議のプライマリ・チョイスのようだ。Main
profileは、エンターテインメント品質のコンシューマー・アプリケーションで大きな関心を集めてきたが、勢いはFRExtの新しいHigh
profileの登場により弱まりつつある。
プロファイルは、想定する主な用途に対応して7種類あり、各々において使用するツール
と処理範囲等を定めている。レべルは、取り扱う映像の画素数に対応して16種類が定められている。
FRExt
改正により、以下4のprofileが追加定義された:
High (HP) High 10 (Hi10P) High
4:2:2 (Hi422P) High 4:4:4 (Hi444P)
これら4つのプロファイルは、Main profileのデザインの上に構築され、共通するのは以下の4点;
適応的マクロブロック・レベルスイッチング。8x8と4x4変換ブロックサイズの自動選択が可能になった。 (*Adaptive
macroblock-level switching between 8x8 and 4x4
transform block size*) エンコーダが固有の人間の視覚認識
ベースの量子化スケーリングマトリクス(カスタム量子化マトリクス)を使える。 (*Encoder-specified
perceptual-based quantization scaling
matrices*) エ
ンコーダは独自に各彩度コンポーネント(*CbとCr*)に独立した量子化パラメータを使える。 (*Encoder
-specified separate control of the quantization
parameter for each chroma component*)
一般的な4:2:0
videoに加え、これらのプロファイルは全て、白黒符号化されたビデオシークエンスもサポートする。新プロファイル間の違いは主にサポートする色深度と
色差信号(*chroma*)
フォーマットだ。ただし、High 4:4:4 はさらに、residual(*
残りの*) color
transform と predictive(*予測*)
lossless coding の機能を持つ。これは他のプロファイルには存在しない。詳細は以下。
プロファ
イル
Coding
Tools Baseline Extended Main
High High 10
High 4:2:2 High 4:4:4 概要 双方向予測やインタレース映像への処理等を省いた基本的ツールで構
成。 伝送エラー耐性用ツールを含む。 Baselineを包含すると共に、よ り高画
質・高度化のためのツールを追加。 標
準的ツール群で構成される代表的なプロファイル。 FMO,ASO,RS(注7)を除くBaseline プロ ファ
イルを包含。 Mainを包含する
と共に、HDTV映像等の高画質化用拡張(FRExt)ツール群を追加。 Highに10ビットサンプリング映像対応を追加。 High 10に4:2:2クロマフォーマット対応を追 加。
High
4:2:2に12ビットサンプリング映像および4:4:4クロマフォ ーマット対応を追加。 主
要用途 モバイル放送、ネット 配信など 高
度な配信など 放送、蓄積メディア、 配信など 高
画質放送、蓄積メディア、スタジオ(編集・蓄積)など 素材配信、スタジオ(編集・蓄
積)など 素材配信、スタジオ(編集・蓄積)など 素材配信、ス
タジオ(編集・蓄積)など スライス I
、Pスライス ◯ ◯ ◯ ◯ ◯ ◯ ◯ B
スライス ◯ ◯ ◯ ◯ ◯ ◯ イ
ンターレース符号化 (PicAFF, MBAFF) ◯ ◯ ◯ ◯ ◯ ◯ エントロピー符号化 CAVLC ◯ ◯ ◯ ◯ ◯ ◯ ◯ CABAC ◯ ◯ ◯ ◯ ◯ 整数変換(DCT?)
8x8 または 4x4 の適応変換 ◯ ◯ ◯ ◯ 量子化制御 カ
スタム量子化マトリクス ◯ ◯ ◯ ◯
CbとCrの個別 QPコントロール ◯ ◯ ◯ ◯ 重
み付け予測 - ◯ ◯ ◯ ◯ ◯ ◯ 色関係 モノ
クロ映像フォーマット ◯ ◯ ◯ ◯
9 および10 Bit サンプル深度 ◯ ◯ ◯
11 および12 Bit サンプル深度 ◯
8 Bit サンプル深度 ◯ ◯ ◯ ◯ ◯ ◯ ◯ 4:
2:0クロマフォーマット ◯ ◯ ◯ ◯ ◯ ◯ ◯ 4:
2:2クロマフォーマット ◯
4:4:4クロマフォーマット ◯
エラー耐性 高度
なエラー耐性 (FMO, ASO, RS) ◯ ◯ ◯ ◯ ◯ ◯ よ
り高度なエラー耐性 (DP) ◯ ◯ ◯ ◯ ◯ SP、
SIスライス ◯ ◯ ◯ ◯ ◯ その他(不詳) Residual
Color Transform ◯
Predictive Lossless
Coding ◯
高位のプロファイルは下位プロファイルの機能を包含する。規格上も高位プロファイルに対応するものは
下位プロファイルのビットストリームは全てデコード可能でなければならないとしている。
High
profileが短期間に極めて大きな関心を集めている理由は、実装上の複雑さがMain
profileに比べて非常に小さく(ほとんど無い)、その一方で圧縮能力は主観的にも客観的に
も向上(特にカスタム量子化マトリクスと適応的マクロブロック・レベルスイッチングによる)し、エンコーダ制御の自由度も増すためだ(CbとCrに独立し
た量子化パラメータを使える事による)。
【元ネタ1】
【元
ネタ2】
スポンサーサイト