原文:Introduction paper to H.264/MPEG-4 AVC including the Fidelity Range Extension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の 講義ガイダンスの模様。)
原文:Introduction paper to H.264/MPEG-4 AVC including the Fidelity Range Extension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の 講義ガイダンスの模様。)
原文:Introduction paper to H.264/MPEG-4 AVC includingthe Fidelity RangeExtension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の講義ガイダンスの模様。)
原文:Introduction paper to H.264/MPEG-4 AVC includingthe Fidelity RangeExtension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の講義ガイダンスの模様。)
原文:Introduction paper to H.264/MPEG-4 AVC includingthe Fidelity RangeExtension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の講義ガイダンスの模様。)
名称 | 1サンプルbit数 | 色彩信号形式 | 備考 |
---|---|---|---|
Highprofile (HP) | 8-bitvideo | 4:2:0 | ハイエンドコンシューマ、および高サンプル精度や拡張彩度フォーマットが必要無い高解像度アプリ用。 |
High10 profile (Hi10P) | 10bitまで | 4:2:0 | |
High4:2:2 profile (H422P) | 10bitまで | 4:2:2まで | |
High4:4:4 profile (H444P) | 12bitまで | 4:4:4まで | 他に
|
原文:Introduction paper to H.264/MPEG-4 AVC including the Fidelity Range Extension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の 講義ガイダンスの模様。)
Coding Tools | Baseline | Extended | Main | High | High 10 | High 4:2:2 | High 4:4:4 |
---|---|---|---|---|---|---|---|
概要 | 双方向予測やインタレース映像への処理等を省いた基本的ツールで構
成。 伝送エラー耐性用ツールを含む。 | Baselineを包含すると共に、よ り高画 質・高度化のためのツールを追加。 | 標
準的ツール群で構成される代表的なプロファイル。 FMO,ASO,RS(注7)を除くBaseline プロ ファ イルを包含。 | Mainを包含する と共に、HDTV映像等の高画質化用拡張(FRExt)ツール群を追加。 | Highに10ビットサンプリング映像対応を追加。 | High 10に4:2:2クロマフォーマット対応を追 加。 | High
4:2:2に12ビットサンプリング映像および4:4:4クロマフォ ーマット対応を追加。 |
主 要用途 | モバイル放送、ネット 配信など | 高 度な配信など | 放送、蓄積メディア、 配信など | 高
画質放送、蓄積メディア、スタジオ(編集・蓄積)など | 素材配信、スタジオ(編集・蓄 積)など | 素材配信、スタジオ(編集・蓄積)など | 素材配信、ス
タジオ(編集・蓄積)など |
スライス | |||||||
I 、Pスライス | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
B スライス | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | |
イ ンターレース符号化 (PicAFF, MBAFF) | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | |
エントロピー符号化 | |||||||
CAVLC | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
CABAC | ◯ | ◯ | ◯ | ◯ | ◯ | ||
整数変換(DCT?) | |||||||
8x8 または 4x4 の適応変換 | ◯ | ◯ | ◯ | ◯ | |||
量子化制御 | |||||||
カ スタム量子化マトリクス | ◯ | ◯ | ◯ | ◯ | |||
CbとCrの個別 QPコントロール | ◯ | ◯ | ◯ | ◯ | |||
重 み付け予測 | - | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
色関係 | |||||||
モノ クロ映像フォーマット | ◯ | ◯ | ◯ | ◯ | |||
9 および10 Bit サンプル深度 | ◯ | ◯ | ◯ | ||||
11 および12 Bit サンプル深度 | ◯ | ||||||
8 Bit サンプル深度 | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
4: 2:0クロマフォーマット | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
4: 2:2クロマフォーマット | ◯ | ||||||
4:4:4クロマフォーマット | ◯ | ||||||
エラー耐性 | |||||||
高度 なエラー耐性 (FMO, ASO, RS) | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | |
よ り高度なエラー耐性 (DP) | ◯ | ◯ | ◯ | ◯ | ◯ | ||
SP、 SIスライス | ◯ | ◯ | ◯ | ◯ | ◯ | ||
その他(不詳) | |||||||
Residual Color Transform | ◯ | ||||||
Predictive Lossless Coding | ◯ |
FRExt Profile | Bit Rate Multiplier |
---|---|
High | 1.25 |
High 10 | 3 |
High 4:2:2 | 4 |
High 4:4:4 | 4 |
レ ベル | 最大 フレーム サイズ (MBs) | 最
大 MB処理 レート (MB/s) | 最大映像 ビッ ト レート (kbps) | 一般的な ピクチャ サ イズ | 一般的なfps | 非FRExt での最大 圧 縮ビット レート (VCL用) | 一
般的な ピクチャ サイズで の最大参 照フレーム数 | 符
号化 ピクチャ | 想
定プロファイル (下記に限定されない) | 備考 | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 99 | 1485 | 64 | QCIF | 15 | 64 kbps | 4 | フレームMBのみ | BP | EP | |||
1b | 99 | 1485 | 128 | QCIF | 15 | 128 kbps | 4 | ||||||
1.1 | 396 | 3000 | 192 | CIF or QCIF | 7.5 (CIF) / 30 (QCIF) | 192 kbps | 2 (CIF) / 9 (QCIF) | ||||||
1.2 | 396 | 6000 | 384 | CIF | 15 | 384 kbps | 6 | ||||||
1.3 | 396 | 11880 | 768 | CIF | 30 | 768 kbps | 6 | ||||||
2 | 396 | 11880 | 2000 | CIF | 30 | 2 Mbps | 6 | ||||||
2.1 | 792 | 19800 | 4000 | HHR (480i or 576i) | 30 / 25 | 4 Mbps | 6 | フレームまたはフィールド | MP | ||||
2.2 | 1620 | 20250 | 4000 | SD | 15 | 4 Mbps | 5 | ||||||
3 | 1620 | 40500 | 10000 | SD | 30 / 25 | 10 Mbps | 5 | HP~ | |||||
3.1 | 3600 | 108000 | 14000 | 1280x720p | 30 | 14 Mbps | 5 | ||||||
3.2 | 5120 | 216000 | 20000 | 1280x720p | 60 | 20 Mbps | 4 | ||||||
4 | 8192 | 245760 | 20000 | HD
Formats (720p or1080i) | 60p / 30i | 20 Mbps | 4 | ||||||
4.1 | 8192 | 245760 | 50000 | HD
Formats (720p or1080i) | 60p / 30i | 50 Mbps | 4 | ||||||
4.2 | 8704 | 522240 | 50000 | 1920x1080p | 60p | 50 Mbps | 4 | フレームMBのみ | |||||
5 | 22080 | 589824 | 135000 | 2kx1k | 72 | 135 Mbps | 5 | ||||||
5.1 | 36864 | 983040 | 240000 | 2kx1k or 4kx2k | 120 / 30 | 240 Mbps | 5 | x264 デフォルト |
映像フォーマット | 輝度の WxH | 最
大 フレーム サイズ (MBs) | 1.0 | 1b | 1.1 | 1.2 | 1.3 | 2 | 2.1 | 2.2 | 3 | 3.1 | 3.2 | 4 | 4.1 | 4.2 | 5 | 5.1 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
SQCIF | 128×96 | 48 | 30.9 | 30.9 | 62.5 | 125.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 |
QCIF | 176×144 | 99 | 15.0 | 15.0 | 30.3 | 60.6 | 120.0 | 120.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 |
QVGA | 320×240 | 300 | 10.0 | 20 | 39.6 | 39.6 | 66.0 | 67.5 | 135.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||
525 SIF | 352×240 | 330 | 9.1 | 18.2 | 36.0 | 36.0 | 60.0 | 61.4 | 122.7 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||
CIF | 352×288 | 396 | 7.6 | 15.2 | 30.0 | 30.0 | 50.0 | 51.1 | 102.3 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||
525 HHR | 352×480 | 660 | 30.0 | 30.7 | 61.4 | 163.6 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||||||
625 HHR | 352×576 | 792 | 25.0 | 25.6 | 51.1 | 136.4 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||||||
VGA | 640×480 | 1200 | 16.9 | 33.8 | 90.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | |||||||
525 4SIF | 704×480 | 1320 | 15.3 | 30.7 | 81.8 | 163.6 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | |||||||
525 SD | 720×480 | 1350 | 15.0 | 30.0 | 80.0 | 160.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | |||||||
4CIF | 704×576 | 1584 | 12.8 | 25.6 | 68.2 | 136.4 | 155.2 | 155.2 | 172.0 | 172.0 | 172.0 | |||||||
625 SD | 720×576 | 1620 | 12.5 | 25.0 | 66.7 | 133.3 | 151.7 | 151.7 | 172.0 | 172.0 | 172.0 | |||||||
SVGA | 800×600 | 1900 | 56.8 | 113.7 | 129.3 | 129.3 | 172.0 | 172.0 | 172.0 | |||||||||
XGA | 1024×768 | 3072 | 35.2 | 70.3 | 80.0 | 80.0 | 170.0 | 172.0 | 172.0 | |||||||||
720p HD | 1280×720 | 3600 | 30.0 | 60.0 | 68.3 | 68.3 | 145.1 | 163.8 | 172.0 | |||||||||
4VGA | 1280×960 | 4800 | 45.0 | 51.2 | 51.2 | 108.8 | 122.9 | 172.0 | ||||||||||
SXGA | 1280×1024 | 5120 | 42.2 | 48.0 | 48.0 | 102.0 | 115.2 | 172.0 | ||||||||||
525 16SIF | 1408×960 | 5280 | 46.5 | 46.5 | 98.9 | 111.7 | 172.0 | |||||||||||
16CIF | 1408×1152 | 6336 | 38.8 | 38.8 | 82.4 | 93.1 | 155.2 | |||||||||||
4SVGA | 1600×1200 | 7500 | 32.8 | 32.8 | 69.6 | 78.6 | 131.1 | |||||||||||
1080 HD | 1920×1088 | 8160 | 30.1 | 30.1 | 64.0 | 72.3 | 120.5 | |||||||||||
2Kx1K | 2048×1024 | 8190 | 30.0 | 30.0 | 63.8 | 72.0 | 120.0 | |||||||||||
2Kx1080 | 2048×1080 | 8704 | 60.0 | 67.8 | 112.9 | |||||||||||||
4XGA | 2048×1536 | 12288 | 48.0 | 80.0 | ||||||||||||||
16VGA | 2560×1920 | 19200 | 30.7 | 51.2 | ||||||||||||||
3616x1536 (2.35:1) | 3616×1536 | 21696 | 27.2 | 45.3 | ||||||||||||||
3672x1536 (2.39:1) | 3680×1536 | 22080 | 26.7 | 44.5 | ||||||||||||||
4Kx2K | 4096×2048 | 32768 | 30.0 | |||||||||||||||
4096x2304 (16:9) | 4096×2304 | 36804 | 26.7 |
名 称 | 縦x横 | 備考 |
---|---|---|
スタンダード | 1×1.37 | 35mm写真フィルムとほぼ同じ。TVもこれに倣った。 |
不詳 | 1×1.2 | ほぼ正方形。トーキーの音声をフィルム上に収録するため、ちょっ と映像を削った。不評で消えた。 |
ヨーロッパ・ビスタ | 1×1.66 | フランス映画に多い。 |
アメリカン・ビスタ | 1×1.85 | シネマスコープを除くほとんどのアメリカ映画。日本、イギリス、 イタリア映画にも多い。 |
マスキングビスタ | 1×1.66~1×1.85 | 35mm(スタンダード・サイズ)フィルムでの撮影または上映時に上下にマスクをかける。 純 正のビスタビジョンと区別するため“ビスタ サイズ”と言う。 1960年代のフィルムの品質向上で実用化。 1980年代のビデオ普及に より、撮影はスタンダード、上映はマスキングビスタが主流となる。 |
シネマスコープ | 1×2.35 | 基準は1×2.35だが、通常は 1×2以上のアスペクト比を「スコープ・サイズ」と呼ぶ。 撮影は専用のアナモルフィック・レンズか、スーパー 35方式(マスキングビスタ的なもの)を使う。 |
名 称 | 種別 | 対応規格 | 根拠 |
---|---|---|---|
DAR Display Aspect Ratio ディスプレイ・アスペクト・レシオ |
画面表示のアスペクト比。 | MPEG-1/2/4 | MEncoder - mpegoptsのvaspect=<1 | 4/3 | 16/9 | 221/100> -xvidencopts のaspect=<x/y | f (float value)> |
PAR Pixel Aspect Ratio ピクセル・アスペクト・レシオ |
ピクセルのアスペクト比。 | MPEG-4 ASP? | MEncoder -xvidencoptsのpar=<mode> DAR = PAR * (width/height)。 |
SAR Sample Aspect Ratio サンプル・アスペクト・レシオ |
ピクセルのアスペクト比。 | MPEG-4 AVC | x264cli Input/Output:の --sar ※ 規格上はVideo Usability Info (Annex E):だが、 ここではcore:54 svn-611M --longhelpに従った。 MEncoder -x264encoptsには見当たらない。 |
素 材解像度 | DAR | SAR(PAR_W : PAR_H) | ||
---|---|---|---|---|
一 般名 (縦横比など) |
少数表記 (高さを1とした時の横幅) |
PAR_W | PAR_H | |
720x480 (NTSC) | 4:3 | 1.33 | 8 | 9 |
16:9 | 1.77(*1) | 32 | 27 | |
アメリカン・ビスタ(*2) | 1.85 | 100 | 81 | |
シネスコ | 2.35 | 69 | 44 | |
704x480 (NTSC Crop) | 4:3 | 1.33 | 10 | 11 |
16:9 | 1.77(*1) | 40 | 33 | |
アメリカン・ビスタ(*2) | 1.85 | 125 | 99 | |
シネスコ | 2.35 | 85 | 53 | |
720x576 (PAL) | 4:3 | 1.33 | 16 | 15 |
16:9 | 1.77(*1) | 64 | 45 | |
アメリカン・ビスタ(*2) | 1.85 | 40 | 27 | |
シネスコ | 2.35 | 32 | 17 | |
704x576 (PAL Crop) | 4:3 | 1.33 | 12 | 11 |
16:9 | 1.77(*1) | 16 | 11 | |
アメリカン・ビスタ(*2) | 1.85 | 50 | 33 | |
シネスコ | 2.35 | 102 | 53 | |
大半とは言いませんが、多くのワイドスクリーンDVDは、厳密には16:9ではなく、1.85:1 か 2.35:1 (シネスコープ)。これは、映像の中にクロップすべき黒帯が含まれていると言う事になります。MEncoder Documents/DVD映像を高画質なMPEG-4 ("DivX")にする方法よ り。従って16:9とは各種ビスタやシネスコを包含する汎用比と思われる。
規 格上、Levelが規定する最大フレームサイズとは、pixel/frameの合計数だけだ。水平・垂直それぞれの最大サイズは、Sqrt (maximum frame size * 8)以下でなければならない事を除けば規格には無い。もしもAVCのレベルにフレームの縦横は720x480といった規定が無く、制限は1フレームあたりのピクセル数だけで、かつ、ピクセルに縦横比情報を持 たせる事ができるのなら、ヨーロッパ・ビスタだろうがアメリカン・ビスタだろうがマスキングビスタだろうがシネスコだろうがそれ以外の変形素材だろうが、 オリジナルのフィルムから起こす場合に限っては、もうちょっとだけ、素材に忠実な解像度で作る事ができそうだ。それなら、MPEG-4 ASPの"PAR"の名称を変える必要性が納得できる。
-vf pullup,softskip,crop=702:352:8:64,scale=640:480,hqdn3d=2:1:4,pp=l5,harddup記録が残っていないがSARもPARも滅茶苦茶なハズだ。
![]() |
![]() |
![]() |
QT Player + avcdecoder 0.5.1 | VLC 0.8.6 | MPlayer OSX 1.0 pre 8 |
改訂版H.264/AVC教科書、p183※この「明示的な指定」は、x264cli、VUI設定の--overscanで行う(参考1, 2)。
※太字オレ
例 えばHDTVの場合、走査線の数は1080本です。これに対してH.264/AVCでは垂直、水平方向とも16画素の倍数で ないと符号化できません (1080本は16の倍数ではない)。例えば、1088本(16の倍数)を符号化した場合、8ラインを捨てて表示する必要がありますが、この場合、クロッ ピング処理によって、ビットストリーム中でどの上下8ラインを捨てるのかを明示的に指定する事ができます。
Introduction paper to H.264/MPEG-4 AVC includingthe Fidelity RangeExtension. (PDF)
2. 符号化ツール(試訳)
各ピクチャは一個以上のスライスに分割することで圧縮される。各スライスはマクロブロックからなる。さらにこれは16x16ピク セルの輝度サンプ ルと、それに対応する輝度サンプルからなる。しかしながら(*これまでとは異なり*)各 マクロブロックは、動き補償予測の為に、さらにサブ・マクロブロック・パーティションに分割される。予測パーティションのサイズは7種類となる。 – 16x16, 16x8, 8x16, 8x8, 8x4, 4x8 そして4x4だ。これまでの規格では、動き補償はマクロブロックを丸ごと使うか、新しめの規格では16x16 か8x8パーティションを使った。従って、パーティションの形にバリエーションが増えたという事は、予測精度の向上をもたらす。次に、残ったデータは 8x8(FRExtでしか使えない)か4x4で空間軸変換される。過去の主要規格ではこの変換ブロックサイズは8x8のみだった。4x4ブロックサイズの 採用で残りの差分信号の精度が向上する事になる。空間軸変換のブロックサイズは常に予測に使われるブロックサイズと同じか、より小さい。ビデオシークエン スのシークエンスからサンプル(*原注:ここでは特にサンプルとピクセルを区別しないが、厳密にはサンプルが正しい。)に至る階層構造は以下のようにな る。
シークエンス(ピクチャ(スライス(マク ロブロック(マクロブロック・パーティション(サブ-マクロブロック・パーティション(ブロック(サンプル))))))
ニコンシステム(株)H.264 解析ツールNH264H1のpdf※これらから、4x4や8x8は16x16に対するサブ区分と思われる。一番右下、田の字型に分割されてるのが8x8だと思う。
http://www.nikon-sys.co.jp/products/index_1_1.htm
MEncoder Document/ DVD映像を高画質なMPEG-4 ("DivX")にする方法/効果的にエンコードするための制限事項(試訳)※Xvidやlibavcodec mpeg-4では、入力映像の縦横が16の倍数でなかった場合、勝手に16の倍数まで映像領域が「あるものとして」エンコードする。
最 高画質を追求する場合、MPEG系圧縮の特徴からくるいくつかの制限事項を守る必要があります。MPEGは映像をマクロブロックと呼ばれる16x16の正 方形に分割します。各マクロブロックは、輝度(強度)情報を表す4個の8x8ブロックと、2個のハーフ・レゾリューション8x8ブロック(red- cyan 軸とblue-yellow軸)で構成されます。手許の動画の横幅と高さが16の倍数でない場合でも、エンコーダは映像全体をカバーできるだけの 16x16マクロブロックを使うので、余聞な無駄が出ます。
ですので、目標ファイルサイズの範囲で最高画質を求める場合は、16の倍数以外の縦横は使わないようにしよう。
2ch/DTV/x264 rev7(2006年11月下旬~12月上旬)※画質的な問題を感じている人はほとんど無いようだ。
- やっぱり16の倍数じゃないとダメっぽいとあったのですが、みなさんは16:9の映像の場合どのような解像度にしています か?
- 704x480(DVD左右クロップ) --sar 40:33
- 自動的に無効領域が追加されて16の倍数になるから問題なし
- 俺も気にしてないな。画質は全然落ちないし
- 俺は気にしてる。16の整数倍にしないとなんとなく暗部とか薄いグラデーションとかでブロック ノイズ増える気がする。ただの気のせいかもしれないけど。
- 画質に関しては関係ないと思うけど、16の倍数だと動画の圧縮率や精度が向上するのは確かだと 思うよ
MPEG-4規格は"マルチタレント"、あらゆるニーズに応える事を狙っていますので、方式が 3つあります:
1)ビデオビットストリームレベルで指定する方式:
現時点ではこれが最も実用的で、広く使われているやりかたでしょう。PARを指定できるコデック(例:3ivx、ffmpeg/ffvfw、XviD)を
使って、出来上がったAVIをMP4 muxerでMP4にmuxします。この場合、MP4 muxerはなんでも構いません( 3ivx
mp4 muxer, MP4Box or mp4UI)。
既にエンコード済みのビットストリームのPARを変更するには、MPEG-4 ASPではMoitahの MPEG4 Modifier、AVCでは hhanhの ARChange
を使います。もっとも、MP4BoxではどちらのフォーマットでもPARを変更できます。
自動アナモルフィック再生に対応したプレイヤは、VideoLAN、MPlayer。DShowでは、3ivx、Nero か Haali
parsers と XviDの組み合わせ(ARをautoに)、3ivx("force overlay"を使う)、Nero か
ffdshow("overlay mixer"を使う)のdecoder filter。
MP4
では"Composition
Matrix"を使う方式も定義しています。これはアスペクトレシオを変更したり、ピクチャを回転させたり、複数のレイヤーを扱ったり、再生中にオーディ
オストリームを二個ミックス(台詞と音楽が分離している映画など)したり、、、、。
Quicktime/Pro
ではこうしたたくさんのcompositionを扱う事ができます。Movie -> Get Movie
Properties -> Video/Sound Track -> Size/Layer/Volume/...
。またそうしたcompositionを持つMP4ファイルを正しく再生できます。
最も幅広いオーサリングができる方式です(Q9)。AR の変更もできます(例えばTransform2D.scaleを使うなど)。BIFS control streamの作成と再生にはGPAC project tools、つまりMP4BoxとOsmo4を使いましょう。
はい。
タイムコードファイルを使います。これをMP4ファイルにくっつけるか、ASPならn-vopsをドロップさせます。
MP4の大きなアドバンテージの一つは相互運用性と、オープ ン規格な事(ライセンスフリー!)です。これをサポートする非常にたくさんのツールが、全てのプラットフォームで出ています。Mac、Linux、 PocketPC、そしてもちろん Windows。
まず始めに以下の二つが必要です。
splitter/parser filter:再生中に、コンテナファイルを内蔵するストリームに分割するもの(audio, video, subtitles)。
decoder filter:エンコードされたストリームをデコードするもの(例えば ffdshow、3ivx、CoreAAC)。
話がずれますが、AVI用のsplitterをインストールする必要が無いのは、デフォル トでwindowsに入っているからです。
話を戻して、こうしたフィルタを含んだパッケージが入手可能です。MP4のストリーミングについては、Apple
と MPEG4IPが無償で良いツールを公開しています。
ストリーミングサーバとしては、Appleの Darwin Streaming Serverが使えま
す。ガイドはeverwicked とlinuxjournalにあります。
ライブストリー
ミンでは、Linuxのみですが、MPEG4IP の mp4live
が使えます。ガイドは everwicked と MPEG4IPにあります。Windowsでは MPEGRecorder
が使えます(どうやらmp4liveのポートのようです)。
ViTooKi
の toolも試すと良いでしょう(オープンソースのストリーミングサーバ、Player、その他)
Cata
からも、オープンソースのMP4ストリーミングサーバが出ています。
MAC では Live
Channel を見て下さい。
ストリーミング放送の
MP4を再生するには、AppleのQuicktime、RealのRealPlayer
10、MPEG4IPの WMP4Player、Dicasの mpegableおよび EnvivioTV (この二つは dshow
playerです)そしてGPACの Osmo4 (最後の二つは streamed advanced
content/user interactivitiyもサポートしています(Envivioのインタラクティブ・デモ))。
また、 MediaFrame
(demos)
と IBM (interactive demos)のjava
appletを使うと、プレイヤをインストールしなくてもMP4ストリーミングを再生できます!。
MPEG-4規格はAVC/H.264で最新で、技術的にも素晴らしく、state-of-the-artのビデオ符号化フォーマットです。
AVC/H.264 ビデオ符号化規格は2003年に二つの団体で策定されました。ISOのMPEGとITUのVCEG です。ITUは国連の下部組織で、H.263フォー マット(主にビデオ会議のソフトに使われてい ます)を策定した機関です。
AVC/H.264 規格そのものの開発はJVTが 開発にあたりました。これにはMPEG とVCEGの専門家が参加しています。
MPEGサイドから見ればこの規格は MPEG-4 Part 10 (ISO 14496-10)、ITU サイドから見ればH.264 (ITU の文書番号)。 AVC(Advanced Video Coding)という "正式な" タイトルはMPEG側がAACと 並べた時のバランスを考えてつけたものです。
AVC/H.264規格は4種類のプロファイルを定義しています。Baseline、Main、 Extendedお よびHigh Profile。この下にさらにレベル(*参考)による分類があります。
DVD バックアップには、High Profileを次項の符号化ツール(* 要素技術*)と一緒に使うのが一番向いているようです。
MPEG-4 ASP (*試訳)の符号化ツールも読んで下さい。GMC以外はAVCでも使えます。
AVC/H.264では、ビットストリームの記述方式(マクロブロック・タイプ、モーションベクトル+参照インデックス、、、)に、 MPEG-4 ASPより先進的なエントロピー符号化ツールを使います。二種類のエントロピー符号化が 定義されています。
CABACは、AVC/H.264デフォル トのCAVLC (別名UVLC)よりも強力な圧縮方式で、ビットレートを約10~15%節約できると言われています(特に高ビットレート時)。CABACもCAVLCも ロスレスで画質低下が一切ありません。し かしエンコードとデコード速度は低下します。
Loop/Deblocking Filter:(他に、インライン フィルタ、インラインデブロック、などとも)
プレフィルタ(例えばavisynthが行う エンコード前のフィルタリング)や、ポストプロセス/フィルタ (デコーダが最終出力前に行うもの)に対して、ループフィルタはエンコード工程の中で、各フレー ムがエンコードされた後にかけるものです。
厳密にはエンコードの 後、但し、後続フレームの為の参照フレームとして使われる前 の時点です。これは特に低ビットレート時のブロックノイズ減少に効果があります。しかし、エンコードとデコードは遅くなります。
Variable Block Sizes/Macroblock Partitions:
MPEG-4 ASPでは、イ ンター4V、またはインター4MVを使うと、16x16~8x8ピクセルの間でブロックサイズを変える事ができました。
AVC/H.264 では、モーションサーチの精度を決めるマクロブロックの大きさを、4x4ピクセルまで下げる事を提案していま す。これは、8x4のように段階的に下げて行く事もできます。ブロックサイズは映像内容に応じて可変です。
各マクロブロックにどの 程度のブロックサイズを与えれば最も効果的か、その判断 が賢いものが良いエンコーダと呼ばれるでしょ う。
Multiple Reference Frames:
MPEG-4 ASPでは、参照フレームにできるのは直前のフレームのみでした。
AVC/H.264のインター・モーション・サーチでは、複数の 候補から参照フレームを選べるようになりました。
つまり、ビデオコデックはASPのようにシンプルに直前フレームを参照するか、そ れとももっと前のフレームを参照するか自分で 決められると言う事です。 例えば、Pフレームは直前のIフレームよりももっと前のフレームを参照できます。
このため、新しいタイプのIフレームが必要になり ました。IDRフレームです。これはIフ レームの一種ですが、後続のフレームに自分よりも前を参照する事を禁止します。複数参照フレームを使うとエンコード、デコード速度は低下し、カットも IDR フレーム単位でしかできなくなります。
Weighted Prediction:
Weigthed Predictionを使うと参照フレームに「重要性」を付ける事が出来ます。例えば、直前の映像を(ブライトネス方向に) スケーリングできます。
これは特にフェードのある場面、後続の映像が直前の映像によく似ている場合に効果的で す。
明転で明るさが増す場合は除きます。また、フェードを使った場面転 換のような、クロスフェードには効果がありません。
Rate Distortion Optimisation (RDO):
RDO を使うと、エンコーダは2種類の選択肢があるような場合に、それがいかなる局面であれ、最も効率の良い符号化方式を選べるようになり ます(例えば インター符号化とイントラ符号化のどちらを選ぶか、モーションサーチ方式の選択、などなど)。
RDO はAVC/H.264 仕様書の定義にありません。しかし、この新しいアプローチを最初に導入したのはH.264レファレンスソフトウェア(JM)です。他のコデックもRDOを 組み込む事が出来ます。例えば、既にRDOを装備しているXviDのVHQモードのように。
現 在入手可能なAVC/H.264の実装は以下の通りです。
x264、Nero、Apple、Sorenson、Elecard、Moonlight、VSS、mpegable、Envivio、Hdot264 (binary)、DSPR、JM (レファレンスソフト) (binary)、ffmpeg、Philips、FastVDO、Skal、Sony、その他いろいろ。
現 在の実装の中には非常に低速なものがあります。
現在、x264とNeroDigitalの AVCエンコーダは良い速度と画質を実現しているように見えますが、AVCが非常に先進的なビデオ符号化形式である事に変わりはなく、古いCPUでの エンコード・デコードは非常に時間のかかるものになるでしょう。
DVD フォーラムとBlu-rayディスクアソシエーションが現在一般的なDVD フォーマットの後継を目指して活動しています。これはいわゆる High Definition コンテンツ (現行DVDより大きな映像サイズ)と呼ばれる物で、名称をHD-DVD と BD-ROMと言います。
HD-DVDでは、 MPEG-4 AVC/H.264は対応必須のビデオコデックです(こ こに書かれている通り)。
Blu-rayも、MPEG-4 AVC/H.264をビデオコデックに含めました(こ こ(pdf直リン)にあるように)。
以上の事から、AVC/H.264 は、現在DVDの中で使われているMPEG-2 のように、広くサポートされる次世代ビデオフォーマットになるものと思われます。