06年09月:次世代光ディスクの画質を上げるPHLエンコーダーとは? :本田雅一氏,ITmediaHigh Profile番長御総謹製のエンコーダを、素材ごとに設定をチューンするようなプロが、駆使する世界。
高橋氏は「ひとつはパラメータの選び方、もうひとつ は量子化マトリックスの作り方や映像全体に対するビット配分で すね。特にビット配分に関しては、 DVD時代に高画質圧縮を行うための研究開発を相当やり、実際に映画会社と一緒に高画質化を行ってきましたから、そこでの経験があります」と話す。
高橋氏のいう“パラメータの選び方”は、H.264世代になって大きく画質に影響する ようになった部分だろう。MPEG系の圧縮ではフレーム間の 近似する映像パターンを見つけてコピーする動き予測という手法が用いられるが、H.264では予測のパターンが大幅に増加している。また同一フレーム内で の動き予測という新しい要素も加わった。
さらに動き予測のマクロブロックに柔軟性が増し(4x4、8x8、4x8などさまざまな形状を選べ る)、 エンコーダー側で判別しなければならない 動き予測のバリエーションが想像を絶するほどに増えているのだ(これがH.264の圧縮負荷が高い原因になっている)。
この開発プロセスはx264でも存在する。素材はほとんどDVDだし機材はご家庭のパソコンだし、バラツキも大きいが、アタマ数は充分だ。その領域に 限っては、“最適なパラメータを選ぶ”エンコーダーに 最も近いと言える。“最適なパラメータを選ぶ”エンコーダーを開発すればい いと文字で書くのは簡単だが、 実際のプログラミングは相当に難しいだろう。しかし、だから こそ他エンコーダーに先んじて高画質化を果たせたと高橋氏は話す。
「われわれは研究開発の部隊で、本来はオーサリング事業を行う部署ではありません。しかし、現在はBD事業を立ち上げるために オーサリングや出荷 するディスクの画質面での品質評価を支援しています。おそらくこうした組織は、世界中どこを探してもないでしょう。品質評価をコーデックを開発と圧縮作業 の監修を行った人間が直接行うのですから」
「たとえば過去にはこんなことがありました。DVDの圧縮作業で、どうしても歪みが目立つところがあり、パラメータ変更では取り 切れない。そこに 柏木が来て“あぁ、これはエンコーダーのバグだなぁ”と話し、エンコーダーのソースコードを修正してしまいまし た。品質評価で納得がいかない時、それをエ ンコーダーのレベルにまで振り返って修正することで進化させる。このプロセスがPHLエンコーダーの画質を高めたのだと思います」
つまり、エンコーダーのバグなのか、それとも圧縮規格そのもののクセや限界なのか、それともビットレートが不足しているのか、逆 にビットが余って 無駄になっていないか。その切り分けが正確に行えることこそが、PHLエンコーダーのアドバンテージというわけだ。
筆者自身、PHLでの品質評価のプロセスを知って驚く、、、というよりも、呆れたことがある。気違いです。気違いが居ます!12ftは約3.7m。自分の部屋の天高は2.3mだった(測るなよ)。16:9なら横は6.5m程になる、、、いや測っ てませんよ?^^;縦12フィートの巨大スクリーンで評価を行っているというのは、以前に紹介したことがあるが、最近 はそれでも歪みやノイズを探すこと が困難にな り、コントラストを強調し、歪みやノイズをディスプレイ側で浮き立たせてチェックを行い、そのノイズを消すように配慮しながら圧縮作業を行っている。
明らかにオーバークオリティといえる品質評価は、PHLが事業体ではなく研究開発を目的にした組織だからこそだが、その結果とし ての 映像は素晴らしいの一言に尽きる。
期待したい。期待したい。期待したい(エコー)。エンコーダーは使いこなしと品質評価のプロセスが肝要で、エンコー ダーが同じならば同じ品質になるわけではないが、PHLエンコーダーが広がり、これこそが次世代といえる画質のソフトが登場することに期待したい。
原文:Introduction paper to H.264/MPEG-4 AVC including the Fidelity Range Extension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の 講義ガイダンスの模様。)
原文:Introduction paper to H.264/MPEG-4 AVC including the Fidelity Range Extension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の 講義ガイダンスの模様。)
原文:Introduction paper to H.264/MPEG-4 AVC including the Fidelity Range Extension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の 講義ガイダンスの模様。)
原文:Introduction paper to H.264/MPEG-4 AVC includingthe Fidelity RangeExtension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の講義ガイダンスの模様。)
原文:Introduction paper to H.264/MPEG-4 AVC includingthe Fidelity RangeExtension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の講義ガイダンスの模様。)
原文:Introduction paper to H.264/MPEG-4 AVC includingthe Fidelity RangeExtension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の講義ガイダンスの模様。)
名称 | 1サンプルbit数 | 色彩信号形式 | 備考 |
---|---|---|---|
Highprofile (HP) | 8-bitvideo | 4:2:0 | ハイエンドコンシューマ、および高サンプル精度や拡張彩度フォーマットが必要無い高解像度アプリ用。 |
High10 profile (Hi10P) | 10bitまで | 4:2:0 | |
High4:2:2 profile (H422P) | 10bitまで | 4:2:2まで | |
High4:4:4 profile (H444P) | 12bitまで | 4:4:4まで | 他に
|
原文:Introduction paper to H.264/MPEG-4 AVC including the Fidelity Range Extension. (PDF)
※スウェーデン、 Luleå University of Technology、Dr. Peter Parne氏の 講義ガイダンスの模様。)
wikipedia:モスクワ大学-- 太字オレようするに東大だべ。
モスクワ大学(モスクワだいがく、Московский государственный университет имени М.В. Ломоносова, M.V. Lomonosov Moscow State University)は、ロシア・モスクワにある大学。ロシアでは通常МГУ(エム・ゲー・ウー)と呼ばれ、M.V.ロ モノーソフ記念モスクワ国立総合大学の略称である。
ロシア国内では最高学府とされ、世界的にもよく知られた総合大学の1つである。
http://www.compression.ru/video/codec_comparison/mpeg-4_avc_h264_2005/part4.htm
- 前年の比較テストと比べると、H.264 規格コデックの水準は極めて向上した。1年前にはMPEG4-ASP 規格のベストコデックはH.264規格のベストコデックに匹敵したが、今やその状況は大きく変わった。DivXコデックには少なからぬ向上が見られるにも 関わらず、新規格コデックの大半に引けを取る。
- 新規格コデックのうち明白に水準を抜いたものを選ぶ事は困難だが、x264 と Ateme が全般的にベストの結果を出した。
- 速度面では明白にATIが抜きん出た。またそれ以外の面が必ずしも悪いわけでもない。
Coding Tools | Baseline | Extended | Main | High | High 10 | High 4:2:2 | High 4:4:4 |
---|---|---|---|---|---|---|---|
概要 | 双方向予測やインタレース映像への処理等を省いた基本的ツールで構
成。 伝送エラー耐性用ツールを含む。 | Baselineを包含すると共に、よ り高画 質・高度化のためのツールを追加。 | 標
準的ツール群で構成される代表的なプロファイル。 FMO,ASO,RS(注7)を除くBaseline プロ ファ イルを包含。 | Mainを包含する と共に、HDTV映像等の高画質化用拡張(FRExt)ツール群を追加。 | Highに10ビットサンプリング映像対応を追加。 | High 10に4:2:2クロマフォーマット対応を追 加。 | High
4:2:2に12ビットサンプリング映像および4:4:4クロマフォ ーマット対応を追加。 |
主 要用途 | モバイル放送、ネット 配信など | 高 度な配信など | 放送、蓄積メディア、 配信など | 高
画質放送、蓄積メディア、スタジオ(編集・蓄積)など | 素材配信、スタジオ(編集・蓄 積)など | 素材配信、スタジオ(編集・蓄積)など | 素材配信、ス
タジオ(編集・蓄積)など |
スライス | |||||||
I 、Pスライス | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
B スライス | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | |
イ ンターレース符号化 (PicAFF, MBAFF) | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | |
エントロピー符号化 | |||||||
CAVLC | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
CABAC | ◯ | ◯ | ◯ | ◯ | ◯ | ||
整数変換(DCT?) | |||||||
8x8 または 4x4 の適応変換 | ◯ | ◯ | ◯ | ◯ | |||
量子化制御 | |||||||
カ スタム量子化マトリクス | ◯ | ◯ | ◯ | ◯ | |||
CbとCrの個別 QPコントロール | ◯ | ◯ | ◯ | ◯ | |||
重 み付け予測 | - | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
色関係 | |||||||
モノ クロ映像フォーマット | ◯ | ◯ | ◯ | ◯ | |||
9 および10 Bit サンプル深度 | ◯ | ◯ | ◯ | ||||
11 および12 Bit サンプル深度 | ◯ | ||||||
8 Bit サンプル深度 | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
4: 2:0クロマフォーマット | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ |
4: 2:2クロマフォーマット | ◯ | ||||||
4:4:4クロマフォーマット | ◯ | ||||||
エラー耐性 | |||||||
高度 なエラー耐性 (FMO, ASO, RS) | ◯ | ◯ | ◯ | ◯ | ◯ | ◯ | |
よ り高度なエラー耐性 (DP) | ◯ | ◯ | ◯ | ◯ | ◯ | ||
SP、 SIスライス | ◯ | ◯ | ◯ | ◯ | ◯ | ||
その他(不詳) | |||||||
Residual Color Transform | ◯ | ||||||
Predictive Lossless Coding | ◯ |
FRExt Profile | Bit Rate Multiplier |
---|---|
High | 1.25 |
High 10 | 3 |
High 4:2:2 | 4 |
High 4:4:4 | 4 |
レ ベル | 最大 フレーム サイズ (MBs) | 最
大 MB処理 レート (MB/s) | 最大映像 ビッ ト レート (kbps) | 一般的な ピクチャ サ イズ | 一般的なfps | 非FRExt での最大 圧 縮ビット レート (VCL用) | 一
般的な ピクチャ サイズで の最大参 照フレーム数 | 符
号化 ピクチャ | 想
定プロファイル (下記に限定されない) | 備考 | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 99 | 1485 | 64 | QCIF | 15 | 64 kbps | 4 | フレームMBのみ | BP | EP | |||
1b | 99 | 1485 | 128 | QCIF | 15 | 128 kbps | 4 | ||||||
1.1 | 396 | 3000 | 192 | CIF or QCIF | 7.5 (CIF) / 30 (QCIF) | 192 kbps | 2 (CIF) / 9 (QCIF) | ||||||
1.2 | 396 | 6000 | 384 | CIF | 15 | 384 kbps | 6 | ||||||
1.3 | 396 | 11880 | 768 | CIF | 30 | 768 kbps | 6 | ||||||
2 | 396 | 11880 | 2000 | CIF | 30 | 2 Mbps | 6 | ||||||
2.1 | 792 | 19800 | 4000 | HHR (480i or 576i) | 30 / 25 | 4 Mbps | 6 | フレームまたはフィールド | MP | ||||
2.2 | 1620 | 20250 | 4000 | SD | 15 | 4 Mbps | 5 | ||||||
3 | 1620 | 40500 | 10000 | SD | 30 / 25 | 10 Mbps | 5 | HP~ | |||||
3.1 | 3600 | 108000 | 14000 | 1280x720p | 30 | 14 Mbps | 5 | ||||||
3.2 | 5120 | 216000 | 20000 | 1280x720p | 60 | 20 Mbps | 4 | ||||||
4 | 8192 | 245760 | 20000 | HD
Formats (720p or1080i) | 60p / 30i | 20 Mbps | 4 | ||||||
4.1 | 8192 | 245760 | 50000 | HD
Formats (720p or1080i) | 60p / 30i | 50 Mbps | 4 | ||||||
4.2 | 8704 | 522240 | 50000 | 1920x1080p | 60p | 50 Mbps | 4 | フレームMBのみ | |||||
5 | 22080 | 589824 | 135000 | 2kx1k | 72 | 135 Mbps | 5 | ||||||
5.1 | 36864 | 983040 | 240000 | 2kx1k or 4kx2k | 120 / 30 | 240 Mbps | 5 | x264 デフォルト |
映像フォーマット | 輝度の WxH | 最
大 フレーム サイズ (MBs) | 1.0 | 1b | 1.1 | 1.2 | 1.3 | 2 | 2.1 | 2.2 | 3 | 3.1 | 3.2 | 4 | 4.1 | 4.2 | 5 | 5.1 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
SQCIF | 128×96 | 48 | 30.9 | 30.9 | 62.5 | 125.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 |
QCIF | 176×144 | 99 | 15.0 | 15.0 | 30.3 | 60.6 | 120.0 | 120.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 |
QVGA | 320×240 | 300 | 10.0 | 20 | 39.6 | 39.6 | 66.0 | 67.5 | 135.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||
525 SIF | 352×240 | 330 | 9.1 | 18.2 | 36.0 | 36.0 | 60.0 | 61.4 | 122.7 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||
CIF | 352×288 | 396 | 7.6 | 15.2 | 30.0 | 30.0 | 50.0 | 51.1 | 102.3 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||
525 HHR | 352×480 | 660 | 30.0 | 30.7 | 61.4 | 163.6 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||||||
625 HHR | 352×576 | 792 | 25.0 | 25.6 | 51.1 | 136.4 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | ||||||
VGA | 640×480 | 1200 | 16.9 | 33.8 | 90.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | |||||||
525 4SIF | 704×480 | 1320 | 15.3 | 30.7 | 81.8 | 163.6 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | |||||||
525 SD | 720×480 | 1350 | 15.0 | 30.0 | 80.0 | 160.0 | 172.0 | 172.0 | 172.0 | 172.0 | 172.0 | |||||||
4CIF | 704×576 | 1584 | 12.8 | 25.6 | 68.2 | 136.4 | 155.2 | 155.2 | 172.0 | 172.0 | 172.0 | |||||||
625 SD | 720×576 | 1620 | 12.5 | 25.0 | 66.7 | 133.3 | 151.7 | 151.7 | 172.0 | 172.0 | 172.0 | |||||||
SVGA | 800×600 | 1900 | 56.8 | 113.7 | 129.3 | 129.3 | 172.0 | 172.0 | 172.0 | |||||||||
XGA | 1024×768 | 3072 | 35.2 | 70.3 | 80.0 | 80.0 | 170.0 | 172.0 | 172.0 | |||||||||
720p HD | 1280×720 | 3600 | 30.0 | 60.0 | 68.3 | 68.3 | 145.1 | 163.8 | 172.0 | |||||||||
4VGA | 1280×960 | 4800 | 45.0 | 51.2 | 51.2 | 108.8 | 122.9 | 172.0 | ||||||||||
SXGA | 1280×1024 | 5120 | 42.2 | 48.0 | 48.0 | 102.0 | 115.2 | 172.0 | ||||||||||
525 16SIF | 1408×960 | 5280 | 46.5 | 46.5 | 98.9 | 111.7 | 172.0 | |||||||||||
16CIF | 1408×1152 | 6336 | 38.8 | 38.8 | 82.4 | 93.1 | 155.2 | |||||||||||
4SVGA | 1600×1200 | 7500 | 32.8 | 32.8 | 69.6 | 78.6 | 131.1 | |||||||||||
1080 HD | 1920×1088 | 8160 | 30.1 | 30.1 | 64.0 | 72.3 | 120.5 | |||||||||||
2Kx1K | 2048×1024 | 8190 | 30.0 | 30.0 | 63.8 | 72.0 | 120.0 | |||||||||||
2Kx1080 | 2048×1080 | 8704 | 60.0 | 67.8 | 112.9 | |||||||||||||
4XGA | 2048×1536 | 12288 | 48.0 | 80.0 | ||||||||||||||
16VGA | 2560×1920 | 19200 | 30.7 | 51.2 | ||||||||||||||
3616x1536 (2.35:1) | 3616×1536 | 21696 | 27.2 | 45.3 | ||||||||||||||
3672x1536 (2.39:1) | 3680×1536 | 22080 | 26.7 | 44.5 | ||||||||||||||
4Kx2K | 4096×2048 | 32768 | 30.0 | |||||||||||||||
4096x2304 (16:9) | 4096×2304 | 36804 | 26.7 |
改訂版H.264/AVC教科書、p183※この「明示的な指定」は、x264cli、VUI設定の--overscanで行う(参考1, 2)。
※太字オレ
例 えばHDTVの場合、走査線の数は1080本です。これに対してH.264/AVCでは垂直、水平方向とも16画素の倍数で ないと符号化できません (1080本は16の倍数ではない)。例えば、1088本(16の倍数)を符号化した場合、8ラインを捨てて表示する必要がありますが、この場合、クロッ ピング処理によって、ビットストリーム中でどの上下8ラインを捨てるのかを明示的に指定する事ができます。
Introduction paper to H.264/MPEG-4 AVC includingthe Fidelity RangeExtension. (PDF)
2. 符号化ツール(試訳)
各ピクチャは一個以上のスライスに分割することで圧縮される。各スライスはマクロブロックからなる。さらにこれは16x16ピク セルの輝度サンプ ルと、それに対応する輝度サンプルからなる。しかしながら(*これまでとは異なり*)各 マクロブロックは、動き補償予測の為に、さらにサブ・マクロブロック・パーティションに分割される。予測パーティションのサイズは7種類となる。 – 16x16, 16x8, 8x16, 8x8, 8x4, 4x8 そして4x4だ。これまでの規格では、動き補償はマクロブロックを丸ごと使うか、新しめの規格では16x16 か8x8パーティションを使った。従って、パーティションの形にバリエーションが増えたという事は、予測精度の向上をもたらす。次に、残ったデータは 8x8(FRExtでしか使えない)か4x4で空間軸変換される。過去の主要規格ではこの変換ブロックサイズは8x8のみだった。4x4ブロックサイズの 採用で残りの差分信号の精度が向上する事になる。空間軸変換のブロックサイズは常に予測に使われるブロックサイズと同じか、より小さい。ビデオシークエン スのシークエンスからサンプル(*原注:ここでは特にサンプルとピクセルを区別しないが、厳密にはサンプルが正しい。)に至る階層構造は以下のようにな る。
シークエンス(ピクチャ(スライス(マク ロブロック(マクロブロック・パーティション(サブ-マクロブロック・パーティション(ブロック(サンプル))))))
ニコンシステム(株)H.264 解析ツールNH264H1のpdf※これらから、4x4や8x8は16x16に対するサブ区分と思われる。一番右下、田の字型に分割されてるのが8x8だと思う。
http://www.nikon-sys.co.jp/products/index_1_1.htm
MEncoder Document/ DVD映像を高画質なMPEG-4 ("DivX")にする方法/効果的にエンコードするための制限事項(試訳)※Xvidやlibavcodec mpeg-4では、入力映像の縦横が16の倍数でなかった場合、勝手に16の倍数まで映像領域が「あるものとして」エンコードする。
最 高画質を追求する場合、MPEG系圧縮の特徴からくるいくつかの制限事項を守る必要があります。MPEGは映像をマクロブロックと呼ばれる16x16の正 方形に分割します。各マクロブロックは、輝度(強度)情報を表す4個の8x8ブロックと、2個のハーフ・レゾリューション8x8ブロック(red- cyan 軸とblue-yellow軸)で構成されます。手許の動画の横幅と高さが16の倍数でない場合でも、エンコーダは映像全体をカバーできるだけの 16x16マクロブロックを使うので、余聞な無駄が出ます。
ですので、目標ファイルサイズの範囲で最高画質を求める場合は、16の倍数以外の縦横は使わないようにしよう。
2ch/DTV/x264 rev7(2006年11月下旬~12月上旬)※画質的な問題を感じている人はほとんど無いようだ。
- やっぱり16の倍数じゃないとダメっぽいとあったのですが、みなさんは16:9の映像の場合どのような解像度にしています か?
- 704x480(DVD左右クロップ) --sar 40:33
- 自動的に無効領域が追加されて16の倍数になるから問題なし
- 俺も気にしてないな。画質は全然落ちないし
- 俺は気にしてる。16の整数倍にしないとなんとなく暗部とか薄いグラデーションとかでブロック ノイズ増える気がする。ただの気のせいかもしれないけど。
- 画質に関しては関係ないと思うけど、16の倍数だと動画の圧縮率や精度が向上するのは確かだと 思うよ
MPEG-4規格は"マルチタレント"、あらゆるニーズに応える事を狙っていますので、方式が 3つあります:
1)ビデオビットストリームレベルで指定する方式:
現時点ではこれが最も実用的で、広く使われているやりかたでしょう。PARを指定できるコデック(例:3ivx、ffmpeg/ffvfw、XviD)を
使って、出来上がったAVIをMP4 muxerでMP4にmuxします。この場合、MP4 muxerはなんでも構いません( 3ivx
mp4 muxer, MP4Box or mp4UI)。
既にエンコード済みのビットストリームのPARを変更するには、MPEG-4 ASPではMoitahの MPEG4 Modifier、AVCでは hhanhの ARChange
を使います。もっとも、MP4BoxではどちらのフォーマットでもPARを変更できます。
自動アナモルフィック再生に対応したプレイヤは、VideoLAN、MPlayer。DShowでは、3ivx、Nero か Haali
parsers と XviDの組み合わせ(ARをautoに)、3ivx("force overlay"を使う)、Nero か
ffdshow("overlay mixer"を使う)のdecoder filter。
MP4
では"Composition
Matrix"を使う方式も定義しています。これはアスペクトレシオを変更したり、ピクチャを回転させたり、複数のレイヤーを扱ったり、再生中にオーディ
オストリームを二個ミックス(台詞と音楽が分離している映画など)したり、、、、。
Quicktime/Pro
ではこうしたたくさんのcompositionを扱う事ができます。Movie -> Get Movie
Properties -> Video/Sound Track -> Size/Layer/Volume/...
。またそうしたcompositionを持つMP4ファイルを正しく再生できます。
最も幅広いオーサリングができる方式です(Q9)。AR の変更もできます(例えばTransform2D.scaleを使うなど)。BIFS control streamの作成と再生にはGPAC project tools、つまりMP4BoxとOsmo4を使いましょう。
はい。
タイムコードファイルを使います。これをMP4ファイルにくっつけるか、ASPならn-vopsをドロップさせます。
MP4の大きなアドバンテージの一つは相互運用性と、オープ ン規格な事(ライセンスフリー!)です。これをサポートする非常にたくさんのツールが、全てのプラットフォームで出ています。Mac、Linux、 PocketPC、そしてもちろん Windows。
まず始めに以下の二つが必要です。
splitter/parser filter:再生中に、コンテナファイルを内蔵するストリームに分割するもの(audio, video, subtitles)。
decoder filter:エンコードされたストリームをデコードするもの(例えば ffdshow、3ivx、CoreAAC)。
話がずれますが、AVI用のsplitterをインストールする必要が無いのは、デフォル トでwindowsに入っているからです。
話を戻して、こうしたフィルタを含んだパッケージが入手可能です。MP4のストリーミングについては、Apple
と MPEG4IPが無償で良いツールを公開しています。
ストリーミングサーバとしては、Appleの Darwin Streaming Serverが使えま
す。ガイドはeverwicked とlinuxjournalにあります。
ライブストリー
ミンでは、Linuxのみですが、MPEG4IP の mp4live
が使えます。ガイドは everwicked と MPEG4IPにあります。Windowsでは MPEGRecorder
が使えます(どうやらmp4liveのポートのようです)。
ViTooKi
の toolも試すと良いでしょう(オープンソースのストリーミングサーバ、Player、その他)
Cata
からも、オープンソースのMP4ストリーミングサーバが出ています。
MAC では Live
Channel を見て下さい。
ストリーミング放送の
MP4を再生するには、AppleのQuicktime、RealのRealPlayer
10、MPEG4IPの WMP4Player、Dicasの mpegableおよび EnvivioTV (この二つは dshow
playerです)そしてGPACの Osmo4 (最後の二つは streamed advanced
content/user interactivitiyもサポートしています(Envivioのインタラクティブ・デモ))。
また、 MediaFrame
(demos)
と IBM (interactive demos)のjava
appletを使うと、プレイヤをインストールしなくてもMP4ストリーミングを再生できます!。
MPEG-4規格はAVC/H.264で最新で、技術的にも素晴らしく、state-of-the-artのビデオ符号化フォーマットです。
AVC/H.264 ビデオ符号化規格は2003年に二つの団体で策定されました。ISOのMPEGとITUのVCEG です。ITUは国連の下部組織で、H.263フォー マット(主にビデオ会議のソフトに使われてい ます)を策定した機関です。
AVC/H.264 規格そのものの開発はJVTが 開発にあたりました。これにはMPEG とVCEGの専門家が参加しています。
MPEGサイドから見ればこの規格は MPEG-4 Part 10 (ISO 14496-10)、ITU サイドから見ればH.264 (ITU の文書番号)。 AVC(Advanced Video Coding)という "正式な" タイトルはMPEG側がAACと 並べた時のバランスを考えてつけたものです。
AVC/H.264規格は4種類のプロファイルを定義しています。Baseline、Main、 Extendedお よびHigh Profile。この下にさらにレベル(*参考)による分類があります。
DVD バックアップには、High Profileを次項の符号化ツール(* 要素技術*)と一緒に使うのが一番向いているようです。
MPEG-4 ASP (*試訳)の符号化ツールも読んで下さい。GMC以外はAVCでも使えます。
AVC/H.264では、ビットストリームの記述方式(マクロブロック・タイプ、モーションベクトル+参照インデックス、、、)に、 MPEG-4 ASPより先進的なエントロピー符号化ツールを使います。二種類のエントロピー符号化が 定義されています。
CABACは、AVC/H.264デフォル トのCAVLC (別名UVLC)よりも強力な圧縮方式で、ビットレートを約10~15%節約できると言われています(特に高ビットレート時)。CABACもCAVLCも ロスレスで画質低下が一切ありません。し かしエンコードとデコード速度は低下します。
Loop/Deblocking Filter:(他に、インライン フィルタ、インラインデブロック、などとも)
プレフィルタ(例えばavisynthが行う エンコード前のフィルタリング)や、ポストプロセス/フィルタ (デコーダが最終出力前に行うもの)に対して、ループフィルタはエンコード工程の中で、各フレー ムがエンコードされた後にかけるものです。
厳密にはエンコードの 後、但し、後続フレームの為の参照フレームとして使われる前 の時点です。これは特に低ビットレート時のブロックノイズ減少に効果があります。しかし、エンコードとデコードは遅くなります。
Variable Block Sizes/Macroblock Partitions:
MPEG-4 ASPでは、イ ンター4V、またはインター4MVを使うと、16x16~8x8ピクセルの間でブロックサイズを変える事ができました。
AVC/H.264 では、モーションサーチの精度を決めるマクロブロックの大きさを、4x4ピクセルまで下げる事を提案していま す。これは、8x4のように段階的に下げて行く事もできます。ブロックサイズは映像内容に応じて可変です。
各マクロブロックにどの 程度のブロックサイズを与えれば最も効果的か、その判断 が賢いものが良いエンコーダと呼ばれるでしょ う。
Multiple Reference Frames:
MPEG-4 ASPでは、参照フレームにできるのは直前のフレームのみでした。
AVC/H.264のインター・モーション・サーチでは、複数の 候補から参照フレームを選べるようになりました。
つまり、ビデオコデックはASPのようにシンプルに直前フレームを参照するか、そ れとももっと前のフレームを参照するか自分で 決められると言う事です。 例えば、Pフレームは直前のIフレームよりももっと前のフレームを参照できます。
このため、新しいタイプのIフレームが必要になり ました。IDRフレームです。これはIフ レームの一種ですが、後続のフレームに自分よりも前を参照する事を禁止します。複数参照フレームを使うとエンコード、デコード速度は低下し、カットも IDR フレーム単位でしかできなくなります。
Weighted Prediction:
Weigthed Predictionを使うと参照フレームに「重要性」を付ける事が出来ます。例えば、直前の映像を(ブライトネス方向に) スケーリングできます。
これは特にフェードのある場面、後続の映像が直前の映像によく似ている場合に効果的で す。
明転で明るさが増す場合は除きます。また、フェードを使った場面転 換のような、クロスフェードには効果がありません。
Rate Distortion Optimisation (RDO):
RDO を使うと、エンコーダは2種類の選択肢があるような場合に、それがいかなる局面であれ、最も効率の良い符号化方式を選べるようになり ます(例えば インター符号化とイントラ符号化のどちらを選ぶか、モーションサーチ方式の選択、などなど)。
RDO はAVC/H.264 仕様書の定義にありません。しかし、この新しいアプローチを最初に導入したのはH.264レファレンスソフトウェア(JM)です。他のコデックもRDOを 組み込む事が出来ます。例えば、既にRDOを装備しているXviDのVHQモードのように。
現 在入手可能なAVC/H.264の実装は以下の通りです。
x264、Nero、Apple、Sorenson、Elecard、Moonlight、VSS、mpegable、Envivio、Hdot264 (binary)、DSPR、JM (レファレンスソフト) (binary)、ffmpeg、Philips、FastVDO、Skal、Sony、その他いろいろ。
現 在の実装の中には非常に低速なものがあります。
現在、x264とNeroDigitalの AVCエンコーダは良い速度と画質を実現しているように見えますが、AVCが非常に先進的なビデオ符号化形式である事に変わりはなく、古いCPUでの エンコード・デコードは非常に時間のかかるものになるでしょう。
DVD フォーラムとBlu-rayディスクアソシエーションが現在一般的なDVD フォーマットの後継を目指して活動しています。これはいわゆる High Definition コンテンツ (現行DVDより大きな映像サイズ)と呼ばれる物で、名称をHD-DVD と BD-ROMと言います。
HD-DVDでは、 MPEG-4 AVC/H.264は対応必須のビデオコデックです(こ こに書かれている通り)。
Blu-rayも、MPEG-4 AVC/H.264をビデオコデックに含めました(こ こ(pdf直リン)にあるように)。
以上の事から、AVC/H.264 は、現在DVDの中で使われているMPEG-2 のように、広くサポートされる次世代ビデオフォーマットになるものと思われます。