面倒なので毎度は書いていませんが、自分はx264も
MEncoderも万人向けと言うつもりはありません。JPEG2000やPNGのようにどマイナーな地位にとどまる可能性もあると思いま
す。いずれにせよ、iTunesのCDリッピングくらいの手軽さがなければひとさまにお奨めできるものではな
いです。エンコードそのものが
実
時間の1/3を切るまでは、マニアの遊びでしょう。
◆◇◆
1.
はじめに
動画エンコードにおいて、画質、速度、ファイルサイズは相互に矛盾する要求です。
画質「だけ」を追求するなら無限のファイルサイズが必要です。あまり大きくては圧縮の旨味が薄れます。
MPEG-1/2/4はどれも、ある程度の画質を諦めてずっと小さなファイルサイズを実現するものです。劣化は必ずあります。
画質劣化を食い止めるにはある程度複雑な処理が必要です。これは時間がかかります。
最終的にどれを重視するかは
人それぞれな
ので正解はありません。が。
このエントリでは、何
を重視するにせよ最初に必要となるのは
「いかに高いレベルで妥協するか」という精神だ。と
言い切ってみます。
その上で、自分が心がけている基本的な事柄を書いてみます。かなり抽象的なものになると思いますが、よろしければお付合い下さい。
『国産ロケットはなぜ墜ちるのか』151p
理工系とひとくくりにされがちだが、理と工の差は、通常想像されるよりもはるかに大きい。理学は自然を理解する事を目的とする
学問で、その基本には「妥
協なき真理の追究」という態度がある。それに対して工学は、理解した自然の力を応用する学問であり、基本にあるのは「い
かに高いレベルで妥協するか」とい
う精神だ。
要するにこの本が面白かったんでなんか書いてみようと^^;。
2.
妥協の前には理想が要ること
「妥協」の前には
「理想」が必要です。理想の無い妥協は迷走
ですから。
 |
- 画 質:素材と同じ。
- 速 度:一瞬。
- サイズ:限りなく小さく。
100=100点だと思ってください。 |
現実にはこれは有り得ません。しかし、要素分解がミソです。多くても大変なのでとりあえずここでは三
つで。この青い三角ができるだけ大きくなるようにあれこれ工夫して
「望み得る最善」に近づい
ていくわけです。
大雑把でも理想がないと、自分の妥協が適切なものかどうかがわかりません。そもそも何を・どの程度差
し出せば何を得られるのかが、いくらやっても見えてきません。漫然とエンコを繰り返してもストレスが溜まるばかりです。雑で充分です。
まず理想。
後は手数を重ねれば重ねる程、問題点が整理され、その姿がより明確になっていきます。決してそこに手が届く事はありません。が、習得効率は上がります。
余談ですが「理
想を要素分解して考える」ことは、 様々なケースで使えると思います。QuickTimeかlinuxインフラか、3ivxか
Apple-H.264か、ffmpegか
MEncoderか、などなどなど。一番重要なエンコツールは、たぶん自分自身です。
繰り返しますが、たかが動画エンコにわざわざこんな面倒を考えるのは万人向けではありません。あくまでそれ自体を楽しめる人向けの遊びだと思います。
3.
必要のないものに深入りしないこと
ここから先は
MPEG-2
PSのアナログTVキャプチャをMEncoderのx264で、2passを使って、rawvideo.264に吐き出す前提で
書いて行きます。
最初に書いたように、画質・速度・サイズは相互に矛盾する要求です。それでなくても動画エンコは面倒の連続です。
なにか最初に「固定条件」
を作ってしまうと、多少は
他の要素の見通しが良くなります。ではもっとも固定しやすい条件は何か?
画質や速度はやってみなければわからない部分が大きいですし、速度はCPUに、画質は
様々な要素に左右されます。またこれらは目標を決めたところ
で確実に守れるものでもありません。
最も固定しやすい(そして誰が見ても比べやすい)条件はファイルサイズで
しょう。 これは解像度とビットレートで決まります。
3.1. まずは解像度。手許では横幅640で固定しています。
解像度 |
横幅 |
高さ |
画素数 |
4:3 |
640 |
480 |
約30万画
素 |
16:9
(ビスタ) |
640 |
352 |
約22万画
素 |
シネスコ |
640 |
272 |
約17万画
素 |
2006秋現在、世間的には720x480や704x480の人が多いようです。
もともと720x480は普通の4:3や映画の16:9のどっちにも使え
ると言
う事で決まった中間解像度なので、正直に720x480で表示すると人間がデブになったりノッポになったりします。もちろん通常は再生時にソフト/ハード
が4:3なり16:9
なりに拡大・縮小してくれるので問題はありません。が、
手許で縮小している理由は以下:
- 再生時に使う拡大・縮小アルゴリズムは当然リアルタイム
でなければなりません。ですから性能もそれなりです。どのみち視聴時には720x480のサイズでは無い。と割り切って、MEncoderでもう少し優れた拡大・縮小アルゴリズムを使っています。
- 720x480と640x480では5万画素ほど違います。そのぶん速度も、圧縮効率
も向上します。
- TVキャプチャで入りがちな黒帯をなるたけcropしたいという理由もあります。そのぶん速度も、圧縮効率
も向上します。
なお、16:9以下では高さの数値が正確な比率になっていませんが、これは縦横とも16の倍数でなければならないというMPEG-1/2/4の基本原則
に従っています。
720x480や704x480でエンコして、拡大・縮小は再生時に行うと言う事は、映
像データをできるだけ弄らない、という事です。できるだけ弄らないという事は、素材に対する忠実度が高い~画質が良い~事に繋がります。未来のプレイヤ
(ハード・ソフト)に期待している、とも言えます。
3.2 次に、ビットレート。手許では一律に1024kbpsで揃えています。
1024kbpsのx264映像と128kbpsのaac音声を.mp4に突っ込んだ場合、30分番組が概ね250MB、
CMカットして24分なら200MBになります。
これは出来上がりサイズのキリの良さで選んでいます。
他に、
Doom9
の投票でこのくらいのビットレートがもっとも多い事。北米ではいまだに映画の1CD化が主流なのかなんなのかは解りませんが、これ
はx264は1000kbpsあたり
のビットレートで最も多くテストさ
れており、従ってその付近で最も安定した性能を発
揮するようチューニングされている筈だと考えています。特に、オプションからは弄れない部分が、です。
また、最新のHDレコーダでは4MbpsのMPEG-2でも
まぁまぁ見れる画質と言いますから、これよりはうんと縮めたいところでもあります。
3.3 最後に、2パスしか使わない理由
これは、
特定のビットレート制限の範囲で
「望み得る最善の画
質」を要求するなら最低でも2パスが必要だからです。
この解像度とビットレートが万人向けかどうかは良く解りません。もともと画質を基準に決めたわけでは無い事に注意して下さい。単に見通しをよくする為
です。
特定の解像度とビットレートの範囲でビットを有効に使う=1bitあたりの画質を追求するアプローチについてはMEncoderドキュメントの『
DVD映像を高画質なMPEG-4 ("DivX")にする方法』を参考に
しています。
4.
検証のない経験は非効率なこと
理想の構成要素のうち、面倒なものや自分に必要のない部分を固定すると、それ以外の部分、~例えば
x264のオプション~、に集中する事ができま
す。
2005年10月から2006年10月現在まで、手許では地アナ録画のMPEG-2全てを2パス,
1024kbps、横幅640でx264+
aac.mp4にエンコード
していま
す。
その条件下での画質は概ね以下の通りです。
種類 |
Avg QP(p) |
主観画質(通常視聴) |
アニメ |
4:3
(640x480)は18~23程度
16:9(640x352)は14~18程度 |
良好
良好 |
実 写 |
落語:ノイ
ズが酷くなければ20~23。ノイズが酷い場合は28程度。
サッカー:ノイズが少なくても28付近。 |
不満・着物
や顔のディテイル
充分 |
映 画 |
内容やノイ
ズにより
様々。最悪で28程度。 |
素材により
様々 |
Avg
QP(p)と言うのはPフレームに適用された量子化値です。低いほど画質が良いので「画質劣化度」くらいに思っても良いと思います。
ビットレート制限がある場合は、MEncoderがひとこまひとこま「画質劣化度」を調節して指定サイズに収めてくれるわけです。
ffmpegXの作者さんはAvg
QP(p)=20以下を無駄に高画質としていますが、実写素材ではビットレートを上げるなどしてもう少し低めのQPを狙っても良いかも
しれ
ません。
なお、手許ではエンコード設定と数値的な結果をテキストに書き出すシェルスクリプトを
作り、毎回それを読んでいます。表計算に要点を書くのは結構サボりますが、記憶・経験・主観的な印象だけだとどうしてもあやふやになるの
で、できるだけ数値的な結果を読む。違和感のある数字が出たら、なぜこの番組はこうなるのか考える、、、これで
意外な事に気が付くこともあります。
ソースコードは読めませんし、理屈を読んでもろくに理解できないので、
少しでも効率よく経験値を稼ごうと思って始めた筈だったんですが、もはや番
組よりログ見るほうが楽しみなカラダに、、、。
5.
おわりに
しつこいですが、動画エンコなんてものは所詮、マニアの遊びです。
ほんの少し、自分の服を自分で作るのに近いんじゃないかと言う気もします。そんで気が付いたらミシンの分解組立てにハマってやんの。うお、今度の新型は
ボタン付けができ
るぞスゲェ!みたいな。地アナのインタレ縞が見えるとか地デジのブロックノイズが見えるとか。あんま意味ないです。所詮、マニアの遊びです。
ここに書いたのはホンの一例で、実際には全くもって
自由で
す。それぞれの
「望み得る最善」を探してみて下さい。
遊びはマジにやらなきゃ面白くないです。
スポンサーサイト