WO1999031886A1 - Image encoding method and device - Google Patents

Image encoding method and device Download PDF

Info

Publication number
WO1999031886A1
WO1999031886A1 PCT/JP1998/005626 JP9805626W WO9931886A1 WO 1999031886 A1 WO1999031886 A1 WO 1999031886A1 JP 9805626 W JP9805626 W JP 9805626W WO 9931886 A1 WO9931886 A1 WO 9931886A1
Authority
WO
WIPO (PCT)
Prior art keywords
pull
encoding
pattern
down pattern
stability
Prior art date
Application number
PCT/JP1998/005626
Other languages
English (en)
French (fr)
Inventor
Masaaki Isozaki
Atsuo Yada
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Publication of WO1999031886A1 publication Critical patent/WO1999031886A1/ja
Priority to US09/374,134 priority Critical patent/US6275528B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive

Description

明 細 書 画像符号化方法及び装置 技 術 分 野 本発明は、 ビデオ素材を符号化する画像符号化方法及び装置に関 し、 特に、 プルダウン変換された入力ビデオ素材のプルダウンパ夕 ーンに基づいて符号化を行う画像符号化方法及び装置に関するもの である。 背 景 技 術 ビデオ情報を D V D ( D igital Versati le Disk, Digital Video Disk) やビデオ C Dのようなパッケージメディァに蓄積する際に、 ビデオ情報に圧縮符号化処理を施すェンコ一ドシステムでは、 まず、 ビデオ素材の画像の符号化難易度 (diff iculty) を測定し、 次に、 その符号化難易度に基づいてパッケ一ジメディァの記録容量の範囲 内の与えられたバイ ト数に収まるように、 各ビデオ情報のフレーム ごとにビッ ト配分 (B it ass ign) 処理を行うエンコード方法が一般 に採用されている。 以下、 このエンコード方法を 2パスェンコ一デ ィ ング方法という。
図 1は、 ビデオ情報を圧縮符号化して D V D等のォーサリングな どを行うために用いられる、 従来のビデオェンコ一ドシステムの構 成例を示している。 スーパーバイザ 1 0 3は、 ビデオエンコー ドシステムの全体を管 理するものであり、 ビデオ, オーディオ, メニューなどの各ェンコ ードシステムにェンコ一ド条件を与え、 ェンコ一ド結果の報告を受 ける。 この例では、 ファイル 「v.enc」 によってビデオエンコード 条件が指定され、 ビデオェンコーダ側からはエンコード結果のビッ トス ト リームが書き込まれた R A I D (Redundant Arrays of Inexpensive Disks) 1 04上のアドレス 「v.adr」 と、 ビッ トス ト リームをマルチプレックスする際に必要なデ一夕 「vxxx.aui」 が報 告される。
主コン トローラ 1 1 1は、 ネッ トワーク 1 0 2を介して接続され るスーパ一バイザ 1 0 3との間のデータ通信により、 このビデオェ ンコ一 ドシステム全体の動作を制御する。
具体的には、 主コン トローラ 1 1 1は、 グラフィカルユーザ一ィ ン夕ーフエース (GU I : Graphical User Interface) 部 1 1 4の 管理により、 スーパ一バイザ 1 0 3からの制御を受け付けると共に、 ォペレ一夕の操作を受け付け、 この GU I部 1 1 4により管理され るビッ トアサイン部 1 1 5, エンコーダコン トロール部 1 1 6, V TRコン トロール部 1 1 7により、 エンコーダ 1 1 2 , ビデオテ一 プレコーダ (VTR) 1 1 0の動作を制御する。 これにより主コン トロ一ラ 1 1 1は、 スーパーバイザ 1 0 3から通知されたェンコ一 ド条件に従って、 処理対象の素材を符号化処理し、 その処理結果を スーパ一バイザ 3に通知する。 さらに、 主コントローラ 1 1 1は、 GU I部 1 1 4を介してオペレー夕の設定を受け付けて、 上記の符 号化の詳細な条件を変更できるようにされている。
上記の主コン トローラ 1 1 1の G U I部 1 1 4は、 ビッ トアサイ ン部 1 1 5のビッ ト配分プログラム 「BIT— ASSIGNj , エンコーダコ ン トロ一ル部 1 1 6のエンコーダコン トロールプログラム 「CTRL— ENC」 および VTRコン ト口一ル部 1 1 7の 丁1^コン トロールプ ログラムの 3つのプログラムを管理している。
また、 ビッ トアサイ ン部 1 1 5は、 スーパーバイザ 1 03から通 知されるエンコード条件のファイル 「v.enc」 に従って符号化処理 の条件をフレーム単位で決定し、 この条件による制御デ一夕をファ ィル形式 「CTL filej によりコン トロール部 1 1 6に通知する。 このとき、 ビッ トアサイン部 1 1 5は、 符号化処理におけるビッ ト配分 (ビヅ トアサイン) を設定し、 さらに設定された条件をオペ レー夕の操作に応じて変更する。 さらに、 ビッ トアサイン部 1 1 5 は、 デ一夕圧縮されたビデオデ一夕 D 2が RA I D 1 04に記録さ れると、 そのビデオデータ D 2が書き込まれた; RA I D 1 04上の アドレスのデータ 「v.adr」 を、 後段における多重化処理に必要な デ一夕量等の情報 「vxxx.aui」 と共にスーパ一バイザ 1 03に通知 する。
エンコーダコン トロ一ル部 1 16は、 ビッ トアサイン部 1 1 5か ら通知される制御ファイル 「CTL filej に従ってエンコーダ 1 1 2 の動作を制御する。 さらに、 エンコーダコン トロール部 1 1 6は、 符号化処理に要する符号化難易度 「difficulty」 のデータをフレー ム単位でビッ トアサイン部 1 1 5に通知し、 R A I D 1 04にビデ ォデ一夕 D 2が記録されると、 その記録アドレスのデ一夕 「v.adr」 , 後の多重化処理に必要なデ一夕 「vxxx. auij をビッ トアサイン部 1 1 5に通知する。
V T Rコン トロール部 1 1 7は、 スーパーバイザ 3から通知され る編集リス 卜に従ってビデオテープレコーダ (V T R ) 1 1 0の動 作を制御し、 所望の編集対象の素材を再生する。
ビデオテープレコーダ (V T R ) 1 1 0は、 主コン トローラ 1 1
1を介してスーパ一バイザ 1 0 3から通知される編集リス 卜に従つ て、 磁気テープに記録されたビデオデータ D 1を再生してェンコ一 ダ 1 1 2に出力する。
エンコーダ 1 1 2は、 スーパーバイザ 1 0 3から主コン トローラ
1 1 1 を介して通知される条件に従って動作を切り換え、 V T R 1
1 0から出力されるビデオデータ D 1を、 M P E G (Moving Picture Experts Group) の手法により圧縮符号化する。
このとき、 エンコーダ 1 1 2は、 符号化処理の結果を主コン ト口 —ラ 1 1 1に通知し、 主コン トローラ 1 1 1は、 そのデータ圧縮に おける符号化の条件を制御し、 発生するビッ ト量を制御する。 これ により、 主コン トローラ 1 1 1は、 データ圧縮により発生するビッ ト量をフレーム単位で把握できる。
また、 エンコーダ 1 1 2は、 2パスエンコードにおける事前のェ ンコード条件設定の処理時 (仮エンコード時) には、 単にビデオデ —夕 D 1をデータ圧縮して処理結果を主コン トローラ 1 1 1に通知 するだけであるが、 最終的なデ一夕圧縮処理時 (本エンコード時) には、 圧縮処理されたビデオデ一夕 D 2を R A I D 1 0 4に記録し、 さらにそのデータが記録されたァドレス, デ一夕量等を主コン ト口 ーラ 1 1に通知する。
モニタ装置 1 1 3は、 エンコーダ 1 1 2によりデータ圧縮された ビデオデ一夕 D 2をモニタできるように構成される。 このモニタ装 置 1 1 3により、 このビデオエンコードシステムでは、 オペレータ がデータ圧縮処理の結果を必要に応じて確認する、 いわゆるプレビ ュ一を行うことができる。 そして、 ォペレ一夕が、 このプレビュー 結果に基づいて主コン トローラ 1 1 1を操作して、 符号化の条件を 詳細に変更できるようにされている。
上述したように、 DVDでは、 ビデオデ一夕の圧縮方式として M PEG (Moving Picture Experts Group) を採用している。
MP E Gは、 動き補償予測による時間方向の冗長度を除去するこ とによりデータ圧縮する方式であり、 フ レーム内だけで符号化され る I (Intra) ピクチャ, 過去の画面から現在を予測して符号化さ れる P (Predictive) ピクチャ, 過去の画像と未来の画像とから現 在を予測して符号化される B (Bidirectionally Predictive) ピク チヤの 3種類の符号化画像が用いられる。
また、 これらの画像は、 Iピクチャを必ず 1つ含むまとまりであ る GOP (Group of Pictures) とされる。
図 2は、 G 0 P構造の一例を示している。
この例では、 1つの GO Pを構成するピクチャ (フレーム) の数 Nが 1 5である。 GOPの各ピクチャが表示される順序は、 符号化 される順序とは異なっており、 表示順における GO Pの先頭のピク チヤは、 Iピクチャの前であって Pピクチャまたは Iピクチャの次 にある Bビクチャである。 また、 表示順における G〇 Pの最後は、 次の Iピクチャの前にある最初の Pピクチャである。
次に、 2パスエンコードについて、 図 1に例示のビデオェンコ一 ドシステムの構成を参照しながら説明する。
図 3は、 上記のビデオェンコ一ドシステムにおける 2パスェンコ ―ドの基本的な処理手順を示している。 まず、 ステップ S 5 1で、 スーパーバイザ 1 0 3からネッ トヮ一 ク 1 0 2を経由して、 ビデオ情報に割り当てられるビッ ト総量ゃ最 大レートなどのエンコード条件 「v . enc」 が与えられ、 エンコーダ コン トロール部 1 1 6はこのェンコ一ド条件に従って設定される。 次に、 ステップ S 5 2で、 エンコーダコン トロール部 1 1 6が、 エンコーダ 1 1 2を使ってェンコ一ド素材の符号化難易度 (diff iculty) を測定する。 ここでは、 素材の各画素の D C値や動きべク ト ル量 M Eも併せて測定される。 そして、 これらの測定結果に基づい てフアイルが作成される。
実際の符号化難易度の測定は、 以下のように行われる。
ェンコ一ド素材となるビデオ情報は、 マス夕一テープであるディ ジ夕ルビデオカセッ 卜から V T R 1 1 0により再生される。
エンコーダコン ト口ール部 1 1 6は、 エンコーダ 1 1 2を介して、 V T R 1 1 0により再生されたビデオ情報 D 1の符号化難易度を測 定する。 ここでは、 符号化の際に量子化ステップ数を固定値に設定 して発生ビッ ト量が測定される。 動きが多く、 高い周波数成分が多 い画像では発生ビッ ト量が多くなり、 静止画や平坦な部分が多い画 像では発生ビッ ト量が少なくなる。 この発生ビッ ト量の大きさを符 号化難易度としている。
次に、 ステップ S 5 3では、 ステップ S 5 1で設定されたェンコ —ド条件によってステップ S 5 2で測定された、 各ピクチャの符号 化難易度の大きさに応じて、 エンコーダコン トロール部 1 1 6が、 ビッ トアサイン部 1 1 5内のビッ ト配分計算プログラム 「B IT— ASSIGNj を実行し、 割り当てビッ ト量 (夕一ゲッ ト量) の配分計算 を行う。 そして、 ステップ S 5 4で、 上記のビッ ト配分計算の結果を使つ て仮エンコードを行い、 エンコーダ 1 1 2に内蔵されている口一力 ルデコーダ出力の画質によって、 本ェンコ一ドを実行するかどうか をオペレー夕に判断させるようにする。
実際には、 上記のビッ ト配分によるビヅ ト ス ト リームを R A I D 1 0 4に出力しないで、 オペレー夕が、 任意の処理範囲を指定でき るモードであるプレビュー (Preview) モードで画質が確認される。 そして、 ステップ S 5 5で、 画質評価が行われ、 画質に問題があ る場合 (N G ) にはステップ S 5 6に進み、 問題がある部分のビッ トレートを上げたりフィルターレベルを調整するといつた画質調整 のためのカス夕マイズ作業を行った後に、 ステップ S 5 7でビッ ト 配分再計算が実行される。
その後、 ステップ S 5 4に戻り、 カス夕マイズされた部分がプレ ビューされ、 ステップ S 5 5で画質が確認される。 ここで、 全ての 部分の画質が良好であればステップ S 5 8に進み、 エンコーダ 1 1 2によって、 ステップ S 5 7で再計算されたビッ ト配分による素材 全体についてのェンコ一ドが実行される。
一方、 ステップ S 5 5で、 画質に問題がないと判断された場合に は、 そのままステップ S 5 8に進み、 エンコーダ 1 1 2により、 ス テツプ S 5 3で計算されたビッ ト配分によるェンコ一ド処理が実行 される。
そして、 ステップ S 5 9で、 ェンコ一ド結果であるビッ トス ト リ —ムが S C S I ( Smal l Computer System Interface ) 等を介して R A I D 1 0 4に書き込まれる等の後処理が行われ、 2パスェンコ ―ド処理が終了する。 ステップ S 5 8におけるエンコー ドの実行後、 ビデオエンコーダ コン トロール部 1 1 6は、 上述したようなェンコ一ド結果の情報を ネッ トワーク 1 0 2経由でスーパーバイザ 1 0 3に報告する。
なお、 この図 3の各ステップのうち、 ステップ S 5 2, ステップ S 5 4およびステップ S 5 8を除く各ステップの処理は、 オフライ ンで行われる。
次に、 上述した 2パスエンコーディ ングにおいて、 ビッ トアサイ ン部 1 1 5で実行されるビッ ト配分計算についてさらに説明する。 図 4 A〜図 4 Gは、 ビッ ト配分計算における余り ビッ トの処理例 を示している。
まず、 ディジタルビデオディスク (D V D ) などのパッケージメ ディァの記録容量のうちのビデオ情報に割り当てられるビッ ト総量 「QTY_BYTES」 (図 4 A ) および最大ビッ トレート 「MAXMTE」 が、 スーパーバイザ 1 0 3から指定される。
これに対して、 エンコーダコン トロール部 1 1 6は、 ビッ トアサ イ ン部 1 1 5内のビッ ト配分計算プログラム 「B I T_ASS I GN」 を実行 し、 まず、 最大ビッ トレート 「MAXRATE」 以下になるように制限が 加えられた総ビッ ト数 「USB_BYTES」 を求め (図 4 B ) 、 この値か ら G O Pのヘッダ (Header) に必要なビッ ト数 「T0TA HEADERj を 引いた値と、 素材全体のフレーム総数から夕ーゲッ ト数の総和の目 標値となる 「 SUPPLY— BYTES」 を算出する (図 4 C ) 。
そして、 この 「SUPPLY_BYTES」 の大きさに収まるように、 各ピク チヤへの割当てビッ ト量 (夕ーゲヅ ト量) が配分される。 全てのピ クチャへの割当てビッ ト量の総和を 「TARGET_BYTES」 とすると、 図 4 D〜図 4 Fに示すように、 夕ーゲッ ト数の総和の目標値 「SUPPLY — BYTES」 から、 上記の 「TARGET— BYTES」 を引いた値が、 ビッ ト配分 の際の余り (Remain) を示す量 「REMAIN_BYTES」 となる。
そして、 図 4 Gに示すように、 「TARGET_BYTES」 と Headerの和が 「TARGET_OUT_BYTES」 とされる。
図 5は、 図 3のステップ S 5 3における、 ビッ ト配分計算処理の 手順の一具体例を示している。
まず、 ステップ S 6 1で、 前述したようにスーパ一バイザ 3から 送られるビッ ト総量 「QTY_BYTES」 と最大ビッ トレ一ト 「MAXRATE」 が入力される。
次に、 ステップ S 6 2で、 図 3のステップ S 5 2で作成された符 号化難易度 (d i ff i cu lty) の測定結果のファイルがそのまま読み込 まれる。
そして、 ステップ S 6 3で、 符号化難易度と共に測定された各画 像の D C値や動きべク トル量 M Eの大きさのパラメ一夕の変化量か ら、 シーンが変化するポイン トが検出される。
なお、 このステップ S 6 3におけるシーンチェンジの検出/処理 には、 本件出願人がすでに日本国特許出願の特願平 8— 2 7 4 0 9 4号の明細書および図面にて開示した 「映像信号処理装置」 におけ るシーンチェンジ点を検出するための処理を適用できる。 この 「映 像信号処理装置」 は、 映像信号の各フレームの直流レベルを検出し、 この直流レベルを曲線近似して得られる誤差値から、 その映像信号 のシ一ンチェンジのフレームを検出してシーンチェンジ点を明らか にするというものである。 そして、 シーンがチェンジしたとして検 出されたポイン トでは、 Pピクチャが I ピクチャに変更されて、 画 質改善が図られる。 次に、 ステップ S 6 4では、 チャプター (CHAPTER) 境界処理が 行われる。 D V D再生装置でのチャプターサーチ時には、 再生され るビクチャが、 特定されないピクチヤからジャンプしてく ることに なる。 その場合でも再生画像が乱れないようにするため、 このチヤ プ夕境界処理によってチャプターの位置が必ず G◦ Pの先頭になる ようにピクチャタイプが変更されたり、 G 0 P長が制限される。 ステップ S 6 5では、 上記の一連の作業の結果として変更された、 I ピクチャ, Pピクチャ, Bピクチャなどのピクチャタイプに合わ せた符号化難易度 (D ifficulty) の値に対して補間/補正が行われ る。
これは、 D V Dでは、 1 G O Pのデコード時の、 表示される最大 のフィールド数が制限されていることから、 ピクチャタイプの変更 に伴って G O P構造が変化したことにより 1 G O Pの長さがこの制 限を越えることがあるためである。 そのような場合には、 制限を満 たすように、 Pピクチャを I ピクチャに変更して G O P長が短くさ れる G◦ P制約処理が行われる。
ステップ S 6 6では、 ステップ S 6 5における補間/補正処理に よって得られた符号化難易度、 およびェンコ一ドされる素材全体に 与えられたビッ ト数 「 SUPPLY— BYTES」 に応じて、 各ピクチャごとの ターゲッ トビッ ト (Target bit) 数が計算される。
そして、 ステップ S 6 7で、 ェンコ一ド結果のビッ トス ト リーム を書き込む際の R A I D 4のアドレス (ADDRESS) を計算した上で、 ステップ S 6 8に進み、 エンコーダ用のコン ト口一ルファィルが作 成されて処理が終了する。
上記のような手順により、 素材の符号化難易度 (Diff iculty) お よび素材全体に与えられたビッ ト数 「 SUPPLY— BYTES」 に応じて、 各 ピクチャごとの夕ーゲッ トビヅ ト数が計算され、 エンコーダ用のコ ン トロールファィルが作成される。
以下では、 このような一連のビッ ト配分の手順について、 さらに 詳しく説明する。 ここでは、 ビッ ト配分の計算例として、 まず G O Pを単位としてビッ ト量が配分され、 その後、 各 G O P内で各ピク チヤの符号化難易度 (Difficulty) に応じたビッ ト配分が行われる ものとしており、 各 G 0 Pごとの符号化難易度の和である 「gop— di f f」 に応じて、 エンコード時の G 0 P単位のビッ ト割当て量 「gop— targetj が配分される。
図 6は、 この GO Pごとの符号化難易度の和 「gop— diffj とェン コード時の G〇 P単位のビッ ト割当て量 「gop_target」 とを変換す るための、 最も簡単な関数の例を示している。
この例では、 「gop_target」 を Y とし、 「gop— diff」 を X として、 Y = AX + B
という形で表される評価関数が用いられる。
許容される最大ビッ トレ一ト以下に制限された総ビッ ト数 「USB— BYTES j は、
USB— BYTES = min (QTY— BYTES - MAXRATE x KT
x total— frame—number) . · · ( \ ) で与えられる。 ここで、
N T S C方式の場合には、 KT = 1/8 (bits) /30 (Hz) ,
PA L方式の場合には、 1/8 (bits) /25 (Hz)
である。 また、 「totaし frame_number」 はエンコードされる素材の フレーム総数, min (s,t) は sまたは tの小さい方を選択する関数 である。 また、 ""DIFFICULTY— SUM」 は、 全てのピクチャの符号化難 易度の総和である。
SUPPLY— BYTES = USB_BYTES - TOTAL— HEADER . . . ( 2 ) DIFFICULTY— SUM = ∑ difficulty · . · ( 3 )
B 二 GOP_MINBYTES · · · ( 4 )
∑y = A x ∑x + Bx n
ここで、 ∑y = SUPPLY_BYTES, ∑ x = DIFFICULTY一 SUM, nは GO Pの総数である。 よって
A (SUPPLY一 BYTES - Bxn) / DIFFICULTY— SIM
となる。 従って、 各ピクチャのターゲッ ト量は、
gop— target 二 A x gop_diff + B · · · ( 5 ) で与えられる。
その後、 各 GO P内で各ピクチャの符号化難易度に応じたビッ ト 配分が行われる。 G 0 P内での各ビクチャの配分は符号化難易度の 大きさに比例させた場合には、 各ピクチャの夕ーゲッ ト量は以下の 式で求められる。
target (k) = GOP— TARGET x diffuculty (k) / G0P_diff
• · · ( 6 )
( 1≤k≤GO P内のピクチャ数)
そして、 このようなビッ ト配分計算の後、 エンコード結果のビッ トス ト リームが書き込まれる R A I D 4のア ドレスが設定され、 ェ ンコーダ用コン トロールフアイルが出力される。 このようにして作 成されたコン トロールファイルによってエンコード処理を行うこと により、 素材の画像の難しさに応じた可変ビッ トレ一トェンコ一デ ィ ングが実行される。 以上が 2パス可変ビヅ トレ一トェンコ一ディ ングの概要である。 次に、 映画 (フィルム) 素材のプルダウン (pulldown) 処理につ いて説明する。
24コマ/秒で構成されている映画フイルムを、 3 0フレーム/ 秒で構成される N T S C方式のテレビ ' ビデオ信号に変換するため に、 同じフィールド画像を周期的に繰り返す処理が行われる。 以下 では、 この処理を 2— 3プルダゥン変換という。
図 7は、 この 2— 3プルダウン変換の原理を示している。
プルダウンのパターンの位相は、 フィルム素材から N T S C方式 のビデオ素材への変換時に決定される。 多くの場合はパターンが規 則的に変換されている。
ビデオ素材の 1フレームは 2フィ一ルドで構成されるが、 そのう ちの第 1フィールド (1st field ) を ト ップフィ一ルド (top_fiel d ) とし、 第 2フィ一ルド (2nd field ) をボトムフィ一ルド (bo ttom— field) とする。 また、 同じフィール ド画を繰り返す場所をリ ピー ト ファース トフィ 一ル ド (repeat— first— field) と呼ぶ。
このような映画素材では、 同じフィ一ルドが繰り返される位置が 分かっていれば、 エンコードの際にそのフィールドを符号化しない ように処理して圧縮効率を高めることができる。
符号化の際の 2— 3プルダウンパターンの組合せは、 以下の 4通 りである。
0: bottom— iield—iirst
1: bottom— field— nrst, repeat— first— field
2: top— field— first
3: top field— first, repeat— first— field ここでは、 これらのパターンの組合せを 「ピクチャモード」 と定 義する。
プルダウン変換と同時に符号化を行う場合や、 上記プルダウンパ 夕一ンを示す情報等が与えられる場合には、 上述のようなプルダウ ン処理を考慮した最適の符号化、 すなわち繰り返されるフ ィ ール ド については画像の符号化を行わず、 どのフィ一ルドが繰り返された かを示す情報のみを出力するような符号化、 を行うことができるが、 これらの情報が与えられない場合には、 プルダウン処理を考慮した 符号化が適切に行えないことがある。
次に、 2— 3プルダウンパターンと、 N T S C方式に従う素材の ロールの先頭からのビデオフレーム番号 kとの関係について説明す る。
上述したピクチャモードを、 リピートされていない ト ップフィー ルドを含む位置とフレーム番号 kとの関係を p_mode[k]とすると、 図 7からも分かるように、 上記の 0〜 3のピクチャモードに属さな いフレーム番号が存在する。 この場合の p—mode[k] の値を 4とする。 図 2は、 プルダウンにおける p_mode[k] の状態遷移図である。 プルダウンが規則正しく連続している場合には、 p— mode[k] の値 は、 フレーム番号 kの増加に伴って、 5で割った余りの体 (mod 5 ) において 1ずつ増加していく。
P_mode[k+l] = (p_mode[k] + 1 ) mod 5 · · · ( 7 ) プルダウンパターンが乱れた場合には、 p_mode が 0または 2のと きのみ、 その値を繰り返すことができる。
p_mode[k+l] = (p_mode[k] + 1 ) mod 5 · · · ( 8 )
(p_mode[k] が 0または 2の場合に限る) 2パスエンコーディ ングにおいては、 符号化難易度 (diff iculty) の測定を行う際にプルダウンパターンが自動検出される。 このとき、 測定されたプルダウンパターンをもとにビッ ト配分が行われ、 コン トロ一ルファイルが作成される。
そして、 最終的なエンコード時には、 上記のコン ト口一ルフアイ ルに記述されたプルダウンパターンに従って符号化が行われる。
しかし、 上述したようなプルダウンパターンの自動検出手法は、 現在のフレームと 1つ前のフレームの、 トップフィ一ル ドおよびボ トムフィールドの差分をもとにしているという原理上、 素材が静止 画像に近い場合にはプルダウンパターンを正しく検出できないこと がある。
例えば、 映画の最初の部分について考えると、 最初のタイ トルシ —ンから始まる映像は黒からフヱ一ドィンし、 映画会社のロゴが現 れ、 黒にフヱードアウ トする。 このような場合には、 黒へのフエ一 ドィン /ァゥ トのような動きが少ない部分については、 プルダウン 位相の正確な検出が困難であり、 検出を誤ることが多い。
さらに、 フィルム素材からビデオ素材に変換するコンバータに撮 像管を用いている古い装置が使用された素材では、 フ レーム間の残 像によってプルダゥン位相を正しく検出できない場合がある。
同様の理由で、 前のフレームの画像と現在のフレームの画像とを 加算してランダムノイズを減らすようなノイズレデューサを用いた 素材でも、 プルダウン位相が正しく検出できない場合がある。
また、 プルダウン位相が異なるフィルム素材を多数編集したよう な素材では、 編集ボイ ン 卜でプルダウンパターンの検出のディ レイ から、 誤ったプルダウン位相として検出されるおそれがある。 このように、 誤った位相でエンコードを行うと、 正しい位相に口 ックするまでの間は誤ったプルダウンパターンで処理されるため、 ェンコ一ド結果の画像の動きがぎこちなくなるなどの問題がある。 プルダウン処理によってエンコードを実行しても問題ないかどう かは、 素材のプルダウンパターンの安定性に大きく依存する。
しかし、 事前にその判定を行うことは困難であるため、 ォペレ一 夕が、 ェンコ一ド後の画像の動きを見て適性を判断するしかなく、 ェンコ一ド条件が不適切であつたと判断された場合には、 条件を変 えて最初からェンコ一ドし直さなければならないことが問題となつ ていた。 発 明 の 開 示 本発明は、 上述した問題点に鑑みてなされたものであり、 2パス 可変レートエンコードにおいて、 プルダウン処理によるェンコ一ド 条件の適否を、 ェンコ一ドの実行前に判定できるような画像符号化 方法及び装置を提供することを目的とする。
上記の課題を解決するために、 本発明の画像符号化方法は、 プル ダウン変換が施された入力ビデオ素材に対してプルダウンパターン に基づく符号化を施す 2パス画像符号化方法において、 上記入力ビ デォ素材のプルダウンパターンを測定する測定工程と、 上記測定さ れたプルダウンパターンの安定度を判定する判定工程とを有するこ とを特徴とする。
ここで、 上記判定工程は、 上記測定されたプルダウンパターンと 想定される複数の初期位相に基づく各プルダウンパターンとを比較 して、 上記各プルダウンパ夕一ンのうちの上記測定されたプルダウ ンパターンに最も近いプルダウンパターンを与える初期位相を選択 する選択工程と、 上記選択された初期位相に基づくプルダウンパ夕 ーンの、 上記ビデオ素材の総フレーム数に対する誤差を算出する誤 差算出工程と、 上記算出された誤差に基づいて、 上記選択された初 期位相に基づく プルダウンパターンの安定度をェンコ一ド前に判定 する安定度判定工程とを有することが好ましい。
また、 上記の課題を解決するために、 本発明の画像符号化装置は、 プルダウン変換が施された入力ビデオ素材に対してプルダウン処理 を施しながら、 プルダウンパターンに基づく符号化を施す 2パス画 像符号化装置において、 上記入力ビデオ素材のプルダウンパターン を測定する測定手段と、 上記測定されたプルダウンパターンと想定 される複数の初期位相に基づく各プルダウンパターンとを比較して、 上記各プルダウンパターンのうちの上記測定されたプルダウンパ夕 ーンに最も近いプルダウンパターンを与える初期位相を選択する選 択手段と、 上記選択された初期位相に基づく プルダウンパターンの、 上記ビデオ素材の総フレーム数に対する誤差を算出する誤差算出手 段と、 上記算出された誤差に基づいて、 上記選択された初期位相に 基づくプルダウンパターンの安定度をェンコ一ド前に判定する安定 度判定手段とを有することを特徴とする。
上記の本発明によれば、 2パス可変レートエンコードにおいて、 入力ビデオ素材のプルダウンパターンを測定し、 測定されたブルダ ゥンパターンの安定度により、 プルダウン処理によるエンコード条 件の適否を、 ェンコ一ドの実行前に判定できるようになる。 図面の簡単な説明 図 1は、 従来のビデオェンコ一ドシステムの構成例を示す図であ る。
図 2は、 G 0 P構造について説明するための図である。
図 3は、 従来のビデオエンコードシステムにおける 2パスェンコ 一ドの基本的な処理手順を示すフ口一チャートである。
図 4 A〜図 4 Gは、 ビッ ト配分計算における余り ビッ 卜の処理例 を説明するための図である。
図 5は、 ビッ ト配分計算処理の手順の一具体例を示すフローチヤ ートである。
図 6は、 G O Pごとの符号化難易度の和 「gop— diffj とェンコ一 ド時の G O P単位のビッ ト割当て量 「gop_target」 とを変換するた めの関数の一例を示す図である。
図 7は、 2 _ 3プルダウン変換について説明するための図である。 図 8は、 プルダウンにおける p— mode [k] の状態遷移図である。 図 9は、 2— 3プルダゥンパターンの初期位相を示す図である。 図 1 0は、 測定されたプルダウンパターンと想定されるプルダゥ ンパターンとの比較結果の一例を示す図である。
図 1 1は、 プルダウンパターンの安定度を判断するアルゴリズム の一例を示すフローチャートである。
図 1 2は、 プルダウンパターンの安定度を判断するァルゴリズム の一例を示す、 図 1 1に続く フローチャートである。
図 1 3は、 本発明に係るビデオェンコ一ドの基本的な処理手順を 示すフローチャートである。 図 1 4は、 本発明に係るビデオェンコ一ドシステムの構成例を示 す図である。 発明を実施するための最良の形態 本発明の好ましい実施の形態について、 図面を参照しながら以下 説明する。
本発明の実施の形態においては、 入力ビデオ素材に対してブルダ ゥン処理に応じた符号化を施す 2パス方式の画像符号化の際に、 入 力ビデオ素材のプルダウンパターンを測定し、 測定されたプルダゥ ンパターンの安定度を判定している。 この安定度の判定は、 上記測 定されたプルダウンパターンと想定される複数の初期位相に基づく 各プルダウンパターンとを比較して、 各プルダウンパターンのうち の上記測定されたプルダウンパターンに最も近いプルダウンパ夕一 ンを与える初期位相を選択し、 選択された初期位相に基づくブルダ ゥンパターンの、 上記ビデオ素材の総フレーム数に対する誤差を算 出し、 算出された誤差に基づいて、 上記選択された初期位相に基づ くプルダウンパターンの安定度をェンコ一ド前に判定することで実 現している。 この判定結果に基づいて、 上記入力ビデオ素材のプル ダウン処理によるエンコードの適否を判断する。 なお、 上記ブルダ ゥン処理に応じた符号化あるいはプルダウン処理による符号化とは、 主としてプルダウンパターンの繰り返しフィールドを符号化しない ことにより符号化効率を高めるものである。
以下、 本発明に係る画像符号化方法及び画像符号化装置の実施の 形態について、 前述した 2— 3プルダウン変換が施されるビデオ素 材のエンコード処理を例として説明する。
図 9は、 前述した 2— 3プルダウンパターンの初期位相を示して いる。
フィルム素材からビデオ信号にフレーム変換する際の 2— 3プル ダウンは、 ほとんどの場合に規則正しく行われている。 そこで、 ェ ンコ一ドされる素材のプルダウンパターンは規則正しいとする。 また、 エンコードされる素材の最初はチャプター指定され、 必ず P_mode が 2の状態でェンコ一ドされなければならないと規定され ていることを考慮すると、 プルダウンパターンの初期位相は、 乱れ がない場合には、 この図に示す 7通りのいずれかのパターンで表す ことができる。
これらのプルダウンのプルダゥンパターンは、 初期位相のモード を p— start ( 0≤ p— start ≤ 6 ) とすると、 k番目のフレームの ピクチャモード p— mode[k]は、 以下の式で表される。
pd_cycle[7][10] = {{2,2,2,2,2,2,2,2,2,2},
{2, 3, 4, 0,0,0, 0,0, 0,0},
{2,3,4,0,1,2,3,4,0,1},
{2,2,3,4,0,1,2,3,4,0},
{2,2,2,3,4,0,1,2,3,4},
{2,2,2,2,3,4,0,1,2,3},
{2,2,2,2,2,3,4,0,1,2}}
p_mode[kj = pd— cycle [pd— start] [k mod 5] ( k < 5 のとき)
p_mode[k] = pd—cycle[pd— start] [k mod 5 + 5] ( k≥ 5 のとき) そこで、 本発明の実施の形態の画像符号化方法では、 フレーム番 号 k ( 0≤ k≤kend) に対して想定される上記の 7通りの初期位相 に基づく プルダウンパターンと、 測定されたプルダウンパターンと を比較し、 その 7通りのうちの最もエラーが少ないものを選択する。 以下に、 このような本発明に係る画像符号化方法の実施の一形態 としてのビデオェンコ一ド処理の流れを説明する。
( 1 ) まず、 ps番目のプルダウンパターンと測定されたプルダゥ ンパターンとを比較して、 一致していたら pd_match[ps] を 1だけ 増加する。 一方、 比較結果が違っていたら、 位相がずれはじめたポ イン 卜の個数 (エラ一の立ち上がりエッジ) を pd— errnb[ps] とし てカウン トする。
( 2 ) 上記 ( 1 ) の処理を 0≤ k^kend の範囲で繰り返す。
( 3 ) 上記 ( 1 ) および ( 2 ) の処理を 0≤ps≤ 6 の範囲で繰 り返す。
( 4 ) 0≤ps≤ 6 の範囲での pd_match[ps] の最大値を求める。 最大となった ps についての位相がずれはじめたポイン トの個数 pd_errnb[ps] を pd— error— max とする。
( 5 ) 測定された総フレーム数 frame_nbに対するパターンマッチ ング率 pd一 match— ratio と、 エラー発生率 pd_error— ratio を、 以 下のように求める。
pd— error— ratio = pd— error— max / f rame_nb * 100 (¾) pd— match— ratio = pd— match— max / frame— nb * 100 (%)
( 6 ) パターンマッチング率 pd_match— ratio がしきい値 PD— MATC H— LIMIT 以下である場合、 または、 総フレーム数 frame— nb が、 しき い値 PD FRAME LIMIT 以上で、 かつ、 エラ一発生率 pd error ratio がしきい値 PD— ERROR_LIMIT 以上である場合に、 エンコード素材のプ ルダウンパターンは安定していない (従って、 プルダウン処理を指 定してェンコ一ドすると画質に問題が生じる可能性が大きい) と判 定して、 ォペレ一夕に警告を示すメ ッセージを表示する。
( 7 ) オペレータ一が、 上記の警告を見て、 当初のエンコード条 件で処理を続けるかどうかを判断する。 処理を中止する場合には、 ェンコ一ド条件からプルダウン処理の指定をはずして、 エンコード 作業を最初からやり直す。
上記のような手順により行われる、 本発明に係る実施の形態のビ デォエンコードにおいて、 エンコード素材のプルダウンパターンの 安定度を判定するためのしきい値は、 例えば以下のように設定され る。
PD— MATCH一 LIMIT = 75 (%)
PD_ERROR_LIMIT = 0.5 (%)
PD_FRAME_LIMIT = 10000 (frame)
また、 初期値は、 次のように設定される。
pd_match[ps] = 0; ( p— mode が同じであった回数 ) pd_errnb[ps] 二 0; ( pd—mode が変ィ匕した回数 )
(0 ≤ ps ≤ 6)
pd— error = pd_error_back : 0;
pd— match— max = 0
次に、 プルダウンパターンの測定について説明する。
図 1 0は、 本実施の形態における、 仮エンコード時に測定される、 ェンコ一ド素材のプルダウンパターンを、 前述した 7通りの初期位 相に基づくプルダウンパターンと比較した結果の一例を示している。 この図において、 error は、 測定結果とプルダウンパターンが異 なっている場合に 1 とされる。 pd_match [ps ] は、 error が 0の個 数、 すなわち p_mode が同じであった回数を示す。 また、 pd— error [ps ] は、 error が 0から 1になるところのエッジの数と同じであ る。
この例では、 P S = 2で示される初期位相に基づくプルダウンパ 夕一ンが、 測定されたプルダウンパターンに最も近いことが分かる。 ここでは、 total— frame = 1 3なので、
パターンマッチング率 pdjnatch— ratio = 84. 5 %
エラー発生率 pd— error— rat io 二 7. 7% となる。
この結果を、 前述の設定されたしきい値を用いて判定すると、 こ の測定された素材のプルダウンパターンは安定していると判断され る。 このように、 プルダウンパターンの測定値に対する pd— match の値が最大のものが、 初期位相として選択される。
図 1 1および図 1 2は、 上述した本発明の実施の一形態としての ビデオェンコ一ド処理における、 プルダウンパターンの安定度を判 断するァルゴリズムの一具体例を示している。
図 1 1のステップ S 1では、 pjnode が同じであった回数 pd— mat ch [ps ]および pd— error [ps ]が初期化されて、 いずれも値が 0にさ れる。 ただし、 psで示されるプルダウンパターンの初期位相は、 前 述したように 7通りに限られることから、 0≤ps≤ 6である。 また、 pd— error , pd_error_Dac , pd— match— max , psの ί直が、 レヽ れも 0 (こ される。
次に、 ステップ S 2では、 ビデオのフレーム番号 kの値が 0にさ れる。
次に、 ステップ S 3では、 k < 5であるかどうかが判断される。 k < 5であればステップ S 4に進む。 一方、 k < 5を満たさないと きはステップ S 5に進む。 これは、 図 9に示すプルダウンパターン の初期位相において、 最初の 4フレームまでが特異点となるためで ある。
そして、 ステップ S 4では pm = pd— cyc le [st] [k mod 5 ] とされ、 ステップ S 5では pm = pd_cyc le [ st] [k mod 5+5] とされる。
次に、 ステップ S 6で pd— error一 back = pd— error とされる。 そして、 ステップ S 7では、 pm == p mode [k] であるかどうかが 判断され、 この条件を満たす場合にはステップ S 8に進み、 この条 件を満たさない場合にはステップ S 9に進む。 ここで、 「=」 は代 入を意味しているのに対し、 「==」 は C言語等で用いられるのと同 様に等しいかどうかの条件判定を意味するものである。
次に、 ステップ S 8では、 pd—match [ps ]の値が 1だけイ ンク リメ ン トされ、 また pd_error の値が 0にされる。
一方、 ステップ S 9では、 pd_error の値が 1にされる。
そして、 ステップ S 1 0では、 pd error == 1 かつ pd error ba ck == 0 であるかどうかが判断される。 この条件を満たす場合には ステップ S 1 1 に進み、 pd errnb [ps]の値が 1だけインク リメン ト される。 一方、 ステップ S 1 0の条件を満たさない場合にはステツ プ S 1 1をスキップしてステップ S 1 2に進む。
次に、 ステップ S 1 2で、 フレーム番号 kが 1だけインク リメン 卜される。
ステップ S 1 3では、 フレーム番号 kが kendを越えたかどうかが 判断され、 この条件を満たさない場合、 すなわち最後のフレームま で至っていない場合にはステツプ S 3に戻って上記の手順が繰り返 される。 一方、 この条件を満たす場合、 すなわち最後のフレームま で至った場合にはステップ S 1 4に進み、 psの値が 1だけインク リ メン トされて、 次の初期位相に基づくプルダウンパターンについて 同様の処理が行われる。
ステップ S 1 5では、 ps > 6であるかどうかが判断され、 この条 件を満たさない場合、 すなわち前述の 7通りの初期位相に基づく プ ルダウンパターンの全てについての処理が終了していない場合には ステップ S 2に戻って上記の手順が繰り返される。 一方、 この条件 を満たす場合、 すなわち前述の 7通りの初期位相に基づく プルダウ ンパターンの全てについて処理が終了した場合には図 1 2のステヅ プ S 1 6に進み、 ps二 0とされる。
ステップ S 1 7では、 pd— match— max が、 pd_match[ps ] よりも小 であるかどうかが判断され、 この条件を満たす場合には、 ステップ S 1 8に進み、 pd_match_max = pd_match[ps] , pd_error_max = pd— errnb [ps]とされる。 一方、 ステップ S 1 7の条件を満たさない 場合には、 ステップ S 1 8をスキップしてステップ S 1 9に進む。 ステップ S 1 9では、 psの値が 1だけィンクリメン トされて、 次 の初期位相に基づくプルダウンパ夕一ンについて同様の処理が行わ れる。
ステップ S 2 0では、 ps > 6であるかどうか、 すなわち前述の 7 通りの初期位相に基づくプルダウンパターンの全てについての処理 が終了したかどうかが判断され、 この条件を満たさない場合にはス テツプ S 1 7に戻って上記の手順が繰り返される。 一方、 この条件 を満たす場合にはステップ S 2 1に進み、 エラ一発生率 pd— error— ratio , ノ 夕一ンマッチング率 pd—match— rat io が計算される。
そして、 ステップ S 2 2では、 パターンマッチング率 pd— match_ ratio がしきい値 PD— MATCH— L IMITよりも小である、 または、 測定さ れた総フレーム数 frame_nb がしきい値 PD_FRAME— L IMIT およびエラ —発生率 dp_error_ratioがしきい値 PD— ERROR— R より大であるか どうかが判断される。 この条件を満たしている場合には、 測定され たプルダウンパターンが安定していないと判断されてステップ S 2 3で pd_stabl e= 0 とされる。 一方、 この条件を満たしている場合 には、 測定されたプルダウンパターンが安定していると判断されて ステップ S 2 4で pd_stabl e= 1 とされる。
図 1 3は、 以上説明したプルダウンパターンの安定度の算出を含 む、 本発明に係るビデオェンコ一ドの基本的な処理手順を示してい る。
まず、 ステップ S 3 1でエンコード条件が入力され、 ステップ S 3 2で符号化難易度 (Diff i culty) パラメ一夕が入力され、 ステツ プ S 3 3でこれらに基づく仮エンコードによりプルダウン素材のプ ルダウン (pul ldown) パターンの安定度が算出される。
ステップ S 3 4で、 上記の算出されたプルダウンパターンの安定 度が判断され、 安定していないと判断された場合にはステツプ S 3 5でワーニング (警告) が表示され、 ステップ S 3 6でエンコード を続けるかどうかがオペレータにより判断される。 そして、 ステツ プ S 3 6で、 当初のェンコ一ド条件で処理を続けるとされた場合に はステツプ S 3 7に進む。 一方、 ステップ S 3 4で、 算出されたプ ルダウンパターンが安定していると判断された場合にはそのままス テツプ S 3 7に進む。
なお、 ステップ S 3 6でェンコ一ドを続けないとされた場合には、 ステップ S 4 4でプルダウン処理なしのエンコードを行う等してビ デォエンコード処理を終了する。
次に、 ステップ S 3 7では、 シーンチェンジの検出/処理が行わ れる。
ステップ S 3 8では、 境界を Pピクチヤ, I ピクチャの並びに変 換するチヤプ夕 (CHAPTER) 境界処理が行われる。 ステップ S 3 9 では、 符号化難易度 (Difficulty) の補間/補正処理が行われる。 ステップ S 4 0では、 ターゲッ トビッ ト (Target bit) 数が計算さ れる。 ステップ S 4 1では、 アドレス (ADDRESS) が計算される。 ステップ S 4 2では、 tg— rate が算出される。
なお、 ステップ S 3 7からステップ S 4 1 までの各ステップにお ける処理は、 図 5に示した従来の処理手順における処理と同様に行 うことができる。
そして、 ステップ S 4 3で、 ェンコ一ダ用コン トロールファイル が作成されてビデオェンコ一ド処理が終了する。
次に、 本発明に係る画像符号化装置について説明する。
図 1 4は、 本発明に係る画像符号化装置の実施の一形態としての ビデオェンコ一ドシステムの構成例を示している。
このビデオェンコ一ドシステムは、 上述した本発明に係る画像符 号化方法を適用して、 D V D ( Digital Versati le Disk, Digital Video Disk) 用にビデオ情報を圧縮符号化してォーサリングなどを 行うために用いることができるものであり、 その基本的な構成は図 1に示した従来のビデオェンコ一ドシステムの構成とほぼ同様とす ることができる。
主コン トローラ 1 1は、 このビデオエンコードシステムに割り当 てられた計算機により構成され、 ネッ トワーク 2を介して接続され るス一パーバイザ 3との間でデータ通信を行って、 このビデオェン コードシステム全体の動作を制御する。
具体的には、 主コン トローラ 1 1は、 グラフィカルユーザ一ィン 夕一フエース (GU I : Graphical User Interface) 部 14の管理 により、 スーパ一バイザ 3からの制御を受け付けると共に、 図示し ていないオペレー夕の操作を受け付け、 この GU I部 14により管 理されるビッ トアサイ ン部 1 5 , エンコーダコン トロール部 16 , V T Rコン ト口一ル部 1 7により、 エンコーダ 1 2 , ビデオテープ レコーダ (VTR) 1 0の動作を制御する。 これにより、 主コン ト ローラ 1 1は、 スーパ一バイザ 3から通知されたェンコ一ド条件に 従って、 処理対象の素材を符号化処理し、 その処理結果をスーパ一 バイザ 3に通知する。 さらに、 主コン ト口一ラ 1 1は、 GU I部 1 4を介してオペレー夕の設定を受け付けて、 上記の符号化の詳細な 条件を変更できるようにされている。
具体的には、 主コン トローラ 1 1の G U I部 14は、 ビッ トアサ イン部 1 5のビッ ト配分プログラム 「BIT_ASSIGN」 , エンコーダコ ン ト口一ル部 1 6のエンコーダコン トロールプログラム 「CTRL_ENC」 および VTRコン トロール部 1 7の VTRコン トロ一ルプログラム の 3つのプログラムを管理している。
また、 ビッ トアサイン部 1 5は、 スーパーバイザ 3から通知され る符号化ファイル 「v.enc」 に従って符号化処理の条件をフレーム 単位で決定し、 この条件による制御デ一夕をファイル形式 「CTL filej によりコン トロール部 1 6に通知する。
このとき、 ビッ トアサイン部 1 5は、 符号化処理におけるビッ ト 配分を設定し、 さらに設定された条件をオペレー夕の操作に応じて 変更する。 さらに、 ビッ トアサイン部 1 5は、 デ一夕圧縮されたビ デォデ一夕 D 2が、 エンコーダ 1 2から S C S I等を介して RA I D 4に記録されると、 R A I D 4上のア ドレスデ一夕 「v.adr」 を、 後段における多重化処理に必要なデータ量等の情報 「vxxx.aui」 と 共にスーパ一バイザ 3に通知する。
エンコーダコン トロール部 1 6は、 ビッ トアサイン部 1 5から通 知される制御ファイル 「CTL file」 に従って、 ィ一サネッ ト ETHER などを介してエンコーダ 12の動作を制御する。 さらに、 ェンコ一 ダコン トロール部 1 6は、 符号化処理に要する符号化難易度 「dif- ficultyj のデ一夕をフレ一ム単位でビッ トアサイ ン部 1 5に通知 し、 ビデオデ一夕 D 2が記録された R A I D 4の記録ァドレスのデ —夕 「v.adr」 , 後の多重化処理に必要なデータ 「vxxx. aui 」 を ビッ トアサイン部 1 5に通知する。
V T Rコン トロール部 1 7は、 スーパーバイザ 3から通知される 編集リス トに従って、 R S— 422 ( 9ピンリモート) などを介し てビデオテープレコーダ (VTR) 1 0の動作を制御し、 所望の編 集対象の素材を再生する。
ビデオテープレコーダ (VTR) 1 0は、 主コン トローラ 1 1を 介してスーパ一バイザ 3から通知される編集リス 卜に従って、 磁気 テープに記録されたビデオデータ D 1を再生して、 処理対象の 「SDI」 , 「REF V」 , 「TIME CODEj をェンコ一ダ 1 2に出力する。 この VTR 1 0としては、 通常はディ ジ夕ル VTRが用いられる。 エンコーダ 1 2は、 スーパーバイザ 3から主コン トローラ 1 1 を 介して通知される条件に従って動作を切り換え、 V T R 1 0から出 力されるビデオデ一夕 D 1を、 M P E G (Moving P icture Experts Group) の手法により圧縮符号化する。
このとき、 エンコーダ 1 2は、 符号化処理の結果を主コン トロー ラ 1 1に通知し、 主コン ト口一ラ 1 1は、 そのデ一夕圧縮における 符号化の条件を制御し、 発生するビッ ト量を制御する。 これにより、 主コン トローラ 1 1は、 デ一夕圧縮により発生するビッ ト量をフレ ーム単位で把握できる。
また、 エンコーダ 1 2は、 2パスエンコードにおける事前のェン コード条件設定の処理時 (仮ェンコ一ド時) には、 V T R 1 0から はビデオデ一夕を単にデ一夕圧縮して処理結果を主コン トロ一ラ 1 1に通知するだけであるが、 最終的なデ一夕圧縮処理時 (本ェンコ ード時) には、 圧縮処理されたビデオデータ D 2を R A I D 4に記 録し、 さらにそのデ一夕が記録されたアドレス, デ一夕量等を主コ ン トローラ 1 1に通知する。
モニタ装置 1 3は、 エンコーダ 1 2によりデ一夕圧縮されたビデ ォデ一夕 D 2をモニタできるように構成される。 このモニタ装置 1 3ににより、 このビデオエンコードシステムでは、 ォペレ一夕がデ —夕圧縮処理の結果を必要に応じて確認する、 いわゆるプレビュー を行うことができる。 そして、 ォペレ一夕が、 このプレビュー結果 に基づいて主コン トローラ 1 1を操作して、 符号化の条件を詳細に 変更できるようにされている。
以上説明したような画像符号化方法および画像符号化装置によれ ば、 2パス可変レ一トェンコ一ドの条件としてプルダウン処理が指 定された場合に、 エンコード対象となる素材の適性を、 本ェンコ一 ドを実行する前に判断できるため、 D V Dのォ一サリングなどを行 う際に発生するェンコ一ド条件の見直しなどの作業工数を削減でき る。 すなわち、 2— 3プルダウンによる 2パス可変レートェンコ一 ドにおいて、 プリエンコード (仮エンコード) 時に、 素材の複雑さ を示す符号化難易度の測定と共に、 プルダウンパターンの安定度を 求めてェンコ一ド素材の適性を本ェンコ一ド前に判定するようにし たため、 早い時点でエンコード条件の見直しを促すことができるよ うになる。

Claims

請 求 の 範 囲
1 . 入力ビデオ素材に対してプルダウン処理に応じた符号化を施す
2パス方式の画像符号化方法において、
上記入力ビデオ素材のプルダウンパターンを測定する測定工程と、 上記測定されたプルダウンパターンの安定度を判定する判定工程 と
を有することを特徴とする画像符号化方法。
2 . 上記判定工程における判定結果に基づいて、 上記入力ビデオ素 材のプルダウン処理によるェンコ一ドの適否を表示する表示工程を さらに有することを特徴とする請求の範囲第 1項記載の画像符号化 方法。
3 . 上記判定工程は、
上記測定されたプルダウンパターンと想定される複数の初期位相 に基づく各プルダウンパターンとを比較して、 上記各プルダウンパ ターンのうちの上記測定されたプルダウンパターンに最も近いプル ダウンパターンを与える初期位相を選択する選択工程と、
上記選択された初期位相に基づくプルダウンパターンの、 上記ビ デォ素材の総フレーム数に対する誤差を算出する誤差算出工程と、 上記算出された誤差に基づいて、 上記選択された初期位相に基づ くプルダウンパターンの安定度をェンコ一ド前に判定する安定度判 定工程と
を有することを特徴とする請求の範囲第 1項記載の画像符号化方 法。
4 . 上記安定度判定工程では、 上記測定されたビデオ素材のブルダ ゥンパターンと上記選択された初期位相に基づくプルダウンパ夕一 ンとのマツチング率およびエラー発生率を、 それぞれしきい値と比 較して、 上記ビデオ素材のプルダウン処理によるェンコ一ドの安定 度を判定すること
を特徴とする請求の範囲第 3項記載の画像符号化方法。
5 . 上記プルダウン処理に応じた符号化は、 上記測定されたブルダ ゥンパターンに応じて、 繰り返しフィ一ルドを符号化しないことに より行われることを特徴とする請求の範囲第 1項記載の画像符号化 方法。
6 . 入力ビデオ素材に対して、 プルダウンパターンに基づく符号化 を施す 2パス方式の画像符号化装置において、
上記入力ビデオ素材のプルダウンパターンを測定する測定手段と、 上記測定されたプルダウンパターンと想定される複数の初期位相 に基づく各プルダウンパターンとを比較して、 上記各プルダゥンパ ターンのうちの上記測定されたプルダウンパターンに最も近いプル ダウンパターンを与える初期位相を選択する選択手段と、
上記選択された初期位相に基づく プルダウンパターンの、 上記ビ デォ素材の総フレーム数に対する誤差を算出する誤差算出手段と、 上記算出された誤差に基づいて、 上記選択された初期位相に基づ くプルダウンパターンの安定度をェンコ一ド前に判定する安定度判 定手段と
を有することを特徴とする画像符号化装置。
7 . 上記安定度判定手段における判定結果に基づいて、 上記入力ビ デォ素材のプルダウン処理によるェンコ一ドの適否を表示する表示 手段をさらに有することを特徴とする請求の範囲第 6項記載の画像 符号化装置。
8 . 上記安定度判定手段では、 上記測定されたビデオ素材のブルダ ゥンパターンと上記選択された初期位相に基づく プルダウンパ夕一 ンとのマッチング率およびエラー発生率を、 それぞれしきい値と比 較して、 上記ビデオ素材のプルダウン処理によるェンコ一ドの安定 度を判定することを特徴とする請求の範囲第 6項記載の画像符号化
PCT/JP1998/005626 1997-12-12 1998-12-11 Image encoding method and device WO1999031886A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US09/374,134 US6275528B1 (en) 1997-12-12 1999-08-10 Picture encoding method and picture encoding apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP34344197A JP3740813B2 (ja) 1997-12-12 1997-12-12 画像符号化方法および画像符号化装置
JP9/343441 1997-12-12

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US09/374,134 Continuation US6275528B1 (en) 1997-12-12 1999-08-10 Picture encoding method and picture encoding apparatus

Publications (1)

Publication Number Publication Date
WO1999031886A1 true WO1999031886A1 (en) 1999-06-24

Family

ID=18361545

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1998/005626 WO1999031886A1 (en) 1997-12-12 1998-12-11 Image encoding method and device

Country Status (3)

Country Link
US (1) US6275528B1 (ja)
JP (1) JP3740813B2 (ja)
WO (1) WO1999031886A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6563953B2 (en) 1998-11-30 2003-05-13 Microsoft Corporation Predictive image compression using a single variable length code for both the luminance and chrominance blocks for each macroblock
WO2003053066A1 (en) 2001-12-17 2003-06-26 Microsoft Corporation Skip macroblock coding
US7130472B2 (en) * 2002-01-21 2006-10-31 Canon Kabushiki Kaisha Image distribution apparatus, communication terminal apparatus, and control method thereof
US6940540B2 (en) * 2002-06-27 2005-09-06 Microsoft Corporation Speaker detection and tracking using audiovisual data
US20050013498A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
US8064520B2 (en) 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
US7623574B2 (en) * 2003-09-07 2009-11-24 Microsoft Corporation Selecting between dominant and non-dominant motion vector predictor polarities
US7620106B2 (en) * 2003-09-07 2009-11-17 Microsoft Corporation Joint coding and decoding of a reference field selection and differential motion vector information
US7606308B2 (en) * 2003-09-07 2009-10-20 Microsoft Corporation Signaling macroblock mode information for macroblocks of interlaced forward-predicted fields
US7616692B2 (en) * 2003-09-07 2009-11-10 Microsoft Corporation Hybrid motion vector prediction for interlaced forward-predicted fields
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7567617B2 (en) 2003-09-07 2009-07-28 Microsoft Corporation Predicting motion vectors for fields of forward-predicted interlaced video frames
JP4655191B2 (ja) * 2004-09-02 2011-03-23 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
US9077960B2 (en) * 2005-08-12 2015-07-07 Microsoft Corporation Non-zero coefficient block pattern coding
EP1848220A3 (en) * 2006-04-18 2011-09-28 Pioneer Corporation Block noise removal device
KR101484280B1 (ko) * 2009-12-08 2015-01-20 삼성전자주식회사 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08265639A (ja) * 1995-03-24 1996-10-11 Mitsubishi Electric Corp 映像信号変換装置および再変換装置
JPH09168148A (ja) * 1995-09-20 1997-06-24 Sony Corp 動画像符号化方法及び装置、並びに記録媒体
JPH09284757A (ja) * 1996-04-11 1997-10-31 Sony Corp 画像符号化装置および方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5461420A (en) * 1992-09-18 1995-10-24 Sony Corporation Apparatus for coding and decoding a digital video signal derived from a motion picture film source
GB9303369D0 (en) * 1993-02-19 1993-04-07 Philips Electronics Uk Ltd Identifying film frames in a video sequence
MY113223A (en) * 1994-12-29 2001-12-31 Sony Corp Processing of redundant fields in a moving picture to achive synchronized system operation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08265639A (ja) * 1995-03-24 1996-10-11 Mitsubishi Electric Corp 映像信号変換装置および再変換装置
JPH09168148A (ja) * 1995-09-20 1997-06-24 Sony Corp 動画像符号化方法及び装置、並びに記録媒体
JPH09284757A (ja) * 1996-04-11 1997-10-31 Sony Corp 画像符号化装置および方法

Also Published As

Publication number Publication date
JPH11177978A (ja) 1999-07-02
JP3740813B2 (ja) 2006-02-01
US6275528B1 (en) 2001-08-14

Similar Documents

Publication Publication Date Title
JP3465272B2 (ja) デジタルデータ記録装置および記録方法
JP3953574B2 (ja) 番組符号化装置及び記録装置
WO1999031886A1 (en) Image encoding method and device
EP0861490B1 (en) Recording and reproducing system for simultaneous recording and reproduction via an information carrier
KR101242447B1 (ko) 프로그램, 복호 장치, 복호 방법, 및 기록 매체
JP4791129B2 (ja) 画像符号化装置、画像符号化方法及び画像編集装置
JP3911768B2 (ja) 画像符号化方法及び画像符号化装置
JP3837889B2 (ja) エンコード方法およびエンコード装置
JP3956394B2 (ja) 音声・映像データ符号化装置およびその方法
WO2004091204A1 (ja) オーディオ/ビデオ記録装置、記録方法、再生装置、再生方法、再生プログラム及び記録プログラム
JP4634622B2 (ja) ビデオ又はオーディオ符号化器におけるビットレート制御のための方法及び装置
JP4244051B2 (ja) プログラム、復号装置、復号方法、並びに、記録媒体
JP4650454B2 (ja) 符号化装置及び符号化方法
JP2000358219A (ja) 記録装置
JP3951152B2 (ja) 画像符号化装置および方法
JP4462643B2 (ja) 画像符号化方法及び画像符号化装置
KR20000000611A (ko) 기록매체의 잔량 검출 및 검출잔량에 따른 신호의 압축 기록방법과 그 장치
JPH10304372A (ja) 画像符号化方法および装置、画像伝送方法
US20050053363A1 (en) Method of and device for encoding an information stream
JP3660514B2 (ja) 可変レート動画像符号化方法および動画像編集システム
JPH0918830A (ja) 映像編集装置
JP4161385B2 (ja) 画像符号化方法及び装置並びに画像処理装置及び画像処理方法
JPH08331556A (ja) 画像符号化装置および画像符号化方法
JPH10108200A (ja) 画像符号化方法およびその装置
JP3801894B2 (ja) ディスク状記録媒体の記録方法及び記録装置、並びに再生方法及び再生装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CA US

WWE Wipo information: entry into national phase

Ref document number: 09374134

Country of ref document: US