WO1999031886A1

WO1999031886A1 - Image encoding method and device

Info

Publication number: WO1999031886A1
Application number: PCT/JP1998/005626
Authority: WO
Inventors: Masaaki Isozaki; Atsuo Yada
Original assignee: Sony Corporation
Priority date: 1997-12-12
Filing date: 1998-12-11
Publication date: 1999-06-24
Also published as: JPH11177978A; JP3740813B2; US6275528B1

Description

明細書画像符号化方法及び装置技術分野本発明は、ビデオ素材を符号化する画像符号化方法及び装置に関し、特に、プルダウン変換された入力ビデオ素材のプルダウンパ夕ーンに基づいて符号化を行う画像符号化方法及び装置に関するものである。背景技術ビデオ情報を D V D ( D igital Versati le Disk, Digital Video Disk) やビデオ C Dのようなパッケージメディァに蓄積する際に、ビデオ情報に圧縮符号化処理を施すェンコ一ドシステムでは、まず、ビデオ素材の画像の符号化難易度（diff iculty) を測定し、次に、その符号化難易度に基づいてパッケ一ジメディァの記録容量の範囲内の与えられたバイト数に収まるように、各ビデオ情報のフレームごとにビット配分（B it ass ign) 処理を行うエンコード方法が一般に採用されている。以下、このエンコード方法を 2パスェンコ一ディング方法という。

図 1は、ビデオ情報を圧縮符号化して D V D等のォーサリングなどを行うために用いられる、従来のビデオェンコ一ドシステムの構成例を示している。スーパーバイザ 1 0 3は、ビデオエンコードシステムの全体を管理するものであり、ビデオ，オーディオ，メニューなどの各ェンコードシステムにェンコ一ド条件を与え、ェンコ一ド結果の報告を受ける。この例では、ファイル「v.enc」によってビデオエンコード条件が指定され、ビデオェンコーダ側からはエンコード結果のビットストリームが書き込まれた R A I D (Redundant Arrays of Inexpensive Disks) 1 04上のアドレス「v.adr」と、ビットストリームをマルチプレックスする際に必要なデ一夕「vxxx.aui」が報告される。

主コントローラ 1 1 1は、ネットワーク 1 0 2を介して接続されるスーパ一バイザ 1 0 3との間のデータ通信により、このビデオェンコ一ドシステム全体の動作を制御する。

具体的には、主コントローラ 1 1 1は、グラフィカルユーザ一ィン夕ーフエース（GU I : Graphical User Interface) 部 1 1 4の管理により、スーパ一バイザ 1 0 3からの制御を受け付けると共に、ォペレ一夕の操作を受け付け、この GU I部 1 1 4により管理されるビットアサイン部 1 1 5，エンコーダコントロール部 1 1 6， V TRコントロール部 1 1 7により、エンコーダ 1 1 2 , ビデオテ一プレコーダ（VTR) 1 1 0の動作を制御する。これにより主コントロ一ラ 1 1 1は、スーパーバイザ 1 0 3から通知されたェンコ一ド条件に従って、処理対象の素材を符号化処理し、その処理結果をスーパ一バイザ 3に通知する。さらに、主コントローラ 1 1 1は、 GU I部 1 1 4を介してオペレー夕の設定を受け付けて、上記の符号化の詳細な条件を変更できるようにされている。

上記の主コントローラ 1 1 1の G U I部 1 1 4は、ビットアサイン部 1 1 5のビット配分プログラム「BIT— ASSIGNj , エンコーダコントロ一ル部 1 1 6のエンコーダコントロールプログラム「CTRL— ENC」および VTRコント口一ル部 1 1 7の丁1^コントロールプログラムの 3つのプログラムを管理している。

また、ビットアサイン部 1 1 5は、スーパーバイザ 1 03から通知されるエンコード条件のファイル「v.enc」に従って符号化処理の条件をフレーム単位で決定し、この条件による制御デ一夕をファィル形式「CTL filej によりコントロール部 1 1 6に通知する。このとき、ビットアサイン部 1 1 5は、符号化処理におけるビット配分（ビヅトアサイン）を設定し、さらに設定された条件をオペレー夕の操作に応じて変更する。さらに、ビットアサイン部 1 1 5 は、デ一夕圧縮されたビデオデ一夕 D 2が RA I D 1 04に記録されると、そのビデオデータ D 2が書き込まれた; RA I D 1 04上のアドレスのデータ「v.adr」を、後段における多重化処理に必要なデ一夕量等の情報「vxxx.aui」と共にスーパ一バイザ 1 03に通知する。

エンコーダコントロ一ル部 1 16は、ビットアサイン部 1 1 5から通知される制御ファイル「CTL filej に従ってエンコーダ 1 1 2 の動作を制御する。さらに、エンコーダコントロール部 1 1 6は、符号化処理に要する符号化難易度「difficulty」のデータをフレーム単位でビットアサイン部 1 1 5に通知し、 R A I D 1 04にビデォデ一夕 D 2が記録されると、その記録アドレスのデ一夕「v.adr」，後の多重化処理に必要なデ一夕「vxxx. auij をビットアサイン部 1 1 5に通知する。

V T Rコントロール部 1 1 7は、スーパーバイザ 3から通知される編集リス卜に従ってビデオテープレコーダ（V T R ) 1 1 0の動作を制御し、所望の編集対象の素材を再生する。

ビデオテープレコーダ（V T R ) 1 1 0は、主コントローラ 1 1

1を介してスーパ一バイザ 1 0 3から通知される編集リス卜に従つて、磁気テープに記録されたビデオデータ D 1を再生してェンコ一ダ 1 1 2に出力する。

エンコーダ 1 1 2は、スーパーバイザ 1 0 3から主コントローラ

1 1 1 を介して通知される条件に従って動作を切り換え、 V T R 1

1 0から出力されるビデオデータ D 1を、 M P E G (Moving Picture Experts Group) の手法により圧縮符号化する。

このとき、エンコーダ 1 1 2は、符号化処理の結果を主コント口 —ラ 1 1 1に通知し、主コントローラ 1 1 1は、そのデータ圧縮における符号化の条件を制御し、発生するビット量を制御する。これにより、主コントローラ 1 1 1は、データ圧縮により発生するビット量をフレーム単位で把握できる。

また、エンコーダ 1 1 2は、 2パスエンコードにおける事前のェンコード条件設定の処理時（仮エンコード時）には、単にビデオデ —夕 D 1をデータ圧縮して処理結果を主コントローラ 1 1 1に通知するだけであるが、最終的なデ一夕圧縮処理時（本エンコード時）には、圧縮処理されたビデオデ一夕 D 2を R A I D 1 0 4に記録し、さらにそのデータが記録されたァドレス，デ一夕量等を主コント口ーラ 1 1に通知する。

モニタ装置 1 1 3は、エンコーダ 1 1 2によりデータ圧縮されたビデオデ一夕 D 2をモニタできるように構成される。このモニタ装置 1 1 3により、このビデオエンコードシステムでは、オペレータがデータ圧縮処理の結果を必要に応じて確認する、いわゆるプレビュ一を行うことができる。そして、ォペレ一夕が、このプレビュー結果に基づいて主コントローラ 1 1 1を操作して、符号化の条件を詳細に変更できるようにされている。

上述したように、 DVDでは、ビデオデ一夕の圧縮方式として M PEG (Moving Picture Experts Group) を採用している。

MP E Gは、動き補償予測による時間方向の冗長度を除去することによりデータ圧縮する方式であり、フレーム内だけで符号化される I (Intra) ピクチャ，過去の画面から現在を予測して符号化される P (Predictive) ピクチャ，過去の画像と未来の画像とから現在を予測して符号化される B (Bidirectionally Predictive) ピクチヤの 3種類の符号化画像が用いられる。

また、これらの画像は、 Iピクチャを必ず 1つ含むまとまりである GOP (Group of Pictures) とされる。

図 2は、 G 0 P構造の一例を示している。

この例では、 1つの GO Pを構成するピクチャ（フレーム）の数 Nが 1 5である。 GOPの各ピクチャが表示される順序は、符号化される順序とは異なっており、表示順における GO Pの先頭のピクチヤは、 Iピクチャの前であって Pピクチャまたは Iピクチャの次にある Bビクチャである。また、表示順における G〇 Pの最後は、次の Iピクチャの前にある最初の Pピクチャである。

次に、 2パスエンコードについて、図 1に例示のビデオェンコ一ドシステムの構成を参照しながら説明する。

図 3は、上記のビデオェンコ一ドシステムにおける 2パスェンコ ―ドの基本的な処理手順を示している。まず、ステップ S 5 1で、スーパーバイザ 1 0 3からネットヮ一ク 1 0 2を経由して、ビデオ情報に割り当てられるビット総量ゃ最大レートなどのエンコード条件「v . enc」が与えられ、エンコーダコントロール部 1 1 6はこのェンコ一ド条件に従って設定される。次に、ステップ S 5 2で、エンコーダコントロール部 1 1 6が、エンコーダ 1 1 2を使ってェンコ一ド素材の符号化難易度（diff iculty) を測定する。ここでは、素材の各画素の D C値や動きべクトル量 M Eも併せて測定される。そして、これらの測定結果に基づいてフアイルが作成される。

実際の符号化難易度の測定は、以下のように行われる。

ェンコ一ド素材となるビデオ情報は、マス夕一テープであるディジ夕ルビデオカセッ卜から V T R 1 1 0により再生される。

エンコーダコント口ール部 1 1 6は、エンコーダ 1 1 2を介して、 V T R 1 1 0により再生されたビデオ情報 D 1の符号化難易度を測定する。ここでは、符号化の際に量子化ステップ数を固定値に設定して発生ビット量が測定される。動きが多く、高い周波数成分が多い画像では発生ビット量が多くなり、静止画や平坦な部分が多い画像では発生ビット量が少なくなる。この発生ビット量の大きさを符号化難易度としている。

次に、ステップ S 5 3では、ステップ S 5 1で設定されたェンコ —ド条件によってステップ S 5 2で測定された、各ピクチャの符号化難易度の大きさに応じて、エンコーダコントロール部 1 1 6が、ビットアサイン部 1 1 5内のビット配分計算プログラム「B IT— ASSIGNj を実行し、割り当てビット量（夕一ゲット量）の配分計算を行う。そして、ステップ S 5 4で、上記のビット配分計算の結果を使つて仮エンコードを行い、エンコーダ 1 1 2に内蔵されている口一力ルデコーダ出力の画質によって、本ェンコ一ドを実行するかどうかをオペレー夕に判断させるようにする。

実際には、上記のビット配分によるビヅトストリームを R A I D 1 0 4に出力しないで、オペレー夕が、任意の処理範囲を指定できるモードであるプレビュー（Preview) モードで画質が確認される。そして、ステップ S 5 5で、画質評価が行われ、画質に問題がある場合（N G ) にはステップ S 5 6に進み、問題がある部分のビットレートを上げたりフィルターレベルを調整するといつた画質調整のためのカス夕マイズ作業を行った後に、ステップ S 5 7でビット配分再計算が実行される。

その後、ステップ S 5 4に戻り、カス夕マイズされた部分がプレビューされ、ステップ S 5 5で画質が確認される。ここで、全ての部分の画質が良好であればステップ S 5 8に進み、エンコーダ 1 1 2によって、ステップ S 5 7で再計算されたビット配分による素材全体についてのェンコ一ドが実行される。

一方、ステップ S 5 5で、画質に問題がないと判断された場合には、そのままステップ S 5 8に進み、エンコーダ 1 1 2により、ステツプ S 5 3で計算されたビット配分によるェンコ一ド処理が実行される。

そして、ステップ S 5 9で、ェンコ一ド結果であるビットストリ —ムが S C S I ( Smal l Computer System Interface ) 等を介して R A I D 1 0 4に書き込まれる等の後処理が行われ、 2パスェンコ ―ド処理が終了する。ステップ S 5 8におけるエンコードの実行後、ビデオエンコーダコントロール部 1 1 6は、上述したようなェンコ一ド結果の情報をネットワーク 1 0 2経由でスーパーバイザ 1 0 3に報告する。

なお、この図 3の各ステップのうち、ステップ S 5 2，ステップ S 5 4およびステップ S 5 8を除く各ステップの処理は、オフラインで行われる。

次に、上述した 2パスエンコーディングにおいて、ビットアサイン部 1 1 5で実行されるビット配分計算についてさらに説明する。図 4 A〜図 4 Gは、ビット配分計算における余りビットの処理例を示している。

まず、ディジタルビデオディスク（D V D ) などのパッケージメディァの記録容量のうちのビデオ情報に割り当てられるビット総量「QTY_BYTES」（図 4 A ) および最大ビットレート「MAXMTE」が、スーパーバイザ 1 0 3から指定される。

これに対して、エンコーダコントロール部 1 1 6は、ビットアサイン部 1 1 5内のビット配分計算プログラム「B I T_ASS I GN」を実行し、まず、最大ビットレート「MAXRATE」以下になるように制限が加えられた総ビット数「USB_BYTES」を求め（図 4 B ) 、この値から G O Pのヘッダ（Header) に必要なビット数「T0TA HEADERj を引いた値と、素材全体のフレーム総数から夕ーゲット数の総和の目標値となる「 SUPPLY— BYTES」を算出する（図 4 C ) 。

そして、この「SUPPLY_BYTES」の大きさに収まるように、各ピクチヤへの割当てビット量（夕ーゲヅト量）が配分される。全てのピクチャへの割当てビット量の総和を「TARGET_BYTES」とすると、図 4 D〜図 4 Fに示すように、夕ーゲット数の総和の目標値「SUPPLY — BYTES」から、上記の「TARGET— BYTES」を引いた値が、ビット配分の際の余り（Remain) を示す量「REMAIN_BYTES」となる。

そして、図 4 Gに示すように、「TARGET_BYTES」と Headerの和が「TARGET_OUT_BYTES」とされる。

図 5は、図 3のステップ S 5 3における、ビット配分計算処理の手順の一具体例を示している。

まず、ステップ S 6 1で、前述したようにスーパ一バイザ 3から送られるビット総量「QTY_BYTES」と最大ビットレ一ト「MAXRATE」が入力される。

次に、ステップ S 6 2で、図 3のステップ S 5 2で作成された符号化難易度（d i ff i cu lty) の測定結果のファイルがそのまま読み込まれる。

そして、ステップ S 6 3で、符号化難易度と共に測定された各画像の D C値や動きべクトル量 M Eの大きさのパラメ一夕の変化量から、シーンが変化するポイントが検出される。

なお、このステップ S 6 3におけるシーンチェンジの検出/処理には、本件出願人がすでに日本国特許出願の特願平 8— 2 7 4 0 9 4号の明細書および図面にて開示した「映像信号処理装置」におけるシーンチェンジ点を検出するための処理を適用できる。この「映像信号処理装置」は、映像信号の各フレームの直流レベルを検出し、この直流レベルを曲線近似して得られる誤差値から、その映像信号のシ一ンチェンジのフレームを検出してシーンチェンジ点を明らかにするというものである。そして、シーンがチェンジしたとして検出されたポイントでは、 Pピクチャが I ピクチャに変更されて、画質改善が図られる。次に、ステップ S 6 4では、チャプター（CHAPTER) 境界処理が行われる。 D V D再生装置でのチャプターサーチ時には、再生されるビクチャが、特定されないピクチヤからジャンプしてくることになる。その場合でも再生画像が乱れないようにするため、このチヤプ夕境界処理によってチャプターの位置が必ず G◦ Pの先頭になるようにピクチャタイプが変更されたり、 G 0 P長が制限される。ステップ S 6 5では、上記の一連の作業の結果として変更された、 I ピクチャ， Pピクチャ， Bピクチャなどのピクチャタイプに合わせた符号化難易度（D ifficulty) の値に対して補間/補正が行われる。

これは、 D V Dでは、 1 G O Pのデコード時の、表示される最大のフィールド数が制限されていることから、ピクチャタイプの変更に伴って G O P構造が変化したことにより 1 G O Pの長さがこの制限を越えることがあるためである。そのような場合には、制限を満たすように、 Pピクチャを I ピクチャに変更して G O P長が短くされる G◦ P制約処理が行われる。

ステップ S 6 6では、ステップ S 6 5における補間/補正処理によって得られた符号化難易度、およびェンコ一ドされる素材全体に与えられたビット数「 SUPPLY— BYTES」に応じて、各ピクチャごとのターゲットビット（Target bit) 数が計算される。

そして、ステップ S 6 7で、ェンコ一ド結果のビットストリームを書き込む際の R A I D 4のアドレス（ADDRESS) を計算した上で、ステップ S 6 8に進み、エンコーダ用のコント口一ルファィルが作成されて処理が終了する。

上記のような手順により、素材の符号化難易度（Diff iculty) および素材全体に与えられたビット数「 SUPPLY— BYTES」に応じて、各ピクチャごとの夕ーゲットビヅト数が計算され、エンコーダ用のコントロールファィルが作成される。

以下では、このような一連のビット配分の手順について、さらに詳しく説明する。ここでは、ビット配分の計算例として、まず G O Pを単位としてビット量が配分され、その後、各 G O P内で各ピクチヤの符号化難易度（Difficulty) に応じたビット配分が行われるものとしており、各 G 0 Pごとの符号化難易度の和である「gop— di f f」に応じて、エンコード時の G 0 P単位のビット割当て量「gop— targetj が配分される。

図 6は、この GO Pごとの符号化難易度の和「gop— diffj とェンコード時の G〇 P単位のビット割当て量「gop_target」とを変換するための、最も簡単な関数の例を示している。

この例では、「gop_target」を Y とし、「gop— diff」を X として、 Y = AX + B

という形で表される評価関数が用いられる。

許容される最大ビットレ一ト以下に制限された総ビット数「USB— BYTES j は、

USB— BYTES = min (QTY— BYTES - MAXRATE x KT

x total— frame—number) . · · ( \ ) で与えられる。ここで、

N T S C方式の場合には、 KT = 1/8 (bits) /30 (Hz) ,

PA L方式の場合には、 1/8 (bits) /25 (Hz)

である。また、「totaし frame_number」はエンコードされる素材のフレーム総数， min (s,t) は sまたは tの小さい方を選択する関数である。また、 ""DIFFICULTY— SUM」は、全てのピクチャの符号化難易度の総和である。

SUPPLY— BYTES = USB_BYTES - TOTAL— HEADER . . . ( 2 ) DIFFICULTY— SUM = ∑ difficulty · . · ( 3 )

B 二 GOP_MINBYTES · · · ( 4 )

∑y = A x ∑x + Bx n

ここで、 ∑y = SUPPLY_BYTES, ∑ x = DIFFICULTY一 SUM, nは GO Pの総数である。よって

A (SUPPLY一 BYTES - Bxn) / DIFFICULTY— SIM

となる。従って、各ピクチャのターゲット量は、

gop— target 二 A x gop_diff + B · · · ( 5 ) で与えられる。

その後、各 GO P内で各ピクチャの符号化難易度に応じたビット配分が行われる。 G 0 P内での各ビクチャの配分は符号化難易度の大きさに比例させた場合には、各ピクチャの夕ーゲット量は以下の式で求められる。

target (k) = GOP— TARGET x diffuculty (k) / G0P_diff

• · · ( 6 )

( 1≤k≤GO P内のピクチャ数）

そして、このようなビット配分計算の後、エンコード結果のビットストリームが書き込まれる R A I D 4のアドレスが設定され、ェンコーダ用コントロールフアイルが出力される。このようにして作成されたコントロールファイルによってエンコード処理を行うことにより、素材の画像の難しさに応じた可変ビットレ一トェンコ一ディングが実行される。以上が 2パス可変ビヅトレ一トェンコ一ディングの概要である。次に、映画（フィルム）素材のプルダウン（pulldown) 処理について説明する。

24コマ/秒で構成されている映画フイルムを、 3 0フレーム/ 秒で構成される N T S C方式のテレビ ' ビデオ信号に変換するために、同じフィールド画像を周期的に繰り返す処理が行われる。以下では、この処理を 2— 3プルダゥン変換という。

図 7は、この 2— 3プルダウン変換の原理を示している。

プルダウンのパターンの位相は、フィルム素材から N T S C方式のビデオ素材への変換時に決定される。多くの場合はパターンが規則的に変換されている。

ビデオ素材の 1フレームは 2フィ一ルドで構成されるが、そのうちの第 1フィールド（1st field ) をトップフィ一ルド（top_fiel d ) とし、第 2フィ一ルド（2nd field ) をボトムフィ一ルド（bo ttom— field) とする。また、同じフィールド画を繰り返す場所をリピートファーストフィ一ルド（repeat— first— field) と呼ぶ。

このような映画素材では、同じフィ一ルドが繰り返される位置が分かっていれば、エンコードの際にそのフィールドを符号化しないように処理して圧縮効率を高めることができる。

符号化の際の 2— 3プルダウンパターンの組合せは、以下の 4通りである。

0： bottom— iield—iirst

1： bottom— field— nrst, repeat— first— field

2： top— field— first

3： top field— first, repeat— first— field ここでは、これらのパターンの組合せを「ピクチャモード」と定義する。

プルダウン変換と同時に符号化を行う場合や、上記プルダウンパ夕一ンを示す情報等が与えられる場合には、上述のようなプルダウン処理を考慮した最適の符号化、すなわち繰り返されるフィールドについては画像の符号化を行わず、どのフィ一ルドが繰り返されたかを示す情報のみを出力するような符号化、を行うことができるが、これらの情報が与えられない場合には、プルダウン処理を考慮した符号化が適切に行えないことがある。

次に、 2— 3プルダウンパターンと、 N T S C方式に従う素材のロールの先頭からのビデオフレーム番号 kとの関係について説明する。

上述したピクチャモードを、リピートされていないトップフィールドを含む位置とフレーム番号 kとの関係を p_mode[k]とすると、図 7からも分かるように、上記の 0〜 3のピクチャモードに属さないフレーム番号が存在する。この場合の p—mode[k] の値を 4とする。図 2は、プルダウンにおける p_mode[k] の状態遷移図である。プルダウンが規則正しく連続している場合には、 p— mode[k] の値は、フレーム番号 kの増加に伴って、 5で割った余りの体（mod 5 ) において 1ずつ増加していく。

P_mode[k+l] = (p_mode[k] + 1 ) mod 5 · · · ( 7 ) プルダウンパターンが乱れた場合には、 p_mode が 0または 2のときのみ、その値を繰り返すことができる。

p_mode[k+l] = (p_mode[k] + 1 ) mod 5 · · · ( 8 )

(p_mode[k] が 0または 2の場合に限る） 2パスエンコーディングにおいては、符号化難易度（diff iculty) の測定を行う際にプルダウンパターンが自動検出される。このとき、測定されたプルダウンパターンをもとにビット配分が行われ、コントロ一ルファイルが作成される。

そして、最終的なエンコード時には、上記のコント口一ルフアイルに記述されたプルダウンパターンに従って符号化が行われる。

しかし、上述したようなプルダウンパターンの自動検出手法は、現在のフレームと 1つ前のフレームの、トップフィ一ルドおよびボトムフィールドの差分をもとにしているという原理上、素材が静止画像に近い場合にはプルダウンパターンを正しく検出できないことがある。

例えば、映画の最初の部分について考えると、最初のタイトルシ —ンから始まる映像は黒からフヱ一ドィンし、映画会社のロゴが現れ、黒にフヱードアウトする。このような場合には、黒へのフエ一ドィン /ァゥトのような動きが少ない部分については、プルダウン位相の正確な検出が困難であり、検出を誤ることが多い。

さらに、フィルム素材からビデオ素材に変換するコンバータに撮像管を用いている古い装置が使用された素材では、フレーム間の残像によってプルダゥン位相を正しく検出できない場合がある。

同様の理由で、前のフレームの画像と現在のフレームの画像とを加算してランダムノイズを減らすようなノイズレデューサを用いた素材でも、プルダウン位相が正しく検出できない場合がある。

また、プルダウン位相が異なるフィルム素材を多数編集したような素材では、編集ボイン卜でプルダウンパターンの検出のディレイから、誤ったプルダウン位相として検出されるおそれがある。このように、誤った位相でエンコードを行うと、正しい位相に口ックするまでの間は誤ったプルダウンパターンで処理されるため、ェンコ一ド結果の画像の動きがぎこちなくなるなどの問題がある。プルダウン処理によってエンコードを実行しても問題ないかどうかは、素材のプルダウンパターンの安定性に大きく依存する。

しかし、事前にその判定を行うことは困難であるため、ォペレ一夕が、ェンコ一ド後の画像の動きを見て適性を判断するしかなく、ェンコ一ド条件が不適切であつたと判断された場合には、条件を変えて最初からェンコ一ドし直さなければならないことが問題となつていた。発明の開示本発明は、上述した問題点に鑑みてなされたものであり、 2パス可変レートエンコードにおいて、プルダウン処理によるェンコ一ド条件の適否を、ェンコ一ドの実行前に判定できるような画像符号化方法及び装置を提供することを目的とする。

上記の課題を解決するために、本発明の画像符号化方法は、プルダウン変換が施された入力ビデオ素材に対してプルダウンパターンに基づく符号化を施す 2パス画像符号化方法において、上記入力ビデォ素材のプルダウンパターンを測定する測定工程と、上記測定されたプルダウンパターンの安定度を判定する判定工程とを有することを特徴とする。

ここで、上記判定工程は、上記測定されたプルダウンパターンと想定される複数の初期位相に基づく各プルダウンパターンとを比較して、上記各プルダウンパ夕一ンのうちの上記測定されたプルダウンパターンに最も近いプルダウンパターンを与える初期位相を選択する選択工程と、上記選択された初期位相に基づくプルダウンパ夕ーンの、上記ビデオ素材の総フレーム数に対する誤差を算出する誤差算出工程と、上記算出された誤差に基づいて、上記選択された初期位相に基づくプルダウンパターンの安定度をェンコ一ド前に判定する安定度判定工程とを有することが好ましい。

また、上記の課題を解決するために、本発明の画像符号化装置は、プルダウン変換が施された入力ビデオ素材に対してプルダウン処理を施しながら、プルダウンパターンに基づく符号化を施す 2パス画像符号化装置において、上記入力ビデオ素材のプルダウンパターンを測定する測定手段と、上記測定されたプルダウンパターンと想定される複数の初期位相に基づく各プルダウンパターンとを比較して、上記各プルダウンパターンのうちの上記測定されたプルダウンパ夕ーンに最も近いプルダウンパターンを与える初期位相を選択する選択手段と、上記選択された初期位相に基づくプルダウンパターンの、上記ビデオ素材の総フレーム数に対する誤差を算出する誤差算出手段と、上記算出された誤差に基づいて、上記選択された初期位相に基づくプルダウンパターンの安定度をェンコ一ド前に判定する安定度判定手段とを有することを特徴とする。

上記の本発明によれば、 2パス可変レートエンコードにおいて、入力ビデオ素材のプルダウンパターンを測定し、測定されたブルダゥンパターンの安定度により、プルダウン処理によるエンコード条件の適否を、ェンコ一ドの実行前に判定できるようになる。図面の簡単な説明図 1は、従来のビデオェンコ一ドシステムの構成例を示す図である。

図 2は、 G 0 P構造について説明するための図である。

図 3は、従来のビデオエンコードシステムにおける 2パスェンコ一ドの基本的な処理手順を示すフ口一チャートである。

図 4 A〜図 4 Gは、ビット配分計算における余りビッ卜の処理例を説明するための図である。

図 5は、ビット配分計算処理の手順の一具体例を示すフローチヤートである。

図 6は、 G O Pごとの符号化難易度の和「gop— diffj とェンコ一ド時の G O P単位のビット割当て量「gop_target」とを変換するための関数の一例を示す図である。

図 7は、 2 _ 3プルダウン変換について説明するための図である。図 8は、プルダウンにおける p— mode [k] の状態遷移図である。図 9は、 2— 3プルダゥンパターンの初期位相を示す図である。図 1 0は、測定されたプルダウンパターンと想定されるプルダゥンパターンとの比較結果の一例を示す図である。

図 1 1は、プルダウンパターンの安定度を判断するアルゴリズムの一例を示すフローチャートである。

図 1 2は、プルダウンパターンの安定度を判断するァルゴリズムの一例を示す、図 1 1に続くフローチャートである。

図 1 3は、本発明に係るビデオェンコ一ドの基本的な処理手順を示すフローチャートである。図 1 4は、本発明に係るビデオェンコ一ドシステムの構成例を示す図である。発明を実施するための最良の形態本発明の好ましい実施の形態について、図面を参照しながら以下説明する。

本発明の実施の形態においては、入力ビデオ素材に対してブルダゥン処理に応じた符号化を施す 2パス方式の画像符号化の際に、入力ビデオ素材のプルダウンパターンを測定し、測定されたプルダゥンパターンの安定度を判定している。この安定度の判定は、上記測定されたプルダウンパターンと想定される複数の初期位相に基づく各プルダウンパターンとを比較して、各プルダウンパターンのうちの上記測定されたプルダウンパターンに最も近いプルダウンパ夕一ンを与える初期位相を選択し、選択された初期位相に基づくブルダゥンパターンの、上記ビデオ素材の総フレーム数に対する誤差を算出し、算出された誤差に基づいて、上記選択された初期位相に基づくプルダウンパターンの安定度をェンコ一ド前に判定することで実現している。この判定結果に基づいて、上記入力ビデオ素材のプルダウン処理によるエンコードの適否を判断する。なお、上記ブルダゥン処理に応じた符号化あるいはプルダウン処理による符号化とは、主としてプルダウンパターンの繰り返しフィールドを符号化しないことにより符号化効率を高めるものである。

以下、本発明に係る画像符号化方法及び画像符号化装置の実施の形態について、前述した 2— 3プルダウン変換が施されるビデオ素材のエンコード処理を例として説明する。

図 9は、前述した 2— 3プルダウンパターンの初期位相を示している。

フィルム素材からビデオ信号にフレーム変換する際の 2— 3プルダウンは、ほとんどの場合に規則正しく行われている。そこで、ェンコ一ドされる素材のプルダウンパターンは規則正しいとする。また、エンコードされる素材の最初はチャプター指定され、必ず P_mode が 2の状態でェンコ一ドされなければならないと規定されていることを考慮すると、プルダウンパターンの初期位相は、乱れがない場合には、この図に示す 7通りのいずれかのパターンで表すことができる。

これらのプルダウンのプルダゥンパターンは、初期位相のモードを p— start ( 0≤ p— start ≤ 6 ) とすると、 k番目のフレームのピクチャモード p— mode[k]は、以下の式で表される。

pd_cycle[7][10] = {{2,2,2,2,2,2,2,2,2,2},

{2, 3, 4, 0,0，0, 0,0, 0,0}，

{2,3,4,0,1,2,3,4,0,1},

{2,2,3,4,0,1,2,3,4,0},

{2,2,2,3,4,0,1,2,3,4},

{2,2,2,2,3,4,0,1,2,3},

{2,2,2,2,2,3,4,0,1,2}}

p_mode[kj = pd— cycle [pd— start] [k mod 5] ( k < 5 のとき）

p_mode[k] = pd—cycle[pd— start] [k mod 5 + 5] ( k≥ 5 のとき）そこで、本発明の実施の形態の画像符号化方法では、フレーム番号 k ( 0≤ k≤kend) に対して想定される上記の 7通りの初期位相に基づくプルダウンパターンと、測定されたプルダウンパターンとを比較し、その 7通りのうちの最もエラーが少ないものを選択する。以下に、このような本発明に係る画像符号化方法の実施の一形態としてのビデオェンコ一ド処理の流れを説明する。

( 1 ) まず、 ps番目のプルダウンパターンと測定されたプルダゥンパターンとを比較して、一致していたら pd_match[ps] を 1だけ増加する。一方、比較結果が違っていたら、位相がずれはじめたポイン卜の個数（エラ一の立ち上がりエッジ）を pd— errnb[ps] としてカウントする。

( 2 ) 上記（ 1 ) の処理を 0≤ k^kend の範囲で繰り返す。

( 3 ) 上記（ 1 ) および（ 2 ) の処理を 0≤ps≤ 6 の範囲で繰り返す。

( 4 ) 0≤ps≤ 6 の範囲での pd_match[ps] の最大値を求める。最大となった ps についての位相がずれはじめたポイントの個数 pd_errnb[ps] を pd— error— max とする。

( 5 ) 測定された総フレーム数 frame_nbに対するパターンマッチング率 pd一 match— ratio と、エラー発生率 pd_error— ratio を、以下のように求める。

pd— error— ratio = pd— error— max / f rame_nb * 100 (¾) pd— match— ratio = pd— match— max / frame— nb * 100 (%)

( 6 ) パターンマッチング率 pd_match— ratio がしきい値 PD— MATC H— LIMIT 以下である場合、または、総フレーム数 frame— nb が、しきい値 PD FRAME LIMIT 以上で、かつ、エラ一発生率 pd error ratio がしきい値 PD— ERROR_LIMIT 以上である場合に、エンコード素材のプルダウンパターンは安定していない（従って、プルダウン処理を指定してェンコ一ドすると画質に問題が生じる可能性が大きい）と判定して、ォペレ一夕に警告を示すメッセージを表示する。

( 7 ) オペレータ一が、上記の警告を見て、当初のエンコード条件で処理を続けるかどうかを判断する。処理を中止する場合には、ェンコ一ド条件からプルダウン処理の指定をはずして、エンコード作業を最初からやり直す。

上記のような手順により行われる、本発明に係る実施の形態のビデォエンコードにおいて、エンコード素材のプルダウンパターンの安定度を判定するためのしきい値は、例えば以下のように設定される。

PD— MATCH一 LIMIT = 75 (%)

PD_ERROR_LIMIT = 0.5 (%)

PD_FRAME_LIMIT = 10000 (frame)

また、初期値は、次のように設定される。

pd_match[ps] = 0; ( p— mode が同じであった回数） pd_errnb[ps] 二 0; ( pd—mode が変ィ匕した回数 )

(0 ≤ ps ≤ 6)

pd— error = pd_error_back ： 0;

pd— match— max = 0

次に、プルダウンパターンの測定について説明する。

図 1 0は、本実施の形態における、仮エンコード時に測定される、ェンコ一ド素材のプルダウンパターンを、前述した 7通りの初期位相に基づくプルダウンパターンと比較した結果の一例を示している。この図において、 error は、測定結果とプルダウンパターンが異なっている場合に 1 とされる。 pd_match [ps ] は、 error が 0の個数、すなわち p_mode が同じであった回数を示す。また、 pd— error [ps ] は、 error が 0から 1になるところのエッジの数と同じである。

この例では、 P S = 2で示される初期位相に基づくプルダウンパ夕一ンが、測定されたプルダウンパターンに最も近いことが分かる。ここでは、 total— frame = 1 3なので、

パターンマッチング率 pdjnatch— ratio = 84. 5 %

エラー発生率 pd— error— rat io 二 7. 7% となる。

この結果を、前述の設定されたしきい値を用いて判定すると、この測定された素材のプルダウンパターンは安定していると判断される。このように、プルダウンパターンの測定値に対する pd— match の値が最大のものが、初期位相として選択される。

図 1 1および図 1 2は、上述した本発明の実施の一形態としてのビデオェンコ一ド処理における、プルダウンパターンの安定度を判断するァルゴリズムの一具体例を示している。

図 1 1のステップ S 1では、 pjnode が同じであった回数 pd— mat ch [ps ]および pd— error [ps ]が初期化されて、いずれも値が 0にされる。ただし、 psで示されるプルダウンパターンの初期位相は、前述したように 7通りに限られることから、 0≤ps≤ 6である。また、 pd— error , pd_error_Dac , pd— match— max , psの ί直が、レヽれも 0 (こされる。

次に、ステップ S 2では、ビデオのフレーム番号 kの値が 0にされる。

次に、ステップ S 3では、 k < 5であるかどうかが判断される。 k < 5であればステップ S 4に進む。一方、 k < 5を満たさないときはステップ S 5に進む。これは、図 9に示すプルダウンパターンの初期位相において、最初の 4フレームまでが特異点となるためである。

そして、ステップ S 4では pm = pd— cyc le [st] [k mod 5 ] とされ、ステップ S 5では pm = pd_cyc le [ st] [k mod 5+5] とされる。

次に、ステップ S 6で pd— error一 back = pd— error とされる。そして、ステップ S 7では、 pm == p mode [k] であるかどうかが判断され、この条件を満たす場合にはステップ S 8に進み、この条件を満たさない場合にはステップ S 9に進む。ここで、「=」は代入を意味しているのに対し、「==」は C言語等で用いられるのと同様に等しいかどうかの条件判定を意味するものである。

次に、ステップ S 8では、 pd—match [ps ]の値が 1だけインクリメントされ、また pd_error の値が 0にされる。

一方、ステップ S 9では、 pd_error の値が 1にされる。

そして、ステップ S 1 0では、 pd error == 1 かつ pd error ba ck == 0 であるかどうかが判断される。この条件を満たす場合にはステップ S 1 1 に進み、 pd errnb [ps]の値が 1だけインクリメントされる。一方、ステップ S 1 0の条件を満たさない場合にはステツプ S 1 1をスキップしてステップ S 1 2に進む。

次に、ステップ S 1 2で、フレーム番号 kが 1だけインクリメン卜される。

ステップ S 1 3では、フレーム番号 kが kendを越えたかどうかが判断され、この条件を満たさない場合、すなわち最後のフレームまで至っていない場合にはステツプ S 3に戻って上記の手順が繰り返される。一方、この条件を満たす場合、すなわち最後のフレームまで至った場合にはステップ S 1 4に進み、 psの値が 1だけインクリメントされて、次の初期位相に基づくプルダウンパターンについて同様の処理が行われる。

ステップ S 1 5では、 ps > 6であるかどうかが判断され、この条件を満たさない場合、すなわち前述の 7通りの初期位相に基づくプルダウンパターンの全てについての処理が終了していない場合にはステップ S 2に戻って上記の手順が繰り返される。一方、この条件を満たす場合、すなわち前述の 7通りの初期位相に基づくプルダウンパターンの全てについて処理が終了した場合には図 1 2のステヅプ S 1 6に進み、 ps二 0とされる。

ステップ S 1 7では、 pd— match— max が、 pd_match[ps ] よりも小であるかどうかが判断され、この条件を満たす場合には、ステップ S 1 8に進み、 pd_match_max = pd_match[ps] , pd_error_max = pd— errnb [ps]とされる。一方、ステップ S 1 7の条件を満たさない場合には、ステップ S 1 8をスキップしてステップ S 1 9に進む。ステップ S 1 9では、 psの値が 1だけィンクリメントされて、次の初期位相に基づくプルダウンパ夕一ンについて同様の処理が行われる。

ステップ S 2 0では、 ps > 6であるかどうか、すなわち前述の 7 通りの初期位相に基づくプルダウンパターンの全てについての処理が終了したかどうかが判断され、この条件を満たさない場合にはステツプ S 1 7に戻って上記の手順が繰り返される。一方、この条件を満たす場合にはステップ S 2 1に進み、エラ一発生率 pd— error— ratio , ノ夕一ンマッチング率 pd—match— rat io が計算される。

そして、ステップ S 2 2では、パターンマッチング率 pd— match_ ratio がしきい値 PD— MATCH— L IMITよりも小である、または、測定された総フレーム数 frame_nb がしきい値 PD_FRAME— L IMIT およびエラ —発生率 dp_error_ratioがしきい値 PD— ERROR— R より大であるかどうかが判断される。この条件を満たしている場合には、測定されたプルダウンパターンが安定していないと判断されてステップ S 2 3で pd_stabl e= 0 とされる。一方、この条件を満たしている場合には、測定されたプルダウンパターンが安定していると判断されてステップ S 2 4で pd_stabl e= 1 とされる。

図 1 3は、以上説明したプルダウンパターンの安定度の算出を含む、本発明に係るビデオェンコ一ドの基本的な処理手順を示している。

まず、ステップ S 3 1でエンコード条件が入力され、ステップ S 3 2で符号化難易度（Diff i culty) パラメ一夕が入力され、ステツプ S 3 3でこれらに基づく仮エンコードによりプルダウン素材のプルダウン（pul ldown) パターンの安定度が算出される。

ステップ S 3 4で、上記の算出されたプルダウンパターンの安定度が判断され、安定していないと判断された場合にはステツプ S 3 5でワーニング（警告）が表示され、ステップ S 3 6でエンコードを続けるかどうかがオペレータにより判断される。そして、ステツプ S 3 6で、当初のェンコ一ド条件で処理を続けるとされた場合にはステツプ S 3 7に進む。一方、ステップ S 3 4で、算出されたプルダウンパターンが安定していると判断された場合にはそのままステツプ S 3 7に進む。

なお、ステップ S 3 6でェンコ一ドを続けないとされた場合には、ステップ S 4 4でプルダウン処理なしのエンコードを行う等してビデォエンコード処理を終了する。

次に、ステップ S 3 7では、シーンチェンジの検出/処理が行われる。

ステップ S 3 8では、境界を Pピクチヤ， I ピクチャの並びに変換するチヤプ夕（CHAPTER) 境界処理が行われる。ステップ S 3 9 では、符号化難易度（Difficulty) の補間/補正処理が行われる。ステップ S 4 0では、ターゲットビット（Target bit) 数が計算される。ステップ S 4 1では、アドレス（ADDRESS) が計算される。ステップ S 4 2では、 tg— rate が算出される。

なお、ステップ S 3 7からステップ S 4 1 までの各ステップにおける処理は、図 5に示した従来の処理手順における処理と同様に行うことができる。

そして、ステップ S 4 3で、ェンコ一ダ用コントロールファイルが作成されてビデオェンコ一ド処理が終了する。

次に、本発明に係る画像符号化装置について説明する。

図 1 4は、本発明に係る画像符号化装置の実施の一形態としてのビデオェンコ一ドシステムの構成例を示している。

このビデオェンコ一ドシステムは、上述した本発明に係る画像符号化方法を適用して、 D V D ( Digital Versati le Disk, Digital Video Disk) 用にビデオ情報を圧縮符号化してォーサリングなどを行うために用いることができるものであり、その基本的な構成は図 1に示した従来のビデオェンコ一ドシステムの構成とほぼ同様とすることができる。

主コントローラ 1 1は、このビデオエンコードシステムに割り当てられた計算機により構成され、ネットワーク 2を介して接続されるス一パーバイザ 3との間でデータ通信を行って、このビデオェンコードシステム全体の動作を制御する。

具体的には、主コントローラ 1 1は、グラフィカルユーザ一ィン夕一フエース（GU I : Graphical User Interface) 部 14の管理により、スーパ一バイザ 3からの制御を受け付けると共に、図示していないオペレー夕の操作を受け付け、この GU I部 14により管理されるビットアサイン部 1 5 , エンコーダコントロール部 16 , V T Rコント口一ル部 1 7により、エンコーダ 1 2 , ビデオテープレコーダ（VTR) 1 0の動作を制御する。これにより、主コントローラ 1 1は、スーパ一バイザ 3から通知されたェンコ一ド条件に従って、処理対象の素材を符号化処理し、その処理結果をスーパ一バイザ 3に通知する。さらに、主コント口一ラ 1 1は、 GU I部 1 4を介してオペレー夕の設定を受け付けて、上記の符号化の詳細な条件を変更できるようにされている。

具体的には、主コントローラ 1 1の G U I部 14は、ビットアサイン部 1 5のビット配分プログラム「BIT_ASSIGN」，エンコーダコント口一ル部 1 6のエンコーダコントロールプログラム「CTRL_ENC」および VTRコントロール部 1 7の VTRコントロ一ルプログラムの 3つのプログラムを管理している。

また、ビットアサイン部 1 5は、スーパーバイザ 3から通知される符号化ファイル「v.enc」に従って符号化処理の条件をフレーム単位で決定し、この条件による制御デ一夕をファイル形式「CTL filej によりコントロール部 1 6に通知する。

このとき、ビットアサイン部 1 5は、符号化処理におけるビット配分を設定し、さらに設定された条件をオペレー夕の操作に応じて変更する。さらに、ビットアサイン部 1 5は、デ一夕圧縮されたビデォデ一夕 D 2が、エンコーダ 1 2から S C S I等を介して RA I D 4に記録されると、 R A I D 4上のアドレスデ一夕「v.adr」を、後段における多重化処理に必要なデータ量等の情報「vxxx.aui」と共にスーパ一バイザ 3に通知する。

エンコーダコントロール部 1 6は、ビットアサイン部 1 5から通知される制御ファイル「CTL file」に従って、ィ一サネット ETHER などを介してエンコーダ 12の動作を制御する。さらに、ェンコ一ダコントロール部 1 6は、符号化処理に要する符号化難易度「dif- ficultyj のデ一夕をフレ一ム単位でビットアサイン部 1 5に通知し、ビデオデ一夕 D 2が記録された R A I D 4の記録ァドレスのデ —夕「v.adr」，後の多重化処理に必要なデータ「vxxx. aui 」をビットアサイン部 1 5に通知する。

V T Rコントロール部 1 7は、スーパーバイザ 3から通知される編集リストに従って、 R S— 422 ( 9ピンリモート）などを介してビデオテープレコーダ（VTR) 1 0の動作を制御し、所望の編集対象の素材を再生する。

ビデオテープレコーダ（VTR) 1 0は、主コントローラ 1 1を介してスーパ一バイザ 3から通知される編集リス卜に従って、磁気テープに記録されたビデオデータ D 1を再生して、処理対象の「SDI」，「REF V」，「TIME CODEj をェンコ一ダ 1 2に出力する。この VTR 1 0としては、通常はディジ夕ル VTRが用いられる。エンコーダ 1 2は、スーパーバイザ 3から主コントローラ 1 1 を介して通知される条件に従って動作を切り換え、 V T R 1 0から出力されるビデオデ一夕 D 1を、 M P E G (Moving P icture Experts Group) の手法により圧縮符号化する。

このとき、エンコーダ 1 2は、符号化処理の結果を主コントローラ 1 1に通知し、主コント口一ラ 1 1は、そのデ一夕圧縮における符号化の条件を制御し、発生するビット量を制御する。これにより、主コントローラ 1 1は、デ一夕圧縮により発生するビット量をフレーム単位で把握できる。

また、エンコーダ 1 2は、 2パスエンコードにおける事前のェンコード条件設定の処理時（仮ェンコ一ド時）には、 V T R 1 0からはビデオデ一夕を単にデ一夕圧縮して処理結果を主コントロ一ラ 1 1に通知するだけであるが、最終的なデ一夕圧縮処理時（本ェンコード時）には、圧縮処理されたビデオデータ D 2を R A I D 4に記録し、さらにそのデ一夕が記録されたアドレス，デ一夕量等を主コントローラ 1 1に通知する。

モニタ装置 1 3は、エンコーダ 1 2によりデ一夕圧縮されたビデォデ一夕 D 2をモニタできるように構成される。このモニタ装置 1 3ににより、このビデオエンコードシステムでは、ォペレ一夕がデ —夕圧縮処理の結果を必要に応じて確認する、いわゆるプレビューを行うことができる。そして、ォペレ一夕が、このプレビュー結果に基づいて主コントローラ 1 1を操作して、符号化の条件を詳細に変更できるようにされている。

以上説明したような画像符号化方法および画像符号化装置によれば、 2パス可変レ一トェンコ一ドの条件としてプルダウン処理が指定された場合に、エンコード対象となる素材の適性を、本ェンコ一ドを実行する前に判断できるため、 D V Dのォ一サリングなどを行う際に発生するェンコ一ド条件の見直しなどの作業工数を削減できる。すなわち、 2— 3プルダウンによる 2パス可変レートェンコ一ドにおいて、プリエンコード（仮エンコード）時に、素材の複雑さを示す符号化難易度の測定と共に、プルダウンパターンの安定度を求めてェンコ一ド素材の適性を本ェンコ一ド前に判定するようにしたため、早い時点でエンコード条件の見直しを促すことができるようになる。

Claims

請求の範囲

1 . 入力ビデオ素材に対してプルダウン処理に応じた符号化を施す

2パス方式の画像符号化方法において、

上記入力ビデオ素材のプルダウンパターンを測定する測定工程と、上記測定されたプルダウンパターンの安定度を判定する判定工程と

を有することを特徴とする画像符号化方法。

2 . 上記判定工程における判定結果に基づいて、上記入力ビデオ素材のプルダウン処理によるェンコ一ドの適否を表示する表示工程をさらに有することを特徴とする請求の範囲第 1項記載の画像符号化方法。

3 . 上記判定工程は、

上記測定されたプルダウンパターンと想定される複数の初期位相に基づく各プルダウンパターンとを比較して、上記各プルダウンパターンのうちの上記測定されたプルダウンパターンに最も近いプルダウンパターンを与える初期位相を選択する選択工程と、

上記選択された初期位相に基づくプルダウンパターンの、上記ビデォ素材の総フレーム数に対する誤差を算出する誤差算出工程と、上記算出された誤差に基づいて、上記選択された初期位相に基づくプルダウンパターンの安定度をェンコ一ド前に判定する安定度判定工程と

を有することを特徴とする請求の範囲第 1項記載の画像符号化方法。

4 . 上記安定度判定工程では、上記測定されたビデオ素材のブルダゥンパターンと上記選択された初期位相に基づくプルダウンパ夕一ンとのマツチング率およびエラー発生率を、それぞれしきい値と比較して、上記ビデオ素材のプルダウン処理によるェンコ一ドの安定度を判定すること

を特徴とする請求の範囲第 3項記載の画像符号化方法。

5 . 上記プルダウン処理に応じた符号化は、上記測定されたブルダゥンパターンに応じて、繰り返しフィ一ルドを符号化しないことにより行われることを特徴とする請求の範囲第 1項記載の画像符号化方法。

6 . 入力ビデオ素材に対して、プルダウンパターンに基づく符号化を施す 2パス方式の画像符号化装置において、

上記入力ビデオ素材のプルダウンパターンを測定する測定手段と、上記測定されたプルダウンパターンと想定される複数の初期位相に基づく各プルダウンパターンとを比較して、上記各プルダゥンパターンのうちの上記測定されたプルダウンパターンに最も近いプルダウンパターンを与える初期位相を選択する選択手段と、

上記選択された初期位相に基づくプルダウンパターンの、上記ビデォ素材の総フレーム数に対する誤差を算出する誤差算出手段と、上記算出された誤差に基づいて、上記選択された初期位相に基づくプルダウンパターンの安定度をェンコ一ド前に判定する安定度判定手段と

を有することを特徴とする画像符号化装置。

7 . 上記安定度判定手段における判定結果に基づいて、上記入力ビデォ素材のプルダウン処理によるェンコ一ドの適否を表示する表示手段をさらに有することを特徴とする請求の範囲第 6項記載の画像符号化装置。

8 . 上記安定度判定手段では、上記測定されたビデオ素材のブルダゥンパターンと上記選択された初期位相に基づくプルダウンパ夕一ンとのマッチング率およびエラー発生率を、それぞれしきい値と比較して、上記ビデオ素材のプルダウン処理によるェンコ一ドの安定度を判定することを特徴とする請求の範囲第 6項記載の画像符号化