[go: up one dir, main page]

JP5045371B2 - 動画像の各画素の前景背景分類装置、方法及びプログラム - Google Patents

動画像の各画素の前景背景分類装置、方法及びプログラム Download PDF

Info

Publication number
JP5045371B2
JP5045371B2 JP2007281538A JP2007281538A JP5045371B2 JP 5045371 B2 JP5045371 B2 JP 5045371B2 JP 2007281538 A JP2007281538 A JP 2007281538A JP 2007281538 A JP2007281538 A JP 2007281538A JP 5045371 B2 JP5045371 B2 JP 5045371B2
Authority
JP
Japan
Prior art keywords
pixel
pixels
foreground
background
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007281538A
Other languages
English (en)
Other versions
JP2009110240A (ja
Inventor
パナヒプル テヘラニ メヒルダド
彰夫 石川
茂之 酒澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2007281538A priority Critical patent/JP5045371B2/ja
Priority to US12/240,467 priority patent/US8204316B2/en
Publication of JP2009110240A publication Critical patent/JP2009110240A/ja
Application granted granted Critical
Publication of JP5045371B2 publication Critical patent/JP5045371B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/277Analysis of motion involving stochastic approaches, e.g. using Kalman filters
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

本発明は、動画像を構成する各フレームの各画素について、前景と背景のいずれに対応するのかを判定して分類する技術に関する。
例えば、監視システムや、交通量の測定システム、ビデオ会議における人の追跡のためには、動画像内の移動する対象物、例えば人、動物、車両等を、それら以外の固定物、例えば、建物、道路、樹木、壁、各種備品等とは区別すること、つまり、動画像の各フレームの各画素が、対象物に対応しているのか、固定物に対応しているのかを判定することが必要となる。なお、以後、分離すべき移動する対象物を前景、それら以外の部分を背景と呼ぶ。
この判定のための従来技術として、あらかじめ背景のみを参照画像として撮影しておき、この参照画像に基づき実際に撮影した動画像の各画素の判定を行う方法が提案されている(例えば、非特許文献1及び2、参照。)。しかしながら、背景の色が、光等の影響により、対象物を撮影する時間内において変化する環境においては、非特許文献1及び2に記載の方法を利用することはできないという問題がある。更に、前景と背景の色が似通っている場合に、前景と背景の区別ができず、判定精度が劣化するという問題もある。
これに対して、動画像の各フレームから、画素値の確率的モデルを生成し、閾値に基づき動画像の各フレームの各画素が前景に対応しているのか、背景に対応しているのかを判断する方法が、非特許文献3に記載されている。
Thanarat Horprasert、et al、"A Statistical Approach for Real−time Robust Background Subtraction and Shadow Detection"、Proc.IEEE、Frame−Rate Application Workshop、Greece、1999年 Yutaka Satoh、et al、"Robust Background Subtraction based on Bi−polar Radial Reach Correlation"、TENCON 2005、IEEE Region 10、2005年11月 Ahmed Elgammal、et al、"Background and Foreground Modeling Using Nonparametric Kernel Density Estimation for Visual Surveillance"、Proc.of I EEE、Vol.90、No.7、2002年7月
非特許文献3に記載の方法は、固定的な単一の閾値に基づき各画素を前景又は背景に分類するものであり、このため、例えば、前景による生ずる影と、背景の色が似ている場合、閾値の値によって前景と判定されたり、背景と判定されたりする等、設定する閾値により結果が異なるといった問題が存在する。
この手法の問題は、明るい色(ハイライトや影)やカメラ特性に対して非常に敏感であることである。従って、背景が高周波な境界を有する領域では、(3次元画像表示のように)高い検出精度を要するアプリケーションには不充分であり、このモデルは高感度な検出ができない。この文献では、背景が非常に高周波な分散を有する場合に、このモデルは高感度な検出を実現できない。少数のガウス分布により背景の分散をモデリングすると不正確となる。さらに、輝度分布が背景モデルによってカバーされるため、背景の分布が非常に広い場合に検出を不充分にする。
したがって、本発明は、前景と背景、それぞれの色や、前景により生ずる影等の影響を受けず、従来技術より正確に、各画素を、前景又は背景に分類する装置及び方法、並びに、該装置としてコンピュータを機能させるプログラムを提供することを目的とする。
本発明における装置によれば、
動画像の各フレームの各画素を、前景に対応する前景画素と背景に対応する背景画素に分類する装置であって、処理対象である複数の処理対象フレームの各画素について、画素値の出現確率を示す画素の分布値を、処理対象フレームから選択した所定数のフレームの同一位置にある画素の画素値に基づき求める分布値生成手段と、画素の分布値、第1の閾値及び第2の閾値により、処理対象フレームの各画素を、前景画素、背景画素、不定である不定画素のいずれかに分類する判定手段と、判定手段による分類結果に基づき、処理対象フレームの各画素を前景画素又は背景画素に振り分ける調整手段とを備えていることを特徴とする。
本発明の装置における他の実施形態によれば、
判定手段は、画素の分布値を、第1の閾値及び第2の閾値により区分することで、該画素を前景画素、背景画素、不定画素のいずれかに分類する第1の手段と、フレームを所定サイズのブロックに分割し、第1の手段による画素の分類結果から、各ブロックについて、隣接フレーム間における各分類数の変化を求め、求めた変化に基づき、各ブロックに適用する第1の閾値及び第2の閾値を更新し、更新後の第1の閾値及び第2の閾値により各ブロックの各画素を、前景画素、背景画素、不定画素のいずれかに分類する第2の手段とを備えていることも好ましい。
また、本発明の装置における他の実施形態によれば、
第2の手段は、前景画素、不定画素、背景画素のいずれか2つを、第1の画素及び第2の画素とし、ブロック内にある第1の画素数の隣接フレーム間における変化の、処理対象フレームに渡る平均値及び標準偏差に基づき、該ブロックの第1の許容範囲を算出し、該ブロック内にある第2の画素数の隣接フレーム間における変化の、処理対象フレームに渡る平均値及び標準偏差に基づき、該ブロックの第2の許容範囲を算出する手段と、ブロック内にある第1の画素数の、1つ前のフレームからの変化である第1の変化数が、該ブロックの第1の許容範囲にない場合、又は、該ブロック内にある第2の画素数の、1つ前のフレームからの変化である第2の変化数が、該ブロックの第2の許容範囲にない場合、該ブロックに対する第1の閾値及び第2の閾値を、第1の変化数が第1の許容範囲内となり、第2の変化数が第2の許容範囲内となるまで更新する手段とを備えていることも好ましい。
更に、本発明の装置における他の実施形態によれば、
調整手段は、不定画素を含む第1の領域内における前景画素数及び背景画素数と、第1の領域内における前景画素及び背景画素の分布に基づき、該不定画素を、前景画素、背景画素、不定画素のいずれかに振り分けることを、第1の領域の大きさを変更しながら繰り返し行う第3の手段を含んでいることも好ましい。
更に、本発明の装置における他の実施形態によれば、
調整手段は、不定画素を含む第2の領域であって、第2の領域に含まれる前景画素数と背景画素数の差の該前景画素数と該背景画素数に対する比が第3の閾値未満となる領域を求め、処理対象フレームの一部又は全部のフレームを選択フレームとし、該不定画素の画素値の選択フレームに渡る平均値及び標準偏差と、第2の領域内にある前景画素の画素値の選択フレームに渡る平均値及び標準偏差と、第2の領域内にある背景画素の画素値の選択フレームに渡る平均値及び標準偏差と、該不定画素と第2の領域内にある前景画素の物理距離と、該不定画素と第2の領域内にある背景画素の物理距離とに基づき、該不定画素を、前景画素又は背景画素に振り分ける第4の手段を含んでいることも好ましい。
更に、本発明の装置における他の実施形態によれば、
調整手段は、フレーム内にある総ての不定画素を前景画素又は背景画素とし、前景画素を含む第3の領域内にある背景画素の割合が第4の閾値より大きい場合には、該前景画素を背景画素とし、背景画素を含む第3の領域内にある前景画素の割合が第4の閾値より大きい場合には、該背景画素を前景画素とする第5の手段を含んでいることも好ましい。
更に、本発明の装置における他の実施形態によれば、
分布値生成手段は、処理対象フレームから選択した前記所定数のフレームの同一位置にある画素の組に含まれる各画素の画素値に基づき、該組の標準偏差を推定し、該組の画素、それぞれについて、推定した該組の標準偏差をその標準偏差とし、該画素の画素値を平均値とするガウス分布又はラプラシアン分布を生成し、該組に含まれる画素のガウス分布又はラプラシアン分布の和に基づき、該組のカーネル分布を生成し、該組と同一位置にある処理対象フレームの画素の画素値を、生成した該組のカーネル分布に代入して、該画素の分布値を求めることも好ましい。
本発明における方法によれば、
動画像の各フレームの各画素を、前景に対応する前景画素と背景に対応する背景画素に分類する方法であって、処理対象である複数の処理対象フレームの各画素について、画素値の出現確率を示す画素の分布値を、処理対象フレームから選択した所定数のフレームの同一位置にある画素の画素値に基づき求める分布値生成ステップと、画素の分布値、第1の閾値及び第2の閾値により、処理対象フレームの各画素を、前景画素、背景画素、不定である不定画素のいずれかに分類する判定ステップと、判定ステップでの分類結果に基づき、処理対象フレームの各画素を前景画素又は背景画素に振り分ける調整ステップとを備えていることを特徴とする。
本発明の方法における他の実施形態によれば、
判定ステップは、画素の分布値を、第1の閾値及び第2の閾値により区分することで、該画素を前景画素、背景画素、不定画素のいずれかに分類する第1のステップと、第1のステップによる分類結果に基づき第1の閾値及び第2の閾値を更新し、更新後の第1の閾値及び第2の閾値により各画素を、前景画素、背景画素、不定画素のいずれかに再分類する第2のステップとを備えていることが好ましい。
また、本発明におけるプログラムによれば、上記装置としてコンピュータを機能させることを特徴とする。
閾値で前景又は背景に硬判定するのではなく、判定が微妙である画素については、一旦、不定と判定し、これら不定画素については、近傍にある画素の分類結果やその分布、更には、画素値を考慮して前景又は背景と判定する。これにより、従来技術より精度良く分類することができる。また、閾値も固定的とするのではなく、一旦、ある閾値にて分類した後、この分類結果に基づき閾値を調整する。つまり、動画像の内容に応じて閾値を変化させる。これにより、従来技術における方法より、更に、精度良く分類することが可能になる。なお、各フレームに対して単一の閾値を適用するのではなく、フレームをブロックに分割し、ブロックごとに閾値を変化させることにより、画素の局所的な特性に応じた閾値を設定することができ、分類の精度をより高めることができる。
本発明を実施するための最良の実施形態について、以下では図面を用いて詳細に説明する。図1は、本発明による、動画像の各フレームの各画素を、前景又は背景に分類する装置のブロック図である。本発明による装置は、Wフレーム単位で前景と背景の分類処理を行う。このため、記憶部1に保存されている動画像の全フレームを、Wフレームずつバッファ2に読み出し、分布値生成部3、判定部4及び調整部5は、バッファ2に格納されている分類処理対象であるWフレームの各画素を、前景又は背景に分類し、分類結果を記憶部1に保存する。
図6は、本発明による前景背景分類方法全体のフロー図である。まず、閾値1から閾値6(以後、Th1からTh6と表記する。)を初期値に設定する(S1)。ここで、Th1及びTh2は、判定部4が使用し、その値については、処理の最中に動的に変更する。一方、Th3からTh6は、調整部5が使用し、その値は固定的である。続いて、処理対象のWフレームを選択、つまり、バッファ2に読み出す(S2)。分布値生成部3は、Wフレームのうち、Nフレームを選択し、選択したNフレームの画素値に基づき、各画素のカーネル分布を生成する(S3)。カーネル分布生成の詳細は後述するが、カーネル分布は、赤、緑、青、それぞれの画素値を変数とする関数であり、対応する画素の画素値を代入することで、その画素値の出現確率を示す分布値を出力する。
判定部4は、カーネル分布から得られる画素の分布値を、Th1及びTh2により区分けすることにより、当該画素を、前景画素(F)、背景画素(B)、不定画素(U)のいずれかに分類する(S4)。続いて、判定部4は、各フレームをブロックに分割し、ブロック内の前景画素数及び不定画素数の、隣接フレーム間における変化に基づきTh1とTh2を調整するための値の範囲である許容範囲を各ブロックについて求め、ブロックの許容範囲に基づき当該ブロックの画素に対して適用するTh1及びTh2を適応的に変更し、変更後のTh1及びTh2を用いて当該ブロックの各画素の再分類を行う(S5)。なお、再分類の詳細は後述する。
調整部5は、Th3からTh6により、不定画素の背景画素又は前景画素への振り分けと、最終調整を行い、当該Wフレームについての最終的な分類結果を記憶部1に出力する(S6)。以後、全フレームの前景背景分類処理が終了するまで、S3からS6の処理を繰り返す(S7及びS8)。以下、図6の各処理の詳細について述べる。
まず、分布値生成部3によるカーネル分布の生成について説明する。分布値生成部3は、各画素のカーネル分布を生成するため、バッファ2に格納されているWフレームからNフレームを選択する。選択するNフレームは、Wフレームの最初のNフレームとするが、最後のNフレームとしたり、1つおきに選択したりしても良い。もちろんWフレーム総てを利用しても良い。図2は、選択したNフレームを示しており、カーネル分布の生成は、各フレームの同一位置にある画素を単位として行う。つまり、各フレームがM個の画素から構成されている場合、M個のカーネル分布を生成する。
以下では、各フレームのj番目にある画素Pに対するカーネル分布の生成を述べる。図2によると、Pの画素値(赤,緑,青)は、第1フレームでは、(r,g,b)であり、第2フレームでは、(r,g,b)であり、第3フレームでは、(r,g,b)であり、以後、同様に、第Nフレームでは、(r,g,b)である。
分布値生成部3は、色別に、隣接フレーム間における画素値の差である差分値と、全差分値の中央値を求める。つまり、赤に対しては、N−1個の差分値dr、k=1〜N−1を、
dr=|r−r|、dr=|r−r|、・・・、drN−1=|rN−1−r
により求め、続いて差分値drからdrN−1の中央値mrを求める。同様に、緑についての中央値mgと、青についての中央値mbも求める。
画素値の分布は、一般的にガウス分布に従うと仮定でき、よって、中央値より大きい確率は1/4より大きくなるため、赤、緑、青それぞれの標準偏差σr、σg、σbを、以下の式で推定する。
σr=mr/(0.68×(20.5))
σg=mg/(0.68×(20.5))
σb=mb/(0.68×(20.5))
分布値生成部3は、上記、σr、σg、σbを標準偏差とし、画素値を平均値とするガウス分布G(平均値、標準偏差)を、色別に、各フレームについて生成する。具体的には、図2に示す様に、第1フレームの赤については、その画素値がrであるため、平均値と標準偏差がそれぞれrとσrであるガウス分布Gr1=G(r、σr)を、同様に、緑と青について、ガウス分布Gg1=G(g、σg)とガウス分布Gb1=G(b、σb)を、以後、第2から第Nのフレームについても同様にして、合計3×Nのガウス分布を生成する。
続いて、分布値生成部3は、同一フレームの各色に対するガウス分布の積を求め、その積をNフレームに渡り合計することにより、各フレームのj番目の画素の組に対するカーネル分布を生成する。つまり、第1フレームについては、赤、緑、青に対するガウス分布の積、G=Gr1×Gg1×Gb1を、同様に、第2から第NのフレームそれぞれについてG〜Gを計算し、第j番目の画素の組に対するカーネル分布KD(r,g,b)を、
KD(r,g,b)=G+G+・・・+G
により求める。なお、本発明において、カーネル分布の生成には、ガウス分布以外にも、例えば、ラプラシアン分布を使用することができる。
分布値生成部3は、この様にして求めた第j番目の画素の組のカーネル分布に、処理対象フレームそれぞれの第j番目の画素の画素値を代入して、処理対象フレームそれぞれの第j番目の画素の分布値を得る。
続いて、判定部4による前景画素、背景画素、不定画素の判定について説明する。判定部4は、各画素の分布値を、Th1とTh2により区分けすることで、各フレームの各画素を、前景画素、背景画素、不定画素のいずれかに分類する。図7は、画素分類の処理フロー図である。まず、対象フレームの全画素を背景画素と仮に分類する(S11)。その後、未処理の画素を1つ選択し(S12)、選択した画素の分布値がTh1より小さければ前景画素に分類し(S13及びS14)、Th1以上かつTh2未満であれば不定画素に分類(S15及びS16)することを全画素に対して行う(S17)。
上記カーネル分布の生成から明らかなように、他のフレームにおいても近い画素値が多く出現した場合には分布値は高くなり、他のフレームでよく出現した画素値とは離れている場合には分布値は低くなる。よって、Th2より大きい分布値の画素については、固定物、つまり、背景と判定し、逆に、Th1より小さい分布値の画素は、移動している物、つまり、前景と判断し、Th1とTh2の間の分布値については、とりあえず不定と判断する。
ただし、Th1及びTh2は動画像ごとに適切に調整されるべきものであるため、判定部4は、上記分類結果に基づきTh1及びTh2を適応的に修正して、各画素の再分類を行う。このため、判定部4は各フレームをブロックに分割し、ブロックごとに、2つの許容範囲FallowとUallowを求める。以下、2つの許容範囲FallowとUallowの算出について説明する。
図8は、許容範囲算出のフロー図であり、図3は、許容範囲の算出方法を説明する図である。なお、図3においては、1ブロックを16画素としている。図3によると、このブロックの画素の分類は、第1フレームにおいて、前景画素が6、不定画素が6、背景画素が4であり、第2フレームにおいて、前景画素が7、不定画素が6、背景画素が3であり、第3フレームにおいて、前景画素が8、不定画素が4、背景画素が4であり、第Wフレームにおいて、前景画素が5、不定画素が3、背景画素が8である。
判定部4は、処理対象ブロックを選択(S31)し、隣接フレーム間における前景画素数の差ΔFと、不定画素数の差ΔUを求め、W−1個のΔFの平均値MF及び標準偏差sFと、W−1個のΔUの平均値MU及び標準偏差sUを求める(S32)。この値から、許容範囲FallowとUallowを、0≦a<1である所定のaを用い、
MF−a×sF≦Fallow≦MF+a×sF
MU−a×sU≦Uallow≦MU+a×sU
により算出する(S33及びS34)。
なお、これら許容範囲によって判定する対象の値は、以下に述べる様に、整数であるため、下限については小数点以下を切上げ、上限については小数点以下を切り下げる。この処理を全部ブロックに対して行う(S35)。
続いて、ブロックの許容範囲FallowとUallowを用いた、判定部4による第2フレームから第Wフレームの、当該ブロック内の画素の再分類について説明する。ここでは、最初にWフレームの全画素の分類に使用したTh1が0.2、Th2が0.4、Fallowが−1から1、Uallowが−1から0であるものとして説明する。
図3に示す様に、第2フレームの第1フレームからの前景画素数の変化ΔF=+1であり、これはFallow内である。同様に、不定画素数の変化ΔU=0であり、これは、Uallow内である。したがって、第2フレームの当該ブロックに対するTh1及びTh2の変更は行わず、よって、第2フレームの当該ブロックに対する画素の分類の変更はない。
更に、第3フレームの第2フレームからの前景画素数の変化ΔF=+1であり、これはFallow内である。しかしながら、不定画素数の変化ΔU=−2であり、これは、Uallow内ではない。Uallow内とするためには、ΔUの数を増加させる必要があり、よって、Th2の値を増加させる。なお、この増加の単位はあらかじめ決めておく。ここでは、Th2の値を0.4から0.5に変化させたものとする。閾値を変更したため、第3フレームの当該ブロックの全画素を、変更後の閾値に基づき、図7に示す方法で再分類し、再度、第2フレームからのΔF及びΔUが、それぞれ、許容範囲Fallow及びUallow内にあるか否かを調べる。
図4は、変更後の閾値による、第3フレームに対する画素の再分類後の状態を示している。ここでは、Th2の値の変更により、第3フレームの画素の分類が、前景画素が8、不定画素が5、背景画素が3となり、これによりΔF=+1、ΔU=−1と、許容範囲内となったため、この段階で第3フレームに対する処理を終了する。なお、許容範囲にない場合には、更に閾値を変更する。
その後、第4フレームの当該ブロックの画素も変更後の閾値に基づき再分類し、第3フレームの分類との差分ΔFとΔUを計算し、この値が、それぞれ、FallowとUallow内であれば、第4フレームの分類をそのままとし、いずれかの差分が許容範囲内になければ、閾値を再度変更し、以後、第Wフレームまで同様の処理を行う。
なお、上記例においては、ΔUが下限未満であったためTh2を増加させたが、ΔUが上限より大きい場合にはTh2を減少させ、ΔFが下限未満である場合にはTh1を増加させ、ΔFが上限より大きい場合にはTh1を減少させることになる。更に、前景画素と不定画素の変化を使用したが、前景画素と背景画素であっても、不定画素と背景画素であっても良い。
図9は、画素の再分類のフロー図である。判定部4は、フレーム番号の初期値を2に設定し(S41)、処理対象フレームを選択し(S42)、前フレームの前景画素数及び背景画素数を、それぞれ、NF及びNUとする(S43)。続いて、現在のTh1及びTh2により処理対象フレームの処理対象ブロックの画素を分類し、前景画素数NFと、不定画素数NUを求め(S44)、NF−NFがFallowであり、かつ、NU−NUがUallowであるか否かを判定する(S45)。共に範囲内であれば、現在の分類を確定し(S47)、最終フレームでなければ、次のフレームに対して同じ処理を行う(S48及びS49)。また、Fallow又はUallow内になければ、Th1及び/又はTh2を変更し、共に範囲内となるまで、S44及びS45の処理を繰り返す。なお、上記処理は、各ブロックに対してそれぞれ行う。
以上、判定部4は、フレーム間での分類の変化に基づき閾値を適応的に調整して、調整後の閾値で画素を再分類し、分類結果を分類情報として調整部5に出力する。
続いて、調整部5による不定画素の、前景画素又は背景画素への振り分けと、最終調整について説明する。振り分け及び調整は、第1から第3の処理によりフレームを単位として行う。
図10は、調整部5における第1の処理のフロー図である。まず、半径R1及びR2、ここでR1>R2、を初期値に設定し(S51)、対象フレームの総ての不定画素を未処理とし(S52)、未処理の不定画素を1つ選択し(S53)、選択画素を背景画素又は不定画素に振り分ける(S54)。より詳しくは、所定の条件を満たす場合には、選択画素を背景画素に変更し、所定の条件を満たさない場合には選択画素を不定画素のままとする。
図5は、S54での振り分けを説明する図である。選択画素10を中心とし、半径R1の円11と、半径R2の円12を描き、円11内の前景画素の割合P(F)と、円12内の背景画素の割合P(B)をそれぞれ算出し、P(F)<Th3<P(B)であれば、選択画素10を背景画素に変更し、それ以外であれば不定画素のままとする。つまり、選択画素10を中心としたある領域内の前景画素数が比較的少なく、かつ、選択画素の近傍に前景画素が集中していない場合は、背景画素であると判定する。言い換えると、円11内の前景画素数及び背景画素数とその分布に基づき、選択画素を背景画素とするか、不定画素のままとするかを判定する。よって、Th3は、例えば、10%といった、比較的に小さい値とし、この値については、あらかじめ経験的に決めておく。
フレーム内の各不定画素に対してS54の処理を順次行って、全不定画素の処理が終了した場合(S55)、不定画素が存在するか否かを判定する(S56)。不定画素が存在しなければ第1の処理は終了し、存在する場合には、当該フレームの不定画素を未処理とする(S57)。続いて、未処理の画素を1つ選択し(S58)、選択画素を前景画素又は不定画素に振り分ける(S59)。
S54における背景画素又は不定画素への振り分けと同様、前景画素又は不定画素の振り分けは、図5の円11内の背景画素の割合P(B)と、円12内の前景画素の割合P(F)を、それぞれ算出し、P(B)<Th4<P(F)であれば、選択画素10を前景画素に変更することにより行う。なお、Th3とTh4を区別するのではなく、1つの閾値としても良い。
フレームの各不定画素に対してS59の処理を順次行って全不定画素の処理が終了した場合(S60)、不定画素が存在するか否かを判定する(S61)。不定画素が存在しなければ第1の処理は終了し、存在する場合には、半径R1及びR2を、所定の割合だけ減少させる(S62)。減少後のR2の大きさが1画素間の距離未満であれば、第1の処理は終了し、1画素以上あれば、変更後のR1及びR2を用いて、再度、S52以降の処理を行う(S63)。
続いて、第2の処理について説明する。図11は、調整部5における第2の処理のフロー図である。第1の処理において不定画素のままとなった画素のうち、未処理の画素を1つ選択し(S71)、半径R3を1画素に設定した上で(S72)、選択した画素を中心とする半径R3の円を描き、半径R3の円内にある前景画素数NFと、背景画素数NBを、それぞれ、算出する(S73)。NFとNBの差の絶対値を、NFとNBの合計で除した値をTh5と比較し(S74)、Th5以上である場合には、除した値がTh5未満となるまで、半径R3を所定の割合で増加(S75)させる。ただし、画素間の相関が極端に低くなる程大きな円で処理することを防ぐため、R3の最大値Rmaxをあらかじめ定義しておき、R3がRmaxを超えた場合には、選択した画素を不定画素のままとする(S76)。除した値がTh5未満となった場合、半径R3の円内にある各画素の画素値についてのNフレームの平均値及び標準偏差に基づき、選択画素を背景画素又は前景画素に分類する(S77)。
S77における選択画素の前景画素又は背景画素への振り分けは、半径R3内にある前景画素数と、背景画素数の差が小さい方が分類精度の点で好ましく、S74からS76の処理は、前景画素数と背景画素数をできるだけ等しくするために行っている。よって、Th5の値は例えば10%といった比較的小さい値を、あらかじめ経験的に決めておく。以下に、S77における分類の詳細について説明する。
まず、調整部5は、以下の4つの値を計算する。
D(μ,B)=ΣdpB |μpB−μ (1)
D(σ,B)=ΣdpB |σpB−σ (2)
D(μ,F)=ΣdqF |μqF−μ (3)
D(σ,F)=ΣdqF |σqF−σ (4)
ここで、μ及びσは、選択画素の画素値のNフレームに渡る平均値及び標準偏差であり、μpB及びσpBは、半径R3の円内にある背景画素pの画素値のNフレームに渡る平均値及び標準偏差であり、μqF及びσqFは、半径R3の円内にある前景画素qの画素値のNフレームに渡る平均値及び標準偏差であり、dpBは、背景画素pと選択画素との物理距離であり、dqFは、前景画素qと選択画素との物理距離である。また、式(1)及び(2)において、Σは、半径R3の円内にある総ての背景画素の和を取ることを意味し、式(3)及び(4)において、Σは、半径R3の円内にある総ての前景画素の和を取ることを意味している。なお、本実施形態において、Nフレームは、カーネル分布生成に使用したものと同じとしているが、異なるものでもあってもよく、更に、使用するフレーム数もNでなくとも良い。
式(1)から(4)の絶対値の部分は、統計的な距離を表しており、式(1)から(4)は、前景画素又は背景画素の、選択画素からの物理距離と統計的距離の積の和を示している。調整部5は、
D(μ,F)<D(μ,B)、かつ、D(σ,F)<D(σ,B)
である場合、平均値についても標準偏差についても、前景画素への距離が近いため、選択画素を前景画素に振り分け、
D(μ,F)>D(μ,B)、かつ、D(σ,F)>D(σ,B)
である場合には、選択画素を背景画素に振り分ける。
上記のどちらにも当てはまらない場合には、D(μ,F)+D(σ,F)の値と、D(μ,B)+D(σ,B)の値を比較し、D(μ,F)+D(σ,F)の方が小さければ選択画素を前景画素に、そうでなければ選択画素を背景画素に振り分ける。
調整部5は、総ての不定画素に対して上述した処理を実行することで第2の処理を終了する(S78)。
最後に、調整部5による第3の処理について説明する。まず、この時点で不定画素を総て前景画素に分類する。続いて、前景画素を1つ選択し、選択した画素を中心とする半径R4の円を描き、半径R4の円内の背景画素の割合とTh6とを比較し、背景画素の割合がTh6より大きい場合、選択画素を背景画素に振り分ける。この処理をフレーム内の総ての前景画素に対して行った後、逆の処理を総ての背景画素に対して行う。すなわち、背景画素を1つ選択し、選択した画素を中心とする半径R4の円を描き、半径R4の円内の前景画素の割合とTh6とを比較し、前景画素の割合がTh6より大きい場合、選択画素を前景画素に分類する。
第3の処理は、例えば、1つ又はごく少数の前景画素の周囲が、多数の背景画素に囲まれているような状況を修正するものであり、Th6には90%といった、比較的高い値を、あらかじめ経験的に決めておく。なお、第3の処理において最初に総ての不定画素を前景画素としたが、総ての不定画素を背景画素としても良い。
以上、Th1及びTh2の2つの閾値により、前景画素とも背景画素とも判断しにくいものについては一旦、不定画素であると判定し、これら不定画素については、不定画素を中心とするある領域にある画素の、分類結果やその分布、更には、画素値の統計的な距離と物理距離に基づき、どちらであるかを判定する。また、Th1及びTh2についても、一旦、Th1及びTh2による分類結果から、逆に、Th1及びTh2の値を見直して更新し、更新後の値で再分類する。これら処理により、従来技術より正確に前景と背景の分類を行うことが可能になる。
なお、本発明による装置は、上記装置の各部としてコンピュータを機能させるコンピュータプログラムにより実現することができる。また、本発明による方法は、コンピュータに上述した各処理を実行させるコンピュータプログラムにより実現することができる。このコンピュータプログラムは、コンピュータが読み取り可能な記憶媒体に記憶されて、又は、ネットワーク経由で配布が可能なものである。更に、本発明は、ハードウェアのみや、ソフトウェアのみならず、それらの組合せによっても実現可能である。
本発明による装置のブロック図である。 カーネル分布生成の説明図である。 許容範囲の算出方法を説明する図である。 画素の再分類を説明する図である。 判定部における第1の処理の説明図である。 本発明による前景背景分離方法全体のフロー図である。 画素分類のフロー図である。 許容範囲の算出のフロー図である。 画素の再分類のフロー図である。 判定部における第1の処理のフロー図である。 判定部における第2の処理のフロー図である
符号の説明
1 記憶部
2 バッファ
3 分布値生成部
4 判定部
5 調整部
10 画素
11、12 円

Claims (8)

  1. 動画像の各フレームの各画素を、前景に対応する前景画素と背景に対応する背景画素に分類する装置であって、
    処理対象である複数の処理対象フレームの各画素について、画素値の出現確率を示す画素の分布値を、処理対象フレームから選択した所定数のフレームの同一位置にある画素の画素値に基づき求める分布値生成手段と、
    画素の分布値、第1の閾値及び第2の閾値により、処理対象フレームの各画素を、前景画素、背景画素、不定である不定画素のいずれかに分類する判定手段と、
    判定手段による分類結果に基づき、処理対象フレームの各画素を前景画素又は背景画素に振り分ける調整手段と、
    を備え
    判定手段は、
    画素の分布値を、第1の閾値及び第2の閾値により区分することで、該画素を前景画素、背景画素、不定画素のいずれかに分類する第1の手段と、
    フレームを所定サイズのブロックに分割し、第1の手段による画素の分類結果から、各ブロックについて、隣接フレーム間における各分類数の変化を求め、求めた変化に基づき、各ブロックに適用する第1の閾値及び第2の閾値を更新し、更新後の第1の閾値及び第2の閾値により各ブロックの各画素を、前景画素、背景画素、不定画素のいずれかに分類する第2の手段と、
    を備えている装置。
  2. 第2の手段は、
    前景画素、不定画素、背景画素のいずれか2つを、第1の画素及び第2の画素とし、
    ブロック内にある第1の画素数の隣接フレーム間における変化の、処理対象フレームに渡る平均値及び標準偏差に基づき、該ブロックの第1の許容範囲を算出し、該ブロック内にある第2の画素数の隣接フレーム間における変化の、処理対象フレームに渡る平均値及び標準偏差に基づき、該ブロックの第2の許容範囲を算出する手段と、
    ブロック内にある第1の画素数の、1つ前のフレームからの変化である第1の変化数が、該ブロックの第1の許容範囲にない場合、又は、該ブロック内にある第2の画素数の、1つ前のフレームからの変化である第2の変化数が、該ブロックの第2の許容範囲にない場合、該ブロックに対する第1の閾値及び第2の閾値を、第1の変化数が第1の許容範囲内となり、第2の変化数が第2の許容範囲内となるまで更新する手段と、
    を備えている請求項に記載の装置。
  3. 調整手段は、
    不定画素を含む第1の領域内における前景画素数及び背景画素数と、第1の領域内における前景画素及び背景画素の分布に基づき、該不定画素を、前景画素、背景画素、不定画素のいずれかに振り分けることを、第1の領域の大きさを変更しながら繰り返し行う第3の手段を含んでいる、
    請求項1または2に記載の装置。
  4. 調整手段は、
    不定画素を含む第2の領域であって、第2の領域に含まれる前景画素数と背景画素数の差の、該前景画素数と該背景画素数の和に対する比が第3の閾値未満となる領域を求め、処理対象フレームの一部又は全部のフレームを選択フレームとし、該不定画素の画素値の選択フレームに渡る平均値及び標準偏差と、第2の領域内にある前景画素の画素値の選択フレームに渡る平均値及び標準偏差と、第2の領域内にある背景画素の画素値の選択フレームに渡る平均値及び標準偏差と、該不定画素と第2の領域内にある前景画素の物理距離と、該不定画素と第2の領域内にある背景画素の物理距離とに基づき、該不定画素を、前景画素又は背景画素に振り分ける第4の手段を含んでいる、
    請求項1からのいずれか1項に記載の装置。
  5. 調整手段は、
    フレーム内にある総ての不定画素を前景画素又は背景画素とし、前景画素を含む第3の領域内にある背景画素の割合が第4の閾値より大きい場合には、該前景画素を背景画素とし、背景画素を含む第3の領域内にある前景画素の割合が第4の閾値より大きい場合には、該背景画素を前景画素とする第5の手段を含んでいる、
    請求項1からのいずれか1項に記載の装置。
  6. 分布値生成手段は、
    処理対象フレームから選択した前記所定数のフレームの同一位置にある画素の組に含まれる各画素の画素値に基づき、該組の標準偏差を推定し、
    該組の画素、それぞれについて、推定した該組の標準偏差をその標準偏差とし、該画素の画素値を平均値とするガウス分布又はラプラシアン分布を生成し、該組に含まれる画素のガウス分布又はラプラシアン分布の和に基づき、該組のカーネル分布を生成し、
    該組と同一位置にある処理対象フレームの画素の画素値を、生成した該組のカーネル分布に代入して、該画素の分布値を求める、
    請求項1からのいずれか1項に記載の装置。
  7. 動画像の各フレームの各画素を、前景に対応する前景画素と背景に対応する背景画素に分類する方法であって、
    処理対象である複数の処理対象フレームの各画素について、画素値の出現確率を示す画素の分布値を、処理対象フレームから選択した所定数のフレームの同一位置にある画素の画素値に基づき求める分布値生成ステップと、
    画素の分布値、第1の閾値及び第2の閾値により、処理対象フレームの各画素を、前景画素、背景画素、不定である不定画素のいずれかに分類する判定ステップと、
    判定ステップでの分類結果に基づき、処理対象フレームの各画素を前景画素又は背景画素に振り分ける調整ステップと、
    を備え
    判定ステップは、
    画素の分布値を、第1の閾値及び第2の閾値により区分することで、該画素を前景画素、背景画素、不定画素のいずれかに分類する第1のステップと、
    第1のステップによる分類結果に基づき第1の閾値及び第2の閾値を更新し、更新後の第1の閾値及び第2の閾値により各画素を、前景画素、背景画素、不定画素のいずれかに再分類する第2のステップと、
    を備えている方法。
  8. 請求項1からのいずれか1項に記載の装置としてコンピュータを機能させることを特徴とするプログラム。
JP2007281538A 2007-10-30 2007-10-30 動画像の各画素の前景背景分類装置、方法及びプログラム Expired - Fee Related JP5045371B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007281538A JP5045371B2 (ja) 2007-10-30 2007-10-30 動画像の各画素の前景背景分類装置、方法及びプログラム
US12/240,467 US8204316B2 (en) 2007-10-30 2008-09-29 Apparatus, method and computer program for classifying pixels in a motion picture as foreground or background

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007281538A JP5045371B2 (ja) 2007-10-30 2007-10-30 動画像の各画素の前景背景分類装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2009110240A JP2009110240A (ja) 2009-05-21
JP5045371B2 true JP5045371B2 (ja) 2012-10-10

Family

ID=40582927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007281538A Expired - Fee Related JP5045371B2 (ja) 2007-10-30 2007-10-30 動画像の各画素の前景背景分類装置、方法及びプログラム

Country Status (2)

Country Link
US (1) US8204316B2 (ja)
JP (1) JP5045371B2 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101590511B1 (ko) * 2009-01-23 2016-02-02 에스케이텔레콤 주식회사 움직임 벡터 부호화/복호화 장치 및 방법과 그를 이용한 영상 부호화/복호화 장치 및 방법
JP4798236B2 (ja) * 2009-03-06 2011-10-19 カシオ計算機株式会社 撮像装置、画像処理方法及びプログラム
US8643701B2 (en) 2009-11-18 2014-02-04 University Of Illinois At Urbana-Champaign System for executing 3D propagation for depth image-based rendering
US9628722B2 (en) 2010-03-30 2017-04-18 Personify, Inc. Systems and methods for embedding a foreground video into a background feed based on a control input
JP5665401B2 (ja) * 2010-07-21 2015-02-04 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US9077958B2 (en) * 2010-08-30 2015-07-07 Honda Motor Co., Ltd. Road departure warning system
US8649592B2 (en) 2010-08-30 2014-02-11 University Of Illinois At Urbana-Champaign System for background subtraction with 3D camera
US8565482B2 (en) * 2011-02-28 2013-10-22 Seiko Epson Corporation Local difference pattern based local background modeling for object detection
JP5948983B2 (ja) * 2012-03-09 2016-07-06 オムロン株式会社 画像処理装置、画像処理方法、および画像処理プログラム
US9070004B2 (en) * 2012-05-03 2015-06-30 General Electric Company Automatic segmentation and characterization of cellular motion
US9014543B1 (en) * 2012-10-23 2015-04-21 Google Inc. Methods and systems configured for processing video frames into animation
US9159137B2 (en) * 2013-10-14 2015-10-13 National Taipei University Of Technology Probabilistic neural network based moving object detection method and an apparatus using the same
US9774548B2 (en) 2013-12-18 2017-09-26 Personify, Inc. Integrating user personas with chat sessions
US9485433B2 (en) 2013-12-31 2016-11-01 Personify, Inc. Systems and methods for iterative adjustment of video-capture settings based on identified persona
US9386303B2 (en) 2013-12-31 2016-07-05 Personify, Inc. Transmitting video and sharing content via a network using multiple encoding techniques
US9414016B2 (en) 2013-12-31 2016-08-09 Personify, Inc. System and methods for persona identification using combined probability maps
US9443162B2 (en) * 2014-09-25 2016-09-13 Aricent Holdings Luxembourg S.A.R.L. Intelligent background selection and image segmentation
WO2016154598A1 (en) * 2015-03-25 2016-09-29 Carnegie Mellon University System and method for adaptive, rapidly deployable, human-intelligent sensor feeds
US9916668B2 (en) 2015-05-19 2018-03-13 Personify, Inc. Methods and systems for identifying background in video data using geometric primitives
US9563962B2 (en) 2015-05-19 2017-02-07 Personify, Inc. Methods and systems for assigning pixels distance-cost values using a flood fill technique
US10244224B2 (en) 2015-05-26 2019-03-26 Personify, Inc. Methods and systems for classifying pixels as foreground using both short-range depth data and long-range depth data
US9607397B2 (en) 2015-09-01 2017-03-28 Personify, Inc. Methods and systems for generating a user-hair-color model
TWI569212B (zh) * 2015-12-10 2017-02-01 財團法人工業技術研究院 影像辨識方法
US9883155B2 (en) 2016-06-14 2018-01-30 Personify, Inc. Methods and systems for combining foreground video and background video using chromatic matching
US9881207B1 (en) 2016-10-25 2018-01-30 Personify, Inc. Methods and systems for real-time user extraction using deep learning networks
CN108229262B (zh) * 2016-12-22 2021-10-15 腾讯科技(深圳)有限公司 一种色情视频检测方法及装置
EP3582181B1 (en) 2018-06-14 2020-04-01 Axis AB Method, device and system for determining whether pixel positions in an image frame belong to a background or a foreground
US11257226B1 (en) * 2019-07-17 2022-02-22 Amazon Technologies, Inc. Low-overhead motion classification
US11776129B2 (en) * 2020-12-16 2023-10-03 Qualcomm Incorporated Semantic refinement of image regions
US11800056B2 (en) 2021-02-11 2023-10-24 Logitech Europe S.A. Smart webcam system
US11800048B2 (en) 2021-02-24 2023-10-24 Logitech Europe S.A. Image generating system with background replacement or modification capabilities
CN115330756B (zh) * 2022-10-11 2023-02-28 天津恒宇医疗科技有限公司 基于光影特征的oct图像中导丝识别方法及识别系统
US20240357104A1 (en) * 2023-04-21 2024-10-24 Nokia Technologies Oy Determining regions of interest using learned image codec for machines

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4054125B2 (ja) * 1999-03-03 2008-02-27 日本放送協会 動画像オブジェクト抽出装置
GB2358098A (en) * 2000-01-06 2001-07-11 Sharp Kk Method of segmenting a pixelled image
US7277580B2 (en) * 2001-12-12 2007-10-02 Sony Corporation Multiple thresholding for video frame segmentation
US6987882B2 (en) * 2002-07-01 2006-01-17 Xerox Corporation Separation system for Multiple Raster Content (MRC) representation of documents
US20060170769A1 (en) * 2005-01-31 2006-08-03 Jianpeng Zhou Human and object recognition in digital video
US7865015B2 (en) * 2006-02-22 2011-01-04 Huper Laboratories Co. Ltd. Method for video object segmentation
US7916944B2 (en) * 2007-01-31 2011-03-29 Fuji Xerox Co., Ltd. System and method for feature level foreground segmentation
US8131077B2 (en) * 2007-04-03 2012-03-06 Flashfoto, Inc. Systems and methods for segmenting an image based on perceptual information
US8094943B2 (en) * 2007-09-27 2012-01-10 Behavioral Recognition Systems, Inc. Background-foreground module for video analysis system

Also Published As

Publication number Publication date
JP2009110240A (ja) 2009-05-21
US8204316B2 (en) 2012-06-19
US20090110299A1 (en) 2009-04-30

Similar Documents

Publication Publication Date Title
JP5045371B2 (ja) 動画像の各画素の前景背景分類装置、方法及びプログラム
Sajid et al. Background subtraction for static & moving camera
US12002259B2 (en) Image processing apparatus, training apparatus, image processing method, training method, and storage medium
US8094936B2 (en) Method and apparatus to segment motion area in real-time to detect motion in surveillance camera system
CN113537099A (zh) 一种公路隧道火灾烟雾动态检测方法
US9179092B2 (en) System and method producing high definition video from low definition video
CN111126115B (zh) 暴力分拣行为识别方法和装置
US8331713B2 (en) Image processing apparatus, image processing method, program and learning apparatus
US20150104062A1 (en) Probabilistic neural network based moving object detection method and an apparatus using the same
CN111401202A (zh) 一种基于深度学习的行人口罩佩戴实时检测方法
JP2021064054A (ja) 路上障害物検知装置、路上障害物検知方法、及び路上障害物検知プログラム
CN115908154A (zh) 基于图像处理的视频后期颗粒噪声去除方法
CN112561946A (zh) 一种动态目标检测方法
CN106557765A (zh) 注意检测装置以及注意检测方法
CN113065379A (zh) 融合图像质量的图像检测方法、装置、电子设备
JP7279817B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
Nghiem et al. Background subtraction in people detection framework for RGB-D cameras
CN116309270B (zh) 一种基于双目图像的输电线路典型缺陷识别方法
CN101567088B (zh) 一种运动物体检测的方法和装置
CN110717910B (zh) 基于卷积神经网络的ct图像目标检测方法及ct扫描仪
Jin et al. Fusing Canny operator with vibe algorithm for target detection
CN107169997A (zh) 面向夜间环境下的背景减除算法
CN116051605B (zh) 一种多层级深度特征融合及自适应重检测的目标跟踪方法
Li et al. Image object detection algorithm based on improved Gaussian mixture model
Mahajan et al. Image contrast enhancement using Gaussian Mixture model and genetic algorithm

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100709

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100823

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120619

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120702

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees