[go: up one dir, main page]

JP2008176791A - グラウンドトルース・データからの合成画像及びビデオの生成 - Google Patents

グラウンドトルース・データからの合成画像及びビデオの生成 Download PDF

Info

Publication number
JP2008176791A
JP2008176791A JP2008008112A JP2008008112A JP2008176791A JP 2008176791 A JP2008176791 A JP 2008176791A JP 2008008112 A JP2008008112 A JP 2008008112A JP 2008008112 A JP2008008112 A JP 2008008112A JP 2008176791 A JP2008176791 A JP 2008176791A
Authority
JP
Japan
Prior art keywords
image
generating
document
series
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008008112A
Other languages
English (en)
Other versions
JP5049798B2 (ja
Inventor
Andrew Lookingbill
ルッキンビル アンドリュー
Jonathan J Hull
ジェー ハル ジョナサン
Emilio R Antunez
アール アンテュネス エミリオ
Ke Qifa
コォ チィファ
Berna Erol
エロール ベルナ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2008176791A publication Critical patent/JP2008176791A/ja
Application granted granted Critical
Publication of JP5049798B2 publication Critical patent/JP5049798B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • H04N1/10Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces
    • H04N1/107Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces with manual scanning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/1607Correcting image deformation, e.g. trapezoidal deformation caused by perspective
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/04Scanning arrangements
    • H04N2201/0402Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207
    • H04N2201/0414Scanning an image in a series of overlapping zones

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Studio Devices (AREA)

Abstract

【課題】ビデオを生成するシステム及び方法を開示する。
【解決手段】物体情報が受信される。基準点に対する物体の動きのパスが生成される。基準フレームの一連の画像及びグラウンドが、グラウンドトルース、及び生成されたパスから生成される。画像を生成するシステム及び方法を開示する。物体情報が受信される。画像データ及びグラウンドトルースを、位置、画像記述、カメラ特性、及び画像歪みパラメータを用いて生成することができる。文書と基準点との間の位置関係が判定される。文書及びグラウンドトルースの画像が、物体情報及び位置関係から、かつ、文書のユーザ指定環境に応じて生成される。
【選択図】図1

Description

本発明は一般に、画像及びビデオの生成の分野に関し、特に、グラウンドトルース・データを用いた、画像及びビデオの生成に関する。
種々のモデルが、画像劣化を考慮した文書画像生成に用いられている。文書画像劣化の適切なモデルは、数多くの論文の主題となっている(Y. Li, D. Lopresti、G. Nagy及びA. Tomkinsによる「Validation of Image Defect Models for Optical Character Recognition (IEEE Trans. Pattern Anal. Mach. Intell. 18,2 (Feb. 1996), pp. 99-108)」)。Pavlidasは、水平方向及び垂直方向のスケーリング、回転、サンプリング・レート、及び量子化閾値を含むモデルを提案している(T. Pavlidasによる「Effects of Distortion on the Recognition Rate of a Structural OCR System (Pro. Conf. on Comp. Vision and Pattern Recog., pp. 303-309, Washington, DC, 1983)」)。Bairdは、可変パラメータが、フォント・サイズ、空間サンプリング・レート、回転、水平方向及び垂直方向のスケーリング、水平方向及び垂直方向の平行移動、画素変位、ガウス点広がり関数、画素センサ感度、及び量子化閾値を含むモデルを提案している(H. Bairdによる「Document Image Defect Models (Proc. Of IAPR Workshop on Syntactic and Structural Pattern Recognition, pp. 38-46, Murray Hill, NJ June 1990)」、及びH. Bairdによる「The State of the Art of Document Image Degradation Modeling (Proc. of 4th LAPR International Workshop on Document Analysis Systems, Rio de Janeiro, Brazil, pp. 1-16, 2000)」)。Smithは、点広がり関数の幅、及び2値化の閾値を変えるモデルを試している(E. H. Barney Smith及びT. Andersenによる「Text Degradations and OCR Training (International Conference on Document Analysis and Recognition 2005, Seoul, Korea, August 2005)」)。Khoubyari及びHullは、文字ストロークを厚くし、次いで、特定の黒画素を白画素に任意に換えることによって文字の粗をシミュレートしている(Khoubyari, S.、及びJ. J. Hullによる「Keyword Location in Noisy Document Images (Second Annual Symposium on Document Analysis and Information Retrieval, Las Vegas, NV, pp. 217-231, April, 1993)」)。Kanungo他は、製本文書の走査によって生じるカール歪みをモデリングしている(Kanungo, T.、Haralick, R.M.及びPhillips, I.による「Global and Local Document Degradation Models (Document Analysis and Recognition, 1993., Proceedings of the Second International Conference on Document Analysis and Recognition ICDAR-93, Volume, Issue, 20-22 Oct 1993, pp. 730-734)」)。更にZiは、関心文書の下にあるか、又は関心文書の裏面上にあるテキスト及び画像からのブリードスルーの効果を考察している(G. Ziによる「Groundtruth Generation and Document Image Degradation (University of Maryland Language and Media Processing Laboratory Technical Report (LAMP-TR-121), 2005)」)。
前述のモデルは、スキャナ上の画像、又は2値画像を扱う。前述のモデルは、非平面形態の撮像を規定するものでない。更に、前述のモデルは、ビデオを撮像するために、大量のデータ組を用いる。より一般化された撮像システム・モデルが必要である。
開示されるシステム及び方法の一実施例によって、ビデオが生成される。物体情報が受信される。基準点に対する物体の動きのパスが生成される。基準フレームの一連の画像及びグラウンドトルースが、物体情報、及び生成されたパスから生成される。
開示されるシステム及び方法の一実施例によって、画像が生成される。物体情報が受信される。画像データ及びグラウンドトルースを、位置、画像記述、カメラ特性、及び画像歪みパラメータを用いて生成することができる。文書と基準点との間の位置関係が判定される。文書及びグラウンドトルースの画像が、物体情報及び位置関係から、かつ、文書のユーザ指定環境に応じて生成される。
本明細書記載の特徴及び利点は、全てを含む訳でなく、特に、多くの更なる特徴及び利点が、図面、明細書及び特許請求の範囲にかんがみて当業者に明らかになる。更に、本明細書において使用する文言は主に、読みやすさ及び教示の目的で選択されており、本発明の主題について、輪郭を描く、又は周囲に線を引くために選択されていないことがあり得る。
開示された実施例は、添付図面とともに解釈される、詳細な説明及び特許請求の範囲から、より容易に明らかになる他の利点及び特性を有する。
図面及び以下の説明は、例証の目的でのみ、本発明の好ましい実施例に関する。以下の記載から、本明細書及び特許請求の範囲記載の構造及び方法の別の実施例が、特許請求の範囲に係わる発明の原理から逸脱しない限り用いることができる実行可能な代替策として容易に認識されよう。
次に、いくつかの実施例を詳細に参照する。これらの例は添付図面に示す。実行可能な限り、類似又は同様の参照符号を用い得るものであり、類似又は同様の参照符号は、類似又は同様の機能を示し得る。図は、例証の目的でのみ、本発明の実施例を表す。本明細書及び特許請求の範囲記載の原理から逸脱しない限り本明細書及び特許請求の範囲記載の構造及び方法の別の実施例を用いることができることを当業者は以下の説明から容易に認識するであろう。
画像及びビデオを生成する方法及びシステムは、グラウンドトルース・データ、及びカメラのパラメータのモデル、並びに、撮像されている物体の環境を用いた、画像、又は一連の画像の生成を含む。モデリングは、画像劣化、及びハンドヘルド型装置を含む種々の画像捕捉装置によって捕捉される画像を含み得る。方法及びシステムは、画像捕捉装置、及び撮像されている文書の任意の配置、並びに、ソース文書及び任意の照明状態の等長的変形も可能にする。方法及びシステムは、フォーカス・ブラー、モーション・ブラー、ヒストグラム圧縮、センサ雑音、内部及び外部のカメラ・パラメータ、シャドウ、センサ分解能、口径食、背景クラッタ、文書変形や、鏡面反射特性、周囲特性、並びに、拡散照明及び材料特性の効果もモデリングする。一実施例では、これは、仮想カメラの位置、及びその内部パラメータに基づいた仮想画像を生成するための一般的な光線追跡モデルを用いることによって達成される。
図1は、画像生成システム100を示す図である。プリンタ102は、印刷されたソース文書106を生成し、印刷情報を画像生成システム100に供給する。画像捕捉装置104は、ソース文書106を検出し、捕捉し、画像108を生成する。画像捕捉装置104は例えば、ハンドヘルド型画像捕捉装置(ディジタル・カメラや携帯電話機など)、又は固定型画像捕捉装置(ウェブ・カメラなど)であり得る。例として、画像捕捉装置104は、本出願においてはカメラ104としても表す。画像生成システム100は、プリンタ102からの印刷情報に応じて仮想画像110を生成する。印刷情報(図示せず)は、ソース文書106を表し、ページ記述言語(例えば、ポストスクリプト(登録商標)又はPCL)におけるデータであり得る。印刷情報は、コンピュータ・オペレーティング・システム(例えば、ウィンドウズ(登録商標)XP)によってラスタ画像に変換されるグラフィックス・デバイス・インタプリタ(GDI)コマンド系列でもあり得る。印刷情報は、ソース文書における物体毎のグラウンドトルース・データを含み得る。仮想画像110は、グラウンドトルース・データを含む、印刷情報から生成される印刷文書106の生成画像である。一実施例では、ページ記述言語ファイルは、インタープリタ(ゴーストスクリプトなど)によってラスタ表現(tiff、jpegやbmpなど)に変換される。一実施例では、仮想画像110は単一の画像である。別の実施例では、仮想画像110は、画像又はフレーム(ビデオなど)の系列である。一実施例では、仮想画像110は画像108を表す。画像生成システム100は、印刷情報、カメラ104のパラメータ、及びソース文書106の環境パラメータを用いて仮想画像110を生成する。
画像生成システム100は、インテル社によって製造されたペンティアム(登録商標)4又はジオン・プロセッサなどのプロセッサを含み得るものであり、画像生成をソフトウェアとして実行する。画像生成システム100は全体的に、又は部分的に、パソコンのビデオ・カード上のグラフィックス処理装置(GPU)上のソフトウェアとして生成することもできる。
画像生成システム100を用いて顔認識又は医療撮像システムのためのデータを生成することができる。
図2は、画像生成器100であり得るビデオ生成器200の一実施例を示すブロック図である。ビデオ生成器200は、パス生成器202及び画像生成モデル204を備える。
パス生成器202は、特定の画像(文書106など)に対する、カメラの位置の座標系列を生成する。一実施例では、パス生成器202は、カメラ104の移動に対する人間の行動のモデル、カメラ104の移動のパス、及びカメラ104のフレーム・レートに応じて座標系列(座標xt、yt、zt、pt、tt及びztとして示す)を生成する。一実施例では、移動のパスは一連の制御点として規定され、人間モデルは、制御点間のカメラを移動させるための人間行動を表す。カメラ104の移動のパスは、個人がカメラによって行う移動を規定するためにユーザによって規定されるか、又はカメラ104から受信することができる。
画像生成モデル204は、カメラ104の特性、画像歪みパラメータ、及び、単一画像又はフレーム系列を(座標組毎に1つ)生成するために、プリンタ102からの画像記述及びグラウンドトルース・データを備える物体情報を用いることができる。カメラ104の特性、及び画像歪みパラメータは、ユーザ入力することができる。各フレームは、ソース文書106の特定のワープ及びシャドウを補正するよう歪めさせる。ソース文書106についての受信物体情報は、画像の生成を可能にする情報を含む。一連の画像の場合、動きを表す大量のデータ組が通常、用いられる。画像生成モデル204は、画像を表す物体情報(顔認識や医療撮像などの場合においては3次元でもよい)を用いて、画像又はビデオを生成する。一実施例では、物体情報は、文書のラスタ画像(例えば、tiff、jpeg、bmp等)、並びに、各文字の識別情報及び位置を規定したグラウンドトルース情報を含む。(注:位置は、文字の左上隅のx-y、並びにこれをカバーするボックスにおける列及び行の数として規定することが可能である)。別の実施例では、物体情報は、ページ記述言語(PDL)(ポストスクリプトやPCLなど)における印刷情報であり、画像生成モデル204の処理の一部は、ゴーストスクリプトなどのインタープリタを用いてPDLからの文書の画像を「レンダリングする」。別の実施例では、顔認識や医療撮像などの3次元アプリケーションの物体情報が、仮想現実マークアップ言語(VRML)又は拡張可能3D(X3D)ファイルとして供給され、画像生成モデル204の処理の一部は、オープンVRML、Xj3Dやフラックスなどのインタープリタを用いてオブジェクトの3次元ビューをレンダリングする。画像生成モデル204は、仮想画像110のグラウンドトルース・データを生成することができる。一実施例では、ソース文書106における何れかの入力x-y座標を、仮想画像110における対応する出力画像x’-y’に変換する写像テーブルが出力される。これは、図3のソース文書において示すバウンディング・ボックス・データの位置などの何れかのグラウンドトルース情報の幾何学的位置の変換を可能にする。仮想画像110における何れかのx’-y’座標を、ソース文書106における対応するx-y位置に変換する「逆」写像テーブルも画像生成モデル204によって提供することができる。写像テーブルは、ソース文書又は実画像に生じるx-y又はx’-y’毎にエントリを有する通常のアレイ又はハッシュ・テーブルの形式をとり得る。別の実施例では、x-y又はx’-y’対が与えられ、他方の画像における対応する対を計算する関数を提供することができる。写像関数の例には、射影変換、及び他の周知の幾何変換が含まれる。特定の場合には、写像テーブルは、2つ以上の出力位置を設けることができる。更に、前述の位置は、入力位置に寄与した画像特性(例えば、強度、色等)の量を示す尤度値と関連付けることができる。よって、画像生成モデル204は、単一画像のグラウンドトルース・データを受信し、一連のビデオ・フレームのグラウンドトルース・データを生成することができる。これは、仮想画像110を生成する前に生成されるグラウンドトルース・データの量を削減する。一実施例では、画像生成モデル204は、画像捕捉装置104のパラメータ、センサ雑音、コントラスト劣化、シャドウ、口径食、フォーカス・ブラー、モーション・ブラー、背景、等長的表面(isometric surface)、及び全般照明を用いて仮想画像110を生成する。画像生成モデル204は、ワープを含む画像の動きのパラメータ、及びシャドウを含み得る。画像生成モデル204は、機械学習を用いてパラメータを推定することができる。
図3は、ソース文書106、及びグラウンドトルース・データによって表すマーキングされた領域301の画像である。マーキングされた領域301のグラウンドトルースは、ソース文書106上のフォントフェース、フォント・サイズ、及び位置を含み得る。画像生成モデル204は、プリンタ102若しくは別のソースからグラウンドトルースを受信し、又は、グラウンドトルースを印刷情報から生成する。グラウンドトルースは、画像上のマーキングされた領域301のオーバレイとして処理することができる。画像のグランドトルースは、ソース文書、及びそれがどのようにして生成されたか(文書の対応する紙バージョンが印刷された日時及び場所、プリンタ、PC、並びに文書を印刷した個人の識別情報など)についてのメタデータも含むことが可能である。グラウンドトルースは、元のソース・ファイル(例えば、ワード、PDF等)の位置、パス及び名前も含むことが可能である。これは、ソース・ファイルを後に位置特定するうえで十分である。
図4は、ソース文書106からカメラ104までの光線追跡を示す図である。画像生成モデル204は光線追跡を用いて、図5に関して後述する外部カメラ・パラメータを用いてソース文書106の部分からカメラ104までの光線を追跡することによって仮想画像110を生成する。光線を、文書106の各部分からカメラ104まで追跡して文書の画像を生成する。カメラ104をパス生成器202からの座標によって移動させるにつれ、光線が、文書106からカメラ104まで追跡される。
図5は、画像生成モデル204(カメラ外部パラメータ・モデル502、カメラ内部モデル504及び複数の効果モデル506、508、510、512、514、516、518、520、522、524及び526を備える)を示すブロック図である。効果モデル506、508、510、512、514、516、518、520、522、524及び526は、センサ雑音モデル506、ヒストグラム効果モデル508、シャドウ・マスク・モデル510、口径食モデル512、フォーカス・ブラー・モデル514、モーション・ブラー・モデル516、等長的表面モデル518、全般照明モデル520、背景モデル522、画像圧縮モデル524、及びブリードスルー・モデル526を含む。画像生成モデル204は、光線追跡にカメラ外部パラメータ・モデル502を用いる。画像生成モデル204は、カメラ内部パラメータ・モデル504を用いて、カメラ104からの画像に対する効果をシミュレートする。画像生成モデル204は、効果モデル506、508、510、512、514、516、518、520、522、524及び526を用いて、画像106に対する写真、照明及び環境をシミュレートする。
カメラ104の外部パラメータは、画像106に対する、カメラ104の平行移動及び向きの情報を含み得る。一実施例では、カメラ104の位置は、ソース文書106(その中心を原点とみなす)に対する、カメラ104のカメラ位置(例えば、単位:インチ(2.5cm))の大局x、y及びz値によって表す。カメラの向きは、3つのオイラー角度(,,X、 ,,Y、及び,,Z)によって表す。一実施例では、画像生成モデル204は、光線追跡を用いて画像110を、外部パラメータ502の外部パラメータを用いて生成する。
図6は、ソース文書106の上方の例示的なビデオ軌道601を示す3次元図である。パス生成器202は、人間行動のモデル、及び配列制御点組を用いて、特定のソース文書106のカメラ104の位置を推定する。パス生成器202は、カメラ104のフレーム・レートでの、制御点間の軌道に沿ったカメラ104の動きを計算する。
人間行動モデルは、シミュレートされているタスクの名前、制御点間を移動するための時間量、及びカメラ104が各点に滞留する時間を求める数学的な時間の関数、制御点間のパスを求める数学的な遷移動作関数、及び各制御点に達した際のカメラ104の移動を求める数学的な滞留動作関数を規定する。制御点は、配列された(x、y、z、thetax、thetay、thetaz)の値の組として設けられる。シミュレートされるタスクの名前は、「情報ブラウジング」、「挿入のためのポイント・アンド・クリック」、「取り出しのためのポイント・アンド・クリック」、「拡張現実インタフェース」、「マウス」、「情報ブラウジング」及び「ジェスチャ」を含むが、それらに限定されない。数学的な時間の関数は、移動時間及び滞留時間のユーザ規定定数組を含む。フィッツの法則又はアコットの法則を用いて、点間をナビゲートするために必要な時間を予測することが可能である。数学的な遷移動作関数には、配列制御点組、各制御点対間の移動の合計時間、及びカメラ・フレーム・レート(通常、サンプリング・レート(通常、秒毎フレーム単位のサンプリング・レートとして規定される)が与えられる。遷移動作関数は、フレームが捕捉される都度、カメラの位置を算出する。数学的な遷移動作関数は、直線などのユーザ指定定数、又は、フレームが生成される都度のカメラの位置の手作業の指定を含む。特定の場合には、ナル遷移動作関数が用いられ、システムは制御点においてのみ、画像を生成する。画像数は、滞留時間、及びカメラのフレーム・レートによって求められる。線形動的システムは、遷移動作関数の別の例である。カルマン・フィルタは、人間動作の例から訓練することが可能な遷移動作関数であり、制限点間でカメラを人間がどのようにして移動させるかをシミュレートするパスを生成することが可能である。他の遷移動作関数の例には、拡張カルマン・フィルタ、粒子フィルタ、拡張粒子フィルタ、ベイズ・フィルタ、拡張ベイズ・フィルタ、及び当該技術分野において周知の他の手法を含む。数学的な滞留動作関数には、制御点としての開始位置、その点においてカメラが滞留する時間量、及び、その時間中のカメラの移動の規定が与えられる。移動の例には、継続的な滞留が含まれる。通常、カメラ104は、人間の手をシミュレートするために、制御点付近でジッタリングする。他の移動には、ズームイン及びズームアウトが含まれる。これは、ソース文書106までの距離を調節することによって、ユーザがカメラ104をフォーカスさせようとしていることをシミュレートする。別の滞留動作関数には回転がある。滞留動作関数は、前述の基本動作、及び他の動作の任意の組み合わせでもあり得る。滞留動作関数は、滞留中にフレームが生成される都度の、カメラの位置の手作業の規定であり得る。各動作に割り当てられる滞留時間量は一様であるか、ユーザ規定されるか、又は、別の数学的な関数によって規定することが可能である。
図19A、図19B及び図19Cは、人間行動モデル及び関連した制御点の3つの実施例を示す図である。図19Aに示す例では、「情報ブラウジング」という名前のタスクがシミュレートされる。制御点間の時間は、点間をナビゲートするための時間、及び各点において停止するための時間を求める定数組として規定される。線形動的システムを用いて、制御点間のパスを求める。第1の制御点p0は、カメラ104が静止状態にあることを規定している(すなわち、座標は全て、ゼロである)。第2の制御点p1は、文書の左上隅の右に2インチ(5cm)、文書の左上隅から下に3インチ(7.5cm)、文書のページの上方に3インチ(7.5cm)であり、文書に垂直であることを規定する。3つのオイラー角度はゼロである。p1は、x、y、z位置及び別々のオイラー角度における変化を規定する。thetax=20度、thetax=10度、及びthetaz=10度である。
図19Bに示す例では、「ポイント・アンド・クリック」という名前のタスクがシミュレートされる。制御点間の時間は、フィッツの法則を施すことによって求められ、滞留時間は、定数(5秒)として規定される。動作関数は、カルマン・フィルタによって求められる。制御点は、静止状態における最初の点p0として規定される。カメラ104は、文書の左2インチ(5cm)、及び、最上部から下3インチ(7.5cm)の所にある。第2の制御点は、ソース文書106上の最も左上の段落の中心を算出する関数によって自動的に求められる。
図19Cに示す例では、「拡張現実」という名前のタスクがシミュレートされる。3つの制御点が設けられている(最初のp0は、静止状態のカメラを示している)。p0からp1にナビゲートするための時間は、アコットの法則によって算出される。カメラはp1において6秒間滞留する。p0とp1との間の遷移動作はカルマン・フィルタによって求められ、カメラ104は、p1において滞留中にズームイン及びズームアウトを行う。p1からp2に移動するための時間はフィッツの法則によって求められ、遷移動作はカルマン・フィルタによって求められる。p2において滞留している間、カメラ104は、滞留時間の40%の間、ズームイン及びズームアウトを行い、滞留時間の残りの60%の間、左に回転する。
パス生成器202は、位置、速度、加速度及びジャークを含む一連の状態として、制御点間の軌道601を求める遷移動作関数として離散時間線形動的システムを用いることができる。一実施例では、パス生成器202は雑音を含む。図7は、最小エネルギ駆動力を用いた、軌道601の推定を示す3次元図である。一実施例では、位置推定は、ビデオ系列中の自己移動の推定のためにビデオ・モザイキングを行うためのビデオ特徴マッチング手法(内容を本明細書及び特許請求の範囲に援用する、T.Sato、S.Ikeda、M.Kanbara、A.Iketani、N.Nakajima、N.Yokoya及びK.Yamadaによる「High-resolution Video Mosaicing for Documents and Photos for Estimating Camera Motion (Proceedings of SPIE 5229, 246 (2004))」記載のビデオ特徴マッチング手法など)を用いることができる。一実施例では、グラウンドトルース・データの存在が理由で、一般的な画像登録(フーリエ・メラン変換など)を用いることができる。
一実施例では、パス生成器202は、制御点間のパスを求める遷移動作関数として最小エネルギ解析を行う。カメラ104の位置及び向きは、3つの位置パラメータ及び3つのオイラー角度によって表す。前述はそれぞれ、離散時間線形動的システムを用いて更新される。例えば、ソース文書106の原点に対する、カメラ104の位置(単位:インチ(2.5cm))はXで表される。時間nにおける、カメラのX位置の状態は、
Xn=[P[n]V[n]A[n]J[n]]’
によって表す。
ここで、P[n]は、X方向におけるカメラ104の位置であり、V[n]は速度であり、A[n]は加速度であり、J[n]はジャークである。時間n+1における、カメラのX位置の状態は、
Xn+1=A*Xn+B*u(t)
の関係によって表す。
ここで、u(t)は駆動力として知られており、
であり、
である。
線形動的システムから、状態Xdexがnステップで到達可能な場合、可制御行列は、
Cn=[B AB An-1B]
である。
開始点から、所望の状態Xdexにnステップで達するための最小エネルギ解を用いれば、
u(t)=CnT(CnCnT)-1Xdex
が得られる。
画像生成モデル204は、カメラ内部モデル504を用いて、画像110を生成するためのカメラ内部パラメータを求めることもできる。画像生成モデル204は光線追跡をカメラ内部パラメータを用いて算出して、カメラ原点からのセンサの各画像を通って放たれる光線がソース文書106と交差する所を求める。一実施例では、カメラの内部パラメータは、2つの焦点距離(fx及びfy(単位:画素))、主点座標((ccx及びccy)(単位:画素))、スキュー係数、並びに、放射方向歪み及び接線方向歪みを表す5つの係数である。別の実施例では、内部パラメータは、内容を本明細書及び特許請求の範囲において援用する、Z. Zhangによる「A flexible new technique for camera calibration (IEEE Transactions on Pattern Analysis and Machine Intelligence、 v. 22, no.11, Nox. 2000, 1330-1334)」記載のモデルを用いて解析される。図8は、20個の画像のチェッカーボード校正目標のサンプル、及び校正の結果を示す図である。校正は、焦点距離、光学的中心、スキュー、並びに、放射方向歪み及び接線方向歪みを補正することができる。あるいは、カメラ104のタイプのストック・パラメータ組を用いることができる。
画像生成モデル204は、x方向及びy方向に半画素分だけ、画像平面における追跡光線のx、y位置をジッタリングし、次いで、光線の、ページとの間で生じる4つの交差の平均値を用いることによって、最終画像におけるエイリアシングを削減することができる。
画像生成モデル204は、画像を生成するためのセンサ雑音モデル506を含み得る。一実施例では、センサ雑音モデル506は、内容を本明細書及び特許請求の範囲において援用する、Costantini, R.及びSusstrunk, S. による「Virtual Sensor Design (Proceedings of the SPIE, Volume 5301, pp. 408-419 (2004))」の仮想センサ設計などの信号依存性雑音及び信号に依存しない雑音を備えるセンサ雑音モデルである。別の実施例では、センサ雑音モデル506は、画素利得の非一様性のみを含む。センサ雑音モデル506は、平均1、及び、雑音の所望レベルを達成するよう調節可能な範囲を有する一様な変数を含み得る。画像生成モデル204は、光線追跡によって算出された画素の算出強度値で、利得の非一様性を乗算する。
図9は、例示的なセンサ雑音モデル506を示す図である。画素利得の非位置養成のスケール係数を実画像について機械学習手法を用いて推定することが可能である。一実施例では、センサ雑音モデルは、仮想画像、及びマッチングされる実画像における空間周波数の分布の類似度を最大にするための滑降シンプレックス(ネルダー・ミード)アルゴリズムを含む(内容を本明細書及び特許請求の範囲において援用する、Kanungo, T.及びZheng, Q.による「A Downhill Simplex Algorithm for Estimating Morphological Degradation Model Parameters (University of Maryland Technical Report, LAMP-RT-006)」を参照されたい)。
一実施例では、センサ雑音モデル506は、以下のように定義される近傍周波数分布(NFD)を用いる。画像における8x8画素ブロック901毎に、2DFFT(2次元高速フーリエ変換(FFT))が算出される(902に図示している)。ブロックは大半がテキスト又は大半が背景である旨をFFTのDC係数が示す場合、ブロックをこの時点で廃棄することができる。2DFFTの振幅の対数の左上隅の対角成分が平均化される。合計で6つの周波数帯が検討される。
次いで、6ビットの特徴ベクトル903が構成される。各ビットは、かなり大きな成分が周波数帯それぞれにおいて存在しているか否かを示す。この場合における「かなり大きな」は、同様な画像の母集団の平均(事前に求められる)よりも大きいとして定義される。
画像内の8x8画素ブロック全てのこの特徴ベクトル903のサンプルが、コルモゴロフ-スミルノフ検定(KS検定)の2サンプルのバージョンを用いて別の画像からのサンプルと比較することが可能である。滑降シンプレックス・アルゴリズムのコスト関数入力として、センサ雑音モデル506は、KS検定がもたらすKS統計を用いる。(2つの母集団が実際に、単一の母集団から引き出されているという)ナル仮説を2つの母集団が満たす状態に近付くにつれてゼロに達する。滑降シンプレックス・アルゴリズムを用いる利点は、目的関数の導関数を計算しない点である。最適化関数は凸でないことがあり得るので、異なる当初シンプレックス推測を有するアルゴリズムの複数のランダムな再起動を行うことができる。一実施例では、0.01程度の画素利得非一様性スケール値は、アルゴリズムが収束する所である。
画像生成モデル204は、ヒストグラム効果モデル508を含む。実際に、実際のセンサを用いて捕捉された画像のヒストグラムの範囲は、シーンにおいて存在している強度値の範囲よりも小さい。ヒストグラム効果モデル508は、実際のカメラによって撮られた特定のサンプル画像において生起する値の範囲内に収まるよう仮想画像のヒストグラム値を写像することによるか、又は、ルックアップ・テーブル変換によってその画素値累積分布が画像例の画素値の累積分布に一致するように仮想画像のヒストグラムを変換しようとする、より複雑なヒストグラム・マッチングによってこの効果をモデリングすることができる。
一実施例では、ヒストグラム効果モデル508は、最大値及び最小値を有する所望のヒストグラムを含み、仮想画像のヒストグラムは、所望のヒストグラムに一致するよう調節される。別の実施例では、所望のヒストグラムは、ユーザ規定のサンプル画像から得られる。
画像生成モデル204は、文書画像の上方に投げかけられるシャドウを生成するためのシャドウ・マスク・モデル510を含む。ユーザの腕又はカメラ自体によって文書画像の上方に投げかけられることが多い大きな大域的なシャドウをモデリングするために、シャドウ・マスクを用いる。図10Aは、シャドウ・マスク1001を示す図である。図10Bは、シャドウ・マスク1001を用いて生成されるシャドウを有する仮想画像を示す図である。シャドウ・マスク1001を要素単位で仮想画像と乗算して、シャドウを有する仮想画像を生成する。
一実施例では、ユーザ規定のサンプル画像における大域的なシャドウ・マスクは、SIGGRAPH2003におけるポスター・プログラム「Shadow Removal from a Real Image Based on Shadow Density」においてM.Baba、M.Mukunoki及びN.Asadaによって提案された手法を用いて推定される。サンプル画像はまず最大値フィルタを用いてフィルタリングされ、次いで、最小値フィルタを用いてフィルタリングされ、次いで、平滑化フィルタを用いてフィルタリングされる。画像の大域的な輝度が結果として生じる。仮想文書画像生成器では、これはシャドウ・マスクとして直接用いられるが、更なる閾値化を行って別個の半影マスク及び本影マスクをもたらすことが可能である。図11Aは、シャドウ・マスク・モデル510を用いて生成された画像の種々のシャドウ、及び半影領域及び本影領域を示す図である。図11Bは、シャドウ、半影領域及び本影領域を有する画像の輝度を示す3次元図である。別の実施例では、いくつかのシャドウ・マスクが、特定のカメラ位置(X、Y、Z、thetax、thetay、thetaz)について予め算出される。シャドウ・マスク・モデル510は、位置がカメラの位置に最も近いシャドウ・マスクを選ぶよう修正される。至近性についての決定は、ユークリッド距離尺度や他の一般に用いられる距離尺度(例えば、都市ブロック距離等)によって行うことが可能である。別の代替的な実施例では、シャドウ・マスクは、カメラの位置、全域照明モデル、シャドウを投げかけ得る物体のモデルを前提として動的に生成される。シャドウ・マスク・モデル510は、カメラ位置を動的シャドウ生成アルゴリズムに供給し、算出するシャドウを仮想画像と要素単位で乗算して、シャドウを有する仮想画像を生成するよう修正される。
画像生成モデル204は口径食モデル512を含む。口径食モデル512は、画像画素に対応する光線と、カメラの光学軸との間の角度の増加に伴う、輝度における「コサイン4乗」減衰を、その角度のコサインの4乗で画素値を乗算することによって捕捉するための、口径食に似た効果をモデル画像において含む。実画像における口径食は、レンズ・エレメントによる妨害によって遠隔の軸外光線が物理アパーチャに達しないことの結果である。口径食モデル512は例えば、内容を本明細書及び特許請求の範囲に援用する、Aggarwal. M.、Hua, H.及びAhuja, N.による「On Cosine-fourth and Vignetting Effects in Real Lenses (Int.Conf. on Computer Vision (ICCV) Proceedings, Volume 1, Vancouver, Canada, July 9-12, 2001 ページ:472-479)」記載の口径食モデルであり得る。図12は、口径食を有する画像を示す図である。一実施例では、口径食効果は、コサイン4乗効果をディセーブルすることが可能であるように、やはり、シャドウ・マスク推定手順によってうまく捕捉される。
画像生成モデル204は、パス生成器202からの座標、及びカメラ内部パラメータを用いて、フォーカスされていないカメラ104によってもたらされるブラーを補正するためのフォーカス・ブラー・モデル514を含む。一実施例では、フォーカス・ブラー・モデル514は、カメラ104の光学軸に沿った、ページまでの距離と、カメラが「フォーカスされている」として経験的に判定される距離(何れも単位:インチ(2.5cm))との間の差の絶対値として算出される標準偏差を有する単一ガウシアン点広がり関数(PSF)を含む。フォーカス・ブラー・モデル514は次いで、フォーカス・ブラー・スケール・パラメータ(フォーカス・ブラーの振幅を制御するためにユーザ規定することができる)で標準偏差をスケーリングする。ブラーはよって、カメラの移動に伴って線形的に増減する。図13Aは、フォーカス・ブラー・モデルのガウシアンPSFを示す3次元図である。図13Bは、フォーカス・ブラー・モデル514を用いて形成された画像を示す図である。
フォーカス・ブラー・スケール・パラメータは、近傍周波数分布及び滑降シンプレックス・アルゴリズム(センサ雑音パラメータとともに前述している)を用いて推定することもできる。滑降シンプレックス・アルゴリズムは、複数のパラメータを同時に最適化することが可能である。一実施例では、フォーカス・ブラー・スケール係数は、約0.3乃至約0.5の範囲である。
画像生成モデル204は、画像106に対する、カメラ104の動きによってもたらされる画像のブラーをモデリングするモーション・ブラー・モデル516を含む。一実施例では、モーション・ブラー・モデル516は、共通のブラーを用いて画像の部分全てについてブラーをモデリングする大域的なブラー・モデルを含む。このモデルは、カメラの実際のパラメータ(露光時間など)を含まず、画素と画像との間の距離差を含まない。後者は、特定のセンサ画素が他のセンサ画素よりも紙に近いことを補正しておらず、よって、モーション・ブラーの低下があり得る。この実施例において、大域的なブラーは、露光時間中にカメラ104が移動した場合に生じる、2つの直交方向(x及びyなど)におけるブラーの量を表し、ユーザが選択することができるブラー・パラメータblur_dx及びblur_dyによって方向及び振幅が求められるパスに沿った画素値の平均によって、最後の画像の各画素を置き換えることによって達成される、人工的であるが、知覚的にそれらしく見えるモーション・ブラーである。
別の実施例では、モーション・ブラー・モデル516は、対応する別々のカメラ位置の複数の中間画像を生成し、これらの画像を一画像に合成してブラーを表す。画像は、k回再レンダリングされる(部分的な位置変動は、所望の露光時間及びカメラ速度に対応する)。例証的な例として、モーション・ブラー・モデル516は、blur_dx及びblur_dyプラー・パラメータ組をゼロにセットし、特定の速度で移動しており、特定の露光時間を有していた場合にカメラ104が占める、設定された個数(k)の等間隔の中間位置において算出することによって仮想画像のブラーを生成する。最後の画像は、前述のk個の中間画像の平均である。この実施例は、より大きなkとともに増加する、最終画像の平滑性と、kとともに線形に増加する、画像組をレンダリングするために要する時間との間のトレードオフを提供し得る。図14は、モーション・ブラー・モデル516を用いてブラーが生じたビデオ・フレームの例証的な例の図である。
画像生成モデル204は、可展面(例えば、折った紙又は製本ボリュームのワープやカールによってもたらされる)を有する画像を生成するために等長的表面モデル518を含む。可展面は例えば、「引き裂くことも引き伸ばすこともなく平面上に展開することが可能な」表面であり得る(内容を本明細書及び特許請求の範囲において援用する、J.Liang、D.Dementhon、及びD.Doermannによる「Flattening Curved Documents in Images (Proc. Of the IEEE Conf. on Computer Vision and Pattern Recognition (CVPR)、 2005)」)。これは等距離写像である。文書の表面に沿った距離は同じ状態に留まるからである。このようにしてワーピングするものとしてソース文書がモデリングされた場合、光線・平面交差の算出は、より一般的な光線・関数交差になる。図15A及び図15Bは、画像の一方向における二次曲線群及び三次曲線群それぞれを示す3次元図である。
画像生成モデル204は、材料特性及び光源特性の効果をモデリングするための全般照明モデル520を含む。上記効果は、内容を本明細書及び特許請求の範囲において援用する、「Real-Time Rendering(A.K.Peters, Natick、 MA. 2nd Edition (2002), pp. 70-84)」にT.Akenine-Moller及びE.Hainesによって記載されているように、周囲成分、拡散反射成分及び鏡面反射成分を含み得る。上記効果は、光線追跡中に算出することができる。合計照度の周囲成分は、紙の周囲(ambient)定数と光源の周囲定数との積である(例えば、光源が周囲光を何ら照らさない場合、その周囲定数はゼロになる。)拡散反射成分は、紙の拡散反射定数と光源の拡散反射定数との積を、紙上の関心点から光源へのベクトルと、その点における法線ベクトルとの内積で乗算した結果である。最後に、鏡面反射成分は、紙の鏡面反射係数と光源の鏡面反射係数との積と、照明ベクトルと法線ベクトルとの間の正規化された半分のベクトルと、法線ベクトルとの内積とを乗算したものに輝き成分のべき指数をかけたものである。周囲成分、拡散反射成分及び鏡面反射成分が加算されると、その合計照度値を用いて、仮想画像における対応する画素の振幅を変調する。図16は、ストロボ写真の効果を再現するために全般照明モデルによって生成される仮想画像を示す図である。第1の実施例では、紙(又は一般には物体)並びに光源の周囲係数、拡散反射係数及び鏡面反射係数と、光源の位置の数は固定である。別の実施例では、光源の位置は、経過時間、フレーム番号、又は任意のユーザ設定の関数として変わり得る。別の代替的な実施例では、周囲係数、拡散反射係数及び鏡面反射係数も、経過時間、フレーム番号、又は任意のユーザ設定の関数として動的に変わり得る。これは、物体の物理組成における変化(その自然時効や、紙文書においては、高照度の光や特定の他の力(熱など)の存在下でのその退色)をシミュレートすることを可能にする。これは、感熱紙文書の退色をシミュレートすることが可能である。
画像生成モデル204は、背景クラッタの効果をまねるための背景モデル522を含む。ユーザは、ソース文書106の境界の外側にある画像領域内に表示する対象の背景画像を規定することができる。図17は、例示的な背景画像を示す。背景クラッタは、検査画像又は訓練画像において余分な情報をもたらし、それによって、光学式文字認識などのアプリケーションにおいて問題を引き起こす。背景モデルは、追跡光線が文書のマージンの外側の紙平面と交差した場合の画素値を光線追跡が供給するための背景としてデスクトップ・シーンの高分解能画像を用いることによって背景クラッタをまねる。一実施例では、画像は、小さな被写界深度を有する。シーン平面はカメラの画像平面と平行である。単一の固定背景画像を用いることができる。別の実施例では、いくつかの背景画像が提供され、背景モデルは、乱数生成器を用いてそれらの1つを確率的に選ぶ。例えば、時間の60%は一画像を用いることができ、時間の30%は別の画像を用いることができ、全フレームの10%は別の画像を用いることができる。更に別の代替的な実施例では、背景画像はビデオ・クリップとして提供することが可能であり、背景として用いる特定のフレームは、最初に生成されたフレームから経過した時間、先行して生成されたフレームの数によって、又は、ユーザ設定によって判定される。ソース文書がビデオ・ディスプレイ上に示されており、背景が動的に変わった場合にそうであるように背景がソース文書と共平面である場合、背景として用いられる特定のフレームを光線追跡することが可能である。別の実施例では、背景として用いられる特定のフレームが、カメラからのその距離についてソース文書とは異なる設定の下ではあるが、カメラ(X、Y、Z、thetax、thetay、thetaz)の位置を前提として、光線追跡することが可能である。別の実施例では、光線追跡して背景画像を生成することが可能な、背景の3次元モデルを用いる。
画像生成モデル204は、カメラ104の画像圧縮をモデリングするための画像圧縮モデル524を含む。画像圧縮は例えば、静止画像圧縮又はビデオ圧縮であり得る。画像生成モデル204は、異なる圧縮レベルの種々の画像形式で仮想画像を生成する。
画像生成モデル204は、ページ・ブリードスルーのモデル526を含み得る。ブリードスルーは、走査文書画像では、多くの場合、生じる。一実施例では、ページ・ブリードスルー・モデルは、第2の文書画像(本のブリードスルーの場合に、長手方向軸を中心に回転させることができる)を第1の文書画像と合成することを含む。光線がソース文書と交差する場合、以下の発見的方法を用いることができる。光線がテキスト画素(暗画素)と交差すると、センサ画素値がその値にセットされる。しかし、光線が非テキスト画素(明画素)と交差すると、センサ画素値は、A*,,+B*(1-,,)にセットされる。ここでAはその画素におけるソース文書の値であり、Bはその画素における反対側の文書の値であり、「,,」は混合値である(例えば、0.85は、現実的な可視ブリードスルーに適切な値であり得る)。
図18は、画像生成システム100の動作を示すフロー図である。画像生成システム100は、人間行動のモデル、制御点組、及びカメラのフレーム・レート、ラスタ及びグラウンドトルースに変換可能な物体情報、カメラ特性、並びに画像歪みパラメータを含む、動きの規定を受信する。パス生成器202は、基準点に対する、物体の動きのパスを生成する(1804)か、又は、基準点に対する、物体の位置を生成する。画像生成モデル204は、グラウンドトルース及び生成パスから参照フレームの一連の画像、又は画像を生成する(1806)。画像生成モデル204は、パス又は位置、物体情報、カメラ特性及び画像歪みパラメータを用いて、グラウンドトルース情報を含む画像又はビデオ・データも生成することができる。
一実施例では、画像生成システム100は、物体情報からの個人の画像又はビデオを生成し、顔認識のために、一又は複数の個人の実際の画像又はビデオとこれが比較される。別の実施例では、個人の一部分の画像又はビデオが、医療撮像との比較のために、かつ診断のために生成される。
本明細書における、「一実施例」又は「実施例」への参照は、そうした実施例に関して記載した特定の構成要素、特徴、構造又は特性が少なくとも一実施例に含まれることを意味する。本明細書中の種々の箇所における句「一実施例における」は必ずしも、その全てが同じ実施例を表すものでない。
「結合された」及び「接続された」の表現、並びにそれらの派生形を用いて、特定の実施例を説明していることがあり得る。前述の語は、互いに同義であることを意図するものでない。例えば、「接続された」の語を用いて特定の実施例を説明して、2つ以上の構成要素が互いに直接、物理的に又は電気的に接触していることを示すことができる。別の例では、「結合された」の語を用いて特定の実施例を説明して、2つ以上の構成要素が互いに直接、物理的に又は電気的に接触していることを示すことができる。しかし、「結合された}の語は、2つ以上の構成要素が互いに直接、接触している訳でないが、なお、互いに協調、又は相互作用することも意味し得る。実施例はこの意味合いで限定される訳でない。
本明細書及び特許請求の範囲記載の通り、「comprises」、「comprising」、「includes」、「including」、「has」、「having」又はその何れかの他の変形が、排他的でない包含をカバーすることを意図している。例えば、構成要素のリストを有する処理、方法、物若しくは装置は、必ずしも前述の構成要素に限定される訳でない一方、明記されていないか、又は前述の処理、方法、物若しくは装置に固有の他の構成要素を含み得る。更に、別途明記していない限り、「or」は、包含的論理和を表し、排他的論理和は表さない。例えば、条件A又はBは、以下の何れかによって満たされる(Aが真であり(又は存在しており)、Bが偽である(又は存在していない)場合と、Aが偽であり(又は存在しておらず)、Bが真である(又は存在している)場合と、A及びBが真であり(又は存在している)場合)。
更に、「a」又は「an」を用いて。本発明の構成要素及び構成部分を表す。これは、便宜上、かつ、本発明の概略を示すために行っているに過ぎない。前述の記載は、1つ又は少なくとも1つを含むとして読むものとし、単数形は、そうでないことを意味することが明らかでない限り、複数形も含む。
本明細書及び特許請求の範囲を読めば、当業者は、本明細書及び特許請求の範囲に開示された原理によって、グラウンドトルースを用いて合成画像又はビデオを生成するシステム及び方法のなお更に別の構造設計及び機能設計を認識するであろう。よって、特定の実施例及び応用例を例証し、説明したが、本発明は、本明細書及び特許請求の範囲に開示されたまさにその構成及び構成部分に限定されず、当業者に明らかになる種々の修正、変更及び変形を、本発明の方法並びに装置の装置、動作及び詳細において特許請求の範囲記載の本発明の趣旨及び範囲から逸脱しない限り、行うことができる。
本発明による画像生成システムを示す図である。 図1の画像生成システムの一実施例を示すブロック図である。 図1のソース文書、及びソース文書のグラウンドトルースを示すマーキングした領域の画像を示す図である。 ソース文書からカメラまでの光線追跡を示す図である。 図2の画像生成システムの画像生成モデルを示すブロック図である。 ソース文書の上方の例示的なビデオ軌道を示す3次元図である。 最小エネルギ駆動力を用いた、図6の軌道の推定を示す3次元図である。 20個の画像のチェッカーボード校正目標のサンプル、及びカメラ校正ツールボックスを示す図である。 センサ雑音モデルを示す図である。 シャドウ・マスクを示す図である。 図10Aのシャドウ・マスクを用いて生成されるシャドウを有する仮想画像を示す図である。 画像の種々のシャドウ、半影領域及び本影領域を示す図である。 シャドウ、半影領域及び本影領域を有する画像の輝度を示す3次元図である。 口径食を有する画像を示す図である。 フォーカス・ブラー・モデルのガウシアンPSFを示す3次元図である。 フォーカス・ブラー・モデルを用いて形成された画像を示す図である。 モーション・ブラー・モデルを用いてブラーが生じたビデオ・フレームの例証的な例を示す図である。 画像の一方向における二次曲線群を示す3次元図である。 画像の一方向における三次曲線群を示す3次元図である。 ストロボ写真の効果を再現するために全般照明モデルによって生成される仮想画像を示す図である。 例示的な背景画像を示す図である。 図1の画像生成システムの動作を示すフロー図である。 人間行動モデル及び関連した制御点の実施例を示す図である。 人間行動モデル及び関連した制御点の別の実施例を示す図である。 人間行動モデル及び関連した制御点の更に別の実施例を示す図である。
符号の説明
100 画像生成システム
102 プリンタ
104 画像捕捉装置
106 ソース文書
108 画像
110 仮想画像
200 ビデオ生成器
202 パス生成器
204 画像生成モデル

Claims (21)

  1. ビデオを生成する方法であって、
    物体を表す物体情報を受信する工程と、
    基準点に対する前記物体の動きのパスを生成する工程と、
    基準フレームの一連の画像及びグラウンドトルースを前記物体情報及び前記生成されたパスから生成する工程とを備える方法。
  2. 請求項1記載の方法であって、前記基準点が前記物体の画像を受信する方法。
  3. 請求項1記載の方法であって、ハンドヘルド型撮像装置が前記基準点において配置される方法。
  4. 請求項1記載の方法であって、前記一連の画像を生成する工程が、
    前記物体に対する、画像装置の位置及び向きに基づいて前記一連の画像を生成する工程を含む方法。
  5. 請求項1記載の方法であって、前記一連の画像を生成する工程が、
    画像捕捉装置の特性に応じて前記一連の画像を生成する工程を含む方法。
  6. 請求項5記載の方法であって、画像捕捉装置の前記特性がヒストグラム効果を含む方法。
  7. 請求項1記載の方法であって、前記一連の画像を生成する工程が、
    画像圧縮に応じて前記一連の画像を生成する工程を含む方法。
  8. 請求項1記載の方法であって、前記一連の画像を生成する工程が、
    モーション・ブラーに応じて前記一連の画像を生成する工程を含む方法。
  9. 請求項1記載の方法であって、前記一連の画像を生成する工程が、
    フォーカス・ブラーに応じて前記一連の画像を生成する工程を含む方法。
  10. 請求項1記載の方法であって、前記一連の画像を生成する工程が、
    背景に応じて前記一連の画像を生成する工程を含む方法。
  11. 請求項1記載の方法であって、前記一連の画像を生成する工程が、
    カメラ内部特性に応じて前記一連の画像を生成する工程を含む方法。
  12. 請求項1記載の方法であって、前記一連の画像を生成する工程が、等長的表面に応じて前記一連の画像を生成する工程を含む方法。
  13. 請求項1記載の方法であって、前記物体が人間の一部分である方法。
  14. ビデオ生成器であって、
    物体を表す物体情報を受信するためのインタフェースと、
    基準点に対する、前記物体の動きのパスを生成するためのパス生成器と、
    基準フレームの一連の画像及びグラウンドトルースを前記物体情報及び前記生成されたパスから生成するための画像生成器とを備えるビデオ生成器。
  15. 画像を生成する方法であって、
    文書を表す物体情報を受信する工程と、
    前記文書と基準点との間の位置関係を判定する工程と、
    前記文書及びグラウンドトルースの画像を、前記物体情報及び前記位置関係から、かつ、前記文書のユーザ指定環境に応じて生成する工程とを備える方法。
  16. 請求項15記載の方法であって、前記文書及びグラウンドトルースの画像を生成する工程が、
    位置、画像の記述、カメラ特性、及び画像歪みパラメータを用いて画像データ及びグラウンドトルースを生成する工程を備える方法。
  17. 請求項15記載の方法であって、前記文書の前記ユーザ指定環境が前記文書の照明を含む方法。
  18. 請求項15記載の方法であって、前記文書の前記ユーザ指定環境が、前記文書の画像を捕捉する撮像捕捉装置の特性を含み、前記生成された画像が、前記捕捉された画像の視覚画像である方法。
  19. 請求項15記載の方法であって、前記文書の前記ユーザ指定環境が前記文書の特性を含む方法。
  20. 請求項19記載の方法であって、前記文書の特性が前記文書の形状を含む方法。
  21. 画像生成器であって、
    文書を表す物体情報を受信するためのインタフェースと、
    前記文書と基準点との間の位置関係を判定するためのプロセッサと、
    前記文書及びグラウンドトルースの画像を、前記物体情報及び前記位置関係から、かつ、前記文書のユーザ指定環境に応じて生成するための生成器とを備える画像生成器。
JP2008008112A 2007-01-18 2008-01-17 グラウンドトルース・データからの合成画像及びビデオの生成 Expired - Fee Related JP5049798B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/624,466 US7970171B2 (en) 2007-01-18 2007-01-18 Synthetic image and video generation from ground truth data
US11/624,466 2007-01-18

Publications (2)

Publication Number Publication Date
JP2008176791A true JP2008176791A (ja) 2008-07-31
JP5049798B2 JP5049798B2 (ja) 2012-10-17

Family

ID=39641290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008008112A Expired - Fee Related JP5049798B2 (ja) 2007-01-18 2008-01-17 グラウンドトルース・データからの合成画像及びビデオの生成

Country Status (2)

Country Link
US (2) US7970171B2 (ja)
JP (1) JP5049798B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014026662A (ja) * 2008-09-15 2014-02-06 Ricoh Co Ltd 検索システム、検索方法及びコンピュータプログラム
JP2014520351A (ja) * 2011-07-08 2014-08-21 レストレーション ロボティクス,インク. カメラシステムの座標系の較正および変換

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009013845A1 (ja) * 2007-07-20 2009-01-29 Techwell Japan K.K. 画像処理装置及びカメラシステム
KR101457741B1 (ko) * 2008-03-20 2014-11-03 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. 썸네일 기반의 이미지 품질 검사
GB2465791A (en) * 2008-11-28 2010-06-02 Sony Corp Rendering shadows in augmented reality scenes
US8649600B2 (en) * 2009-07-10 2014-02-11 Palo Alto Research Center Incorporated System and method for segmenting text lines in documents
US8442319B2 (en) * 2009-07-10 2013-05-14 Palo Alto Research Center Incorporated System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
US8452086B2 (en) * 2009-07-10 2013-05-28 Palo Alto Research Center Incorporated System and user interface for machine-assisted human labeling of pixels in an image
US8416263B2 (en) 2010-03-08 2013-04-09 Empire Technology Development, Llc Alignment of objects in augmented reality
US8488900B2 (en) 2010-06-23 2013-07-16 Digimarc Corporation Identifying and redressing shadows in connection with digital watermarking and fingerprinting
US8644638B2 (en) * 2011-02-25 2014-02-04 Microsoft Corporation Automatic localized adjustment of image shadows and highlights
US8849819B2 (en) 2011-08-05 2014-09-30 Deacon Johnson System and method for controlling and organizing metadata associated with on-line content
US8693731B2 (en) * 2012-01-17 2014-04-08 Leap Motion, Inc. Enhanced contrast for object detection and characterization by optical imaging
US8699819B1 (en) * 2012-05-10 2014-04-15 Google Inc. Mosaicing documents for translation using video streams
US8913829B2 (en) * 2012-06-05 2014-12-16 Tandent Vision Science, Inc. Automatic processing scale estimation for use in an image process
US9916514B2 (en) 2012-06-11 2018-03-13 Amazon Technologies, Inc. Text recognition driven functionality
US9070230B2 (en) * 2013-07-23 2015-06-30 Adobe Systems Incorporated Simulating strobe effects with digital image content
US9807372B2 (en) * 2014-02-12 2017-10-31 Htc Corporation Focused image generation single depth information from multiple images from multiple sensors
US9437394B1 (en) 2014-03-28 2016-09-06 Carl Zeiss Microscopy Ltd. Method of operating a charged particle microscope and charged particle microscope operating according to such method
US20160189350A1 (en) * 2014-12-30 2016-06-30 Texas Instruments Incorporated System and method for remapping of image to correct optical distortions
US9684970B2 (en) 2015-02-27 2017-06-20 Qualcomm Incorporated Fast adaptive estimation of motion blur for coherent rendering
US10440350B2 (en) * 2015-03-03 2019-10-08 Ditto Technologies, Inc. Constructing a user's face model using particle filters
JP2016170522A (ja) * 2015-03-11 2016-09-23 株式会社東芝 移動体検出装置
WO2016198929A1 (en) * 2015-06-12 2016-12-15 Mathur Ashok Chand Method and apparatus of very much faster 3d printer
US10977880B2 (en) * 2017-05-31 2021-04-13 General Electric Company Hover time remaining for an aircraft
US10474890B2 (en) * 2017-07-13 2019-11-12 Intuit, Inc. Simulating image capture
GB2568087B (en) * 2017-11-03 2022-07-20 Imagination Tech Ltd Activation functions for deep neural networks
US10943387B2 (en) * 2018-08-30 2021-03-09 Nvidia Corporation Generating scenes containing shadows using pixel noise reduction techniques
RU2709661C1 (ru) 2018-09-19 2019-12-19 Общество с ограниченной ответственностью "Аби Продакшн" Обучение нейронных сетей для обработки изображений с помощью синтетических фотореалистичных содержащих знаки изображений
RU2721187C1 (ru) 2019-03-29 2020-05-18 Общество с ограниченной ответственностью "Аби Продакшн" Обучение языковых моделей с использованием текстовых корпусов, содержащих реалистичные ошибки оптического распознавания символов (ocr)
WO2021044186A1 (en) * 2019-09-02 2021-03-11 Trieye Ltd. Multi-view image fusion by image space equalization and stereo-based rectification from two different cameras
CA3240453A1 (en) * 2019-11-18 2021-05-27 Elbit Systems Ltd. A system and method for mixed reality
US11580387B2 (en) * 2019-12-29 2023-02-14 International Business Machines Corporation Combining point observations with raster data for machine learning
WO2021146699A1 (en) * 2020-01-17 2021-07-22 Massachusetts Institute Of Technology Systems and methods for utilizing synthetic medical images generated using a neural network
CN113221601B (zh) * 2020-01-21 2024-08-06 深圳富泰宏精密工业有限公司 字符识别方法、装置及计算机可读存储介质
US11861313B2 (en) 2020-02-02 2024-01-02 International Business Machines Corporation Multi-level linguistic alignment in specific user targeted messaging
US11080819B1 (en) * 2020-07-08 2021-08-03 Adobe Inc. Generating developable depth images using rank minimization
US11030488B1 (en) 2020-12-31 2021-06-08 VoyagerX, Inc. Book scanning using machine-trained model
US10991081B1 (en) * 2020-12-31 2021-04-27 VoyagerX, Inc. Book scanning using machine-trained model
US11727535B2 (en) * 2021-01-14 2023-08-15 Nvidia Corporation Using intrinsic functions for shadow denoising in ray tracing applications

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000268179A (ja) * 1999-01-14 2000-09-29 Oojisu Soken:Kk 三次元形状情報取得方法及び装置,二次元画像取得方法及び装置並びに記録媒体
JP2001211359A (ja) * 2000-01-25 2001-08-03 Olympus Optical Co Ltd 電子カメラ
JP2005286395A (ja) * 2004-03-26 2005-10-13 Fuji Photo Film Co Ltd 画像処理システムおよびその方法
JP2006053568A (ja) * 2004-08-13 2006-02-23 Fujitsu Ltd 劣化文字画像生成プログラム、方法および装置
JP2006059351A (ja) * 2004-08-18 2006-03-02 Fujitsu Ltd 劣化辞書生成プログラム、方法および装置
JP2006215756A (ja) * 2005-02-02 2006-08-17 Dainippon Ink & Chem Inc 画像処理装置および画像処理方法ならびにそのプログラム

Family Cites Families (311)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1915993A (en) 1931-04-27 1933-06-27 Gen Electric Statistical machine
JPS54130680U (ja) 1978-03-03 1979-09-11
US4759075A (en) 1983-03-14 1988-07-19 Ana Tech Corporation Method and apparatus for vectorizing documents and symbol recognition
JPH01144165A (ja) 1987-11-30 1989-06-06 Toshiba Corp 電子ファイリング装置
US5035302A (en) 1989-03-03 1991-07-30 Otis Elevator Company "Artificial Intelligence" based learning system predicting "Peak-Period" times for elevator dispatching
JP2795719B2 (ja) 1990-03-07 1998-09-10 富士通株式会社 認識距離の差に基づく最良優先探索処理方法
US5077805A (en) 1990-05-07 1991-12-31 Eastman Kodak Company Hybrid feature-based and template matching optical character recognition system
US5109439A (en) 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
KR0176448B1 (ko) 1991-07-19 1999-05-01 강진구 이미지 코딩 방법 및 장치
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5392447A (en) 1992-01-10 1995-02-21 Eastman Kodak Compay Image-based electronic pocket organizer with integral scanning unit
US6678864B1 (en) 1992-02-25 2004-01-13 Irving Tsai Method and apparatus for linking designated portions of a received document image with an electronic address
US6574375B1 (en) 1992-04-06 2003-06-03 Ricoh Company, Ltd. Method for detecting inverted text images on a digital scanning device
US5432864A (en) 1992-10-05 1995-07-11 Daozheng Lu Identification card verification system
US5579471A (en) 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US5493689A (en) 1993-03-01 1996-02-20 International Business Machines Corporation System for configuring an event driven interface including control blocks defining good loop locations in a memory which represent detection of a characteristic pattern
US5546502A (en) 1993-03-19 1996-08-13 Ricoh Company, Ltd. Automatic invocation of computational resources without user intervention
US5553217A (en) 1993-09-23 1996-09-03 Ricoh Company, Ltd. Document layout using tiling
US5664111A (en) 1994-02-16 1997-09-02 Honicorp, Inc. Computerized, multimedia, network, real time, interactive marketing and transactional system
US6947571B1 (en) 1999-05-19 2005-09-20 Digimarc Corporation Cell phones with optical capabilities, and related applications
JPH07319691A (ja) 1994-03-29 1995-12-08 Toshiba Corp 資源保護装置、特権保護装置、ソフトウェア利用法制御装置、及びソフトウェア利用法制御システム
US5465353A (en) 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
DE69516751T2 (de) 1994-04-15 2000-10-05 Canon Kk Bildvorverarbeitung für Zeichenerkennungsanlage
US6164534A (en) 1996-04-04 2000-12-26 Rathus; Spencer A. Method and apparatus for accessing electronic data via a familiar printed medium
US6866196B1 (en) 1994-05-25 2005-03-15 Spencer A. Rathus Method and apparatus for accessing electronic data via a familiar printed medium
US5694546A (en) 1994-05-31 1997-12-02 Reisman; Richard R. System for automatic unattended electronic information transport between a server and a client by a vendor provided transport software with a manifest list
EP0702322B1 (en) 1994-09-12 2002-02-13 Adobe Systems Inc. Method and apparatus for identifying words described in a portable electronic document
US5555556A (en) 1994-09-30 1996-09-10 Xerox Corporation Method and apparatus for document segmentation by background analysis
US6804332B1 (en) 1994-09-30 2004-10-12 Wildfire Communications, Inc. Network based knowledgeable assistant
US6460036B1 (en) 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
JPH08297669A (ja) 1994-12-27 1996-11-12 Internatl Business Mach Corp <Ibm> 複合ドキュメント内の複数のパートを自動的にリンクするシステムおよび方法
US5873077A (en) 1995-01-13 1999-02-16 Ricoh Corporation Method and apparatus for searching for and retrieving documents using a facsimile machine
US7051086B2 (en) 1995-07-27 2006-05-23 Digimarc Corporation Method of linking on-line data to printed documents
US5842194A (en) 1995-07-28 1998-11-24 Mitsubishi Denki Kabushiki Kaisha Method of recognizing images of faces or general images using fuzzy combination of multiple resolutions
US5793371A (en) 1995-08-04 1998-08-11 Sun Microsystems, Inc. Method and apparatus for geometric compression of three-dimensional graphics data
US5764277A (en) 1995-11-08 1998-06-09 Bell Communications Research, Inc. Group-of-block based video signal combining for multipoint continuous presence video conferencing
US5706097A (en) 1995-11-13 1998-01-06 Eastman Kodak Company Index print with a digital recording medium containing still images, motion sequences, and sound sequences
US20010013546A1 (en) 1996-01-09 2001-08-16 Ross William Leslie Identification system
US5832474A (en) 1996-02-26 1998-11-03 Matsushita Electric Industrial Co., Ltd. Document search and retrieval system with partial match searching of user-drawn annotations
US5918012A (en) 1996-03-29 1999-06-29 British Telecommunications Public Limited Company Hyperlinking time-based data files
US5933525A (en) * 1996-04-10 1999-08-03 Bbn Corporation Language-independent and segmentation-free optical character recognition system and method
US5806005A (en) 1996-05-10 1998-09-08 Ricoh Company, Ltd. Wireless image transfer from a digital still video camera to a networked computer
US5956468A (en) 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US6104834A (en) 1996-08-01 2000-08-15 Ricoh Company Limited Matching CCITT compressed document images
US6353822B1 (en) 1996-08-22 2002-03-05 Massachusetts Institute Of Technology Program-listing appendix
US6819783B2 (en) 1996-09-04 2004-11-16 Centerframe, Llc Obtaining person-specific images in a public venue
US5899999A (en) 1996-10-16 1999-05-04 Microsoft Corporation Iterative convolution filter particularly suited for use in an image classification and retrieval system
US5937110A (en) 1996-12-20 1999-08-10 Xerox Corporation Parallel propagating embedded binary sequences for characterizing objects in N-dimensional address space
US7437351B2 (en) 1997-01-10 2008-10-14 Google Inc. Method for searching media
US5892843A (en) 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images
JP3634099B2 (ja) 1997-02-17 2005-03-30 株式会社リコー 文書情報管理システム,媒体用紙情報作成装置および文書情報管理装置
MXPA99010114A (es) 1997-05-07 2004-09-10 Neomedia Tech Inc Unidad de control remotomejorado con escaner y sistema para enllazar automaticamente a recursos enlinea.
DE69810768D1 (de) 1997-06-03 2003-02-20 Stephen Bide Tragbares navigationssystem mit richtungsdetektor, positionsdetektor und datenbank
US6025780A (en) 1997-07-25 2000-02-15 Checkpoint Systems, Inc. RFID tags which are virtually activated and/or deactivated and apparatus and methods of using same in an electronic security system
US6121969A (en) 1997-07-29 2000-09-19 The Regents Of The University Of California Visual navigation in perceptual databases
JPH1153168A (ja) 1997-08-07 1999-02-26 Matsushita Graphic Commun Syst Inc 音声情報付文書作成装置及びこれを用いた方法
US6035055A (en) 1997-11-03 2000-03-07 Hewlett-Packard Company Digital image management system in a distributed data access network system
US6415278B1 (en) 1997-11-14 2002-07-02 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US5999664A (en) 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
US6574644B2 (en) 1997-11-26 2003-06-03 Siemens Corporate Research, Inc Automatic capturing of hyperlink specifications for multimedia documents
US6138129A (en) 1997-12-16 2000-10-24 World One Telecom, Ltd. Method and apparatus for providing automated searching and linking of electronic documents
US6804659B1 (en) 2000-01-14 2004-10-12 Ricoh Company Ltd. Content based web advertising
US7124093B1 (en) 1997-12-22 2006-10-17 Ricoh Company, Ltd. Method, system and computer code for content based web advertising
JP4183311B2 (ja) 1997-12-22 2008-11-19 株式会社リコー 文書の注釈方法、注釈装置および記録媒体
US6584223B1 (en) 1998-04-02 2003-06-24 Canon Kabushiki Kaisha Image search apparatus and method
US6393142B1 (en) 1998-04-22 2002-05-21 At&T Corp. Method and apparatus for adaptive stripe based patch matching for depth estimation
US6337683B1 (en) 1998-05-13 2002-01-08 Imove Inc. Panoramic movies which simulate movement through multidimensional space
US6504571B1 (en) 1998-05-18 2003-01-07 International Business Machines Corporation System and methods for querying digital image archives using recorded parameters
US6253201B1 (en) 1998-06-23 2001-06-26 Philips Electronics North America Corporation Scalable solution for image retrieval
US6345274B1 (en) 1998-06-29 2002-02-05 Eastman Kodak Company Method and computer program product for subjective image content similarity-based retrieval
US6223171B1 (en) 1998-08-25 2001-04-24 Microsoft Corporation What-if index analysis utility for database systems
US7039856B2 (en) 1998-09-30 2006-05-02 Ricoh Co., Ltd. Automatic document classification using text and images
US6964374B1 (en) 1998-10-02 2005-11-15 Lucent Technologies Inc. Retrieval and manipulation of electronically stored information via pointers embedded in the associated printed material
US6470095B2 (en) 1998-10-13 2002-10-22 Xerox Corporation Automatic extraction of text regions and region borders for an electronic work surface
US6192157B1 (en) 1998-10-27 2001-02-20 Hewlett-Packard Company Modifications of postscript adaptive data compression (ADC) for 3 plane, 8 bit color images, JPEG lossy compression, and variable Q factors
US6363381B1 (en) 1998-11-03 2002-03-26 Ricoh Co., Ltd. Compressed document matching
JP4058181B2 (ja) 1998-11-25 2008-03-05 キヤノン株式会社 周辺機器装置及びその制御方法及び記憶媒体
US6301386B1 (en) 1998-12-09 2001-10-09 Ncr Corporation Methods and apparatus for gray image based text identification
US6448979B1 (en) 1999-01-25 2002-09-10 Airclic, Inc. Printed medium activated interactive communication of multimedia information, including advertising
US6411953B1 (en) 1999-01-25 2002-06-25 Lucent Technologies Inc. Retrieval and matching of color patterns based on a predetermined vocabulary and grammar
US6922699B2 (en) 1999-01-26 2005-07-26 Xerox Corporation System and method for quantitatively representing data objects in vector space
US6071501A (en) 1999-02-05 2000-06-06 The Procter & Gamble Company Photostable UV protection compositions
CA2683191A1 (en) 1999-03-02 2000-09-08 Amway Corp. Electronic commerce transactions within a marketing system
JP3902904B2 (ja) 1999-03-23 2007-04-11 キヤノン株式会社 情報提示装置、方法、カメラ制御装置、方法及びコンピュータ読み取り可能な記憶媒体
US6658151B2 (en) 1999-04-08 2003-12-02 Ricoh Co., Ltd. Extracting information from symbolically compressed document images
US6791605B1 (en) 1999-05-07 2004-09-14 Eastman Kodak Company Image capture and printing device
US6397213B1 (en) 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition
US7406214B2 (en) 1999-05-19 2008-07-29 Digimarc Corporation Methods and devices employing optical sensors and/or steganography
US7206820B1 (en) 2000-03-18 2007-04-17 Digimarc Corporation System for linking from object to remote resource
US6411724B1 (en) 1999-07-02 2002-06-25 Koninklijke Philips Electronics N.V. Using meta-descriptors to represent multimedia information
US6628412B1 (en) 1999-08-05 2003-09-30 Hewlett-Packard Development Company, L.P. Methods of document management and automated document tracking, and a document management system
US6408257B1 (en) 1999-08-31 2002-06-18 Xerox Corporation Augmented-reality display method and system
US6732915B1 (en) 1999-09-10 2004-05-11 Fuji Xerox Co., Ltd. Systems and methods for controlling a presentation using physical objects
US6859802B1 (en) 1999-09-13 2005-02-22 Microsoft Corporation Image retrieval based on relevance feedback
US6751343B1 (en) 1999-09-20 2004-06-15 Ut-Battelle, Llc Method for indexing and retrieving manufacturing-specific digital imagery based on image content
US6799201B1 (en) 2000-09-19 2004-09-28 Motorola, Inc. Remotely configurable multimedia entertainment and information system for vehicles
US7134095B1 (en) 1999-10-20 2006-11-07 Gateway, Inc. Simulated three-dimensional navigational menu system
KR100353798B1 (ko) 1999-12-01 2002-09-26 주식회사 코난테크놀로지 영상 객체 모양 정보 추출 방법 및 그를 이용한 내용기반 이미지 검색 시스템 및 그 방법
US7185274B1 (en) 1999-12-07 2007-02-27 Microsoft Corporation Computer user interface architecture wherein users interact with both content and user interface by activating links
US6820111B1 (en) 1999-12-07 2004-11-16 Microsoft Corporation Computer user interface architecture that saves a user's non-linear navigation history and intelligently maintains that history
US7458014B1 (en) 1999-12-07 2008-11-25 Microsoft Corporation Computer user interface architecture wherein both content and user interface are composed of documents with links
JP2001177712A (ja) 1999-12-15 2001-06-29 Fuji Xerox Co Ltd 画像処理装置および被画像形成媒体
US6643652B2 (en) 2000-01-14 2003-11-04 Saba Software, Inc. Method and apparatus for managing data exchange among systems in a network
US20010042030A1 (en) 2000-02-15 2001-11-15 Sadao Ito Information providing system for providing information about parts
JP2001230916A (ja) 2000-02-18 2001-08-24 Ricoh Co Ltd ファイルシステム
WO2001061448A1 (en) 2000-02-18 2001-08-23 The University Of Maryland Methods for the electronic annotation, retrieval, and use of electronic images
US6766363B1 (en) 2000-02-28 2004-07-20 Barpoint.Com, Inc. System and method of linking items in audio, visual, and printed media to related information stored on an electronic network using a mobile device
US6859909B1 (en) 2000-03-07 2005-02-22 Microsoft Corporation System and method for annotating web-based documents
US6865302B2 (en) 2000-03-16 2005-03-08 The Regents Of The University Of California Perception-based image retrieval
JP4409035B2 (ja) 2000-03-22 2010-02-03 本田技研工業株式会社 画像処理装置、特異箇所検出方法、及び特異箇所検出プログラムを記録した記録媒体
WO2001071558A1 (en) 2000-03-23 2001-09-27 Mitsubishi Denki Kabushiki Kaisha Image retrieval/distribution system and image retrieval/distribution method
JP3842006B2 (ja) 2000-03-30 2006-11-08 グローリー工業株式会社 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
EP1662064A1 (en) 2000-04-24 2006-05-31 Hunter Douglas Inc. Compressible structural panel
US7003734B1 (en) 2000-05-05 2006-02-21 Point Roll, Inc. Method and system for creating and displaying images including pop-up images on a visual display
AU2001259525A1 (en) 2000-05-08 2001-11-20 Qwest Communications International Inc. Location based messaging method and system
US7034864B2 (en) 2000-05-19 2006-04-25 Canon Kabushiki Kaisha Image display apparatus, image display system, and image display method
US20010049700A1 (en) 2000-05-26 2001-12-06 Shinobu Ichikura Information processing apparatus, information processing method and storage medium
US6903707B2 (en) 2000-08-09 2005-06-07 Information Decision Technologies, Llc Method for using a motorized camera mount for tracking in augmented reality
FR2812957B1 (fr) 2000-08-14 2003-01-31 Cit Alcatel Procede de memorisation de donnees dans un fichier multimedia utilisant des bases de temps relatives
US7523411B2 (en) * 2000-08-22 2009-04-21 Bruce Carlin Network-linked interactive three-dimensional composition and display of saleable objects in situ in viewer-selected scenes for purposes of object promotion and procurement, and generation of object advertisements
US7062722B1 (en) 2000-08-22 2006-06-13 Bruce Carlin Network-linked interactive three-dimensional composition and display of saleable objects in situ in viewer-selected scenes for purposes of promotion and procurement
US6671684B1 (en) 2000-09-01 2003-12-30 Ricoh Co., Ltd. Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
US6405172B1 (en) 2000-09-09 2002-06-11 Mailcode Inc. Voice-enabled directory look-up based on recognized spoken initial characters
US20020038430A1 (en) 2000-09-13 2002-03-28 Charles Edwards System and method of data collection, processing, analysis, and annotation for monitoring cyber-threats and the notification thereof to subscribers
AU2001294704A1 (en) 2000-09-25 2002-04-08 Databites, Inc. System and method for automatic retrieval of structured online documents
US6940491B2 (en) 2000-10-27 2005-09-06 International Business Machines Corporation Method and system for generating hyperlinked physical copies of hyperlinked electronic documents
JP2002132547A (ja) 2000-10-27 2002-05-10 Fuji Xerox Co Ltd 電子情報管理サーバ、電子情報管理クライアントおよび電子情報管理方法ならびに電子情報管理プログラムを記録したコンピュータ読み取り可能な記録媒体
US6970860B1 (en) 2000-10-30 2005-11-29 Microsoft Corporation Semi-automatic annotation of multimedia objects
US20020102966A1 (en) 2000-11-06 2002-08-01 Lev Tsvi H. Object identification method for portable devices
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
AU2002227215A1 (en) 2000-11-10 2002-05-21 Eric N. Clark Wireless digital camera adapter and systems and methods related thereto and for use with such an adapter
WO2002041241A1 (en) 2000-11-17 2002-05-23 Jacob Weitman Applications for a mobile digital camera, that distinguish between text-, and image-information in an image
US7013309B2 (en) 2000-12-18 2006-03-14 Siemens Corporate Research Method and apparatus for extracting anchorable information units from complex PDF documents
US7596691B2 (en) 2000-12-19 2009-09-29 Fuji Xerox Co., Ltd. Internet facsimile and control method thereof and communication instruction terminal
US7007243B2 (en) 2000-12-20 2006-02-28 Eastman Kodak Company Method and apparatus for producing digital images with embedded image capture location icons
US7092953B1 (en) 2000-12-28 2006-08-15 Rightlsline, Inc. Apparatus and methods for intellectual property database navigation
JP2002229955A (ja) 2001-02-02 2002-08-16 Matsushita Electric Ind Co Ltd 情報端末装置及び認証システム
US7366979B2 (en) 2001-03-09 2008-04-29 Copernicus Investments, Llc Method and apparatus for annotating a document
US7392287B2 (en) 2001-03-27 2008-06-24 Hemisphere Ii Investment Lp Method and apparatus for sharing information using a handheld device
US7200271B2 (en) 2001-03-29 2007-04-03 The Boeing Company Method, computer program product, and system for performing automated text recognition and text search within a graphic file
US6690828B2 (en) 2001-04-09 2004-02-10 Gary Elliott Meyers Method for representing and comparing digital images
WO2002084590A1 (en) 2001-04-11 2002-10-24 Applied Minds, Inc. Knowledge web
JP2002318578A (ja) 2001-04-20 2002-10-31 Mitsubishi Electric Corp 画像表示方法
US20020176628A1 (en) 2001-05-22 2002-11-28 Starkweather Gary K. Document imaging and indexing system
US20020194264A1 (en) 2001-05-31 2002-12-19 Pioneer Corporation Digital information distribution apparatus and method
US20040238621A1 (en) 2001-07-10 2004-12-02 American Express Travel Related Services Company, Inc. Method and system for fingerprint biometrics on a fob
DE60131385T2 (de) 2001-07-13 2008-06-19 Hewlett-Packard Development Co., L.P. (n.d.Ges.d. Staates Delaware), Houston Verwendung von Einzelfarben bei einem Drucker
US6903752B2 (en) 2001-07-16 2005-06-07 Information Decision Technologies, Llc Method to view unseen atmospheric phenomenon using augmented reality
US7188085B2 (en) 2001-07-20 2007-03-06 International Business Machines Corporation Method and system for delivering encrypted content with associated geographical-based advertisements
JP4617621B2 (ja) 2001-08-07 2011-01-26 コニカミノルタホールディングス株式会社 印刷制御装置、及びその課金方法
US7068309B2 (en) 2001-10-09 2006-06-27 Microsoft Corp. Image exchange with image annotation
US6925475B2 (en) 2001-10-12 2005-08-02 Commissariat A L'energie Atomique Process and apparatus for management of multimedia databases
JP3886769B2 (ja) 2001-10-26 2007-02-28 富士通株式会社 補正画像生成装置および補正画像生成プログラム
US20030122922A1 (en) 2001-11-26 2003-07-03 Saffer Kevin D. Video e-mail system and associated method
US6931603B2 (en) 2001-11-29 2005-08-16 International Business Machines Corporation Method and system for appending information to graphical files stored in specific graphical file formats
US7099508B2 (en) 2001-11-29 2006-08-29 Kabushiki Kaisha Toshiba Document identification device, document definition method and document identification method
US7322514B2 (en) 2001-11-30 2008-01-29 International Barcode Corporation Method for identifying and authenticating goods using codes, barcodes and radio frequency identification
US7308486B2 (en) 2001-12-06 2007-12-11 Accenture Global Services Gmbh Mobile guide communications system
JP3821367B2 (ja) 2001-12-11 2006-09-13 ソニー株式会社 チャット提供システム、情報処理装置および方法、並びにプログラム
US20030112930A1 (en) 2001-12-18 2003-06-19 Bosik Barry S. Call management system responsive to network presence
US7268906B2 (en) 2002-01-07 2007-09-11 Xerox Corporation Systems and methods for authenticating and verifying documents
US7239747B2 (en) 2002-01-24 2007-07-03 Chatterbox Systems, Inc. Method and system for locating position in printed texts and delivering multimedia information
US7139004B2 (en) 2002-01-25 2006-11-21 Xerox Corporation Method and apparatus to convert bitmapped images for use in a structured text/graphics editor
US7362354B2 (en) 2002-02-12 2008-04-22 Hewlett-Packard Development Company, L.P. Method and system for assessing the photo quality of a captured image in a digital still camera
US7167574B2 (en) 2002-03-14 2007-01-23 Seiko Epson Corporation Method and apparatus for content-based image copy detection
US6588039B1 (en) 2002-03-21 2003-07-08 Stride Tool, Inc. Plier tool and process
US7251689B2 (en) 2002-03-27 2007-07-31 International Business Machines Corporation Managing storage resources in decentralized networks
US7421153B1 (en) 2002-04-05 2008-09-02 Bank Of America Corporation Image and data processing system
US6793334B2 (en) 2002-04-11 2004-09-21 Hewlett-Packard Development Company, L.P. Barcode printing module
US7043474B2 (en) 2002-04-15 2006-05-09 International Business Machines Corporation System and method for measuring image similarity based on semantic meaning
US20040036679A1 (en) 2002-05-02 2004-02-26 Emerson Harry E. Computer system providing a visual indication when typing in caps lock mode
JP4202677B2 (ja) 2002-05-09 2008-12-24 株式会社東芝 アイデア抽出支援方法とアイデア抽出支援用のコンピュータプログラム
US20030229857A1 (en) 2002-06-05 2003-12-11 Fuji Xerox Co., Ltd. Apparatus, method, and computer program product for document manipulation which embeds information in document data
US7240279B1 (en) 2002-06-19 2007-07-03 Microsoft Corporation XML patterns language
CA2397424A1 (en) 2002-08-09 2004-02-09 Mohammed Lamine Kherfi Content-based image retrieval using positive and negative examples
US7277891B2 (en) 2002-10-11 2007-10-02 Digimarc Corporation Systems and methods for recognition of individuals using multiple biometric searches
US7249123B2 (en) 2002-10-31 2007-07-24 International Business Machines Corporation System and method for building social networks based on activity around shared virtual objects
US6810328B2 (en) 2002-11-23 2004-10-26 Alpine Electronics, Inc Navigation method and system for indicating area-specific traffic information
WO2004063884A2 (en) 2003-01-09 2004-07-29 Evolution Robotics, Inc. Computer and vision-based augmented interaction in the use of printed media
US20040139391A1 (en) 2003-01-15 2004-07-15 Xerox Corporation Integration of handwritten annotations into an electronic original
US20040143644A1 (en) 2003-01-21 2004-07-22 Nec Laboratories America, Inc. Meta-search engine architecture
US7360694B2 (en) 2003-01-23 2008-04-22 Mastercard International Incorporated System and method for secure telephone and computer transactions using voice authentication
US6880252B1 (en) 2003-03-11 2005-04-19 Theodore P. Drake Hand tool for defining a starting location for an element to be driven into a substrate
US7310769B1 (en) 2003-03-12 2007-12-18 Adobe Systems Incorporated Text encoding using dummy font
JP2006524357A (ja) 2003-03-17 2006-10-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響装置の遠隔制御の方法
US7882113B2 (en) 2003-03-28 2011-02-01 International Business Machines Corporation Method, apparatus, and system for formatting time data to improve processing in a sort utility
US7206773B2 (en) 2003-04-11 2007-04-17 Ricoh Company, Ltd Techniques for accessing information captured during a presentation using a paper document handout for the presentation
US7236632B2 (en) 2003-04-11 2007-06-26 Ricoh Company, Ltd. Automated techniques for comparing contents of images
JP2004348706A (ja) 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2006527544A (ja) 2003-06-06 2006-11-30 ネオメディア テクノロジーズ,インク. カメラ機能付きセル電話を用いたインターネット・コンテンツの自動アクセス
JP2005010854A (ja) 2003-06-16 2005-01-13 Sony Computer Entertainment Inc 情報提示方法および装置
US20040260680A1 (en) 2003-06-19 2004-12-23 International Business Machines Corporation Personalized indexing and searching for information in a distributed data processing system
US20040260625A1 (en) 2003-06-20 2004-12-23 Yoshinori Usami Digital photo print order acceptance method and digital image management method
US7310779B2 (en) 2003-06-26 2007-12-18 International Business Machines Corporation Method for creating and selecting active regions on physical documents
JP4322169B2 (ja) 2003-07-16 2009-08-26 株式会社リコー 文書処理システム、文書処理方法、文書処理プログラム
US7446895B2 (en) 2003-07-18 2008-11-04 Sharp Laboratories Of America, Inc. Print content system and method for providing document control
JP2005070416A (ja) 2003-08-25 2005-03-17 Fujitsu Ten Ltd 楽曲情報の更新システム、楽曲情報の送信装置、楽曲情報の更新機能を有する端末装置、並びに楽曲情報の更新方法、楽曲情報の送信方法、端末装置の楽曲情報更新方法
US7305435B2 (en) 2003-08-25 2007-12-04 Nokia Corporation Internet access via smartphone camera
US7843313B2 (en) 2003-09-05 2010-11-30 Honeywell International Inc. Distributed stand-off verification and face recognition systems (FRS)
WO2005029353A1 (ja) 2003-09-18 2005-03-31 Fujitsu Limited 注釈管理システム、注釈管理方法、文書変換サーバ、文書変換プログラム、電子文書付加プログラム
US20050080693A1 (en) 2003-10-14 2005-04-14 Foss Sheldon H. Point-of-sale customer identification system
US7370034B2 (en) 2003-10-15 2008-05-06 Xerox Corporation System and method for performing electronic information retrieval using keywords
US7512286B2 (en) 2003-10-27 2009-03-31 Hewlett-Packard Development Company, L.P. Assessing image quality
US7373109B2 (en) 2003-11-04 2008-05-13 Nokia Corporation System and method for registering attendance of entities associated with content creation
US7912291B2 (en) 2003-11-10 2011-03-22 Ricoh Co., Ltd Features for retrieval and similarity matching of documents from the JPEG 2000-compressed domain
US7937340B2 (en) 2003-12-03 2011-05-03 Microsoft Corporation Automated satisfaction measurement for web search
GB0328326D0 (en) 2003-12-05 2004-01-07 British Telecomm Image processing
US7359532B2 (en) 2003-12-11 2008-04-15 Intel Corporation Fingerprint minutiae matching using scoring techniques
US20050160258A1 (en) 2003-12-11 2005-07-21 Bioobservation Systems Limited Detecting objectionable content in displayed images
US20050185225A1 (en) 2003-12-12 2005-08-25 Brawn Dennis E. Methods and apparatus for imaging documents
US7480334B2 (en) 2003-12-23 2009-01-20 Genesis Microchip Inc. Temporal motion vector filtering
US7376270B2 (en) 2003-12-29 2008-05-20 Canon Kabushiki Kaisha Detecting human faces and detecting red eyes
US7734729B2 (en) 2003-12-31 2010-06-08 Amazon Technologies, Inc. System and method for obtaining information relating to an item of commerce using a portable imaging device
US7475061B2 (en) 2004-01-15 2009-01-06 Microsoft Corporation Image-based document indexing and retrieval
US7872669B2 (en) 2004-01-22 2011-01-18 Massachusetts Institute Of Technology Photo-based mobile deixis system and related techniques
US8615487B2 (en) 2004-01-23 2013-12-24 Garrison Gomez System and method to store and retrieve identifier associated information content
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7310676B2 (en) 2004-02-09 2007-12-18 Proxpro, Inc. Method and computer system for matching mobile device users for business and social networking
GB2411532B (en) 2004-02-11 2010-04-28 British Broadcasting Corp Position determination
US20060041605A1 (en) 2004-04-01 2006-02-23 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US20060122983A1 (en) 2004-12-03 2006-06-08 King Martin T Locating electronic instances of documents based on rendered instances, document fragment digest generation, and digest based document fragment determination
US20060053097A1 (en) 2004-04-01 2006-03-09 King Martin T Searching and accessing documents on private networks for use with captures from rendered documents
US20060104515A1 (en) 2004-07-19 2006-05-18 King Martin T Automatic modification of WEB pages
US7197502B2 (en) 2004-02-18 2007-03-27 Friendly Polynomials, Inc. Machine-implemented activity management system using asynchronously shared activity data objects and journal data items
US7751805B2 (en) 2004-02-20 2010-07-06 Google Inc. Mobile image-based information retrieval system
US8421872B2 (en) 2004-02-20 2013-04-16 Google Inc. Image base inquiry system for search engines for mobile telephones with integrated camera
US7565139B2 (en) 2004-02-20 2009-07-21 Google Inc. Image-based search engine for mobile phones with camera
US7386789B2 (en) 2004-02-27 2008-06-10 Hewlett-Packard Development Company, L.P. Method for determining logical components of a document
JP2005266198A (ja) 2004-03-18 2005-09-29 Pioneer Electronic Corp 音響情報再生装置および音楽データのキーワード作成方法
US7831387B2 (en) 2004-03-23 2010-11-09 Google Inc. Visually-oriented driving directions in digital mapping system
US20100013615A1 (en) 2004-03-31 2010-01-21 Carnegie Mellon University Obstacle detection having enhanced classification
US7707218B2 (en) 2004-04-16 2010-04-27 Mobot, Inc. Mobile query system and method based on visual cues
US20050240381A1 (en) 2004-04-26 2005-10-27 Pjm Interconnection, Llc. Systems and methods for analysis of a commodity transmission network
JP2005348055A (ja) 2004-06-02 2005-12-15 Toshiba Corp ユーザプロファイル編集装置及びユーザプロファイル編集方法並びにプログラム
US7150399B2 (en) 2004-06-09 2006-12-19 Ricoh Co., Ltd. Embedding barcode data in an auxiliary field of an image file
US20050289182A1 (en) 2004-06-15 2005-12-29 Sand Hill Systems Inc. Document management system with enhanced intelligent document recognition capabilities
US7746376B2 (en) 2004-06-16 2010-06-29 Felipe Mendoza Method and apparatus for accessing multi-dimensional mapping and information
US7263472B2 (en) * 2004-06-28 2007-08-28 Mitsubishi Electric Research Laboratories, Inc. Hidden markov model based object tracking and similarity metrics
US20050289447A1 (en) 2004-06-29 2005-12-29 The Boeing Company Systems and methods for generating and storing referential links in a database
US20060020630A1 (en) 2004-07-23 2006-01-26 Stager Reed R Facial database methods and systems
US7890871B2 (en) 2004-08-26 2011-02-15 Redlands Technology, Llc System and method for dynamically generating, maintaining, and growing an online social network
US20060043188A1 (en) 2004-08-27 2006-03-02 Gregg Kricorissian Imaging method and apparatus for object identification
US20060070120A1 (en) 2004-09-02 2006-03-30 Brother Kogyo Kabushiki Kaisha File transmitting device and multi function device
US20060074828A1 (en) 2004-09-14 2006-04-06 Heumann John M Methods and apparatus for detecting temporal process variation and for managing and predicting performance of automatic classifiers
US8600989B2 (en) 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US7669148B2 (en) 2005-08-23 2010-02-23 Ricoh Co., Ltd. System and methods for portable device for mixed media system
US8489583B2 (en) 2004-10-01 2013-07-16 Ricoh Company, Ltd. Techniques for retrieving documents using an image capture device
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US7812986B2 (en) 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US7138905B2 (en) 2004-11-18 2006-11-21 Honeywell International Inc. Controlled environment thermal image detection system and methods regarding same
US20060119880A1 (en) 2004-12-02 2006-06-08 Dandekar Shree A Local photo printing
US7689655B2 (en) 2004-12-06 2010-03-30 Aol Inc. Managing and collaborating with digital content using a dynamic user interface
WO2006085151A2 (en) 2004-12-06 2006-08-17 Dspv, Ltd System and method of generic symbol recognition and user authentication using a communication device with imaging capabilities
US20060140475A1 (en) 2004-12-15 2006-06-29 Chin Frances M Network support for corrupting images captured at a prohibited location
US8230326B2 (en) 2004-12-17 2012-07-24 International Business Machines Corporation Method for associating annotations with document families
KR100608596B1 (ko) 2004-12-28 2006-08-03 삼성전자주식회사 얼굴 검출을 기반으로 하는 휴대용 영상 촬영 기기 및영상 촬영 방법
US7698270B2 (en) 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
JP4455357B2 (ja) 2005-01-28 2010-04-21 キヤノン株式会社 情報処理装置及び情報処理方法
US20060190812A1 (en) 2005-02-22 2006-08-24 Geovector Corporation Imaging systems including hyperlink associations
US7567262B1 (en) 2005-02-25 2009-07-28 IDV Solutions LLC Hybrid graphics for interactive reporting
US7644078B2 (en) 2005-02-28 2010-01-05 Gm Global Technology Operations, Inc. System and method for mining of temporal data
US20060200480A1 (en) 2005-03-01 2006-09-07 Harris David N System and method for using product identifiers
US20060218225A1 (en) 2005-03-28 2006-09-28 Hee Voon George H Device for sharing social network information among users over a network
US7546524B1 (en) 2005-03-30 2009-06-09 Amazon Technologies, Inc. Electronic input device, system, and method using human-comprehensible content to automatically correlate an annotation of a paper document with a digital version of the document
US7765231B2 (en) 2005-04-08 2010-07-27 Rathus Spencer A System and method for accessing electronic data via an image search engine
JP2006305176A (ja) 2005-04-28 2006-11-09 Nintendo Co Ltd ゲームプログラムおよびゲーム装置
US7809722B2 (en) 2005-05-09 2010-10-05 Like.Com System and method for enabling search and retrieval from image files based on recognized information
US7519200B2 (en) 2005-05-09 2009-04-14 Like.Com System and method for enabling the use of captured images through recognition
US7747642B2 (en) 2005-05-09 2010-06-29 Trend Micro Incorporated Matching engine for querying relevant documents
US7809192B2 (en) 2005-05-09 2010-10-05 Like.Com System and method for recognizing objects from images and identifying relevancy amongst images and information
US7450760B2 (en) 2005-05-18 2008-11-11 Scanr, Inc. System and method for capturing and processing business data
US7676767B2 (en) 2005-06-15 2010-03-09 Microsoft Corporation Peel back user interface to show hidden functions
US7929775B2 (en) 2005-06-16 2011-04-19 Strider Labs, Inc. System and method for recognition in 2D images using 3D class models
KR100754656B1 (ko) 2005-06-20 2007-09-03 삼성전자주식회사 이미지와 관련한 정보를 사용자에게 제공하는 방법 및시스템과 이를 위한 이동통신단말기
US20060294049A1 (en) 2005-06-27 2006-12-28 Microsoft Corporation Back-off mechanism for search
KR100906918B1 (ko) 2005-06-30 2009-07-08 올림푸스 가부시키가이샤 검색 시스템 및 검색 방법
US7623711B2 (en) 2005-06-30 2009-11-24 Ricoh Co., Ltd. White space graphs and trees for content-adaptive scaling of document images
US8249344B2 (en) * 2005-07-01 2012-08-21 Microsoft Corporation Grammatical parsing of document visual structures
TW200705299A (en) 2005-07-21 2007-02-01 Yu-Chung Chu Method and system for consumer photograph based advertisement and information distribution
JP2007034847A (ja) 2005-07-28 2007-02-08 Canon Inc 検索装置及び検索方法
GB2445688A (en) 2005-09-01 2008-07-16 Zvi Haim Lev System and method for reliable content access using a cellular/wireless device with imaging capabilities
GB2430735A (en) 2005-09-30 2007-04-04 Sony Uk Ltd Object detection
US8849821B2 (en) 2005-11-04 2014-09-30 Nokia Corporation Scalable visual search system simplifying access to network and device functionality
US7663671B2 (en) 2005-11-22 2010-02-16 Eastman Kodak Company Location based image classification with map segmentation
US20100005485A1 (en) 2005-12-19 2010-01-07 Agency For Science, Technology And Research Annotation of video footage and personalised video generation
US7761436B2 (en) 2006-01-03 2010-07-20 Yahoo! Inc. Apparatus and method for controlling content access based on shared annotations for annotated users in a folksonomy scheme
US7725451B2 (en) 2006-01-23 2010-05-25 Microsoft Corporation Generating clusters of images for search results
GB2434933B (en) 2006-02-01 2009-06-03 Motorola Inc Apparatus and method for image labelling
US7463270B2 (en) 2006-02-10 2008-12-09 Microsoft Corporation Physical-virtual interpolation
US8554690B2 (en) 2006-03-31 2013-10-08 Ricoh Company, Ltd. Techniques for using media keys
JP4864508B2 (ja) 2006-03-31 2012-02-01 富士通株式会社 情報検索プログラム、情報検索方法および情報検索装置
US7668405B2 (en) 2006-04-07 2010-02-23 Eastman Kodak Company Forming connections between image collections
US20070276845A1 (en) 2006-05-12 2007-11-29 Tele Atlas North America, Inc. Locality indexes and method for indexing localities
US20080010273A1 (en) 2006-06-12 2008-01-10 Metacarta, Inc. Systems and methods for hierarchical organization and presentation of geographic search results
US7946491B2 (en) 2006-08-03 2011-05-24 Nokia Corporation Method, apparatus, and computer program product for providing a camera barcode reader
US8838560B2 (en) 2006-08-25 2014-09-16 Covario, Inc. System and method for measuring the effectiveness of an on-line advertisement campaign
US7774431B2 (en) 2006-09-05 2010-08-10 Gloto Real time collaborative on-line multimedia albums
US7752534B2 (en) 2006-09-19 2010-07-06 International Business Machines Corporation Method and apparatus for customizing the display of multidimensional data
US7766241B2 (en) 2006-09-29 2010-08-03 Konica Minolta Systems Laboratory, Inc. Barcode for two-way verification of a document
US9361943B2 (en) 2006-11-07 2016-06-07 The Board Of Trustees Of The Leland Stanford Jr. University System and method for tagging objects in a panoramic video and associating functions and indexing panoramic images with same
US7900847B2 (en) 2007-01-18 2011-03-08 Target Brands, Inc. Barcodes with graphical elements
US8347206B2 (en) 2007-03-15 2013-01-01 Microsoft Corporation Interactive image tagging
WO2008141432A1 (en) 2007-05-17 2008-11-27 Fat Free Mobile Inc. Web page transcoding method and system applying queries to plain text
US8788589B2 (en) 2007-10-12 2014-07-22 Watchitoo, Inc. System and method for coordinating simultaneous edits of shared digital data
US8540158B2 (en) 2007-12-12 2013-09-24 Yiwu Lei Document verification using dynamic document identification framework
WO2010028169A2 (en) 2008-09-05 2010-03-11 Fotonauts, Inc. Reverse tagging of images in system for managing and sharing digital images

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000268179A (ja) * 1999-01-14 2000-09-29 Oojisu Soken:Kk 三次元形状情報取得方法及び装置,二次元画像取得方法及び装置並びに記録媒体
JP2001211359A (ja) * 2000-01-25 2001-08-03 Olympus Optical Co Ltd 電子カメラ
JP2005286395A (ja) * 2004-03-26 2005-10-13 Fuji Photo Film Co Ltd 画像処理システムおよびその方法
JP2006053568A (ja) * 2004-08-13 2006-02-23 Fujitsu Ltd 劣化文字画像生成プログラム、方法および装置
JP2006059351A (ja) * 2004-08-18 2006-03-02 Fujitsu Ltd 劣化辞書生成プログラム、方法および装置
JP2006215756A (ja) * 2005-02-02 2006-08-17 Dainippon Ink & Chem Inc 画像処理装置および画像処理方法ならびにそのプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014026662A (ja) * 2008-09-15 2014-02-06 Ricoh Co Ltd 検索システム、検索方法及びコンピュータプログラム
JP2014520351A (ja) * 2011-07-08 2014-08-21 レストレーション ロボティクス,インク. カメラシステムの座標系の較正および変換

Also Published As

Publication number Publication date
US20110310110A1 (en) 2011-12-22
US7970171B2 (en) 2011-06-28
JP5049798B2 (ja) 2012-10-17
US20080175507A1 (en) 2008-07-24
US8238609B2 (en) 2012-08-07

Similar Documents

Publication Publication Date Title
JP5049798B2 (ja) グラウンドトルース・データからの合成画像及びビデオの生成
CN107330439B (zh) 一种图像中物体姿态的确定方法、客户端及服务器
CN111328396B (zh) 用于图像中的对象的姿态估计和模型检索
US10872420B2 (en) Electronic device and method for automatic human segmentation in image
US9807263B2 (en) Mobile document capture assistance using augmented reality
CN100470452C (zh) 一种实现三维增强现实的方法及系统
CN111401266B (zh) 绘本角点定位的方法、设备、计算机设备和可读存储介质
Zhang et al. An image stitching algorithm based on histogram matching and SIFT algorithm
RU2659745C1 (ru) Реконструкция документа из серии изображений документа
TWI506563B (zh) A method and apparatus for enhancing reality of two - dimensional code
CN101147159A (zh) 利用统计模板匹配进行对象检测的快速方法
CN103198311B (zh) 基于拍摄的图像来识别字符的方法及装置
TWI423146B (zh) 動態偵測與識別指示牌的方法與系統
Beyeler OpenCV with Python blueprints
CN109816694B (zh) 目标跟踪方法、装置及电子设备
CN115953744B (zh) 一种基于深度学习的车辆识别追踪方法
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
Ashar et al. A survey on object detection and recognition for blurred and low-quality images: Handling, deblurring, and reconstruction
KR20230053262A (ko) 2d 현실공간 이미지를 기반의 3d 객체 인식 및 변환 방법과 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램
Chhabra et al. Curved text detection and recognition in natural scenic images based on L-Yolov8 object detection algorithm
KR101566544B1 (ko) 문서상의 주요부를 자동 인식하여 저장하는 시스템 및 그 저장 방법
Sucontphunt Geometric surface image prediction for image recognition enhancement
JP7212207B1 (ja) 画像処理システム、画像処理方法、及びプログラム
JP7137171B1 (ja) 画像処理システム、画像処理方法、及びプログラム
Liu et al. A novel effectiveness evaluation method of smokescreen jamming based on the fusion of directional gradients and local texture features

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120723

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5049798

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees