DE10236932A1 - System und Verfahren zum Ermöglichen einer Bildwiedergewinnung - Google Patents
System und Verfahren zum Ermöglichen einer BildwiedergewinnungInfo
- Publication number
- DE10236932A1 DE10236932A1 DE10236932A DE10236932A DE10236932A1 DE 10236932 A1 DE10236932 A1 DE 10236932A1 DE 10236932 A DE10236932 A DE 10236932A DE 10236932 A DE10236932 A DE 10236932A DE 10236932 A1 DE10236932 A1 DE 10236932A1
- Authority
- DE
- Germany
- Prior art keywords
- user
- image
- images
- attribute
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Die vorliegende Offenbarung bezieht sich auf ein System und ein Verfahren zum Ermöglichen einer Bildwiedergewinnung. Bei einer Anordnung weist das Verfahren die Schritte des Abfragens eines Benutzers bezüglich zumindest einem Attribut eines Bildes, das der Benutzer wiedergewinnen möchte, des Empfangens von Benutzerantworten und des Vorlegens von mindestens einem Bild für den Benutzer, basierend auf der Benutzerantwort, auf. Bei einer Anordnung weist das System eine Einrichtung zum Abfragen eines Benutzers über Attribute eines Bildes, das der Benutzer wiedergewinnen möchte, eine Einrichtung zum Wiedergewinnen von Benutzerantworten und eine Einrichtung zum Vorlegen von Bildern an den Benutzer auf die Benutzerantworten hin auf.
Description
- Die vorliegende Offenbarung bezieht sich auf eine Bildwiedergewinnung. Insbesondere bezieht sich die Offenbarung auf ein System und ein Verfahren zum Ermöglichen einer Bildwiedergewinnung.
- Momentan bestehen viele unterschiedliche Bilderfassungsvorrichtungen, die zum Erfassen und Speichern digitaler Bilder (Standbilder oder Videobilder) konfiguriert sind. Beispiele umfassen digitale Kameras und digitale Videorecorder, die tatsächliche Echtzeitszenen erfassen, und Scanner, die bestehende Bilder digital als filmbasierte Photographien erfassen. Obwohl verschiedene bestehende Bilderfassungsvorrichtungen zumindest temporär Bilder innerhalb des Vorrichtungsspeichers speichern können, speichern Benutzer normalerweise die erfaßten Bilder in einer lokalen oder entfernten Datenbank. Der Benutzer kann die erfaßten Bilder z. B. innerhalb einer Festplatte des Personalcomputers (PC) des Benutzers speichern oder kann die erfaßten Bilder innerhalb eines Onlinearchivs speichern, auf das über das Internet zugegriffen werden kann.
- Benutzer speichern oft jedes Bild in der Datenbank unter Verwendung eines Dateinamens, der auf bestimmte Weise für den Inhalt des Bildes relevant ist. Wenn das Bild z. B. eine Photographie einer Person mit dem Namen "Joe" ist und an seinem Geburtstag gemacht wurde, kann der Benutzer das Bild als "joe_birthday" oder mit einem entsprechenden Namen speichern. Durch Speichern des Bildes mit einem beschreibenden Dateinamen ist es wahrscheinlicher, daß der Benutzer später das Bild lokalisiert, wenn dasselbe erwünscht ist. Wenn der Benutzer viele unterschiedliche Bilder in der Datenbank speichert, ist dieses Identifikations- und Wiedergewinnungsverfahren vielleicht leider nicht effektiv, aufgrund der begrenzten Informationsmenge, die in dem Dateinamen geliefert werden kann.
- Aufgrund der Einschränkungen, die dem zuvor genannten Speicherungs- und Wiedergewinnungs-Verfahren zugeordnet sind, speichern Benutzer die Bilder oft ferner (oder alternativ) in unterschiedlichen Verzeichnissen innerhalb der Datenbank. Der Benutzer kann z. B. die Verzeichnisse "Familie", "Freunde", "Geschäft" und "Urlaub" beibehalten, die Bilder enthalten, die diese Themen betreffen. Bei einer derartigen Anordnung kann der Benutzer das Suchfeld für ein Bild einschränken, nach dem er oder sie sucht, und dann durch die Bilddateinamen scrollen, in der Hoffnung, das gewünschte Bild zu lokalisieren. Dieses Speicherungs- und Wiedergewinnungs-Verfahren kann auch nachteilhaft sein. Als erstes muß der Benutzer große Sorgfalt beim Speichern der Bilder ausüben, um sicherzustellen, daß eines oder mehrere Bilder nicht in dem falschen Verzeichnis abgelegt werden. Daher kann der Speicherungsprozeß für den Benutzer ermüdend sein. Zusätzlich dazu können sich mehrere Bilder für die Plazierung in mehr als einem Verzeichnis qualifizieren. Das Bild kann z. B. das eines Familienmitglieds sein, das im Urlaub gemacht wurde. In solchen Situationen muß sich der Benutzer entweder bestimmte geltende Standards ausdenken, um zu bestimmen, in welches einzelne Verzeichnis das Bild gespeichert wird, oder er muß sicherstellen, daß das Bild in jedem zutreffenden Verzeichnis gespeichert wird.
- Um die Situation zu vermeiden, in der der Benutzer ein Bild nur nach dem Dateinamen heraussuchen muß, verwenden manche Benutzer ferner Skizzenansichten, mit welchen jede der Photographien einer bestimmen Datenbank und/oder eines Verzeichnisses betrachtet werden kann, entweder in Gruppen oder durch Scrollen durch alle Bilder. Obwohl dieses Verfahren dem Benutzer viel Zeit beim Lokalisieren eines bestimmten Bildes sparen kann, kann es für den Benutzer ebenfalls ermüdend sein, insbesondere wenn die Datenbank und/oder das Verzeichnis mehrere hundert Bilder enthält. Ferner ist es für den Benutzer einfach, das gewünschte Bild zu überspringen, ohne dasselbe zu bemerken, da die Bilder üblicherweise nur als schwach aufgelöste Skizzen dargestellt sind.
- Bei einem wiederum weiterem Szenario kann der Benutzer einem Bild Schlüsselwörter zuweisen, derart, daß der Benutzer später die Schlüsselwörter in eine Suchmaschine eingeben kann, wenn er versucht, das Bild wiederzugewinnen. Obwohl dieses Verfahren dem zuvor genannten Verfahren auf mehrere Arten überlegen ist, weist dasselbe ebenfalls Einschränkungen auf, insofern, daß die Effektivität der Suchmaschine durch die Fähigkeiten und den Fleiß des Benutzers beim Erzeugen von Schlüsselwörtern eingeschränkt ist, wenn das Bild gespeichert wird. Zusätzlich dazu ist die Suchmaschine statisch und daher nicht in der Lage, später mehr Informationen von dem Benutzer zu sammeln, die verwendet werden könnten, um deren Fähigkeit zu verbessern, das Bild zu finden.
- Es ist die Aufgabe der vorliegenden Erfindung, ein Verfahren, ein Bildwiedergewinnungssystem und ein Computerprogramm für eine verbesserte Bildwiedergewinnung zu schaffen.
- Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1, ein Bildwiedergewinnungssystem gemäß Anspruch 11 und ein Computerprogramm gemäß Anspruch 16 gelöst.
- Aus dem Vorangehenden geht hervor, daß es wünschenswert wäre, ein System und ein Verfahren zum Ermöglichen einer Bildwiedergewinnung zu haben, das einen oder mehrere der oben identifizierten Nachteile vermeidet. Die vorliegende Offenbarung liefert ein derartiges System und Verfahren.
- Bei einer Anordnung weist das Verfahren die Schritte des Abfragens eines Benutzers über mindestens ein Attribut eines Bildes, das der Benutzer wiedergewinnen möchte, das Empfangen von Benutzerantworten und das Vorlegen von zumindest einem Bild an den Benutzer basierend auf der Benutzerantwort auf.
- Bei einer Anordnung weist das System eine Einrichtung zum Abfragen eines Benutzers über Attribute eines Bildes, das der Benutzer wiedergewinnen möchte, eine Einrichtung zum Empfangen von Benutzerantworten und eine Einrichtung zum Vorlegen von Bildern an den Benutzer basierend auf den Benutzerantworten auf.
- Bei einem bevorzugten Ausführungsbeispiel sind das System und das Verfahren angepaßt, um Informationen von dem Benutzer während des Wiedergewinnungsprozesses zu empfangen, so daß das System ausgefeilter beim Erkennen von Bildattributen und daher beim Lokalisieren und Wiedergewinnen von Bildern wird.
- Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
- Fig. 1 eine schematische Ansicht eines Systems zum Ermöglichen einer Bildwiedergewinnung gemäß der vorliegenden Erfindung;
- Fig. 2 eine schematische Ansicht einer Bilderfassungsvorrichtung, die in Fig. 1 gezeigt ist;
- Fig. 3 eine schematische Ansicht einer Rechenvorrichtung, die in Fig. 1 gezeigt ist;
- Fig. 4 ein Flußdiagramm, das ein Beispiel der Operation eines Bildwiedergewinnungsmoduls darstellt, das in Fig. 2 gezeigt ist, während eines Bildspeicherungsprozesses;
- Fig. 5 eine schematische Darstellung von Zuordnungen, die während eines Bildspeicherungsprozesses der vorliegenden Erfindung erzeugt wurden;
- Fig. 6A-6C ein Flußdiagramm, das ein Beispiel der Operation des Bildwiedergewinnungsmoduls während eines Bildwiedergewinnungsprozesses gemäß der vorliegenden Erfindung darstellt, das in Fig. 2 gezeigt ist; und
- Fig. 7 eine schematische Darstellung eines beispielhaften Verfahrens zum Identifizieren eines Bildattributs für das Bildwiedergewinnungsmodul gemäß der vorliegenden Erfindung.
- Wie oben erwähnt wurde, stellen aktuelle Bildwiedergewinnungs-Systeme und -Verfahren für den Benutzer mehrere Nachteile dar. Dementsprechend wird beabsichtigt, ein Bildwiedergewinnungs-System und -Verfahren bereitzustellen, das diese Nachteile verhindert. Genauer gesagt ist ein System und ein Verfahren beabsichtigt, das Informationen von dem Benutzer während des Wiedergewinnungsprozesses sammeln kann, um beim Lokalisieren von Bildern erfahrener zu werden. Ein Beispielsystem zum Praktizieren der Verfahren wird zuerst erörtert, gefolgt von Beispielen, wie das System arbeitet und wie dasselbe zum Wiedergewinnen von Bildern verwendet werden kann.
- Bezug nehmend nun auf die Zeichnungen, in denen gleiche Bezugszeichen entsprechende Teile in den unterschiedlichen Ansichten anzeigen, stellt Fig. 1 ein System 100 zum Ermöglichen einer Bildwiedergewinnung gemäß der vorliegenden Erfindung dar. Wie in dieser Figur angezeigt ist, kann das System 100 eine oder mehrere Bilderfassungsvorrichtungen 102 aufweisen, die zum Erfassen eines Bildes 104 verwendet werden können, das üblicherweise entweder eine tatsächliche Echtzeitszene oder ein bestehendes Bild, wie z. B. eine Photographie, aufweist. Die Beschaffenheit der Bilderfassungsvorrichtungen 102 kann variieren. Beispielsweise können die Bilderfassungsvorrichtungen 102 eine digitale Kamera 106, einen digitalen Videorekorder 108 und einen Scanner 110 aufweisen. Obwohl diese bestimmten Bilderfassungsvorrichtungen in Fig. 1 dargestellt sind und hierin spezifisch identifiziert sind, werden Fachleute auf dem Gebiet erkennen, daß die innerhalb dieser Offenbarung enthaltenen Lehren im wesentlichen jede Vorrichtung betreffen, die in der Lage ist, Bilddaten zu erfassen.
- Wie ferner in Fig. 1 angezeigt ist, kann jede der Bilderfassungsvorrichtungen 102 mit einer ersten Rechenvorrichtung 112 verbunden sein. Wie in Fig. 1 gezeigt ist, kann jede Vorrichtung 102 durch eine Hardware verbunden sein. Alternativ könnten drahtlose Kommunikationen verwendet werden. Die erste Rechenvorrichtung 112 kann einen Personalcomputer (PC) oder im wesentlichen jede andere Rechenvorrichtung aufweisen, die Bilddaten von einer Bilderfassungsvorrichtung 102 empfangen kann. Bei bestimmten Anordnungen kann die erste Rechenvorrichtung 112 (direkt oder drahtlos) mit einem Netzwerk 114 verbunden sein, derart, daß die erste Rechenvorrichtung 112 mit einer zweiten Rechenvorrichtung 116 kommunizieren kann, die auf ähnliche Weise mit dem Netzwerk verbunden ist. Das Netzwerk 114 kann eines oder mehrere Teilnetzwerke aufweisen, die kommunikativ miteinander gekoppelt sind. Beispielsweise können diese Netzwerke eines oder mehrere lokale Netze (LAN = local area network) und/oder weite Netze (WAN = wide area network) umfassen. Üblicherweise jedoch weist das Netzwerk 114 einen Satz von Netzwerken auf, der einen Teil des Internets bildet. Wie in Fig. 1 angezeigt ist, kann die zweite Rechenvorrichtung 116 einen Netzwerkserver aufweisen. Obwohl ein Netzwerkserver beschrieben und gezeigt ist, wird darauf hingewiesen, daß der Server nur als ein Beispiel bereitgestellt ist, und daß diese Darstellung den Schutzbereich der vorliegenden Offenbarung nicht einschränken soll.
- Fig. 2 ist eine schematische Ansicht, die eine Beispielarchitektur für die Bilderfassungsvorrichtungen 102 darstellt, die in Fig. 1 gezeigt sind. Wie oben erwähnt wurde, kann die Beschaffenheit der Bilderfassungsvorrichtungen 102 umfassend variieren. Allgemein ausgedrückt weist jede Bilderfassungsvorrichtung 102 üblicherweise jedoch eine Verarbeitungsvorrichtung 200, einen Speicher 202, eine Bilderfassungshardware 204, eine oder mehrere Benutzerschnittstellenvorrichtungen 206 und eines oder mehrere Vorrichtungsschnittstellenelemente 208 auf. Jede dieser Komponenten ist mit einer lokalen Schnittstelle 210 verbunden, die beispielsweise einen oder mehrere interne Busse aufweist. Die Verarbeitungsvorrichtung 200 ist angepaßt, um Befehle auszuführen, die in dem Speicher 202 gespeichert sind, und kann einen Allzweckprozessor, einen Mikroprozessor, eine oder mehrere anwendungsspezifische, integrierte Schaltungen (ASIC; ASIC = application specific integrated circuit), eine Mehrzahl von entsprechend konfigurierten, digitalen Logikgattern und andere bekannte elektrische Konfigurationen aufweisen, die einzelne Elemente sowohl individuell als auch in verschiedenen Kombinationen aufweisen, um die Gesamtoperation der Bilderfassungsvorrichtung 102 zu koordinieren.
- Die Bilderfassungshardware 202 weist die verschiedenen Komponenten auf, die verwendet werden, um digitale Bilder wiederzugewinnen und zu speichern. Wenn die Bilderfassungsvorrichtung 102 eine digitale Stehbildkamera oder einen digitalen Videorekorder aufweist, kann die Bilderfassungshardware 202 eine Linse, eines oder mehrere Fokussierungselemente (Linsen, Spiegel etc.), eines oder mehrere Lichterfassungselemente (z. B. ladungsgekoppelte Vorrichtung (CCD; CCD = charge-coupled device)) etc. aufweisen. Alternativ, wo die Bilderfassungsvorrichtung 102 einen Scanner aufweist, kann die Bilderfassungshardware 202 im allgemeinen eine Auflageplatte, einen optischen Sensor, einen Fokussierungsmechanismus, etc. aufweisen.
- Die eine oder die mehreren Benutzerschnittstellenvorrichtungen 206 weisen üblicherweise Schnittstellentools auf, mit denen die Bilderfassungsvorrichtungseinstellungen geändert werden können, und durch die der Benutzer Befehle an die Vorrichtung 102 kommunizieren kann. Beispielsweise können die Benutzerschnittstellenvorrichtungen 206 eine oder mehrere Funktionstasten aufweisen, mit denen die Operation der Bilderfassungsvorrichtung 102 und eine Anzeige, die angepaßt ist, um graphische Informationen an den Benutzer zu kommunizieren (z. B. eine Flüssigkristallanzeige (LCD; LCD = liquid crystal display)), gesteuert werden kann. Das eine oder die mehreren Vorrichtungsschnittstellenelemente 208 sind angepaßt, um eine elektrische Verbindung mit einer anderen Vorrichtung zu ermöglichen, wie z. B. der ersten Rechenvorrichtung 112, und um eine Verbindung zu dem Netzwerk 114 zu ermöglichen, wenn die Bilderfassungsvorrichtung 102 netzwerkaktiviert ist. In jedem Fall weisen die Schnittstellenelemente 208 üblicherweise eine Datenübertragungs-/Empfangs-Vorrichtung und/oder eines oder mehrere Kommunikationstore auf.
- Der Speicher 202 umfaßt verschiedene Software- und/oder Firmware-Programme, einschließlich eines Betriebssystems 212 und eines Bilderfassungsmoduls 214. Das Betriebssystem 212 enthält die verschiedenen Befehle, die verwendet werden, um den allgemeinen Betrieb der Bilderfassungsvorrichtung 102 zu steuern. Das Bilderfassungsmodul 214 weist eine Software und/oder eine Firmware auf, die angepaßt ist, um in Verbindung mit der Bilderfassungshardware 204 Daten zu erfassen, die durch die Bilderfassungsvorrichtung 102 in der Datenspeicherung 216 gespeichert und/oder zu einer anderen Vorrichtung (z. B. Rechenvorrichtung 212, 216) zur Speicherung übertragen werden können.
- Fig. 3 ist eine schematische Ansicht, die eine Beispielarchitektur für die Rechenvorrichtungen 112 und 116 darstellt, die, wie unten beschrieben ist, zum Speichern von Bildern und Konfigurieren derselben für eine spätere Wiedergewinnung verwendet werden können. Wie in Fig. 3 angezeigt ist, kann jede Rechenvorrichtung 112, 116 eine Verarbeitungsvorrichtung 300, einen Speicher 302, eine oder mehrere Benutzerschnittstellenvorrichtungen 304, eine oder mehrere Netzwerkschnittstellenvorrichtungen 306 und eine lokale Schnittstelle 308 aufweisen, mit der jede der anderen Komponenten elektrisch verbunden ist. Die lokale Schnittstelle 308 kann zusätzliche Elemente aufweisen, die der Einfachheit halber weggelassen sind, wie z. B. Steuerungen, Puffer (Cash-Speicher), Treiber, Repeater und Empfänger zum Ermöglichen von Kommunikationen. Ferner kann die lokale Schnittstelle 308 Adreß-, Steuerungs- und/oder Datenkommunikationen umfassen, zum Ermöglichen der entsprechenden Kommunikationen zwischen den zuvor genannten Komponenten.
- Die Verarbeitungsvorrichtung 300 kann jeglichen kundenspezifisch hergestellten oder handelsüblich erhältlichen Prozessor, eine zentrale Verarbeitungseinheit (CPU; CPU = central processing unit) oder einen Hilfsprozessor unter verschiedenen Prozessoren, die der Rechenvorrichtung 112, 116 zugeordnet sind, einen halbleiterbasierten Mikroprozessor (in der Form eines Mikrochips) oder einen Makroprozessor umfassen, wobei dies nicht einschränkend sein soll. Der Speicher 302 kann auf nichteinschränkende Weise jegliches einer Kombination aus flüchtigen Speicherelementen (z. B. Direktzugriffsspeicher (RAM, wie z. B. DRAM, SRAM etc.)) und nichtflüchtigen Speicherelementen (z. B. ROM, Festplatte, Band, CDROM etc.) umfassen.
- Die Benutzerschnittstellenvorrichtungen 304 weisen üblicherweise jene auf, die normalerweise in Verbindung mit einer Rechenvorrichtung verwendet werden. Zum Beispiel können die Benutzerschnittstellenvorrichtungen 304 eine Tastatur, eine Maus, einen Monitor etc. aufweisen. Die eine oder die mehreren Netzwerkschnittstellenvorrichtungen 306 weisen die Hardware auf, mit der die Rechenvorrichtung 112, 116 Informationen über das Netzwerk 114 überträgt und empfängt. Beispielsweise umfassen die Netzwerkschnittstellenvorrichtungen 306 Komponenten, die sowohl Eingangssignale als auch Ausgangssignale kommunizieren, z. B. einen Modulator/Demodulator (z. B. Modem), ein Hochfrequenz- (HF-) oder ein anderes Sende-/Empfangs-Gerät, eine Telefonschnittstelle, eine Brücke, einen Router etc.
- Der Speicher 302 weist verschiedene Softwareprogramme auf, einschließlich eines Betriebssystems 310, eines Bildwiedergewinnungsmoduls 312, eines Bilderfassungsvorrichtungstreibers 320 und einer Datenbank 322. Das Betriebssystem 310 steuert die Ausführung anderer Softwareelemente, wie z. B. des Bildwiedergewinnungsmoduls 312, und liefert Planung, Eingabe-/Ausgabe-Steuerung, Datei- und Daten-Verwaltung, Speicherverwaltung und Kommunikationssteuerung und verwandte Dienste. Wie in Fig. 3 angezeigt ist, kann das Bildwiedergewinnungsmodul 312 verschiedene Teilmodule aufweisen. Das Bildwiedergewinnungsmodul 312 kann z. B. einen Bildanalysealgorithmus 314, der verwendet wird, um Bilder zu analysieren, eine Bildsuchmaschine 316, die zum Lokalisieren und Wiedergewinnen gespeicherter Bilder verwendet wird und einen Bildattributzuweiser 318, der verwendet werden kann, um Bildattributzuweisungen durchzuführen, die die Erfahrung der Suchmaschine verbessern, aufweisen. Obwohl separate Teilmodule in Fig. 3 identifiziert wurden, werden Fachleute auf dem Gebiet erkennen, daß diese Teilmodule verschiedene Funktionalitäten darstellen, die durch das Bilderfassungsmodul 312 durchgeführt werden, und daß die Teilmodule daher kombiniert oder alternativ angeordnet werden können. Beispiele der Operation des Bilderfassungsmoduls 312 sind unten Bezug nehmend auf die Fig. 4-7 bereitgestellt.
- Ferner ist in dem Speicher 302 ein Bilderfassungsvorrichtungstreiber 320 umfaßt, der verwendet wird, um mit den Bilderfassungsvorrichtungen 102 zu kommunizieren und dieselben zu steuern (wo zutreffend). Alternativ, bei sogenannten "treiberlosen" Systemen, wird der Bilderfassungsvorrichtungstreiber 320 vielleicht nicht gebraucht. Der Speicher 302 umfaßt üblicherweise eine Datenbank 322, die zum Speichern von Bilddaten verwendet werden kann und, wie unten detailliert erörtert wird, Metadaten, die durch das Bildwiedergewinnungsmodul 312 zum Lokalisieren und Wiedergewinnen von Bildern verwendet werden können.
- Es wurden verschiedene Software- und/oder Firmware- Programme hierin beschrieben. Es wird darauf hingewiesen, daß diese Programme auf jedem computerlesbaren Medium zur Verwendung durch oder in Verbindung mit jeglichem computerverwandten System oder Verfahren gespeichert werden können. In dem Kontext dieses Dokuments ist ein computerlesbares Medium eine elektronische, magnetische, optische oder andere physische Vorrichtung oder Einrichtung, die ein Computerprogramm zur Verwendung durch oder in Verbindung mit einem computerverwandten System oder Verfahren enthalten oder speichern kann. Diese Programme können in jedem computerlesbaren Medium zur Verwendung durch oder in Verbindung mit einem Befehlsausführungssystem, einer Einrichtung oder einer Vorrichtung, wie z. B. einem computerbasierten System, einem prozessorenthaltenden System oder einem anderen System verkörpert sein, das die Befehle aus dem Befehlsausführungssystem, der Einrichtung oder der Vorrichtung holen und die Befehle ausführen kann. In dem Kontext dieses Dokuments kann ein "computerlesbares Medium" jede Einrichtung sein, die das Programm zur Verwendung durch oder in Verbindung mit dem Befehlsausführungssystem, der Einrichtung oder der Vorrichtung speichern, kommunizieren, verbreiten oder transportieren kann.
- Das computerlesbare Medium kann z. B., aber nicht ausschließlich, ein elektronisches, magnetisches, optisches, elektromagnetisches, Infrarot- oder Halbleiter-System, eine Einrichtung, eine Vorrichtung oder ein Verteilmedium sein. Spezifischere Beispiele (eine nichterschöpfende Liste) des computerlesbaren Mediums umfassen eine elektrische Verbindung mit einem oder mehreren Drähten, eine tragbare Computerdiskette, einen Direktzugriffsspeicher (RAM; RAM = random access memory), einen Nur-Lese-Speicher (ROM; ROM = read-only memory), einen löschbaren, programmierbaren Nur- Lese-Speicher (EPROM, EEPROM oder Flash-Speicher), eine optische Faser und einen tragbaren CD-Platten-Nur-Lese- Speicher (CDROM). Es wird darauf hingewiesen, daß das computerlesbare Medium sogar Papier oder ein anderes geeignetes Medium sein kann, auf das das Programm gedruckt wird, da das Programm elektronisch erfaßt, z. B. über optisches Scannen des Papiers oder eines anderen Mediums, nachfolgendes Kompilieren, Interpretieren oder anderweitiges Verarbeiten auf eine geeignete Weise, wenn nötig erfaßt und dann in einem Computerspeicher gespeichert werden kann.
- Da nun ein Beispielsystem 100 oben beschrieben wurde, ist nun die Operation des Systems erörtert. Bei der nachfolgenden Erörterung werden mehrere Flußdiagramme bereitgestellt. Es wird darauf hingewiesen, daß jegliche Prozeßbeschreibungen oder Blöcke in diesen Flußdiagrammen Module, Segmente oder Codeabschnitte darstellen, die einen oder mehrere ausführbare Befehle zum Implementieren spezifischer Logikfunktionen oder Schritte in dem Prozeß umfassen, und daß alternative Implementierungen machbar sind. Ferner können Funktionen außer der Reihenfolge ausgeführt werden, die gezeigt oder erörtert ist, einschließlich im wesentlichen gleichzeitig oder in umgekehrter Reihenfolge, abhängig von der umfaßten Funktionalität.
- Bezug nehmend nun auf Fig. 4 wird ein Betriebsbeispiel des Bildwiedergewinnungsmoduls 312 während des Bildspeicherungsprozesses gemäß der vorliegenden Erfindung erörtert. Wie aus späteren, hierin bereitgestellten Erörterungen offensichtlich wird, kann die Teilnahme des Bildwiedergewinnungsmoduls an dem Speicherungsprozeß zu einer verbesserten Wiedergewinnungsfähigkeit führen. Wie bei Block 400 angezeigt ist, erfaßt das Bildwiedergewinnungsmodul 312 zuerst eine Speicherungsanfrage. Beispielsweise kann diese Anfrage eine Anfrage zum Speichern eines erfaßten Bildes (z. B. digitales Photo, digitaler Videorahmen oder gescanntes Bild) in der lokalen oder entfernten Datenbank 322 sein. Sobald diese Anfrage erfaßt wurde, kann das Bildwiedergewinnungsmodul 312 vom Benutzer Schlüsselwörtern oder Phrasen anfordern, die für den Inhalt des Bildes relevant sind, und die der Benutzer später in eine Suchmaschine eingeben kann, wenn er versucht, das Bild aus der Datenbank 322 wiederzugewinnen. Wenn das Bild z. B. eine Abbildung von Joes Geburtstagsparty aufweist, kann der Benutzer "Joe", "Geburtstag" und "Party" als Schlüsselwörter oder die Phrase "Joe auf seiner Geburtstagsparty" eingeben.
- Bezug nehmend auf das Entscheidungselement 404, wenn der Benutzer Schlüsselwörter oder Phrasen bereitstellen möchte, fährt der Fluß mit Block 406 fort, wo die Schlüsselwörter oder Phrasen empfangen werden. Wenn der Benutzer jedoch keine Schlüsselwörter und/oder Phrasen bereitstellen möchte, fährt der Fluß unten mit Block 410 fort, wie nachfolgend beschrieben wird. Sobald die Schlüsselwörter oder Phrasen empfangen wurden, werden die bereitgestellten Schlüsselwörter oder Schlüsselwörter, die aus der bereitgestellten Phrase extrahiert wurden, als Bildmetadaten gespeichert, wie bei Block 408 angezeigt wird. Wenn der Benutzer z. B. die Phrase "Joe auf seiner Geburtstagsparty" bereitgestellt hat, kann das Bildwiedergewinnungsmodul 312 die Ausdrücke "Joe", "Geburtstag" und "Party" als einzelne Suchbegriffe speichern. Wie Fachleuten auf dem Gebiet bekannt ist, können die Metadaten als Teil der Bilddatei gespeichert werden, die in dem Speicherungsprozeß erzeugt wird, derart, daß die Datei sowohl Bilddaten als auch Megadaten enthält, oder separat in einer Nachschlagtabelle gespeichert werden kann, die die Schlüsselwörter mit den spezifischen Bilddateien korreliert.
- Bezug nehmend als nächstes auf Block 410, kann das Bildwiedergewinnungsmodul 312 das Bild analysieren, das nach erkennbaren Attributen gespeichert werden soll. Genauer gesagt kann der Bildanalysealgorithmus 314 des Bildwiedergewinnungsmoduls 312 das Bild in Verbindung mit den gespeicherten Attributzuweisungen analysieren. Beispielsweise kann der Bildanalysealgorithmus 314 vorkonfiguriert sein, um gewisse Bildattribute zu erkennen, die Sonnenlicht, Himmel, Gras, Bäume, Gewässer, Glühlicht, fluoreszierendes Licht, Menschen, menschliche Gesichter, Tiere etc. betreffen. Fachleute auf dem Gebiet werden erkennen, daß eine derartige Erkennung auf Farbspektren, Lichtspektren, Objektkanten, Objektaspektverhältnissen, Position in dem Bild usw. basieren kann. Mit derartigen, gespeicherten Attributzuweisungen kann das Bildwiedergewinnungsmodul 312 ferner den Metadaten etwas hinzufügen, die dem Bild zugeordnet sind, durch Markieren der Attribute des Bildes (z. B. durch Hinzufügen eines Metadatenetiketts), das der Benutzer vielleicht nicht mit Schlüsselwörtern oder Phrasen identifiziert hat, die er oder sie bereitgestellt hat (falls vorhanden). Fig. 5 stellt schematisch Bilder und ihre zugeordneten Metadaten dar. Wie in dieser Figur angezeigt ist, kann jedes gespeicherte Bild (Bild 1, Bild 2, . . .) Metadaten 500 aufweisen, die eines oder mehrere Schlüsselwörter (Schlüsselwort 1, Schlüsselwort 2, . . .) und eines oder mehrere identifizierte Attribute (Attribut 1, Attribut 2, . . .) umfassen.
- Bezug nehmend auf das Entscheidungselement 412 von Fig. 4, wenn ein erkennbares Attribut in dem Bild vorhanden ist, fährt der Fluß mit Block 414 fort, wo eine Attributzuweisung als Metadaten gespeichert wird, z. B. durch den Bildattributzuordner 318. Sobald diese Zuordnung gespeichert wurde, kann der Fluß zurückkehren zu Block 410, wo die Bildwiedergewinnungsmodule 312 das Bild nach anderen erkennbaren Attributen analysieren können. Dementsprechend kann das Bildwiedergewinnungsmodul 312 mehrere Bildattribute finden, die die Bildwiedergewinnungserfahrung des Moduls steigern. Wiederum Bezug nehmend auf das Entscheidungselement 412, wenn keine (oder keine weiteren) Bildattribute identifiziert wurden, wird der Fluß beendet und die Bilddatei wird in der Datenbank 322 gespeichert.
- Nachdem ein Bild gespeichert wurde, z. B. unter Verwendung des oben Bezug nehmend auf Fig. 4 und 5 beschriebenen Verfahrens, kann der Benutzer das Bild aus der Datenbank 322 wiedergewinnen. Wenn die Datenbank 322 eine große Anzahl von Bildern aufweist, kann es für den Benutzer schwierig sein, das gewünschte Bild schnell zu lokalisieren. Das Bildwiedergewinnungsmodul 312 und genauer gesagt die Bildsuchmaschine 316 können jedoch verwendet werden, um den Wiedergewinnungsprozeß zu erleichtern. Wie nachfolgend erörtert wird, ist das Bildwiedergewinnungsmodul 312 derart konfiguriert, daß es Informationen von dem Benutzer während des Wiedergewinnungsprozesses erhalten und weitere Attributzuordnungen als Metadaten speichern kann, die bei späteren Wiedergewinnungsprozessen helfen. Dementsprechend ist das Bildwiedergewinnungsmodul 312 dynamisch konfiguriert, um durch den Bildwiedergewinnungsprozeß erfahrener zu werden.
- Das Bildwiedergewinnungsmodul 312 kann nun Bezug nehmend auf Fig. 6A eine Wiedergewinnungsanfrage empfangen, die bei Block 600 angezeigt ist. Beispielsweise kann diese Wiedergewinnungsanfrage durch die Bildsuchmaschine 316 empfangen werden, die eine Anwendung aufweisen kann, mit der der Benutzer Suchanfragen schnittstellenmäßig verbinden und übertragen kann. Sobald die Suchanfrage empfangen wird, kann das Bildwiedergewinnungsmodul 312 den Benutzer nach den Schlüsselwörtern oder Phrasen auffordern, von denen der Benutzer glaubt, daß er oder sie dieselben bei dem Speicherungsprozeß bereitgestellt hat. Wie aus der nachfolgenden Erörterung offensichtlich wird, ist dieser Schritt insofern optional, daß das Bildwiedergewinnungsmodul 312 in der Lage ist, die Bildwiedergewinnung auf andere Weisen zu ermöglichen. Wenn Bezug nehmend auf das Entscheidungselement 604 keine Schlüsselwörter oder Phrasen durch den Benutzer bereitgestellt werden, fährt der Fluß mit Block 612 in Fig. 6B fort, wie unten beschrieben ist. Wenn der Benutzer jedoch Schlüsselwörter oder Phrasen liefert, fährt der Fluß bei Block 606 fort, wo die Schlüsselwörter oder Phrasen durch das Bildwiedergewinnungsmodul 312 empfangen werden. Sobald diese Schlüsselwörter oder Phrasen empfangen wurden, kann das Modul 312 die Bilddateien, genauer gesagt die Metadaten, die diesen Dateien zugeordnet sind, nach den Schlüsselwörtern durchsuchen, die durch den Benutzer bereitgestellt wurden, wie bei Block 608 angezeigt ist.
- Wenn eines oder mehrere Bilder durch das Bildwiedergewinnungsmodul 312 lokalisiert werden, wie bei dem Entscheidungselement 610 angezeigt ist, fährt der Fluß mit dem Entscheidungselement 612 fort, wo bestimmt werden kann, ob eine Mehrzahl (z. B. mehr als 50) der Bilder lokalisiert wurde, oder ob nur eines oder wenige Bilder lokalisiert wurden. Es wird darauf hingewiesen, daß der Inhalt einer "Mehrzahl" variieren kann, und daß dieselbe bei manchen Ausführungsbeispielen durch den Benutzer auswählbar ist. Wenn nur eines von wenigen Bildern lokalisiert wurde, kann der Fluß mit Block 614 fortfahren, wo die Bilder dem Benutzer vorgelegt werden können (z. B. in Skizzenform). Sobald dieselben an den Benutzer vorgelegt wurden, kann der Fluß dann an dem Entscheidungselement 632 von Fig. 6C fortfahren, wie nachfolgend beschrieben wird.
- Bezug nehmend nochmals auf das Entscheidungselement 612 in Fig. 6A fährt der Fluß mit Block 616 fort, der in Fig. 6B gezeigt ist, wenn eine Mehrzahl von Bildern durch das Bildwiedergewinnungsmodul 312 nach dem Durchsuchen nach den Schlüsselwörtern lokalisiert wurde. Wie bei Block 616 angezeigt ist, kann das Bildwiedergewinnungsmodul 312 konfiguriert sein, um den Benutzer darüber abzufragen, nach welchen Attributen des Bildes der Benutzer sucht, wenn keine Schlüsselwörter oder Phrasen bereitgestellt wurden (Entscheidungselement 604), wenn keine Bilder unter Verwendung der bereitgestellten Schlüsselwörter lokalisiert wurden (Entscheidungselement 610) oder wenn eine Mehrzahl von Bildern unter Verwendung der bereitgestellten Schlüsselwörter lokalisiert wurde (Entscheidungselement 612). In jedem dieser Szenarios hat das Bildwiedergewinnungsmodul 312 das Suchfeld nicht mit großer Effizienz geschmälert. Obwohl die Abfrage derart beschrieben ist, daß sie in diesen bestimmten Szenarios auf den Benutzer gerichtet ist, kann das Bildwiedergewinnungsmodul 312 alternativ konfiguriert sein, um den Bildwiedergewinnungsprozeß durch Abfragen des Benutzers zu beginnen, falls erwünscht. Ferner wird darauf hingewiesen, daß der Benutzer optional den Abfrageprozeß, falls erwünscht, jederzeit aktivieren könnte.
- Die Abfrage kann eine oder eine Serie von Fragen aufweisen, die dem Benutzer gestellt werden, die verwendet werden, um das Suchfeld des gewünschten Bildes zu schmälern. Beispielsweise können die Fragen relativ breit gefächert sein und mit jeder neu gestellten Frage immer spezifischer werden. Ferner kann die Beschaffenheit jeder Nachfolgefrage, die dem Benutzer gestellt wird, von der Antwort abhängen, die der Benutzer auf die vorangehend gestellte Frage geliefert hat. Die erste Frage kann z. B. sein: "Ist das Bild von einer Außen- oder Innen-Szene?". Wenn der Benutzer z. B. antwortet, daß das Bild von einer Außenszene stammt, kann die zweite Frage sein: "Wurde das Bild am Tag oder in der Nacht gemacht?". Andere Nachfolgefragen könnten sein: "Sind Personen auf dem Bild?", "Ist das Bild eine Nahaufnahme?" etc. Die Antworten auf diese Fragen können verwendet werden, um gewisse Bilder als potentielle Übereinstimmungen basierend auf den Bildattributen zu eliminieren, die dieselben nicht enthalten. Wenn der Benutzer z. B. anzeigt, daß das Bild von einer Innenszene ist, kann das Bildwiedergewinnungsmodul 312 alle Außenbilder aus der Sammlung von potentiellen Übereinstimmungen beseitigen. Als Alternative ist angegeben, daß potentielle Übereinstimmungen basierend auf Bildattributen ausgewählt werden können, die dieselben enthalten.
- Die Benutzerantworten werden empfangen, wie bei Block 618 angezeigt ist, eine nach der anderen, wie bei Block 620 angezeigt ist, wobei verschiedene Bilder beseitigt werden. Genauer gesagt durchsucht das Bildwiedergewinnungsmodul 312die Metadaten, die den Bildern zugeordnet sind; um zu bestimmen, welche Bilder die falschen und/oder die richtigen Bildattribute enthalten. Bezug nehmend auf das Entscheidungselement 622 kann bestimmt werden, ob eine angemessene Anzahl von potentiellen Bildern lokalisiert wurde (z. B. 20). Was eine "angemessene" Anzahl ausmacht, kann variieren, und bei manchen Ausführungsbeispielen kann dies durch den Benutzer spezifiziert werden. Wenn keine angemessene Anzahl lokalisiert wird (z. B. es werden zu viele lokalisiert), dann kann der Fluß zurückkehren zu Block 616 und der Abfrageprozeß kann fortfahren, um das Suchfeld weiter zu schmälern. Wenn eine angemessene Anzahl von Bildern lokalisiert wurde, fährt der Fluß jedoch mit Block 624 fort, wo die Bilder dem Benutzer vorgelegt werden (z. B. in Skizzenform).
- An diesem Punkt kann das Bildwiedergewinnungsmodul 312 den Benutzer auffordern, die Bildattribute zu identifizieren, die in den Bildern enthalten sind, die dem Benutzer vorgelegt wurden, um die Erfahrung des Bildwiedergewinnungsmoduls zu erhöhen, wie in Block 626 identifiziert ist. Diese Identifizierung kann auf verschiedene Weisen kommuniziert werden. Bei einer Anordnung kann die Identifizierung eine Auswahl von Bildern aufweisen, die dem Benutzer vorgelegt werden, die ein bestimmtes Attribut enthalten, das sie mit dem Bild gemeinsam haben, nach dem der Benutzer gesucht hat, oder das sie miteinander gemeinsam haben. Der Benutzer könnte z. B. alle Bilder aussuchen, die ein Bild einer bestimmten Person umfassen. Durch eine derartige Auswahl kann das Bildwiedergewinnungsmodul 312 alle Bilder einander und/oder den Antworten zuordnen, die dieses Attribut aufweisen, die durch den Benutzer während des Abfrageprozesses bereitgestellt wurden.
- Da das oben beschriebene Identifizierungsverfahren auf gewisse Weise intuitiv ist, möchte der Benutzer vielleicht eine direktere Identifizierung eines Medienattributs liefern. Es sei z. B. angenommen, daß der Benutzer nach einem Bild eines Fußballspiels gesucht hat, dann könnte der Benutzer einen Fußball hervorheben, der in einem oder mehreren der Bilder vorhanden ist, die dem Benutzer vorgelegt wurden. Dies ist schematisch in Fig. 7 dargestellt, die ein Beispielbild 700 zeigt, das einen Fußball 702 umfaßt. Wie in dieser Figur angezeigt ist, kann der Benutzer den Fußball 702 mit einem Hervorhebekästchen 704 auswählen, unter Verwendung einer Maus oder einer anderen Benutzerschnittstellenvorrichtung. Nachdem der Fußball 702 auf die in Fig. 7 gezeigte Weise hervorgehoben wurde, kann der Benutzer den Fußball explizit derart identifizieren, daß er dem Bildwiedergewinnungsmodul 312 "Fußball" oder einen "Fußball" darstellt. Das Bildwiedergewinnungsmodul 312 kann daher lernen, ein rundes Objekt mit schwarzen und weißen Flecken derart zuzuordnen, daß es den Ausdrücken "Fußball" oder ein "Fußball" zugeordnet wird, derart, daß, wenn diese Ausdrücke von dem Benutzer als Schlüsselwort oder ansprechend auf eine gestellte Frage empfangen werden, das Bildwiede rgewinnungsmodul 312 alle Bilder lokalisieren kann, die einen Fußball umfassen. Abhängig von der Ausgereiftheit des Bildwiedergewinnungsmoduls 312 könnte das Modul auf diese Weise trainiert werden, um im wesentlichen jedes Bildmerkmal oder Objekt innerhalb eines Bildes zu erkennen.
- Zurück bei Block 626 und Fig. 6B kann das Bildwiede rgewinnungsmodul 312 die Identifizierungen empfangen, wie sie in Block 628 von Fig. 6C angezeigt sind, sobald der Benutzer aufgefordert wurde, Bildattribute zu identifizieren. An diesem Punkt können die Attributzuordnungen z. B. durch den Bildattributzuordner 318 als Metadaten gespeichert werden. Wenn der beispielsweise Benutzer den Fußball 702 für das Bildwiedergewinnungsmodul 312 identifiziert hat, kann die Existenz des Fußballs in den Metadaten (z. B. als ein Metadatenetikett) markiert werden, die dem Bild 700 zugeordnet sind. Zusätzlich dazu kann das Bildwiedergewinnungsmodul 312 konfiguriert sein, um die gesamte Datenbank nach Bildern zu durchsuchen, um jedes Bild zu identifizieren, das dieses Attribut enthält, und diese Informationen in den Metadaten dieser Bilder zu speichern.
- An diesem Punkt kann bestimmt werden, ob das gewünschte Bild oder die Bilder durch das Bildwiedergewinnungsmodul 312 lokalisiert wurden, wie bei dem Entscheidungselement 632 angezeigt ist. Wenn nicht, kann der Fluß zu Block 616 zurückkehren, wo dem Benutzer weitere Fragen gestellt werden und der oben beschriebene Prozeß wiederholt wird. In einer derartigen Situation kann der Wiedergewinnungsprozeß (sowie der Bildwiedergewinnungsmodul-Lernprozeß) in seiner Beschaffenheit iterativ sein. Alternativ können herkömmliche Bildwiedergewinnungstechniken verwendet werden, um das Bild zu lokalisieren, und falls erwünscht kann dem Bildwiedergewinnungsmodul 312 beigebracht werden, eines oder mehrere Attribute innerhalb des Bildes auf die oben beschriebene Weise zu erkennen. Wenn das Bild oder die Bilder jedoch lokalisiert wurden, fährt der Fluß mit Block 634 fort, wo die Bildauswahl des Benutzers empfangen wird, und mit Block 636, wo das Bild für den Benutzer wiedergewonnen wird. Wiederum kann der Benutzer an diesem Punkt Bildattribute für das Bildwiedergewinnungsmodul 312 falls erwünscht identifizieren, so daß das Bild sowie andere Bilder, die die identifizierten Attribute enthalten, zukünftig leichter lokalisiert werden können. An diesem Punkt endet der Wiedergewinnungsfluß und der Prozeß kann zum Lokalisieren und Wiedergewinnen anderer Bilder wiederholt werden.
- Aus der obigen Beschreibung wird offensichtlich, daß je häufiger der Wiedergewinnungsprozeß und der Informationsaustausch, der während desselben stattfindet, durchgeführt werden, desto erfahrener kann das Bildwiedergewinnungsmodul 312 werden. Daher können vorteilhaftere Ergebnisse mit dem Bildwiedergewinnungsmodul 312 als im Vergleich zu herkömmlichen Bildwiedergewinnungssoftwarepaketen erreicht werden.
Claims (20)
1. Verfahren zum Ermöglichen einer Bildwiedergewinnung,
das folgende Schritte aufweist:
Abfragen eines Benutzers über zumindest ein Attribut eines Bildes, das der Benutzer wiedergewinnen (602) möchte;
Empfangen einer Benutzerantwort (606);
Vorlegen von zumindest einem Bild an den Benutzer basierend auf der Benutzerantwort (614).
Abfragen eines Benutzers über zumindest ein Attribut eines Bildes, das der Benutzer wiedergewinnen (602) möchte;
Empfangen einer Benutzerantwort (606);
Vorlegen von zumindest einem Bild an den Benutzer basierend auf der Benutzerantwort (614).
2. Verfahren gemäß Anspruch 1, bei dem der Schritt des
Abfragens eines Benutzers das Stellen einer Reihe von
Fragen an den Benutzer aufweist, und bei dem der
Schritt des Empfangens der Benutzerantwort das
Empfangen separater Antworten auf jede gestellte Frage
aufweist.
3. Verfahren gemäß Anspruch 2, bei dem zumindest eine der
aufeinanderfolgenden Fragen von der Benutzerantwort
abhängt, die auf eine vorangehende Frage gegeben
wurde.
4. Verfahren gemäß einem der Ansprüche 1 bis 3, das
ferner den Schritt des Beseitigens potentieller
Bildübereinstimmungen ansprechend auf die empfangene Antwort
aufweist.
5. Verfahren gemäß einen der Ansprüche 1 bis 4, das
ferner den Schritt des Aufforderns des Benutzers (630)
aufweist, mindestens ein Bildattribut zu
identifizieren (626).
6. Verfahren gemäß Anspruch 5, das ferner den Schritt des
Speicherns einer Attributzuordnung als Bildmetadaten
ansprechend auf eine Benutzerantwort auf die
Aufforderung des Benutzers hin aufweist.
7. Verfahren gemäß Anspruch 6, bei dem die
Benutzerantwort auf die Aufforderung eine direkte Auswahl von
zumindest einem vorgelegten Bild durch den Benutzer
aufweist.
8. Verfahren gemäß Anspruch 6 oder 7, bei dem die
Benutzerantwort auf die Aufforderung die Identifizierung
von zumindest einem Bildattribut bei zumindest einem
vorgelegten Bild durch den Benutzer aufweist.
9. Verfahren gemäß einem der Ansprüche 1 bis 8, das
ferner den Schritt des Analysierens der Bilder nach einem
erkennbaren Bildattribut aufweist.
10. Verfahren gemäß Anspruch 9, das ferner den Schritt des
Speicherns von Attributzuordnungen als Bildmetadaten
basierend auf dem Analysieren der Bilder aufweist.
11. Bildwiedergewinnungssystem, das folgende Merkmale
aufweist:
eine Einrichtung zum Abfragen eines Benutzers über Attribute eines Bildes, das der Benutzer wiedergewinnen möchte;
eine Einrichtung zum Empfangen von Benutzerantworten; und
eine Einrichtung zum Vorlegen von Bildern an den Benutzer basierend auf den Benutzerantworten.
eine Einrichtung zum Abfragen eines Benutzers über Attribute eines Bildes, das der Benutzer wiedergewinnen möchte;
eine Einrichtung zum Empfangen von Benutzerantworten; und
eine Einrichtung zum Vorlegen von Bildern an den Benutzer basierend auf den Benutzerantworten.
12. System gemäß Anspruch 11, das ferner eine Einrichtung
zum Auffordern des Benutzers zum Identifizieren der
Bildattribute aufweist.
13. System gemäß Anspruch 12, das ferner eine Einrichtung
zum Speichern einer Attributzuordnung als
Bildmetadaten ansprechend auf eine Benutzerantwort auf das
Auffordern des Benutzers hin aufweist.
14. System gemäß einem der Ansprüche 11 bis 13, das ferner
eine Einrichtung zum Analysieren von Bildern nach
einem erkennbaren Bildattribut aufweist.
15. System gemäß Anspruch 14, das ferner eine Einrichtung
zum Speichern von Attributzuordnungen als
Bildmetadaten basierend auf dem Analysieren der Bilder aufweist.
16. Computerprogramm, das auf einem computerlesbaren
Medium gespeichert ist, das folgende Merkmale aufweist:
eine Logik, die konfiguriert ist, um Fragen für einen Benutzer zu erzeugen, die entworfen sind, um Antworten bezüglich von Attributen eines Bildes zu erhalten, das der Benutzer wiedergewinnen möchte;
eine Logik, die konfiguriert ist, um Benutzerantworten zu empfangen; und
eine Logik, die konfiguriert ist, um zu bestimmen, welche Bilder den Wiedergewinnungswünschen des Benutzers entsprechen könnten.
eine Logik, die konfiguriert ist, um Fragen für einen Benutzer zu erzeugen, die entworfen sind, um Antworten bezüglich von Attributen eines Bildes zu erhalten, das der Benutzer wiedergewinnen möchte;
eine Logik, die konfiguriert ist, um Benutzerantworten zu empfangen; und
eine Logik, die konfiguriert ist, um zu bestimmen, welche Bilder den Wiedergewinnungswünschen des Benutzers entsprechen könnten.
17. Programm gemäß Anspruch 16, das ferner eine Logik
aufweist, die konfiguriert ist, um den Benutzer
aufzufordern, Bildattribute zu identifizieren.
18. Programm gemäß Anspruch 17, das ferner eine Logik
aufweist, die konfiguriert ist, um eine
Attributzuordnung als Bildmetadaten zu speichern, ansprechend auf
eine Benutzerantwort auf das Auffordern des Benutzers
hin.
19. Programm gemäß einem der Ansprüche 16 bis 18, das
ferner eine Logik aufweist, die konfiguriert ist, um
Bilder nach einem erkennbaren Bildattribut zu
analysieren.
20. Programm gemäß Anspruch 19, das ferner eine Logik
aufweist, die konfiguriert ist, um Attributzuordnungen
basierend auf dem Analysieren der Bilder als
Bildmetadaten zu speichern.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US09/938,256 US20030039410A1 (en) | 2001-08-23 | 2001-08-23 | System and method for facilitating image retrieval |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE10236932A1 true DE10236932A1 (de) | 2003-03-20 |
Family
ID=25471177
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE10236932A Withdrawn DE10236932A1 (de) | 2001-08-23 | 2002-08-12 | System und Verfahren zum Ermöglichen einer Bildwiedergewinnung |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20030039410A1 (de) |
| DE (1) | DE10236932A1 (de) |
| GB (1) | GB2381615A (de) |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1761025A1 (de) * | 2003-03-04 | 2007-03-07 | Ricoh Company, Ltd. | Bilderzeugungsvorrichtung und Bildverarbeitungsvorrichtung |
| FR2852769B1 (fr) * | 2003-03-20 | 2005-09-16 | Eastman Kodak Co | Procede de partage de donnees multimedia |
| US20050163378A1 (en) * | 2004-01-22 | 2005-07-28 | Jau-Yuen Chen | EXIF-based imaged feature set for content engine |
| US7788258B1 (en) * | 2004-06-21 | 2010-08-31 | Google Inc. | Automatic determination of whether a document includes an image gallery |
| US7734622B1 (en) * | 2005-03-25 | 2010-06-08 | Hewlett-Packard Development Company, L.P. | Media-driven browsing |
| US7702681B2 (en) * | 2005-06-29 | 2010-04-20 | Microsoft Corporation | Query-by-image search and retrieval system |
| JP4890212B2 (ja) * | 2005-12-12 | 2012-03-07 | 株式会社リコー | スキャン画像管理装置 |
| US20070233828A1 (en) * | 2006-03-31 | 2007-10-04 | Jeremy Gilbert | Methods and systems for providing data storage and retrieval |
| KR101135891B1 (ko) * | 2006-10-11 | 2012-04-13 | 삼성전자주식회사 | 인덱스정보에 따라 파일을 화상처리하는 화상형성장치 |
| JP5043748B2 (ja) * | 2008-05-19 | 2012-10-10 | キヤノン株式会社 | コンテンツ管理装置、コンテンツ管理装置の制御方法、プログラム及び記録媒体 |
| US8788504B1 (en) * | 2008-11-12 | 2014-07-22 | Google Inc. | Web mining to build a landmark database and applications thereof |
| US20100131533A1 (en) * | 2008-11-25 | 2010-05-27 | Ortiz Joseph L | System for automatic organization and communication of visual data based on domain knowledge |
| WO2011017746A1 (en) * | 2009-08-11 | 2011-02-17 | Someones Group Intellectual Property Holdings Pty Ltd | Method, system and controller for searching a database |
| US9009163B2 (en) * | 2009-12-08 | 2015-04-14 | Intellectual Ventures Fund 83 Llc | Lazy evaluation of semantic indexing |
| US8954885B2 (en) * | 2010-10-05 | 2015-02-10 | Fergason Patent Properties, Llc | Display system using metadata to adjust area of interest and method |
| KR102019975B1 (ko) * | 2012-08-29 | 2019-11-04 | 삼성전자주식회사 | 디아비스 및 그의 컨텐츠 검색 방법 |
| US10726464B2 (en) | 2014-12-18 | 2020-07-28 | Ebay Inc. | Expressions of user interest |
| US10929462B2 (en) | 2017-02-02 | 2021-02-23 | Futurewei Technologies, Inc. | Object recognition in autonomous vehicles |
| WO2019205170A1 (zh) * | 2018-04-28 | 2019-10-31 | 华为技术有限公司 | 一种拍照方法和终端设备 |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2735187B2 (ja) * | 1987-03-17 | 1998-04-02 | 株式会社東芝 | 情報検索方法 |
| JP3177746B2 (ja) * | 1991-03-20 | 2001-06-18 | 株式会社日立製作所 | デ−タ処理システム及び方法 |
| JP3067966B2 (ja) * | 1993-12-06 | 2000-07-24 | 松下電器産業株式会社 | 画像部品を検索する装置及びその方法 |
| US5802361A (en) * | 1994-09-30 | 1998-09-01 | Apple Computer, Inc. | Method and system for searching graphic images and videos |
| CA2290445A1 (en) * | 1997-05-16 | 1998-11-19 | The Trustees Of Columbia University | Method and system for image retrieval |
| JPH11187231A (ja) * | 1997-12-24 | 1999-07-09 | Canon Inc | 画像検索装置及び画像検索方法 |
| US6345274B1 (en) * | 1998-06-29 | 2002-02-05 | Eastman Kodak Company | Method and computer program product for subjective image content similarity-based retrieval |
| JP3738631B2 (ja) * | 1999-09-27 | 2006-01-25 | 三菱電機株式会社 | 画像検索システムおよび画像検索方法 |
| KR100788643B1 (ko) * | 2001-01-09 | 2007-12-26 | 삼성전자주식회사 | 색과 질감의 조합을 기반으로 하는 영상 검색 방법 |
| US6961482B2 (en) * | 2001-03-05 | 2005-11-01 | Ncs Pearson, Inc. | System for archiving electronic images of test question responses |
-
2001
- 2001-08-23 US US09/938,256 patent/US20030039410A1/en not_active Abandoned
-
2002
- 2002-08-12 DE DE10236932A patent/DE10236932A1/de not_active Withdrawn
- 2002-08-15 GB GB0219019A patent/GB2381615A/en not_active Withdrawn
Also Published As
| Publication number | Publication date |
|---|---|
| GB0219019D0 (en) | 2002-09-25 |
| GB2381615A (en) | 2003-05-07 |
| US20030039410A1 (en) | 2003-02-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE10236932A1 (de) | System und Verfahren zum Ermöglichen einer Bildwiedergewinnung | |
| DE69915516T2 (de) | System zum eindringen in einen rechner bzw. ein rechnernetz | |
| DE69914238T2 (de) | Fotofinishing-system und -verfahren für fortschrittliche automatisierte verarbeitungsdienste, einschliesslich der verarbeitung von bildern und zugehöriger audiodaten | |
| DE69915566T2 (de) | Zusammenstellung und Änderung von Fotocollagen durch Bilderkennung | |
| DE69738619T2 (de) | Verfahren und Vorrichtung zur Kamerakontrolle | |
| DE10214069B4 (de) | Aufzeichnen von Bildern zusammen mit Verbindungsinformationen | |
| DE69837199T2 (de) | Verfahren, vorrichtung und datenträger zur intelligenten auswahl von suchwörtern in einer tastaturlosen umgebung | |
| DE60302651T2 (de) | Schnelles hash-basiertes metadatenretrieval für multimediaobjekte | |
| DE60219678T2 (de) | Gezielte medienerfassung über eine kommunikationsvorrichtung | |
| DE69131251T2 (de) | System und Verfahren zur Verarbeitung von gespeicherte Bilder darstellenden Daten | |
| DE69903936T2 (de) | Verfahren und system für eine digitale bildaufnahmevorrichtung | |
| DE60021443T2 (de) | Verwaltungssystem und -verfahren für audiovisuelle Information | |
| DE69525673T2 (de) | Informationsverarbeitungsmethode und Gerät dafür | |
| DE10250597A1 (de) | Systeme und Verfahren zum Erzeugen von digitalen Bildern, die Bildmetadaten aufweisen, die mit den Bilddaten kombiniert sind | |
| DE112016005555T5 (de) | CAPTCHA-Aufgaben auf Bildbasis | |
| DE112017002821T5 (de) | Verfahren, System und Computerprogrammprodukt zur interaktiven Identifizierung von gleichen Personen oder Objekten in Videoaufnahmen | |
| DE10164540A1 (de) | System und Verfahren zum automatischen Beschneiden von graphischen Bildern | |
| DE102018007937A1 (de) | Entfernen und Ersetzen von Objekten in Bildern entsprechend einem geführten Nutzerdialog | |
| DE102013222290A1 (de) | System und Verfahren zur gemeinsamen Nutzung von Ermittlungsergebnisdaten | |
| DE112015005186T5 (de) | Strukturierte Entitätsinformationsseite | |
| DE112020002228T5 (de) | Kognitive video- und audio-suchaggregation | |
| DE102017005963A1 (de) | Bereitstellen von relevanten Videoszenen in Reaktion auf eine Videosuchabfrage | |
| DE10250596A1 (de) | Lesezeichenmäßiges Markieren erfaßter digitaler Bilder bei einem Ereignis an alle vorliegenden Vorrichtungen | |
| DE102017005964A1 (de) | Techniken zum Auswählen von Objekten in Bildern | |
| DE10248462A1 (de) | System und Verfahren zum Verbessern der Leistungsfähigkeit einer Mehrzahl von Peripheriegeräten |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OP8 | Request for examination as to paragraph 44 patent law | ||
| 8127 | New person/name/address of the applicant |
Owner name: HEWLETT-PACKARD DEVELOPMENT CO., L.P., HOUSTON, TE |
|
| 8130 | Withdrawal |