[go: up one dir, main page]

DE102020129601A1 - Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe - Google Patents

Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe Download PDF

Info

Publication number
DE102020129601A1
DE102020129601A1 DE102020129601.0A DE102020129601A DE102020129601A1 DE 102020129601 A1 DE102020129601 A1 DE 102020129601A1 DE 102020129601 A DE102020129601 A DE 102020129601A DE 102020129601 A1 DE102020129601 A1 DE 102020129601A1
Authority
DE
Germany
Prior art keywords
voice command
command input
data glasses
voice
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102020129601.0A
Other languages
English (en)
Inventor
Jörg Jonas-Kops
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DANTZ, DIRK, DR., DE
Original Assignee
Nxtbase Technologies GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nxtbase Technologies GmbH filed Critical Nxtbase Technologies GmbH
Priority to DE102020129601.0A priority Critical patent/DE102020129601A1/de
Publication of DE102020129601A1 publication Critical patent/DE102020129601A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/01Head-up displays
    • G02B27/017Head mounted

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Optics & Photonics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe auf einer Datenbrille mit den Verfahrensschritten Erfassen einer Sprachbefehlseingabe, Zuordnen der erfassten Sprachbefehlseingabe zu einem Prozessschritt und Starten des der Sprachbefehlseingabe zugeordneten Prozessschrittes, wobei das Verfahren zumindest teilweise auf der Datenbrille ausgeführt wird, wobei ausschließlich Hardware-Ressourcen der Datenbrille zum Empfang einer Sprachbefehlseingabe genutzt werden, wobei die Datenbrille eine Anzeigeeinrichtung aufweist, und wobei nach dem Erfassen der Sprachbefehlseingabe eine Sprachbefehlseingabemöglichkeit auf der Anzeigeeinrichtung der Datenbrille angezeigt wird.

Description

  • Die Erfindung betrifft ein Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe auf einer Datenbrille mit den Verfahrensschritten Erfassen einer Sprachbefehlseingabe, Zuordnen der erfassten Sprachbefehlseingabe zu einem Prozessschritt und Starten des der Sprachbefehlseingabe zugeordneten Prozessschrittes, wobei das Verfahren zumindest teilweise auf der Datenbrille ausgeführt wird, wobei ausschließlich Hardware-Ressourcen der Datenbrille zum Empfang einer Sprachbefehlseingabe genutzt werden, wobei die Datenbrille eine Anzeigeeinrichtung aufweist, und wobei nach dem Erfassen der Sprachbefehlseingabe eine Sprachbefehlseingabemöglichkeit auf der Anzeigeeinrichtung der Datenbrille angezeigt wird.
  • Stand der Technik
  • Elektronische Geräte, die Spracheingabe verstehen und umsetzen, sind bekannt. Derartige Geräte sind z.B. Navigationsgeräte, Smartphones, Smartwatches, Head-Mounted-Devices (HMD) und Augmented-Reality-Systeme (AR). Derartige Systeme werden z.B. im industriellen Bereich (insbesondere Industrie 4.0) der Predictive Maintenance (vorausschauende Wartung) eingesetzt werden, in dem Nutzer Prozesse, wie z.B.: Prüfpläne, Qualitätsprüfungen in Form von Soll-Ist-Vergleichen oder in Form von Schritt für Schritt Anleitungen abarbeiten sowie die Ergebnisse dokumentieren und analysieren.
  • Die genannten Geräte weisen verschiedene Applikationen (Apps) auf und/oder haben über eine meistens drahtlose Verbindung Zugriff auf Apps, deren Funktionen basierend auf der Spracheingabe ausgewählt werden können.
  • Bei Einsatz derartiger Systeme in rauhen Umgebungen mit z.B. hoher Lautstärke und ungünstigen Lichtverhältnissen besteht die Gefahr, dass ein Nutzer eine falsche Spracheingabe tätigt und so u.U. einen Prozessschritt auslöst, der so von ihm nicht intendiert war.
  • Es ist daher Aufgabe der Erfindung, ein Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe bereitzustellen, mit dem ein Nutzer sicher und zuverlässig einen Prozess steuern kann.
  • Es ist ebenfalls Aufgabe der Erfindung, ein Computerprogramm zur Ausführung eines Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe bereitzustellen, mit dem ein Nutzer sicher und zuverlässig einen Prozess steuern kann.
  • Es ist ebenfalls Aufgabe der Erfindung, eine Vorrichtung zur Ausführung eines Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe bereitzustellen, mit dem ein Nutzer sicher und zuverlässig einen Prozess steuern kann.
  • Die Aufgabe wird mittels des Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe auf einer Datenbrille gemäß Anspruch 1 gelöst. Vorteilhafte Ausführungen der Erfindung sind in den Unteransprüchen dargelegt.
  • Das erfindungsgemäße Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe auf einer Datenbrille weist drei Verfahrensschritte auf: Im ersten Verfahrensschritt wird eine Sprachbefehlseingabe erfasst. Der Nutzer gibt einen Sprachbefehl, der erfasst wird. Das Erfassen einer Sprachbefehlseingabe beinhaltet im Rahmen dieser Schrift das Empfangen und das Erkennen der Sprachbefehlseingabe des Nutzers. Im zweiten Verfahrensschritt wird die erfasste Sprachbefehlseingabe einem Prozessschritt zugeordnet. Der Prozessschritt kann z.B. der derzeitige Schritt des Entscheidungsbaums sein. Im dritten Verfahrensschritt wird der der Sprachbefehlseingabe zugeordnete Prozess gestartet. Der Prozess kann z.B. der nächste Prozessschritt des Entscheidungsbaums sein. Im dritten Verfahrensschritt wird der der Sprachbefehlseingabe zugeordnete Prozess gestartet. Der Prozess kann z.B. der nächste Prozessschritt in einem Entscheidungsbaum sein. Erfindungsgemäß erfolgt nach dem Erfassen der Sprachbefehlseingabe des Nutzers eine Anzeige einer Sprachbefehlseingabemöglichkeit auf der Anzeigeeinrichtung der Datenbrille. Mittels Spracheingabe der Sprachbefehlseingabemöglichkeit kann der Nutzer z.B. die Sprachbefehlseingabe bestätigen bzw. widerrufen.
  • Ein Prozess ist im Rahmen dieser Schrift ein Ablauf von Prozessschritten, mit denen zumindest teilweise ein Computerprogramm gesteuert wird. Die Prozessschritte können, müssen aber nicht aufeinander aufbauen. Im zweiten Verfahrensschritt wird die erfasste Sprachbefehlseingabe einem Prozessschritt zugeordnet. Der Prozessschritt kann z.B. der derzeitige Schritt eines Entscheidungsbaums sein.
  • Das erfindungsgemäße Verfahren wird zumindest teilweise auf einer Datenbrille ausgeführt. Limitierende Faktoren sind dabei hauptsächlich der an der Datenbrille selbst angeordnete zur Verfügung stehende Speicherplatz sowie Rechenleistung zur Ausführung eines geeigneten Computerprogramms sowie die auf die Spracheingabe begrenzten Steuerungs- und/oder Eingabemöglichkeiten. Die Datenbrille ist während des Verfahrens mit einem Computer verbunden, der die geeignete und ausreichende Hardware-Ausstattung aufweist. Angestrebt ist eine vollständige Ausführung des Verfahrens auf der Datenbrille, um den Aufwand an geeigneter Hardware so gering wie möglich zu halten. Insbesondere wird die Hardware der Datenbrille zum Empfang einer Sprachbefehlseingabe eines Nutzers verwendet, die Datenbrille weist dazu eine akustische Aufnahmeeinrichtung (Mikrofon) auf. Weitere Hardware kann über die Kopplung über geeignete Kommunikationsschnittstellen mit der Datenbrille verbunden sein. Die weitere Hardware wird dann als zur Datenbrille gehörig gezählt, wenn ein entsprechendes der Hardware zugeordnetes Treiberprogramm auf der Datenbrille ausgeführt wird.
  • In einer weiteren Gestaltung der Erfindung erfolgt parallel zur Anzeige der Sprachbefehlseingabemöglichkeit eine akustische Ausgabe über einen Lautsprecher der Datenbrille. Die visuelle Anzeigeeinrichtung ist üblicherweise ein kleiner Bildschirm, der an einer Datenbrille angeordnet und damit direkt im Sichtfeld des Nutzers ist. Die akustische Ausgabeeinrichtung ist an einer Datenbrille angeordnet und z.B. ein In-Ear-Kopfhörer, damit der Nutzer die Spracheingabemöglichkeit auch in geräuschintensiven Umgebungen gut hören kann.
  • In einer weiteren Ausführung der Erfindung beinhaltet die akustische Ausgabe den Sprachbefehl der erfassten Sprachbefehlseingabe. Der Nutzer erhält durch den Chatbot/das Dialogsystem eine akustische Rückmeldung, ob der von ihm gegebene Sprachbefehl tatsächlich dem von ihm intendierten Sprachbefehl entspricht.
  • In einer Weiterbildung der Erfindung beinhaltet die akustische Ausgabe die Sprachbefehlseingabemöglichkeit. Der Nutzer erhält durch den Chatbot/das Dialogsystem eine akustische Meldung zusätzlich zur Anzeige auf dem Bildschirm, welche Sprachbefehlseingabemöglichkeit ihm zur Verfügung steht, welche Spracheingabe er also tätigen kann. Diese redundante Vorgehensweise erhöht die Sicherheit des erfindungsgemäßen Verfahrens.
  • In einer weiteren Ausgestaltung der Erfindung erfolgt die akustische Ausgabe über einen Chatbot. Der Chatbot ist ein textbasiertes Dialogsystem, mit dem ein Nutzer den Prozess steuert. Der Chatbot reagiert auf bestimmte, als Spracheingabemöglichkeiten akustisch und/oder visuell auf der Datenbrille dargestellte Spracheingaben.
  • In einer weiteren Ausbildung der Erfindung umfasst die auf der Anzeigeeinrichtung der Datenbrille angezeigte Sprachbefehlseingabemöglichkeit eine Sprachbefehlseingabebestätigung der erfassten Sprachbefehlseingabe. Der Sprachbefehlseingabemöglichkeit der Sprachbefehlseingabebestätigung ist dabei ein Prozess zugeordnet, bei der die Spracheingabe der Sprachbefehlseingabebestätigung ausgeführt wird.
  • In einer weiteren Gestaltung der Erfindung ist die Sprachbefehlseingabebestätigung eine Wiederholung der erfassten Sprachbefehlseingabe und/oder eine andere Sprachbefehlseingabe. Die Wiederholung ist eine einfache, aber zuverlässige Methode, dem Nutzer anzuzeigen, dass der von ihm gegebene Spracheingabebefehl korrekt erfasst wurde. Der Nutzer kann daher schnell erkennen, ob der erfasste Spracheingabebefehl dem von ihm intendierten Spracheingabebefehl entspricht. Alternativ kann die Sprachbefehlseingabebestätigung auch frei konfigurierbar gestaltet sein. Die Sprachbefehlseingabebestätigung kann z.B. „Ok“, „Ja“, „Verstanden“ oder derart ähnlich ausgeführt sein, dass ein Nutzer die Sprachbefehlseingabebestätigung sofort und sicher als solche erkennt. Die Sprachbefehlseingabebestätigung kann auch z.B. durch ein Icon oder ein Emoji auf der Anzeigeeinrichtung der Datenbrille erfolgen. Alternativ oder zusätzlich kann eine Bestätigung akustisch auf der Audioausgabe der Datenbrille erfolgen, z.B. durch Ausgabe eines geeigneten Tones oder einer Melodie.
  • In einer vorteilhaften Weiterbildung der Erfindung erfolgt die Sprachbefehlseingabebestätigung der Sprachbefehlseingabe durch das Verstreichen einer Latenzzeit. Nach Eingabe eines Sprachbefehls durch einen Nutzer verstreicht ein Zeitraum, innerhalb dem der Nutzer den von ihm eingegebenen Sprachbefehl annullieren oder ändern kann. Wird der Sprachbefehl nicht durch den Nutzer annulliert oder geändert, wird der dem Sprachbefehl zugeordnete Prozessschritt ausgeführt. Verstreicht umgekehrt die Latenzzeit ohne Annullierung oder Änderung des von einem Nutzer eingegebenen Sprachbefehls, gilt der vom Nutzer eingegebene Sprachbefehl als bestätigt, der dem Sprachbefehl zugeordnete Prozessschritt wird ausgeführt.
  • In einer weiteren Ausführung der Erfindung umfasst die auf der Anzeigeeinrichtung der Datenbrille angezeigte Sprachbefehlseingabemöglichkeit einen Sprachbefehlseingabewiderruf der erfassten Sprachbefehlseingabe. Dem Sprachbefehlseingabewiderruf ist dabei ein Prozess zugeordnet, der bei Spracheingabe des Sprachbefehlseingabewiderrufs ausgeführt wird. Wenn der erfasste Spracheingabebefehl nicht dem vom Nutzer intendierten Spracheingabebefehl entspricht, oder der Nutzer einen anderen Spracheingabebefehl geben möchte, kann der Nutzer den erfassten Spracheingabebefehl widerrufen. Der Sprachbefehlseingabewiderruf startet den Sprachbefehlseingabewiderrufsprozess eines Softwareprogramms zum Widerruf der Sprachbefehlseingabe des Nutzers. Der Sprachbefehlseingabewiderrufsprozess kann z.B. durch Spracheingabe des Nutzers erfolgen, oder durch Verstreichen einer Latenzzeit.
  • In einer weiteren Ausgestaltung der Erfindung stoppt und/oder verhindert die Spracheingabe des Sprachbefehlseingabewiderrufs die Ausführung des der erfassten Sprachbefehlseingabe zugeordneten Prozessschrittes. Der Nutzer widerruft also aktiv die erfasste Sprachbefehlseingabe explizit mittels eines Sprachbefehls.
  • In einer weiteren Ausbildung der Erfindung erfolgt die Ausführung des dem Sprachbefehlseingabewiderruf zugeordneten Prozesses durch das Verstreichen einer Latenzzeit. Nach Eingabe eines Sprachbefehls durch einen Nutzer verstreicht ein Zeitraum, innerhalb dem der Nutzer den von ihm eingegebenen Sprachbefehl bestätigen kann. Wird der Sprachbefehl nicht durch den Nutzer bestätigt, wird der dem Sprachbefehl zugeordnete Prozessschritt widerrufen.
  • In einer weiteren Gestaltung der Erfindung umfasst der Widerruf der Sprachbefehlseingabe das Erfassen einer Widerrufsbefehlseingabe. Der Nutzer widerruft also aktiv die erfasste Sprachbefehlseingabe explizit mittels einer Widerrufsbefehlseingabe, üblicherweise mittels eines Sprachbefehls, z.B. „Abbruch“, „Cancel“ o.ä.
  • Die Aufgabe wird weiterhin durch das Softwareprogramm gemäß Anspruch 13 zur Durchführung des erfindungsgemäßen Verfahrens gelöst.
  • Das erfindungsgemäße Softwareprogramm ist geeignet, das Verfahren zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe durchzuführen. Das Softwareprogramm nutzt die Hardware der Datenbrille zur Eingabe von Sprachbefehlen und Ausgabe von Bestätigung bzw. Widerruf der eingegebenen Sprachbefehle.
  • Die Aufgabe wird außerdem durch die Datenbrille gemäß Anspruch 15 gelöst.
  • Die erfindungsgemäße Datenbrille zur Ausführung des erfindungsgemäßen Verfahrens weist eine Anzeigeeinrichtung zur Darstellung von Spracheingabemöglichkeiten auf. Die Anzeigeeinrichtung ist permanent im Sichtfeld des Nutzers angeordnet, z.B. mittels eines AR-Systems.
  • Weiterhin weist das System ein Mikrophon zum Erfassen von gesprochenen Spracheingabemöglichkeiten auf. Das Mikrofon kann permanent im Sprachfeld des Nutzers angeordnet sein, z.B. mittels eines AR-Systems.
  • Außerdem weist das System eine Computereinheit zur Ausführung eines Softwareprogramms zur Durchführung des Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe auf. Die Computereinheit kann ein Wearable wie Smartphone, Smartwatch sein oder innerhalb eines AR-Systems angeordnet sein. Möglich ist aber auch eine stationäre Computereinheit, mit der ein Wearable mittels Kabelverbindung oder kabelloser Verbindung verbunden ist.
  • In einer Weiterbildung der Erfindung verfügt die Datenbrille ausschließlich über ein Mikrofon zur Befehlseingabe durch einen Nutzer. Das Mikrofon ist derart an der Datenbrille angeordnet, dass ein Nutzer komfortabel und sicher einen Spracheingabebefehl geben kann.
  • Ausführungsbeispiele des erfindungsgemäßen Systems und des erfindungsgemäßen Verfahrens zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe sind in den Zeichnungen schematisch vereinfacht dargestellt und werden in der nachfolgenden Beschreibung näher erläutert.
  • Es zeigen:
    • 1: Eine Ansicht der erfindungsgemäßen Datenbrille
    • 2: Bestätigung des Spracheingabebefehls durch visuelle Anzeige
    • 3: Bestätigung des Spracheingabebefehls durch Wiederholung der Spracheingabe durch visuelle und akustische Anzeige
    • 4: Widerruf des Spracheingabebefehls durch visuelle Anzeige
    • 5: Bestätigung bzw. Widerruf des Spracheingabebefehls durch Verstreichen einer Latenzzeit
    • 6: Ein Ablaufdiagramm des erfindungsgemäßen Verfahrens
  • 1 zeigt eine Ansicht eines Ausführungsbeispiels des erfindungsgemäßen Systems zur Durchführung des Verfahrens 400 zur Steuerung von Prozessen. Das System weist eine Datenbrille 100 auf, mittels dem Spracheingabemöglichkeiten in das Sichtfeld eines Nutzers eingeblendet werden. Die Datenbrille 100 wird in diesem Ausführungsbeispiel wie eine herkömmliche Brille vom Nutzer getragen und verfügt über eine entsprechend gestaltete Fassung 170 mit Bügel 180 und Brillengläsern 190. Die Datenbrille 100 weist die Projektionsvorrichtung 110 mit Bildschirm 120 zur Einblendung der Spracheingabemöglichkeiten direkt vor dem Auge des Nutzers auf. Eine derartige Datenbrille 100 erhöht die Geschwindigkeit der Bearbeitung von Prozessen, da der Nutzer beide Arme frei hat. Zur Sprachein- und ausgabe verfügt die Datenbrille 100 über eine Kommunikationseinheit 160 mit Mikrofon 130 und Audioausgabe 140. Die Audioausgabe 140 weist vorteilhafterweise ein oder zwei In-Ear-Kopfhörer auf. Gesteuert wird die Datenbrille 100 durch die Steuereinheit 150.
  • Neben der Verwendung einer Datenbrille 100 kann das erfindungsgemäße Verfahren 400 aber auch auf anderen Geräten, vorteilhafterweise Wearables (am Körper getragene Geräte) ausgeführt werden, z.B. mittels eines Smartphones.
  • Das System weist außerdem einen Rechner auf (nicht dargestellt), mit der die Steuereinheit 150 verbunden ist. Der Rechner ist vorzugsweise ein handelsüblicher PC oder Notebook, der genügend Rechenleistung bereitstellt, um ein Computerprogramm zu betreiben, mit dem das erfindungsgemäße Verfahren 400 durchgeführt wird. Das erfindungsgemäße Verfahren 400 zur Steuerung von Prozessen weist drei Verfahrensschritte auf: Im ersten Verfahrensschritt 410 wird eine Sprachbefehlseingabe 250 des Nutzers erfasst. Im zweiten 420 Verfahrensschritt wird die erfasste Sprachbefehlseingabe 250 einem Prozess zugeordnet. Im dritten Verfahrensschritt 430 wird der der Sprachbefehlseingabe 250 zugeordnete Prozess gestartet. In einem weiteren zusätzlichen Verfahrensschritt 440 wird nach dem Erfassen der Sprachbefehlseingabe 250 des Nutzers eine Sprachbefehlseingabemöglichkeit auf dem Bildschirm 120 angezeigt. Zusätzlich kann diese Sprachbefehlseingabemöglichkeit auch zeitlich parallel mittels der Audioausgabe 140 dem Nutzer ausgegeben werden.
  • Ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens 400, wobei Bestätigung oder Widerruf des Spracheingabebefehls 250 durch visuelle Anzeige 224 erfolgt, zeigt 2. Zur Steuerung des Prozesses wird vorteilhafterweise ein Chatbot verwendet, also ein textbasiertes Dialogsystem, mit dem ein Nutzer den Prozess steuert. Der Chatbot reagiert nur auf bestimmte, als Spracheingabemöglichkeiten auf dem Bildschirm 120 dargestellte Spracheingaben. Der Bildschirm 120 der Anzeigevorrichtung 110 zeigt in diesem Ausführungsbeispiel dem Nutzer sechs unterschiedliche Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 zur Auswahl an. Die Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 sind sowohl in Schriftform als auch als graphische Darstellung auf dem Bildschirm 120 angezeigt. Der Nutzer gibt die Sprachbefehlseingabe 250 („Vollbild“) durch Sprechen der Sprachbefehlseingabe 250 je nachdem, welche der Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 ihm geeignet erscheint.
  • Im ersten Verfahrensschritt wird die Sprachbefehlseingabe 250 des Nutzers erfasst und erkannt. Dann wird die erfasste Sprachbefehlseingabe 250 zu einem Prozessschritt zugeordnet, in diesem Ausführungsbeispiel also dem Prozessschritt „Vollbild“. Auf dem Bildschirm 120 der Anzeigevorrichtung 110 wird nun eine weitere Sprachbefehlseingabemöglichkeit visuell angezeigt, in diesem Ausführungsbeispiel die Sprachbefehlseingabemöglichkeit „Ok“ zusammen mit einem Symbol 224. Zur Bestätigung der Sprachbefehlseingabe 250 („Vollbild“) gibt der Nutzer die Sprachbefehlseingabe „Ok“, erst danach wird der Prozessschritt „Vollbild“ ausgeführt.
  • 3 zeigt ein weiteres Ausführungsbeispiel des erfindungsgemäßen Verfahrens 400. Eine Bestätigung des Spracheingabebefehls 250 erfolgt durch Wiederholung der Spracheingabe 250 durch visuelle 224 Anzeige. Zur Steuerung des Prozesses wird ebenfalls ein Chatbot verwendet. Der Bildschirm 120 der Anzeigevorrichtung 110 zeigt in diesem Ausführungsbeispiel dem Nutzer ebenfalls sechs unterschiedliche Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 zur Auswahl an. Die Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 sind sowohl in Schriftform als auch als graphische Darstellung auf dem Bildschirm 120 angezeigt. Der Nutzer gibt die Sprachbefehlseingabe 250 („Voice Memo“) durch Sprechen der Sprachbefehlseingabe 250 je nachdem, welche der Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 ihm geeignet erscheint.
  • Im ersten Verfahrensschritt wird die Sprachbefehlseingabe 250 des Nutzers erfasst und erkannt. Dann wird die erfasste Sprachbefehlseingabe 250 einem Prozessschritt zugeordnet, in diesem Ausführungsbeispiel also dem Prozessschritt „Voice Memo“. Auf dem Bildschirm 120 der Anzeigevorrichtung 110 wird nun eine weitere Sprachbefehlseingabemöglichkeit visuell angezeigt, in diesem Ausführungsbeispiel die Sprachbefehlseingabemöglichkeit „Start“ zusammen mit einem Symbol 224. Zur Bestätigung der Sprachbefehlseingabe 250 („Voice Memo“) gibt der Nutzer die Sprachbefehlseingabe „Start“, erst danach wird der Prozessschritt „Voice Memo“ ausgeführt. Alternativ kann der Nutzer in diesem Ausführungsbeispiel die Sprachbefehlseingabe 250 („Voice Memo“) wiederholen, um den Prozessschritt auszuführen.
  • In diesem Ausführungsbeispiel erfolgt die Bestätigung 224 durch ein Symbol, das der jeweiligen Spracheingabemöglichkeit 211, 212, 213, 214, 215, 216 angepasst und damit eindeutig zugeordnet ist. Damit können auch unterschiedliche Nutzer der Datenbrille 100 sofort und auf einen Blick erkennen, dass das von ihnen eingegebene Sprachsignal 250 erfasst und korrekt erkannt ist.
  • Ein weiteres Ausführungsbeispiel des erfindungsgemäßen Verfahrens 400, wobei ein Widerruf des Spracheingabebefehls 250 durch visuelle Anzeige 234 erfolgt, zeigt 4. Zur Steuerung des Prozesses wird ebenfalls ein Chatbot verwendet. Der Bildschirm 120 der Anzeigevorrichtung 110 zeigt in diesem Ausführungsbeispiel dem Nutzer ebenfalls sechs unterschiedliche Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 zur Auswahl an. Die Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 sind sowohl in Schriftform als auch als graphische Darstellung auf dem Bildschirm 120 angezeigt. Der Nutzer gibt das Sprachsignal 250 („Chatbot“) durch Sprechen des Sprachsignals 250 je nachdem, welche der Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 ihm geeignet erscheint. Der Nutzer gibt die Sprachbefehlseingabe 250 („Chatbot“) durch Sprechen der Sprachbefehlseingabe 250 je nachdem, welche der Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 ihm geeignet erscheint.
  • Im ersten Verfahrensschritt wird die Sprachbefehlseingabe 250 des Nutzers erfasst und erkannt. Dann wird die erfasste Sprachbefehlseingabe 250 einem Prozessschritt zugeordnet, in diesem Ausführungsbeispiel also dem Prozessschritt „Chatbot“. Auf dem Bildschirm 120 der Anzeigevorrichtung 110 wird nun eine weitere Sprachbefehlseingabemöglichkeit visuell angezeigt.
  • Auf dem Bildschirm 120 der Anzeigevorrichtung 110 wird in diesem Ausführungsbeispiel dem Nutzer eine Möglichkeit angezeigt, den von ihm gegebenen Sprachbefehl 250 zu widerrufen. Dazu wird dem Nutzer in diesem Ausführungsbeispiel ein Widerruf 234 („Cancel“) auf dem Bildschirm 120 in Schriftform sowie ein Symbol 224, das als Bestätigung der Sprachbefehlseingabe 250 dient, angezeigt. Durch Spracheingabe des Widerrufs 234 kann ein Nutzer den vorher gegebenen Sprachbefehl 250 widerrufen. Zur Bestätigung der Sprachbefehlseingabe 250 („Chatbot“) gibt der Nutzer die Sprachbefehlseingabe „Chatbot“, danach wird der Prozessschritt „Chatbot“ ausgeführt.
  • Ein weiteres Ausführungsbeispiel des erfindungsgemäßen Verfahrens 400, wobei eine Bestätigung bzw. ein Widerruf des Spracheingabebefehls 250 durch Verstreichen einer Latenzzeit 244 erfolgt, zeigt 5. Zur Steuerung des Prozesses wird ebenfalls ein Chatbot verwendet. Der Bildschirm 120 der Anzeigevorrichtung 110 zeigt in diesem Ausführungsbeispiel dem Nutzer ebenfalls sechs unterschiedliche Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 zur Auswahl an. Die Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 sind sowohl in Schriftform als auch als graphische Darstellung auf dem Bildschirm 120 angezeigt. Der Nutzer gibt die Sprachbefehlseingabe 250 („Voice Memo“) durch Sprechen der Sprachbefehlseingabe 250 je nachdem, welche der Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 ihm geeignet erscheint.
  • Im ersten Verfahrensschritt wird die Sprachbefehlseingabe 250 des Nutzers erfasst und erkannt. Dann wird die erfasste Sprachbefehlseingabe 250 einem Prozessschritt zugeordnet, in diesem Ausführungsbeispiel also dem Prozessschritt „Voice Memo“. Auf dem Bildschirm 120 der Anzeigevorrichtung 110 wird nun dem Nutzer eine Latenzzeit 244 angezeigt, in diesem Ausführungsbeispiel 5 s. Die Latenzzeit kann von einem Nutzer frei gewählt werden. Die Latenzzeit 244 ist der Zeitraum, innerhalb dem der gegebene Sprachbefehl 250 noch widerrufen bzw. geändert werden kann, indem der Nutzer den entsprechenden Sprachbefehl der Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 gibt und/oder einen Widerrufsbefehl mittels Spracheingabe gibt, z.B. „Abbruch“. Nach Verstreichen der Latenzzeit 244 ohne Sprachbefehl der Spracheingabemöglichkeiten 211, 212, 213, 214, 215, 216 und/oder Widerrufsbefehl wird der ursprüngliche Sprachbefehl 250 ausgeführt, und nicht ausgeführt bei Widerrufsbefehl. Der Nutzer kann in diesem Ausführungsbeispiel die Sprachbefehlseingabe 250 („Voice Memo“) auch innerhalb des Zeitraums der Latenzzeit 244 wiederholen, um den Prozessschritt auszuführen. Eine andere Möglichkeit besteht darin, dass die Latenzzeit 244 der Zeitraum ist, in dem ein Nutzer den gegebenen Sprachbefehl 250 explizit durch Sprachbefehl bestätigen muss, z.B. mit „Ausführen“. Nach Verstreichen der Latenzzeit 244 ohne Bestätigung durch den Nutzer wird dann der ursprüngliche Sprachbefehl 250 nicht, bei erfolgter Bestätigung jedoch ausgeführt.
  • 6 zeigt ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens 100 zur Steuerung von Prozessen. Das erfindungsgemäße Verfahren 400 zur Steuerung von Prozessen weist drei Verfahrensschritte auf: Im ersten Verfahrensschritt 410 wird eine Sprachbefehlseingabe 250 des Nutzers erfasst. Im zweiten 420 Verfahrensschritt wird die erfasste Sprachbefehlseingabe 250 einem Prozess zugeordnet. Im dritten Verfahrensschritt 430 wird der der Sprachbefehlseingabe 250 zugeordnete Prozess gestartet. In einem weiteren zusätzlichen Verfahrensschritt 440 wird nach dem Erfassen der Sprachbefehlseingabe 250 des Nutzers eine Sprachbefehlseingabemöglichkeit auf dem Bildschirm 120 angezeigt. Zusätzlich kann diese Sprachbefehlseingabemöglichkeit auch zeitlich parallel mittels der Audioausgabe 140 dem Nutzer ausgegeben werden.
  • Bezugszeichenliste
  • 100
    Datenbrille
    110
    Projektionsvorrichtung
    120
    Bildschirm
    130
    Mikrofon
    140
    Audioausgabe
    150
    Steuereinheit
    160
    Kommunikationseinheit
    170
    Fassung
    180
    Bügel
    190
    Brillenglas
    210, 211, 212, 213,
    Darstellung von Spracheingabemöglichkeiten
    214, 215, 216 224
    Symbol
    234
    Widerruf
    244
    Latenzzeit
    250
    Spracheingabebefehle
    400
    Verfahren zur Steuerung von Prozessen
    410
    Erfassung einer Sprachbefehlseingabe
    420
    Zuordnen der erfassten Sprachbefehlseingabe
    430
    Starten des der erfassten Sprachbefehlseingabe zugeordneten Prozesses
    440
    Anzeige einer Sprachbefehlseingabemöglichkeit nach Erfassung der Sprachbefehlseingabe

Claims (16)

  1. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) mit den Verfahrensschritten: • Erfassen einer Sprachbefehlseingabe (250), • Zuordnen der erfassten Sprachbefehlseingabe (250) zu einem Prozessschritt und • Starten des der Sprachbefehlseingabe (250) zugeordneten Prozessschrittes, wobei das Verfahren (400) zumindest teilweise auf der Datenbrille (100) ausgeführt wird, wobei ausschließlich Hardware-Ressourcen der Datenbrille (100) zum Empfang einer Sprachbefehlseingabe (250) genutzt werden, wobei die Datenbrille (100) eine Anzeigeeinrichtung (110) aufweist, wobei nach dem Erfassen der Sprachbefehlseingabe eine Sprachbefehlseingabemöglichkeit auf der Anzeigeeinrichtung (110) der Datenbrille (100) angezeigt wird.
  2. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach Anspruch 1 dadurch gekennzeichnet, dass parallel zur Anzeige der Sprachbefehlseingabemöglichkeit eine akustische Ausgabe über einen Lautsprecher (140) der Datenbrille (100) erfolgt.
  3. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach Anspruch 2, dadurch gekennzeichnet, dass die akustische Ausgabe den Sprachbefehl der erfassten Sprachbefehlseingabe (250) beinhaltet.
  4. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass die akustische Ausgabe die Spracheingabemöglichkeit (210, 211, 212, 213, 214, 215, 216) beinhaltet.
  5. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach einem oder mehreren der Ansprüche 2 bis 4 dadurch gekennzeichnet, dass die akustische Ausgabe über einen Chatbot erfolgt.
  6. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach einem oder mehreren der vorhergehenden Ansprüche dadurch gekennzeichnet, dass die auf der Anzeigeeinrichtung der Datenbrille angezeigte Sprachbefehlseingabemöglichkeit eine Sprachbefehlseingabebestätigung (224) der erfassten Sprachbefehlseingabe (250) umfasst, wobei der Sprachbefehlseingabemöglichkeit der Sprachbefehlseingabebestätigung ein Prozess zugeordnet ist, bei der die Spracheingabe der Sprachbefehlseingabebestätigung ausgeführt wird.
  7. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach Anspruch 6, dadurch gekennzeichnet, dass die Sprachbefehlseingabebestätigung eine Wiederholung der erfassten Sprachbefehlseingabe (250) und/oder eine andere Sprachbefehlseingabe ist.
  8. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach einem oder mehreren der Ansprüche 6 oder 7, dadurch gekennzeichnet, dass die Sprachbefehlseingabebestätigung (224) der Sprachbefehlseingabe (250) durch das Verstreichen einer Latenzzeit (244) erfolgt.
  9. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach einem oder mehreren der vorhergehenden Ansprüche dadurch gekennzeichnet, dass die auf der Anzeigeeinrichtung der Datenbrille angezeigte Sprachbefehlseingabemöglichkeit einen Sprachbefehlseingabewiderruf (224) der erfassten Sprachbefehlseingabe (250) umfasst wobei dem Sprachbefehlseingabewiderruf (224) ein Prozess zugeordnet ist, bei der Spracheingabe des Sprachbefehlseingabewiderrufs ausgeführt wird.
  10. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach Anspruch 9, dadurch gekennzeichnet, dass die Spracheingabe des Sprachbefehlseingabewiderrufs (224) die Ausführung des der erfassten Sprachbefehlseingabe (250) zugeordneten Prozessschrittes stoppt und/oder verhindert.
  11. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach einem oder mehreren der Ansprüche 6 oder 7, dadurch gekennzeichnet, dass die Ausführung des dem Sprachbefehlseingabewiderruf (224) zugeordneten Prozesses durch das Verstreichen einer Latenzzeit (244) erfolgt.
  12. Verfahren (400) zur Steuerung von Prozessen mittels einer Sprachbefehlseingabe (250) auf einer Datenbrille (100) nach einem oder mehreren der Ansprüche 1 bis 11, dadurch gekennzeichnet, dass dadurch gekennzeichnet, dass der Widerruf (234) der Sprachbefehlseingabe (250) das Erfassen einer Widerrufsbefehlseingabe umfasst.
  13. Softwareprogramm zur Durchführung des Verfahrens (400) nach einem oder mehreren der Ansprüche 1 bis 12.
  14. Softwareprogramm zur Durchführung des Verfahrens (400) nach Anspruch 13 dadurch gekennzeichnet, dass die Software zur Durchführung des Verfahrens (400) ausschließlich Hardware-Ressourcen einer Datenbrille (100) nutzt.
  15. Datenbrille (100) zur Durchführung des Verfahrens (400) nach einem oder mehreren der Ansprüche 1 bis 12 umfassend • eine Anzeigeeinrichtung (120) zur Darstellung von Spracheingabemöglichkeiten (210, 211, 212, 213, 214, 215, 216) • ein Mikrophon (130) zum Erfassen von gesprochenen Spracheingabemöglichkeiten (250) • eine Computereinheit zur Ausführung eines Softwareprogramms
  16. Datenbrille (100) zur Durchführung des Verfahrens (400) nach Anspruch 15 dadurch gekennzeichnet, dass die Datenbrille (100) ausschließlich über ein Mikrophon (130) zur Befehlseingabe verfügt.
DE102020129601.0A 2020-11-10 2020-11-10 Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe Pending DE102020129601A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102020129601.0A DE102020129601A1 (de) 2020-11-10 2020-11-10 Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102020129601.0A DE102020129601A1 (de) 2020-11-10 2020-11-10 Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe

Publications (1)

Publication Number Publication Date
DE102020129601A1 true DE102020129601A1 (de) 2022-05-12

Family

ID=81256266

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102020129601.0A Pending DE102020129601A1 (de) 2020-11-10 2020-11-10 Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe

Country Status (1)

Country Link
DE (1) DE102020129601A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102023101499A1 (de) 2023-01-23 2024-07-25 Bayerische Motoren Werke Aktiengesellschaft Verfahren und Vorrichtung zum Betrieb eines virtuellen Assistenten

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050267759A1 (en) 2004-01-29 2005-12-01 Baerbel Jeschke Speech dialogue system for dialogue interruption and continuation control
US20130278631A1 (en) 2010-02-28 2013-10-24 Osterhout Group, Inc. 3d positioning of augmented reality information
US20160274762A1 (en) 2015-03-16 2016-09-22 The Eye Tribe Aps Device interaction in augmented reality
US20200062276A1 (en) 2018-08-22 2020-02-27 Faraday&Future Inc. System and method of controlling auxiliary vehicle functions
US20200060374A1 (en) 2017-03-17 2020-02-27 VICIS, Inc. Removable Communications Module Pocket
US20200099411A1 (en) 2016-04-22 2020-03-26 Seabeck Holdings, Llc Smart aviation communication headset and peripheral components
US20200183154A1 (en) 2018-12-05 2020-06-11 Thales Method and system for display and interaction embedded in a cockpit

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050267759A1 (en) 2004-01-29 2005-12-01 Baerbel Jeschke Speech dialogue system for dialogue interruption and continuation control
US20130278631A1 (en) 2010-02-28 2013-10-24 Osterhout Group, Inc. 3d positioning of augmented reality information
US20160274762A1 (en) 2015-03-16 2016-09-22 The Eye Tribe Aps Device interaction in augmented reality
US20200099411A1 (en) 2016-04-22 2020-03-26 Seabeck Holdings, Llc Smart aviation communication headset and peripheral components
US20200060374A1 (en) 2017-03-17 2020-02-27 VICIS, Inc. Removable Communications Module Pocket
US20200062276A1 (en) 2018-08-22 2020-02-27 Faraday&Future Inc. System and method of controlling auxiliary vehicle functions
US20200183154A1 (en) 2018-12-05 2020-06-11 Thales Method and system for display and interaction embedded in a cockpit

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Youtube.com, „All Iron Man HUD Scenes (up to Endgame)", Video-Zeitpunkt 9:40, veröffentlicht am 04.08.2019.URL: https://www.youtube.com/watch?v=E7-o6a0OUHY [abgerufen am 14.12.2020]

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102023101499A1 (de) 2023-01-23 2024-07-25 Bayerische Motoren Werke Aktiengesellschaft Verfahren und Vorrichtung zum Betrieb eines virtuellen Assistenten

Similar Documents

Publication Publication Date Title
DE10066478B3 (de) Tragbarer Computer in einer Prozesssteuerungsumgebung
EP1250701B1 (de) System und verfahren zur blickfokussierten sprachverarbeitung
DE102014226554A1 (de) Identifikations- und Reparaturunterstützungs-Vorrichtung und -Verfahren
DE102016219134B4 (de) Verfahren zum Zugriff auf ein fahrzeugexternes elektronisches Gerät
EP1250702B1 (de) System und verfahren zur blickfokussierten sprachverarbeitung mit erzeugung eines visuellen feedbacksignals
DE102014206160A1 (de) Benutzerschnittstellenvorrichtung unter verwendung eines lautsprechers und entsprechendes verfahren
DE102009002136B4 (de) Verfahren zum Darstellen einer aktuellen Taskliste auf der graphischen Benutzeroberfläche eines Steuerungscomputers einer Bearbeitungsmaschine
DE102020129601A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
EP1341157A2 (de) Sprachgesteuertes Elektrisches Haushaltsgerät
DE102023112334A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102023112333A1 (de) Verfahren zur sprachsteuerung von technischen geräten
DE102020129600A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102023112332A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102015221304A1 (de) Verfahren und Vorrichtung zur Verbesserung der Erkennungsgenauigkeit bei der handschriftlichen Eingabe von alphanumerischen Zeichen und Gesten
DE102020129602A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102023112338A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
EP3989218A1 (de) Bedienungsfreundlicher virtueller sprachassistent
DE102023112331A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102020129605A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
EP2283426B1 (de) Verfahren und vorrichtung zur korrektur von digital übertragenen informationen
DE102020129603A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102023112337A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102010054242B4 (de) Verfahren zum Bereitstellen einer Bedienvorrichtung in einem Fahrzeug und Bedienvorrichtung
DE102020129604A1 (de) Verfahren zur sprachsteuerung von technischen geräten
DE102020129606A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe

Legal Events

Date Code Title Description
R163 Identified publications notified
R081 Change of applicant/patentee

Owner name: DANTZ, DIRK, DR., DE

Free format text: FORMER OWNER: NXTBASE TECHNOLOGIES GMBH, 14482 POTSDAM, DE