DE19943875A1 - System zur Sprachsteuerung mit einem Mikrofonarray - Google Patents
System zur Sprachsteuerung mit einem MikrofonarrayInfo
- Publication number
- DE19943875A1 DE19943875A1 DE19943875A DE19943875A DE19943875A1 DE 19943875 A1 DE19943875 A1 DE 19943875A1 DE 19943875 A DE19943875 A DE 19943875A DE 19943875 A DE19943875 A DE 19943875A DE 19943875 A1 DE19943875 A1 DE 19943875A1
- Authority
- DE
- Germany
- Prior art keywords
- microphones
- voice control
- microphone array
- speech recognition
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 101100514845 Arabidopsis thaliana MTV1 gene Proteins 0.000 claims abstract description 3
- 101100023518 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DAL7 gene Proteins 0.000 claims abstract description 3
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 3
- 101150032602 mls-1 gene Proteins 0.000 claims abstract description 3
- -1 MTV2 Proteins 0.000 claims abstract 2
- 238000003491 array Methods 0.000 abstract description 2
- 238000000926 separation method Methods 0.000 abstract description 2
- 230000005236 sound signal Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Selective Calling Equipment (AREA)
Abstract
Sprachsteuerungssysteme finden in einer Vielfalt von technischen Gebieten Anwendung. Die gesprochenen Worte werden hierbei durch ein oder mehrere Mikrofone detektiert und dann einem Spracherkennungssystem zugeführt. Um eine Sprachsteuerung auch aus größerer Ferne zu ermöglichen, muß das Sprachsignal von störenden Hintergrundsignalen getrennt werden. Dies kann durch eine räumliche Trennung unter Verwendung von Mikrofonarrays aus zwei oder mehr Mikrofonen erfolgen. Hierbei ist es von Vorteil, die einzelnen Mikrofone des Mikrofonarrays räumlich über eine möglichst große Distanz zu verteilen. Bei einem einzelnen Unterhaltungselektronikgerät sind die Abstände zwischen den einzelnen Mikrofonen jedoch aufgrund der Geräteabmessungen begrenzt. Das erfindungsgemäße System zur Sprachsteuerung besteht daher aus einem Mikrofonarray mit mehreren Mikrofonen (MTV1, MTV2, MLS1, MLS2), die auf verschiedene Geräte (TV, LS1, LS2) verteilt sind, wobei die durch die Mikrofone erzeugten Signale zu der zentralen Spracherkennungseinheit übertragen werden können, vorteilhafterweise über ein bidirektionales Netzwerk basierend auf einem IEEE-1394-Bus.
Description
Die Erfindung betrifft ein System zur Sprachsteuerung mit
einem Mikrofonarray, die insbesondere zur Steuerung von
Geräten der Unterhaltungselektronik genutzt werden kann.
Sprachsteuerungssysteme finden in einer Vielzahl von
technischen Gebieten Anwendung. Die gesprochenen Worte
werden hierbei zunächst als Schallsignale detektiert,
üblicherweise durch ein oder mehrere Mikrofone, und dann
einem Spracherkennungssystem zugeführt. Die
Spracherkennung basiert hierbei üblicherweise auf einem
Akustik- und einem Sprachmodell. Das akustische Modell
nutzt eine große Anzahl von Sprachmustern, wobei
mathematische Algorithmen dazu verwendet werden, die
akustisch am besten passenden Worte zu einem gesprochenen
Wort anzugeben. Das Sprachmodell wiederum basiert auf
einer Analyse, bei der anhand von einer Vielzahl von
Dokumentproben festgestellt wird, in welchem Kontext und
wie häufig gewisse Wörter normalerweise verwendet werden.
Mit solchen Spracherkennungssystemen ist nicht nur das
Erkennen einzelner Wörter, sondern auch von fließend
gesprochenen Sätzen mit hohen Erkennungsraten möglich. Die
Erkennungsrate sinkt jedoch drastisch, wenn nicht
vernachlässigbare Hintergrundgeräusche vorliegen.
Die Robustheit gegen solche akustische Störeinflüsse kann
auf verschiedene Weisen erhöht werden. So wird bei
Diktiersystemen für Computer ein Mikrofon an einem
Kopfhörergestell direkt vor dem Mund des Sprechers
befestigt. Bei diesen Systemen kann nur durch die
unmittelbare Nähe zum Mund ein sehr konstantes Signal und
damit eine zum Teil beachtliche Erkennungsrate erreicht
werden. Ebenso ist es bekannt, ein Fernsehgerät zu
steuern, indem die Bedienungsbefehle in das in einer
Fernbedienung integrierte Mikrofon gesprochen werden. Auch
hier muß jedoch die Fernbedienung unmittelbar vor den Mund
des Benutzers gehalten werden.
Der Erfindung liegt die Aufgabe zugrunde, ein System zur
Sprachsteuerung anzugeben, welches eine ausreichende
Störfestigkeit auch bei Spracheingabe aus größerer Ferne
ermöglicht. Diese Aufgabe wird durch die in Anspruch 1
angegebene Vorrichtung gelöst.
Um eine Sprachsteuerung auch aus größerer Ferne zu
ermöglichen, muß das Sprachsignal von störenden
Hintergrundsignalen getrennt werden. Dies kann durch eine
räumliche Trennung unter Verwendung von Mikrofonarrays aus
zwei oder mehr Mikrofonen erfolgen. Hierbei ist es von
Vorteil, die einzelnen Mikrofone des Mikrofonarrays
räumlich über eine möglichst große Distanz zu verteilen.
Bei einem einzelnen Unterhaltungselektronikgerät sind die
Abstände zwischen den einzelnen Mikrofonen jedoch aufgrund
der Geräteabmessungen begrenzt, wie z. B. bei einem
Fernsehgerät auf unter einen Meter.
Im Prinzip besteht das erfindungsgemäße System zur
Sprachsteuerung aus einem Mikrofonarray mit mehreren
Mikrofonen zur Umwandlung von Sprachbefehlen in
elektrische Signale und einer zentralen
Spracherkennungseinheit zur Umwandlung dieser elektrischen
Signale in Bedienungsbefehle, wobei die Mikrofone auf
verschiedene Geräte verteilt sind, die miteinander in
solcher Weise verbunden sind, daß die durch die Mikrofone
erzeugten Signale zu der zentralen Spracherkennungseinheit
übertragen werden können.
Vorteilhafterweise werden hierbei die Geräte über ein
bidirektionales Netzwerk verbunden, welches, besonders
vorteilhaft auf einem IEEE-1394-Bus basiert.
Besonders vorteilhaft ist das System, wenn ein oder
mehrere Mikrofone in einem Unterhaltungselektronik-
Wiedergabegerät, insbesondere einem Fernsehgerät, und ein
oder mehrere weitere Mikrofone in externen Lautsprechern
integriert sind.
Anhand der Zeichnung wird ein Ausführungsbeispiel der
Erfindung beschrieben.
Diese zeigt eine erfindungsgemäße Anordnung zur
Sprachsteuerung mit einem Mikrofonarray.
In Fig. 1 ist schematisch ein erfindungsgemäßes System
dargestellt. An ein Fernsehgerät TV sind zwei externe
Lautsprecher LS1, LS2 angeschlossen. Interne, in der Figur
nicht dargestellte, Lautsprecher des Fernsehgerätes
ermöglichen zusammen mit den externen Lautsprechern eine
Surround-Sound-Wiedergabe von Mehrkanaltonsignalen, z. B.
die Wiedergabe von entsprechenden digitalen Audiosignalen
gemäß dem MPEG-2- oder AC3-Standard. Die externen
Lautsprecher sind hierbei über einen IEEE-1394-Bus, auch
FireWire genannt, direkt an das Fernsehgerät
angeschlossen, könnten aber ebenso an einen geeigneten
Surround-Sound-Receiver angeschlossen werden. Die
Verwendung eines IEEE-1394-Busses ist von Vorteil, da
dieser eine schnelle Datenübertragung und die
Kommunikation zwischen verschiedenen Geräten ermöglicht.
Weiterhin kann bei Aktivlautsprechern gleichzeitig eine
Stromversorgung über diesen Bus erfolgen.
Zur Detektion der Sprachsignale ist ein Mikrofonarray
vorgesehen. Dieses besteht aus zwei in den
Fernsehempfänger integrierten Mikrofonen MTV1 und MTV2
sowie je einem in die Lautsprechergehäuse integriertes
Mikrofon MLS1 und MLS2. Diese setzen die detektierten
Schallsignale in elektrische Signale um, die durch
Verstärker verstärkt, durch AD-Wandler in digitale Signale
umgewandelt und dann einer Signalverarbeitungseinheit
zugeführt werden. Die Signale von den externen
Lautsprechern werden hierbei ebenfalls über den IEEE-1394-
Bus der Signalverarbeitungseinheit in dem Fernsehgerät
zugeführt. Diese berücksichtigt den jeweiligen
Aufenthaltsort des Benutzers durch eine unterschiedliche
Skalierung bzw. Verarbeitung der detektierten
Schallsignale. Weiterhin kann auch eine Korrektur der
Mikrofonsignale bezüglich der von den Lautsprechern
abgegebenen Schallsignale erfolgen. Das so bearbeitete
Signal wird dann einer Spracherkennungseinheit zugeführt,
die die elektrischen Signale in Worte umwandelt. Die
diesen Worten entsprechenden Befehle werden dann
schließlich einem Systemmanager zur Steuerung des Systems
zugeführt.
Die Skalierung bzw. Verarbeitung der detektierten
Schallsignale durch die Signalverarbeitungseinheit
erfordert, daß die räumliche Anordnung der Mikrofone
bekannt ist. Diese ist für die in das TV-Gehäuse
integrierten Mikrofone bereits herstellerseitig bekannt.
Für die in den Lautsprechern angeordneten Mikrofone muß
dagegen die Position relativ zu dem TV-Gerät noch
ermittelt werden. Dieses kann durch ein Ausmessen und eine
Eingabe der ermittelten Werte über ein entsprechendes
Bildschirmmenü erfolgen. Ebenso kann jedoch ein Mess- und
Abgleichvorgang durchgeführt werden, indem durch die
Lautsprecher ein Testsignalton wiedergegeben und von den
Mikrofonen detektiert wird und aus den unterschiedlichen
Laufzeiten die Position der Mikrofone ermittelt wird.
Die beiden in dem Fernsehempfänger integrierten Mikrofone
können vorteilhaft auf der linken und rechten Seite des
Gehäuses des jeweiligen Gerätes untergebracht werden.
Diese Mikrofonanzahl und ebenso die Anzahl der weiteren
Mikrofone ist jedoch keinesfalls auf zwei beschränkt.
Ebenso sind eine Vielzahl von Kombinationen denkbar, in
denen die Mikrofone integriert sind. So können Mikrofone
statt oder zusätzlich zu dem Fernsehgerät auch in einem
Videorekorder, DVD-Spieler oder einer Fernbedienung
integriert werden. Selbst eine Installation von Mikrofonen
in Geräten, die sich in verschiedenen Räumen befinden, ist
möglich.
Weiterhin ist die Verbindung der Geräte nicht auf ein
Bussystem beschränkt. So ist es z. B. denkbar, bei der
Ausführungsform aus Fig. 1 die Lautsprecher stattdessen
mit Funksignalen anzusteuern. In diesem Fall müssen die
einzelnen Lautsprecher jedoch zusätzlich zu einem
Funkempfänger auch einen Funksender aufweisen.
Die Erfindung kann zur Sprachfernbedienung von
verschiedensten Geräten der Unterhaltungselektronik, wie
z. B. von TV-Geräten, Videorecordern, DVD-Spielern,
Satellitenempfängern, TV-Video-Kombinationen, Audiogeräten
oder kompletten Audiosystemen, aber ebenso von
Personalcomputern oder von Haushaltsgeräten eingesetzt
werden.
Claims (4)
1. System zur Sprachsteuerung mit einem
Mikrofonarray bestehend aus mehreren Mikrofonen (MTV1,
MTV2, MLS1, MLS2) zur Umwandlung von Sprachbefehlen in
elektrische Signale und mit einer zentralen
Spracherkennungseinheit zur Umwandlung dieser
elektrischen Signale in Bedienungsbefehle, dadurch
gekennzeichnet, daß die Mikrofone auf verschiedene
Geräte (TV, LS1, LS2) verteilt sind, die miteinander
in solcher Weise verbunden sind, daß die durch die
Mikrofone erzeugten Signale zu der zentralen
Spracherkennungseinheit übertragen werden können.
2. System nach Anspruch 1, dadurch gekennzeichnet,
daß die Geräte über ein bidirektionales Netzwerk
verbunden sind.
3. System nach Anspruch 2, dadurch gekennzeichnet,
daß das bidirektionale Netzwerk auf einem IEEE-1394-
Bus basiert.
4. System nach einem der vorhergehenden Ansprüche,
dadurch gekennzeichnet, daß ein oder mehrere Mikrofone
in einem Unterhaltungselektronik-Wiedergabegerät (TV),
insbesondere Fernsehgerät, und ein oder mehrere
weitere Mikrofone in externen Lautsprechern (LS1, LS2)
integriert sind.
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19943875A DE19943875A1 (de) | 1999-09-14 | 1999-09-14 | System zur Sprachsteuerung mit einem Mikrofonarray |
| CNB001234986A CN1162837C (zh) | 1999-09-14 | 2000-08-18 | 具有麦克风阵列的语音控制系统 |
| EP00119085A EP1085782A3 (de) | 1999-09-14 | 2000-09-02 | Sprachgesteuertes System mit einer Mikrophonanordnung |
| US09/660,381 US6868045B1 (en) | 1999-09-14 | 2000-09-12 | Voice control system with a microphone array |
| JP2000277687A JP4792156B2 (ja) | 1999-09-14 | 2000-09-13 | マイクロホンアレイを有するボイス制御システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19943875A DE19943875A1 (de) | 1999-09-14 | 1999-09-14 | System zur Sprachsteuerung mit einem Mikrofonarray |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE19943875A1 true DE19943875A1 (de) | 2001-03-15 |
Family
ID=7921899
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE19943875A Withdrawn DE19943875A1 (de) | 1999-09-14 | 1999-09-14 | System zur Sprachsteuerung mit einem Mikrofonarray |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US6868045B1 (de) |
| EP (1) | EP1085782A3 (de) |
| JP (1) | JP4792156B2 (de) |
| CN (1) | CN1162837C (de) |
| DE (1) | DE19943875A1 (de) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7162424B2 (en) | 2001-04-26 | 2007-01-09 | Siemens Aktiengesellschaft | Method and system for defining a sequence of sound modules for synthesis of a speech signal in a tonal language |
Families Citing this family (140)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
| US7349849B2 (en) * | 2001-08-08 | 2008-03-25 | Apple, Inc. | Spacing for microphone elements |
| DE10208466A1 (de) * | 2002-02-27 | 2004-01-29 | BSH Bosch und Siemens Hausgeräte GmbH | Elektrisches Haushaltsgerät |
| DE10208468A1 (de) * | 2002-02-27 | 2003-09-04 | Bsh Bosch Siemens Hausgeraete | Elektrisches Gerät, insbesondere Dunstabzugshaube |
| WO2004038697A1 (en) * | 2002-10-23 | 2004-05-06 | Koninklijke Philips Electronics N.V. | Controlling an apparatus based on speech |
| EP1923866B1 (de) * | 2005-08-11 | 2014-01-01 | Asahi Kasei Kabushiki Kaisha | Schallquellen-Trenneinrichtung, Spracherkennungseinrichtung, tragbares Telefon, Schallquellen-Trennverfahren und Programm |
| WO2007019992A1 (en) * | 2005-08-16 | 2007-02-22 | Vega Grieshaber Kg | Automation network field device using ultrasound communication link |
| US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
| JP4965847B2 (ja) * | 2005-10-27 | 2012-07-04 | ヤマハ株式会社 | 音声信号送受信装置 |
| US8238584B2 (en) * | 2005-11-02 | 2012-08-07 | Yamaha Corporation | Voice signal transmitting/receiving apparatus |
| JP5028786B2 (ja) * | 2005-11-02 | 2012-09-19 | ヤマハ株式会社 | 収音装置 |
| US8068619B2 (en) * | 2006-05-09 | 2011-11-29 | Fortemedia, Inc. | Method and apparatus for noise suppression in a small array microphone system |
| US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
| US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
| US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
| US8144896B2 (en) * | 2008-02-22 | 2012-03-27 | Microsoft Corporation | Speech separation with microphone arrays |
| US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
| US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
| US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
| AU2009287421B2 (en) | 2008-08-29 | 2015-09-17 | Biamp Systems, LLC | A microphone array system and method for sound acquisition |
| WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
| US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
| US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
| US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
| US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
| US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
| US20110123054A1 (en) * | 2009-11-19 | 2011-05-26 | Adamson Systems Engineering Inc. | Method and system for determining relative positions of multiple loudspeakers in a space |
| US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
| US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
| US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
| US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
| DE112011100329T5 (de) | 2010-01-25 | 2012-10-31 | Andrew Peter Nelson Jerram | Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform |
| US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
| CN101894553A (zh) * | 2010-07-23 | 2010-11-24 | 四川长虹电器股份有限公司 | 电视机语音控制的实现方法 |
| US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
| US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
| US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
| US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
| US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
| US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
| US8676579B2 (en) * | 2012-04-30 | 2014-03-18 | Blackberry Limited | Dual microphone voice authentication for mobile device |
| US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
| US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
| US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
| US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
| US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
| BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
| WO2014165032A1 (en) | 2013-03-12 | 2014-10-09 | Aawtend, Inc. | Integrated sensor-array processor |
| US10049685B2 (en) | 2013-03-12 | 2018-08-14 | Aaware, Inc. | Integrated sensor-array processor |
| US10204638B2 (en) | 2013-03-12 | 2019-02-12 | Aaware, Inc. | Integrated sensor-array processor |
| US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
| WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
| CN105027197B (zh) | 2013-03-15 | 2018-12-14 | 苹果公司 | 训练至少部分语音命令系统 |
| JP6114915B2 (ja) * | 2013-03-25 | 2017-04-19 | パナソニックIpマネジメント株式会社 | 音声入力選択装置及び音声入力選択方法 |
| WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
| WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
| US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
| WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
| AU2014278592B2 (en) | 2013-06-09 | 2017-09-07 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
| US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
| AU2014278595B2 (en) | 2013-06-13 | 2017-04-06 | Apple Inc. | System and method for emergency calls initiated by voice command |
| CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
| US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
| US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
| US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
| US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
| US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
| US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
| US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
| US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
| US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
| EP3149728B1 (de) | 2014-05-30 | 2019-01-16 | Apple Inc. | Eingabeverfahren durch einzelne äusserung mit mehreren befehlen |
| US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
| US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
| US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
| US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
| US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
| US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
| US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
| US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
| US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
| US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
| US9699550B2 (en) * | 2014-11-12 | 2017-07-04 | Qualcomm Incorporated | Reduced microphone power-up latency |
| US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
| US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
| US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
| US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
| US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
| US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
| US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
| US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
| US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
| US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
| US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
| US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
| US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
| US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
| US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
| US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
| US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
| US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
| US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
| US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
| US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
| US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
| US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
| US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
| US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
| US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
| US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
| DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
| US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
| US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
| US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
| US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
| US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
| DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
| DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
| DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
| DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
| KR102471499B1 (ko) * | 2016-07-05 | 2022-11-28 | 삼성전자주식회사 | 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체 |
| US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
| US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
| CN106878869B (zh) * | 2017-03-30 | 2020-07-24 | 联想(北京)有限公司 | 麦克风阵列及其使用方法 |
| DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
| DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
| DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
| DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
| DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
| DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
| CN109935237A (zh) * | 2017-12-19 | 2019-06-25 | 展讯通信(上海)有限公司 | 多移动终端的mic阵列自校准方法、装置及服务器 |
| CN108737927B (zh) * | 2018-05-31 | 2020-04-17 | 北京百度网讯科技有限公司 | 确定麦克风阵列的位置的方法、装置、设备和介质 |
| US11170798B2 (en) * | 2018-12-12 | 2021-11-09 | Bby Solutions, Inc. | Remote audio pickup and noise cancellation system and method |
| KR102215543B1 (ko) * | 2019-02-26 | 2021-02-15 | 주식회사 큐버 | Uhd 방송을 위한 어레이 스피커와 어레이 마이크 기반의 ai 음성비서 장치 |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4302749A (en) * | 1978-07-03 | 1981-11-24 | Erkki Ylonen | Automatic firing for clay pigeon launcher |
| US4357488A (en) * | 1980-01-04 | 1982-11-02 | California R & D Center | Voice discriminating system |
| DE3742929C1 (de) * | 1987-12-18 | 1988-09-29 | Daimler Benz Ag | Verfahren zur Verbesserung der Zuverlaessigkeit von Sprachsteuerungen von Funktionselementen und Vorrichtung zu dessen Durchfuehrung |
| DE3929481A1 (de) * | 1988-09-07 | 1990-03-15 | Hitachi Ltd | Verfahren und vorrichtung zur vorbearbeitung von sprachsignalen |
| FR2744630A1 (fr) * | 1996-02-09 | 1997-08-14 | Ecole Superieure Atlantique D | Fauteuil roulant motorise a dispositif de commande vocale supervise par un dispositif de securite, et procede de commande et securisation du deplacement d'un tel fauteuil |
| DE19741596A1 (de) * | 1997-09-20 | 1999-03-25 | Bosch Gmbh Robert | Verfahren zur Optimierung des Empfangs akustischer Signale und elektrisches Gerät |
| DE19812697A1 (de) * | 1998-03-23 | 1999-09-30 | Volkswagen Ag | Verfahren und Einrichtung zum Betrieb einer Mikrofonanordnung, insbesondere in einem Kraftfahrzeug |
| DE19827134A1 (de) * | 1998-05-06 | 1999-11-11 | Volkswagen Ag | Verfahren und Einrichtung zum Betrieb von sprachunterstützten Systemen in Kraftfahrzeugen |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4311874A (en) | 1979-12-17 | 1982-01-19 | Bell Telephone Laboratories, Incorporated | Teleconference microphone arrays |
| US5086385A (en) * | 1989-01-31 | 1992-02-04 | Custom Command Systems | Expandable home automation system |
| JP2687712B2 (ja) * | 1990-07-26 | 1997-12-08 | 三菱電機株式会社 | 一体型ビデオカメラ |
| JP2830421B2 (ja) * | 1990-08-14 | 1998-12-02 | ソニー株式会社 | ワイヤレス受信機 |
| JPH0756596B2 (ja) * | 1990-09-11 | 1995-06-14 | 富士通テン株式会社 | 音声認識装置 |
| JPH04318798A (ja) * | 1991-04-18 | 1992-11-10 | Matsushita Electric Ind Co Ltd | マイクロホン装置 |
| US5255326A (en) * | 1992-05-18 | 1993-10-19 | Alden Stevenson | Interactive audio control system |
| US5963872A (en) * | 1993-03-04 | 1999-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Electronic equipment audio system |
| US6188985B1 (en) * | 1997-01-06 | 2001-02-13 | Texas Instruments Incorporated | Wireless voice-activated device for control of a processor-based host system |
| DE19712632A1 (de) * | 1997-03-26 | 1998-10-01 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten |
| DE59807151D1 (de) * | 1997-05-22 | 2003-03-20 | Inventio Ag | Eingabegerät und Verfahren zur akustischen Befehlseingabe für eine Aufzugsanlage |
| JP3541339B2 (ja) | 1997-06-26 | 2004-07-07 | 富士通株式会社 | マイクロホンアレイ装置 |
| DE69712485T2 (de) * | 1997-10-23 | 2002-12-12 | Sony International (Europe) Gmbh | Sprachschnittstelle für ein Hausnetzwerk |
| US6349352B1 (en) * | 1998-01-06 | 2002-02-19 | Sony Corporation Of Japan | Home audio/video network with both generic and parameterized device control |
-
1999
- 1999-09-14 DE DE19943875A patent/DE19943875A1/de not_active Withdrawn
-
2000
- 2000-08-18 CN CNB001234986A patent/CN1162837C/zh not_active Expired - Lifetime
- 2000-09-02 EP EP00119085A patent/EP1085782A3/de not_active Ceased
- 2000-09-12 US US09/660,381 patent/US6868045B1/en not_active Expired - Lifetime
- 2000-09-13 JP JP2000277687A patent/JP4792156B2/ja not_active Expired - Lifetime
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4302749A (en) * | 1978-07-03 | 1981-11-24 | Erkki Ylonen | Automatic firing for clay pigeon launcher |
| US4357488A (en) * | 1980-01-04 | 1982-11-02 | California R & D Center | Voice discriminating system |
| DE3742929C1 (de) * | 1987-12-18 | 1988-09-29 | Daimler Benz Ag | Verfahren zur Verbesserung der Zuverlaessigkeit von Sprachsteuerungen von Funktionselementen und Vorrichtung zu dessen Durchfuehrung |
| DE3929481A1 (de) * | 1988-09-07 | 1990-03-15 | Hitachi Ltd | Verfahren und vorrichtung zur vorbearbeitung von sprachsignalen |
| FR2744630A1 (fr) * | 1996-02-09 | 1997-08-14 | Ecole Superieure Atlantique D | Fauteuil roulant motorise a dispositif de commande vocale supervise par un dispositif de securite, et procede de commande et securisation du deplacement d'un tel fauteuil |
| DE19741596A1 (de) * | 1997-09-20 | 1999-03-25 | Bosch Gmbh Robert | Verfahren zur Optimierung des Empfangs akustischer Signale und elektrisches Gerät |
| DE19812697A1 (de) * | 1998-03-23 | 1999-09-30 | Volkswagen Ag | Verfahren und Einrichtung zum Betrieb einer Mikrofonanordnung, insbesondere in einem Kraftfahrzeug |
| DE19827134A1 (de) * | 1998-05-06 | 1999-11-11 | Volkswagen Ag | Verfahren und Einrichtung zum Betrieb von sprachunterstützten Systemen in Kraftfahrzeugen |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7162424B2 (en) | 2001-04-26 | 2007-01-09 | Siemens Aktiengesellschaft | Method and system for defining a sequence of sound modules for synthesis of a speech signal in a tonal language |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4792156B2 (ja) | 2011-10-12 |
| US6868045B1 (en) | 2005-03-15 |
| CN1288222A (zh) | 2001-03-21 |
| EP1085782A2 (de) | 2001-03-21 |
| JP2001117587A (ja) | 2001-04-27 |
| CN1162837C (zh) | 2004-08-18 |
| EP1085782A3 (de) | 2001-08-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE19943875A1 (de) | System zur Sprachsteuerung mit einem Mikrofonarray | |
| EP1520447B1 (de) | Verfahren und vorrichtung zur erzeugung von daten über die gegenseitige lage von mindestens drei schallwandlern | |
| DE60120062T2 (de) | Sprachsteuerung von elektronischen Geräten | |
| DE19943872A1 (de) | Vorrichtung zur Anpassung der Richtcharakteristik von Mikrofonen für die Sprachsteuerung | |
| DE69734934T2 (de) | Verfahren und vorrichtung zur projektion von schallquellen auf lautsprechern | |
| DE4498516C2 (de) | Richtungsgradientenmikrofonsystem und Verfahren zu seinem Betrieb | |
| DE10002321C2 (de) | Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung | |
| DE19712632A1 (de) | Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten | |
| DE102010050472A1 (de) | Mikrofonanordnung | |
| DE602004013376T2 (de) | Vsr-surround-röhrenkopfhörer | |
| DE112010005204T5 (de) | Tragbarer Computer mit mehreren eingebetteten Audiosteuerungen | |
| EP1012992B1 (de) | Empfänger in einem antennenfuss | |
| WO2004100609A1 (de) | System zur ortssensitiven wiedergabe von audiosignalen | |
| DE102022108798B4 (de) | Musikinstrument-Tonabnehmer sowie entsprechend ausgestattetes System und Verwendung eines Automotive-Audio-Bus-(A²B) hierfür | |
| CN215773350U (zh) | 一种可调式hdmi高清采集电路 | |
| DE112019007263T5 (de) | Anzeigegerät | |
| DE202009015988U1 (de) | Kompakte Anordnung von Hornlautsprechern | |
| CN215527245U (zh) | 一种多场景音频处理系统 | |
| DE202014100437U1 (de) | System zur Übertragung eines Audiosignals an mehrere mobile Endgeräte | |
| DE102008007097A1 (de) | Audiosystem-Adapter eines Audiosystems | |
| DE102006035104A1 (de) | Testanordnung zum Testen einer otologischen Vorrichtung | |
| DE3501316A1 (de) | Schallwiedergabeeinrichtung | |
| DE202014105825U1 (de) | Drahtloses Akustiksystem | |
| DE202022002782U1 (de) | Musikinstrument-Tonabnehmer sowie entsprechend ausgestattetes System und Verwendung eines Automotive-Audio-Bus-(A²B) hierfür | |
| DE102008013362A1 (de) | Vorrichtung für Konferenztische oder dergleichen |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
| 8120 | Willingness to grant licences paragraph 23 | ||
| 8139 | Disposal/non-payment of the annual fee |