RU2010109071A - Транскрибирование речи в текст для персональных коммуникационных устройств - Google Patents
Транскрибирование речи в текст для персональных коммуникационных устройств Download PDFInfo
- Publication number
- RU2010109071A RU2010109071A RU2010109071/07A RU2010109071A RU2010109071A RU 2010109071 A RU2010109071 A RU 2010109071A RU 2010109071/07 A RU2010109071/07 A RU 2010109071/07A RU 2010109071 A RU2010109071 A RU 2010109071A RU 2010109071 A RU2010109071 A RU 2010109071A
- Authority
- RU
- Russia
- Prior art keywords
- communication device
- personal communication
- speech signal
- generated
- text
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Information Transfer Between Computers (AREA)
- Telephone Function (AREA)
Abstract
1. Способ генерирования текста, содержащий: ! генерирование речевого сигнала посредством произнесения в персональное коммуникационное устройство (105); ! передачу сгенерированного речевого сигнала; и ! прием, в ответ на передачу, текстового сообщения в персональное коммуникационное устройство (105), при этом текстовое сообщение сгенерировано транскрибированием речевого сигнала с использованием системы транскрибирования речи в текст (130), расположенной вне персонального коммуникационного устройства (105). ! 2. Способ по п.1, в котором речевой сигнал сгенерирован как результат произнесения по меньшей мере одного из адреса электронной почты, текста темы письма или по меньшей мере отрывка основной части сообщения электронной почты. ! 3. Способ по п.1, в котором: ! генерирование речевого сигнала содержит сохранение хотя бы части речевого сигнала на персональном коммуникационном устройстве; и ! передача сгенерированного речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для передачи сохраненного речевого сигнала в режиме отложенной передачи. ! 4. Способ по п.1, в котором: ! генерирование речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для запроса транскрибирования; и ! передача сгенерированного сигнала содержит: ! прием подтверждения на персональном коммуникационном устройстве; и ! передачу речевого сигнала в режиме живой передачи. ! 5. Способ по п.1, в котором передача сгенерированного речевого сигнала содержит передачу речевого сигнала в режиме передачи по частям. ! 6. Способ по п.1, в котором передача сгенерированного речевого сигнала содержи�
Claims (20)
1. Способ генерирования текста, содержащий:
генерирование речевого сигнала посредством произнесения в персональное коммуникационное устройство (105);
передачу сгенерированного речевого сигнала; и
прием, в ответ на передачу, текстового сообщения в персональное коммуникационное устройство (105), при этом текстовое сообщение сгенерировано транскрибированием речевого сигнала с использованием системы транскрибирования речи в текст (130), расположенной вне персонального коммуникационного устройства (105).
2. Способ по п.1, в котором речевой сигнал сгенерирован как результат произнесения по меньшей мере одного из адреса электронной почты, текста темы письма или по меньшей мере отрывка основной части сообщения электронной почты.
3. Способ по п.1, в котором:
генерирование речевого сигнала содержит сохранение хотя бы части речевого сигнала на персональном коммуникационном устройстве; и
передача сгенерированного речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для передачи сохраненного речевого сигнала в режиме отложенной передачи.
4. Способ по п.1, в котором:
генерирование речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для запроса транскрибирования; и
передача сгенерированного сигнала содержит:
прием подтверждения на персональном коммуникационном устройстве; и
передачу речевого сигнала в режиме живой передачи.
5. Способ по п.1, в котором передача сгенерированного речевого сигнала содержит передачу речевого сигнала в режиме передачи по частям.
6. Способ по п.1, в котором передача сгенерированного речевого сигнала содержит по меньшей мере одно из:
передачи речевого сигнала в цифровом формате; или
передачи речевого сигнала как телефонного вызова.
7. Способ по п.6, в котором цифровой формат включает в себя цифровой формат протокола Интернет (IP).
8. Способ по п.1, дополнительно содержащий:
редактирование текстового сообщения; и
передачу текстового сообщения в формате электронной почты.
9. Способ по п.8, в котором редактирование текстового сообщения содержит:
замену по меньшей мере одного слова в текстовом сообщении альтернативным словом, причем замена выполняется ручным набором альтернативного слова или выбором альтернативного слова из меню альтернативных слов, предоставленного системой транскрибирования речи в текст.
10. Способ генерирования текста, содержащий:
прием на первом сервере (210) речевого сигнала, сгенерированного персональным коммуникационным устройством (105);
транскрибирование принятого речевого сигнала в текстовое сообщение с использованием системы транскрибирования речи в текст (130), расположенной на втором сервере (125); и
передачу сгенерированного текстового сообщения на персональное коммуникационное устройство (105).
11. Способ по п.10, в котором первый сервер является и вторым сервером.
12. Способ по п.10, дополнительно содержащий:
прием на первом сервере запроса на транскрибирование с персонального коммуникационного устройства; и
установку в ответ на таковой коммуникационного пакетного канала данных между первым сервером и персональным коммуникационным устройством для передачи речевого сигнала с персонального коммуникационного устройства на первый сервер в виде пакетов цифровых данных.
13. Способ по п.10, в котором использование системы транскрибирования речи в текст содержит:
генерирование списка альтернативных кандидатов для речевого распознания произнесенного слова, причем каждому альтернативному кандидату назначается уровень доверия для точности распознания.
14. Способ по п.13, дополнительно содержащий:
передачу с первого сервера на персональное коммуникационное устройство списка альтернативных кандидатов в формате выпадающего меню, связанного с транскрибированным словом.
15. Считываемый компьютером носитель, хранящий считываемые компьютером инструкции для исполнения этапов для:
коммуникативного соединения сервера (210, 125) с персональным коммуникационным устройством (105);
приема на сервере (210, 125) речевого сигнала, сгенерированного на персональном коммуникационном устройстве (105);
транскрибирования принятого речевого сигнала в текстовое сообщение с использованием системы транскрибирования речи в текст (130), расположенной на сервере (210, 125); и
передачи сгенерированного текстового сообщения на персональное коммуникационное устройство (105).
16. Считываемый компьютером носитель по п.15, в котором использование системы транскрибирования речи в текст содержит:
генерирование списка альтернативных кандидатов для речевого распознания произнесенного слова, причем каждому альтернативному кандидату назначается уровень доверия для точности распознания;
создание транскрибированного слова из произнесенного слова с использованием одного из альтернативных кандидатов с наивысшим уровнем доверия; и
прикрепление списка альтернативных кандидатов к транскрибированному слову.
17. Считываемый компьютером носитель по п.16, в котором передача сгенерированного текстового сообщения на персональное коммуникационное устройство содержит передачу транскрибированного слова на персональное коммуникационное устройство вместе со списком альтернативных кандидатов.
18. Считываемый компьютером носитель по п.17, в котором список альтернативных кандидатов прикреплен к транскрибированному слову в формате выпадающего меню.
19. Считываемый компьютером носитель по п.15, далее включающий в себя генерирование базы данных, содержащей по меньшей мере один предпочитаемый словарь или набор тренировочных слов распознавания речи.
20. Считываемый компьютером носитель по п.19, далее включающий в себя считываемые компьютером инструкции для выполнения этапов для:
редактирования сгенерированного текстового сообщения в персональном коммуникационном устройстве; и
передачи текстового сообщения с персонального коммуникационного устройства в формате электронной почты.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US11/854,523 US20090070109A1 (en) | 2007-09-12 | 2007-09-12 | Speech-to-Text Transcription for Personal Communication Devices |
| US11/854,523 | 2007-09-12 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2010109071A true RU2010109071A (ru) | 2011-09-20 |
Family
ID=40432828
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2010109071/07A RU2010109071A (ru) | 2007-09-12 | 2008-08-25 | Транскрибирование речи в текст для персональных коммуникационных устройств |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US20090070109A1 (ru) |
| EP (1) | EP2198527A4 (ru) |
| JP (1) | JP2011504304A (ru) |
| KR (1) | KR20100065317A (ru) |
| CN (1) | CN101803214A (ru) |
| BR (1) | BRPI0814418A2 (ru) |
| RU (1) | RU2010109071A (ru) |
| WO (1) | WO2009035842A1 (ru) |
Families Citing this family (175)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
| US20170169700A9 (en) * | 2005-09-01 | 2017-06-15 | Simplexgrinnell Lp | System and method for emergency message preview and transmission |
| US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
| WO2009073768A1 (en) * | 2007-12-04 | 2009-06-11 | Vovision, Llc | Correcting transcribed audio files with an email-client interface |
| GB2451371B (en) | 2006-04-17 | 2011-02-23 | Vovision Llc | Method and systems for correcting transcribed audio files |
| US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
| US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
| US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
| US20090234635A1 (en) * | 2007-06-29 | 2009-09-17 | Vipul Bhatt | Voice Entry Controller operative with one or more Translation Resources |
| US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
| US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
| US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
| US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
| US8856003B2 (en) * | 2008-04-30 | 2014-10-07 | Motorola Solutions, Inc. | Method for dual channel monitoring on a radio device |
| US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
| US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
| US8483679B2 (en) * | 2008-09-09 | 2013-07-09 | Avaya Inc. | Sharing of electromagnetic-signal measurements for providing feedback about transmit-path signal quality |
| US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
| US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
| EP2427865A4 (en) | 2009-05-05 | 2014-01-08 | Notevault Inc | SYSTEM AND METHOD FOR MULTILINGUAL TRANSLATION SERVICE WITH AUTOMATED NOTIFICATION SERVICES |
| US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
| US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
| US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
| US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
| US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
| US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
| US8224654B1 (en) | 2010-08-06 | 2012-07-17 | Google Inc. | Editing voice input |
| KR101208166B1 (ko) * | 2010-12-16 | 2012-12-04 | 엔에이치엔(주) | 온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법 |
| CN102541505A (zh) * | 2011-01-04 | 2012-07-04 | 中国移动通信集团公司 | 语音输入方法及其系统 |
| KR101795574B1 (ko) | 2011-01-06 | 2017-11-13 | 삼성전자주식회사 | 모션에 의해 제어되는 전자기기 및 그 제어 방법 |
| KR101858531B1 (ko) | 2011-01-06 | 2018-05-17 | 삼성전자주식회사 | 모션에 의해 제어되는 디스플레이 장치 및 그 모션 제어 방법 |
| US8489398B1 (en) * | 2011-01-14 | 2013-07-16 | Google Inc. | Disambiguation of spoken proper names |
| US9037459B2 (en) * | 2011-03-14 | 2015-05-19 | Apple Inc. | Selection of text prediction results by an accessory |
| AU2014200860B2 (en) * | 2011-03-14 | 2016-05-26 | Apple Inc. | Selection of text prediction results by an accessory |
| US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
| US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
| US8417233B2 (en) | 2011-06-13 | 2013-04-09 | Mercury Mobile, Llc | Automated notation techniques implemented via mobile devices and/or computer networks |
| KR101457116B1 (ko) * | 2011-11-07 | 2014-11-04 | 삼성전자주식회사 | 음성 인식 및 모션 인식을 이용한 전자 장치 및 그의 제어 방법 |
| US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
| US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
| US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
| US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
| US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
| JP5887253B2 (ja) * | 2012-11-16 | 2016-03-16 | 本田技研工業株式会社 | メッセージ処理装置 |
| JP2016508007A (ja) | 2013-02-07 | 2016-03-10 | アップル インコーポレイテッド | デジタルアシスタントのためのボイストリガ |
| WO2014125356A1 (en) * | 2013-02-13 | 2014-08-21 | Help With Listening | Methodology of improving the understanding of spoken words |
| WO2014144579A1 (en) * | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
| WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
| US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
| WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
| US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
| HK1223708A1 (zh) | 2013-06-09 | 2017-08-04 | Apple Inc. | 用於实现跨数字助理的两个或更多个实例的会话持续性的设备、方法、和图形用户界面 |
| US9305551B1 (en) * | 2013-08-06 | 2016-04-05 | Timothy A. Johns | Scribe system for transmitting an audio recording from a recording device to a server |
| KR20150024188A (ko) * | 2013-08-26 | 2015-03-06 | 삼성전자주식회사 | 음성 데이터에 대응하는 문자 데이터를 변경하는 방법 및 이를 위한 전자 장치 |
| US20150081294A1 (en) * | 2013-09-19 | 2015-03-19 | Maluuba Inc. | Speech recognition for user specific language |
| US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
| CN104735634B (zh) * | 2013-12-24 | 2019-06-25 | 腾讯科技(深圳)有限公司 | 一种关联支付账号管理方法、移动终端、服务器以及系统 |
| US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
| US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
| TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| KR102357321B1 (ko) * | 2014-08-27 | 2022-02-03 | 삼성전자주식회사 | 음성 인식이 가능한 디스플레이 장치 및 방법 |
| CN105374356B (zh) * | 2014-08-29 | 2019-07-30 | 株式会社理光 | 语音识别方法、语音评分方法、语音识别系统及语音评分系统 |
| US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
| WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
| EP3195145A4 (en) | 2014-09-16 | 2018-01-24 | VoiceBox Technologies Corporation | Voice commerce |
| US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
| US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
| US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
| US9747896B2 (en) | 2014-10-15 | 2017-08-29 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
| CA2869245A1 (en) | 2014-10-27 | 2016-04-27 | MYLE Electronics Corp. | Mobile thought catcher system |
| US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
| US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
| US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
| US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
| US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
| US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
| US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
| US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
| US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
| US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
| US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
| US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
| US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
| US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
| US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
| US20190197103A1 (en) * | 2015-11-17 | 2019-06-27 | Ubergrape Gmbh | Asynchronous speech act detection in text-based messages |
| US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
| US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
| US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
| CN105869654B (zh) | 2016-03-29 | 2020-12-04 | 阿里巴巴集团控股有限公司 | 音频消息的处理方法及装置 |
| US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
| US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
| US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
| US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
| US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
| DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
| US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
| US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
| US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
| US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
| US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
| DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
| DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
| DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
| DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
| US10331784B2 (en) | 2016-07-29 | 2019-06-25 | Voicebox Technologies Corporation | System and method of disambiguating natural language processing requests |
| US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
| US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
| US20180143956A1 (en) * | 2016-11-18 | 2018-05-24 | Microsoft Technology Licensing, Llc | Real-time caption correction by audience |
| US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
| US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
| US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
| DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
| US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
| US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
| DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
| US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
| DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
| DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
| DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
| US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
| DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
| DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
| US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
| US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
| US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
| DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
| US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
| CN109213971A (zh) * | 2017-06-30 | 2019-01-15 | 北京国双科技有限公司 | 庭审笔录的生成方法及装置 |
| US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
| US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
| US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
| US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
| US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
| US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
| US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
| US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
| US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
| US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
| US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
| US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
| DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
| DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
| US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
| US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
| DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
| US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
| US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
| US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
| US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
| US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
| US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
| US10963723B2 (en) * | 2018-12-23 | 2021-03-30 | Microsoft Technology Licensing, Llc | Digital image transcription and manipulation |
| US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
| US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
| US11126794B2 (en) * | 2019-04-11 | 2021-09-21 | Microsoft Technology Licensing, Llc | Targeted rewrites |
| US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
| DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
| US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
| US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
| US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
| DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | User activity shortcut suggestions |
| US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
| US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
| US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
| US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
| US11386890B1 (en) * | 2020-02-11 | 2022-07-12 | Amazon Technologies, Inc. | Natural language understanding |
| US11810578B2 (en) | 2020-05-11 | 2023-11-07 | Apple Inc. | Device arbitration for digital assistant-based intercom systems |
| WO2022261808A1 (en) * | 2021-06-15 | 2022-12-22 | Microsoft Technology Licensing, Llc | Contextual spelling correction (csc) for automatic speech recognition (asr) |
| US11657803B1 (en) * | 2022-11-02 | 2023-05-23 | Actionpower Corp. | Method for speech recognition by using feedback information |
Family Cites Families (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3402100B2 (ja) * | 1996-12-27 | 2003-04-28 | カシオ計算機株式会社 | 音声制御ホスト装置 |
| GB2323693B (en) * | 1997-03-27 | 2001-09-26 | Forum Technology Ltd | Speech to text conversion |
| US6173259B1 (en) * | 1997-03-27 | 2001-01-09 | Speech Machines Plc | Speech to text conversion |
| US6178403B1 (en) * | 1998-12-16 | 2001-01-23 | Sharp Laboratories Of America, Inc. | Distributed voice capture and recognition system |
| JP3795692B2 (ja) * | 1999-02-12 | 2006-07-12 | マイクロソフト コーポレーション | 文字処理装置および方法 |
| US6259657B1 (en) * | 1999-06-28 | 2001-07-10 | Robert S. Swinney | Dictation system capable of processing audio information at a remote location |
| US6789060B1 (en) * | 1999-11-01 | 2004-09-07 | Gene J. Wolfe | Network based speech transcription that maintains dynamic templates |
| US6532446B1 (en) * | 1999-11-24 | 2003-03-11 | Openwave Systems Inc. | Server based speech recognition user interface for wireless devices |
| US7035804B2 (en) * | 2001-04-26 | 2006-04-25 | Stenograph, L.L.C. | Systems and methods for automated audio transcription, translation, and transfer |
| US6901364B2 (en) * | 2001-09-13 | 2005-05-31 | Matsushita Electric Industrial Co., Ltd. | Focused language models for improved speech input of structured documents |
| KR20030097347A (ko) * | 2002-06-20 | 2003-12-31 | 삼성전자주식회사 | 휴대용 단말기의 음성인식을 이용한 문자메시지 전송 방법 |
| ATE417346T1 (de) * | 2003-03-26 | 2008-12-15 | Koninkl Philips Electronics Nv | Spracherkennungs- und korrektursystem, korrekturvorrichtung und verfahren zur erstellung eines lexikons von alternativen |
| TWI232431B (en) * | 2004-01-13 | 2005-05-11 | Benq Corp | Method of speech transformation |
| US7130401B2 (en) * | 2004-03-09 | 2006-10-31 | Discernix, Incorporated | Speech to text conversion system |
| KR100625662B1 (ko) * | 2004-06-30 | 2006-09-20 | 에스케이 텔레콤주식회사 | 메시지 서비스 시스템 및 방법 |
| KR100642577B1 (ko) * | 2004-12-14 | 2006-11-08 | 주식회사 케이티프리텔 | 음성 메시지를 문자 메시지로 변환하여 전송하는 방법 및장치 |
| US7917178B2 (en) * | 2005-03-22 | 2011-03-29 | Sony Ericsson Mobile Communications Ab | Wireless communications device with voice-to-text conversion |
| GB2427500A (en) * | 2005-06-22 | 2006-12-27 | Symbian Software Ltd | Mobile telephone text entry employing remote speech to text conversion |
| CA2527813A1 (en) * | 2005-11-24 | 2007-05-24 | 9160-8083 Quebec Inc. | System, method and computer program for sending an email message from a mobile communication device based on voice input |
| GB2451371B (en) * | 2006-04-17 | 2011-02-23 | Vovision Llc | Method and systems for correcting transcribed audio files |
-
2007
- 2007-09-12 US US11/854,523 patent/US20090070109A1/en not_active Abandoned
-
2008
- 2008-08-25 CN CN200880107047A patent/CN101803214A/zh active Pending
- 2008-08-25 EP EP08798590A patent/EP2198527A4/en not_active Withdrawn
- 2008-08-25 JP JP2010524907A patent/JP2011504304A/ja active Pending
- 2008-08-25 WO PCT/US2008/074164 patent/WO2009035842A1/en not_active Ceased
- 2008-08-25 KR KR1020107004918A patent/KR20100065317A/ko not_active Withdrawn
- 2008-08-25 RU RU2010109071/07A patent/RU2010109071A/ru not_active Application Discontinuation
- 2008-08-25 BR BRPI0814418-4A2A patent/BRPI0814418A2/pt not_active IP Right Cessation
Also Published As
| Publication number | Publication date |
|---|---|
| EP2198527A4 (en) | 2011-09-28 |
| WO2009035842A1 (en) | 2009-03-19 |
| US20090070109A1 (en) | 2009-03-12 |
| CN101803214A (zh) | 2010-08-11 |
| EP2198527A1 (en) | 2010-06-23 |
| BRPI0814418A2 (pt) | 2015-01-20 |
| KR20100065317A (ko) | 2010-06-16 |
| JP2011504304A (ja) | 2011-02-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2010109071A (ru) | Транскрибирование речи в текст для персональных коммуникационных устройств | |
| US8032383B1 (en) | Speech controlled services and devices using internet | |
| US8374864B2 (en) | Correlation of transcribed text with corresponding audio | |
| US8532994B2 (en) | Speech recognition using a personal vocabulary and language model | |
| US8204748B2 (en) | System and method for providing a textual representation of an audio message to a mobile device | |
| EP2596492B1 (en) | Efficiently reducing transcription error using hybrid voice transcription | |
| US6895257B2 (en) | Personalized agent for portable devices and cellular phone | |
| US8275618B2 (en) | Mobile dictation correction user interface | |
| US20200012724A1 (en) | Bidirectional speech translation system, bidirectional speech translation method and program | |
| US20090326939A1 (en) | System and method for transcribing and displaying speech during a telephone call | |
| US20120143605A1 (en) | Conference transcription based on conference data | |
| US9282176B2 (en) | Voice recognition dialing for alphabetic phone numbers | |
| US20100158213A1 (en) | Sysetms and Methods for Intelligent Call Transcription | |
| US20130079061A1 (en) | Hand-held communication aid for individuals with auditory, speech and visual impairments | |
| CN101558442A (zh) | 使用语音识别的内容选择 | |
| JP2005149484A5 (ru) | ||
| CN102439661A (zh) | 用于车辆内自动交互的面向服务语音识别 | |
| US9728202B2 (en) | Method and apparatus for voice modification during a call | |
| WO2003079328A1 (fr) | Appareil, procede et programme de conversion audio video | |
| US20100211389A1 (en) | System of communication employing both voice and text | |
| US20110173001A1 (en) | Sms messaging with voice synthesis and recognition | |
| US20090037170A1 (en) | Method and apparatus for voice communication using abbreviated text messages | |
| US20240305707A1 (en) | Systems and methods for cellular and landline text-to-audio and audio-to-text conversion | |
| US20100324884A1 (en) | Enhanced telecommunication system | |
| TW200304638A (en) | Network-accessible speaker-dependent voice models of multiple persons |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20121112 |