[go: up one dir, main page]

RU2010109071A - Транскрибирование речи в текст для персональных коммуникационных устройств - Google Patents

Транскрибирование речи в текст для персональных коммуникационных устройств Download PDF

Info

Publication number
RU2010109071A
RU2010109071A RU2010109071/07A RU2010109071A RU2010109071A RU 2010109071 A RU2010109071 A RU 2010109071A RU 2010109071/07 A RU2010109071/07 A RU 2010109071/07A RU 2010109071 A RU2010109071 A RU 2010109071A RU 2010109071 A RU2010109071 A RU 2010109071A
Authority
RU
Russia
Prior art keywords
communication device
personal communication
speech signal
generated
text
Prior art date
Application number
RU2010109071/07A
Other languages
English (en)
Inventor
Клиффорд Нейл ДИДКОК (US)
Клиффорд Нейл ДИДКОК
Томас У. МИЛЛЕТТ (US)
Томас У. МИЛЛЕТТ
Original Assignee
Майкрософт Корпорейшн (Us)
Майкрософт Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Майкрософт Корпорейшн (Us), Майкрософт Корпорейшн filed Critical Майкрософт Корпорейшн (Us)
Publication of RU2010109071A publication Critical patent/RU2010109071A/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephone Function (AREA)

Abstract

1. Способ генерирования текста, содержащий: ! генерирование речевого сигнала посредством произнесения в персональное коммуникационное устройство (105); ! передачу сгенерированного речевого сигнала; и ! прием, в ответ на передачу, текстового сообщения в персональное коммуникационное устройство (105), при этом текстовое сообщение сгенерировано транскрибированием речевого сигнала с использованием системы транскрибирования речи в текст (130), расположенной вне персонального коммуникационного устройства (105). ! 2. Способ по п.1, в котором речевой сигнал сгенерирован как результат произнесения по меньшей мере одного из адреса электронной почты, текста темы письма или по меньшей мере отрывка основной части сообщения электронной почты. ! 3. Способ по п.1, в котором: ! генерирование речевого сигнала содержит сохранение хотя бы части речевого сигнала на персональном коммуникационном устройстве; и ! передача сгенерированного речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для передачи сохраненного речевого сигнала в режиме отложенной передачи. ! 4. Способ по п.1, в котором: ! генерирование речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для запроса транскрибирования; и ! передача сгенерированного сигнала содержит: ! прием подтверждения на персональном коммуникационном устройстве; и ! передачу речевого сигнала в режиме живой передачи. ! 5. Способ по п.1, в котором передача сгенерированного речевого сигнала содержит передачу речевого сигнала в режиме передачи по частям. ! 6. Способ по п.1, в котором передача сгенерированного речевого сигнала содержи�

Claims (20)

1. Способ генерирования текста, содержащий:
генерирование речевого сигнала посредством произнесения в персональное коммуникационное устройство (105);
передачу сгенерированного речевого сигнала; и
прием, в ответ на передачу, текстового сообщения в персональное коммуникационное устройство (105), при этом текстовое сообщение сгенерировано транскрибированием речевого сигнала с использованием системы транскрибирования речи в текст (130), расположенной вне персонального коммуникационного устройства (105).
2. Способ по п.1, в котором речевой сигнал сгенерирован как результат произнесения по меньшей мере одного из адреса электронной почты, текста темы письма или по меньшей мере отрывка основной части сообщения электронной почты.
3. Способ по п.1, в котором:
генерирование речевого сигнала содержит сохранение хотя бы части речевого сигнала на персональном коммуникационном устройстве; и
передача сгенерированного речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для передачи сохраненного речевого сигнала в режиме отложенной передачи.
4. Способ по п.1, в котором:
генерирование речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для запроса транскрибирования; и
передача сгенерированного сигнала содержит:
прием подтверждения на персональном коммуникационном устройстве; и
передачу речевого сигнала в режиме живой передачи.
5. Способ по п.1, в котором передача сгенерированного речевого сигнала содержит передачу речевого сигнала в режиме передачи по частям.
6. Способ по п.1, в котором передача сгенерированного речевого сигнала содержит по меньшей мере одно из:
передачи речевого сигнала в цифровом формате; или
передачи речевого сигнала как телефонного вызова.
7. Способ по п.6, в котором цифровой формат включает в себя цифровой формат протокола Интернет (IP).
8. Способ по п.1, дополнительно содержащий:
редактирование текстового сообщения; и
передачу текстового сообщения в формате электронной почты.
9. Способ по п.8, в котором редактирование текстового сообщения содержит:
замену по меньшей мере одного слова в текстовом сообщении альтернативным словом, причем замена выполняется ручным набором альтернативного слова или выбором альтернативного слова из меню альтернативных слов, предоставленного системой транскрибирования речи в текст.
10. Способ генерирования текста, содержащий:
прием на первом сервере (210) речевого сигнала, сгенерированного персональным коммуникационным устройством (105);
транскрибирование принятого речевого сигнала в текстовое сообщение с использованием системы транскрибирования речи в текст (130), расположенной на втором сервере (125); и
передачу сгенерированного текстового сообщения на персональное коммуникационное устройство (105).
11. Способ по п.10, в котором первый сервер является и вторым сервером.
12. Способ по п.10, дополнительно содержащий:
прием на первом сервере запроса на транскрибирование с персонального коммуникационного устройства; и
установку в ответ на таковой коммуникационного пакетного канала данных между первым сервером и персональным коммуникационным устройством для передачи речевого сигнала с персонального коммуникационного устройства на первый сервер в виде пакетов цифровых данных.
13. Способ по п.10, в котором использование системы транскрибирования речи в текст содержит:
генерирование списка альтернативных кандидатов для речевого распознания произнесенного слова, причем каждому альтернативному кандидату назначается уровень доверия для точности распознания.
14. Способ по п.13, дополнительно содержащий:
передачу с первого сервера на персональное коммуникационное устройство списка альтернативных кандидатов в формате выпадающего меню, связанного с транскрибированным словом.
15. Считываемый компьютером носитель, хранящий считываемые компьютером инструкции для исполнения этапов для:
коммуникативного соединения сервера (210, 125) с персональным коммуникационным устройством (105);
приема на сервере (210, 125) речевого сигнала, сгенерированного на персональном коммуникационном устройстве (105);
транскрибирования принятого речевого сигнала в текстовое сообщение с использованием системы транскрибирования речи в текст (130), расположенной на сервере (210, 125); и
передачи сгенерированного текстового сообщения на персональное коммуникационное устройство (105).
16. Считываемый компьютером носитель по п.15, в котором использование системы транскрибирования речи в текст содержит:
генерирование списка альтернативных кандидатов для речевого распознания произнесенного слова, причем каждому альтернативному кандидату назначается уровень доверия для точности распознания;
создание транскрибированного слова из произнесенного слова с использованием одного из альтернативных кандидатов с наивысшим уровнем доверия; и
прикрепление списка альтернативных кандидатов к транскрибированному слову.
17. Считываемый компьютером носитель по п.16, в котором передача сгенерированного текстового сообщения на персональное коммуникационное устройство содержит передачу транскрибированного слова на персональное коммуникационное устройство вместе со списком альтернативных кандидатов.
18. Считываемый компьютером носитель по п.17, в котором список альтернативных кандидатов прикреплен к транскрибированному слову в формате выпадающего меню.
19. Считываемый компьютером носитель по п.15, далее включающий в себя генерирование базы данных, содержащей по меньшей мере один предпочитаемый словарь или набор тренировочных слов распознавания речи.
20. Считываемый компьютером носитель по п.19, далее включающий в себя считываемые компьютером инструкции для выполнения этапов для:
редактирования сгенерированного текстового сообщения в персональном коммуникационном устройстве; и
передачи текстового сообщения с персонального коммуникационного устройства в формате электронной почты.
RU2010109071/07A 2007-09-12 2008-08-25 Транскрибирование речи в текст для персональных коммуникационных устройств RU2010109071A (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/854,523 US20090070109A1 (en) 2007-09-12 2007-09-12 Speech-to-Text Transcription for Personal Communication Devices
US11/854,523 2007-09-12

Publications (1)

Publication Number Publication Date
RU2010109071A true RU2010109071A (ru) 2011-09-20

Family

ID=40432828

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010109071/07A RU2010109071A (ru) 2007-09-12 2008-08-25 Транскрибирование речи в текст для персональных коммуникационных устройств

Country Status (8)

Country Link
US (1) US20090070109A1 (ru)
EP (1) EP2198527A4 (ru)
JP (1) JP2011504304A (ru)
KR (1) KR20100065317A (ru)
CN (1) CN101803214A (ru)
BR (1) BRPI0814418A2 (ru)
RU (1) RU2010109071A (ru)
WO (1) WO2009035842A1 (ru)

Families Citing this family (175)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20170169700A9 (en) * 2005-09-01 2017-06-15 Simplexgrinnell Lp System and method for emergency message preview and transmission
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
WO2009073768A1 (en) * 2007-12-04 2009-06-11 Vovision, Llc Correcting transcribed audio files with an email-client interface
GB2451371B (en) 2006-04-17 2011-02-23 Vovision Llc Method and systems for correcting transcribed audio files
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US20090234635A1 (en) * 2007-06-29 2009-09-17 Vipul Bhatt Voice Entry Controller operative with one or more Translation Resources
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8856003B2 (en) * 2008-04-30 2014-10-07 Motorola Solutions, Inc. Method for dual channel monitoring on a radio device
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8483679B2 (en) * 2008-09-09 2013-07-09 Avaya Inc. Sharing of electromagnetic-signal measurements for providing feedback about transmit-path signal quality
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
EP2427865A4 (en) 2009-05-05 2014-01-08 Notevault Inc SYSTEM AND METHOD FOR MULTILINGUAL TRANSLATION SERVICE WITH AUTOMATED NOTIFICATION SERVICES
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8224654B1 (en) 2010-08-06 2012-07-17 Google Inc. Editing voice input
KR101208166B1 (ko) * 2010-12-16 2012-12-04 엔에이치엔(주) 온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법
CN102541505A (zh) * 2011-01-04 2012-07-04 中国移动通信集团公司 语音输入方法及其系统
KR101795574B1 (ko) 2011-01-06 2017-11-13 삼성전자주식회사 모션에 의해 제어되는 전자기기 및 그 제어 방법
KR101858531B1 (ko) 2011-01-06 2018-05-17 삼성전자주식회사 모션에 의해 제어되는 디스플레이 장치 및 그 모션 제어 방법
US8489398B1 (en) * 2011-01-14 2013-07-16 Google Inc. Disambiguation of spoken proper names
US9037459B2 (en) * 2011-03-14 2015-05-19 Apple Inc. Selection of text prediction results by an accessory
AU2014200860B2 (en) * 2011-03-14 2016-05-26 Apple Inc. Selection of text prediction results by an accessory
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8417233B2 (en) 2011-06-13 2013-04-09 Mercury Mobile, Llc Automated notation techniques implemented via mobile devices and/or computer networks
KR101457116B1 (ko) * 2011-11-07 2014-11-04 삼성전자주식회사 음성 인식 및 모션 인식을 이용한 전자 장치 및 그의 제어 방법
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
JP5887253B2 (ja) * 2012-11-16 2016-03-16 本田技研工業株式会社 メッセージ処理装置
JP2016508007A (ja) 2013-02-07 2016-03-10 アップル インコーポレイテッド デジタルアシスタントのためのボイストリガ
WO2014125356A1 (en) * 2013-02-13 2014-08-21 Help With Listening Methodology of improving the understanding of spoken words
WO2014144579A1 (en) * 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
HK1223708A1 (zh) 2013-06-09 2017-08-04 Apple Inc. 用於实现跨数字助理的两个或更多个实例的会话持续性的设备、方法、和图形用户界面
US9305551B1 (en) * 2013-08-06 2016-04-05 Timothy A. Johns Scribe system for transmitting an audio recording from a recording device to a server
KR20150024188A (ko) * 2013-08-26 2015-03-06 삼성전자주식회사 음성 데이터에 대응하는 문자 데이터를 변경하는 방법 및 이를 위한 전자 장치
US20150081294A1 (en) * 2013-09-19 2015-03-19 Maluuba Inc. Speech recognition for user specific language
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
CN104735634B (zh) * 2013-12-24 2019-06-25 腾讯科技(深圳)有限公司 一种关联支付账号管理方法、移动终端、服务器以及系统
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
KR102357321B1 (ko) * 2014-08-27 2022-02-03 삼성전자주식회사 음성 인식이 가능한 디스플레이 장치 및 방법
CN105374356B (zh) * 2014-08-29 2019-07-30 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
EP3195145A4 (en) 2014-09-16 2018-01-24 VoiceBox Technologies Corporation Voice commerce
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9747896B2 (en) 2014-10-15 2017-08-29 Voicebox Technologies Corporation System and method for providing follow-up responses to prior natural language inputs of a user
CA2869245A1 (en) 2014-10-27 2016-04-27 MYLE Electronics Corp. Mobile thought catcher system
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US20190197103A1 (en) * 2015-11-17 2019-06-27 Ubergrape Gmbh Asynchronous speech act detection in text-based messages
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
CN105869654B (zh) 2016-03-29 2020-12-04 阿里巴巴集团控股有限公司 音频消息的处理方法及装置
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10331784B2 (en) 2016-07-29 2019-06-25 Voicebox Technologies Corporation System and method of disambiguating natural language processing requests
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US20180143956A1 (en) * 2016-11-18 2018-05-24 Microsoft Technology Licensing, Llc Real-time caption correction by audience
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN109213971A (zh) * 2017-06-30 2019-01-15 北京国双科技有限公司 庭审笔录的生成方法及装置
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US10963723B2 (en) * 2018-12-23 2021-03-30 Microsoft Technology Licensing, Llc Digital image transcription and manipulation
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11126794B2 (en) * 2019-04-11 2021-09-21 Microsoft Technology Licensing, Llc Targeted rewrites
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. User activity shortcut suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11386890B1 (en) * 2020-02-11 2022-07-12 Amazon Technologies, Inc. Natural language understanding
US11810578B2 (en) 2020-05-11 2023-11-07 Apple Inc. Device arbitration for digital assistant-based intercom systems
WO2022261808A1 (en) * 2021-06-15 2022-12-22 Microsoft Technology Licensing, Llc Contextual spelling correction (csc) for automatic speech recognition (asr)
US11657803B1 (en) * 2022-11-02 2023-05-23 Actionpower Corp. Method for speech recognition by using feedback information

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3402100B2 (ja) * 1996-12-27 2003-04-28 カシオ計算機株式会社 音声制御ホスト装置
GB2323693B (en) * 1997-03-27 2001-09-26 Forum Technology Ltd Speech to text conversion
US6173259B1 (en) * 1997-03-27 2001-01-09 Speech Machines Plc Speech to text conversion
US6178403B1 (en) * 1998-12-16 2001-01-23 Sharp Laboratories Of America, Inc. Distributed voice capture and recognition system
JP3795692B2 (ja) * 1999-02-12 2006-07-12 マイクロソフト コーポレーション 文字処理装置および方法
US6259657B1 (en) * 1999-06-28 2001-07-10 Robert S. Swinney Dictation system capable of processing audio information at a remote location
US6789060B1 (en) * 1999-11-01 2004-09-07 Gene J. Wolfe Network based speech transcription that maintains dynamic templates
US6532446B1 (en) * 1999-11-24 2003-03-11 Openwave Systems Inc. Server based speech recognition user interface for wireless devices
US7035804B2 (en) * 2001-04-26 2006-04-25 Stenograph, L.L.C. Systems and methods for automated audio transcription, translation, and transfer
US6901364B2 (en) * 2001-09-13 2005-05-31 Matsushita Electric Industrial Co., Ltd. Focused language models for improved speech input of structured documents
KR20030097347A (ko) * 2002-06-20 2003-12-31 삼성전자주식회사 휴대용 단말기의 음성인식을 이용한 문자메시지 전송 방법
ATE417346T1 (de) * 2003-03-26 2008-12-15 Koninkl Philips Electronics Nv Spracherkennungs- und korrektursystem, korrekturvorrichtung und verfahren zur erstellung eines lexikons von alternativen
TWI232431B (en) * 2004-01-13 2005-05-11 Benq Corp Method of speech transformation
US7130401B2 (en) * 2004-03-09 2006-10-31 Discernix, Incorporated Speech to text conversion system
KR100625662B1 (ko) * 2004-06-30 2006-09-20 에스케이 텔레콤주식회사 메시지 서비스 시스템 및 방법
KR100642577B1 (ko) * 2004-12-14 2006-11-08 주식회사 케이티프리텔 음성 메시지를 문자 메시지로 변환하여 전송하는 방법 및장치
US7917178B2 (en) * 2005-03-22 2011-03-29 Sony Ericsson Mobile Communications Ab Wireless communications device with voice-to-text conversion
GB2427500A (en) * 2005-06-22 2006-12-27 Symbian Software Ltd Mobile telephone text entry employing remote speech to text conversion
CA2527813A1 (en) * 2005-11-24 2007-05-24 9160-8083 Quebec Inc. System, method and computer program for sending an email message from a mobile communication device based on voice input
GB2451371B (en) * 2006-04-17 2011-02-23 Vovision Llc Method and systems for correcting transcribed audio files

Also Published As

Publication number Publication date
EP2198527A4 (en) 2011-09-28
WO2009035842A1 (en) 2009-03-19
US20090070109A1 (en) 2009-03-12
CN101803214A (zh) 2010-08-11
EP2198527A1 (en) 2010-06-23
BRPI0814418A2 (pt) 2015-01-20
KR20100065317A (ko) 2010-06-16
JP2011504304A (ja) 2011-02-03

Similar Documents

Publication Publication Date Title
RU2010109071A (ru) Транскрибирование речи в текст для персональных коммуникационных устройств
US8032383B1 (en) Speech controlled services and devices using internet
US8374864B2 (en) Correlation of transcribed text with corresponding audio
US8532994B2 (en) Speech recognition using a personal vocabulary and language model
US8204748B2 (en) System and method for providing a textual representation of an audio message to a mobile device
EP2596492B1 (en) Efficiently reducing transcription error using hybrid voice transcription
US6895257B2 (en) Personalized agent for portable devices and cellular phone
US8275618B2 (en) Mobile dictation correction user interface
US20200012724A1 (en) Bidirectional speech translation system, bidirectional speech translation method and program
US20090326939A1 (en) System and method for transcribing and displaying speech during a telephone call
US20120143605A1 (en) Conference transcription based on conference data
US9282176B2 (en) Voice recognition dialing for alphabetic phone numbers
US20100158213A1 (en) Sysetms and Methods for Intelligent Call Transcription
US20130079061A1 (en) Hand-held communication aid for individuals with auditory, speech and visual impairments
CN101558442A (zh) 使用语音识别的内容选择
JP2005149484A5 (ru)
CN102439661A (zh) 用于车辆内自动交互的面向服务语音识别
US9728202B2 (en) Method and apparatus for voice modification during a call
WO2003079328A1 (fr) Appareil, procede et programme de conversion audio video
US20100211389A1 (en) System of communication employing both voice and text
US20110173001A1 (en) Sms messaging with voice synthesis and recognition
US20090037170A1 (en) Method and apparatus for voice communication using abbreviated text messages
US20240305707A1 (en) Systems and methods for cellular and landline text-to-audio and audio-to-text conversion
US20100324884A1 (en) Enhanced telecommunication system
TW200304638A (en) Network-accessible speaker-dependent voice models of multiple persons

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20121112