RU2010109071A

RU2010109071A - Транскрибирование речи в текст для персональных коммуникационных устройств

Info

Publication number: RU2010109071A
Application number: RU2010109071/07A
Authority: RU
Inventors: Клиффорд Нейл ДИДКОК (US); Клиффорд Нейл ДИДКОК; Томас У. МИЛЛЕТТ (US); Томас У. МИЛЛЕТТ
Original assignee: Майкрософт Корпорейшн (Us); Майкрософт Корпорейшн
Priority date: 2007-09-12
Filing date: 2008-08-25
Publication date: 2011-09-20
Also published as: EP2198527A4; WO2009035842A1; US20090070109A1; CN101803214A; EP2198527A1; BRPI0814418A2; KR20100065317A; JP2011504304A

Abstract

1. Способ генерирования текста, содержащий: ! генерирование речевого сигнала посредством произнесения в персональное коммуникационное устройство (105); ! передачу сгенерированного речевого сигнала; и ! прием, в ответ на передачу, текстового сообщения в персональное коммуникационное устройство (105), при этом текстовое сообщение сгенерировано транскрибированием речевого сигнала с использованием системы транскрибирования речи в текст (130), расположенной вне персонального коммуникационного устройства (105). ! 2. Способ по п.1, в котором речевой сигнал сгенерирован как результат произнесения по меньшей мере одного из адреса электронной почты, текста темы письма или по меньшей мере отрывка основной части сообщения электронной почты. ! 3. Способ по п.1, в котором: ! генерирование речевого сигнала содержит сохранение хотя бы части речевого сигнала на персональном коммуникационном устройстве; и ! передача сгенерированного речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для передачи сохраненного речевого сигнала в режиме отложенной передачи. ! 4. Способ по п.1, в котором: ! генерирование речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для запроса транскрибирования; и ! передача сгенерированного сигнала содержит: ! прием подтверждения на персональном коммуникационном устройстве; и ! передачу речевого сигнала в режиме живой передачи. ! 5. Способ по п.1, в котором передача сгенерированного речевого сигнала содержит передачу речевого сигнала в режиме передачи по частям. ! 6. Способ по п.1, в котором передача сгенерированного речевого сигнала содержи�

Claims

1. Способ генерирования текста, содержащий:

генерирование речевого сигнала посредством произнесения в персональное коммуникационное устройство (105);

передачу сгенерированного речевого сигнала; и

прием, в ответ на передачу, текстового сообщения в персональное коммуникационное устройство (105), при этом текстовое сообщение сгенерировано транскрибированием речевого сигнала с использованием системы транскрибирования речи в текст (130), расположенной вне персонального коммуникационного устройства (105).

2. Способ по п.1, в котором речевой сигнал сгенерирован как результат произнесения по меньшей мере одного из адреса электронной почты, текста темы письма или по меньшей мере отрывка основной части сообщения электронной почты.

3. Способ по п.1, в котором:

генерирование речевого сигнала содержит сохранение хотя бы части речевого сигнала на персональном коммуникационном устройстве; и

передача сгенерированного речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для передачи сохраненного речевого сигнала в режиме отложенной передачи.

4. Способ по п.1, в котором:

генерирование речевого сигнала содержит нажатие кнопки на персональном коммуникационном устройстве для запроса транскрибирования; и

передача сгенерированного сигнала содержит:

прием подтверждения на персональном коммуникационном устройстве; и

передачу речевого сигнала в режиме живой передачи.

5. Способ по п.1, в котором передача сгенерированного речевого сигнала содержит передачу речевого сигнала в режиме передачи по частям.

6. Способ по п.1, в котором передача сгенерированного речевого сигнала содержит по меньшей мере одно из:

передачи речевого сигнала в цифровом формате; или

передачи речевого сигнала как телефонного вызова.

7. Способ по п.6, в котором цифровой формат включает в себя цифровой формат протокола Интернет (IP).

8. Способ по п.1, дополнительно содержащий:

редактирование текстового сообщения; и

передачу текстового сообщения в формате электронной почты.

9. Способ по п.8, в котором редактирование текстового сообщения содержит:

замену по меньшей мере одного слова в текстовом сообщении альтернативным словом, причем замена выполняется ручным набором альтернативного слова или выбором альтернативного слова из меню альтернативных слов, предоставленного системой транскрибирования речи в текст.

10. Способ генерирования текста, содержащий:

прием на первом сервере (210) речевого сигнала, сгенерированного персональным коммуникационным устройством (105);

транскрибирование принятого речевого сигнала в текстовое сообщение с использованием системы транскрибирования речи в текст (130), расположенной на втором сервере (125); и

передачу сгенерированного текстового сообщения на персональное коммуникационное устройство (105).

11. Способ по п.10, в котором первый сервер является и вторым сервером.

12. Способ по п.10, дополнительно содержащий:

прием на первом сервере запроса на транскрибирование с персонального коммуникационного устройства; и

установку в ответ на таковой коммуникационного пакетного канала данных между первым сервером и персональным коммуникационным устройством для передачи речевого сигнала с персонального коммуникационного устройства на первый сервер в виде пакетов цифровых данных.

13. Способ по п.10, в котором использование системы транскрибирования речи в текст содержит:

генерирование списка альтернативных кандидатов для речевого распознания произнесенного слова, причем каждому альтернативному кандидату назначается уровень доверия для точности распознания.

14. Способ по п.13, дополнительно содержащий:

передачу с первого сервера на персональное коммуникационное устройство списка альтернативных кандидатов в формате выпадающего меню, связанного с транскрибированным словом.

15. Считываемый компьютером носитель, хранящий считываемые компьютером инструкции для исполнения этапов для:

коммуникативного соединения сервера (210, 125) с персональным коммуникационным устройством (105);

приема на сервере (210, 125) речевого сигнала, сгенерированного на персональном коммуникационном устройстве (105);

транскрибирования принятого речевого сигнала в текстовое сообщение с использованием системы транскрибирования речи в текст (130), расположенной на сервере (210, 125); и

передачи сгенерированного текстового сообщения на персональное коммуникационное устройство (105).

16. Считываемый компьютером носитель по п.15, в котором использование системы транскрибирования речи в текст содержит:

генерирование списка альтернативных кандидатов для речевого распознания произнесенного слова, причем каждому альтернативному кандидату назначается уровень доверия для точности распознания;

создание транскрибированного слова из произнесенного слова с использованием одного из альтернативных кандидатов с наивысшим уровнем доверия; и

прикрепление списка альтернативных кандидатов к транскрибированному слову.

17. Считываемый компьютером носитель по п.16, в котором передача сгенерированного текстового сообщения на персональное коммуникационное устройство содержит передачу транскрибированного слова на персональное коммуникационное устройство вместе со списком альтернативных кандидатов.

18. Считываемый компьютером носитель по п.17, в котором список альтернативных кандидатов прикреплен к транскрибированному слову в формате выпадающего меню.

19. Считываемый компьютером носитель по п.15, далее включающий в себя генерирование базы данных, содержащей по меньшей мере один предпочитаемый словарь или набор тренировочных слов распознавания речи.

20. Считываемый компьютером носитель по п.19, далее включающий в себя считываемые компьютером инструкции для выполнения этапов для:

редактирования сгенерированного текстового сообщения в персональном коммуникационном устройстве; и

передачи текстового сообщения с персонального коммуникационного устройства в формате электронной почты.