RU2009111270A - Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ - Google Patents
Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ Download PDFInfo
- Publication number
- RU2009111270A RU2009111270A RU2009111270/09A RU2009111270A RU2009111270A RU 2009111270 A RU2009111270 A RU 2009111270A RU 2009111270/09 A RU2009111270/09 A RU 2009111270/09A RU 2009111270 A RU2009111270 A RU 2009111270A RU 2009111270 A RU2009111270 A RU 2009111270A
- Authority
- RU
- Russia
- Prior art keywords
- speech
- information
- encoded
- mixing
- voice information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 19
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 230000006870 function Effects 0.000 claims 11
- 238000004590 computer program Methods 0.000 claims 1
- 230000001105 regulatory effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Telephonic Communication Services (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. Способ смешения речи для смешения совокупности речевой информации, включающий в себя ! первый этап, на котором выбирают речевую информацию из совокупности речевой информации; ! второй этап, на котором суммируют всю выбранную речевую информацию; ! третий этап, на котором получают речевую информацию путем суммирования речевой информации, отличной от одной речевой информации, из выбранной речевой информации; ! четвертый этап, на котором кодируют упомянутую речевую информацию, полученную на втором этапе; ! пятый этап, на котором кодируют упомянутую речевую информацию, полученную на третьем этапе; и ! шестой этап, на котором копируют упомянутую кодированную информацию, полученную на четвертом этапе, в кодированную информацию, полученную на пятом этапе. ! 2. Способ смешения речи по п. 1, в котором ! на упомянутом шестом этапе кодированную информацию, хранящуюся в памяти кодера, который осуществляет кодирование на упомянутом четвертом этапе, копируют в кодер, который осуществляет кодирование на упомянутом пятом этапе. ! 3. Способ смешения речи по п. 1 или п. 2, дополнительно содержащий ! седьмой этап, на котором переключают и выдают кодированную информацию, полученную на четвертом этапе или кодированную информацию, полученную на пятом этапе, согласно результату выбора, полученному на упомянутом первом этапе. ! 4. Способ смешения речи по п. 1, в котором входную кодированную речевую информацию декодируют, и декодированную речевую информацию используют в качестве речевой информации на первом этапе. ! 5. Способ смешения речи по п. 1, в котором на упомянутом первом этапе выбирают речевую информацию согласно мощности речевог
Claims (20)
1. Способ смешения речи для смешения совокупности речевой информации, включающий в себя
первый этап, на котором выбирают речевую информацию из совокупности речевой информации;
второй этап, на котором суммируют всю выбранную речевую информацию;
третий этап, на котором получают речевую информацию путем суммирования речевой информации, отличной от одной речевой информации, из выбранной речевой информации;
четвертый этап, на котором кодируют упомянутую речевую информацию, полученную на втором этапе;
пятый этап, на котором кодируют упомянутую речевую информацию, полученную на третьем этапе; и
шестой этап, на котором копируют упомянутую кодированную информацию, полученную на четвертом этапе, в кодированную информацию, полученную на пятом этапе.
2. Способ смешения речи по п. 1, в котором
на упомянутом шестом этапе кодированную информацию, хранящуюся в памяти кодера, который осуществляет кодирование на упомянутом четвертом этапе, копируют в кодер, который осуществляет кодирование на упомянутом пятом этапе.
3. Способ смешения речи по п. 1 или п. 2, дополнительно содержащий
седьмой этап, на котором переключают и выдают кодированную информацию, полученную на четвертом этапе или кодированную информацию, полученную на пятом этапе, согласно результату выбора, полученному на упомянутом первом этапе.
4. Способ смешения речи по п. 1, в котором входную кодированную речевую информацию декодируют, и декодированную речевую информацию используют в качестве речевой информации на первом этапе.
5. Способ смешения речи по п. 1, в котором на упомянутом первом этапе выбирают речевую информацию согласно мощности речевого сигнала для упомянутой речевой информации.
6. Способ смешения речи по п. 1, в котором на упомянутом первом этапе выбирают речевую информацию согласно тому, содержат ли речевые данные упомянутой речевой информации звук или тишину.
7. Способ смешения речи по п. 1, в котором на упомянутом третьем этапе речевую информацию, полученную путем суммирования речевой информации, отличной от одной речевой информации, из упомянутой выбранной речевой информации, получают путем вычитания упомянутой выбранной речевой информации из упомянутой суммарной речевой информации одной за другой.
8. Способ смешения речи по п. 1, в котором упомянутая речевая информация является кодированными данными речевого сигнала; на упомянутом первом этапе, анализируют совокупность упомянутых кодированных данных и выбирают кодированные данные для смешения, и декодируют упомянутые выбранные кодированные данные и генерируют декодированный речевой сигнал.
9. Способ смешения речи по п. 1, в котором упомянутая речевая информация является кодированными данными речевого сигнала; на упомянутом первом этапе, анализируют упомянутые кодированные данные и декодированные речевые сигналы, полученные путем декодирования кодированных данных, и выбирают декодированные речевые сигналы для смешения.
10. Способ смешения речи по п. 8 или 9, в котором
на упомянутом втором этапе генерируют речевой сигнал путем суммирования всех декодированных речевых сигналов;
на упомянутом третьем этапе генерируют речевой сигнал путем суммирования декодированных речевых сигналов, отличных от одного декодированного речевого сигнала, из выбранных декодированных речевых сигналов;
на упомянутом четвертом этапе подвергают дифференциальному кодированию речевые сигналы, генерируемые на упомянутом втором этапе на первом кодере;
на упомянутом пятом этапе подвергают дифференциальному кодированию речевые сигналы, генерируемые на упомянутом третьем этапе на втором кодере;
на упомянутом шестом этапе делают содержимое памяти, указывающим состояние второго кодера на упомянутом пятом этапе, равным содержимому памяти, указывающим состояние первого кодера на упомянутом четвертом этапе, когда результат выбора декодированных речевых сигналов для смешения изменяется.
11. Способ смешения речи по п. 1, включающий в себя этап, на котором регулируют разность громкостей между речевыми сигналами, подлежащими смешению, таким образом, чтобы она была малой.
12. Способ смешения речи по п. 1, включающий в себя этап, на котором регулируют громкость звука смешанного речевого сигнала таким образом, чтобы она была равна наибольшей громкости речевого сигнала в речевых сигналах, подлежащих смешению или чтобы она находилась на заранее определенном уровне.
13. Сервер многоточечной конференции, который смешивает совокупность речевых сигналов, содержащий
средство выбора для выбора речевой информации из совокупности речевой информации;
средство суммирования всех сигналов для суммирования всей речевой информации, выбранной упомянутым средством выбора;
средство суммирования для получения речевой информации путем суммирования речевой информации, отличной от одной речевой информации, из упомянутой выбранной речевой информации;
первое средство кодирования для кодирования речевой информации, суммированной упомянутым средством суммирования всех сигналов;
второе средство кодирования для кодирования речевой информации, суммированной упомянутым средством суммирования; и
средство переключения для копирования кодированной информации, полученной упомянутым первым средством кодирования, в упомянутое второе средство кодирования.
14. Сервер многоточечной конференции по п. 13, в котором средство переключения копирует кодированную информацию, хранящуюся в памяти первого средства кодирования, во второе средство кодирования, согласно результату выбора, полученному средством выбора.
15. Сервер многоточечной конференции по п. 13 или п. 14, дополнительно содержащий средство переключения выходных сигналов для переключения и выдачи кодированной информации, полученной упомянутым первом средством кодирования, или кодированной информации, полученной упомянутым вторым средством кодирования согласно результату выбора упомянутого средства выбора.
16. Сервер многоточечной конференции по п. 13, содержащий средство декодирования для декодирования совокупности входной кодированной речевой информации, причем средство выбора выбирает речевую информацию из совокупности речевой информации, декодированной упомянутым средством декодирования.
17. Сервер многоточечной конференции по п. 13, в котором средство выбора выбирает речевую информацию согласно мощности речевого сигнала упомянутой речевой информации.
18. Сервер многоточечной конференции по п. 13, в котором упомянутое средство выбора выбирает речевую информацию согласно тому, содержат ли речевые данные упомянутой речевой информации звук или тишину.
19. Сервер многоточечной конференции по п. 13, в котором упомянутое средство суммирования получает речевую информацию путем суммирования речевых сигналов, отличной от одной речевой информации, из упомянутой выбранной речевой информации, путем вычитания выбранной речевой информации из речевой информации, просуммированной упомянутым средством суммирования всех сигналов одной за другой.
20. Машиночитаемый носитель, хранящий компьютерную программу для осуществления смешения речи из совокупности речевой информации, причем программа содержит инструкции, побуждающие компьютер осуществлять следующие функции:
первую функцию для выбора речевой информации из совокупности речевой информации;
вторую функцию для суммирования всей выбранной речевой информации;
третью функцию для вычитания упомянутой выбранной речевой информации из суммарной речевой информации одной за другой;
четвертую функцию для кодирования речевой информации, полученной из упомянутой второй функции;
пятую функцию для кодирования речевой информации, полученной из упомянутой третьей функции; и
шестую функцию для копирования кодированной информации, полученной из упомянутой четвертой функции, в кодированную информацию, полученную из упомянутой пятой функции.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006232919 | 2006-08-30 | ||
| JP2006-232919 | 2006-08-30 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2009111270A true RU2009111270A (ru) | 2010-10-10 |
Family
ID=39136033
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2009111270/09A RU2009111270A (ru) | 2006-08-30 | 2007-08-28 | Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ |
Country Status (10)
| Country | Link |
|---|---|
| US (1) | US8255206B2 (ru) |
| EP (1) | EP2068544A4 (ru) |
| JP (1) | JP4582238B2 (ru) |
| KR (1) | KR101036965B1 (ru) |
| CN (1) | CN101513030A (ru) |
| BR (1) | BRPI0714736A2 (ru) |
| CA (1) | CA2660007A1 (ru) |
| MX (1) | MX2009002093A (ru) |
| RU (1) | RU2009111270A (ru) |
| WO (1) | WO2008026754A1 (ru) |
Families Citing this family (123)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
| US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
| US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
| US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
| US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
| US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
| US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
| JP2010166425A (ja) * | 2009-01-16 | 2010-07-29 | Nec Corp | 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法 |
| JP2010166424A (ja) * | 2009-01-16 | 2010-07-29 | Nec Corp | 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法 |
| WO2010090019A1 (ja) * | 2009-02-04 | 2010-08-12 | パナソニック株式会社 | 結合装置、遠隔通信システム及び結合方法 |
| US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
| US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
| US9025497B2 (en) * | 2009-07-10 | 2015-05-05 | Qualcomm Incorporated | Media forwarding for a group communication session in a wireless communications system |
| US9088630B2 (en) * | 2009-07-13 | 2015-07-21 | Qualcomm Incorporated | Selectively mixing media during a group communication session within a wireless communications system |
| US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
| US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
| US8873774B2 (en) * | 2010-07-30 | 2014-10-28 | Hewlett-Packard Development Company, L.P. | Audio mixer |
| US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
| US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
| US8924206B2 (en) * | 2011-11-04 | 2014-12-30 | Htc Corporation | Electrical apparatus and voice signals receiving method thereof |
| US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
| US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
| US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
| US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
| BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
| CN103327014B (zh) * | 2013-06-06 | 2015-08-19 | 腾讯科技(深圳)有限公司 | 一种语音处理方法、装置及系统 |
| WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
| WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
| AU2014278592B2 (en) | 2013-06-09 | 2017-09-07 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
| US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
| US20150092615A1 (en) * | 2013-10-02 | 2015-04-02 | David Paul Frankel | Teleconference system with overlay aufio method associate thereto |
| US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
| JP6224850B2 (ja) | 2014-02-28 | 2017-11-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 会議における変化盲を使った知覚的連続性 |
| US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
| EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
| US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| US10446141B2 (en) * | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
| US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
| US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
| US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
| US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
| US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
| US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
| US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
| JP5802956B1 (ja) * | 2015-03-16 | 2015-11-04 | 株式会社アクセル | 音声合成装置、音声合成方法 |
| US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
| US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
| US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
| US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
| US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
| US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
| US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
| US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
| US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
| US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
| DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
| US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
| US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
| DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
| DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
| DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
| US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
| US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
| US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
| US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
| US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
| US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
| DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
| DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
| US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
| US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
| US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
| DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
| DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
| DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
| DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
| DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
| US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
| US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
| US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
| DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
| US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
| US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
| US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
| US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
| US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
| US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
| US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
| US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
| US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
| US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
| US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
| US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
| US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
| DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
| DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
| US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
| DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
| US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
| US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
| US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
| US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
| US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
| US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
| US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
| US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
| US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
| ES2967185T3 (es) | 2019-04-03 | 2024-04-29 | Dolby Laboratories Licensing Corp | Servidor multimedia de escena de voz escalable |
| US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
| US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
| US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
| DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
| US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
| US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
| US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
| DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | User activity shortcut suggestions |
| US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
| WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
Family Cites Families (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4456789A (en) * | 1978-03-07 | 1984-06-26 | The Post Office | Audio teleconferencing |
| US5150410A (en) * | 1991-04-11 | 1992-09-22 | Itt Corporation | Secure digital conferencing system |
| JPH0685932A (ja) | 1992-09-07 | 1994-03-25 | Tech Res & Dev Inst Of Japan Def Agency | 音声ブリッジ装置 |
| JPH06169349A (ja) | 1992-11-30 | 1994-06-14 | Hitachi Ltd | N−1加算方式 |
| JP3300471B2 (ja) | 1993-06-08 | 2002-07-08 | 三菱電機株式会社 | 通信制御装置 |
| JPH1075310A (ja) * | 1996-08-29 | 1998-03-17 | Nec Corp | 多地点テレビ会議システム |
| US6125343A (en) * | 1997-05-29 | 2000-09-26 | 3Com Corporation | System and method for selecting a loudest speaker by comparing average frame gains |
| US6697476B1 (en) * | 1999-03-22 | 2004-02-24 | Octave Communications, Inc. | Audio conference platform system and method for broadcasting a real-time audio conference over the internet |
| GB9915312D0 (en) * | 1999-06-30 | 1999-09-01 | Nortel Networks Corp | Conference circuit for encoded digital audio |
| US6940826B1 (en) * | 1999-12-30 | 2005-09-06 | Nortel Networks Limited | Apparatus and method for packet-based media communications |
| US6683858B1 (en) * | 2000-06-28 | 2004-01-27 | Paltalk Holdings, Inc. | Hybrid server architecture for mixing and non-mixing client conferencing |
| US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
| US6804340B2 (en) * | 2001-05-03 | 2004-10-12 | Raytheon Company | Teleconferencing system |
| US20030223562A1 (en) * | 2002-05-29 | 2003-12-04 | Chenglin Cui | Facilitating conference calls by dynamically determining information streams to be received by a mixing unit |
| US20040190701A1 (en) * | 2003-03-28 | 2004-09-30 | Versatel Networks Inc. | Apparatus and method for a distributed conference bridge |
| JP2005151044A (ja) | 2003-11-13 | 2005-06-09 | Japan Science & Technology Agency | 音声ミキシング方法、音声ミキシングシステム及び音声ミキシングのためのプログラム |
| JP4033840B2 (ja) | 2004-02-12 | 2008-01-16 | 日本電信電話株式会社 | 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体 |
| JP2006232919A (ja) | 2005-02-23 | 2006-09-07 | Fuji Photo Film Co Ltd | コアシェル粒子の製造方法 |
| US7599834B2 (en) * | 2005-11-29 | 2009-10-06 | Dilithium Netowkrs, Inc. | Method and apparatus of voice mixing for conferencing amongst diverse networks |
| ES2396072T3 (es) * | 2006-07-07 | 2013-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato para combinar múltiples fuentes de audio paramétricamente codificadas |
| CN101502089B (zh) * | 2006-07-28 | 2013-07-03 | 西门子企业通讯有限责任两合公司 | 进行音频会议的方法、音频会议装置和编码器之间的切换方法 |
| US8515039B2 (en) * | 2006-07-28 | 2013-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Method for carrying out a voice conference and voice conference system |
-
2007
- 2007-08-28 RU RU2009111270/09A patent/RU2009111270A/ru not_active Application Discontinuation
- 2007-08-28 CN CNA2007800325552A patent/CN101513030A/zh active Pending
- 2007-08-28 JP JP2008532145A patent/JP4582238B2/ja not_active Expired - Fee Related
- 2007-08-28 MX MX2009002093A patent/MX2009002093A/es not_active Application Discontinuation
- 2007-08-28 BR BRPI0714736-8A patent/BRPI0714736A2/pt not_active Application Discontinuation
- 2007-08-28 EP EP07806574A patent/EP2068544A4/en not_active Withdrawn
- 2007-08-28 CA CA002660007A patent/CA2660007A1/en not_active Abandoned
- 2007-08-28 WO PCT/JP2007/067101 patent/WO2008026754A1/ja not_active Ceased
- 2007-08-28 US US12/438,659 patent/US8255206B2/en not_active Expired - Fee Related
- 2007-08-28 KR KR1020097004325A patent/KR101036965B1/ko not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| MX2009002093A (es) | 2009-03-10 |
| US20090248402A1 (en) | 2009-10-01 |
| CA2660007A1 (en) | 2008-03-06 |
| WO2008026754A1 (fr) | 2008-03-06 |
| BRPI0714736A2 (pt) | 2013-05-07 |
| JP4582238B2 (ja) | 2010-11-17 |
| KR20090035728A (ko) | 2009-04-10 |
| KR101036965B1 (ko) | 2011-05-25 |
| CN101513030A (zh) | 2009-08-19 |
| EP2068544A1 (en) | 2009-06-10 |
| JPWO2008026754A1 (ja) | 2010-01-21 |
| US8255206B2 (en) | 2012-08-28 |
| EP2068544A4 (en) | 2010-09-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2009111270A (ru) | Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ | |
| KR101227932B1 (ko) | 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법 | |
| ATE499677T1 (de) | Kodierung und dekodierung von audio-objekten | |
| TWI566234B (zh) | 使用殘餘訊號式調整去相關訊號之貢獻的多聲道音頻解碼器、多聲道音頻編碼器、方法及電腦程式 | |
| US9489962B2 (en) | Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method | |
| US8060363B2 (en) | Audio signal encoding | |
| RU2011100135A (ru) | Эффективное использование поэтапно передаваемой информации в аудиокодировании и декодировании | |
| RU2450440C1 (ru) | Способ и устройство для обработки аудиосигнала | |
| JP5735671B2 (ja) | オーディオ信号のデコーディング方法及びその装置 | |
| NO20070560L (no) | Multikanalsynthesiser og fremgangsmate for a generere et flerkanalsutgangssignal. | |
| KR20090082927A (ko) | 오디오 신호의 디코딩 방법 및 그 장치 | |
| RU2014122111A (ru) | Кодирование и декодирование аудиообъектов | |
| KR101414412B1 (ko) | 오디오 신호의 인코딩 장치, 오디오 신호의 디코딩 장치, 오디오 신호의 인코딩 방법, 스케일러블 인코딩 오디오 신호의 디코딩 방법, 인코더, 디코더, 전자기기 및 컴퓨터 판독가능한 기록 매체 | |
| JP6165151B2 (ja) | 改善された階層符号化 | |
| RU2009122690A (ru) | Устройство объединения потоков, модуль и способ декодирования | |
| ATE539431T1 (de) | Kodierung von tonsignalen mit hall | |
| KR20220042166A (ko) | Ivas 비트스트림들의 인코딩 및 디코딩 | |
| KR20150028147A (ko) | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치 | |
| US8484039B2 (en) | Apparatus for efficiently mixing narrowband and wideband voice data and a method therefor | |
| RU2015135593A (ru) | Устройство и способ для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов | |
| CN115250367A (zh) | 用于混合多媒体文件的方法及装置 | |
| JP2013003330A (ja) | ステレオ信号符号化方法、ステレオ信号符号化装置、プログラム | |
| CN116032566A (zh) | 一种隐私协议的语音播报方法、装置和终端设备 | |
| KR20080060457A (ko) | Tts기능을 갖는 휴대용 멀티미디어 단말기 | |
| JP2016146526A (ja) | 通話装置、通話システムおよび通話方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FA93 | Acknowledgement of application withdrawn (no request for examination) |
Effective date: 20110620 |