[go: up one dir, main page]

RU2009111270A - Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ - Google Patents

Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ Download PDF

Info

Publication number
RU2009111270A
RU2009111270A RU2009111270/09A RU2009111270A RU2009111270A RU 2009111270 A RU2009111270 A RU 2009111270A RU 2009111270/09 A RU2009111270/09 A RU 2009111270/09A RU 2009111270 A RU2009111270 A RU 2009111270A RU 2009111270 A RU2009111270 A RU 2009111270A
Authority
RU
Russia
Prior art keywords
speech
information
encoded
mixing
voice information
Prior art date
Application number
RU2009111270/09A
Other languages
English (en)
Inventor
Хиронори ИТО (JP)
Хиронори ИТО
Казунори ОДЗАВА (JP)
Казунори ОДЗАВА
Original Assignee
Нек Корпорейшн (Jp)
Нек Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нек Корпорейшн (Jp), Нек Корпорейшн filed Critical Нек Корпорейшн (Jp)
Publication of RU2009111270A publication Critical patent/RU2009111270A/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Способ смешения речи для смешения совокупности речевой информации, включающий в себя ! первый этап, на котором выбирают речевую информацию из совокупности речевой информации; ! второй этап, на котором суммируют всю выбранную речевую информацию; ! третий этап, на котором получают речевую информацию путем суммирования речевой информации, отличной от одной речевой информации, из выбранной речевой информации; ! четвертый этап, на котором кодируют упомянутую речевую информацию, полученную на втором этапе; ! пятый этап, на котором кодируют упомянутую речевую информацию, полученную на третьем этапе; и ! шестой этап, на котором копируют упомянутую кодированную информацию, полученную на четвертом этапе, в кодированную информацию, полученную на пятом этапе. ! 2. Способ смешения речи по п. 1, в котором ! на упомянутом шестом этапе кодированную информацию, хранящуюся в памяти кодера, который осуществляет кодирование на упомянутом четвертом этапе, копируют в кодер, который осуществляет кодирование на упомянутом пятом этапе. ! 3. Способ смешения речи по п. 1 или п. 2, дополнительно содержащий ! седьмой этап, на котором переключают и выдают кодированную информацию, полученную на четвертом этапе или кодированную информацию, полученную на пятом этапе, согласно результату выбора, полученному на упомянутом первом этапе. ! 4. Способ смешения речи по п. 1, в котором входную кодированную речевую информацию декодируют, и декодированную речевую информацию используют в качестве речевой информации на первом этапе. ! 5. Способ смешения речи по п. 1, в котором на упомянутом первом этапе выбирают речевую информацию согласно мощности речевог

Claims (20)

1. Способ смешения речи для смешения совокупности речевой информации, включающий в себя
первый этап, на котором выбирают речевую информацию из совокупности речевой информации;
второй этап, на котором суммируют всю выбранную речевую информацию;
третий этап, на котором получают речевую информацию путем суммирования речевой информации, отличной от одной речевой информации, из выбранной речевой информации;
четвертый этап, на котором кодируют упомянутую речевую информацию, полученную на втором этапе;
пятый этап, на котором кодируют упомянутую речевую информацию, полученную на третьем этапе; и
шестой этап, на котором копируют упомянутую кодированную информацию, полученную на четвертом этапе, в кодированную информацию, полученную на пятом этапе.
2. Способ смешения речи по п. 1, в котором
на упомянутом шестом этапе кодированную информацию, хранящуюся в памяти кодера, который осуществляет кодирование на упомянутом четвертом этапе, копируют в кодер, который осуществляет кодирование на упомянутом пятом этапе.
3. Способ смешения речи по п. 1 или п. 2, дополнительно содержащий
седьмой этап, на котором переключают и выдают кодированную информацию, полученную на четвертом этапе или кодированную информацию, полученную на пятом этапе, согласно результату выбора, полученному на упомянутом первом этапе.
4. Способ смешения речи по п. 1, в котором входную кодированную речевую информацию декодируют, и декодированную речевую информацию используют в качестве речевой информации на первом этапе.
5. Способ смешения речи по п. 1, в котором на упомянутом первом этапе выбирают речевую информацию согласно мощности речевого сигнала для упомянутой речевой информации.
6. Способ смешения речи по п. 1, в котором на упомянутом первом этапе выбирают речевую информацию согласно тому, содержат ли речевые данные упомянутой речевой информации звук или тишину.
7. Способ смешения речи по п. 1, в котором на упомянутом третьем этапе речевую информацию, полученную путем суммирования речевой информации, отличной от одной речевой информации, из упомянутой выбранной речевой информации, получают путем вычитания упомянутой выбранной речевой информации из упомянутой суммарной речевой информации одной за другой.
8. Способ смешения речи по п. 1, в котором упомянутая речевая информация является кодированными данными речевого сигнала; на упомянутом первом этапе, анализируют совокупность упомянутых кодированных данных и выбирают кодированные данные для смешения, и декодируют упомянутые выбранные кодированные данные и генерируют декодированный речевой сигнал.
9. Способ смешения речи по п. 1, в котором упомянутая речевая информация является кодированными данными речевого сигнала; на упомянутом первом этапе, анализируют упомянутые кодированные данные и декодированные речевые сигналы, полученные путем декодирования кодированных данных, и выбирают декодированные речевые сигналы для смешения.
10. Способ смешения речи по п. 8 или 9, в котором
на упомянутом втором этапе генерируют речевой сигнал путем суммирования всех декодированных речевых сигналов;
на упомянутом третьем этапе генерируют речевой сигнал путем суммирования декодированных речевых сигналов, отличных от одного декодированного речевого сигнала, из выбранных декодированных речевых сигналов;
на упомянутом четвертом этапе подвергают дифференциальному кодированию речевые сигналы, генерируемые на упомянутом втором этапе на первом кодере;
на упомянутом пятом этапе подвергают дифференциальному кодированию речевые сигналы, генерируемые на упомянутом третьем этапе на втором кодере;
на упомянутом шестом этапе делают содержимое памяти, указывающим состояние второго кодера на упомянутом пятом этапе, равным содержимому памяти, указывающим состояние первого кодера на упомянутом четвертом этапе, когда результат выбора декодированных речевых сигналов для смешения изменяется.
11. Способ смешения речи по п. 1, включающий в себя этап, на котором регулируют разность громкостей между речевыми сигналами, подлежащими смешению, таким образом, чтобы она была малой.
12. Способ смешения речи по п. 1, включающий в себя этап, на котором регулируют громкость звука смешанного речевого сигнала таким образом, чтобы она была равна наибольшей громкости речевого сигнала в речевых сигналах, подлежащих смешению или чтобы она находилась на заранее определенном уровне.
13. Сервер многоточечной конференции, который смешивает совокупность речевых сигналов, содержащий
средство выбора для выбора речевой информации из совокупности речевой информации;
средство суммирования всех сигналов для суммирования всей речевой информации, выбранной упомянутым средством выбора;
средство суммирования для получения речевой информации путем суммирования речевой информации, отличной от одной речевой информации, из упомянутой выбранной речевой информации;
первое средство кодирования для кодирования речевой информации, суммированной упомянутым средством суммирования всех сигналов;
второе средство кодирования для кодирования речевой информации, суммированной упомянутым средством суммирования; и
средство переключения для копирования кодированной информации, полученной упомянутым первым средством кодирования, в упомянутое второе средство кодирования.
14. Сервер многоточечной конференции по п. 13, в котором средство переключения копирует кодированную информацию, хранящуюся в памяти первого средства кодирования, во второе средство кодирования, согласно результату выбора, полученному средством выбора.
15. Сервер многоточечной конференции по п. 13 или п. 14, дополнительно содержащий средство переключения выходных сигналов для переключения и выдачи кодированной информации, полученной упомянутым первом средством кодирования, или кодированной информации, полученной упомянутым вторым средством кодирования согласно результату выбора упомянутого средства выбора.
16. Сервер многоточечной конференции по п. 13, содержащий средство декодирования для декодирования совокупности входной кодированной речевой информации, причем средство выбора выбирает речевую информацию из совокупности речевой информации, декодированной упомянутым средством декодирования.
17. Сервер многоточечной конференции по п. 13, в котором средство выбора выбирает речевую информацию согласно мощности речевого сигнала упомянутой речевой информации.
18. Сервер многоточечной конференции по п. 13, в котором упомянутое средство выбора выбирает речевую информацию согласно тому, содержат ли речевые данные упомянутой речевой информации звук или тишину.
19. Сервер многоточечной конференции по п. 13, в котором упомянутое средство суммирования получает речевую информацию путем суммирования речевых сигналов, отличной от одной речевой информации, из упомянутой выбранной речевой информации, путем вычитания выбранной речевой информации из речевой информации, просуммированной упомянутым средством суммирования всех сигналов одной за другой.
20. Машиночитаемый носитель, хранящий компьютерную программу для осуществления смешения речи из совокупности речевой информации, причем программа содержит инструкции, побуждающие компьютер осуществлять следующие функции:
первую функцию для выбора речевой информации из совокупности речевой информации;
вторую функцию для суммирования всей выбранной речевой информации;
третью функцию для вычитания упомянутой выбранной речевой информации из суммарной речевой информации одной за другой;
четвертую функцию для кодирования речевой информации, полученной из упомянутой второй функции;
пятую функцию для кодирования речевой информации, полученной из упомянутой третьей функции; и
шестую функцию для копирования кодированной информации, полученной из упомянутой четвертой функции, в кодированную информацию, полученную из упомянутой пятой функции.
RU2009111270/09A 2006-08-30 2007-08-28 Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ RU2009111270A (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006232919 2006-08-30
JP2006-232919 2006-08-30

Publications (1)

Publication Number Publication Date
RU2009111270A true RU2009111270A (ru) 2010-10-10

Family

ID=39136033

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009111270/09A RU2009111270A (ru) 2006-08-30 2007-08-28 Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ

Country Status (10)

Country Link
US (1) US8255206B2 (ru)
EP (1) EP2068544A4 (ru)
JP (1) JP4582238B2 (ru)
KR (1) KR101036965B1 (ru)
CN (1) CN101513030A (ru)
BR (1) BRPI0714736A2 (ru)
CA (1) CA2660007A1 (ru)
MX (1) MX2009002093A (ru)
RU (1) RU2009111270A (ru)
WO (1) WO2008026754A1 (ru)

Families Citing this family (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
JP2010166425A (ja) * 2009-01-16 2010-07-29 Nec Corp 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法
JP2010166424A (ja) * 2009-01-16 2010-07-29 Nec Corp 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法
WO2010090019A1 (ja) * 2009-02-04 2010-08-12 パナソニック株式会社 結合装置、遠隔通信システム及び結合方法
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9025497B2 (en) * 2009-07-10 2015-05-05 Qualcomm Incorporated Media forwarding for a group communication session in a wireless communications system
US9088630B2 (en) * 2009-07-13 2015-07-21 Qualcomm Incorporated Selectively mixing media during a group communication session within a wireless communications system
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8873774B2 (en) * 2010-07-30 2014-10-28 Hewlett-Packard Development Company, L.P. Audio mixer
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8924206B2 (en) * 2011-11-04 2014-12-30 Htc Corporation Electrical apparatus and voice signals receiving method thereof
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
BR112015018905B1 (pt) 2013-02-07 2022-02-22 Apple Inc Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
CN103327014B (zh) * 2013-06-06 2015-08-19 腾讯科技(深圳)有限公司 一种语音处理方法、装置及系统
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
AU2014278592B2 (en) 2013-06-09 2017-09-07 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US20150092615A1 (en) * 2013-10-02 2015-04-02 David Paul Frankel Teleconference system with overlay aufio method associate thereto
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
JP6224850B2 (ja) 2014-02-28 2017-11-01 ドルビー ラボラトリーズ ライセンシング コーポレイション 会議における変化盲を使った知覚的連続性
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) * 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
JP5802956B1 (ja) * 2015-03-16 2015-11-04 株式会社アクセル 音声合成装置、音声合成方法
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
ES2967185T3 (es) 2019-04-03 2024-04-29 Dolby Laboratories Licensing Corp Servidor multimedia de escena de voz escalable
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. User activity shortcut suggestions
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4456789A (en) * 1978-03-07 1984-06-26 The Post Office Audio teleconferencing
US5150410A (en) * 1991-04-11 1992-09-22 Itt Corporation Secure digital conferencing system
JPH0685932A (ja) 1992-09-07 1994-03-25 Tech Res & Dev Inst Of Japan Def Agency 音声ブリッジ装置
JPH06169349A (ja) 1992-11-30 1994-06-14 Hitachi Ltd N−1加算方式
JP3300471B2 (ja) 1993-06-08 2002-07-08 三菱電機株式会社 通信制御装置
JPH1075310A (ja) * 1996-08-29 1998-03-17 Nec Corp 多地点テレビ会議システム
US6125343A (en) * 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6697476B1 (en) * 1999-03-22 2004-02-24 Octave Communications, Inc. Audio conference platform system and method for broadcasting a real-time audio conference over the internet
GB9915312D0 (en) * 1999-06-30 1999-09-01 Nortel Networks Corp Conference circuit for encoded digital audio
US6940826B1 (en) * 1999-12-30 2005-09-06 Nortel Networks Limited Apparatus and method for packet-based media communications
US6683858B1 (en) * 2000-06-28 2004-01-27 Paltalk Holdings, Inc. Hybrid server architecture for mixing and non-mixing client conferencing
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US6804340B2 (en) * 2001-05-03 2004-10-12 Raytheon Company Teleconferencing system
US20030223562A1 (en) * 2002-05-29 2003-12-04 Chenglin Cui Facilitating conference calls by dynamically determining information streams to be received by a mixing unit
US20040190701A1 (en) * 2003-03-28 2004-09-30 Versatel Networks Inc. Apparatus and method for a distributed conference bridge
JP2005151044A (ja) 2003-11-13 2005-06-09 Japan Science & Technology Agency 音声ミキシング方法、音声ミキシングシステム及び音声ミキシングのためのプログラム
JP4033840B2 (ja) 2004-02-12 2008-01-16 日本電信電話株式会社 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体
JP2006232919A (ja) 2005-02-23 2006-09-07 Fuji Photo Film Co Ltd コアシェル粒子の製造方法
US7599834B2 (en) * 2005-11-29 2009-10-06 Dilithium Netowkrs, Inc. Method and apparatus of voice mixing for conferencing amongst diverse networks
ES2396072T3 (es) * 2006-07-07 2013-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para combinar múltiples fuentes de audio paramétricamente codificadas
CN101502089B (zh) * 2006-07-28 2013-07-03 西门子企业通讯有限责任两合公司 进行音频会议的方法、音频会议装置和编码器之间的切换方法
US8515039B2 (en) * 2006-07-28 2013-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Method for carrying out a voice conference and voice conference system

Also Published As

Publication number Publication date
MX2009002093A (es) 2009-03-10
US20090248402A1 (en) 2009-10-01
CA2660007A1 (en) 2008-03-06
WO2008026754A1 (fr) 2008-03-06
BRPI0714736A2 (pt) 2013-05-07
JP4582238B2 (ja) 2010-11-17
KR20090035728A (ko) 2009-04-10
KR101036965B1 (ko) 2011-05-25
CN101513030A (zh) 2009-08-19
EP2068544A1 (en) 2009-06-10
JPWO2008026754A1 (ja) 2010-01-21
US8255206B2 (en) 2012-08-28
EP2068544A4 (en) 2010-09-22

Similar Documents

Publication Publication Date Title
RU2009111270A (ru) Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ
KR101227932B1 (ko) 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
ATE499677T1 (de) Kodierung und dekodierung von audio-objekten
TWI566234B (zh) 使用殘餘訊號式調整去相關訊號之貢獻的多聲道音頻解碼器、多聲道音頻編碼器、方法及電腦程式
US9489962B2 (en) Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method
US8060363B2 (en) Audio signal encoding
RU2011100135A (ru) Эффективное использование поэтапно передаваемой информации в аудиокодировании и декодировании
RU2450440C1 (ru) Способ и устройство для обработки аудиосигнала
JP5735671B2 (ja) オーディオ信号のデコーディング方法及びその装置
NO20070560L (no) Multikanalsynthesiser og fremgangsmate for a generere et flerkanalsutgangssignal.
KR20090082927A (ko) 오디오 신호의 디코딩 방법 및 그 장치
RU2014122111A (ru) Кодирование и декодирование аудиообъектов
KR101414412B1 (ko) 오디오 신호의 인코딩 장치, 오디오 신호의 디코딩 장치, 오디오 신호의 인코딩 방법, 스케일러블 인코딩 오디오 신호의 디코딩 방법, 인코더, 디코더, 전자기기 및 컴퓨터 판독가능한 기록 매체
JP6165151B2 (ja) 改善された階層符号化
RU2009122690A (ru) Устройство объединения потоков, модуль и способ декодирования
ATE539431T1 (de) Kodierung von tonsignalen mit hall
KR20220042166A (ko) Ivas 비트스트림들의 인코딩 및 디코딩
KR20150028147A (ko) 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치
US8484039B2 (en) Apparatus for efficiently mixing narrowband and wideband voice data and a method therefor
RU2015135593A (ru) Устройство и способ для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов
CN115250367A (zh) 用于混合多媒体文件的方法及装置
JP2013003330A (ja) ステレオ信号符号化方法、ステレオ信号符号化装置、プログラム
CN116032566A (zh) 一种隐私协议的语音播报方法、装置和终端设备
KR20080060457A (ko) Tts기능을 갖는 휴대용 멀티미디어 단말기
JP2016146526A (ja) 通話装置、通話システムおよび通話方法

Legal Events

Date Code Title Description
FA93 Acknowledgement of application withdrawn (no request for examination)

Effective date: 20110620