RU2009111270A

RU2009111270A - Способ смешения речи и сервер многоточечной конференции и программа, использующая этот способ

Info

Publication number: RU2009111270A
Application number: RU2009111270/09A
Authority: RU
Inventors: Хиронори ИТО (JP); Хиронори ИТО; Казунори ОДЗАВА (JP); Казунори ОДЗАВА
Original assignee: Нек Корпорейшн (Jp); Нек Корпорейшн
Priority date: 2006-08-30
Filing date: 2007-08-28
Publication date: 2010-10-10
Also published as: MX2009002093A; US20090248402A1; CA2660007A1; WO2008026754A1; BRPI0714736A2; JP4582238B2; KR20090035728A; KR101036965B1; CN101513030A; EP2068544A1; JPWO2008026754A1; US8255206B2; EP2068544A4

Abstract

1. Способ смешения речи для смешения совокупности речевой информации, включающий в себя ! первый этап, на котором выбирают речевую информацию из совокупности речевой информации; ! второй этап, на котором суммируют всю выбранную речевую информацию; ! третий этап, на котором получают речевую информацию путем суммирования речевой информации, отличной от одной речевой информации, из выбранной речевой информации; ! четвертый этап, на котором кодируют упомянутую речевую информацию, полученную на втором этапе; ! пятый этап, на котором кодируют упомянутую речевую информацию, полученную на третьем этапе; и ! шестой этап, на котором копируют упомянутую кодированную информацию, полученную на четвертом этапе, в кодированную информацию, полученную на пятом этапе. ! 2. Способ смешения речи по п. 1, в котором ! на упомянутом шестом этапе кодированную информацию, хранящуюся в памяти кодера, который осуществляет кодирование на упомянутом четвертом этапе, копируют в кодер, который осуществляет кодирование на упомянутом пятом этапе. ! 3. Способ смешения речи по п. 1 или п. 2, дополнительно содержащий ! седьмой этап, на котором переключают и выдают кодированную информацию, полученную на четвертом этапе или кодированную информацию, полученную на пятом этапе, согласно результату выбора, полученному на упомянутом первом этапе. ! 4. Способ смешения речи по п. 1, в котором входную кодированную речевую информацию декодируют, и декодированную речевую информацию используют в качестве речевой информации на первом этапе. ! 5. Способ смешения речи по п. 1, в котором на упомянутом первом этапе выбирают речевую информацию согласно мощности речевог

Claims

1. Способ смешения речи для смешения совокупности речевой информации, включающий в себя

первый этап, на котором выбирают речевую информацию из совокупности речевой информации;

второй этап, на котором суммируют всю выбранную речевую информацию;

третий этап, на котором получают речевую информацию путем суммирования речевой информации, отличной от одной речевой информации, из выбранной речевой информации;

четвертый этап, на котором кодируют упомянутую речевую информацию, полученную на втором этапе;

пятый этап, на котором кодируют упомянутую речевую информацию, полученную на третьем этапе; и

шестой этап, на котором копируют упомянутую кодированную информацию, полученную на четвертом этапе, в кодированную информацию, полученную на пятом этапе.

2. Способ смешения речи по п. 1, в котором

на упомянутом шестом этапе кодированную информацию, хранящуюся в памяти кодера, который осуществляет кодирование на упомянутом четвертом этапе, копируют в кодер, который осуществляет кодирование на упомянутом пятом этапе.

3. Способ смешения речи по п. 1 или п. 2, дополнительно содержащий

седьмой этап, на котором переключают и выдают кодированную информацию, полученную на четвертом этапе или кодированную информацию, полученную на пятом этапе, согласно результату выбора, полученному на упомянутом первом этапе.

4. Способ смешения речи по п. 1, в котором входную кодированную речевую информацию декодируют, и декодированную речевую информацию используют в качестве речевой информации на первом этапе.

5. Способ смешения речи по п. 1, в котором на упомянутом первом этапе выбирают речевую информацию согласно мощности речевого сигнала для упомянутой речевой информации.

6. Способ смешения речи по п. 1, в котором на упомянутом первом этапе выбирают речевую информацию согласно тому, содержат ли речевые данные упомянутой речевой информации звук или тишину.

7. Способ смешения речи по п. 1, в котором на упомянутом третьем этапе речевую информацию, полученную путем суммирования речевой информации, отличной от одной речевой информации, из упомянутой выбранной речевой информации, получают путем вычитания упомянутой выбранной речевой информации из упомянутой суммарной речевой информации одной за другой.

8. Способ смешения речи по п. 1, в котором упомянутая речевая информация является кодированными данными речевого сигнала; на упомянутом первом этапе, анализируют совокупность упомянутых кодированных данных и выбирают кодированные данные для смешения, и декодируют упомянутые выбранные кодированные данные и генерируют декодированный речевой сигнал.

9. Способ смешения речи по п. 1, в котором упомянутая речевая информация является кодированными данными речевого сигнала; на упомянутом первом этапе, анализируют упомянутые кодированные данные и декодированные речевые сигналы, полученные путем декодирования кодированных данных, и выбирают декодированные речевые сигналы для смешения.

10. Способ смешения речи по п. 8 или 9, в котором

на упомянутом втором этапе генерируют речевой сигнал путем суммирования всех декодированных речевых сигналов;

на упомянутом третьем этапе генерируют речевой сигнал путем суммирования декодированных речевых сигналов, отличных от одного декодированного речевого сигнала, из выбранных декодированных речевых сигналов;

на упомянутом четвертом этапе подвергают дифференциальному кодированию речевые сигналы, генерируемые на упомянутом втором этапе на первом кодере;

на упомянутом пятом этапе подвергают дифференциальному кодированию речевые сигналы, генерируемые на упомянутом третьем этапе на втором кодере;

на упомянутом шестом этапе делают содержимое памяти, указывающим состояние второго кодера на упомянутом пятом этапе, равным содержимому памяти, указывающим состояние первого кодера на упомянутом четвертом этапе, когда результат выбора декодированных речевых сигналов для смешения изменяется.

11. Способ смешения речи по п. 1, включающий в себя этап, на котором регулируют разность громкостей между речевыми сигналами, подлежащими смешению, таким образом, чтобы она была малой.

12. Способ смешения речи по п. 1, включающий в себя этап, на котором регулируют громкость звука смешанного речевого сигнала таким образом, чтобы она была равна наибольшей громкости речевого сигнала в речевых сигналах, подлежащих смешению или чтобы она находилась на заранее определенном уровне.

13. Сервер многоточечной конференции, который смешивает совокупность речевых сигналов, содержащий

средство выбора для выбора речевой информации из совокупности речевой информации;

средство суммирования всех сигналов для суммирования всей речевой информации, выбранной упомянутым средством выбора;

средство суммирования для получения речевой информации путем суммирования речевой информации, отличной от одной речевой информации, из упомянутой выбранной речевой информации;

первое средство кодирования для кодирования речевой информации, суммированной упомянутым средством суммирования всех сигналов;

второе средство кодирования для кодирования речевой информации, суммированной упомянутым средством суммирования; и

средство переключения для копирования кодированной информации, полученной упомянутым первым средством кодирования, в упомянутое второе средство кодирования.

14. Сервер многоточечной конференции по п. 13, в котором средство переключения копирует кодированную информацию, хранящуюся в памяти первого средства кодирования, во второе средство кодирования, согласно результату выбора, полученному средством выбора.

15. Сервер многоточечной конференции по п. 13 или п. 14, дополнительно содержащий средство переключения выходных сигналов для переключения и выдачи кодированной информации, полученной упомянутым первом средством кодирования, или кодированной информации, полученной упомянутым вторым средством кодирования согласно результату выбора упомянутого средства выбора.

16. Сервер многоточечной конференции по п. 13, содержащий средство декодирования для декодирования совокупности входной кодированной речевой информации, причем средство выбора выбирает речевую информацию из совокупности речевой информации, декодированной упомянутым средством декодирования.

17. Сервер многоточечной конференции по п. 13, в котором средство выбора выбирает речевую информацию согласно мощности речевого сигнала упомянутой речевой информации.

18. Сервер многоточечной конференции по п. 13, в котором упомянутое средство выбора выбирает речевую информацию согласно тому, содержат ли речевые данные упомянутой речевой информации звук или тишину.

19. Сервер многоточечной конференции по п. 13, в котором упомянутое средство суммирования получает речевую информацию путем суммирования речевых сигналов, отличной от одной речевой информации, из упомянутой выбранной речевой информации, путем вычитания выбранной речевой информации из речевой информации, просуммированной упомянутым средством суммирования всех сигналов одной за другой.

20. Машиночитаемый носитель, хранящий компьютерную программу для осуществления смешения речи из совокупности речевой информации, причем программа содержит инструкции, побуждающие компьютер осуществлять следующие функции:

первую функцию для выбора речевой информации из совокупности речевой информации;

вторую функцию для суммирования всей выбранной речевой информации;

третью функцию для вычитания упомянутой выбранной речевой информации из суммарной речевой информации одной за другой;

четвертую функцию для кодирования речевой информации, полученной из упомянутой второй функции;

пятую функцию для кодирования речевой информации, полученной из упомянутой третьей функции; и

шестую функцию для копирования кодированной информации, полученной из упомянутой четвертой функции, в кодированную информацию, полученную из упомянутой пятой функции.