RU2017120175A

RU2017120175A - Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных

Info

Publication number: RU2017120175A
Application number: RU2017120175A
Authority: RU
Inventors: Роберт БЛЕЙДТ; Тобиас БЛИМ; Штефан КРЕГЕЛО
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2014-11-12
Filing date: 2015-11-06
Publication date: 2018-12-13
Also published as: US11218740B2; JP2019193268A; BR112017009734A2; AU2015345248A1; EP3219105A1; MY186808A; JP6530070B2; TW201622368A; CN107211164A; KR20170084231A; CA2967519A1; CN107211164B; RU2017120175A3; KR102151707B1; US20190373294A1; RU2679379C2; US20180007398A1; WO2016075053A1; US10349092B2; MX2017006198A

Claims

1. Кодер (100) для кодирования вторичных мультимедийных данных (80, 125, 130), содержащих метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), причем кодер содержит:

- модуль (105) группировки, сконфигурированный с возможностью группировки потока битов вторичных мультимедийных данных (125), чтобы формировать сгруппированные вторичные мультимедийные данные (130), представляющие слова данных;

- формирователь опорных сигналов для формирования опорного шаблона (135), указывающего опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;

- компоновщик потоков, содержащий фильтр (15), чтобы подвергать фильтрации нижних частот слова данных или опорный шаблон (135), чтобы получать импульсы (15') данных, содержащие длину более чем в одну выборку предварительно определенной частоты дискретизации, при этом амплитуда импульса (15') данных взвешивается согласно сгруппированным вторичным мультимедийным данным или словам данных, при этом фильтр (15) сконфигурирован с возможностью суммировать последовательные взвешенные импульсы данных в моменты предварительно определенной частоты дискретизации, с тем чтобы получать поток цифровых слов;

- при этом кодер (100) сконфигурирован с возможностью выводить поток (145) цифровых слов (142).

2. Кодер (100) по п. 1, в котором кодирование содержит добавление избыточности посредством цифровой модуляции.

3. Кодер (100) по п. 1, в котором цифровая модуляция выполняется таким образом, что два или более битов вторичных мультимедийных данных (80, 125, 130) передаются в каждом цифровом слове потока цифровых слов.

4. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью выводить поток (145) цифровых слов (142) таким образом, что поток цифровых слов допускает передачу по PCM-аудиоканалу.

5. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью выводить дополнительный поток цифровых слов, причем дополнительный поток цифровых слов представляет первичные мультимедийные данные, причем дополнительный поток является отдельным от потока (145) цифровых слов (142).

6. Кодер (100) по п. 5, в котором первичные мультимедийные данные являются аудиоданными, при этом вторичные мультимедийные данные являются метаданными для аудиоданных или управляющими данными для аудиоданных.

7. Кодер (100) по п. 5, при этом кодер сконфигурирован с возможностью выводить поток (145) цифровых слов (142) и дополнительный поток цифровых слов таким образом, что дополнительный поток цифровых слов допускает передачу по первому PCM-аудиоканалу, и таким образом, что поток цифровых слов допускает передачу по второму PCM-аудиоканалу, отличающемуся от первого PCM-аудиоканала.

8. Кодер (100) по п. 5, в котором каждое из цифровых слов дополнительного потока, представляющего первичные мультимедийные данные (90a, 90b), имеет предварительно заданное число битов, большее 8 битов и меньшее 32 битов, при этом каждое из цифровых слов потока цифровых слов также имеет предварительно определенное число битов.

9. Кодер (100) по п. 1, в котором цифровая модуляция представляет собой импульсно-амплитудную модуляцию.

10. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью формировать поток цифровых слов таким образом, что поток цифровых слов содержит или опорный шаблон амплитуды.

11. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью выводить видеопоток, представляющий последовательность видеоизображений, при этом кодер сконфигурирован с возможностью выводить поток (145) цифровых слов (142) таким образом, что управляющие данные или метаданные вторичных мультимедийных данных, связанных с определенным видеоизображением, связаны с определенным видеоизображением.

12. Кодер (100) по п. 11, при этом кодер сконфигурирован с возможностью выводить поток цифровых слов в качестве первого потока цифровых слов, ассоциированных с первым видеоизображением из последовательности видеоизображений, и выводить поток цифровых слов в качестве второго потока цифровых слов, ассоциированных со вторым видеоизображением из последовательности видеоизображений, при этом первое и второе цифровые слова являются идентичными между собой.

13. Кодер (100) по п. 1,

- при этом кодер (100) сконфигурирован с возможностью формировать цифровые слова (142), причем цифровые слова (142) имеют 12-28 битов, либо при этом цифровые слова дискретизированы на частоте дискретизации от 30 кГц до 55 кГц, либо при этом цифровые слова имеют динамический диапазон в 70-160 дБ или имеют номинальный уровень сигнала полного RMS-масштаба в -20 дБ.

14. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью использовать верхнюю частоту для ограничения полосы частот вторичных мультимедийных данных, составляющей от 15 кГц до 27,5 кГц для частоты дискретизации от 30 кГц до 55 кГц.

15. Кодер (100) по п. 1, причем кодер содержит:

- модуль (115) преобразования, сконфигурированный с возможностью преобразования группы вторичных мультимедийных данных, содержащих первое число битов, в слово (140) данных, содержащее второе число битов, превышающее первое число битов, при этом сгруппированные вторичные мультимедийные данные (130) совмещаются с зазором до старшего бита или младшего бита слова (140) данных;

- компоновщик (120) потоков, сконфигурированный с возможностью компоновки потока (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55).

16. Кодер (100) по п. 1,

- при этом кодер содержит формирователь (17) опорных сигналов, сконфигурированный с возможностью формирования опорного шаблона (135), указывающего опорную амплитуду (41, 42) или предварительно определенный момент (40, 165) времени в первичных мультимедийных данных (90, 90a, 90b); и

- при этом компоновщик (120) потоков сконфигурирован с возможностью компоновать поток (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55), с использованием опорного шаблона (60) или слова (140) данных.

17. Кодер (100) по п. 1,

- в котором фильтр (15) сконфигурирован с возможностью получать нулевые точки (165) в моменты предварительно определенной частоты дискретизации импульса (15') данных, при этом импульс данных содержит слово (140) данных, содержащее сгруппированные вторичные мультимедийные данные (130) или опорный шаблон (135);

- при этом компоновщик (120) потоков сконфигурирован с возможностью компоновать поток, представляющий кодированные вторичные мультимедийные данные (55), с использованием опорного шаблона и множества слов данных таким образом, что нулевые точки (180c) импульса (15') данных совмещаются с максимумом (180a) дополнительного импульса данных, чтобы получать устойчивый к межсимвольным помехам (ISI) поток, представляющий кодированные вторичные мультимедийные данные.

18. Кодер (100) по п. 1, в котором фильтр (15) содержит частоту отсечки, составляющую менее 1,5 раз от частоты дискретизации первичных мультимедийных данных.

19. Кодер (100) по п. 1, в котором формирователь (17) опорных сигналов сконфигурирован с возможностью формировать сгруппированный опорный шаблон, содержащий первое число битов, при этом формирователь (17) опорных сигналов дополнительно сконфигурирован с возможностью преобразовывать сгруппированный опорный шаблон в слово (140) данных, содержащее второе число битов, превышающее первое число битов; или

- при этом модуль (115) преобразования сконфигурирован с возможностью преобразовывать сгруппированный опорный шаблон, содержащий первое число битов, в слово (140) данных, содержащее второе число битов, превышающее первое число битов.

20. Кодер по п. 1, при этом кодер (100) сконфигурирован с возможностью выводить кодированные вторичные мультимедийные данные в качестве потока (145) цифровых слов (142) в качестве управляющей дорожки и выводить вплоть до 15 каналов первичных мультимедийных данных в качестве аудиодорожек, при этом управляющая дорожка и аудиодорожки формируются в соответствии с AES3-стандартом.

21. Декодер (50) для декодирования мультимедийного сигнала (155), содержащего принимаемый поток (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55), содержащие метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), и опорный шаблон, указывающий опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;

- при этом декодер сконфигурирован с возможностью восстанавливать вторичные мультимедийные данные (80, 125), при этом восстановление содержит:

- анализ опорного шаблона, чтобы вычислять и компенсировать усиление или ослабление или смещение постоянного тока, применяемое к потоку цифровых слов; или

- преобразование частоты дискретизации, ассоциированной с цифровыми словами (140), согласно предварительно определенному моменту времени первичных мультимедийных данных, указываемых в опорном шаблоне (135), в предварительно определенную частоту дискретизации, с тем чтобы получать восстановленные вторичные мультимедийные данные (80, 125),

- при этом декодер сконфигурирован с возможностью извлекать поток (125') битов из восстановленных вторичных мультимедийных данных (80, 125).

22. Декодер (50) по п. 21, в котором восстановление содержит манипулирование принимаемым потоком (145) цифровых слов (142) относительно амплитуд, представленных посредством принимаемых цифровых слов (142).

23. Декодер (50) по п. 21, в котором мультимедийный сигнал дополнительно содержит дополнительный принимаемый поток цифровых слов, представляющий кодированные первичные мультимедийные данные, причем дополнительный принимаемый поток является отдельным от принимаемого потока, и

- при этом декодер сконфигурирован с возможностью обрабатывать первичные мультимедийные данные, представленные посредством дополнительного принимаемого потока, с использованием метаданных или управляющих данных, представленных посредством потока битов.

24. Декодер (50) по п. 21, содержащий:

- анализатор (60) опорных шаблонов для анализа опорного шаблона (135) кодированных вторичных мультимедийных данных (55), при этом анализатор (60) опорных шаблонов сконфигурирован с возможностью определять амплитуду (41, 42) опорного шаблона (135) или определять предварительно определенный момент (40) времени в первичных мультимедийных данных (90, 90a, 90b);

- манипулятор (65) сигналов для манипулирования кодированными вторичными мультимедийными данными (55) в соответствии с проанализированным опорным шаблоном (75) и вычисленным опорным шаблоном, чтобы получать вторичные мультимедийные данные (80, 125);

- процессор (70) сигналов для обработки первичных мультимедийных данных (90, 90a, 90b) согласно кодированным вторичным мультимедийным данным (55), чтобы получать декодированный мультимедийный сигнал (85).

25. Декодер (50) по п. 21, в котором анализатор опорных шаблонов содержит:

- модуль (32) определения моментов времени, сконфигурированный с возможностью определять предварительно заданный момент времени первичных мультимедийных данных в опорном шаблоне с точки зрения выборок частоты дискретизации;

- модуль (33) повышающей дискретизации, сконфигурированный с возможностью повышающе дискретизировать диапазон вокруг определенного момента времени, чтобы определять точную позицию предварительно определенного момента времени;

- дискретизирующий модуль (34) накопления, сконфигурированный с возможностью определять точную позицию цифровых слов в потоке цифровых слов, чтобы получать фактическую частоту дискретизации, ассоциированную с цифровыми словами, отличающуюся от предварительно определенной частоты дискретизации.

26. Декодер (50) по п. 21, в котором анализатор (60) опорных шаблонов содержит модуль (94) вычисления коэффициентов усиления, чтобы вычислять коэффициент усиления или ослабления согласно амплитуде опорного шаблона и амплитуде вычисленного опорного шаблона, при этом манипулятор (65) сигналов содержит умножитель (27), сконфигурированный с возможностью усиливать или ослаблять слова данных согласно коэффициенту усиления или ослабления, чтобы получать слова данных с компенсацией усиления.

27. Декодер (50) по п. 21,

- в котором анализатор опорных шаблонов содержит амплитудный детектор, чтобы определять амплитуду опорного шаблона и дополнительную амплитуду опорного шаблона;

- при этом анализатор (60) опорных шаблонов дополнительно содержит модуль (96) компенсации смещения, сконфигурированный с возможностью вычислять смещение (96a) кодированных вторичных мультимедийных данных согласно уходу амплитуды опорного шаблона (135) и дополнительной амплитуды опорного шаблона, при этом манипулятор (65) сигналов содержит сумматор, сконфигурированный с возможностью суммировать смещение кодированных вторичных мультимедийных данных с кодированными вторичными мультимедийными данными для того, чтобы получать кодированные вторичные мультимедийные данные (96) с компенсацией смещения.

28. Декодер (50) по п. 21,

- в котором манипулятор (65) сигналов содержит модуль (29) обратного преобразования, сконфигурированный с возможностью обратно преобразовывать вторичные мультимедийные данные, содержащие первое число битов, из слов (140) данных, содержащих второе число битов, превышающее первое число битов; или

- в котором манипулятор (65) сигналов содержит модуль (31) разгруппировки, сконфигурированный с возможностью разгруппировывать группу вторичных мультимедийных данных, содержащих первое число битов, чтобы получать поток битов декодированных вторичных мультимедийных данных.

29. Мультимедийный сигнал (155), содержащий:

- поток (145) цифровых слов (142), представляющих кодированные вторичные мультимедийные данные (55), содержащие метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), и опорный шаблон, указывающий опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;

- причем поток цифровых слов содержит импульсы данных, содержащие подвергнуты фильтрации нижних частот слова (140) данных или опорный шаблон (135), причем импульсы (15') данных содержат длину более чем в одну выборку предварительно определенной частоты дискретизации, при этом амплитуда импульса (15') данных взвешивается согласно слову (140) данных или опорному шаблону (135), при этом фильтр (15) сконфигурирован с возможностью суммировать последовательные взвешенные импульсы данных в моменты предварительно определенной частоты дискретизации, с тем чтобы получать поток цифровых слов.

30. Мультимедийный сигнал (155) по п. 29, в котором цифровые слова (142) содержат фильтрованные вторичные мультимедийные данные.

31. Мультимедийный сигнал (155) по п. 29, в котором вторичные мультимедийные данные содержат опорный шаблон (135) и множество слов (140) данных.

32. Мультимедийный сигнал (155) по п. 29, в котором вторичные мультимедийные данные преобразуются в слова данных с зазором до старшего бита слова данных или младшего бита слова данных.

33. Мультимедийный сигнал (155) по п. 29, в котором опорный шаблон содержит опорную амплитуду кодированных вторичных мультимедийных данных и предварительно определенный момент времени в первичных мультимедийных данных, при этом множество слов данных содержат вторичные мультимедийные данные.

34. Мультимедийный сигнал (155) по п. 29, в котором мультимедийный сигнал содержит дополнительный поток первичных мультимедийных данных, при этом первичные мультимедийные данные содержат аудиоданные или видеоданные, при этом дополнительный поток, содержащий первичные мультимедийные данные, совмещается с потоком кодированных вторичных мультимедийных данных в предварительно определенный момент времени в первичных мультимедийных данных.

35. Способ (1100) для декодирования мультимедийного сигнала (155), содержащего принимаемый поток (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55), содержащие метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), и опорный шаблон временного распределения, указывающий момент времени в первичных мультимедийных данных, при этом способ содержит этапы, на которых:

- восстанавливают вторичные мультимедийные данные (80, 125), при этом восстановление содержит этапы, на которых:

- анализируют опорный шаблон, чтобы вычислять и компенсировать усиление или ослабление или смещение постоянного тока, применяемое к потоку цифровых слов, или

- преобразуют частоту дискретизации, ассоциированную с цифровыми словами (140), согласно предварительно определенному моменту времени первичных мультимедийных данных, указываемых в опорном шаблоне (135), в предварительно определенную частоту дискретизации, с тем, чтобы получать восстановленные вторичные мультимедийные данные (80, 125); и

- извлекают поток (125') битов из восстановленных вторичных мультимедийных данных (80, 125).

36. Способ (1200) для кодирования вторичных мультимедийных данных (80, 125), содержащих метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), при этом способ содержит этапы, на которых:

- группируют поток битов вторичных мультимедийных данных (125), чтобы формировать сгруппированные вторичные мультимедийные данные (130), представляющие слова данных;

- формируют опорный шаблон (135), указывающий опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;

- подвергают фильтрации нижних частот слова данных или опорный шаблон (135), чтобы получать импульсы (15') данных, содержащие длину более чем в одну выборку предварительно определенной частоты дискретизации, при этом амплитуда импульса (15') данных взвешивается согласно сгруппированным вторичным мультимедийным данным или словам данных, при этом фильтр (15) сконфигурирован с возможностью суммировать последовательные взвешенные импульсы данных в моменты предварительно определенной частоты дискретизации, с тем чтобы получать поток цифровых слов,

- выводят кодированные вторичные мультимедийные данные в качестве потока (145) цифровых слов (142).

37. Компьютерная программа, имеющая программный код для осуществления способа по п. 35 или 36, когда компьютерная программа работает на компьютере.

38. Система обработки данных, содержащая:

- кодер по п. 1; и

- декодер по п. 21.

39. Система обработки данных по п. 38, дополнительно содержащая:

- манипулятор сигналов для манипулирования потоком (145) цифровых слов (142), чтобы получать манипулируемый поток цифровых слов,

- при этом декодер сконфигурирован с возможностью восстанавливать поток цифровых слов из манипулируемого потока цифровых слов.

40. Система обработки данных по п. 39, в которой манипулятор сигналов сконфигурирован с возможностью манипулировать посредством усиления амплитуды или ослабления амплитуды либо введения смещения или варьирования смещения, либо частотно-избирательного ослабления или усиления, либо повторной дискретизации, и

- при этом декодер (50) сконфигурирован с возможностью восстанавливать поток цифровых слов, манипулируемых посредством усиления амплитуды или ослабления амплитуды либо введения смещения или варьирования смещения, либо частотно-избирательного ослабления или усиления, либо повторной дискретизации.

41. Система обработки данных по п. 39, в которой манипулятор сигналов сконфигурирован с возможностью принимать PCM-аудиоканал и выводить PCM-аудиоканал,

- при этом кодер сконфигурирован с возможностью выводить сигнал, допускающий передачу по PCM-аудиоканалу, и

- при этом декодер сконфигурирован с возможностью принимать принимаемый поток из PCM-аудиоканала.