[go: up one dir, main page]

RU2017120175A - Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных - Google Patents

Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных Download PDF

Info

Publication number
RU2017120175A
RU2017120175A RU2017120175A RU2017120175A RU2017120175A RU 2017120175 A RU2017120175 A RU 2017120175A RU 2017120175 A RU2017120175 A RU 2017120175A RU 2017120175 A RU2017120175 A RU 2017120175A RU 2017120175 A RU2017120175 A RU 2017120175A
Authority
RU
Russia
Prior art keywords
data
multimedia data
stream
encoder
digital words
Prior art date
Application number
RU2017120175A
Other languages
English (en)
Other versions
RU2017120175A3 (ru
RU2679379C2 (ru
Inventor
Роберт БЛЕЙДТ
Тобиас БЛИМ
Штефан КРЕГЕЛО
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2017120175A3 publication Critical patent/RU2017120175A3/ru
Publication of RU2017120175A publication Critical patent/RU2017120175A/ru
Application granted granted Critical
Publication of RU2679379C2 publication Critical patent/RU2679379C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Claims (85)

1. Кодер (100) для кодирования вторичных мультимедийных данных (80, 125, 130), содержащих метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), причем кодер содержит:
- модуль (105) группировки, сконфигурированный с возможностью группировки потока битов вторичных мультимедийных данных (125), чтобы формировать сгруппированные вторичные мультимедийные данные (130), представляющие слова данных;
- формирователь опорных сигналов для формирования опорного шаблона (135), указывающего опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;
- компоновщик потоков, содержащий фильтр (15), чтобы подвергать фильтрации нижних частот слова данных или опорный шаблон (135), чтобы получать импульсы (15') данных, содержащие длину более чем в одну выборку предварительно определенной частоты дискретизации, при этом амплитуда импульса (15') данных взвешивается согласно сгруппированным вторичным мультимедийным данным или словам данных, при этом фильтр (15) сконфигурирован с возможностью суммировать последовательные взвешенные импульсы данных в моменты предварительно определенной частоты дискретизации, с тем чтобы получать поток цифровых слов;
- при этом кодер (100) сконфигурирован с возможностью выводить поток (145) цифровых слов (142).
2. Кодер (100) по п. 1, в котором кодирование содержит добавление избыточности посредством цифровой модуляции.
3. Кодер (100) по п. 1, в котором цифровая модуляция выполняется таким образом, что два или более битов вторичных мультимедийных данных (80, 125, 130) передаются в каждом цифровом слове потока цифровых слов.
4. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью выводить поток (145) цифровых слов (142) таким образом, что поток цифровых слов допускает передачу по PCM-аудиоканалу.
5. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью выводить дополнительный поток цифровых слов, причем дополнительный поток цифровых слов представляет первичные мультимедийные данные, причем дополнительный поток является отдельным от потока (145) цифровых слов (142).
6. Кодер (100) по п. 5, в котором первичные мультимедийные данные являются аудиоданными, при этом вторичные мультимедийные данные являются метаданными для аудиоданных или управляющими данными для аудиоданных.
7. Кодер (100) по п. 5, при этом кодер сконфигурирован с возможностью выводить поток (145) цифровых слов (142) и дополнительный поток цифровых слов таким образом, что дополнительный поток цифровых слов допускает передачу по первому PCM-аудиоканалу, и таким образом, что поток цифровых слов допускает передачу по второму PCM-аудиоканалу, отличающемуся от первого PCM-аудиоканала.
8. Кодер (100) по п. 5, в котором каждое из цифровых слов дополнительного потока, представляющего первичные мультимедийные данные (90a, 90b), имеет предварительно заданное число битов, большее 8 битов и меньшее 32 битов, при этом каждое из цифровых слов потока цифровых слов также имеет предварительно определенное число битов.
9. Кодер (100) по п. 1, в котором цифровая модуляция представляет собой импульсно-амплитудную модуляцию.
10. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью формировать поток цифровых слов таким образом, что поток цифровых слов содержит или опорный шаблон амплитуды.
11. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью выводить видеопоток, представляющий последовательность видеоизображений, при этом кодер сконфигурирован с возможностью выводить поток (145) цифровых слов (142) таким образом, что управляющие данные или метаданные вторичных мультимедийных данных, связанных с определенным видеоизображением, связаны с определенным видеоизображением.
12. Кодер (100) по п. 11, при этом кодер сконфигурирован с возможностью выводить поток цифровых слов в качестве первого потока цифровых слов, ассоциированных с первым видеоизображением из последовательности видеоизображений, и выводить поток цифровых слов в качестве второго потока цифровых слов, ассоциированных со вторым видеоизображением из последовательности видеоизображений, при этом первое и второе цифровые слова являются идентичными между собой.
13. Кодер (100) по п. 1,
- при этом кодер (100) сконфигурирован с возможностью формировать цифровые слова (142), причем цифровые слова (142) имеют 12-28 битов, либо при этом цифровые слова дискретизированы на частоте дискретизации от 30 кГц до 55 кГц, либо при этом цифровые слова имеют динамический диапазон в 70-160 дБ или имеют номинальный уровень сигнала полного RMS-масштаба в -20 дБ.
14. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью использовать верхнюю частоту для ограничения полосы частот вторичных мультимедийных данных, составляющей от 15 кГц до 27,5 кГц для частоты дискретизации от 30 кГц до 55 кГц.
15. Кодер (100) по п. 1, причем кодер содержит:
- модуль (115) преобразования, сконфигурированный с возможностью преобразования группы вторичных мультимедийных данных, содержащих первое число битов, в слово (140) данных, содержащее второе число битов, превышающее первое число битов, при этом сгруппированные вторичные мультимедийные данные (130) совмещаются с зазором до старшего бита или младшего бита слова (140) данных;
- компоновщик (120) потоков, сконфигурированный с возможностью компоновки потока (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55).
16. Кодер (100) по п. 1,
- при этом кодер содержит формирователь (17) опорных сигналов, сконфигурированный с возможностью формирования опорного шаблона (135), указывающего опорную амплитуду (41, 42) или предварительно определенный момент (40, 165) времени в первичных мультимедийных данных (90, 90a, 90b); и
- при этом компоновщик (120) потоков сконфигурирован с возможностью компоновать поток (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55), с использованием опорного шаблона (60) или слова (140) данных.
17. Кодер (100) по п. 1,
- в котором фильтр (15) сконфигурирован с возможностью получать нулевые точки (165) в моменты предварительно определенной частоты дискретизации импульса (15') данных, при этом импульс данных содержит слово (140) данных, содержащее сгруппированные вторичные мультимедийные данные (130) или опорный шаблон (135);
- при этом компоновщик (120) потоков сконфигурирован с возможностью компоновать поток, представляющий кодированные вторичные мультимедийные данные (55), с использованием опорного шаблона и множества слов данных таким образом, что нулевые точки (180c) импульса (15') данных совмещаются с максимумом (180a) дополнительного импульса данных, чтобы получать устойчивый к межсимвольным помехам (ISI) поток, представляющий кодированные вторичные мультимедийные данные.
18. Кодер (100) по п. 1, в котором фильтр (15) содержит частоту отсечки, составляющую менее 1,5 раз от частоты дискретизации первичных мультимедийных данных.
19. Кодер (100) по п. 1, в котором формирователь (17) опорных сигналов сконфигурирован с возможностью формировать сгруппированный опорный шаблон, содержащий первое число битов, при этом формирователь (17) опорных сигналов дополнительно сконфигурирован с возможностью преобразовывать сгруппированный опорный шаблон в слово (140) данных, содержащее второе число битов, превышающее первое число битов; или
- при этом модуль (115) преобразования сконфигурирован с возможностью преобразовывать сгруппированный опорный шаблон, содержащий первое число битов, в слово (140) данных, содержащее второе число битов, превышающее первое число битов.
20. Кодер по п. 1, при этом кодер (100) сконфигурирован с возможностью выводить кодированные вторичные мультимедийные данные в качестве потока (145) цифровых слов (142) в качестве управляющей дорожки и выводить вплоть до 15 каналов первичных мультимедийных данных в качестве аудиодорожек, при этом управляющая дорожка и аудиодорожки формируются в соответствии с AES3-стандартом.
21. Декодер (50) для декодирования мультимедийного сигнала (155), содержащего принимаемый поток (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55), содержащие метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), и опорный шаблон, указывающий опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;
- при этом декодер сконфигурирован с возможностью восстанавливать вторичные мультимедийные данные (80, 125), при этом восстановление содержит:
- анализ опорного шаблона, чтобы вычислять и компенсировать усиление или ослабление или смещение постоянного тока, применяемое к потоку цифровых слов; или
- преобразование частоты дискретизации, ассоциированной с цифровыми словами (140), согласно предварительно определенному моменту времени первичных мультимедийных данных, указываемых в опорном шаблоне (135), в предварительно определенную частоту дискретизации, с тем чтобы получать восстановленные вторичные мультимедийные данные (80, 125),
- при этом декодер сконфигурирован с возможностью извлекать поток (125') битов из восстановленных вторичных мультимедийных данных (80, 125).
22. Декодер (50) по п. 21, в котором восстановление содержит манипулирование принимаемым потоком (145) цифровых слов (142) относительно амплитуд, представленных посредством принимаемых цифровых слов (142).
23. Декодер (50) по п. 21, в котором мультимедийный сигнал дополнительно содержит дополнительный принимаемый поток цифровых слов, представляющий кодированные первичные мультимедийные данные, причем дополнительный принимаемый поток является отдельным от принимаемого потока, и
- при этом декодер сконфигурирован с возможностью обрабатывать первичные мультимедийные данные, представленные посредством дополнительного принимаемого потока, с использованием метаданных или управляющих данных, представленных посредством потока битов.
24. Декодер (50) по п. 21, содержащий:
- анализатор (60) опорных шаблонов для анализа опорного шаблона (135) кодированных вторичных мультимедийных данных (55), при этом анализатор (60) опорных шаблонов сконфигурирован с возможностью определять амплитуду (41, 42) опорного шаблона (135) или определять предварительно определенный момент (40) времени в первичных мультимедийных данных (90, 90a, 90b);
- манипулятор (65) сигналов для манипулирования кодированными вторичными мультимедийными данными (55) в соответствии с проанализированным опорным шаблоном (75) и вычисленным опорным шаблоном, чтобы получать вторичные мультимедийные данные (80, 125);
- процессор (70) сигналов для обработки первичных мультимедийных данных (90, 90a, 90b) согласно кодированным вторичным мультимедийным данным (55), чтобы получать декодированный мультимедийный сигнал (85).
25. Декодер (50) по п. 21, в котором анализатор опорных шаблонов содержит:
- модуль (32) определения моментов времени, сконфигурированный с возможностью определять предварительно заданный момент времени первичных мультимедийных данных в опорном шаблоне с точки зрения выборок частоты дискретизации;
- модуль (33) повышающей дискретизации, сконфигурированный с возможностью повышающе дискретизировать диапазон вокруг определенного момента времени, чтобы определять точную позицию предварительно определенного момента времени;
- дискретизирующий модуль (34) накопления, сконфигурированный с возможностью определять точную позицию цифровых слов в потоке цифровых слов, чтобы получать фактическую частоту дискретизации, ассоциированную с цифровыми словами, отличающуюся от предварительно определенной частоты дискретизации.
26. Декодер (50) по п. 21, в котором анализатор (60) опорных шаблонов содержит модуль (94) вычисления коэффициентов усиления, чтобы вычислять коэффициент усиления или ослабления согласно амплитуде опорного шаблона и амплитуде вычисленного опорного шаблона, при этом манипулятор (65) сигналов содержит умножитель (27), сконфигурированный с возможностью усиливать или ослаблять слова данных согласно коэффициенту усиления или ослабления, чтобы получать слова данных с компенсацией усиления.
27. Декодер (50) по п. 21,
- в котором анализатор опорных шаблонов содержит амплитудный детектор, чтобы определять амплитуду опорного шаблона и дополнительную амплитуду опорного шаблона;
- при этом анализатор (60) опорных шаблонов дополнительно содержит модуль (96) компенсации смещения, сконфигурированный с возможностью вычислять смещение (96a) кодированных вторичных мультимедийных данных согласно уходу амплитуды опорного шаблона (135) и дополнительной амплитуды опорного шаблона, при этом манипулятор (65) сигналов содержит сумматор, сконфигурированный с возможностью суммировать смещение кодированных вторичных мультимедийных данных с кодированными вторичными мультимедийными данными для того, чтобы получать кодированные вторичные мультимедийные данные (96) с компенсацией смещения.
28. Декодер (50) по п. 21,
- в котором манипулятор (65) сигналов содержит модуль (29) обратного преобразования, сконфигурированный с возможностью обратно преобразовывать вторичные мультимедийные данные, содержащие первое число битов, из слов (140) данных, содержащих второе число битов, превышающее первое число битов; или
- в котором манипулятор (65) сигналов содержит модуль (31) разгруппировки, сконфигурированный с возможностью разгруппировывать группу вторичных мультимедийных данных, содержащих первое число битов, чтобы получать поток битов декодированных вторичных мультимедийных данных.
29. Мультимедийный сигнал (155), содержащий:
- поток (145) цифровых слов (142), представляющих кодированные вторичные мультимедийные данные (55), содержащие метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), и опорный шаблон, указывающий опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;
- причем поток цифровых слов содержит импульсы данных, содержащие подвергнуты фильтрации нижних частот слова (140) данных или опорный шаблон (135), причем импульсы (15') данных содержат длину более чем в одну выборку предварительно определенной частоты дискретизации, при этом амплитуда импульса (15') данных взвешивается согласно слову (140) данных или опорному шаблону (135), при этом фильтр (15) сконфигурирован с возможностью суммировать последовательные взвешенные импульсы данных в моменты предварительно определенной частоты дискретизации, с тем чтобы получать поток цифровых слов.
30. Мультимедийный сигнал (155) по п. 29, в котором цифровые слова (142) содержат фильтрованные вторичные мультимедийные данные.
31. Мультимедийный сигнал (155) по п. 29, в котором вторичные мультимедийные данные содержат опорный шаблон (135) и множество слов (140) данных.
32. Мультимедийный сигнал (155) по п. 29, в котором вторичные мультимедийные данные преобразуются в слова данных с зазором до старшего бита слова данных или младшего бита слова данных.
33. Мультимедийный сигнал (155) по п. 29, в котором опорный шаблон содержит опорную амплитуду кодированных вторичных мультимедийных данных и предварительно определенный момент времени в первичных мультимедийных данных, при этом множество слов данных содержат вторичные мультимедийные данные.
34. Мультимедийный сигнал (155) по п. 29, в котором мультимедийный сигнал содержит дополнительный поток первичных мультимедийных данных, при этом первичные мультимедийные данные содержат аудиоданные или видеоданные, при этом дополнительный поток, содержащий первичные мультимедийные данные, совмещается с потоком кодированных вторичных мультимедийных данных в предварительно определенный момент времени в первичных мультимедийных данных.
35. Способ (1100) для декодирования мультимедийного сигнала (155), содержащего принимаемый поток (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55), содержащие метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), и опорный шаблон временного распределения, указывающий момент времени в первичных мультимедийных данных, при этом способ содержит этапы, на которых:
- восстанавливают вторичные мультимедийные данные (80, 125), при этом восстановление содержит этапы, на которых:
- анализируют опорный шаблон, чтобы вычислять и компенсировать усиление или ослабление или смещение постоянного тока, применяемое к потоку цифровых слов, или
- преобразуют частоту дискретизации, ассоциированную с цифровыми словами (140), согласно предварительно определенному моменту времени первичных мультимедийных данных, указываемых в опорном шаблоне (135), в предварительно определенную частоту дискретизации, с тем, чтобы получать восстановленные вторичные мультимедийные данные (80, 125); и
- извлекают поток (125') битов из восстановленных вторичных мультимедийных данных (80, 125).
36. Способ (1200) для кодирования вторичных мультимедийных данных (80, 125), содержащих метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), при этом способ содержит этапы, на которых:
- группируют поток битов вторичных мультимедийных данных (125), чтобы формировать сгруппированные вторичные мультимедийные данные (130), представляющие слова данных;
- формируют опорный шаблон (135), указывающий опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;
- подвергают фильтрации нижних частот слова данных или опорный шаблон (135), чтобы получать импульсы (15') данных, содержащие длину более чем в одну выборку предварительно определенной частоты дискретизации, при этом амплитуда импульса (15') данных взвешивается согласно сгруппированным вторичным мультимедийным данным или словам данных, при этом фильтр (15) сконфигурирован с возможностью суммировать последовательные взвешенные импульсы данных в моменты предварительно определенной частоты дискретизации, с тем чтобы получать поток цифровых слов,
- выводят кодированные вторичные мультимедийные данные в качестве потока (145) цифровых слов (142).
37. Компьютерная программа, имеющая программный код для осуществления способа по п. 35 или 36, когда компьютерная программа работает на компьютере.
38. Система обработки данных, содержащая:
- кодер по п. 1; и
- декодер по п. 21.
39. Система обработки данных по п. 38, дополнительно содержащая:
- манипулятор сигналов для манипулирования потоком (145) цифровых слов (142), чтобы получать манипулируемый поток цифровых слов,
- при этом декодер сконфигурирован с возможностью восстанавливать поток цифровых слов из манипулируемого потока цифровых слов.
40. Система обработки данных по п. 39, в которой манипулятор сигналов сконфигурирован с возможностью манипулировать посредством усиления амплитуды или ослабления амплитуды либо введения смещения или варьирования смещения, либо частотно-избирательного ослабления или усиления, либо повторной дискретизации, и
- при этом декодер (50) сконфигурирован с возможностью восстанавливать поток цифровых слов, манипулируемых посредством усиления амплитуды или ослабления амплитуды либо введения смещения или варьирования смещения, либо частотно-избирательного ослабления или усиления, либо повторной дискретизации.
41. Система обработки данных по п. 39, в которой манипулятор сигналов сконфигурирован с возможностью принимать PCM-аудиоканал и выводить PCM-аудиоканал,
- при этом кодер сконфигурирован с возможностью выводить сигнал, допускающий передачу по PCM-аудиоканалу, и
- при этом декодер сконфигурирован с возможностью принимать принимаемый поток из PCM-аудиоканала.
RU2017120175A 2014-11-12 2015-11-06 Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных RU2679379C2 (ru)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP14192907.5 2014-11-12
EP14192907 2014-11-12
EP15163198.3 2015-04-10
EP15163198 2015-04-10
EP15181428 2015-08-18
EP15181428.2 2015-08-18
PCT/EP2015/075987 WO2016075053A1 (en) 2014-11-12 2015-11-06 Decoder for decoding a media signal and encoder for encoding secondary media data comprising metadata or control data for primary media data

Publications (3)

Publication Number Publication Date
RU2017120175A3 RU2017120175A3 (ru) 2018-12-13
RU2017120175A true RU2017120175A (ru) 2018-12-13
RU2679379C2 RU2679379C2 (ru) 2019-02-07

Family

ID=54476977

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017120175A RU2679379C2 (ru) 2014-11-12 2015-11-06 Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных

Country Status (13)

Country Link
US (2) US10349092B2 (ru)
EP (1) EP3219105A1 (ru)
JP (2) JP6530070B2 (ru)
KR (1) KR102151707B1 (ru)
CN (1) CN107211164B (ru)
AU (1) AU2015345248B2 (ru)
CA (1) CA2967519C (ru)
MX (1) MX2017006198A (ru)
MY (1) MY186808A (ru)
RU (1) RU2679379C2 (ru)
SG (1) SG11201703855SA (ru)
TW (1) TWI631835B (ru)
WO (1) WO2016075053A1 (ru)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1805891B1 (en) 2004-10-26 2012-05-16 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI529703B (zh) 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
CN107591158B (zh) 2012-05-18 2020-10-27 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
EP2901449B1 (en) 2013-01-21 2018-01-03 Dolby Laboratories Licensing Corporation Audio encoder and decoder with program loudness and boundary metadata
US9841941B2 (en) 2013-01-21 2017-12-12 Dolby Laboratories Licensing Corporation System and method for optimizing loudness and dynamic range across different playback devices
CN105074818B (zh) 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
US9635417B2 (en) 2013-04-05 2017-04-25 Dolby Laboratories Licensing Corporation Acquisition, recovery, and matching of unique information from file-based media for automated file detection
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP4379715A3 (en) 2013-09-12 2024-08-21 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
WO2015038475A1 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
CN110808723B (zh) 2014-05-26 2024-09-17 杜比实验室特许公司 音频信号响度控制
ES3036395T3 (en) 2014-10-10 2025-09-18 Dolby Laboratories Licensing Corp Transmission-agnostic presentation-based program loudness
CN113242448B (zh) 2015-06-02 2023-07-14 索尼公司 发送装置和方法、媒体处理装置和方法以及接收装置
EP3996375A1 (en) * 2016-05-26 2022-05-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Broadcast streaming of panoramic video for interactive clients
KR102666132B1 (ko) * 2016-12-21 2024-05-14 삼성전자주식회사 반도체 메모리 장치의 데이터 정렬 회로, 반도체 메모리 장치 및 반도체 메모리 장치의 데이터 정렬 방법
JP2018148488A (ja) * 2017-03-08 2018-09-20 ソニーセミコンダクタソリューションズ株式会社 信号処理装置および方法
US10412395B2 (en) 2017-03-10 2019-09-10 Raytheon Company Real time frame alignment in video data
US10390030B2 (en) * 2017-03-10 2019-08-20 Raytheon Company Symbology encoding in video data
EP3622645B1 (en) * 2017-05-12 2021-11-03 Telefonaktiebolaget LM Ericsson (publ) Adaptive crc length for beam sweeping
IT201700078297A1 (it) * 2017-07-11 2019-01-11 Inst Rundfunktechnik Gmbh Verfahren und einrichtung zum ableiten von audioparameterwerten aus einem aes67 kompatiblen audioinformationssignal
JP7575947B2 (ja) * 2018-07-02 2024-10-30 ドルビー ラボラトリーズ ライセンシング コーポレイション 没入的オーディオ信号を含むビットストリームを生成するための方法および装置
GB2593117A (en) * 2018-07-24 2021-09-22 Nokia Technologies Oy Apparatus, methods and computer programs for controlling band limited audio objects
US10554963B1 (en) * 2018-10-16 2020-02-04 Raytheon Company Video load balancing and error detection based on measured channel bandwidth
EP3973677A4 (en) * 2019-05-21 2023-07-12 Genetec Inc. METHODS AND SYSTEMS FOR CODEC DETECTION IN VIDEO DATA STREAM
US12432046B2 (en) 2019-05-21 2025-09-30 Genetec Inc. Methods and systems for processing information streams
US12073842B2 (en) * 2019-06-24 2024-08-27 Qualcomm Incorporated Psychoacoustic audio coding of ambisonic audio data
US20230006785A1 (en) * 2019-11-23 2023-01-05 Creative Technology Ltd System and method for transmitting data over a digital interface
CN111238547B (zh) * 2020-01-19 2022-02-08 东方电气自动控制工程有限公司 一种位置式编码器过零翻转时转速计算的算法
CN115668938B (zh) * 2020-03-18 2026-01-13 Lg电子株式会社 点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法
WO2021232157A1 (en) * 2020-05-19 2021-11-25 The Governing Council Of The University Of Toronto Sustained release pharmaceutical composition
CN112988109B (zh) * 2021-05-17 2021-09-28 深圳市爱图仕影像器材有限公司 单音频接口信号切换电路及单音频接口切换装置
JPWO2023171357A1 (ru) * 2022-03-07 2023-09-14
CN114339297B (zh) * 2022-03-09 2022-06-21 央广新媒体文化传媒(北京)有限公司 音频处理方法、装置、电子设备和计算机可读存储介质
CN114554027B (zh) * 2022-03-16 2022-11-25 湖南双菱电子科技有限公司 一种音频嵌入处理及视音频同步输出处理方法
CN115103286B (zh) * 2022-04-29 2024-09-27 北京瑞森新谱科技股份有限公司 一种asio低延时声学采集方法
CN116994600B (zh) * 2023-09-28 2023-12-12 中影年年(北京)文化传媒有限公司 基于音频驱动角色口型的方法及系统

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1109155A (en) * 1977-07-14 1981-09-15 Northern Telecom Limited Automatic d-c offset cancellation in pcm encoders
US4550425A (en) * 1982-09-20 1985-10-29 Sperry Corporation Speech sampling and companding device
DE3504734C2 (de) 1985-02-12 1998-12-10 Max Planck Gesellschaft Verfahren und Vorrichtung zur Aufnahme von Spinresonanzdaten
JPH0865072A (ja) * 1994-08-23 1996-03-08 Mitsubishi Electric Corp デジタル音声放送受信機
US6411725B1 (en) * 1995-07-27 2002-06-25 Digimarc Corporation Watermark enabled video objects
US5822360A (en) * 1995-09-06 1998-10-13 Solana Technology Development Corporation Method and apparatus for transporting auxiliary data in audio signals
EP1431961B1 (en) * 1995-12-06 2008-05-14 Verance Corporation Post-compression hidden data transport
US8908872B2 (en) * 1996-06-07 2014-12-09 That Corporation BTSC encoder
US6226758B1 (en) * 1997-09-30 2001-05-01 Cirrus Logic, Inc. Sample rate conversion of non-audio AES data channels
US6209094B1 (en) * 1998-10-14 2001-03-27 Liquid Audio Inc. Robust watermark method and apparatus for digital signals
US6571144B1 (en) * 1999-10-20 2003-05-27 Intel Corporation System for providing a digital watermark in an audio signal
US6737957B1 (en) * 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
KR20020020899A (ko) * 2000-03-30 2002-03-16 요트.게.아. 롤페즈 이진 소스신호의 복수의 비트의 스트림을 이진 채널신호의복수의 비트의 스트림으로 인코딩하는 방법
US7088398B1 (en) * 2001-12-24 2006-08-08 Silicon Image, Inc. Method and apparatus for regenerating a clock for auxiliary data transmitted over a serial link with video data
US20050213726A1 (en) * 2001-12-31 2005-09-29 Polycom, Inc. Conference bridge which transfers control information embedded in audio information between endpoints
JP2004201267A (ja) * 2002-10-24 2004-07-15 Sony Corp ディジタルフィルタ並びにその係数算出装置及び係数算出方法
US7535836B2 (en) * 2003-02-12 2009-05-19 Broadcom Corporation Method and system to provide word-level flow control using spare link bandwidth
DE60317578T2 (de) * 2003-09-22 2008-09-18 Inova Semiconductors Gmbh System und verfahren zur bildung einer bidirektionalen multimediaverbindung
WO2005071676A2 (en) * 2004-01-19 2005-08-04 Koninklijke Philips Electronics N.V. Embedding a secondary information signal in a channel data stream
US8826328B2 (en) * 2004-11-12 2014-09-02 Opentv, Inc. Communicating primary content streams and secondary content streams including targeted advertising to a remote unit
KR100686521B1 (ko) * 2005-09-23 2007-02-26 한국정보통신대학교 산학협력단 비디오 및 메타데이터의 통합을 위한 비디오 멀티미디어응용 파일 형식의 인코딩/디코딩 방법 및 시스템
JP5130352B2 (ja) * 2007-05-04 2013-01-30 ノキア コーポレイション マルチメディアコンテナファイルの受信ヒントトラックに記録するメディアストリーム
JP2009212697A (ja) * 2008-03-03 2009-09-17 Aiphone Co Ltd テレビドアホン装置
US20120033819A1 (en) * 2010-08-06 2012-02-09 Samsung Electronics Co., Ltd. Signal processing method, encoding apparatus therefor, decoding apparatus therefor, and information storage medium
US8380334B2 (en) * 2010-09-07 2013-02-19 Linear Acoustic, Inc. Carrying auxiliary data within audio signals
EP2614640A1 (en) * 2010-09-10 2013-07-17 Thomson Licensing Video decoding using block- based mixed - resolution data pruning
JP5909100B2 (ja) * 2012-01-26 2016-04-26 日本放送協会 ラウドネスレンジ制御システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
WO2014035864A1 (en) * 2012-08-31 2014-03-06 Dolby Laboratories Licensing Corporation Processing audio objects in principal and supplementary encoded audio signals
KR101849612B1 (ko) * 2013-01-28 2018-04-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 새로운 미디어 장치 상에 내장된 라우드니스 메타데이터를 갖거나 또는 갖지 않고 미디어의 정규화된 오디오 재생을 위한 방법 및 장치
BR112015029329A8 (pt) * 2013-05-30 2020-03-17 Sony Corp aparelho, método e sistema de processamento de sinal, e, meio de armazenamento legível por computador
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP2830047A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
WO2015034275A1 (ko) * 2013-09-05 2015-03-12 엘지전자(주) 무선 통신 시스템에서 오디오/비디오 스트리밍 수행 방법 및 장치
US9990935B2 (en) * 2013-09-12 2018-06-05 Dolby Laboratories Licensing Corporation System aspects of an audio codec
CN106170988A (zh) * 2014-03-13 2016-11-30 凡瑞斯公司 使用嵌入式代码的交互式内容获取
US9928728B2 (en) * 2014-05-09 2018-03-27 Sony Interactive Entertainment Inc. Scheme for embedding a control signal in an audio signal using pseudo white noise
US20150325115A1 (en) * 2014-05-09 2015-11-12 Sony Computer Entertainment Inc. Scheme for embedding a control signal in an audio signal
PT3149955T (pt) * 2014-05-28 2019-08-05 Fraunhofer Ges Forschung Processador de dados e transporte de dados de controlo do utilizador para descodificadores e renderizadores de áudio
US9838571B2 (en) * 2015-04-10 2017-12-05 Gvbb Holdings S.A.R.L. Precision timing for broadcast network
US9934790B2 (en) * 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization

Also Published As

Publication number Publication date
US11218740B2 (en) 2022-01-04
JP2019193268A (ja) 2019-10-31
BR112017009734A2 (pt) 2018-02-06
AU2015345248A1 (en) 2017-06-01
EP3219105A1 (en) 2017-09-20
MY186808A (en) 2021-08-22
JP6530070B2 (ja) 2019-06-12
TW201622368A (zh) 2016-06-16
CN107211164A (zh) 2017-09-26
KR20170084231A (ko) 2017-07-19
CA2967519A1 (en) 2016-05-19
CN107211164B (zh) 2021-01-29
RU2017120175A3 (ru) 2018-12-13
KR102151707B1 (ko) 2020-09-03
US20190373294A1 (en) 2019-12-05
RU2679379C2 (ru) 2019-02-07
US20180007398A1 (en) 2018-01-04
WO2016075053A1 (en) 2016-05-19
US10349092B2 (en) 2019-07-09
MX2017006198A (es) 2017-07-31
AU2015345248B2 (en) 2019-02-14
JP6887461B2 (ja) 2021-06-16
SG11201703855SA (en) 2017-06-29
JP2018500804A (ja) 2018-01-11
TWI631835B (zh) 2018-08-01
CA2967519C (en) 2020-07-07

Similar Documents

Publication Publication Date Title
RU2017120175A (ru) Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных
CA3110057C (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation
DK166933B1 (da) Fremgangsmaade til overfoering af et audiosignal
IL304770B2 (en) Adaptive processing with multiple media processing nodes
BR112012025570A2 (pt) aparelho e método de processamento de sinal, meio de gravação, decodificador, codificador, métodos de decodificação e de codificação.
BR112012025573A2 (pt) Aparelho de processamento de sinal, métodos de processamento de sinal, de codificação e de decodificação, programa, codificador, e, decodificador
RU2010140328A (ru) Способ и устройство для кодирования и декодирования основывающегося на объектах аудиосигнала
US10019997B2 (en) Method and apparatus for quantisation index modulation for watermarking an input signal
US20140214431A1 (en) Sample rate scalable lossless audio coding
TR201816634T4 (tr) Bağımsız gürültü-doldurma kullanarak iyileştirilmiş bir sinyal üretmek için cihaz ve yöntem.
JP2005530206A (ja) 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
Bae et al. A new hybrid non-uniform coding with low bit rates for sound signal in near field communication
US9813725B1 (en) System, method, and computer program for encoding and decoding a unique signature in a video file
JP2007333785A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
CN101647201A (zh) 以低比特率对包含噪声的音频信号进行编码/解码的方法和设备
US20160035365A1 (en) Sound encoding device, sound encoding method, sound decoding device and sound decoding method
US8781134B2 (en) Method and apparatus for encoding and decoding stereo audio
JP5131596B2 (ja) 信号分離再生装置および信号分離再生方法
JP5640238B2 (ja) 特異点信号処理システムおよびそのプログラム
Hoffmann et al. The Sennheiser vocoder goes digital-on a German R&D project in the 1970s.
KR102345487B1 (ko) 이중 도메인을 이용한 음원 분리기의 훈련 방법, 음원 분리 방법 및 그 장치
KR101425354B1 (ko) 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치
FR2639779A1 (fr) Dispositif de codage et de decodage des signaux de radiodiffusion sonore
JP2006023658A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
HK40107858A (zh) 包括编码hoa表示的位流的解码方法和装置、以及介质