RU2017120175A - Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных - Google Patents
Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных Download PDFInfo
- Publication number
- RU2017120175A RU2017120175A RU2017120175A RU2017120175A RU2017120175A RU 2017120175 A RU2017120175 A RU 2017120175A RU 2017120175 A RU2017120175 A RU 2017120175A RU 2017120175 A RU2017120175 A RU 2017120175A RU 2017120175 A RU2017120175 A RU 2017120175A
- Authority
- RU
- Russia
- Prior art keywords
- data
- multimedia data
- stream
- encoder
- digital words
- Prior art date
Links
- 238000005070 sampling Methods 0.000 claims 17
- 238000000034 method Methods 0.000 claims 6
- 230000003321 amplification Effects 0.000 claims 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims 3
- 238000012952 Resampling Methods 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 2
- 238000011084 recovery Methods 0.000 claims 2
- 238000009825 accumulation Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Claims (85)
1. Кодер (100) для кодирования вторичных мультимедийных данных (80, 125, 130), содержащих метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), причем кодер содержит:
- модуль (105) группировки, сконфигурированный с возможностью группировки потока битов вторичных мультимедийных данных (125), чтобы формировать сгруппированные вторичные мультимедийные данные (130), представляющие слова данных;
- формирователь опорных сигналов для формирования опорного шаблона (135), указывающего опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;
- компоновщик потоков, содержащий фильтр (15), чтобы подвергать фильтрации нижних частот слова данных или опорный шаблон (135), чтобы получать импульсы (15') данных, содержащие длину более чем в одну выборку предварительно определенной частоты дискретизации, при этом амплитуда импульса (15') данных взвешивается согласно сгруппированным вторичным мультимедийным данным или словам данных, при этом фильтр (15) сконфигурирован с возможностью суммировать последовательные взвешенные импульсы данных в моменты предварительно определенной частоты дискретизации, с тем чтобы получать поток цифровых слов;
- при этом кодер (100) сконфигурирован с возможностью выводить поток (145) цифровых слов (142).
2. Кодер (100) по п. 1, в котором кодирование содержит добавление избыточности посредством цифровой модуляции.
3. Кодер (100) по п. 1, в котором цифровая модуляция выполняется таким образом, что два или более битов вторичных мультимедийных данных (80, 125, 130) передаются в каждом цифровом слове потока цифровых слов.
4. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью выводить поток (145) цифровых слов (142) таким образом, что поток цифровых слов допускает передачу по PCM-аудиоканалу.
5. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью выводить дополнительный поток цифровых слов, причем дополнительный поток цифровых слов представляет первичные мультимедийные данные, причем дополнительный поток является отдельным от потока (145) цифровых слов (142).
6. Кодер (100) по п. 5, в котором первичные мультимедийные данные являются аудиоданными, при этом вторичные мультимедийные данные являются метаданными для аудиоданных или управляющими данными для аудиоданных.
7. Кодер (100) по п. 5, при этом кодер сконфигурирован с возможностью выводить поток (145) цифровых слов (142) и дополнительный поток цифровых слов таким образом, что дополнительный поток цифровых слов допускает передачу по первому PCM-аудиоканалу, и таким образом, что поток цифровых слов допускает передачу по второму PCM-аудиоканалу, отличающемуся от первого PCM-аудиоканала.
8. Кодер (100) по п. 5, в котором каждое из цифровых слов дополнительного потока, представляющего первичные мультимедийные данные (90a, 90b), имеет предварительно заданное число битов, большее 8 битов и меньшее 32 битов, при этом каждое из цифровых слов потока цифровых слов также имеет предварительно определенное число битов.
9. Кодер (100) по п. 1, в котором цифровая модуляция представляет собой импульсно-амплитудную модуляцию.
10. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью формировать поток цифровых слов таким образом, что поток цифровых слов содержит или опорный шаблон амплитуды.
11. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью выводить видеопоток, представляющий последовательность видеоизображений, при этом кодер сконфигурирован с возможностью выводить поток (145) цифровых слов (142) таким образом, что управляющие данные или метаданные вторичных мультимедийных данных, связанных с определенным видеоизображением, связаны с определенным видеоизображением.
12. Кодер (100) по п. 11, при этом кодер сконфигурирован с возможностью выводить поток цифровых слов в качестве первого потока цифровых слов, ассоциированных с первым видеоизображением из последовательности видеоизображений, и выводить поток цифровых слов в качестве второго потока цифровых слов, ассоциированных со вторым видеоизображением из последовательности видеоизображений, при этом первое и второе цифровые слова являются идентичными между собой.
13. Кодер (100) по п. 1,
- при этом кодер (100) сконфигурирован с возможностью формировать цифровые слова (142), причем цифровые слова (142) имеют 12-28 битов, либо при этом цифровые слова дискретизированы на частоте дискретизации от 30 кГц до 55 кГц, либо при этом цифровые слова имеют динамический диапазон в 70-160 дБ или имеют номинальный уровень сигнала полного RMS-масштаба в -20 дБ.
14. Кодер (100) по п. 1, при этом кодер сконфигурирован с возможностью использовать верхнюю частоту для ограничения полосы частот вторичных мультимедийных данных, составляющей от 15 кГц до 27,5 кГц для частоты дискретизации от 30 кГц до 55 кГц.
15. Кодер (100) по п. 1, причем кодер содержит:
- модуль (115) преобразования, сконфигурированный с возможностью преобразования группы вторичных мультимедийных данных, содержащих первое число битов, в слово (140) данных, содержащее второе число битов, превышающее первое число битов, при этом сгруппированные вторичные мультимедийные данные (130) совмещаются с зазором до старшего бита или младшего бита слова (140) данных;
- компоновщик (120) потоков, сконфигурированный с возможностью компоновки потока (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55).
16. Кодер (100) по п. 1,
- при этом кодер содержит формирователь (17) опорных сигналов, сконфигурированный с возможностью формирования опорного шаблона (135), указывающего опорную амплитуду (41, 42) или предварительно определенный момент (40, 165) времени в первичных мультимедийных данных (90, 90a, 90b); и
- при этом компоновщик (120) потоков сконфигурирован с возможностью компоновать поток (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55), с использованием опорного шаблона (60) или слова (140) данных.
17. Кодер (100) по п. 1,
- в котором фильтр (15) сконфигурирован с возможностью получать нулевые точки (165) в моменты предварительно определенной частоты дискретизации импульса (15') данных, при этом импульс данных содержит слово (140) данных, содержащее сгруппированные вторичные мультимедийные данные (130) или опорный шаблон (135);
- при этом компоновщик (120) потоков сконфигурирован с возможностью компоновать поток, представляющий кодированные вторичные мультимедийные данные (55), с использованием опорного шаблона и множества слов данных таким образом, что нулевые точки (180c) импульса (15') данных совмещаются с максимумом (180a) дополнительного импульса данных, чтобы получать устойчивый к межсимвольным помехам (ISI) поток, представляющий кодированные вторичные мультимедийные данные.
18. Кодер (100) по п. 1, в котором фильтр (15) содержит частоту отсечки, составляющую менее 1,5 раз от частоты дискретизации первичных мультимедийных данных.
19. Кодер (100) по п. 1, в котором формирователь (17) опорных сигналов сконфигурирован с возможностью формировать сгруппированный опорный шаблон, содержащий первое число битов, при этом формирователь (17) опорных сигналов дополнительно сконфигурирован с возможностью преобразовывать сгруппированный опорный шаблон в слово (140) данных, содержащее второе число битов, превышающее первое число битов; или
- при этом модуль (115) преобразования сконфигурирован с возможностью преобразовывать сгруппированный опорный шаблон, содержащий первое число битов, в слово (140) данных, содержащее второе число битов, превышающее первое число битов.
20. Кодер по п. 1, при этом кодер (100) сконфигурирован с возможностью выводить кодированные вторичные мультимедийные данные в качестве потока (145) цифровых слов (142) в качестве управляющей дорожки и выводить вплоть до 15 каналов первичных мультимедийных данных в качестве аудиодорожек, при этом управляющая дорожка и аудиодорожки формируются в соответствии с AES3-стандартом.
21. Декодер (50) для декодирования мультимедийного сигнала (155), содержащего принимаемый поток (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55), содержащие метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), и опорный шаблон, указывающий опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;
- при этом декодер сконфигурирован с возможностью восстанавливать вторичные мультимедийные данные (80, 125), при этом восстановление содержит:
- анализ опорного шаблона, чтобы вычислять и компенсировать усиление или ослабление или смещение постоянного тока, применяемое к потоку цифровых слов; или
- преобразование частоты дискретизации, ассоциированной с цифровыми словами (140), согласно предварительно определенному моменту времени первичных мультимедийных данных, указываемых в опорном шаблоне (135), в предварительно определенную частоту дискретизации, с тем чтобы получать восстановленные вторичные мультимедийные данные (80, 125),
- при этом декодер сконфигурирован с возможностью извлекать поток (125') битов из восстановленных вторичных мультимедийных данных (80, 125).
22. Декодер (50) по п. 21, в котором восстановление содержит манипулирование принимаемым потоком (145) цифровых слов (142) относительно амплитуд, представленных посредством принимаемых цифровых слов (142).
23. Декодер (50) по п. 21, в котором мультимедийный сигнал дополнительно содержит дополнительный принимаемый поток цифровых слов, представляющий кодированные первичные мультимедийные данные, причем дополнительный принимаемый поток является отдельным от принимаемого потока, и
- при этом декодер сконфигурирован с возможностью обрабатывать первичные мультимедийные данные, представленные посредством дополнительного принимаемого потока, с использованием метаданных или управляющих данных, представленных посредством потока битов.
24. Декодер (50) по п. 21, содержащий:
- анализатор (60) опорных шаблонов для анализа опорного шаблона (135) кодированных вторичных мультимедийных данных (55), при этом анализатор (60) опорных шаблонов сконфигурирован с возможностью определять амплитуду (41, 42) опорного шаблона (135) или определять предварительно определенный момент (40) времени в первичных мультимедийных данных (90, 90a, 90b);
- манипулятор (65) сигналов для манипулирования кодированными вторичными мультимедийными данными (55) в соответствии с проанализированным опорным шаблоном (75) и вычисленным опорным шаблоном, чтобы получать вторичные мультимедийные данные (80, 125);
- процессор (70) сигналов для обработки первичных мультимедийных данных (90, 90a, 90b) согласно кодированным вторичным мультимедийным данным (55), чтобы получать декодированный мультимедийный сигнал (85).
25. Декодер (50) по п. 21, в котором анализатор опорных шаблонов содержит:
- модуль (32) определения моментов времени, сконфигурированный с возможностью определять предварительно заданный момент времени первичных мультимедийных данных в опорном шаблоне с точки зрения выборок частоты дискретизации;
- модуль (33) повышающей дискретизации, сконфигурированный с возможностью повышающе дискретизировать диапазон вокруг определенного момента времени, чтобы определять точную позицию предварительно определенного момента времени;
- дискретизирующий модуль (34) накопления, сконфигурированный с возможностью определять точную позицию цифровых слов в потоке цифровых слов, чтобы получать фактическую частоту дискретизации, ассоциированную с цифровыми словами, отличающуюся от предварительно определенной частоты дискретизации.
26. Декодер (50) по п. 21, в котором анализатор (60) опорных шаблонов содержит модуль (94) вычисления коэффициентов усиления, чтобы вычислять коэффициент усиления или ослабления согласно амплитуде опорного шаблона и амплитуде вычисленного опорного шаблона, при этом манипулятор (65) сигналов содержит умножитель (27), сконфигурированный с возможностью усиливать или ослаблять слова данных согласно коэффициенту усиления или ослабления, чтобы получать слова данных с компенсацией усиления.
27. Декодер (50) по п. 21,
- в котором анализатор опорных шаблонов содержит амплитудный детектор, чтобы определять амплитуду опорного шаблона и дополнительную амплитуду опорного шаблона;
- при этом анализатор (60) опорных шаблонов дополнительно содержит модуль (96) компенсации смещения, сконфигурированный с возможностью вычислять смещение (96a) кодированных вторичных мультимедийных данных согласно уходу амплитуды опорного шаблона (135) и дополнительной амплитуды опорного шаблона, при этом манипулятор (65) сигналов содержит сумматор, сконфигурированный с возможностью суммировать смещение кодированных вторичных мультимедийных данных с кодированными вторичными мультимедийными данными для того, чтобы получать кодированные вторичные мультимедийные данные (96) с компенсацией смещения.
28. Декодер (50) по п. 21,
- в котором манипулятор (65) сигналов содержит модуль (29) обратного преобразования, сконфигурированный с возможностью обратно преобразовывать вторичные мультимедийные данные, содержащие первое число битов, из слов (140) данных, содержащих второе число битов, превышающее первое число битов; или
- в котором манипулятор (65) сигналов содержит модуль (31) разгруппировки, сконфигурированный с возможностью разгруппировывать группу вторичных мультимедийных данных, содержащих первое число битов, чтобы получать поток битов декодированных вторичных мультимедийных данных.
29. Мультимедийный сигнал (155), содержащий:
- поток (145) цифровых слов (142), представляющих кодированные вторичные мультимедийные данные (55), содержащие метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), и опорный шаблон, указывающий опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;
- причем поток цифровых слов содержит импульсы данных, содержащие подвергнуты фильтрации нижних частот слова (140) данных или опорный шаблон (135), причем импульсы (15') данных содержат длину более чем в одну выборку предварительно определенной частоты дискретизации, при этом амплитуда импульса (15') данных взвешивается согласно слову (140) данных или опорному шаблону (135), при этом фильтр (15) сконфигурирован с возможностью суммировать последовательные взвешенные импульсы данных в моменты предварительно определенной частоты дискретизации, с тем чтобы получать поток цифровых слов.
30. Мультимедийный сигнал (155) по п. 29, в котором цифровые слова (142) содержат фильтрованные вторичные мультимедийные данные.
31. Мультимедийный сигнал (155) по п. 29, в котором вторичные мультимедийные данные содержат опорный шаблон (135) и множество слов (140) данных.
32. Мультимедийный сигнал (155) по п. 29, в котором вторичные мультимедийные данные преобразуются в слова данных с зазором до старшего бита слова данных или младшего бита слова данных.
33. Мультимедийный сигнал (155) по п. 29, в котором опорный шаблон содержит опорную амплитуду кодированных вторичных мультимедийных данных и предварительно определенный момент времени в первичных мультимедийных данных, при этом множество слов данных содержат вторичные мультимедийные данные.
34. Мультимедийный сигнал (155) по п. 29, в котором мультимедийный сигнал содержит дополнительный поток первичных мультимедийных данных, при этом первичные мультимедийные данные содержат аудиоданные или видеоданные, при этом дополнительный поток, содержащий первичные мультимедийные данные, совмещается с потоком кодированных вторичных мультимедийных данных в предварительно определенный момент времени в первичных мультимедийных данных.
35. Способ (1100) для декодирования мультимедийного сигнала (155), содержащего принимаемый поток (145) цифровых слов, представляющих кодированные вторичные мультимедийные данные (55), содержащие метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), и опорный шаблон временного распределения, указывающий момент времени в первичных мультимедийных данных, при этом способ содержит этапы, на которых:
- восстанавливают вторичные мультимедийные данные (80, 125), при этом восстановление содержит этапы, на которых:
- анализируют опорный шаблон, чтобы вычислять и компенсировать усиление или ослабление или смещение постоянного тока, применяемое к потоку цифровых слов, или
- преобразуют частоту дискретизации, ассоциированную с цифровыми словами (140), согласно предварительно определенному моменту времени первичных мультимедийных данных, указываемых в опорном шаблоне (135), в предварительно определенную частоту дискретизации, с тем, чтобы получать восстановленные вторичные мультимедийные данные (80, 125); и
- извлекают поток (125') битов из восстановленных вторичных мультимедийных данных (80, 125).
36. Способ (1200) для кодирования вторичных мультимедийных данных (80, 125), содержащих метаданные или управляющие данные для первичных мультимедийных данных (90, 90a, 90b), при этом способ содержит этапы, на которых:
- группируют поток битов вторичных мультимедийных данных (125), чтобы формировать сгруппированные вторичные мультимедийные данные (130), представляющие слова данных;
- формируют опорный шаблон (135), указывающий опорную амплитуду или предварительно определенный момент времени в первичных мультимедийных данных;
- подвергают фильтрации нижних частот слова данных или опорный шаблон (135), чтобы получать импульсы (15') данных, содержащие длину более чем в одну выборку предварительно определенной частоты дискретизации, при этом амплитуда импульса (15') данных взвешивается согласно сгруппированным вторичным мультимедийным данным или словам данных, при этом фильтр (15) сконфигурирован с возможностью суммировать последовательные взвешенные импульсы данных в моменты предварительно определенной частоты дискретизации, с тем чтобы получать поток цифровых слов,
- выводят кодированные вторичные мультимедийные данные в качестве потока (145) цифровых слов (142).
37. Компьютерная программа, имеющая программный код для осуществления способа по п. 35 или 36, когда компьютерная программа работает на компьютере.
38. Система обработки данных, содержащая:
- кодер по п. 1; и
- декодер по п. 21.
39. Система обработки данных по п. 38, дополнительно содержащая:
- манипулятор сигналов для манипулирования потоком (145) цифровых слов (142), чтобы получать манипулируемый поток цифровых слов,
- при этом декодер сконфигурирован с возможностью восстанавливать поток цифровых слов из манипулируемого потока цифровых слов.
40. Система обработки данных по п. 39, в которой манипулятор сигналов сконфигурирован с возможностью манипулировать посредством усиления амплитуды или ослабления амплитуды либо введения смещения или варьирования смещения, либо частотно-избирательного ослабления или усиления, либо повторной дискретизации, и
- при этом декодер (50) сконфигурирован с возможностью восстанавливать поток цифровых слов, манипулируемых посредством усиления амплитуды или ослабления амплитуды либо введения смещения или варьирования смещения, либо частотно-избирательного ослабления или усиления, либо повторной дискретизации.
41. Система обработки данных по п. 39, в которой манипулятор сигналов сконфигурирован с возможностью принимать PCM-аудиоканал и выводить PCM-аудиоканал,
- при этом кодер сконфигурирован с возможностью выводить сигнал, допускающий передачу по PCM-аудиоканалу, и
- при этом декодер сконфигурирован с возможностью принимать принимаемый поток из PCM-аудиоканала.
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP14192907.5 | 2014-11-12 | ||
| EP14192907 | 2014-11-12 | ||
| EP15163198.3 | 2015-04-10 | ||
| EP15163198 | 2015-04-10 | ||
| EP15181428 | 2015-08-18 | ||
| EP15181428.2 | 2015-08-18 | ||
| PCT/EP2015/075987 WO2016075053A1 (en) | 2014-11-12 | 2015-11-06 | Decoder for decoding a media signal and encoder for encoding secondary media data comprising metadata or control data for primary media data |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| RU2017120175A3 RU2017120175A3 (ru) | 2018-12-13 |
| RU2017120175A true RU2017120175A (ru) | 2018-12-13 |
| RU2679379C2 RU2679379C2 (ru) | 2019-02-07 |
Family
ID=54476977
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2017120175A RU2679379C2 (ru) | 2014-11-12 | 2015-11-06 | Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных |
Country Status (13)
| Country | Link |
|---|---|
| US (2) | US10349092B2 (ru) |
| EP (1) | EP3219105A1 (ru) |
| JP (2) | JP6530070B2 (ru) |
| KR (1) | KR102151707B1 (ru) |
| CN (1) | CN107211164B (ru) |
| AU (1) | AU2015345248B2 (ru) |
| CA (1) | CA2967519C (ru) |
| MX (1) | MX2017006198A (ru) |
| MY (1) | MY186808A (ru) |
| RU (1) | RU2679379C2 (ru) |
| SG (1) | SG11201703855SA (ru) |
| TW (1) | TWI631835B (ru) |
| WO (1) | WO2016075053A1 (ru) |
Families Citing this family (39)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1805891B1 (en) | 2004-10-26 | 2012-05-16 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
| TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
| CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
| US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
| CN107591158B (zh) | 2012-05-18 | 2020-10-27 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
| EP2901449B1 (en) | 2013-01-21 | 2018-01-03 | Dolby Laboratories Licensing Corporation | Audio encoder and decoder with program loudness and boundary metadata |
| US9841941B2 (en) | 2013-01-21 | 2017-12-12 | Dolby Laboratories Licensing Corporation | System and method for optimizing loudness and dynamic range across different playback devices |
| CN105074818B (zh) | 2013-02-21 | 2019-08-13 | 杜比国际公司 | 音频编码系统、用于产生比特流的方法以及音频解码器 |
| CN104080024B (zh) | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
| US9635417B2 (en) | 2013-04-05 | 2017-04-25 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
| TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
| EP4379715A3 (en) | 2013-09-12 | 2024-08-21 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
| WO2015038475A1 (en) | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
| CN110808723B (zh) | 2014-05-26 | 2024-09-17 | 杜比实验室特许公司 | 音频信号响度控制 |
| ES3036395T3 (en) | 2014-10-10 | 2025-09-18 | Dolby Laboratories Licensing Corp | Transmission-agnostic presentation-based program loudness |
| CN113242448B (zh) | 2015-06-02 | 2023-07-14 | 索尼公司 | 发送装置和方法、媒体处理装置和方法以及接收装置 |
| EP3996375A1 (en) * | 2016-05-26 | 2022-05-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Broadcast streaming of panoramic video for interactive clients |
| KR102666132B1 (ko) * | 2016-12-21 | 2024-05-14 | 삼성전자주식회사 | 반도체 메모리 장치의 데이터 정렬 회로, 반도체 메모리 장치 및 반도체 메모리 장치의 데이터 정렬 방법 |
| JP2018148488A (ja) * | 2017-03-08 | 2018-09-20 | ソニーセミコンダクタソリューションズ株式会社 | 信号処理装置および方法 |
| US10412395B2 (en) | 2017-03-10 | 2019-09-10 | Raytheon Company | Real time frame alignment in video data |
| US10390030B2 (en) * | 2017-03-10 | 2019-08-20 | Raytheon Company | Symbology encoding in video data |
| EP3622645B1 (en) * | 2017-05-12 | 2021-11-03 | Telefonaktiebolaget LM Ericsson (publ) | Adaptive crc length for beam sweeping |
| IT201700078297A1 (it) * | 2017-07-11 | 2019-01-11 | Inst Rundfunktechnik Gmbh | Verfahren und einrichtung zum ableiten von audioparameterwerten aus einem aes67 kompatiblen audioinformationssignal |
| JP7575947B2 (ja) * | 2018-07-02 | 2024-10-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 没入的オーディオ信号を含むビットストリームを生成するための方法および装置 |
| GB2593117A (en) * | 2018-07-24 | 2021-09-22 | Nokia Technologies Oy | Apparatus, methods and computer programs for controlling band limited audio objects |
| US10554963B1 (en) * | 2018-10-16 | 2020-02-04 | Raytheon Company | Video load balancing and error detection based on measured channel bandwidth |
| EP3973677A4 (en) * | 2019-05-21 | 2023-07-12 | Genetec Inc. | METHODS AND SYSTEMS FOR CODEC DETECTION IN VIDEO DATA STREAM |
| US12432046B2 (en) | 2019-05-21 | 2025-09-30 | Genetec Inc. | Methods and systems for processing information streams |
| US12073842B2 (en) * | 2019-06-24 | 2024-08-27 | Qualcomm Incorporated | Psychoacoustic audio coding of ambisonic audio data |
| US20230006785A1 (en) * | 2019-11-23 | 2023-01-05 | Creative Technology Ltd | System and method for transmitting data over a digital interface |
| CN111238547B (zh) * | 2020-01-19 | 2022-02-08 | 东方电气自动控制工程有限公司 | 一种位置式编码器过零翻转时转速计算的算法 |
| CN115668938B (zh) * | 2020-03-18 | 2026-01-13 | Lg电子株式会社 | 点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法 |
| WO2021232157A1 (en) * | 2020-05-19 | 2021-11-25 | The Governing Council Of The University Of Toronto | Sustained release pharmaceutical composition |
| CN112988109B (zh) * | 2021-05-17 | 2021-09-28 | 深圳市爱图仕影像器材有限公司 | 单音频接口信号切换电路及单音频接口切换装置 |
| JPWO2023171357A1 (ru) * | 2022-03-07 | 2023-09-14 | ||
| CN114339297B (zh) * | 2022-03-09 | 2022-06-21 | 央广新媒体文化传媒(北京)有限公司 | 音频处理方法、装置、电子设备和计算机可读存储介质 |
| CN114554027B (zh) * | 2022-03-16 | 2022-11-25 | 湖南双菱电子科技有限公司 | 一种音频嵌入处理及视音频同步输出处理方法 |
| CN115103286B (zh) * | 2022-04-29 | 2024-09-27 | 北京瑞森新谱科技股份有限公司 | 一种asio低延时声学采集方法 |
| CN116994600B (zh) * | 2023-09-28 | 2023-12-12 | 中影年年(北京)文化传媒有限公司 | 基于音频驱动角色口型的方法及系统 |
Family Cites Families (40)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA1109155A (en) * | 1977-07-14 | 1981-09-15 | Northern Telecom Limited | Automatic d-c offset cancellation in pcm encoders |
| US4550425A (en) * | 1982-09-20 | 1985-10-29 | Sperry Corporation | Speech sampling and companding device |
| DE3504734C2 (de) | 1985-02-12 | 1998-12-10 | Max Planck Gesellschaft | Verfahren und Vorrichtung zur Aufnahme von Spinresonanzdaten |
| JPH0865072A (ja) * | 1994-08-23 | 1996-03-08 | Mitsubishi Electric Corp | デジタル音声放送受信機 |
| US6411725B1 (en) * | 1995-07-27 | 2002-06-25 | Digimarc Corporation | Watermark enabled video objects |
| US5822360A (en) * | 1995-09-06 | 1998-10-13 | Solana Technology Development Corporation | Method and apparatus for transporting auxiliary data in audio signals |
| EP1431961B1 (en) * | 1995-12-06 | 2008-05-14 | Verance Corporation | Post-compression hidden data transport |
| US8908872B2 (en) * | 1996-06-07 | 2014-12-09 | That Corporation | BTSC encoder |
| US6226758B1 (en) * | 1997-09-30 | 2001-05-01 | Cirrus Logic, Inc. | Sample rate conversion of non-audio AES data channels |
| US6209094B1 (en) * | 1998-10-14 | 2001-03-27 | Liquid Audio Inc. | Robust watermark method and apparatus for digital signals |
| US6571144B1 (en) * | 1999-10-20 | 2003-05-27 | Intel Corporation | System for providing a digital watermark in an audio signal |
| US6737957B1 (en) * | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
| KR20020020899A (ko) * | 2000-03-30 | 2002-03-16 | 요트.게.아. 롤페즈 | 이진 소스신호의 복수의 비트의 스트림을 이진 채널신호의복수의 비트의 스트림으로 인코딩하는 방법 |
| US7088398B1 (en) * | 2001-12-24 | 2006-08-08 | Silicon Image, Inc. | Method and apparatus for regenerating a clock for auxiliary data transmitted over a serial link with video data |
| US20050213726A1 (en) * | 2001-12-31 | 2005-09-29 | Polycom, Inc. | Conference bridge which transfers control information embedded in audio information between endpoints |
| JP2004201267A (ja) * | 2002-10-24 | 2004-07-15 | Sony Corp | ディジタルフィルタ並びにその係数算出装置及び係数算出方法 |
| US7535836B2 (en) * | 2003-02-12 | 2009-05-19 | Broadcom Corporation | Method and system to provide word-level flow control using spare link bandwidth |
| DE60317578T2 (de) * | 2003-09-22 | 2008-09-18 | Inova Semiconductors Gmbh | System und verfahren zur bildung einer bidirektionalen multimediaverbindung |
| WO2005071676A2 (en) * | 2004-01-19 | 2005-08-04 | Koninklijke Philips Electronics N.V. | Embedding a secondary information signal in a channel data stream |
| US8826328B2 (en) * | 2004-11-12 | 2014-09-02 | Opentv, Inc. | Communicating primary content streams and secondary content streams including targeted advertising to a remote unit |
| KR100686521B1 (ko) * | 2005-09-23 | 2007-02-26 | 한국정보통신대학교 산학협력단 | 비디오 및 메타데이터의 통합을 위한 비디오 멀티미디어응용 파일 형식의 인코딩/디코딩 방법 및 시스템 |
| JP5130352B2 (ja) * | 2007-05-04 | 2013-01-30 | ノキア コーポレイション | マルチメディアコンテナファイルの受信ヒントトラックに記録するメディアストリーム |
| JP2009212697A (ja) * | 2008-03-03 | 2009-09-17 | Aiphone Co Ltd | テレビドアホン装置 |
| US20120033819A1 (en) * | 2010-08-06 | 2012-02-09 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus therefor, decoding apparatus therefor, and information storage medium |
| US8380334B2 (en) * | 2010-09-07 | 2013-02-19 | Linear Acoustic, Inc. | Carrying auxiliary data within audio signals |
| EP2614640A1 (en) * | 2010-09-10 | 2013-07-17 | Thomson Licensing | Video decoding using block- based mixed - resolution data pruning |
| JP5909100B2 (ja) * | 2012-01-26 | 2016-04-26 | 日本放送協会 | ラウドネスレンジ制御システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム |
| WO2014035864A1 (en) * | 2012-08-31 | 2014-03-06 | Dolby Laboratories Licensing Corporation | Processing audio objects in principal and supplementary encoded audio signals |
| KR101849612B1 (ko) * | 2013-01-28 | 2018-04-18 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 새로운 미디어 장치 상에 내장된 라우드니스 메타데이터를 갖거나 또는 갖지 않고 미디어의 정규화된 오디오 재생을 위한 방법 및 장치 |
| BR112015029329A8 (pt) * | 2013-05-30 | 2020-03-17 | Sony Corp | aparelho, método e sistema de processamento de sinal, e, meio de armazenamento legível por computador |
| TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
| EP2830047A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
| WO2015034275A1 (ko) * | 2013-09-05 | 2015-03-12 | 엘지전자(주) | 무선 통신 시스템에서 오디오/비디오 스트리밍 수행 방법 및 장치 |
| US9990935B2 (en) * | 2013-09-12 | 2018-06-05 | Dolby Laboratories Licensing Corporation | System aspects of an audio codec |
| CN106170988A (zh) * | 2014-03-13 | 2016-11-30 | 凡瑞斯公司 | 使用嵌入式代码的交互式内容获取 |
| US9928728B2 (en) * | 2014-05-09 | 2018-03-27 | Sony Interactive Entertainment Inc. | Scheme for embedding a control signal in an audio signal using pseudo white noise |
| US20150325115A1 (en) * | 2014-05-09 | 2015-11-12 | Sony Computer Entertainment Inc. | Scheme for embedding a control signal in an audio signal |
| PT3149955T (pt) * | 2014-05-28 | 2019-08-05 | Fraunhofer Ges Forschung | Processador de dados e transporte de dados de controlo do utilizador para descodificadores e renderizadores de áudio |
| US9838571B2 (en) * | 2015-04-10 | 2017-12-05 | Gvbb Holdings S.A.R.L. | Precision timing for broadcast network |
| US9934790B2 (en) * | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
-
2015
- 2015-11-05 TW TW104136494A patent/TWI631835B/zh active
- 2015-11-06 KR KR1020177016054A patent/KR102151707B1/ko active Active
- 2015-11-06 SG SG11201703855SA patent/SG11201703855SA/en unknown
- 2015-11-06 RU RU2017120175A patent/RU2679379C2/ru active
- 2015-11-06 MX MX2017006198A patent/MX2017006198A/es active IP Right Grant
- 2015-11-06 WO PCT/EP2015/075987 patent/WO2016075053A1/en not_active Ceased
- 2015-11-06 MY MYPI2017000703A patent/MY186808A/en unknown
- 2015-11-06 JP JP2017525797A patent/JP6530070B2/ja active Active
- 2015-11-06 AU AU2015345248A patent/AU2015345248B2/en active Active
- 2015-11-06 EP EP15790965.6A patent/EP3219105A1/en active Pending
- 2015-11-06 CN CN201580073193.6A patent/CN107211164B/zh active Active
- 2015-11-06 CA CA2967519A patent/CA2967519C/en active Active
-
2017
- 2017-05-08 US US15/589,839 patent/US10349092B2/en active Active
-
2019
- 2019-05-15 JP JP2019091836A patent/JP6887461B2/ja active Active
- 2019-06-21 US US16/448,454 patent/US11218740B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US11218740B2 (en) | 2022-01-04 |
| JP2019193268A (ja) | 2019-10-31 |
| BR112017009734A2 (pt) | 2018-02-06 |
| AU2015345248A1 (en) | 2017-06-01 |
| EP3219105A1 (en) | 2017-09-20 |
| MY186808A (en) | 2021-08-22 |
| JP6530070B2 (ja) | 2019-06-12 |
| TW201622368A (zh) | 2016-06-16 |
| CN107211164A (zh) | 2017-09-26 |
| KR20170084231A (ko) | 2017-07-19 |
| CA2967519A1 (en) | 2016-05-19 |
| CN107211164B (zh) | 2021-01-29 |
| RU2017120175A3 (ru) | 2018-12-13 |
| KR102151707B1 (ko) | 2020-09-03 |
| US20190373294A1 (en) | 2019-12-05 |
| RU2679379C2 (ru) | 2019-02-07 |
| US20180007398A1 (en) | 2018-01-04 |
| WO2016075053A1 (en) | 2016-05-19 |
| US10349092B2 (en) | 2019-07-09 |
| MX2017006198A (es) | 2017-07-31 |
| AU2015345248B2 (en) | 2019-02-14 |
| JP6887461B2 (ja) | 2021-06-16 |
| SG11201703855SA (en) | 2017-06-29 |
| JP2018500804A (ja) | 2018-01-11 |
| TWI631835B (zh) | 2018-08-01 |
| CA2967519C (en) | 2020-07-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2017120175A (ru) | Декодер для декодирования мультимедийного сигнала и кодер для кодирования вторичных мультимедийных данных, содержащих метаданные или управляющие данные для первичных мультимедийных данных | |
| CA3110057C (en) | Method and apparatus for compressing and decompressing a higher order ambisonics representation | |
| DK166933B1 (da) | Fremgangsmaade til overfoering af et audiosignal | |
| IL304770B2 (en) | Adaptive processing with multiple media processing nodes | |
| BR112012025570A2 (pt) | aparelho e método de processamento de sinal, meio de gravação, decodificador, codificador, métodos de decodificação e de codificação. | |
| BR112012025573A2 (pt) | Aparelho de processamento de sinal, métodos de processamento de sinal, de codificação e de decodificação, programa, codificador, e, decodificador | |
| RU2010140328A (ru) | Способ и устройство для кодирования и декодирования основывающегося на объектах аудиосигнала | |
| US10019997B2 (en) | Method and apparatus for quantisation index modulation for watermarking an input signal | |
| US20140214431A1 (en) | Sample rate scalable lossless audio coding | |
| TR201816634T4 (tr) | Bağımsız gürültü-doldurma kullanarak iyileştirilmiş bir sinyal üretmek için cihaz ve yöntem. | |
| JP2005530206A (ja) | 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム | |
| Bae et al. | A new hybrid non-uniform coding with low bit rates for sound signal in near field communication | |
| US9813725B1 (en) | System, method, and computer program for encoding and decoding a unique signature in a video file | |
| JP2007333785A (ja) | オーディオ信号符号化装置およびオーディオ信号符号化方法 | |
| CN101647201A (zh) | 以低比特率对包含噪声的音频信号进行编码/解码的方法和设备 | |
| US20160035365A1 (en) | Sound encoding device, sound encoding method, sound decoding device and sound decoding method | |
| US8781134B2 (en) | Method and apparatus for encoding and decoding stereo audio | |
| JP5131596B2 (ja) | 信号分離再生装置および信号分離再生方法 | |
| JP5640238B2 (ja) | 特異点信号処理システムおよびそのプログラム | |
| Hoffmann et al. | The Sennheiser vocoder goes digital-on a German R&D project in the 1970s. | |
| KR102345487B1 (ko) | 이중 도메인을 이용한 음원 분리기의 훈련 방법, 음원 분리 방법 및 그 장치 | |
| KR101425354B1 (ko) | 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치 | |
| FR2639779A1 (fr) | Dispositif de codage et de decodage des signaux de radiodiffusion sonore | |
| JP2006023658A (ja) | オーディオ信号符号化装置及びオーディオ信号符号化方法 | |
| HK40107858A (zh) | 包括编码hoa表示的位流的解码方法和装置、以及介质 |