[go: up one dir, main page]

RU2020111480A - Устройство и способ кодирования, устройство и способ декодирования и программа - Google Patents

Устройство и способ кодирования, устройство и способ декодирования и программа Download PDF

Info

Publication number
RU2020111480A
RU2020111480A RU2020111480A RU2020111480A RU2020111480A RU 2020111480 A RU2020111480 A RU 2020111480A RU 2020111480 A RU2020111480 A RU 2020111480A RU 2020111480 A RU2020111480 A RU 2020111480A RU 2020111480 A RU2020111480 A RU 2020111480A
Authority
RU
Russia
Prior art keywords
metadata
data
decoding
frame
audio data
Prior art date
Application number
RU2020111480A
Other languages
English (en)
Other versions
RU2020111480A3 (ru
Inventor
Мицуюки ХАТАНАКА
Тору ТИНЕН
Original Assignee
Сони Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сони Корпорейшн filed Critical Сони Корпорейшн
Publication of RU2020111480A publication Critical patent/RU2020111480A/ru
Publication of RU2020111480A3 publication Critical patent/RU2020111480A3/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6005Decoder aspects
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6011Encoder aspects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (37)

1. Устройство декодирования, содержащее:
блок декодирования, который декодирует аудиоданные, содержащие объектное аудио, причем аудиоданные содержатся в кодированном битовом потоке, и считывает метаданные объектного аудио из области, в которой могут храниться произвольные данные кодированного битового потока; и
устройство вывода, которое выводит декодированные аудиоданные на основе метаданных.
2. Устройство декодирования по п. 1, в котором из соответствующего множества областей кодированного битового потока для одного кадра блок декодирования считывает множество фрагментов данных, полученных делением метаданных, и получает метаданные на основе множества фрагментов данных.
3. Устройство декодирования по п. 1, в котором из соответствующего множества областей множества кадров кодированного битового потока блок декодирования считывает множество фрагментов данных, полученных делением метаданных, и получает метаданные для множества кадров на основе множества фрагментов данных.
4. Устройство декодирования по п. 3, в котором метаданные для множества кадров содержат репрезентативное значение метаданных для периода времени, содержащего множество кадров, и конечное значение которое является метаданными в конечном кадре периода времени.
5. Устройство декодирования по п. 4, в котором блок декодирования дополнительно содержит блок формирования метаданных, который дополнительно считывает из области информацию о применяемяемом кадре, указывающую кадр, репрезентативное значение которого используется в качестве метаданных, и которое формирует метаданные кадров в периоде времени, выполняя процесс интерполяции на основе репрезентативного значения, конечного значения и информации о применяемом кадре.
6. Устройство декодирования по п. 1, в котором на основе метаданных, которые временно были считаны последними из числа фрагментов метаданных, считанных из областей в кадрах, предшествующих заданному кадру, устройство вывода выводит декодированные аудиоданные заданного кадра.
7. Устройство декодирования по п. 6, в котором согласно команде, касающейся того, использовать ли метаданные, которые были считаны последними, устройство вывода выводит декодированные аудиоданные заданного кадра на основе метаданных, считанных последними.
8. Устройство декодирования по п. 1, в котором в случае, когда метаданные заданного кадра не смогли быть получены, устройство вывода выводит декодированные аудиоданные заданного кадра на основе других метаданных, которые отличаются от метаданных, считанных из области.
9. Устройство декодирования по п. 1, в котором
кодированный битовый поток содержит битовый поток AAC, и
блок декодирования считывает метаданные из DSE, который является областью.
10. Устройство декодирования по п. 1, в котором
кодированный битовый поток содержит битовый поток AAC, и
блок декодирования считывает информацию конфигурации аудиоданных или информацию аудиоданных о расположении громкоговорителей из PCE битового потока AAC.
11. Способ декодирования, выполняемый устройством декодирования, содержащий этапы, на которых:
декодируют аудиоданные, содержащие объектное аудио, причем аудиоданные содержатся в кодированном битовом потоке, и считывают метаданные объектного аудио из области, в которой могут храниться произвольные данные кодированного битового потока; и
выводят декодированные аудиоданные на основе метаданных.
12. Программа, заставляющая компьютер выполнять процесс, содержащий этапы, на которых:
декодируют аудиоданные, содержащие объектное аудио, причем аудиоданные содержатся в кодированном битовом потоке, и считывают метаданные объектного аудио из области, в которой могут храниться произвольные данные кодированного битового потока; и
выводят декодированные аудиоданные на основе метаданных.
13. Устройство кодирования, содержащее блок кодирования, который кодирует аудиоданные, содержащие объектное аудио, и хранит метаданные объектного аудио в области, в который могут храниться произвольные данные, для формирования кодированного битового потока, содержащего метаданные и кодированные аудиоданные.
14. Устройство кодирования по п. 13, в котором блок кодирования хранит множество фрагментов данных, полученных делением метаданных на соответствующее множество областей в кодированном битовом потоке для одного кадра.
15. Устройство кодирования по п. 13, в котором блок кодирования хранит множество фрагментов данных в соответствующем множестве областей множества кадров в кодированном битовом потоке, причем множество фрагментов данных были получены делением метаданных для множества кадров.
16. Устройство кодирования по п. 15, дополнительно содержащее блок определения метаданных, определяющий репрезентативное значение метаданных для некоторого периода времени, содержащего множество кадров, и использующий репрезентативное значение в качестве метаданных для множества кадров.
17. Устройство кодирования по п. 16, в котором блок определения метаданных определяет конечное значение, которое является метаданными в конечном кадре периода времени, и использует репрезентативное значение и конечное значение в качестве метаданных для множества кадров.
18. Устройство кодирования по п. 16, в котором блок кодирования хранит в определенной области информацию о применяемом кадре, указывающую кадр, использующий репрезентативное значение в качестве метаданных.
19. Устройство кодирования по любому из пп. 13-18, в котором блок кодирования хранит в определенной области информацию, подающую команду в отношении того, использовать ли в качестве метаданных заданного кадра метаданные кадра, ближайшего к заданному кадру, из числа фрагментов метаданных, временно хранящихся в областях кадров перед заданным кадром.
20. Устройство кодирования по п. 13, в котором
кодированный битовый поток содержит битовый поток AAC, и
блок кодирования хранит метаданные в DSE, который является областью.
21. Устройство кодирования по п. 13, в котором
кодированный битовый поток содержит битовый поток AAC, и
блок кодирования хранит информацию конфигурации аудиоданных или информацию аудиоданных о расположении громкоговорителей в PCE битового потока AAC.
22. Способ кодирования, выполняемый устройством кодирования, содержащий этапы, на которых кодируют аудиоданные, содержащие объектное аудио, и сохраняют метаданные объектного аудио в области, в которой могут храниться произвольные данные, для формирования кодированного битового потока, содержащего метаданные и кодированные аудиоданные.
23. Программа, заставляющая компьютер выполнять процесс, содержащий этап кодирования аудиоданных, содержащих объектное аудио, и хранения метаданных объектного аудио в области, в которой могут храниться произвольные данные, для формирования кодированного битового потока, содержащего метаданные и кодированные аудиоданные.
RU2020111480A 2017-10-05 2018-09-21 Устройство и способ кодирования, устройство и способ декодирования и программа RU2020111480A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017195064 2017-10-05
JP2017-195064 2017-10-05
PCT/JP2018/034981 WO2019069710A1 (ja) 2017-10-05 2018-09-21 符号化装置および方法、復号装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
RU2020111480A true RU2020111480A (ru) 2021-09-20
RU2020111480A3 RU2020111480A3 (ru) 2021-12-08

Family

ID=65995091

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2020111480A RU2020111480A (ru) 2017-10-05 2018-09-21 Устройство и способ кодирования, устройство и способ декодирования и программа

Country Status (7)

Country Link
US (1) US11595056B2 (ru)
EP (1) EP3693961B1 (ru)
JP (1) JP7358986B2 (ru)
KR (1) KR102683551B1 (ru)
CN (1) CN111164679B (ru)
RU (1) RU2020111480A (ru)
WO (1) WO2019069710A1 (ru)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7739255B2 (ja) * 2019-07-08 2025-09-16 ヴォイスエイジ・コーポレーション オーディオストリーム内のメタデータのコーディングのためならびに柔軟なオブジェクト内およびオブジェクト間のビットレートの適応のための方法およびシステム
US11930349B2 (en) 2020-11-24 2024-03-12 Naver Corporation Computer system for producing audio content for realizing customized being-there and method thereof
JP7536733B2 (ja) * 2020-11-24 2024-08-20 ネイバー コーポレーション オーディオと関連してユーザカスタム型臨場感を実現するためのコンピュータシステムおよびその方法
KR102505249B1 (ko) * 2020-11-24 2023-03-03 네이버 주식회사 사용자 맞춤형 현장감 실현을 위한 오디오 콘텐츠를 전송하는 컴퓨터 시스템 및 그의 방법
JP7663418B2 (ja) * 2021-06-09 2025-04-16 日本放送協会 音響メタデータ処理装置及びプログラム
CN114299972B (zh) * 2021-12-30 2025-06-17 北京字跳网络技术有限公司 音频处理方法、装置、设备及存储介质
JP2024100287A (ja) * 2023-01-13 2024-07-26 株式会社デンソー 電子制御装置、mac送信方法、mac送信プログラム、及び電子制御システム
WO2024208964A1 (en) * 2023-04-06 2024-10-10 Telefonaktiebolaget Lm Ericsson (Publ) Stabilization of rendering with varying detail

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2984840T3 (es) * 2011-07-01 2024-10-31 Dolby Laboratories Licensing Corp Sistema y método para la generación, codificación e interpretación informática (o renderización) de señales de audio adaptativo
JP6012884B2 (ja) * 2012-12-21 2016-10-25 ドルビー ラボラトリーズ ライセンシング コーポレイション 知覚的基準に基づいてオブジェクト・ベースのオーディオ・コンテンツをレンダリングするためのオブジェクト・クラスタリング
EP3005356B1 (en) 2013-05-24 2017-08-09 Dolby International AB Efficient coding of audio scenes comprising audio objects
EP3005353B1 (en) * 2013-05-24 2017-08-16 Dolby International AB Efficient coding of audio scenes comprising audio objects
US20140358565A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Compression of decomposed representations of a sound field
EP2830047A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
JP6652320B2 (ja) 2013-12-16 2020-02-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置及び受信装置
CN114242082B (zh) 2014-05-30 2025-11-04 索尼公司 信息处理装置和信息处理方法
RU2700405C2 (ru) 2014-10-16 2019-09-16 Сони Корпорейшн Устройство передачи данных, способ передачи данных, приёмное устройство и способ приёма
TWI607655B (zh) 2015-06-19 2017-12-01 Sony Corp Coding apparatus and method, decoding apparatus and method, and program

Also Published As

Publication number Publication date
KR102683551B1 (ko) 2024-07-11
US20200265853A1 (en) 2020-08-20
US11595056B2 (en) 2023-02-28
JPWO2019069710A1 (ja) 2020-11-05
EP3693961A1 (en) 2020-08-12
CN111164679B (zh) 2024-04-09
EP3693961B1 (en) 2024-06-12
KR20200054978A (ko) 2020-05-20
CN111164679A (zh) 2020-05-15
JP7358986B2 (ja) 2023-10-11
EP3693961A4 (en) 2020-11-11
WO2019069710A1 (ja) 2019-04-11
RU2020111480A3 (ru) 2021-12-08

Similar Documents

Publication Publication Date Title
RU2020111480A (ru) Устройство и способ кодирования, устройство и способ декодирования и программа
AR123837A2 (es) Codificador de audio para la codificación de una señal de múltiples canales, un decodificador de audio para la decodificación de una señal de audio codificada, métodos y programa de computación
RU2017143404A (ru) Устройство кодирования, способ кодирования, устройство декодирования, способ декодирования и программа
RU2014106516A (ru) Устройство декодирования, способ декодирования, устройство кодирования, способ кодирования и программа
RU2016105691A (ru) Устройство и способ для эффективного кодирования метаданных объектов
JP2018532319A5 (ru)
RU2016119393A (ru) Аудиокодер и аудиодекодер с метаданными громкости и границы программы
JP2019535175A5 (ru)
RU2012143340A (ru) Декодер звукового сигнала, кодирующее устройство звукового сигнала, способы и компьютерная программа, использующие зависящее от частоты выборки кодирование контура деформации времени
JP2017535150A5 (ja) 画像を符号化する方法、画像を復号する方法、画像を符号化する装置、画像を復号する装置、及びプログラム
JP2015194666A5 (ru)
RU2012127132A (ru) Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
RU2014106530A (ru) Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа
JP2010210680A5 (ru)
JP2016103804A5 (ru)
US10699723B2 (en) Encoding and decoding of digital audio signals using variable alphabet size
RU2017120115A (ru) Обеспечение информации точности в устройстве кодирования изображения, способ и программа кодирования изображения, устройство декодирования изображения, и способ и программа декодирования изображения
CN110249384B (zh) 具有索引编码和位安排的量化器
RU2018115787A (ru) Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования
JP6526091B2 (ja) 低複雑度の調性適応音声信号量子化
RU2017117896A (ru) Кодирование и декодирование аудиосигналов
US9691397B2 (en) Device and method data for embedding data upon a prediction coding of a multi-channel signal
JP7257965B2 (ja) デジタルオーディオ信号における差分データ
CN101641733A (zh) 对音频信号编码和解码的方法和设备
JP6510566B2 (ja) オーディオ信号の時間包絡線を処理するための方法および装置、ならびにエンコーダ