KR101756838B1 - 다채널 오디오 신호를 다운 믹스하는 방법 및 장치 - Google Patents
다채널 오디오 신호를 다운 믹스하는 방법 및 장치 Download PDFInfo
- Publication number
- KR101756838B1 KR101756838B1 KR1020110013228A KR20110013228A KR101756838B1 KR 101756838 B1 KR101756838 B1 KR 101756838B1 KR 1020110013228 A KR1020110013228 A KR 1020110013228A KR 20110013228 A KR20110013228 A KR 20110013228A KR 101756838 B1 KR101756838 B1 KR 101756838B1
- Authority
- KR
- South Korea
- Prior art keywords
- channel
- block
- signal
- frequency
- downmixed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따라 다채널 오디오 신호를 다운 믹스하는 과정을 설명하기 위한 블록도,
도 3은 본 발명의 일 실시예에 따라 다채널 오디오 신호를 다운 믹스하는 과정을 설명하기 위한 순서도,
도 4는 본 발명의 일 실시예에 따라 스테레오 신호를 생성하는 과정을 설명하기 위한 순서도,
도 5는 본 발명의 일 실시예에 따라 5.1 채널의 오디오 신호를 Left/Right only 방식으로 다운 믹스하는 과정을 설명하기 위한 블록도,
도 6은 본 발명의 일 실시예에 따라 5.1 채널의 오디오 신호를 Left/Right total 방식으로 다운 믹스하는 과정을 설명하기 위한 블록도,
도 7은 본 발명의 일 실시예에 따라 7.1 채널의 오디오 신호를 Left/Right only 방식으로 다운 믹스하는 과정을 설명하기 위한 블록도,
도 8은 본 발명의 일 실시예에 따라 7.1 채널의 오디오 신호를 Left/Right total 방식으로 다운 믹스하는 과정을 설명하기 위한 블록도,
도 9는 본 발명의 일 실시예에 따른 다운 믹스 장치의 구조를 나타낸 도면이다.
Claims (7)
- 다채널 오디오 신호를 타겟 채널로 다운 믹스(down-mix)하는 방법에 있어서,
다채널 주파수 계수들 각각에 대하여 해당 오디오 샘플들의 인코딩에 적용된 블록 타입을 판단하는 단계;
상기 판단 결과에 따라 타겟 채널들 각각에 대하여 가장 많이 사용된 블록 타입의 주파수 계수들끼리 다운 믹스하는 단계;
상기 다운 믹스된 결과 생성된 주파수 계수 및 상기 다채널 주파수 계수들 중 다운 믹스되지 않은 주파수 계수를 시간 도메인으로 변환하는 단계; 및
상기 변환된 신호들을 이용하여 타겟 채널의 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 방법. - 제1항에 있어서,
상기 타겟 채널의 신호를 생성하는 단계는,
상기 다운 믹스되지 않은 주파수 계수로부터 변환된 신호의 레벨을 조절하는 단계; 및
상기 조절된 신호와 상기 다운 믹스 결과 생성된 주파수 계수로부터 변환된 신호를 다운 믹스하는 단계를 포함하는 것을 특징으로 하는 방법. - 제1항에 있어서,
상기 다운 믹스하는 단계는,
다운 믹스 방식이 Stereo Left/Right Only 방식이고, 사용 빈도가 동일한 블록 타입이 복수 개인 경우, 상기 다채널 주파수 계수들 중 스테레오 채널의 양쪽 모두에 반영되는 주파수 계수를 결정하고, 상기 결정된 주파수 계수에 사용되지 않은 블록 타입을 상기 가장 많이 사용된 블록 타입으로 결정하는 단계를 포함하는 것을 특징으로 하는 방법. - 다채널 오디오 신호를 타겟 채널로 다운 믹스(down-mix)하는 장치에 있어서,
다채널 주파수 계수들 각각에 대하여 해당 오디오 샘플들의 인코딩에 적용된 블록 타입을 판단하는 블록타입판단부;
상기 판단 결과에 따라 타겟 채널들 각각에 대하여 가장 많이 사용된 블록 타입의 주파수 계수들끼리 다운 믹스하는 다운믹스수행부;
상기 다운 믹스된 결과 생성된 주파수 계수 및 상기 다채널 주파수 계수들 중 다운 믹스되지 않은 주파수 계수를 시간 도메인으로 변환하는 변환부; 및
상기 변환된 신호들을 이용하여 타겟 채널의 신호를 생성하는 타겟채널신호생성부를 포함하는 것을 특징으로 하는 장치. - 제4항에 있어서,
상기 타겟채널신호생성부는,
상기 다운 믹스되지 않은 주파수 계수들로부터 변환된 신호의 레벨을 조절하는 레벨조절부; 및
상기 조절된 신호와 상기 다운 믹스 결과 생성된 주파수 계수로부터 변환된 신호를 다운 믹스하는 다운믹스부를 포함하는 것을 특징으로 하는 장치. - 제4항에 있어서,
상기 다운믹스수행부는,
다운 믹스 방식이 Stereo Left/Right Only 방식이고, 사용 빈도가 동일한 블록 타입이 복수 개인 경우, 상기 다채널 주파수 계수들 중 스테레오 채널의 양쪽 모두에 반영되는 주파수 계수를 결정하고, 상기 결정된 주파수 계수에 사용되지 않은 블록 타입을 상기 가장 많이 사용된 블록 타입으로 결정하는 것을 특징으로 하는 장치. - 제1항 내지 제3항 중 어느 한 항에 의한 방법을 실행하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US13/272,632 US8874449B2 (en) | 2010-10-13 | 2011-10-13 | Method and apparatus for downmixing multi-channel audio signals |
| CN201180059881.9A CN103262160B (zh) | 2010-10-13 | 2011-10-13 | 用于对多通道音频信号进行缩混的方法和设备 |
| JP2013533774A JP5753270B2 (ja) | 2010-10-13 | 2011-10-13 | 多チャネルオーディオ信号をダウンミックスする方法及び装置 |
| EP11832769.1A EP2628322B1 (en) | 2010-10-13 | 2011-10-13 | Method and apparatus for downmixing multi-channel audio signals |
| PCT/KR2011/007637 WO2012050382A2 (en) | 2010-10-13 | 2011-10-13 | Method and apparatus for downmixing multi-channel audio signals |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US39261810P | 2010-10-13 | 2010-10-13 | |
| US61/392,618 | 2010-10-13 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20120038351A KR20120038351A (ko) | 2012-04-23 |
| KR101756838B1 true KR101756838B1 (ko) | 2017-07-11 |
Family
ID=46139170
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020110013228A Expired - Fee Related KR101756838B1 (ko) | 2010-10-13 | 2011-02-15 | 다채널 오디오 신호를 다운 믹스하는 방법 및 장치 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US8874449B2 (ko) |
| EP (1) | EP2628322B1 (ko) |
| JP (1) | JP5753270B2 (ko) |
| KR (1) | KR101756838B1 (ko) |
| CN (1) | CN103262160B (ko) |
| WO (1) | WO2012050382A2 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2023120957A1 (ko) * | 2021-12-22 | 2023-06-29 | 삼성전자주식회사 | 송신 장치, 수신 장치 및 그 제어 방법 |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104541524B (zh) * | 2012-07-31 | 2017-03-08 | 英迪股份有限公司 | 一种用于处理音频信号的方法和设备 |
| EP2830332A3 (en) | 2013-07-22 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration |
| JP6721977B2 (ja) * | 2015-12-15 | 2020-07-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
| FR3045915A1 (fr) * | 2015-12-16 | 2017-06-23 | Orange | Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal |
| CN105812986A (zh) * | 2016-05-09 | 2016-07-27 | 中山奥凯华泰电子有限公司 | 将多声道缩混成无线两声道的音箱和处理方法 |
| GB2574667A (en) * | 2018-06-15 | 2019-12-18 | Nokia Technologies Oy | Spatial audio capture, transmission and reproduction |
| CN113544774B (zh) * | 2019-03-06 | 2024-08-20 | 弗劳恩霍夫应用研究促进协会 | 降混器及降混方法 |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5867819A (en) * | 1995-09-29 | 1999-02-02 | Nippon Steel Corporation | Audio decoder |
| SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
| SG54383A1 (en) * | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
| US5946352A (en) * | 1997-05-02 | 1999-08-31 | Texas Instruments Incorporated | Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain |
| WO1998051126A1 (en) * | 1997-05-08 | 1998-11-12 | Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. | Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions |
| US6141645A (en) * | 1998-05-29 | 2000-10-31 | Acer Laboratories Inc. | Method and device for down mixing compressed audio bit stream having multiple audio channels |
| AU781629B2 (en) | 1999-04-07 | 2005-06-02 | Dolby Laboratories Licensing Corporation | Matrix improvements to lossless encoding and decoding |
| US7613306B2 (en) | 2004-02-25 | 2009-11-03 | Panasonic Corporation | Audio encoder and audio decoder |
| WO2007109338A1 (en) * | 2006-03-21 | 2007-09-27 | Dolby Laboratories Licensing Corporation | Low bit rate audio encoding and decoding |
| EP1768107B1 (en) * | 2004-07-02 | 2016-03-09 | Panasonic Intellectual Property Corporation of America | Audio signal decoding device |
| US7860721B2 (en) * | 2004-09-17 | 2010-12-28 | Panasonic Corporation | Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality |
| WO2007010451A1 (en) * | 2005-07-19 | 2007-01-25 | Koninklijke Philips Electronics N.V. | Generation of multi-channel audio signals |
| US7761177B2 (en) * | 2005-07-29 | 2010-07-20 | Lg Electronics Inc. | Method for generating encoded audio signal and method for processing audio signal |
| US8019611B2 (en) * | 2005-10-13 | 2011-09-13 | Lg Electronics Inc. | Method of processing a signal and apparatus for processing a signal |
| CA2701457C (en) * | 2007-10-17 | 2016-05-17 | Oliver Hellmuth | Audio coding using upmix |
| JP4743228B2 (ja) * | 2008-05-22 | 2011-08-10 | 三菱電機株式会社 | デジタル音声信号解析方法、その装置、及び映像音声記録装置 |
| ATE557386T1 (de) * | 2008-06-26 | 2012-05-15 | France Telecom | Raumsynthese mehrkanaliger tonsignale |
-
2011
- 2011-02-15 KR KR1020110013228A patent/KR101756838B1/ko not_active Expired - Fee Related
- 2011-10-13 WO PCT/KR2011/007637 patent/WO2012050382A2/en not_active Ceased
- 2011-10-13 CN CN201180059881.9A patent/CN103262160B/zh not_active Expired - Fee Related
- 2011-10-13 US US13/272,632 patent/US8874449B2/en not_active Expired - Fee Related
- 2011-10-13 JP JP2013533774A patent/JP5753270B2/ja not_active Expired - Fee Related
- 2011-10-13 EP EP11832769.1A patent/EP2628322B1/en not_active Not-in-force
Non-Patent Citations (2)
| Title |
|---|
| J.Breebaart, et al. MPEG spatial audio coding/MPEG surround: overview and current status. Audio Engineering Society Convention 119. 2005.10.10. |
| Jonas Engdegard, et al. Spatial audio object coding (SAOC) - The upcoming MPEG standard on parametric object based audio coding. Audio Engineering Society Convention 124. 2008.05.20. |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2023120957A1 (ko) * | 2021-12-22 | 2023-06-29 | 삼성전자주식회사 | 송신 장치, 수신 장치 및 그 제어 방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP2628322B1 (en) | 2015-12-16 |
| EP2628322A4 (en) | 2014-08-06 |
| CN103262160A (zh) | 2013-08-21 |
| CN103262160B (zh) | 2015-06-17 |
| WO2012050382A2 (en) | 2012-04-19 |
| JP5753270B2 (ja) | 2015-07-22 |
| JP2013545128A (ja) | 2013-12-19 |
| US20120093322A1 (en) | 2012-04-19 |
| EP2628322A2 (en) | 2013-08-21 |
| KR20120038351A (ko) | 2012-04-23 |
| US8874449B2 (en) | 2014-10-28 |
| WO2012050382A3 (en) | 2012-06-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101058047B1 (ko) | 스테레오 신호 생성 방법 | |
| KR101756838B1 (ko) | 다채널 오디오 신호를 다운 믹스하는 방법 및 장치 | |
| CN103620677B (zh) | 音频信号帧中事件时隙位置的编码与译码技术 | |
| KR101029077B1 (ko) | 스테레오 신호 생성 방법 및 장치 | |
| US8433583B2 (en) | Audio decoding | |
| RU2696952C2 (ru) | Аудиокодировщик и декодер | |
| JP7383685B2 (ja) | バイノーラル・ダイアログ向上 | |
| KR20150038156A (ko) | 오브젝트-기반의 서라운드 코덱에 대한 피드백을 가진 스케일러블 다운믹스 설계 | |
| JP2009523259A (ja) | マルチチャンネル信号の復号化及び符号化方法、記録媒体及びシステム | |
| KR102881405B1 (ko) | 음향 환경 시뮬레이션 | |
| KR102657547B1 (ko) | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 | |
| CN108028988A (zh) | 处理低复杂度格式转换的内部声道的设备和方法 | |
| JP2015118123A (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| A201 | Request for examination | ||
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20220706 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20220706 |