KR102506167B1 - 신호 처리 장치 및 방법, 및 프로그램 - Google Patents
신호 처리 장치 및 방법, 및 프로그램 Download PDFInfo
- Publication number
- KR102506167B1 KR102506167B1 KR1020197029362A KR20197029362A KR102506167B1 KR 102506167 B1 KR102506167 B1 KR 102506167B1 KR 1020197029362 A KR1020197029362 A KR 1020197029362A KR 20197029362 A KR20197029362 A KR 20197029362A KR 102506167 B1 KR102506167 B1 KR 102506167B1
- Authority
- KR
- South Korea
- Prior art keywords
- information
- frame
- spread
- spread information
- audio object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/055—Time compression or expansion for synchronising with other signals, e.g. video signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04845—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2203/00—Indexing scheme relating to G06F3/00 - G06F3/048
- G06F2203/048—Indexing scheme relating to G06F3/048
- G06F2203/04806—Zoom, i.e. interaction techniques or interactors for controlling the zooming operation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
Abstract
Description
도 2는 부호화 장치의 구성예를 도시하는 도면이다.
도 3은 부호화 처리를 설명하는 흐름도이다.
도 4는 복호 장치의 구성예를 도시하는 도면이다.
도 5는 복호 처리를 설명하는 흐름도이다.
도 6은 스프레드 정보의 생성에 대하여 설명하는 도면이다.
도 7은 부호화 처리를 설명하는 흐름도이다.
도 8은 복호 처리를 설명하는 흐름도이다.
도 9는 줌에 대하여 설명하는 도면이다.
도 10은 줌에 따른 오브젝트 위치 정보의 수정에 대하여 설명하는 도면이다.
도 11은 복호 장치의 구성예를 도시하는 도면이다.
도 12는 복호 처리를 설명하는 흐름도이다.
도 13은 컴퓨터의 구성예를 도시하는 도면이다.
22 : 오브젝트 오디오 부호화부
23 : 메타데이터 입력부
24 : 스프레드 정보 생성부
101 : 복호 장치
111 : 언패킹/복호부
112 : 스프레드 정보 생성부
113 : 렌더링부
161 : 위치 정보 수정부
162 : 스프레드 정보 수정부
Claims (12)
- 오디오 오브젝트의 처리 대상의 프레임의 오브젝트 위치 정보 및 상기 오디오 오브젝트의 상기 처리 대상의 프레임과는 상이한 다른 프레임의 스프레드 정보와, 줌 정보와, 상기 오디오 오브젝트의 크기 정보 중 어느 것에 기초하여, 상기 오디오 오브젝트의 상기 처리 대상의 프레임의 스프레드 정보를 생성하는 스프레드 정보 생성부를 구비하고,
상기 스프레드 정보 생성부에 의해 생성된 스프레드 정보는, 상기 오디오 오브젝트의 음상의 크기의 범위를 나타내는 각도 정보이고,
상기 스프레드 정보 생성부는, 상기 오디오 오브젝트의 상기 다른 프레임의 상기 스프레드 정보와, 상기 오디오 오브젝트의 상기 처리 대상의 프레임 및 상기 다른 프레임의 상기 오브젝트 위치 정보에 기초하여 상기 처리 대상의 프레임의 상기 스프레드 정보를 생성하는, 신호 처리 장치. - 제1항에 있어서,
상기 오브젝트 위치 정보는, 기준 위치로부터 상기 오디오 오브젝트까지의 거리인, 신호 처리 장치. - 제2항에 있어서,
상기 스프레드 정보 생성부는, 상기 처리 대상의 프레임에 있어서의 상기 거리 및 상기 다른 프레임에 있어서의 상기 거리의 비와, 상기 다른 프레임의 상기 스프레드 정보의 정접의 곱의 역정접을 상기 처리 대상의 프레임의 상기 스프레드 정보로서 생성하는, 신호 처리 장치. - 오디오 오브젝트의 처리 대상의 프레임의 오브젝트 위치 정보 및 상기 오디오 오브젝트의 상기 처리 대상의 프레임과는 상이한 다른 프레임의 스프레드 정보와, 줌 정보와, 상기 오디오 오브젝트의 크기 정보 중 어느 것에 기초하여, 상기 오디오 오브젝트의 상기 처리 대상의 프레임의 스프레드 정보를 생성하는 단계
를 포함하고,
생성된 스프레드 정보는, 상기 오디오 오브젝트의 음상의 크기의 범위를 나타내는 각도 정보이고,
상기 처리 대상의 프레임의 스프레드 정보를 생성하는 단계는, 상기 오디오 오브젝트의 상기 다른 프레임의 상기 스프레드 정보와, 상기 오디오 오브젝트의 상기 처리 대상의 프레임 및 상기 다른 프레임의 상기 오브젝트 위치 정보에 기초하는 것인, 신호 처리 방법. - 오디오 오브젝트의 처리 대상의 프레임의 오브젝트 위치 정보 및 상기 오디오 오브젝트의 상기 처리 대상의 프레임과는 상이한 다른 프레임의 스프레드 정보와, 줌 정보와, 상기 오디오 오브젝트의 크기 정보 중 어느 것에 기초하여, 상기 오디오 오브젝트의 상기 처리 대상의 프레임의 스프레드 정보를 생성하는 단계 - 생성된 스프레드 정보는, 상기 오디오 오브젝트의 음상의 크기의 범위를 나타내는 각도 정보이고,
상기 처리 대상의 프레임의 스프레드 정보를 생성하는 단계는, 상기 오디오 오브젝트의 상기 다른 프레임의 상기 스프레드 정보와, 상기 오디오 오브젝트의 상기 처리 대상의 프레임 및 상기 다른 프레임의 상기 오브젝트 위치 정보에 기초하는 것임 -
를 포함하는 처리를 컴퓨터에 실행시키는 프로그램을 기록한 컴퓨터 판독가능한 기록 매체. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017085907 | 2017-04-25 | ||
| JPJP-P-2017-085907 | 2017-04-25 | ||
| PCT/JP2018/015158 WO2018198767A1 (ja) | 2017-04-25 | 2018-04-11 | 信号処理装置および方法、並びにプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20190140913A KR20190140913A (ko) | 2019-12-20 |
| KR102506167B1 true KR102506167B1 (ko) | 2023-03-07 |
Family
ID=63919609
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020197029362A Active KR102506167B1 (ko) | 2017-04-25 | 2018-04-11 | 신호 처리 장치 및 방법, 및 프로그램 |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US20200126582A1 (ko) |
| EP (1) | EP3618463A4 (ko) |
| JP (2) | JP7107305B2 (ko) |
| KR (1) | KR102506167B1 (ko) |
| CN (1) | CN110537373B (ko) |
| BR (1) | BR112019021897A2 (ko) |
| RU (1) | RU2763785C2 (ko) |
| WO (1) | WO2018198767A1 (ko) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3206408B1 (en) * | 2014-10-10 | 2020-12-30 | Sony Corporation | Encoding device and method, playback device and method, and program |
| CN110537373B (zh) * | 2017-04-25 | 2021-09-28 | 索尼公司 | 信号处理装置和方法以及存储介质 |
| EP4358085A3 (en) | 2017-04-26 | 2024-07-10 | Sony Group Corporation | Signal processing device, method, and program |
| EP4074078A1 (en) * | 2019-12-12 | 2022-10-19 | Liquid Oxigen (Lox) B.V. | Generating an audio signal associated with a virtual sound source |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013514696A (ja) * | 2009-12-17 | 2013-04-25 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法 |
| WO2016208406A1 (ja) * | 2015-06-24 | 2016-12-29 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
Family Cites Families (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3256045B2 (ja) * | 1993-09-17 | 2002-02-12 | シャープ株式会社 | 音声出力回路 |
| GB2343347B (en) * | 1998-06-20 | 2002-12-31 | Central Research Lab Ltd | A method of synthesising an audio signal |
| US7532901B1 (en) * | 2001-03-16 | 2009-05-12 | Radeum, Inc. | Methods and apparatus to detect location and orientation in an inductive system |
| US8743284B2 (en) * | 2007-10-08 | 2014-06-03 | Motorola Mobility Llc | Synchronizing remote audio with fixed video |
| AU2009295348A1 (en) * | 2008-09-25 | 2010-04-01 | Igruuv Pty Ltd | Video and audio content system |
| JP5267362B2 (ja) * | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
| US10326978B2 (en) * | 2010-06-30 | 2019-06-18 | Warner Bros. Entertainment Inc. | Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning |
| US9124757B2 (en) * | 2010-10-04 | 2015-09-01 | Blue Jeans Networks, Inc. | Systems and methods for error resilient scheme for low latency H.264 video coding |
| US10154361B2 (en) * | 2011-12-22 | 2018-12-11 | Nokia Technologies Oy | Spatial audio processing apparatus |
| CN105723740B (zh) * | 2013-11-14 | 2019-09-17 | 杜比实验室特许公司 | 音频的屏幕相对呈现和用于这样的呈现的音频的编码和解码 |
| WO2015104451A1 (en) * | 2014-01-07 | 2015-07-16 | Nokia Technologies Oy | Method and apparatus for video coding and decoding |
| CN105900169B (zh) * | 2014-01-09 | 2020-01-03 | 杜比实验室特许公司 | 音频内容的空间误差度量 |
| EP2925024A1 (en) * | 2014-03-26 | 2015-09-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio rendering employing a geometric distance definition |
| EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
| EP2960854A1 (en) * | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and device for determining a set of modifiable elements in a group of pictures |
| JP6464449B2 (ja) * | 2014-08-29 | 2019-02-06 | 本田技研工業株式会社 | 音源分離装置、及び音源分離方法 |
| CN119132317A (zh) * | 2014-10-01 | 2024-12-13 | 杜比国际公司 | 高效drc配置文件传输 |
| EP3206408B1 (en) * | 2014-10-10 | 2020-12-30 | Sony Corporation | Encoding device and method, playback device and method, and program |
| WO2017020011A1 (en) * | 2015-07-30 | 2017-02-02 | Dolby Laboratories Licensing Corporation | Searching the results of an automatic speech recognition process |
| CN106385660B (zh) * | 2015-08-07 | 2020-10-16 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
| JP2017055149A (ja) | 2015-09-07 | 2017-03-16 | ソニー株式会社 | 音声処理装置および方法、符号化装置、並びにプログラム |
| CN105898669B (zh) * | 2016-03-18 | 2017-10-20 | 南京青衿信息科技有限公司 | 一种声音对象的编码方法 |
| CN117612539A (zh) * | 2016-05-30 | 2024-02-27 | 索尼公司 | 视频音频处理设备、视频音频处理方法和存储介质 |
| US10863297B2 (en) * | 2016-06-01 | 2020-12-08 | Dolby International Ab | Method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position |
| EP3301951A1 (en) * | 2016-09-30 | 2018-04-04 | Koninklijke KPN N.V. | Audio object processing based on spatial listener information |
| US10721578B2 (en) * | 2017-01-06 | 2020-07-21 | Microsoft Technology Licensing, Llc | Spatial audio warp compensator |
| US10861467B2 (en) * | 2017-03-01 | 2020-12-08 | Dolby Laboratories Licensing Corporation | Audio processing in adaptive intermediate spatial format |
| CN110537373B (zh) | 2017-04-25 | 2021-09-28 | 索尼公司 | 信号处理装置和方法以及存储介质 |
| US11595774B2 (en) * | 2017-05-12 | 2023-02-28 | Microsoft Technology Licensing, Llc | Spatializing audio data based on analysis of incoming audio data |
| GB201800918D0 (en) * | 2018-01-19 | 2018-03-07 | Nokia Technologies Oy | Associated spatial audio playback |
-
2018
- 2018-04-11 CN CN201880026183.0A patent/CN110537373B/zh active Active
- 2018-04-11 KR KR1020197029362A patent/KR102506167B1/ko active Active
- 2018-04-11 BR BR112019021897-1A patent/BR112019021897A2/pt not_active Application Discontinuation
- 2018-04-11 RU RU2019132899A patent/RU2763785C2/ru active
- 2018-04-11 WO PCT/JP2018/015158 patent/WO2018198767A1/ja not_active Ceased
- 2018-04-11 JP JP2019514363A patent/JP7107305B2/ja active Active
- 2018-04-11 US US16/606,257 patent/US20200126582A1/en not_active Abandoned
- 2018-04-11 EP EP18792058.2A patent/EP3618463A4/en not_active Withdrawn
-
2022
- 2022-07-14 JP JP2022112863A patent/JP7388492B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013514696A (ja) * | 2009-12-17 | 2013-04-25 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法 |
| WO2016208406A1 (ja) * | 2015-06-24 | 2016-12-29 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022137213A (ja) | 2022-09-21 |
| CN110537373A (zh) | 2019-12-03 |
| US20200126582A1 (en) | 2020-04-23 |
| CN110537373B (zh) | 2021-09-28 |
| RU2763785C2 (ru) | 2022-01-11 |
| JPWO2018198767A1 (ja) | 2020-02-27 |
| RU2019132899A (ru) | 2021-04-19 |
| BR112019021897A2 (pt) | 2020-05-26 |
| JP7388492B2 (ja) | 2023-11-29 |
| KR20190140913A (ko) | 2019-12-20 |
| JP7107305B2 (ja) | 2022-07-27 |
| EP3618463A4 (en) | 2020-04-29 |
| EP3618463A1 (en) | 2020-03-04 |
| WO2018198767A1 (ja) | 2018-11-01 |
| RU2019132899A3 (ko) | 2021-07-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7388492B2 (ja) | 信号処理装置および方法、並びにプログラム | |
| US11917221B2 (en) | Encoding device and method, reproduction device and method, and program | |
| JP7160032B2 (ja) | 信号処理装置および方法、並びにプログラム | |
| KR102653185B1 (ko) | 정보 처리 장치 및 방법, 그리고 프로그램이 저장된 컴퓨터 판독 가능한 기록매체 | |
| KR102683551B1 (ko) | 복호 장치 및 방법, 그리고 프로그램을 기록한 컴퓨터 판독가능 기록매체 | |
| US20240013795A1 (en) | Information processing device and method, and program | |
| US12495269B2 (en) | Method and apparatus for low complexity low bitrate 6DoF HOA rendering | |
| US11967153B2 (en) | Information processing apparatus, reproduction processing apparatus, and information processing method | |
| US20210204086A1 (en) | Signal processing apparatus and method as well as program | |
| CN114026849A (zh) | 信息处理装置、信息处理方法、再现处理装置以及再现处理方法 | |
| AU2024219691B2 (en) | Information processing device, method, and program | |
| KR102377449B1 (ko) | 다중 코덱 기반의 전방위 몰입형 비디오에 대한 디코딩 방법 및 디코딩 장치 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
Patent event date: 20191007 Patent event code: PA01051R01D Comment text: International Patent Application |
|
| PG1501 | Laying open of application | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20210219 Comment text: Request for Examination of Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220428 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20221127 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230228 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20230302 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |