WO2014088328A1

WO2014088328A1 - 오디오 제공 장치 및 오디오 제공 방법

Info

Publication number: WO2014088328A1
Application number: PCT/KR2013/011182
Authority: WO
Inventors: 조현; 김선민; 박재하; 전상배
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2012-12-04
Filing date: 2013-12-04
Publication date: 2014-06-12
Anticipated expiration: 2015-06-04
Also published as: MX347100B; JP2020025348A; AU2013355504C1; MX2015007100A; CA3031476C; EP2930952A4; US20180007483A1; CN107690123B; CN104969576B; MX2019011755A; CA2893729A1; SG10201709574WA; AU2016238969B2; JP6843945B2; BR112015013154A2; CN104969576A; EP2930952A1; KR101802335B1; RU2695508C1; BR112015013154B1

Abstract

오디오 제공 장치 및 이의 오디오 제공 방법이 제공된다. 본 오디오 제공 장치는 오브젝트 오디오 신호의 궤도 정보를 이용하여 오브젝트 오디오 신호를 렌더링하여 오브젝트 렌더링부, 제1 채널 수를 가지는 오디오 신호를 제2 채널 수를 가지는 오디오 신호로 렌더링하는 채널 렌더링부, 렌더링된 오브젝트 오디오 신호 및 제2 채널 수를 가지는 오디오 신호를 믹싱하는 믹싱부를 포함한다.

Description

오디오 제공 장치 및 오디오 제공 방법

본 발명은 오디오 제공 장치 및 오디오 제공 방법에 관한 것으로, 더욱 상세하게는, 다양한 포맷의 오디오 신호를 오디오 재생 시스템에 최적화되게 렌더링하여 출력하는 오디오 제공 장치 및 오디오 제공 방법에 관한 것이다.

현재 멀티미디어 시장은 다양한 오디오 포맷이 혼재되어 있는 상황이다. 예를 들어, 오디오 제공 장치는 2 채널의 오디오 포맷부터 22.2 채널의 오디오 포맷까지 다양한 오디오 포맷을 제공하고 있다. 특히, 근래에는 입체적인 공간에서 음원을 표현할 수 있는 7.1 채널, 11.1 채널 및 22.2 채널과 같은 오디오 시스템이 제공되고 있다.

그러나, 현재 제공되는 대부분의 오디오 신호는 2.1 채널 포맷이나 5.1 채널 포맷으로서, 입체적인 공간에서 음원을 표현하는데 한계가 존재한다. 또한, 7.1 채널, 11.1 채널 및 22.2 채널의 오디오 신호를 재생하기 위한 오디오 시스템을 가정에 설치하기에는 현실적인 어려움이 존재한다.

따라서, 입력 신호의 포맷 및 오디오 제공 장치에 따라 능동적으로 오디오 신호를 렌더링하기 위한 방안의 모색이 요청된다.

본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로, 채널 오디오 신호를 업믹싱 또는 다운믹싱을 통해 청취 환경에 최적화하고, 오브젝트 오디오 신호를 궤도 정보에 따라 렌더링하여 청취 환경에 최적화된 음상을 제공할 수 있는 오디오 제공 방법 및 이를 적용한 오디오 제공 장치를 제공함에 있다.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 오디오 제공 장치는, 오브젝트 오디오 신호의 궤도 정보를 이용하여 상기 오브젝트 오디오 신호를 렌더링하여 오브젝트 렌더링부; 제1 채널 수를 가지는 오디오 신호를 제2 채널 수를 가지는 오디오 신호로 렌더링하는 채널 렌더링부; 및 상기 렌더링된 오브젝트 오디오 신호 및 상기 제2 채널 수를 가지는 오디오 신호를 믹싱하는 믹싱부;를 포함한다.

그리고, 상기 오브젝트 렌더링부는, 상기 오브젝트 오디오 신호의 궤도 정보를 3차원 좌표 정보로 변환하는 궤도 정보 분석부; 상기 변환된 3차원 좌표 정보를 바탕으로 거리 제어 정보를 생성하는 거리 제어부; 상기 변환된 3차원 좌표 정보를 바탕으로 뎁스 제어 정보를 생성하는 뎁스 제어부; 상기 변환된 3차원 좌표 정보를 바탕으로 오브젝트 오디오 신호를 정위시키기 위한 정위 정보를 생성하는 정위부; 및 상기 거리 제어 정보, 뎁스 제어 정보 및 정위 정보를 바탕으로 상기 오브젝트 오디오 신호를 렌더링하는 렌더링부;를 포함할 수 있다.

또한, 상기 거리 제어부는, 상기 오브젝트 오디오 신호의 거리 게인을 산출하며, 상기 오브젝트 오디오 신호의 거리가 멀수록 상기 오브젝트 오디오 신호의 거리 게인을 감소시키고, 상기 오브젝트 오디오 신호의 거리가 가까울수록 상기 오브젝트 오디오 신호의 거리 게인을 증가시킬 수 있다.

그리고, 상기 뎁스 제어부는, 상기 오브젝트 오디오 신호의 수평면상 투영 거리를 바탕으로 뎁스 게인을 획득하며, 상기 뎁스 게인은, 네거티브 벡터 및 포지티브 벡터의 합으로 표현되거나 포지티브 벡터 및 널 벡터의 합으로 표현될 수 있다.

또한, 상기 정위부는, 상기 오디오 제공 장치의 스피커 레이아웃에 따라 상기 오브젝트 오디오 신호를 정위시키기 위한 패닝 게인을 산출할 수 있다.

그리고, 상기 렌더링부는, 상기 오브젝트 신호의 거리 게인, 뎁스 게인 및 패닝 게인을 바탕으로 상기 오브젝트 오디오 신호를 멀티 채널로 렌더링할 수 있다.

또한, 상기 오브젝트 렌더링부는, 상기 오브젝트 오디오 신호가 복수 개 존재하는 경우, 상기 복수의 오브젝트 오디오 신호 중 상관도를 갖는 오브젝트 사이의 위상 차이를 산출하고, 상기 복수의 오브젝트 오디오 신호 중 하나를 상기 산출된 위상 차이만큼 이동하여 상기 복수의 오브젝트 오디오 신호를 합성할 수 있다.

그리고, 상기 오디오 제공 장치가 동일한 고도를 가지는 복수의 스피커를 이용하여 오디오를 재생하는 경우, 상기 오브젝트 렌더링부는, 상기 오브젝트 오디오 신호의 스펙트럼 특성(spectral characteristics)을 보정하여 상기 오브젝트 오디오 신호에 가상 고도 정보를 제공하는 가상 필터부; 및 상기 가상 필터부에 의해 제공된 가상 고도 정보를 바탕으로 상기 오브젝트 오디오 신호를 렌더링하는 가상 렌더링부;를 포함할 수 있다.

또한, 상기 가상 필터부는, 복수의 단계로 구성된 트리 구조를 이룰 수 있다.

그리고, 상기 채널 렌더링부는, 상기 제1 채널 수를 가지는 오디오 신호의 레이아웃이 2차원인 경우, 상기 제1 채널 수를 가지는 오디오 신호를 상기 제1 채널 수보다 많은 상기 제2 채널 수를 가지는 오디오 신호로 업믹싱하며, 상기 제2 채널 수를 가지는 오디오 신호의 레이아웃은 상기 제1 채널 수를 가지는 오디오 신호와 상이한 고도 정보를 가지는 3차원일 수 있다.

또한, 상기 채널 렌더링부는, 상기 제1 채널 수를 가지는 오디오 신호의 레이아웃이 3차원인 경우, 상기 제1 채널 수를 가지는 오디오 신호를 상기 제1 채널 수보다 적은 상기 제2 채널 수를 가지는 오디오 신호로 다운믹싱하며, 상기 제2 채널 수를 가지는 오디오 신호의 레이아웃은 복수의 채널이 동일한 고도 성분을 가지는 2차원일 수 있다.

그리고, 상기 오브젝트 오디오 신호 및 상기 제1 채널 수를 가지는 오디오 신호 중 적어도 하나는, 특정 프레임에 대해 가상 3차원 렌더링을 수행할지 여부를 결정하는 정보를 포함할 수 있다.

또한, 상기 채널 렌더링부는, 상기 제1 채널 수를 가지는 오디오 신호를 상기 제2 채널 수를 가지는 오디오 신호로 렌더링하는 과정에서 상관도를 갖는 오디오 신호 사이의 위상 차이를 산출하고, 상기 복수의 오디오 신호 중 하나를 상기 산출된 위상 차이만큼 이동하여 상기 복수의 오디오 신호를 합성할 수 있다.

그리고, 상기 믹싱부는, 상기 렌더링된 오브젝트 오디오 신호와 상기 제2 채널 수를 가지는 오디오 신호를 믹싱하는 동안 상관도를 갖는 오디오 신호 사이의 위상 차이를 산출하고, 상기 복수의 오디오 신호 중 하나를 상기 산출된 위상 차이만큼 이동하여 상기 복수의 오디오 신호를 합성할 수 있다.

또한, 상기 오브젝트 오디오 신호는, 사용자에게 오브젝트 오디오 신호의 선택을 위한 오브젝트 오디오 신호의 ID 및 유형 정보 중 적어도 하나를 저장할 수 있다.

한편, 상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 오브젝트 오디오 신호의 궤도 정보를 이용하여 상기 오브젝트 오디오 신호를 렌더링하는 단계; 제1 채널 수를 가지는 오디오 신호를 제2 채널 수를 가지는 오디오 신호로 렌더링하는 단계; 및 상기 렌더링된 오브젝트 오디오 신호 및 상기 제2 채널 수를 가지는 오디오 신호를 믹싱하는 단계;를 포함한다.

그리고, 상기 오브젝트 오디오 신호를 렌더링하는 단계는, 상기 오브젝트 오디오 신호의 궤도 정보를 3차원 좌표 정보로 변환하는 단계; 상기 변환된 3차원 좌표 정보를 바탕으로 거리 제어 정보를 생성하는 단계; 상기 변환된 3차원 좌표 정보를 바탕으로 뎁스 제어 정보를 생성하는 단계; 상기 변환된 3차원 좌표 정보를 바탕으로 오브젝트 오디오 신호를 정위시키기 위한 정위 정보를 생성하는 단계; 및 상기 거리 제어 정보, 뎁스 제어 정보 및 정위 정보를 바탕으로 상기 오브젝트 오디오 신호를 렌더링하는 단계;를 포함할 수 있다.

또한, 상기 거리 제어 정보를 생성하는 단계는, 상기 오브젝트 오디오 신호의 거리 게인을 산출하며, 상기 오브젝트 오디오 신호의 거리가 멀수록 상기 오브젝트 오디오 신호의 거리 게인을 감소시키고, 상기 오브젝트 오디오 신호의 거리가 가까울수록 상기 오브젝트 오디오 신호의 거리 게인을 증가시킬 수 있다.

그리고, 상기 뎁스 제어 정보를 생성하는 단계는, 상기 오브젝트 오디오 신호의 수평면상 투영 거리를 바탕으로 뎁스 게인을 획득하며, 상기 뎁스 게인은, 네거티브 벡터 및 포지티브 벡터의 합으로 표현되거나 포지티브 벡터 및 널 벡터의 합으로 표현될 수 있다.

또한, 상기 정위 정보를 생성하는 단계는, 상기 오디오 제공 장치의 스피커 레이아웃에 따라 상기 오브젝트 오디오 신호를 정위시키기 위한 패닝 게인을 산출할 수 있다.

그리고, 상기 렌더링하는 단계는, 상기 오브젝트 신호의 거리 게인, 뎁스 게인 및 패닝 게인을 바탕으로 상기 오브젝트 오디오 신호를 멀티 채널로 렌더링할 수 있다.

또한, 상기 오브젝트 오디오 신호를 렌더링하는 단계는, 상기 오브젝트 오디오 신호가 복수 개 존재하는 경우, 상기 복수의 오브젝트 오디오 신호 중 상관도를 갖는 오브젝트 사이의 위상 차이를 산출하고, 상기 복수의 오브젝트 오디오 신호 중 하나를 상기 산출된 위상 차이만큼 이동하여 상기 복수의 오브젝트 오디오 신호를 합성할 수 있다.

그리고, 상기 오디오 제공 장치가 동일한 고도를 가지는 복수의 스피커를 이용하여 오디오를 재생하는 경우, 상기 오브젝트 오디오 신호를 렌더링하는 단계는, 상기 오브젝트 오디오 신호의 스펙트럼 특성(spectral characteristics)을 보정하여 상기 오브젝트 오디오 신호에 가상 고도 정보를 산출하는 단계; 상기 가상 필터부에 의해 제공된 가상 고도 정보를 바탕으로 상기 오브젝트 오디오 신호를 렌더링하는 단계;를 포함할 수 있다.

또한, 상기 산출하는 단계는, 복수의 단계로 구성된 트리 구조를 이루는 가상 필터를 이용하여 상기 오브젝트 오디오 신호의 가상 고도 정보를 산출할 수 있다.

그리고, 상기 제2 채널 수를 가지는 오디오 신호로 렌더링하는 단계는, 상기 제1 채널 수를 가지는 오디오 신호의 레이아웃이 2차원인 경우, 상기 제1 채널 수를 가지는 오디오 신호를 상기 제1 채널 수보다 많은 상기 제2 채널 수를 가지는 오디오 신호로 업믹싱하며, 상기 제2 채널 수를 가지는 오디오 신호의 레이아웃은 상기 제1 채널 수를 가지는 오디오 신호와 상이한 고도 정보를 가지는 3차원일 수 있다.

또한, 상기 제2 채널 수를 가지는 오디오 신호로 렌더링하는 단계는, 상기 제1 채널 수를 가지는 오디오 신호의 레이아웃이 3차원인 경우, 상기 제1 채널 수를 가지는 오디오 신호를 상기 제1 채널 수보다 적은 상기 제2 채널 수를 가지는 오디오 신호로 다운믹싱하며, 상기 제2 채널 수를 가지는 오디오 신호의 레이아웃은 복수의 채널이 동일한 고도 성분을 가지는 2차원일 수 있다.

또한, 상기 오브젝트 오디오 신호 및 상기 제1 채널 수를 가지는 오디오 신호 중 적어도 하나는, 특정 프레임에 대해 가상 3차원 렌더링을 수행할지 여부를 결정하는 정보를 포함할 수 있다.

상술한 바와 같은 본 발명의 다양한 실시예에 의해, 오디오 제공 장치는 다양한 포맷을 가지는 오디오 신호를 오디오 시스템 공간에 최적화되게 재생시킬 수 있게 된다.

도 1은 본 발명의 일 실시예에 따른, 오디오 제공 장치의 구성을 나타내는 블럭도,

도 2는 본 발명의 일 실시예에 따른, 오브젝트 렌더링부의 구성을 도시한 블럭도,

도 3은 본 발명의 일 실시예에 따른, 오브젝트 오디오 신호의 궤도 정보를 설명하기 위한 도면,

도 4는 본 발명의 일 실시예에 따른, 오브젝트 오디오 신호의 거리 정보에 따른 거리 게인을 설명하기 위한 그래프,

도 5a 및 도 5b는 본 발명의 일 실시예에 따른, 오브젝트 오디오 신호의 뎁스 정보에 따른 뎁스 게인을 설명하기 위한 그래프,

도 6은 본 발명의 다른 실시예에 따른, 가상 3차원 오브젝트 오디오 신호를 제공하기 위한 오브젝트 렌더링부의 구성을 나타내는 블럭도,

도 7a 및 도 7b는 본 발명의 일 실시예에 따른, 가상 필터부를 설명하기 위한 도면,

도 8a 내지 도 8g는 본 발명의 다양한 실시예에 따른, 오디오 신호의 채널 렌더링을 설명하기 위한 도면,

도 9는 본 발명의 일 실시예에 따른, 오디오 신호 제공 방법을 설명하기 위한 흐름도,

도 10은 보 발명의 다른 실시예에 따른, 오디오 제공 장치의 구성을 도시한 블럭도이다.

이하에서는 도면을 참조하여 본 발명에 대해 더욱 상세히 설명하기로 한다. 도 1은 본 발명의 일 실시예에 따른, 오디오 제공 장치(100)의 구성을 나타내는 블럭도이다. 도 1에 도시된 바와 같이, 오디오 제공 장치(100)는 입력부(110), 분리부(120), 오브젝트 렌더링부(130), 채널 렌더링부(140), 믹싱부(150) 및 출력부(160)를 포함한다.

입력부(110)는 다양한 소스로부터 오디오 신호를 수신할 수 있다. 이때, 오디오 소스는 채널 오디오 신호 및 오브젝트 오디오 신호를 포함할 수 있다. 여기서, 채널 오디오 신호는 해당 프레임의 배경음을 포함하는 오디오 신호로서, 제1 채널수(예를 들어, 5.1채널, 7.1 채널 등)를 가질 수 있다. 또한, 오브젝트 오디오 신호는 모션을 갖는 오브젝트이거나 해당 프레임에서 중요한 오브젝트의 오디오 신호일 수 있다. 오브젝트 오디오 신호의 일 예로 사람 목소리, 총소리 등을 포함할 수 있다. 오브젝트 오디오 신호에는 오브젝트 오디오 신호의 궤도 정보가 포함될 수 있다.

분리부(120)는 입력된 오디오 신호를 채널 오디오 신호와 오브젝트 오디오 신호로 분리한다. 그리고, 분리부(120)는 분리된 오브젝트 오디오 신호 및 채널 오디오 신호를 각각 오브젝트 렌더링부(130) 및 채널 렌더링부(140)로 출력할 수 있다.

오브젝트 렌더링부(130)는 입력된 오브젝트 오디오 신호의 궤도 정보를 바탕으로 입력된 오브젝트 오디오 신호를 렌더링한다. 이때, 오브젝트 렌더링부(130)는 오디오 제공 장치(100)의 스피커 레이아웃에 따라 입력된 오브젝트 오디오 신호를 렌더링할 수 있다. 예를 들어, 오디오 제공 장치(100)의 스피커 레이아웃이 동일한 고도를 가지는 2차원인 경우, 오브젝트 렌더링부(130)는 입력된 오브젝트 오디오 신호를 2차원으로 렌더링할 수 있다. 또한, 오디오 제공 장치(100)의 스피커 레이아웃이 복수의 고도를 가지는 3차원인 경우, 오브젝트 렌더링부(130)는 입력된 오브젝트 오디오 신호를 3차원으로 렌더링할 수 있다. 또한, 오디오 제공 장치(100)의 스피커 레이아웃이 동일한 고도를 가지는 2차원이더라도, 오브젝트 렌더링부(130)는 입력된 오브젝트 오디오 신호에 가상 고도 정보를 부여하여 3차원으로 렌더링할 수 있다. 오브젝트 렌더링부(130)는 도 2 내지 도 7b를 참조하여 상세히 설명하기로 한다.

도 2는 본 발명의 일 실시예에 따른, 오브젝트 렌더링부(130)의 구성을 나타내는 블럭도이다. 도 2에 도시된 바와 같이, 오브젝트 렌더링부(130)는 궤도 정보 분석부(131), 거리 제어부(132), 뎁스 제어부(133), 정위부(134) 및 렌더링부(135)를 포함한다.

궤도 정보 분석부(131)는 오브젝트 오디오 신호의 궤도 정보를 입력받아 분석한다. 구체적으로, 궤도 정보 분석부(131)는 오브젝트 오디오 신호의 궤도 정보를 렌더링에 필요한 3차원 좌표 정보로 변환할 수 있다. 예를 들어, 궤도 정보 분석부(131)는 도 3에 도시된 바와 같이, 입력된 오브젝트 오디오 신호(O)를 (r,θ,φ)의 좌표 정보로 분석할 수 있다. 이때, r은 원점과 오브젝트 오디오 신호와의 거리이며, θ는 음상의 수평면상의 각도이며, φ는 음상의 고도 각도이다.

거리 제어부(132)는 변환된 3차원 좌표 정보를 바탕으로 거리 제어 정보를 생성한다. 구체적으로, 거리 제어부(132)는 궤도 정보 분석부(131)를 통해 분석된 3차원상의 거리(r)를 바탕으로 오브젝트 오디오 신호의 거리 게인을 산출한다. 이때, 거리 제어부(132)는 3차원 상의 거리(r)에 반비례하여 거리 게인을 산출할 수 있다. 즉 거리 제어부(132)는 오브젝트 오디오 신호의 거리가 멀수록 오브젝트 오디오 신호의 거리 게인을 감소시키고, 오브젝트 오디오 신호의 거리가 가까울수록 오브젝트 오디오 신호의 거리 게인을 증가시킬 수 있다. 또한, 거리 제어부(132)는 원점에 가까워질 경우 거리 게인이 발산하지 않도록 순수 반비례가 아닌 상한 게인 값을 설정할 수 있다. 예를 들어, 거리 제어부(132)는 아래의 수학식 1과 같이 거리 게인(d_g)을 산출할 수 있다.

수학식 1

즉, 거리 제어부(132)는 상술한 수학식을 바탕으로 도 4에 도시된 바와 같이, 거리 게인값(d_g)이 1 이상 3.3 이하가 되도록 설정할 수 있다.

뎁스 제어부(133)는 변환된 3차원 좌표 정보를 바탕으로 뎁스 제어 정보를 생성한다. 이때, 뎁스 제어부(133)는 원점과 오브젝트 오디오 신호의 수평면 투영 거리(d)를 바탕으로 뎁스 게인을 획득할 수 있다.

이때, 뎁스 제어부(133)는 네거티브 벡터 및 포지티브 벡터의 합으로 뎁스 게인을 표현할 수 있다. 구체적으로, 오브젝트 오디오 신호의 3차원 좌표에서 r<1인 경우, 즉, 오브젝트 오디오 신호가 오디오 제공 장치(100)에 포함된 스피커로 구성된 구 안에 존재하는 경우, 포지티브 벡터는 (r,θ,φ)로 정의되고, 네거티브 벡터는 (r,θ+180,φ)이라고 정의된다. 뎁스 제어부(133)는 오브젝트 오디오 신호를 정위하기 위하여, 오브젝트 오디오 신호의 궤도 벡터(trajectory vector)를 포지티브 벡터와 네거티브 벡터의 합으로 표현하기 위한 포지티브 벡터의 뎁스 게인(v_p) 및 네거티브 백터의 뎁스 게인(v_n)을 계산할 수 있다. 이때, 포지티브 벡터의 뎁스 게인(v_p) 및 네거티브 백터의 뎁스 게인(v_n)은 아래의 수학식 2와 같이 계산될 수 있다.

수학식 2

즉, 뎁스 제어부(133)는 수평면 투영 거리(d)가 0부터 1까지인 포지티브 벡터의 뎁스 게인 및 네거티브 벡터의 뎁스 게인을 도 5a에 도시된 바와 같이 산출할 수 있다.

또한, 뎁스 제어부(133)는 포지티브 벡터 및 널 벡터의 합으로 뎁스 게인을 표현할 수 있다. 구체적으로, 모든 채널의 패닝 게인과 위치의 곱의 합이 0으로 수렴되는 방향이 없는 경우의 패닝 게인을 널 벡터(null vector)로 정의할 수 있다. 특히, 뎁스 제어부(133)는 수평면 투영 거리(d)가 0에 가까워지면 널 벡터의 뎁스 게인은 1로 매핑되고, 수평면 투영 거리(d)가 1에 가까워지면 포지티브 벡터의 뎁스 게인이 1로 매핑되도록 포지티브 벡터의 뎁스 게인(v_p) 및 널 벡터의 뎁스 게인(v_nll)을 계산할 수 있다. 이때, 포지티브 벡터의 뎁스 게인(v_p) 및 널 벡터의 뎁스 게인(v_nll)은 아래의 수학식 3와 같이 계산될 수 있다.

수학식 3

즉, 뎁스 제어부(133)는 수평면 투영 거리(d)가 0부터 1까지인 포지티브 벡터의 뎁스 게인 및 널 벡터의 뎁스 게인을 도 5b에 도시된 바와 같이 산출할 수 있다.

한편, 뎁스 제어부(133)에 의해 뎁스 제어를 수행하면, 수평면 투영 거리(d)가 0에 가까워질 경우, 모든 스피커에 소리가 출력된다. 이에 의해, 패닝 경계(panning boundary)에 발생하는 불연속성이 감소될 수 있다.

정위부(134)는 변환된 3차원 좌표 정보를 바탕으로 오브젝트 오디오 신호를 정위시키기 위한 정위 정보를 생성한다. 특히, 정위부(134)는 오디오 제공 장치(100)의 스피커 레이아웃에 따라 오브젝트 오디오 신호를 정위시키기 위한 패닝 게인을 산출할 수 있다. 구체적으로, 정위부(134)는 오브젝트 오디오 신호의 궤도와 동일한 방향의 포지티브 벡터를 정위시키기 위한 트리플렛(triplet) 스피커를 선택하고, 포지티브 벡터의 트리플렛 스피커에 대한 3차원 패닝 계수(g_p)를 계산할 수 있다. 그리고, 뎁스 제어부(133)가 포지티브 벡터 및 네거티브의 벡터로 뎁스 게인을 표현하는 경우, 정위부(134)는 오브젝트 오디오 신호의 궤도와 반대 방향의 네거티브 벡터를 정위시키기 위한 트리플렛 스피커를 선택하고, 네거티브 벡터의 트리플렛 스피커에 대한 3차원 패닝 계수(g_n)을 계산할 수 있다.

렌더링부(135)는 거리 제어 정보, 뎁스 제어 정보 및 정위 정보를 바탕으로 오브젝트 오디오 신호를 렌더링한다. 특히, 렌더링부(135)는 거리 제어부(132)로부터 거리 게인(d_g)을 수신하고, 뎁스 제어부(133)로부터 뎁스 게인(v)을 수신하고, 정위부(134)로부터 패닝 게인(g)을 수신하여, 거리 게인(d_g), 뎁스 게인(v), 패닝 게인(g)을 오브젝트 오디오 신호에 적용시켜 멀티채널의 오브젝트 오디오 신호를 생성할 수 있다. 특히, 오브젝트 오디오 신호의 뎁스 게인이 포지티브 벡터와 네거티브 벡터의 합으로 표현되는 경우, 렌더링부(135)는 m번째 채널의 최종 게인(Gm)을 아래의 수학식 4와 같이 산출할 수 있다.

수학식 4

이때, g_p,m은 포지티브 벡터를 정위하였을 경우, m 채널에 적용되는 패닝 계수이며, g_n,m은 네거티브 벡터를 정위하였을 경우, m 채널에 적용되는 패닝 계수일 수 있다.

또한, 오브젝트 오디오 신호의 뎁스 게인이 포지티브 벡터와 널 벡터의 합으로 표현되는 경우, 렌더링부(135)는 m번째 채널의 최종 게인(Gm)을 아래의 수학식 5와 같이 산출할 수 있다.

수학식 5

이때, g_p,m은 포지티브 벡터를 정위하였을 경우, m 채널에 적용되는 패닝 계수이며, g_nll,m은 네거티브 벡터를 정위하였을 경우, m 채널에 적용되는 패닝 계수일 수 있다. 한편, Σg_nll,m은 0이 될 수 있다.

그리고, 렌더링부(135)는 오브젝트 오디오 신호인 x에 적용시켜, m번째 채널의 오브젝트 오디오 신호의 최종 출력(Ym)을 아래의 수학식 6과 같이 산출할 수 있다.

수학식 6

상술한 바와 같이 산출된 오브젝트 오디오 신호의 최종 출력(Ym)은 믹싱부(150)로 출력될 수 있다.

또한, 오브젝트 오디오 신호가 복수 개 존재하는 경우, 오브젝트 렌더링부(130)는 복수의 오브젝트 오디오 신호 사이의 위상 차이를 산출하고, 복수의 오브젝트 오디오 신호 중 하나를 산출된 위상 차이만큼 이동하여 복수의 오브젝트 오디오 신호를 합성할 수 있다.

구체적으로, 복수의 오브젝트 오디오 신호가 입력되는 동안 복수의 오브젝트 오디오 신호 각각이 동일한 신호이나 위상이 서로 반대인 경우, 복수의 오브젝트 오디오 신호를 그대로 합성하면, 복수의 오브젝트 오디오 신호의 중첩으로 인한 오디오 신호의 왜곡이 발생한다. 따라서, 오브젝트 렌더링부(130)는 복수의 오브젝트 오디오 신호 사이의 상관도(correlation)를 산출하고, 상관도가 기설정된 값 이상인 경우, 복수의 오브젝트 오디오 신호 사이의 위상 차이를 산출하고, 복수의 오브젝트 오디오 신호 중 하나를 산출된 위치 차이만큼 이동하여 복수의 오브젝트 오디오 신호를 합성할 수 있다. 이로 인해, 유사한 복수의 오브젝트 오디오 신호가 입력되는 경우, 복수의 오브젝트 오디오 신호의 합성으로 인한 왜곡을 방지할 수 있게 된다.

한편, 상술한 실시예에서는 오디오 제공 장치(100)의 스피커 레이아웃이 상이한 고도감을 가지는 3차원이나, 이는 일 실시예에 불과할 뿐, 오디오 제공 장치(100)의 스피커 레이아웃이 동일한 고도감을 가지는 2차원일 수 있다. 특히, 오디오 제공 장치(100)의 스피커 레이아웃이 동일한 고도감을 가지는 2차원인 경우, 오브젝트 렌더링부(130)는 상술한 오브젝트 오디오 신호의 궤도 정보 중 φ의 값을 0으로 설정할 수 있다.

또한, 오디오 제공 장치(100)의 스피커 레이아웃이 동일한 고도감을 가지는 2차원일 수 있으나, 오디오 제공 장치(100)는 2차원의 스피커 레이아웃을 통해 가상으로 3차원의 오브젝트 오디오 신호를 제공할 수 있다.

이하에서는 가상의 3차원 오브젝트 오디오 신호를 제공하는 실시예에 대해 도 6 및 도 7을 참조하여 설명하기로 한다.

도 6은 본 발명의 다른 실시예에 따른, 가상 3차원 오브젝트 오디오 신호를 제공하기 위한 오브젝트 렌더링부(130')의 구성을 나타내는 블럭도이다. 도 6에 도시된 바와 같이, 오브젝트 렌더링부(130')는 가상 필터부(136), 3차원 렌더링부(137), 가상 렌더링부(138) 및 믹싱부(139)를 포함한다.

3차원 렌더링부(137)는 도 2 내지 도 5b에 도시된 바와 같은 방법을 이용하여 오브젝트 오디오 신호를 렌더링할 수 있다. 이때, 3차원 렌더링부(137)는 오디오 제공 장치(100)의 물리적인 스피커로 출력할 수 있는 오브젝트 오디오 신호를 믹싱부(139)로 출력하고, 상이한 고도감을 제공하는 가상 스피커의 가상 패닝 게인(g_m,top)을 가상 렌더링부(137)로 출력할 수 있다.

가상 필터부(136)는 오브젝트 오디오 신호의 음색을 보정시키는 블록으로, 심리음향을 기반으로 입력된 오브젝트 오디오 신호의 스펙트럼 특성(spectral characteristics)을 보정하여 가상 스피커의 위치에 음상을 제공한다. 이때, 가상 필터부(136)는 HRTF(Head related transfer function), BRIR(Binaural room impulse response) 등의 다양한 형태의 필터로 구현될 수 있다.

또한, 가상 필터부(136)의 길이가 프레임의 길이보다 작을 경우, 가상 필터부(136)를 블럭 컨볼루션(block convolution)을 통해 적용시킬 수 있다.

또한, FFT(Fast Fourier Transform), MDCT(Modified Discrete Cosine Transform), QMF(Quadurature Mirror Filter) 등의 주파수 도메인에서 렌더링을 수행할 경우, 가상 필터부(136)는 곱셈으로 적용될 수 있다.

복수의 가상 탑 레이어 스피커(Virtual top layer speaker)의 경우, 가상 필터부(136)는 하나의 고도 필터(elevation filter) 및 물리적인 스피커들의 배분식을 통해 복수의 가상 탑 레이어 스피커를 생성할 수 있다.

또한, 복수의 가상 탑 레이어 스피커 및 가상 백 스피커(Virtual back speaker)의 경우, 가상 필터부(136)는 각기 다른 위치에서 스펙트럴 컬러레이션(spectral coloration)을 적용시키기 위한 복수의 가상 필터 및 물리적인 스피커들의 배분식을 통해 복수의 가상 탑 레이어 스피커 및 가상 백 스피커를 생성할 수 있다.

또한, 가상 필터부(136)는 H1,H2,...,HN와 같은 N 개의 다른 스펙트럴 컬러레이션을 사용할 경우, 연산량을 줄이기 위하여 트리 구조로 설계가 가능하다. 구체적으로, 가상 필터부(136)는 도 7a에 도시된 바와 같이, 높이(Height)를 인지하는 데에 공통적으로 들어가는 Notch/Peak를 H0로 설계하고, H1 내지 HN에서 H0의 특성을 뺀 나머지 성분인 K1 내지 KN을 HO와 케스케이드(cascade) 형태로 연결할 수 있다. 또한, 가상 필터부(136)는 공통의 성분과 스펙트럴 컬러레이션들에 따라 도 7b에 도시된 바와 같은 복수의 단계로 구성된 트리 구조를 이룰 수 있다.

가상 렌더링부(138)는 가상 채널을 물리적인 채널로 표현하기 위한 렌더링 블럭이다. 특히, 가상 렌더링부(138)는 가상 필터부(136)로부터 출력된 가상 채널 배분식에 따라 가상 스피커로 출력된 오브젝트 오디오 신호를 생성하고, 생성된 가상 스피커의 오브젝트 오디오 신호에 가상 패닝 게인(g_m,top)을 곱하여 출력 신호를 합성할 수 있다. 이때, 복수의 물리적인 평면 스피커에 배분해 주는 정도에 따라 가상 스피커의 위치가 상이해지며, 이 배분의 정도를 가상 채널 배분식이라 정의될 수 있다.

믹싱부(139)는 물리적인 채널의 오브젝트 오디오 신호와 가상 채널의 오브젝트 오디오 신호를 믹싱한다.

이에 의해, 2차원의 스피커 레이아웃을 가지는 오디오 제공 장치(100)를 통해 오브젝트 오디오 신호를 3차원 상에 위치하는 것으로 표현할 수 있다.

다시 도 1에 대해 설명하면, 채널 렌더링부(120)는 제1 채널 수를 가지는 채널 오디오 신호를 제2 채널 수를 가지는 오디오 신호로 렌더링할 수 있다. 이때, 채널 렌더링부(120)는 스피커 레이아웃에 따라 입력된 제1 채널 수를 가지는 채널 오디오 신호를 제2 채널 수를 가지는 오디오 신호로 변경할 수 있다.

구체적으로, 채널 오디오 신호의 레이아웃과 오디오 제공 장치(100)의 스피커 레이아웃이 동일한 경우, 채널 렌더링부(120)는 채널 오디오 신호를 채널의 변화없이 렌더링을 수행할 수 있다.

또한, 채널 오디오 신호의 채널 수가 오디오 제공 장치(100)의 스피커 레이아웃의 채널 수보다 많은 경우, 채널 렌더링부(120)는 채널 오디오 신호를 다운믹스하여 렌더링을 수행할 수 있다. 예를 들어, 채널 오디오 신호의 채널이 7.1 채널이고, 오디오 제공 장치(100)의 스피커 레이아웃이 5.1 채널인 경우, 채널 렌더링부(120)는 7.1 채널의 채널 오디오 신호를 5.1 채널로 다운믹스할 수 있다.

특히, 채널 오디오 신호의 다운믹스를 수행할 경우, 채널 렌더링부(120)는 입력된 채널 오디오 신호의 궤도가 일정하게 정지되어 있는 오브젝트라고 판단하여 다운믹스를 수행할 수 있다. 또한, 3차원의 채널 오디오 신호를 2차원으로 다운믹스하는 경우, 채널 렌더링부(120)는 채널 오디오 신호의 고도 성분을 제거하여 2차원으로 다운믹스하거나 도 6에서 설명한 바와 같은 가상의 고도감을 가지도록 가상 3차원으로 다운믹스할 수 있다. 또한, 채널 렌더링부(120)는 정면의 오디오 신호를 형성하는 프론트 레프트 채널, 프론트 라이트 채널, 센터 채널을 제외한 모든 신호를 다운믹스하여 라이트 서라운드 채널 및 레프트 서라운드 채널로 구현할 수 있다. 또한, 채널 렌더링부(120)는 멀티채널 다운믹스 방정식을 이용하여 다운믹스를 수행할 수 있다.

또한, 채널 오디오 신호의 채널 수가 오디오 제공 장치(100)의 스피커 레이아웃의 채널 수보다 적은 경우, 채널 렌더링부(120)는 채널 오디오 신호를 업믹스하여 렌더링을 수행할 수 있다. 예를 들어, 채널 오디오 신호의 채널이 7.1 채널이고, 오디오 제공 장치(100)의 스피커 레이아웃이 9.1 채널인 경우, 채널 렌더링부(120)는 7.1 채널의 채널 오디오 신호를 9.1 채널로 업믹스할 수 있다.

특히, 2차원의 채널 오디오 신호를 3차원으로 업믹스하는 경우, 채널 렌더링부(120)는 프론트 채널 및 서라운드 채널 간의 상관도(correlation)을 기반으로 고도 성분을 가지는 탑 레이어를 생성하여 업믹스를 수행하거나, 채널간의 분석으로 통해 센터 및 앰비언스(ambience)로 나누어 업믹스를 수행할 수 있다.

또한, 채널 렌더링부(140)는 제1 채널 수를 가지는 오디오 신호를 제2 채널 수를 가지는 오디오 신호로 렌더링하는 과정에서 상관도를 갖는 오디오 신호 사이의 위상 차이를 산출하고, 복수의 오디오 신호 중 하나를 산출된 위상 차이만큼 이동하여 복수의 오디오 신호를 합성할 수 있다.

한편, 오브젝트 오디오 신호 및 제1 채널 수를 가지는 채널 오디오 신호 중 적어도 하나는, 특정 프레임에 대해 가상 3차원 렌더링 또는 2차원 렌더링을 수행할지 여부를 결정하는 가이드 정보를 포함할 수 있다. 따라서, 오브젝트 렌더링부(130) 및 채널 렌더링부(140) 각각은 오브젝트 오디오 신호 및 채널 오디오 신호에 포함된 가이드 정보를 바탕으로 렌더링을 수행할 수 있다. 예를 들어, 제1 프레임에서 오브젝트 오디오 신호를 가상 3차원 렌더링을 수행하라는 가이드 정보가 포함된 경우, 오브젝트 렌더링부(140) 및 채널 렌더링부(140)는 제1 프레임에서 오브젝트 오디오 신호 및 채널 오디오 신호를 가상 3차원 렌더링을 수행할 수 있다. 또하느 제2 프레임에서 오브젝트 오디오 신호를 2차원 렌더링하라는 가이드 정보가 포함된 경우, 오브젝트 렌더링부(130) 및 채널 렌더링부(140)는 제2 프레임에서 오브젝트 오디오 신호 및 채널 오디오 신호를 2차원 렌더링을 수행할 수 있다.

믹싱부(150)는 오브젝트 렌더링부(130)로부터 출력된 오브젝트 오디오 신호와 채널 렌더링부(140)로부터 출력된 제2 채널 수를 가지는 채널 오디오 신호를 믹싱할 수 있다.

한편, 믹싱부(150)는 렌더링된 오브젝트 오디오 신호와 제2 채널 수를 가지는 오디오 신호를 믹싱하는 동안 상관도를 갖는 오디오 신호 사이의 위상 차이를 산출하고, 복수의 오디오 신호 중 하나를 상기 산출된 위상 차이만큼 이동하여 복수의 오디오 신호를 합성할 수 있다.

출력부(160)는 믹싱부(150)로부터 출력된 오디오 신호를 출력한다. 이때, 출력부(160)는 복수의 스피커를 포함할 수 있다. 예를 들어, 출력부(160)는 5.1 채널, 7.1 채널, 9.1 채널, 22.2 채널 등과 같은 스피커로 구현될 수 있다.

이하에서는 도 8a 내지 도 8g를 참조하여 본 발명의 다양한 실시예에 대해 설명하도록 한다.

도 8a는 본 발명의 제1 실시예에 따른, 오브젝트 오디오 신호 및 채널 오디오 신호의 렌더링을 설명하기 위한 도면이다.

우선, 오디오 제공 장치(100)는 9.1 채널의 채널 오디오 신호 및 2개의 오브젝트 오디오 신호(O1,O2)를 수신한다. 이때, 9.1 채널의 채널 오디오 신호는 프런트 레프트 채널(Front Left Channel: FL), 프론트 라이트 채널(Front Right Channel: FR), 프론트 센터 채널(Front Center channel: FC), 서브우퍼 채널(Subwoofer channel: Lfe), 서라운드 레프트 채널(Surround Left channel: SL), 서라운드 라이트 채널(Surround Right Channel: SR), 탑 프론트 레프트 채널(Top Front Left channel: TL), 탑 프론트 라이트 채널(Top Front Right channel: TR), 백 레프트 채널(Back Left channel:BL), 백 라이트 채널(Back Right channel: BR)을 포함한다.

한편, 오디오 제공 장치(100)는 5.1 채널의 스피커 레이아웃으로 구성될 수 있다. 즉, 오디오 제공 장치(100)는 프론트 라이트 채널, 프론트 레프트 채널, 프론트 센터 채널, 서브우퍼 채널, 서라운드 레프트 채널 및 서라운드 라이트 채널 각각에 대응되는 스피커를 구비할 수 있다.

오디오 제공 장치(100)는 입력된 채널 오디오 신호 중 탑 프론트 레프트 채널, 탑 프론트 라이트 채널, 백 레프트 채널, 백 라이트 채널 각각에 대응되는 신호에 가상 필터링을 수행하여 렌더링할 수 있다.

그리고, 오디오 제공 장치(100)는 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(02)에 대한 가상 3차원 렌더링을 수행할 수 있다.

오디오 제공 장치(100)는 프론트 레프트 채널의 채널 오디오 신호, 가상 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 가상 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 라이트 채널의 채널 오디오 신호, 가상 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 가상 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 라이트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 센터 채널 및 서브우퍼 채널 각각의 채널 오디오 신호를 그대로 프론트 센터 채널 및 서브우퍼 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 레프트 채널의 채널 오디오 신호, 가상 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 가상 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 라이트 채널의 채널 오디오 신호, 가상 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 가상 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 라이트 채널에 대응되는 스피커로 출력할 수 있다.

상술한 바와 같은 채널 렌더링 및 오브젝트 렌더링을 통해 오디오 제공 장치(100)는 5.1 채널의 스피커를 이용하여 9.1 채널의 가상 3차원 오디오 환경을 구축할 수 있게 된다.

도 8b는 본 발명의 제2 실시예에 따른, 오브젝트 오디오 신호 및 채널 오디오 신호의 렌더링을 설명하기 위한 도면이다.

우선, 오디오 제공 장치(100)는 9.1 채널의 채널 오디오 신호 및 2개의 오브젝트 오디오 신호(O1,O2)를 수신한다.

한편, 오디오 제공 장치(100)는 7.1 채널의 스피커 레이아웃으로 구성될 수 있다. 즉, 오디오 제공 장치(100)는 프론트 라이트 채널, 프론트 레프트 채널, 프론트 센터 채널, 서브우퍼 채널, 서라운드 레프트 채널, 서라운드 라이트 채널, 백 레프트 채널 및 백 라이트 채널 각각에 대응되는 스피커를 구비할 수 있다.

오디오 제공 장치(100)는 입력된 채널 오디오 신호 중 탑 프론트 레프트 채널, 탑 프론트 라이트 채널 각각에 대응되는 신호에 가상 필터링을 수행하여 렌더링할 수 있다.

오디오 제공 장치(100)는 프론트 레프트 채널의 채널 오디오 신호, 가상 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 라이트 채널의 채널 오디오 신호, 가상 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 라이트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 센터 채널 및 서브우퍼 채널 각각의 채널 오디오 신호를 그대로 프론트 센터 채널 및 서브우퍼 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 레프트 채널의 채널 오디오 신호, 가상 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 라이트 채널의 채널 오디오 신호, 가상 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 라이트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 백 레프트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 백 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 백 라이트 채널의 채널 오디오 신호, 가상 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 백 라이트 채널에 대응되는 스피커로 출력할 수 있다.

상술한 바와 같은 채널 렌더링 및 오브젝트 렌더링을 통해 오디오 제공 장치(100)는 7.1 채널의 스피커를 이용하여 9.1 채널의 가상 3차원 오디오 환경을 구축할 수 있게 된다.

도 8c는 본 발명의 제3 실시예에 따른, 오브젝트 오디오 신호 및 채널 오디오 신호의 렌더링을 설명하기 위한 도면이다.

한편, 오디오 제공 장치(100)는 9.1 채널의 스피커 레이아웃으로 구성될 수 있다. 즉, 오디오 제공 장치(100)는 프론트 라이트 채널, 프론트 레프트 채널, 프론트 센터 채널, 서브우퍼 채널, 서라운드 레프트 채널, 서라운드 라이트 채널, 백 레프트 채널, 백 라이트 채널, 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널 각각에 대응되는 스피커를 구비할 수 있다.

그리고, 오디오 제공 장치(100)는 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(02)에 대한 3차원 렌더링을 수행할 수 있다.

오디오 제공 장치(100)는 프론트 라이트 채널, 프론트 레프트 채널, 프론트 센터 채널, 서브우퍼 채널, 서라운드 레프트 채널, 서라운드 라이트 채널, 백 레프트 채널, 백 라이트 채널, 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호 각각에 3차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 대응되는 스피커로 출력할 수 있다.

상술한 바와 같은 채널 렌더링 및 오브젝트 렌더링을 통해 오디오 제공 장치(100)는 9.1 채널의 스피커를 이용하여 9.1 채널의 채널 오디오 신호 및 오브젝트 오디오 신호를 출력할 수 있게 된다.

도 8d는 본 발명의 제4 실시예에 따른, 오브젝트 오디오 신호 및 채널 오디오 신호의 렌더링을 설명하기 위한 도면이다.

한편, 오디오 제공 장치(100)는 11.1 채널의 스피커 레이아웃으로 구성될 수 있다. 즉, 오디오 제공 장치(100)는 프론트 라이트 채널, 프론트 레프트 채널, 프론트 센터 채널, 서브우퍼 채널, 서라운드 레프트 채널, 서라운드 라이트 채널, 백 레프트 채널, 백 라이트 채널, 탑 프론트 레프트 채널, 탑 프론트 라이트 채널, 탑 서라운드 레프트 채널, 탑 서라운드 라이트 채널, 탑 백 레프트 채널 및 탑 백 라이트 채널 각각에 대응되는 스피커를 구비할 수 있다.

그리고, 오디오 제공 장치(100)는 3차원 렌더링된 제1 오브젝트 오디오 신호(01) 및 제2 오브젝트 오디오 신호(02) 각각을 탑 서라운드 레프트 채널, 탑 서라운드 라이트 채널, 탑 백 레프트 채널 및 탑 백 라이트 채널 각각에 대응되는 스피커로 출력할 수 있다.

상술한 바와 같은 채널 렌더링 및 오브젝트 렌더링을 통해 오디오 제공 장치(100)는 11.1 채널의 스피커를 이용하여 9.1 채널의 채널 오디오 신호 및 오브젝트 오디오 신호를 출력할 수 있게 된다.

도 8e는 본 발명의 제5 실시예에 따른, 오브젝트 오디오 신호 및 채널 오디오 신호의 렌더링을 설명하기 위한 도면이다.

오디오 제공 장치(100)는 입력된 채널 오디오 신호 중 탑 프론트 레프트 채널, 탑 프론트 라이트 채널, 백 레프트 채널, 백 라이트 채널 각각에 대응되는 신호에 2차원 렌더링을 수행한다.

그리고, 오디오 제공 장치(100)는 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(02)에 대한 2차원 렌더링을 수행할 수 있다.

오디오 제공 장치(100)는 프론트 레프트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 라이트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 센터 채널 및 서브우퍼 채널 각각의 채널 오디오 신호를 그대로 프론트 센터 채널 및 서브우퍼 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 레프트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 라이트 채널에 대응되는 스피커로 출력할 수 있다.

상술한 바와 같은 채널 렌더링 및 오브젝트 렌더링을 통해 오디오 제공 장치(100)는 5.1 채널의 스피커를 이용하여 9.1 채널의 채널 오디오 신호 및 오브젝트 오디오 신호를 출력할 수 있게 된다. 즉, 도 8a에 비교하여, 본 실시예는 가상 3차원 오디오 신호로 렌더링하는 것이 아닌 2차원 오디오 신호로 렌더링할 수 있다.

도 8f는 본 발명의 제6 실시예에 따른, 오브젝트 오디오 신호 및 채널 오디오 신호의 렌더링을 설명하기 위한 도면이다.

오디오 제공 장치(100)는 입력된 채널 오디오 신호 중 탑 프론트 레프트 채널, 탑 프론트 라이트 채널 각각에 대응되는 신호에 2차원 렌더링을 수행할 수 있다.

오디오 제공 장치(100)는 프론트 레프트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 라이트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 센터 채널 및 서브우퍼 채널 각각의 채널 오디오 신호를 그대로 프론트 센터 채널 및 서브우퍼 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 레프트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 라이트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 백 레프트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 백 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 백 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 백 라이트 채널에 대응되는 스피커로 출력할 수 있다.

상술한 바와 같은 채널 렌더링 및 오브젝트 렌더링을 통해 오디오 제공 장치(100)는 7.1 채널의 스피커를 이용하여 9.1 채널의 채널 오디오 신호 및 오브젝트 오디오 신호를 출력할 수 있게 된다. 즉, 도 8b에 비교하여, 본 실시예는 가상 3차원 오디오 신호로 렌더링하는 것이 아닌 2차원 오디오 신호로 렌더링할 수 있다.

도 8g는 본 발명의 제7 실시예에 따른, 오브젝트 오디오 신호 및 채널 오디오 신호의 렌더링을 설명하기 위한 도면이다.

오디오 제공 장치(100)는 입력된 채널 오디오 신호 중 탑 프론트 레프트 채널, 탑 프론트 라이트 채널, 백 레프트 채널, 백 라이트 채널 각각에 대응되는 신호에 2차원으로 다운믹스하여 렌더링을 수행한다.

오디오 제공 장치(100)는 프론트 레프트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 가상 3차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 가상 3차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 프론트 라이트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 프론트 센터 채널 및 서브우퍼 채널 각각의 채널 오디오 신호를 그대로 프론트 센터 채널 및 서브우퍼 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 레프트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 가상 3차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 레프트 채널에 대응되는 스피커로 출력할 수 있다. 또한, 오디오 제공 장치(100)는 서라운드 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 탑 프론트 레프트 채널 및 탑 프론트 라이트 채널의 채널 오디오 신호, 2차원 렌더링된 백 레프트 채널 및 백 라이트 채널의 채널 오디오 신호, 가상 3차원 렌더링된 제1 오브젝트 오디오 신호(O1) 및 제2 오브젝트 오디오 신호(O2)를 믹싱하여 서라운드 라이트 채널에 대응되는 스피커로 출력할 수 있다.

상술한 바와 같은 채널 렌더링 및 오브젝트 렌더링을 통해 오디오 제공 장치(100)는 5.1 채널의 스피커를 이용하여 9.1 채널의 채널 오디오 신호 및 오브젝트 오디오 신호를 출력할 수 있게 된다. 즉, 도 8a와 비교하여, 채널 오디오 신호의 음상보다는 음질이 중요하다고 판단된 경우, 오디오 제공 장치(100)는 채널 오디오 신호만을 2차원으로 다운믹스하고, 오브젝트 오디오 신호를 가상 3차원으로 렌더링할 수 있다.

도 9는 본 발명의 일 실시예에 따른, 오디오 신호 제공 방법을 설명하기 위한 흐름도이다.

우선, 오디오 제공 장치(100)는 오디오 신호를 입력받는다(S910). 이때, 오디오 신호는 제1 채널 수를 가지는 채널 오디오 신호 및 오브젝트 오디오 신호를 포함할 수 있다.

그리고, 오디오 제공 장치(100)는 입력된 오디오 신호를 분리한다(S920). 구체적으로, 오디오 제공 장치(100)는 입력된 오디오 신호를 채널 오디오 신호 및 오브젝트 오디오 신호로 분리할 수 있다.

그리고, 오디오 제공 장치(100)는 오브젝트 오디오 신호를 렌더링한다(S930). 구체적으로, 오디오 제공 장치(100)는 도 2 내지 도 5b에서 설명한 바와 같이, 오브젝트 오디오 신호를 2차원 또는 3차원으로 렌더링할 수 있다. 또한, 오디오 제공 장치(100)는 도 6 내지 도 7b에서 설명한 바와 같이, 오브젝트 오디오 신호를 가상의 3차원 오디오 신호로 렌더링할 수 있다.

그리고, 오디오 제공 장치(100)는 제1 채널 수를 가지는 채널 오디오 신호를 제2 채널 수로 렌더링한다(S940). 이때, 오디오 제공 장치(100)는 입력된 채널 오디오 신호를 다운믹스하거나 업믹스하여 렌더링을 수행할 수 있다. 또한, 오디오 제공 장치(100)는 입력된 채널 오디오 신호의 채널 수를 유지하여 렌더링을 수행할 수 있다.

그리고, 오디오 제공 장치(100)는 렌더링된 오브젝트 오디오 신호와 제2 채널 수를 가지는 채널 오디오 신호를 믹싱한다(S950). 구체적으로, 오디오 제공 장치(100)는 도 8a 내지 도 8g에서 설명한 바와 같이, 렌더링된 오브젝트 오디오 신호 및 채널 오디오 신호를 믹싱할 수 있다.

그리고, 오디오 제공 장치(100)는 믹싱된 오디오 신호를 출력한다(S960).

상술한 바와 같은 오디오 제공 방법에 의해, 오디오 제공 장치(100)는 다양한 포맷을 가지는 오디오 신호를 오디오 시스템 공간에 최적화되게 재생시킬 수 있게 된다.

이하에서는 도 10을 참조하여 본 발명의 다른 실시예에 대해 설명하기로 한다. 도 10은 본 발명의 다른 실시예에 따른, 오디오 제공 장치(1000)의 구성을 나타내는 블럭도이다. 도 10에 도시된 바와 같이, 오디오 제공 장치(1000)는 입력부(1010), 분리부(1020), 오디오 신호 디코딩부(1030), 부가정보 디코딩부(1040), 렌더링부(1050), 사용자 입력부(1060), 인터페이스부(1070) 및 출력부(1080)를 포함한다.

입력부(1010)는 압축된 오디오 신호를 입력받는다. 이때, 압축된 오디오 신호에는 채널 오디오 신호와 오브젝트 오디오 신호가 포함된 압축된 형태의 오디오 신호뿐만 아니라 부가정보를 포함할 수 있다.

분리부(1020)는 압축된 오디오 신호를 오디오 신호와 부가정보로 분리하고, 오디오 신호를 오디오 신호 디코딩부(1030)로 출력하며, 부가정보를 부가정보 디코딩부(1040)로 출력한다.

오디오 신호 디코딩부(1030)는 압축된 형태의 오디오 신호를 해제하여 렌더링부(1050)로 출력한다. 한편, 오디오 신호는 멀티 채널의 채널 오디오 신호 및 오브젝트 오디오 신호를 포함한다. 이때, 멀티 채널의 채널 오디오 신호는 배경음 및 배경음악과 같은 오디오 신호일 수 있으며, 오브젝트 오디오 신호는 사람 목소리, 총소리 등과 같은 특정 물체에 대한 오디오 신호일 수 있다.

부가정보 디코딩부(1040)는 입력된 오디오 신호의 부가정보를 디코딩한다. 이때, 입력된 오디오 신호의 부가정보에는 입력된 오디오 신호의 채널 수, 길이, 게인값, 패닝 게인, 위치, 각도 등과 같은 다양한 정보가 포함될 수 있다.

렌더링부(1050)는 입력된 부가 정보 및 오디오 신호를 바탕으로 렌더링을 수행할 수 있다. 이때, 렌더링부(1050)는 사용자 입력부(1060)에 입력된 사용자 명령에 따라 도 2 내지 도 8g에 설명한 바와 같은 다양한 방법을 이용하여 렌더링을 수행할 수 있다. 예를 들어, 입력된 오디오 신호가 7.1 채널의 오디오 신호이고, 오디오 제공 장치(1000)의 스피커 레이아웃이 5.1 채널인 경우, 렌더링부(1050)는 사용자 입력부(1060)를 통해 입력된 사용자 명령에 따라 7.1 채널의 오디오 신호를 2차원의 5.1 채널 오디오 신호로 다운믹스할 수 있고, 7.1 채널의 오디오 신호를 가상 3차원 5.1 채널 오디오 신호로 다운믹스할 수 있다. 또한, 렌더링부(1050)는 사용자 입력부(1060)를 통해 입력된 사용자 명령에 따라 채널 오디오 신호를 2차원으로 렌더링할 수 있으며, 오브젝트 오디오 신호를 가상 3차원으로 렌더링할 수 있다.

또한, 렌더링부(1050)는 사용자 명령 및 스피커 레이아웃에 따라 렌더링된 오디오 신호를 출력부(1080)를 통해 바로 출력할 수 있으나, 오디오 신호 및 부가정보를 인터페이스부(1070)를 통해 외부기기로 전송할 수 있다. 특히, 7.1 채널을 초과하는 스피커 레이아웃을 가지는 오디오 제공 장치(1000)의 경우, 렌더링부(1050)는 오디오 신호 및 부가 정보 중 적어도 일부를 인터페이스부(1070)를 통해 외부 기기로 전송할 수 있다. 이때, 인터페이스부(1070)는 HDMI 인터페이스 등과 같은 디지털 인터페이스로 구현될 수 있다. 외부기기는 입력된 오디오 신호 및 부가정보를 이용하여 렌더링을 수행한 후, 렌더링된 오디오 신호를 출력할 수 있다.

그러나, 상술한 바와 같이, 렌더링부(1050)가 오디오 신호 및 부가정보를 외부 기기로 전송하는 것은 일 실시예에 불과할 뿐, 렌더링부(1050)가 오디오 신호 및 부가정보를 이용하여 오디오 신호를 렌더링한 후 렌더링된 오디오 신호를 출력할 수 있다.

한편, 본 발명의 일 실시예에 따른, 오브젝트 오디오 신호에는 ID 또는 유형 정보, 우선순위 정보 등이 포함된 메타데이터가 포함될 수 있다. 예를 들어, 오브젝트 오디오 신호의 유형이 대화(dialog)인지, 코멘터리(commentary)인지 여부를 나타내는 정보가 포함될 수 있다. 또한, 오디오 신호가 방송 오디오 신호인 경우, 오브젝트 오디오 신호의 유형이 제1 앵커인지, 제2 앵커인지, 제1 캐스터인지, 제2 캐스터인지, 배경음인지 여부 등을 나타내는 정보가 포함될 수 있다. 또한, 오디오 신호가 음악 오디오 신호인 경우, 오브젝트 오디오 신호의 유형이 제1 보컬인지, 제2 보컬인지, 제1 악기음인지, 제2 악기음인지 여부를 나타내는 정보가 포함될 수 있다. 또한, 오디오 신호가 게임 오디오 신호인 경우, 오브젝트 오디오 신호의 유형이 제1 효과음인지, 제2 효과음인지 여부를 나타내는 정보가 포함될 수 있다.

렌더링부(1050)는 상술한 바와 같은 오브젝트 오디오 신호에 포함된 메타데이터를 분석하여 오브젝트 오디오 신호의 우선순위에 따라 오브젝트 오디오 신호를 렌더링할 수 있다.

또한, 렌더링부(1050)는 사용자 선택에 의해 특정 오브젝트 오디오 신호를 제거할 수 있다. 예를 들어, 오디오 신호가 운동경기에 대한 오디오 신호인 경우, 오디오 제공 장치(1000)는 사용자에게 현재 입력되는 오브젝트 오디오 신호의 유형을 안내하는 UI를 디스플레이할 수 있다. 이때, 오브젝트 오디오 신호에는 캐스터 목소리, 해설 목소리, 함성소리 등과 같은 오브젝트 오디오 신호가 포함될 수 있다. 사용자 입력부(1060)를 통해 복수의 오브젝트 오디오 신호 중 캐스터 목소리를 제거하고자 하는 사용자 명령이 입력된 경우, 렌더링부(1050)는 입력된 오디오 오브젝트 오디오 신호 중 캐스터 목소리를 제거하고, 나머지 오브젝트 오디오 신호를 이용하여 렌더링을 수행할 수 있다.

또한, 출력부(1080)는 사용자 선택에 의해 특정 오브젝트 오디오 신호에 대한 볼륨을 증가시키거나 감소시킬 수 있다. 예를 들어, 오디오 신호가 영화 컨텐츠에 포함된 오디오 신호인 경우, 오디오 제공 장치(1000)는 사용자에게 현재 입력되는 오브젝트 오디오 신호의 유형을 안내하는 UI를 디스플레이할 수 있다. 이때, 오브젝트 오디오 신호에는 제1 주인공 목소리, 제2 주인공 목소리, 포탄 소리, 비행기 소리 등이 포함될 수 있다. 사용자 입력부(1060)를 통해 복수의 오브젝트 오디오 신호 중 제1 주인공 목소리, 제2 주인공 목소리의 볼륨을 증가시키고, 포탄 소리, 비행기 소리의 볼륨을 감소시키고자 하는 사용자 명령이 입력된 경우, 출력부(1080)는 제1 주인공 목소리 및 제2 주인공 목소리의 볼륨을 증가시키고, 포탄 소리, 비행기 소리의 볼륨을 감소시킬 수 있다.

상술한 바와 같은 실시예에 의해, 사용자는 자신이 원하는 오디오 신호를 조작할 수 있게 되어 사용자에 적합한 오디오 환경을 구축할 수 있게 된다.

한편, 상술한 다양한 실시 예에 따른 오디오 제공 방법은 프로그램으로 구현되어 디스플레이 장치 또는 입력 장치에 제공될 수 있다. 특히, 디스플레이 장치의 제어 방법을 포함하는 프로그램은 비일시적 판독 가능 매체(non-transitory computer readable medium)에 저장되어 제공될 수 있다.

비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.

또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims

오브젝트 오디오 신호의 궤도 정보를 이용하여 상기 오브젝트 오디오 신호를 렌더링하여 오브젝트 렌더링부;

제1 채널 수를 가지는 오디오 신호를 제2 채널 수를 가지는 오디오 신호로 렌더링하는 채널 렌더링부;

상기 렌더링된 오브젝트 오디오 신호 및 상기 제2 채널 수를 가지는 오디오 신호를 믹싱하는 믹싱부;를 포함하는 오디오 제공 장치.
제1항에 있어서,

상기 오브젝트 렌더링부는,

상기 오브젝트 오디오 신호의 궤도 정보를 3차원 좌표 정보로 변환하는 궤도 정보 분석부;

상기 변환된 3차원 좌표 정보를 바탕으로 거리 제어 정보를 생성하는 거리 제어부;

상기 변환된 3차원 좌표 정보를 바탕으로 뎁스 제어 정보를 생성하는 뎁스 제어부;

상기 변환된 3차원 좌표 정보를 바탕으로 오브젝트 오디오 신호를 정위시키기 위한 정위 정보를 생성하는 정위부; 및

상기 거리 제어 정보, 뎁스 제어 정보 및 정위 정보를 바탕으로 상기 오브젝트 오디오 신호를 렌더링하는 렌더링부;를 포함하는 것을 특징으로 하는 오디오 제공 장치.
제2항에 있어서,

상기 거리 제어부는,

상기 오브젝트 오디오 신호의 거리 게인을 산출하며, 상기 오브젝트 오디오 신호의 거리가 멀수록 상기 오브젝트 오디오 신호의 거리 게인을 감소시키고, 상기 오브젝트 오디오 신호의 거리가 가까울수록 상기 오브젝트 오디오 신호의 거리 게인을 증가시키는 것을 특징으로 하는 오디오 제공 장치.
제3항에 있어서,

상기 뎁스 제어부는,

상기 오브젝트 오디오 신호의 수평면상 투영 거리를 바탕으로 뎁스 게인을 획득하며,

상기 뎁스 게인은,

네거티브 벡터 및 포지티브 벡터의 합으로 표현되거나 포지티브 벡터 및 널 벡터의 합으로 표현되는 것을 특징으로 하는 오디오 제공 장치.
제4항에 있어서,

상기 정위부는,

상기 오디오 제공 장치의 스피커 레이아웃에 따라 상기 오브젝트 오디오 신호를 정위시키기 위한 패닝 게인을 산출하는 것을 특징으로 하는 오디오 제공 장치.
제5항에 있어서,

상기 렌더링부는,

상기 오브젝트 신호의 거리 게인, 뎁스 게인 및 패닝 게인을 바탕으로 상기 오브젝트 오디오 신호를 멀티 채널로 렌더링하는 것을 특징으로 오디오 제공 장치.
제2항에 있어서,

상기 오브젝트 렌더링부는,

상기 오브젝트 오디오 신호가 복수 개 존재하는 경우, 상기 복수의 오브젝트 오디오 신호 중 상관도를 갖는 오브젝트 사이의 위상 차이를 산출하고, 상기 복수의 오브젝트 오디오 신호 중 하나를 상기 산출된 위상 차이만큼 이동하여 상기 복수의 오브젝트 오디오 신호를 합성하는 것을 특징으로 하는 오디오 제공 장치.
제1항에 있어서,

상기 오디오 제공 장치가 동일한 고도를 가지는 복수의 스피커를 이용하여 오디오를 재생하는 경우,

상기 오브젝트 렌더링부는,

상기 오브젝트 오디오 신호의 스펙트럼 특성(spectral characteristics)을 보정하여 상기 오브젝트 오디오 신호에 가상 고도 정보를 제공하는 가상 필터부; 및

상기 가상 필터부에 의해 제공된 가상 고도 정보를 바탕으로 상기 오브젝트 오디오 신호를 렌더링하는 가상 렌더링부;를 포함하는 것을 특징으로 하는 오디오 제공 장치.
제8항에 있어서,

상기 가상 필터부는,

복수의 단계로 구성된 트리 구조를 이루는 것을 특징으로 하는 오디오 제공 장치.
제1항에 있어서,

상기 채널 렌더링부는,

상기 제1 채널 수를 가지는 오디오 신호의 레이아웃이 2차원인 경우, 상기 제1 채널 수를 가지는 오디오 신호를 상기 제1 채널 수보다 많은 상기 제2 채널 수를 가지는 오디오 신호로 업믹싱하며,

상기 제2 채널 수를 가지는 오디오 신호의 레이아웃은 상기 제1 채널 수를 가지는 오디오 신호와 상이한 고도 정보를 가지는 3차원인 것을 특징으로 하는 오디오 제공 장치.
제1항에 있어서,

상기 채널 렌더링부는,

상기 제1 채널 수를 가지는 오디오 신호의 레이아웃이 3차원인 경우, 상기 제1 채널 수를 가지는 오디오 신호를 상기 제1 채널 수보다 적은 상기 제2 채널 수를 가지는 오디오 신호로 다운믹싱하며,

상기 제2 채널 수를 가지는 오디오 신호의 레이아웃은 복수의 채널이 동일한 고도 성분을 가지는 2차원인 것을 특징으로 하는 오디오 제공 장치.
제1항에 있어서,

상기 오브젝트 오디오 신호 및 상기 제1 채널 수를 가지는 오디오 신호 중 적어도 하나는, 특정 프레임에 대해 가상 3차원 렌더링을 수행할지 여부를 결정하는 정보를 포함하는 것을 특징으로 하는 오디오 제공 장치.
제1항에 있어서,

상기 채널 렌더링부는,

상기 제1 채널 수를 가지는 오디오 신호를 상기 제2 채널 수를 가지는 오디오 신호로 렌더링하는 과정에서 상관도를 갖는 오디오 신호 사이의 위상 차이를 산출하고, 상기 복수의 오디오 신호 중 하나를 상기 산출된 위상 차이만큼 이동하여 상기 복수의 오디오 신호를 합성하는 것을 특징으로 하는 오디오 제공 장치.
제1항에 있어서,

상기 믹싱부는,

상기 렌더링된 오브젝트 오디오 신호와 상기 제2 채널 수를 가지는 오디오 신호를 믹싱하는 동안 상관도를 갖는 오디오 신호 사이의 위상 차이를 산출하고, 상기 복수의 오디오 신호 중 하나를 상기 산출된 위상 차이만큼 이동하여 상기 복수의 오디오 신호를 합성하는 것을 특징으로 하는 오디오 제공 장치.
제1항에 있어서,

상기 오브젝트 오디오 신호는,

사용자에게 오브젝트 오디오 신호의 선택을 위한 오브젝트 오디오 신호의 ID 및 유형 정보 중 적어도 하나를 저장하는 것을 특징으로 하는 오디오 제공 장치.
오브젝트 오디오 신호의 궤도 정보를 이용하여 상기 오브젝트 오디오 신호를 렌더링하는 단계;

제1 채널 수를 가지는 오디오 신호를 제2 채널 수를 가지는 오디오 신호로 렌더링하는 단계;

상기 렌더링된 오브젝트 오디오 신호 및 상기 제2 채널 수를 가지는 오디오 신호를 믹싱하는 단계;를 포함하는 오디오 제공 방법.
제16항에 있어서,

상기 오브젝트 오디오 신호를 렌더링하는 단계는,

상기 오브젝트 오디오 신호의 궤도 정보를 3차원 좌표 정보로 변환하는 단계;

상기 변환된 3차원 좌표 정보를 바탕으로 거리 제어 정보를 생성하는 단계;

상기 변환된 3차원 좌표 정보를 바탕으로 뎁스 제어 정보를 생성하는 단계;

상기 변환된 3차원 좌표 정보를 바탕으로 오브젝트 오디오 신호를 정위시키기 위한 정위 정보를 생성하는 단계; 및

상기 거리 제어 정보, 뎁스 제어 정보 및 정위 정보를 바탕으로 상기 오브젝트 오디오 신호를 렌더링하는 단계;를 포함하는 것을 특징으로 하는 오디오 제공 방법.
제17항에 있어서,

상기 거리 제어 정보를 생성하는 단계는,

상기 오브젝트 오디오 신호의 거리 게인을 산출하며, 상기 오브젝트 오디오 신호의 거리가 멀수록 상기 오브젝트 오디오 신호의 거리 게인을 감소시키고, 상기 오브젝트 오디오 신호의 거리가 가까울수록 상기 오브젝트 오디오 신호의 거리 게인을 증가시키는 것을 특징으로 하는 오디오 제공 방법.
제18항에 있어서,

상기 뎁스 제어 정보를 생성하는 단계는,

상기 오브젝트 오디오 신호의 수평면상 투영 거리를 바탕으로 뎁스 게인을 획득하며,

상기 뎁스 게인은,

네거티브 벡터 및 포지티브 벡터의 합으로 표현되거나 포지티브 벡터 및 널 벡터의 합으로 표현되는 것을 특징으로 하는 오디오 제공 방법.
제19항에 있어서,

상기 정위 정보를 생성하는 단계는,

상기 오디오 제공 장치의 스피커 레이아웃에 따라 상기 오브젝트 오디오 신호를 정위시키기 위한 패닝 게인을 산출하는 것을 특징으로 하는 오디오 제공 방법.
제20항에 있어서,

상기 렌더링하는 단계는,

상기 오브젝트 신호의 거리 게인, 뎁스 게인 및 패닝 게인을 바탕으로 상기 오브젝트 오디오 신호를 멀티 채널로 렌더링하는 것을 특징으로 오디오 제공 방법.
제17항에 있어서,

상기 오브젝트 오디오 신호를 렌더링하는 단계는,

상기 오브젝트 오디오 신호가 복수 개 존재하는 경우, 상기 복수의 오브젝트 오디오 신호 중 상관도를 갖는 오브젝트 사이의 위상 차이를 산출하고, 상기 복수의 오브젝트 오디오 신호 중 하나를 상기 산출된 위상 차이만큼 이동하여 상기 복수의 오브젝트 오디오 신호를 합성하는 것을 특징으로 하는 오디오 제공 단계.
제16항에 있어서,

상기 오디오 제공 장치가 동일한 고도를 가지는 복수의 스피커를 이용하여 오디오를 재생하는 경우,

상기 오브젝트 오디오 신호를 렌더링하는 단계는,

상기 오브젝트 오디오 신호의 스펙트럼 특성(spectral characteristics)을 보정하여 상기 오브젝트 오디오 신호에 가상 고도 정보를 산출하는 단계;

상기 가상 필터부에 의해 제공된 가상 고도 정보를 바탕으로 상기 오브젝트 오디오 신호를 렌더링하는 단계;를 포함하는 것을 특징으로 하는 오디오 제공 방법.
제23항에 있어서,

상기 산출하는 단계는,

복수의 단계로 구성된 트리 구조를 이루는 가상 필터를 이용하여 상기 오브젝트 오디오 신호의 가상 고도 정보를 산출하는 것을 특징으로 하는 오디오 제공 방법.
제16항에 있어서,

상기 제2 채널 수를 가지는 오디오 신호로 렌더링하는 단계는,

상기 제1 채널 수를 가지는 오디오 신호의 레이아웃이 2차원인 경우, 상기 제1 채널 수를 가지는 오디오 신호를 상기 제1 채널 수보다 많은 상기 제2 채널 수를 가지는 오디오 신호로 업믹싱하며,

상기 제2 채널 수를 가지는 오디오 신호의 레이아웃은 상기 제1 채널 수를 가지는 오디오 신호와 상이한 고도 정보를 가지는 3차원인 것을 특징으로 하는 오디오 제공 방법.
제16항에 있어서,

상기 제2 채널 수를 가지는 오디오 신호로 렌더링하는 단계는,

상기 제1 채널 수를 가지는 오디오 신호의 레이아웃이 3차원인 경우, 상기 제1 채널 수를 가지는 오디오 신호를 상기 제1 채널 수보다 적은 상기 제2 채널 수를 가지는 오디오 신호로 다운믹싱하며,

상기 제2 채널 수를 가지는 오디오 신호의 레이아웃은 복수의 채널이 동일한 고도 성분을 가지는 2차원인 것을 특징으로 하는 오디오 제공 방법.
제16항에 있어서,

상기 오브젝트 오디오 신호 및 상기 제1 채널 수를 가지는 오디오 신호 중 적어도 하나는, 특정 프레임에 대해 가상 3차원 렌더링을 수행할지 여부를 결정하는 정보를 포함하는 것을 특징으로 하는 오디오 제공 방법.