Claims (89)
1. Система (102) для приема аудиопотоков, которые должны воспроизводиться, содержащая:1. A system (102) for receiving audio streams to be reproduced, comprising:
по меньшей мере один декодер (104) аудио, выполненный с возможностью декодировать аудиосигналы (108) из по меньшей мере одного аудиопотока (106) и/или одного адаптационного набора,at least one audio decoder (104) configured to decode audio signals (108) from at least one audio stream (106) and/or one adaptation set,
причем система (102) выполнена с возможностью запрашивать (112) по меньшей мере один аудиопоток (106), и/или один аудиоэлемент в аудиопотоке, и/или один адаптационный набор, и/или один аудиоэлемент в адаптационном наборе на основе, по меньшей мере, текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных (110) положения пользователя,wherein the system (102) is configured to request (112) at least one audio stream (106), and/or one audio element in the audio stream, and/or one adaptation set, and/or one audio element in the adaptation set based on at least current user movement data, and/or user interaction metadata, and/or user position data (110),
при этом задаются по меньшей мере две аудиосцены, причем по меньшей мере один первый и второй аудиоэлементы ассоциированы с первой аудиосценой и по меньшей мере один третий аудиоэлемент ассоциирован со второй аудиосценой,wherein at least two audio scenes are defined, wherein at least one first and second audio element is associated with the first audio scene and at least one third audio element is associated with the second audio scene,
причем система выполнена с возможностью принимать метаданные, описывающие то, что по меньшей мере один второй аудиоэлемент дополнительно ассоциирован со второй аудиосценой,wherein the system is configured to receive metadata describing that at least one second audio element is additionally associated with the second audio scene,
при этом система выполнена с возможностью принимать по меньшей мере один первый и второй аудиоэлементы, когда положение пользователя ассоциировано с первой аудиосценой,wherein the system is configured to receive at least one first and second audio elements when the user's position is associated with the first audio scene,
причем система выполнена с возможностью принимать по меньшей мере один второй и третий аудиоэлементы, когда положение пользователя ассоциировано со второй аудиосценой, иwherein the system is configured to receive at least one second and third audio elements when the user's position is associated with the second audio scene, and
при этом система выполнена с возможностью принимать, по меньшей мере, первый, второй и третий аудиоэлементы в случае перехода между первой аудиосценой и второй аудиосценой.wherein the system is configured to receive at least the first, second and third audio elements in the event of a transition between the first audio scene and the second audio scene.
2. Система по п. 1, выполненная с возможностью подавать запрос с текущими данными перемещения пользователя, и/или метаданными взаимодействия пользователя, и/или данными (110) положения пользователя для приема по меньшей мере одного аудиопотока (106), и/или одного аудиоэлемента аудиопотока, и/или одного адаптационного набора, и/или одного аудиоэлемента адаптационного набора.2. The system according to claim 1, configured to submit a request with current user movement data, and/or user interaction metadata, and/or user position data (110) for receiving at least one audio stream (106), and/or one audio element of the audio stream, and/or one adaptation set, and/or one audio element of the adaptation set.
3. Система по любому из предшествующих пунктов, выполненная с возможностью:3. A system according to any of the preceding claims, configured to:
приема информации о текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя,receiving information about the user's current movement data and/or user interaction metadata,
и/или данных положения пользователя, и/или любой информации, характеризующей изменения, вызванные действиями пользователя, иand/or user position data, and/or any information characterizing changes caused by user actions, and
приема информации о доступности адаптационных наборов и информации, описывающей ассоциацию по меньшей мере одного адаптационного набора с по меньшей мере одной сценой, и/или данные перемещения, и/или метаданные взаимодействия, и/или данные положения.receiving information about the availability of adaptation sets and information describing the association of at least one adaptation set with at least one scene, and/or movement data, and/or interaction metadata, and/or position data.
4. Система по любому из предшествующих пунктов, выполненная с возможностью решать, нужно ли воспроизводить по меньшей мере один аудиоэлемент аудиопотока и/или один адаптационный набор для текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или положения пользователя, при этом система выполнена с возможностью принимать этот по меньшей мере один аудиоэлемент в текущем виртуальном положении пользователя.4. The system according to any of the preceding claims, configured to decide whether to reproduce at least one audio element of the audio stream and/or one adaptation set for the current user movement data and/or user interaction metadata and/or user position, wherein the system is configured to receive this at least one audio element at the current virtual position of the user.
5. Система по любому из предшествующих пунктов, выполненная с возможностью прогнозировать, станет ли релевантным и/или слышимым по меньшей мере один аудиоэлемент (152) аудиопотока и/или одного адаптационного набора, на основе, по меньшей мере, текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или положения (110),5. A system according to any of the preceding claims, configured to predict whether at least one audio element (152) of an audio stream and/or one adaptation set will become relevant and/or audible, based on at least current user movement data and/or user interaction metadata and/or position (110),
причем система выполнена с возможностью принимать этот по меньшей мере один аудиоэлемент, и/или аудиопоток, и/или адаптационный набор в конкретном виртуальном положении пользователя до предсказанного перемещения и/или взаимодействия пользователя, wherein the system is configured to receive this at least one audio element and/or audio stream and/or adaptation set at a specific virtual position of the user prior to the predicted movement and/or interaction of the user,
при этом система выполнена с возможностью воспроизводить данный по меньшей мере один аудиоэлемент, и/или аудиопоток, и/или один адаптационный набор, и/или один аудиоэлемент в адаптационном наборе, по его приему, в упомянутом конкретном виртуальном положении пользователя после перемещения и/или взаимодействия пользователя.wherein the system is configured to reproduce at least one audio element and/or audio stream and/or one adaptation set and/or one audio element in the adaptation set, upon its reception, in the said specific virtual position of the user after the user's movement and/or interaction.
6. Система по любому из предшествующих пунктов, выполненная с возможностью принимать по меньшей мере один аудиоэлемент (152) с более низким битрейтом и/или уровнем качества в виртуальном положении пользователя до перемещения и/или взаимодействия пользователя, причем система выполнена с возможностью принимать этот по меньшей мере один аудиоэлемент с более высоким битрейтом и/или уровнем качества в виртуальном положении пользователя после упомянутого перемещения и/или взаимодействия пользователя.6. The system according to any of the preceding claims, configured to receive at least one audio element (152) with a lower bit rate and/or quality level at the virtual position of the user before the user's movement and/or interaction, wherein the system is configured to receive this at least one audio element with a higher bit rate and/or quality level at the virtual position of the user after said movement and/or interaction of the user.
7. Система по любому из предшествующих пунктов, при этом каждый аудиоэлемент ассоциируется с положением, ассоциированным со сценой, причем система выполнена с возможностью принимать потоки с более высоким битрейтом и/или уровнем качества для аудиоэлементов ближе к пользователю, чем для аудиоэлементов, более отдаленных от пользователя.7. The system of any of the preceding claims, wherein each audio element is associated with a position associated with a scene, and the system is configured to receive streams with a higher bit rate and/or quality level for audio elements closer to the user than for audio elements further from the user.
8. Система по любому из предшествующих пунктов, при этом по меньшей мере один аудиоэлемент ассоциируется с положением, ассоциированным со сценой,8. A system according to any of the preceding claims, wherein at least one audio element is associated with a position associated with a scene,
при этом система выполнена с возможностью запрашивать разные потоки с разными битрейтами и/или уровнями качества для аудиоэлементов на основе их релевантности и/или уровня слышимости в каждом положении пользователя,wherein the system is configured to request different streams with different bit rates and/or quality levels for audio elements based on their relevance and/or audibility level at each user position,
причем система выполнена с возможностью запрашивать аудиопоток и/или один адаптационный набор с более высоким битрейтом и/или уровнем качества для аудиоэлементов, которые более релевантны и/или лучше слышны в текущем виртуальном положении пользователя, и/или аудиопоток и/или один адаптационный набор с более низким битрейтом и/или уровнем качества для аудиоэлементов, которые менее релевантны и/или хуже слышны в текущем виртуальном положении пользователя.wherein the system is configured to request an audio stream and/or one adaptation set with a higher bit rate and/or quality level for audio elements that are more relevant and/or better heard in the current virtual position of the user, and/or an audio stream and/or one adaptation set with a lower bit rate and/or quality level for audio elements that are less relevant and/or worse heard in the current virtual position of the user.
9. Система по любому из предшествующих пунктов, при этом каждый аудиоэлемент ассоциируется с положением и/или областью в среде, ассоциированной с первой или второй аудиосценой, причем система выполнена с возможностью периодически отправлять запрос с текущими данными перемещения пользователя, и/или метаданными взаимодействия пользователя, и/или положением (110) пользователя, чтобы:9. The system of any of the preceding claims, wherein each audio element is associated with a position and/or region in the environment associated with the first or second audio scene, and the system is configured to periodically send a request with current user movement data, and/or user interaction metadata, and/or user position (110) in order to:
для первого положения принимался поток с более высоким битрейтом и/или уровнем качества, for the first position, a stream with a higher bitrate and/or quality level was accepted,
для второго положения принимался поток с более низким битрейтом и/или уровнем качества,for the second position, a stream with a lower bitrate and/or quality level was accepted,
причем первое положение ближе к упомянутому по меньшей мере одному аудиоэлементу (152), чем второе положение.wherein the first position is closer to said at least one audio element (152) than the second position.
10. Система по любому из предшествующих пунктов, в которой предоставляются первые потоки, ассоциированные с первой, текущей аудиосценой, и, в случае перехода пользователя ко второй, дальней аудиосцене, предоставляются как потоки, ассоциированные с первой аудиосценой, так и вторые потоки, ассоциированные со второй аудиосценой.10. A system according to any of the preceding claims, in which first streams associated with a first, current audio scene are provided, and, in the event of the user moving to a second, distant audio scene, both streams associated with the first audio scene and second streams associated with the second audio scene are provided.
11. Система по любому из предшествующих пунктов, в которой11. A system according to any of the preceding claims, in which
предоставляются первые потоки, ассоциированные с первой аудиосценой, для воспроизведения первой аудиосцены, если положение или виртуальное положение пользователя ассоциировано с первой аудиосценой,first streams associated with the first audio scene are provided for playing the first audio scene if the position or virtual position of the user is associated with the first audio scene,
предоставляются вторые потоки, ассоциированные со второй аудиосценой, для воспроизведения второй аудиосцены, если положение или виртуальное положение пользователя ассоциировано со второй аудиосценой, иsecond streams associated with the second audio scene are provided to reproduce the second audio scene if the position or virtual position of the user is associated with the second audio scene, and
предоставляются как первые потоки, ассоциированные с первой аудиосценой, так и вторые потоки, ассоциированные со второй аудиосценой, в случае перехода положения или виртуального положения пользователя между первой аудиосценой и второй аудиосценой.both first streams associated with the first audio scene and second streams associated with the second audio scene are provided in the event of a transition of the position or virtual position of the user between the first audio scene and the second audio scene.
12. Система по любому из предшествующих пунктов, в которой задается множество сцен (150 А, 150 В),12. A system according to any of the preceding claims, in which a plurality of scenes (150 A, 150 V) are defined,
причем система выполнена с возможностью принимать первые потоки, ассоциированные с первой аудиосценой, для воспроизведения первой аудиосцены, если положение пользователя ассоциировано с первой аудиосценой,wherein the system is configured to receive first streams associated with the first audio scene for reproducing the first audio scene if the user's position is associated with the first audio scene,
причем система выполнена с возможностью принимать вторые потоки, ассоциированные со второй аудиосценой, для воспроизведения второй аудиосцены, если виртуальное положение пользователя ассоциировано со второй аудиосценой, иwherein the system is configured to receive second streams associated with the second audio scene for reproducing the second audio scene if the user's virtual position is associated with the second audio scene, and
при этом система выполнена с возможностью принимать как первые потоки, ассоциированные с первой аудиосценой, так и вторые потоки, ассоциированные со второй аудиосценой, если виртуальное положение пользователя находится в переходном положении (150АВ) между первой аудиосценой и второй аудиосценой.wherein the system is configured to receive both the first streams associated with the first audio scene and the second streams associated with the second audio scene if the user's virtual position is in a transition position (150AB) between the first audio scene and the second audio scene.
13. Система по любому из пп. 10-12, при этом13. The system according to any one of paragraphs 10-12, wherein
первые потоки, ассоциированные с первой аудиосценой, принимаются с более высоким битрейтом и/или уровнем качества, когда положение пользователя ассоциировано с первой аудиосценой,the first streams associated with the first audio scene are received with a higher bitrate and/or quality level when the user position is associated with the first audio scene,
тогда как вторые потоки, ассоциированные со второй аудиосценой, принимаются с более низким битрейтом и/или уровнем качества, когда пользователь находится в начале перехода от первой аудиосцены ко второй аудиосцене, иwhereas the second streams associated with the second audio scene are received at a lower bit rate and/or quality level when the user is at the beginning of the transition from the first audio scene to the second audio scene, and
первые потоки, ассоциированные с первой аудиосценой, принимаются с более низким битрейтом и/или уровнем качества, а вторые потоки, ассоциированные со второй аудиосценой, принимаются с более высоким битрейтом и/или уровнем качества, когда пользователь переходит от первой аудиосцены ко второй аудиосцене,the first streams associated with the first audio scene are received with a lower bit rate and/or quality level, and the second streams associated with the second audio scene are received with a higher bit rate and/or quality level when the user moves from the first audio scene to the second audio scene,
причем упомянутый более низкий битрейт и/или уровень качества ниже упомянутого более высокого битрейта и/или уровня качества.wherein said lower bitrate and/or quality level is lower than said higher bitrate and/or quality level.
14. Система по любому из предшествующих пунктов, в которой задается множество из N аудиоэлементов, и если расстояние пользователя до положения или области этих аудиоэлементов больше заранее установленной пороговой величины, то обрабатываются N аудиоэлементов для приема меньшего числа М аудиоэлементов (M<N), ассоциированных с положением или областью, близкой к положению или области N аудиоэлементов, чтобы14. The system of any one of the preceding claims, wherein a plurality of N audio elements is defined, and if the user's distance to a position or region of these audio elements is greater than a predetermined threshold, then the N audio elements are processed to receive a smaller number of M audio elements (M<N) associated with a position or region close to the position or region of the N audio elements, so that
предоставить системе по меньшей мере один аудиопоток или один адаптационный набор, ассоциированный с N аудиоэлементами, если расстояние пользователя до положения или области N аудиоэлементов меньше заранее установленной пороговой величины, либоprovide the system with at least one audio stream or one adaptation set associated with the N audio elements if the user's distance to the position or region of the N audio elements is less than a predetermined threshold, or
предоставить системе по меньшей мере один аудиопоток или один адаптационный набор, ассоциированный с М аудиоэлементами, если расстояние пользователя до положения или области N аудиоэлементов больше заранее установленной пороговой величины.provide the system with at least one audio stream or one adaptation set associated with the M audio elements if the user's distance to the position or region of the N audio elements is greater than a predetermined threshold.
15. Система (102) по любому из предшествующих пунктов, в которой по меньшей мере одна сцена среды ассоциирована с по меньшей мере одним множеством из N аудиоэлементов, N≥2, при этом каждый аудиоэлемент ассоциируется с положением и/или областью в среде,15. The system (102) according to any of the preceding claims, wherein at least one scene of the environment is associated with at least one set of N audio elements, N≥2, wherein each audio element is associated with a position and/or region in the environment,
причем, по меньшей мере, упомянутое по меньшей мере одно множество из N аудиоэлементов предоставляется в по меньшей мере одном представлении с высоким битрейтом и/или уровнем качества,wherein at least said at least one plurality of N audio elements is provided in at least one representation with a high bit rate and/or quality level,
при этом, по меньшей мере, упомянутое по меньшей мере одно множество из N аудиоэлементов предоставляется в по меньшей мере одном представлении с низким битрейтом и/или уровнем качества, где данное по меньшей мере одно представление принимается путем обработки N аудиоэлементов, чтобы принять меньшее число М аудиоэлементов (M<N), ассоциированных с положением или областью, близкой к положению или области N аудиоэлементов,wherein at least said at least one plurality of N audio elements is provided in at least one representation with a low bit rate and/or quality level, where this at least one representation is received by processing the N audio elements to receive a smaller number M of audio elements (M<N) associated with a position or region close to the position or region of the N audio elements,
причем система выполнена с возможностью запрашивать представление с более высоким битрейтом и/или уровнем качества для аудиоэлементов, если аудиоэлементы более релевантны и/или лучше слышны в текущем виртуальном положении пользователя в сцене,wherein the system is configured to request a higher bit rate and/or quality level representation for the audio elements if the audio elements are more relevant and/or better audible at the user's current virtual position in the scene,
причем система выполнена с возможностью запрашивать представление с более низким битрейтом и/или уровнем качества для аудиоэлементов, если аудиоэлементы менее релевантны и/или хуже слышны в текущем виртуальном положении пользователя в сцене.wherein the system is configured to request a representation with a lower bit rate and/or quality level for the audio elements if the audio elements are less relevant and/or less audible at the user's current virtual position in the scene.
16. Система по п. 14 или 15, в которой, если расстояние пользователя, и/или релевантность, и/или уровень слышимости, и/или угловая ориентация ниже заранее установленной пороговой величины, то разные потоки принимаются для разных аудиоэлементов.16. The system of claim 14 or 15, wherein if the user distance and/or relevance and/or audibility level and/or angular orientation are below a predetermined threshold, then different streams are received for different audio elements.
17. Система по любому из предшествующих пунктов, при этом система выполнена с возможностью принимать потоки на основе ориентации пользователя, и/или направления перемещения пользователя, и/или взаимодействий пользователя в сцене.17. The system of any one of the preceding claims, wherein the system is configured to receive streams based on user orientation, and/or user direction of movement, and/or user interactions in the scene.
18. Система по любому из предшествующих пунктов, выполненная с возможностью принимать первые аудиопотоки или первые адаптационные наборы и вторые аудиопотоки, причем первые аудиоэлементы в первых аудиопотоках или первых адаптационных наборах более релевантны и/или лучше слышны, чем вторые аудиоэлементы во вторых аудиопотоках или вторых адаптационных наборах, при этом первые аудиопотоки или первые адаптационные наборы запрашиваются и/или принимаются с более высоким битрейтом и/или уровнем качества, чем битрейт и/или уровень качества вторых аудиопотоков или вторых адаптационных наборов.18. A system according to any one of the preceding claims, configured to receive first audio streams or first adaptation sets and second audio streams, wherein the first audio elements in the first audio streams or first adaptation sets are more relevant and/or better audible than the second audio elements in the second audio streams or second adaptation sets, wherein the first audio streams or first adaptation sets are requested and/or received at a higher bit rate and/or quality level than the bit rate and/or quality level of the second audio streams or second adaptation sets.
19. Система по любому из предшествующих пунктов, в которой по меньшей мере один первый аудиоэлемент предоставляется в по меньшей мере одном аудиопотоке и/или адаптационном наборе, по меньшей мере один второй аудиоэлемент предоставляется в по меньшей мере одном втором аудиопотоке и/или адаптационном наборе, и по меньшей мере один третий аудиоэлемент предоставляется в по меньшей мере одном третьем аудиопотоке и/или адаптационном наборе, при этом, по меньшей мере, первая аудиосцена описывается метаданными как законченная сцена, которая требует, по меньшей мере, первый и второй аудиопотоки и/или адаптационные наборы, причем вторая аудиосцена описывается метаданными как незаконченная сцена, которая требует, по меньшей мере, третий аудиопоток и/или адаптационный набор и по меньшей мере один второй аудиопоток и/или адаптационные наборы, ассоциированные с, по меньшей мере, первой аудиосценой,19. The system of any one of the preceding claims, wherein at least one first audio element is provided in at least one audio stream and/or adaptation set, at least one second audio element is provided in at least one second audio stream and/or adaptation set, and at least one third audio element is provided in at least one third audio stream and/or adaptation set, wherein at least the first audio scene is described by metadata as a complete scene that requires at least the first and second audio streams and/or adaptation sets, wherein the second audio scene is described by metadata as an unfinished scene that requires at least the third audio stream and/or adaptation set and at least one second audio stream and/or adaptation sets associated with at least the first audio scene,
причем система содержит процессор метаданных, выполненный с возможностью работать с метаданными для обеспечения возможности соединения второго аудиопотока, принадлежащего первому аудио, и третьего аудиопотока, ассоциированного со вторым аудио, в новый единый поток, если положение пользователя ассоциировано со второй аудиосценой.wherein the system comprises a metadata processor configured to operate with metadata to enable the second audio stream belonging to the first audio and the third audio stream associated with the second audio to be combined into a new single stream if the user's position is associated with the second audio scene.
20. Система по любому из предшествующих пунктов, причем система содержит процессор метаданных, выполненный с возможностью работать с метаданными в по меньшей мере одном аудиопотоке перед по меньшей мере одним декодером аудио на основе текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных положения пользователя.20. The system according to any one of the preceding claims, wherein the system comprises a metadata processor configured to operate on metadata in at least one audio stream in front of at least one audio decoder based on current user movement data and/or user interaction metadata and/or user position data.
21. Система по п. 20, в которой процессор метаданных выполнен с возможностью включать и/или отключать по меньшей мере один аудиоэлемент в по меньшей мере одном аудиопотоке или адаптационном наборе перед по меньшей мере одним декодером аудио на основе текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных положения пользователя, причем21. The system of claim 20, wherein the metadata processor is configured to enable and/or disable at least one audio element in at least one audio stream or adaptation set in front of at least one audio decoder based on current user movement data and/or user interaction metadata and/or user position data, wherein
процессор метаданных выполнен с возможностью отключать по меньшей мере один аудиоэлемент в по меньшей мере одном аудиопотоке или адаптационном наборе перед по меньшей мере одним декодером аудио, если система решает, что этот аудиоэлемент больше не нужно воспроизводить как следствие текущих данных перемещения, и/или метаданных взаимодействия, и/или данных положения, и при этомthe metadata processor is configured to disable at least one audio element in at least one audio stream or adaptation set before the at least one audio decoder if the system decides that this audio element no longer needs to be played as a result of current movement data and/or interaction metadata and/or position data, and wherein
процессор метаданных выполнен с возможностью включать по меньшей мере один аудиоэлемент в по меньшей мере одном аудиопотоке или адаптационном наборе перед по меньшей мере одним декодером аудио, если система решает, что этот аудиоэлемент нужно воспроизводить как следствие текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных положения пользователя.the metadata processor is configured to include at least one audio element in at least one audio stream or adaptation set before at least one audio decoder if the system decides that this audio element needs to be reproduced as a result of current user movement data and/or user interaction metadata and/or user position data.
22. Система по любому из предшествующих пунктов, выполненная с возможностью отключать декодирование аудиоэлементов, выбранных на основе текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных положения пользователя.22. The system of any one of the preceding claims, configured to disable decoding of audio elements selected based on current user movement data and/or user interaction metadata and/or user position data.
23. Система по любому из предшествующих пунктов, выполненная с возможностью отключать декодирование и/или воспроизведение по меньшей мере одного потока на основе метаданных, ассоциированных с этим по меньшей мере одним потоком, и на основе текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных положения пользователя.23. The system of any one of the preceding claims, configured to disable decoding and/or playback of at least one stream based on metadata associated with the at least one stream and based on current user movement data and/or user interaction metadata and/or user position data.
24. Система по любому из предшествующих пунктов, дополнительно выполненная с возможностью работать с метаданными, ассоциированными с группой выбранных аудиопотоков, на основе, по меньшей мере, текущих или оценочных данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных положения пользователя, чтобы:24. The system of any of the preceding claims, further configured to operate on metadata associated with the group of selected audio streams based on at least current or estimated user movement data and/or user interaction metadata and/or user position data, in order to:
выбирать и/или включать и/или активировать аудиоэлементы, составляющие аудиосцену для воспроизведения; и/илиselect and/or enable and/or activate the audio elements that make up the audio scene to be played; and/or
обеспечивать соединение всех выбранных аудиопотоков в единый аудиопоток.ensure that all selected audio streams are combined into a single audio stream.
25. Система по любому из предшествующих пунктов, в которой принимается информация для каждого аудиоэлемента или аудиообъекта, причем данная информация включает в себя описательную информацию о местоположениях, в которых активны звуковая сцена или аудиоэлементы.25. A system according to any of the preceding claims, wherein information is received for each audio element or audio object, wherein the information includes descriptive information about the locations at which the sound scene or audio elements are active.
26. Система по любому из предшествующих пунктов, выполненная с возможностью создавать или использовать, по меньшей мере, адаптационные наборы, чтобы:26. A system according to any of the preceding claims, configured to create or use at least adaptation sets to:
множество адаптационных наборов ассоциировалось с одной аудиосценой; и/илиmultiple adaptation sets were associated with a single audio scene; and/or
предоставлялась дополнительная информация, которая соотносит каждый адаптационный набор с одной аудиосценой; и/илиadditional information was provided that related each adaptation set to one audio scene; and/or
предоставлялась дополнительная информация, которая может включать в себя:additional information was provided, which may include:
информацию о границах одной аудиосцены, и/илиinformation about the boundaries of one audio scene, and/or
информацию о взаимосвязи между одним адаптационным набором и одной аудиосценой (например, аудиосцена кодируется в три потока, которые заключаются в три адаптационных набора), и/илиinformation about the relationship between one adaptation set and one audio scene (e.g., an audio scene is encoded into three streams, which are contained in three adaptation sets), and/or
информацию о связи между границами аудиосцены и множеством адаптационных наборов.information about the relationship between audio scene boundaries and the set of adaptation sets.
27. Система по любому из предшествующих пунктов, при этом система дополнительно выполнена с возможностью:27. The system according to any of the preceding paragraphs, wherein the system is further configured to:
принимать по меньшей мере один первый адаптационный набор, содержащий по меньшей мере один аудиопоток, ассоциированный с по меньшей мере одной первой аудиосценой;receive at least one first adaptation set comprising at least one audio stream associated with at least one first audio scene;
принимать по меньшей мере один второй адаптационный набор, содержащий по меньшей мере один второй аудиопоток, ассоциированный с по меньшей мере двумя аудиосценами, включая упомянутую по меньшей мере одну первую аудиосцену; иreceive at least one second adaptation set comprising at least one second audio stream associated with at least two audio scenes, including said at least one first audio scene; and
обеспечивать соединение по меньшей мере одного первого аудиопотока и по меньшей мере одного второго аудиопотока в новый аудиопоток для декодирования, основываясь на метаданных, доступных касаемо текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных положения пользователя, и/или информации, описывающей ассоциацию по меньшей мере одного первого адаптационного набора с по меньшей мере одной первой аудиосценой и/или ассоциацию по меньшей мере одного второго адаптационного набора с по меньшей мере одной первой аудиосценой.provide for joining at least one first audio stream and at least one second audio stream into a new audio stream for decoding based on metadata available regarding current user movement data and/or user interaction metadata and/or user position data and/or information describing an association of at least one first adaptation set with at least one first audio scene and/or an association of at least one second adaptation set with at least one first audio scene.
28. Система по любому из предшествующих пунктов, выполненная с возможностью:28. A system according to any of the preceding claims, capable of:
решать, нужно ли воспроизводить по меньшей мере один аудиоэлемент из по меньшей мере одной аудиосцены, встроенной в по меньшей мере один поток, и по меньшей мере один дополнительный аудиоэлемент из по меньшей мере одной дополнительной аудиосцены, встроенной в по меньшей мере один дополнительный поток; иdecide whether to reproduce at least one audio element from at least one audio scene embedded in at least one stream and at least one additional audio element from at least one additional audio scene embedded in at least one additional stream; and
вызывать, при положительном решении, операцию соединения, или составления, или мультиплексирования, или наложения, или объединения упомянутого по меньшей мере одного дополнительного потока дополнительной аудиосцены с упомянутым по меньшей мере одним потоком по меньшей мере одной аудиосцены.to cause, if the decision is positive, an operation of joining, or composing, or multiplexing, or superimposing, or combining said at least one additional stream of an additional audio scene with said at least one stream of at least one audio scene.
29. Система по любому из предшествующих пунктов, выполненная с возможностью работать с метаданными, ассоциированными с выбранными аудиопотоками, на основе, по меньшей мере, текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных положения пользователя, чтобы:29. The system according to any of the preceding claims, configured to operate on metadata associated with the selected audio streams based on at least current user movement data and/or user interaction metadata and/or user position data, in order to:
выбирать и/или включать и/или активировать аудиоэлементы, составляющие аудиосцену, которую решено воспроизвести; и/илиselect and/or enable and/or activate the audio elements that make up the audio scene that you decide to play; and/or
обеспечивать соединение всех выбранных аудиопотоков в единый аудиопоток.ensure that all selected audio streams are combined into a single audio stream.
30. Способ приема аудиопотоков для воспроизведения, содержащий этапы, на которых:30. A method for receiving audio streams for playback, comprising the steps of:
декодируют аудиосигналы из аудиопотоков; иdecode audio signals from audio streams; and
запрашивают и/или принимают по меньшей мере один аудиопоток на основе текущих данных перемещения пользователя, и/или метаданных взаимодействия пользователя, и/или данных положения поль зователя;requesting and/or receiving at least one audio stream based on current user movement data and/or user interaction metadata and/or user position data;
при этом задаются по меньшей мере две аудиосцены, причем по меньшей мере один первый и второй аудиоэлементы ассоциированы с первой аудиосценой и по меньшей мере один третий аудиоэлемент ассоциирован со второй аудиосценой,wherein at least two audio scenes are defined, wherein at least one first and second audio element is associated with the first audio scene and at least one third audio element is associated with the second audio scene,
причем способ включает в себя прием метаданных, описывающих то, что по меньшей мере один второй аудиоэлемент дополнительно ассоциирован со второй аудиосценой,wherein the method includes receiving metadata describing that at least one second audio element is further associated with the second audio scene,
при этом способ включает в себя запрашивание и/или прием по меньшей мере одного первого и второго аудиоэлементов, когда положение пользователя ассоциировано с первой аудиосценой,wherein the method includes requesting and/or receiving at least one first and second audio elements when the user's position is associated with the first audio scene,
причем способ включает в себя запрашивание и/или прием по меньшей мере одного второго и третьего аудиоэлементов, когда положение пользователя - во второй аудиосцене, иwherein the method includes requesting and/or receiving at least one second and third audio elements when the user's position is in the second audio scene, and
при этом способ включает в себя запрашивание и/или прием, по меньшей мере, первого, второго и третьего аудиоэлементов в случае перехода между первой аудиосценой и второй аудиосценой.wherein the method includes requesting and/or receiving at least the first, second and third audio elements in the event of a transition between the first audio scene and the second audio scene.
31. Компьютерная программа, содержащая инструкции, которые при их исполнении процессором предписывают процессору выполнять способ по п. 30.31. A computer program containing instructions that, when executed by a processor, cause the processor to perform the method of paragraph 30.