[go: up one dir, main page]

RU2758035C2 - Способ и устройство для реконструкции данных изображений по декодированным данным изображений - Google Patents

Способ и устройство для реконструкции данных изображений по декодированным данным изображений Download PDF

Info

Publication number
RU2758035C2
RU2758035C2 RU2017144024A RU2017144024A RU2758035C2 RU 2758035 C2 RU2758035 C2 RU 2758035C2 RU 2017144024 A RU2017144024 A RU 2017144024A RU 2017144024 A RU2017144024 A RU 2017144024A RU 2758035 C2 RU2758035 C2 RU 2758035C2
Authority
RU
Russia
Prior art keywords
image data
parameters
parameter
lost
inconsistent
Prior art date
Application number
RU2017144024A
Other languages
English (en)
Other versions
RU2017144024A (ru
RU2017144024A3 (ru
Inventor
Пьер АНДРИВОН
Давид ТУЗЕ
Николя КАРАМЕЛЛИ
Original Assignee
ИНТЕРДИДЖИТАЛ ВиСи ХОЛДИНГЗ, ИНК.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP17305212.7A external-priority patent/EP3367684A1/en
Application filed by ИНТЕРДИДЖИТАЛ ВиСи ХОЛДИНГЗ, ИНК. filed Critical ИНТЕРДИДЖИТАЛ ВиСи ХОЛДИНГЗ, ИНК.
Publication of RU2017144024A publication Critical patent/RU2017144024A/ru
Publication of RU2017144024A3 publication Critical patent/RU2017144024A3/ru
Application granted granted Critical
Publication of RU2758035C2 publication Critical patent/RU2758035C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4344Remultiplexing of multiplex streams, e.g. by modifying time stamps or remapping the packet identifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/68Circuits for processing colour signals for controlling the amplitude of colour signals, e.g. automatic chroma control circuits
    • H04N9/69Circuits for processing colour signals for controlling the amplitude of colour signals, e.g. automatic chroma control circuits for modifying the colour signals by gamma correction
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

Изобретение относится к вычислительной технике. Технический результат заключается в повышении качества реконструированного изображения путем исключения артефактов мелькания и нежелательных эффектов. Способ реконструкции данных изображений, характеризующих исходные данные изображений, по декодированным данным изображений и по параметрам, полученным из битового потока, содержит проверку того, являются ли упомянутые параметры потерянными, искаженными или несогласованными с декодированными данными изображений с вставленной поверх их графикой или наложением; когда по меньшей мере один из упомянутых параметров является потерянным, искаженным или несогласованным с декодированными данными изображений, к которым добавляется графика или наложение, выбор режима восстановления в соответствии с информационными данными, указывающими, как обработаны упомянутые параметры; и восстановление упомянутого по меньшей мере одного потерянного, искаженного или несогласованного параметра путем применения выбранного режима восстановления; и реконструкцию данных изображений на основании декодированных данных изображений и по меньшей мере одного восстановленного параметра, при этом реконструкция изображений содержит по меньшей мере обратное отображение яркости и коррекцию цветности. 3 н. и 14 з.п. ф-лы, 9 ил., 2 табл.

Description

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящие принципы, в основном, относятся к реконструкции изображений/видео по декодированным данным изображений/видео. В том числе, но не исключительно, область техники настоящих принципов относится к восстановлению параметров для реконструкции изображения по другому изображению.
УРОВЕНЬ ТЕХНИКИ
Настоящий раздел предназначен для ознакомления читателя с различными аспектами данного уровня техники, которые могут быть связаны с различными аспектами настоящих принципов, описываемыми и/или заявляемыми ниже. Можно предположить, что данное описание поможет предоставить читателю дополнительную информацию для обеспечения лучшего понимания различных аспектов настоящих принципов. В связи с этим, следует понимать, что данные утверждения должны рассматриваться с этой точки зрения, а не как допущения уровня техники.
В дальнейшем данные изображений означают одну или несколько матриц отсчетов (значений пикселей) в конкретном формате изображений/видео, который задает всю информацию, относящуюся к значениям пикселей изображения (или видео), и всю информацию, которая может использоваться, например, дисплеем и/или иным устройством для визуализации и/или декодирования изображения (или видео). Изображение содержит первую компоненту в форме первой матрицы отсчетов, обычно характеризующую яркость (или сигнал яркости) изображения, и вторую и третью компоненту в форме других матриц отсчетов, обычно характеризующие цвет (или сигнал цветности) изображения. Или, что то же самое, та же информация может также быть представлена набором матриц отсчетов цвета, например, в традиционном трехцветном представлении RGB.
Значение пикселя представлено вектором значений C, где C - число компонентов. Каждое значение вектора представлено числом бит, которое определяет максимальный динамический диапазон значений пикселей.
Изображения со Стандартным Динамическим Диапазоном (SDR-изображения) представляют собой изображения, значения яркости которых представлены ограниченным числом бит (как правило, 8). Столь ограниченное представление не обеспечивает точного воспроизведения небольших изменений сигнала, в частности, в темном и светлом диапазонах яркости. В изображениях с расширенным динамическим диапазоном (HDR-изображениях) представление сигнала расширено для сохранения высокой точности сигнала во всем его диапазоне. В HDR-изображениях значения пикселей, представляющие значения яркостей, обычно представлены в формате с плавающей точкой (как правило, по меньшей мере, 10 бит на компоненту, а именно, float или half-float), наиболее популярным форматом является формат half-float в openEXR (16 бит на RGB-компоненту, т.е., 48 бит на пиксель) или в целых числах с длинным представлением, как правило, по меньшей мере, 16 бит.
Принятие стандарта Высокоэффективного Кодирования Видеоизображений (HEVC) (ITU-T H.265 Сектор стандартизации по электросвязи ITU (10/2014), серия H: аудиовизуальные и мультимедийные системы, инфраструктура аудиовизуальных услуг - кодирование движущихся видеоизображений, Высокоэффективное кодирование видеоизображений, рекомендация ITU-T H.265) обеспечивает разработку новых видеоуслуг с повышенным качеством просмотра, таких как услуги широковещательной передачи сверхвысокой четкости (Ultra HD). Помимо повышенного пространственного разрешения, Ultra HD может дать более широкую цветовую гамму (WCG) и более расширенный динамический диапазон (HDR), чем телевидение высокой четкости (HD-TV) со Стандартным Динамическим Диапазоном (SDR), развернутое в настоящее время. Предлагались различные решения для представления и кодирования видео с HDR/WCG (SMPTE 2014, «Функция электронно-оптического преобразования эталонных дисплеев с широким динамическим диапазоном, используемых для мастеринга», либо SMPTE ST 2084, 2014, либо Diaz R., Blinstein S. и Qu S. «Объединение сжатия видеоинформации HEVC с конвейером видеоинформации с расширенным динамическим диапазоном», SMPTE Motion Imaging Journal, том 125, выпуск 1, февраль 2016, с. 14-21).
Обратная совместимость SDR с устройствами декодирования и рендеринга является важной особенностью в некоторых системах распределения видеоинформации, таких как системы широковещательной передачи и многоадресной передачи.
Решение на основе процесса одноуровневого кодирования/декодирования может являться обратно совместимым, например, совместимым с SDR и может максимально использовать уже имеющиеся традиционные сети и услуги распределения.
Такое основанное на одном уровне решение распределения и обеспечивает высококачественный HDR-рендеринг на устройствах Потребительской Электроники (CE) с поддержкой HDR, и в то же время обеспечивает высококачественный SDR-рендеринг на CE-устройствах с поддержкой SDR.
Такое основанное на одном уровне решение распределения генерирует кодированный сигнал, например, SDR-сигнал и соответствующие метаданные (объемом несколько байт на видеокадр или сцену), которые могут использоваться для реконструкции другого сигнала, например, HDR-сигнала по декодированному сигналу, например, SDR-сигналу.
Хранящиеся в метаданных значения параметров используются для реконструкции сигнала и могут являться статическими или динамическими. Статические метаданные означают метаданные, которые остаются без изменений для видео (набора изображений) и/или программы.
Статические метаданные действительны для всего видеоконтента (сцены, фильма, клипа...) и могут не зависеть от контента изображений. Они могут определять, например, формат изображений или цветовое пространство, цветовую гамму. Например, принятый SMPTE стандарт ST 2086:2014 «Работа с метаданными цветового объема на дисплеях, поддерживающих режим повышенной яркости и изображения в широкой цветовой гамме» является таким видом статических метаданных для использования в производственной среде. Сообщение с SEI (Информацией для Дополнительной Оптимизации) Объема Цвета Дисплея, используемого для Мастеринга (MDCV) является разновидностью распределения ST 2086 для видеокодеков и H.264/AVC («Передовое кодирование видеосигналов для универсальных аудиовизуальных Услуг», СЕРИЯ H: АУДИОВИЗУАЛЬНЫЕ И МУЛЬТИМЕДИЙНЫЕ СИСТЕМЫ, Рекомендация ITU-T H.264, Сектор стандартизации по электросвязи ITU, январь 2012), и HEVC.
Динамические метаданные являются зависимыми от контента, то есть, метаданные могут изменяться с контентом изображения/видео, например, для каждого изображения или каждой группы изображений. Например, семейства стандартов ST 2094:2016 SMPTE «Динамические Метаданные для Преобразования Объема Цвета» представляют собой динамические метаданные для использования в производственной среде. ST 2094-30 SMPTE может распределяться по кодированным видеопотокам HEVC благодаря сообщению с SEI Информации Повторного Преобразования Цвета (CRI).
В распределительных сетях существует другие решения распределения на основе одного уровня, для которых динамические метаданные адаптации дисплея передаются вместе с традиционным видеосигналом. Указанные решения распределения на основе одного уровня могут создавать 10-битовые данные изображений HDR (например, данные изображений, сигнал которых представлен в виде сигнала HLG10 или PQ10, как задано в Рекомендации ITU-R BT.2100-0 «Рекомендация ITU-R BT.2100-0, Значения параметров изображений для систем телевидения большого динамического диапазона для использования в производстве программ и международном обмене ими») и соответствующие метаданные по входного сигнала (как правило, 12 или 16 бит), кодируют упомянутые 10-битовые данные изображений HDR с помощью, например, схемы кодирования Основного профиля 10 HEVC и реконструируют видеосигнал по декодированному видеосигналу и упомянутым соответствующим метаданным. Динамический диапазон реконструированного сигнала адаптируется в соответствии с соответствующими метаданными, которые могут зависеть от характеристик целевого дисплея.
Передачу динамических метаданных в реальных физических средствах производства и распределения сложно гарантировать, при этом они, вероятно, могут быть потеряны или искажены ввиду соединения, вставки оверлейных уровней, профессионального оборудования, обрезающего битовый поток, обработки потоков аффилированными компаниями и отсутствия в настоящее время стандартизации в части переноса метаданных посредством постпроизводства/профессионального оборудования.
Основанные на одном уровне решения распределения не могут работать без наличия разнородной совокупности динамических метаданных, при этом некоторые из них исключительно важны для обеспечения успеха реконструкции видеосигнала.
Подобные проблемы могут также возникать, когда динамические метаданные не согласуются с изображением, к которому добавляется графика или наложение. Это возникает, например, когда графика (наложения, OSD,...) вставляется (добавляется) в изображение вне цепочки распределения, поскольку метаданные, вычисленные для упомянутого изображения, применяются, как только графика вставляется (добавляется) в изображение. Метаданные при этом считаются не согласующимися с изображением, к которому добавляется графика или наложение, поскольку они могут не быть адаптированными к части упомянутого изображения, которая содержит графику или наложение.
Указанные проблемы можно характеризовать мельканием изображения в фиксированной части графики, когда декодированное изображение отображается в течение долгого времени, или нежелательными эффектами (насыщение, отсечение...) в части изображения, содержащей графику или наложение, обработанные с использованием неподходящих метаданных (например, яркий OSD, обработанный с помощью метаданных, генерированных для темного контента).
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Далее представлено упрощенная сущность настоящих принципов, чтобы обеспечить базовое понимание некоторых аспектов настоящих принципов. Данная сущность не является широким обзором настоящих принципов. Она не предназначена для выявления ключевых или критических элементов настоящих принципов. В нижеследующей сущности лишь представлены некоторые аспекты настоящих принципов в упрощенном виде в качестве вводной части для более подробного описания, которое представлено далее.
Целью настоящих принципов является устранение, по меньшей мере, одного из недостатков предшествующего уровня техники с использованием способа и устройства для реконструкции данных изображений, характеризующих исходные данные изображений, по декодированным данным изображений и параметрам, полученным из битового потока, причем, упомянутые параметры обрабатываются по упомянутым исходным данным изображений. Способ включает в себя:
- проверку того, являются ли упомянутые параметры потерянными, искаженными или несогласованными с декодированными данными изображений, к которым добавляется графика или наложение;
- когда, по меньшей мере, один из упомянутых параметров является потерянным, искаженным или не согласованным с декодированными данными изображений, к которым добавляется графика или наложение,
- выбор режима восстановления в соответствии с информационными данными, указывающими, как обработаны упомянутые параметры; и
- восстановление упомянутого, по меньшей мере, одного потерянного, искаженного или несогласованного параметра путем применения выбранного режима восстановления, причем, упомянутая реконструкция данных изображений при этом учитывает также упомянутые восстановленные параметры.
В соответствии с одним из вариантов осуществления, информационные данные явно сигнализируются элементом синтаксиса в битовом потоке.
В соответствии с одним из вариантов осуществления, информационные данные (ID) неявно сигнализируются.
В соответствии с одним из вариантов осуществления, информационные данные идентифицируют, какая обработка применяется к исходным данным изображений для обработки параметров.
В соответствии с одним из вариантов осуществления, параметр считается потерянным в тех случаях, когда он не извлечен из битового потока.
В соответствии с одним из вариантов осуществления, параметр считается искаженным в тех случаях, когда выполняется, по меньшей мере, одно из следующих условий:
- его значение находится за пределами диапазона значений;
- упомянутый параметр не имеет согласованного значения параметра в соответствии с другими значениями параметра.
В соответствии с одним из вариантов осуществления, режим восстановления состоит в замене всех параметров восстановленными параметрами, даже если только некоторые из параметров не искажены, потеряны или не согласованы с декодированными данными изображений, к которым добавляется графика или наложение.
В соответствии с одним из вариантов осуществления, режим восстановления состоит в замене каждого из потерянных, искаженных или несогласованных параметров восстановленным параметром.
В соответствии с одним из вариантов осуществления, режим восстановления состоит в замене потерянного, искаженного или несогласованного параметра значением из набора ранее сохраненных предварительно определенных значений параметра.
В соответствии с одним из вариантов осуществления, режим восстановления выбирается в соответствии либо, по меньшей мере, с одной характеристикой исходных данных изображений или применяемого для мастеринга дисплея, используемого для градуировки исходных данных изображений или подлежащих реконструкции данных изображений, либо, по меньшей мере, с одной характеристикой реконструированных данных изображений или целевого дисплея.
В соответствии с другими своими аспектами, настоящие принципы также относятся к устройству, содержащему средства для реализации вышеизложенного способа, и постоянному машиночитаемому носителю, программный код которого выдает команды на исполнение этапов вышеизложенного способа при исполнении данной программы на компьютере.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
На чертежах иллюстрируются примеры настоящих принципов. На них изображено следующее:
- на фиг. 1 изображена диаграмма этапов способа реконструкции изображения I3, характеризующего исходное изображение I1, по декодированному изображению
Figure 00000001
в соответствии с одним из примеров настоящих принципов;
- на фиг. 2 изображен сквозной поток действий, обеспечивающий производство контента и его передачу на СЕ-дисплеи с поддержкой HDR и SDR в соответствии с одним из примеров настоящих принципов;
- на фиг. 3 изображен вариант показанного на фиг. 2 сквозного потока действий в соответствии с одним из вариантов осуществления настоящих принципов;
- на фиг. 4 изображен вариант показанного на фиг. 2 сквозного потока действий в соответствии с еще одним вариантом осуществления настоящих принципов;
- на фиг. 5а изображена иллюстрация функции передачи восприятия;
- на фиг. 5b изображен пример кусочно-заданной кривой, используемой для отображения;
- на фиг. 5с изображен пример кривой, используемой для преобразования сигнала обратно в область линейного света;
- на фиг. 6 изображен еще один пример использования способа реконструкции изображения по декодированным данным и параметрам изображения, получаемым из битового потока, в соответствии с одним из примеров настоящих принципов; и
- на фиг. 7 изображен пример архитектуры устройства в соответствии с одним из примеров настоящих принципов.
Подобные или одинаковые элементы упоминаются с одинаковыми ссылочными позициями.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Настоящие принципы подробнее описываются ниже со ссылками на прилагаемые чертежи, на которых изображены примеры настоящих принципов. Однако настоящие принципы могут быть осуществлены во множестве альтернативных форм и не должны трактоваться как ограниченные изложенным в данном документе примерами. В связи с этим, несмотря на то, что настоящие принципы подвержены различным модификациям и альтернативным формам, их конкретные примеры изображены в качестве примеров на чертежах и подробно описываются в данном документе. Однако следует понимать, что не предполагается ограничивать настоящие принципы конкретными описываемыми формами, а напротив, описание охватывает все модификации, эквиваленты и альтернативы, находящиеся в пределах сущности и объема настоящих принципов и определяемые формулой изобретения.
Терминология, используемая в данном документе, приводится только с целью описания конкретных примеров и не предназначена для ограничения настоящих принципов. В контексте данного документа формы единственного числа предполагают также включение форм множественного числа, если контекст явно не указывает на иное. В дальнейшем будет понятно, что термины «включает в себя», «включающий в себя», «содержит» и/или «содержащий» при использовании в данном описании означают присутствие заявляемых признаков, целых чисел, этапов, операций, элементов и/или компонентов, но не исключают присутствия или добавления одного или более других признаков, целых чисел, этапов, операций, элементов, компонентов и/или их групп. Кроме того, когда элемент упоминается как «реагирующий» на другой элемент или «соединенный» с другим элементом, он может являться непосредственно «реагирующим» на другой элемент или «соединенным» с другим элементом, либо могут присутствовать промежуточные элементы. И наоборот, когда элемент упоминается как «непосредственно реагирующий» на другой элемент или «непосредственно соединенный» с другим элементом, промежуточные элементы отсутствуют. В контексте данного документа термин «и/или» содержит все возможные комбинации одного или более из соответствующих перечисленных элементов и может быть сокращен в виде «/».
Будет понятно, что, хотя термины «первый», «второй» и т.д. могут использоваться в контексте данного документа для описания различных элементов, эти элементы не должны ограничиваться указанными терминами. Эти термины используются только для того, чтобы отличить один элемент от другого. Например, первый элемент может называться вторым элементом, а второй элемент аналогичным образом может называться первым элементом в пределах идей настоящих принципов.
Несмотря на то, что некоторые из диаграмм содержат стрелки на путях передачи данных для указания основного направления передачи данных, следует понимать, что передача данных может осуществляться в направлении, противоположном показанному стрелками.
Описываются некоторые примеры применительно к блок-диаграммам и структурным схемам операций, на которых каждый блок представляет элемент схемы, модуль или часть кода, который включает в себя одну или более исполнимых команд для реализации заданной логической функции (функций). Необходимо также отметить, что в других реализациях функция (функции), указанная в блоках, может находиться не в указанном порядке. Например, два блока, изображенные последовательно, в действительности могут исполняться практически параллельно, либо блоки иногда могут исполняться в обратном порядке в зависимости от задействованной функциональности.
Ссылка в данном документе на «в соответствии с одним из примеров» или «в одном из примеров» означает, что конкретный признак, структура или характеристика, описываемая в связи с примером, может быть включена, по меньшей мере, в одну реализацию настоящих принципов. Появление фразы «в соответствии с одним из примеров» или «в одном из примеров» в различных местах в описании не обязательно относится к одному и тому же примеру, равно как и отдельные или альтернативные примеры не обязательно взаимно исключают другие примеры.
Ссылочные позиции, появляющиеся в формуле изобретения, приводятся лишь для наглядности и не оказывают ограничительного влияния на объем формулы изобретения.
Хотя это и не описано в явном виде, настоящие примеры и варианты могут использоваться в любой комбинации или подкомбинации.
В дальнейшем прописные символы, например, (C1,C2,C3) обозначают компоненты первого изображения, а символы нижнего регистра, например, (c1, c2, c3) обозначают компоненты другого изображения, динамический диапазон яркости которого ниже, чем динамический диапазон яркости первого изображения.
Динамический диапазон яркости изображения представляет собой отношение максимума к минимуму значений яркости упомянутого изображения. Как правило, динамический диапазон яркости SDR-изображения составляет 500 (100 кд/м2 к 0,2 кд/м2) и 10000 (1000 кд/м2 к 0,1 кд/м2) для HDR-изображения.
Простые символы в дальнейшем, например, (Y'=
Figure 00000002
,U'=
Figure 00000003
,V'=
Figure 00000004
) обозначают компоненты гамма-компрессии первого изображения, когда указанные простые символы являются прописными символами, а простые символы, например, (y',u',v') обозначают компоненты гамма-компрессии второго изображения, когда указанные простые символы являются прописными символами нижнего регистра.
Настоящие принципы описываются в отношении кодирования/декодирования/реконструкции изображения, но распространяются на кодирование/декодирование/реконструкцию последовательности изображений (видео), поскольку каждое изображение последовательности последовательно кодируется/декодируется/реконструируется, как описывается ниже.
На фиг. 1 изображена диаграмма этапов способа реконструкции изображения I3, характеризующего исходное изображение I1, по декодированному изображению
Figure 00000001
в соответствии с одним из примеров настоящих принципов.
На этапе 10 осуществляется получение набора SP параметров для реконструкции изображения I3. Эти параметры представляют собой либо параметры Р, получаемые из битового потока В, либо восстановленные параметры Pr, когда, по меньшей мере, один параметр Р потерян, искажен или не согласован с декодированным изображением
Figure 00000001
, к которому добавляется графика или наложение.
На этапе 11 модуль М1 получает декодированное изображение
Figure 00000001
, а на этапе 12 модуль М2 реконструирует изображение I3 по декодированному изображению
Figure 00000001
путем использования набора SP параметров.
Осуществляется получение декодированных данных
Figure 00000001
изображения из битового потока (сигнала) В или иного битового потока, при этом, возможно, упомянутые битовые потоки могут храниться в локальной памяти или ином носителе данных.
На подэтапе 101 (этапа 10) модуль М3 получает параметры Р, требуемые для реконструкции изображения I3.
На подэтапе 102 (этапа 10) модуль М4 проверяет, является ли, по меньшей мере, один из параметров Р потерянным, искаженным или несогласованным с декодированным изображением
Figure 00000001
, к которому добавляется графика или наложение.
Когда ни один из параметров Р не является потерянным, искаженным или несогласованным с декодированным изображением
Figure 00000001
, к которому добавляется графика или наложение, набор SP параметров содержит только параметры Р.
Когда, по меньшей мере, один из параметров Р является либо потерянным, либо искаженным, либо несогласованным с декодированным изображением
Figure 00000001
, к которому добавляется графика или наложение, на подэтапе 103 (этапа 10) модуль М5 получает информационные данные ID, указывающие, как обработаны упомянутые параметры, модуль М6 выбирает режим RMi восстановления в соответствии с упомянутыми информационными данными ID, а на подэтапе 105 (этапа 10) модуль М7 восстанавливает упомянутый, по меньшей мере, один потерянный, искаженный или несогласованный параметр путем применения выбранного режима RMi восстановления. Указанный, по меньшей мере, один восстановленный параметр Pr добавляется к набору SP параметров.
На этапе 12 изображение I3 после этого реконструируется с учетом также упомянутого, по меньшей мере, одного восстановленного параметра Pr.
Данный способ является эффективным, поскольку он позволяет получать параметры для основанного на одном уровне решения распределения, когда множество основанных на одном уровне решений распределения совместно используют один и тот же набор элементов синтаксиса для передачи общего набора параметров и когда упомянутым основанным на одном уровне решениям распределения требуются различные режимы (процесс) восстановления для восстановления потерянных, искаженных или несогласованных параметров, обеспечивая тем самым успех реконструкции изображения I3 для каждого из упомянутых основанных на одном уровне решений распределения.
Данный способ также является эффективным, когда СЕ-устройство, как правило, телевизионная приставка или воспроизводящее устройство вставляет графику поверх декодированного изображения
Figure 00000001
, поскольку данный способ выбирает конкретный режим восстановления для замены несогласованных параметров параметрами, адаптированными к декодированному изображению I2, плюс графику (или наложение) и восстанавливает изображение I3 путем использования упомянутых восстановленных параметров по упомянутому декодированному изображению
Figure 00000001
, к которому добавляется графика или наложение, тем самым исключая некоторые артефакты мелькания или нежелательные эффекты, влияющие на качество реконструированного изображения.
Данный способ, как описывается со ссылкой на фиг. 1, может использоваться в различных сферах применения, когда изображение должно реконструироваться по декодированному изображению.
На фиг. 2 изображен сквозной поток действий, обеспечивающий производство контента и его передачу на СЕ-дисплеи с поддержкой HDR и SDR в соответствии с одним из примеров настоящих принципов.
Данный поток действий предполагает основанное на одном уровне решение распределения с соответствующими метаданными и иллюстрирует пример использования способа для реконструкции изображения I3, характеризующего исходные данные I1 изображений, по декодированным данным
Figure 00000001
изображений и набор параметров SP, получаемых в соответствии с примером настоящих принципов, иллюстрируемом на фиг. 1.
В основном, указанное основанное на одном уровне решение распределения включает в себя часть предобработки и часть постобработки.
В части предобработки стадия 20 предобработки разлагает исходное изображение I1 на выходное изображение I12 и набор SP параметров, а этап 24 переключения определяет, является ли либо исходное изображение I1, либо выходное изображение I12 кодированным в битовом потоке B (этап 23).
На этапе 23 изображение I2 может кодироваться с использованием любого традиционного видеокодека, а битовый поток В передается по всей существующей традиционной сети распределения с сопутствующими соответствующими метаданными (набором параметров SP), передаваемыми по конкретному каналу или встроенными в битовый поток В.
В одном из вариантов битовый поток В с сопутствующими метаданными хранится на носителе данных, таком как, например, диск Blu-ray, либо память, либо регистр телевизионной приставки.
В одном из вариантов сопутствующие соответствующие метаданные передаются с помощью другого конкретного канала или хранятся в отдельном носителе данных.
Предпочтительно видео кодируется с использованием кодека H.265/HEVC (ITU-T H.265 Сектор стандартизации по электросвязи ITU (10/2014), серия H: аудиовизуальные и мультимедийные системы, инфраструктура аудиовизуальных услуг - кодирование движущихся видеоизображений, Высокоэффективное кодирование видеоизображений, Рекомендация ITU-T H.265) или H.264/AVC («Передовое кодирование видеосигналов для универсальных аудиовизуальных Услуг», СЕРИЯ H: АУДИОВИЗУАЛЬНЫЕ И МУЛЬТИМЕДИЙНЫЕ СИСТЕМЫ, Рекомендация ITU-T H.264, Сектор стандартизации по электросвязи ITU, январь 2012).
В том случае, когда информационные данные ID определяют, что исходное изображение I1 (возможно, представленное компонентами (C1,U', V') либо видеосигналом Y'CbCr 4:2:0 PQ10 или HLG10) кодируется на этапе 23, помянутое исходное изображение I1 может кодироваться с использованием Основного профиля 10 HEVC.
В том случае, когда информационные данные ID определяют, что выходное изображение I12 кодируется на этапе 23, выходное изображение I12, которое может быть представлено в виде сигнала с гаммой передающей трубки (Стандартным Динамическим Диапазоном) Y'CbCr 4:2:0, может кодироваться с использованием любого профиля HEVC, включая Основной профиль 10 или Основной профиль.
Информационные данные ID могут также передаваться в виде соответствующих метаданных (этап 23). В части постобработки осуществляется получение декодированного изображения
Figure 00000001
из битового потока В (этап 11), осуществляется получение набора SP параметров, как объясняется на фиг. 1 (этап 10), а стадия 12 постобработки, которая является функциональной противоположностью стадии 20 предобработки, реконструирует изображение I3 по декодированному изображению
Figure 00000001
и набору SP параметров.
Указанное основанное на одном уровне решение распределения может также включать в себя необязательные этапы 21, 22, 25, 26 адаптации формата.
Например, на этапе 21 (необязательном) формат исходного изображения I1 может адаптироваться к конкретному формату (C1,U',V') выхода стадии 20 предобработки, а на этапе 22 (необязательном) формат (c, u', v') выходного изображения I12 может также адаптироваться к конкретному выходному формату перед кодированием. На этапе 25 формат декодированного изображения
Figure 00000001
может адаптироваться к конкретному формату входа стадии 12 постобработки, а на этапе 26 изображение I3 может адаптироваться, по меньшей мере, к одной характеристике целевого устройства (например, телевизионной приставки, подключенного телевизора, СЕ-устройства с поддержкой HDR/SDR, проигрывателя дисков Blu-ray), и/или обратное отображение цветовой гаммы может использоваться, когда декодированное изображение
Figure 00000001
и изображение I3 либо исходное изображение I1 представлены в различных цветовых пространствах и/или цветовых гаммах.
Упомянутые этапы адаптации формата (21, 22, 25, 26) могут включать в себя преобразование цветового пространства и/или отображение цветовой гаммы. Могут использоваться обычные процессы адаптации формата, такие как преобразование RGB в YUV или YUV в RGB, BT.709 в BT.2020 или BT.2020 в BT.709, компоненты понижающей дискретизации или повышающей дискретизации сигнала цветности и т.д. Необходимо отметить, что хорошо известное цветовое пространство YUV означает также хорошо известное YCbCr в предшествующем уровне техники. В Приложении Е к рекомендации ETSI - ETSI TS 103 433 V1.1.1, выпуск 2016-8 - приведен пример процессов адаптации формата и обратного отображения цветовой гаммы (Приложение D).
Упомянутый этап 21 адаптации входного формата может также включать в себя адаптацию глубины в битах исходного изображения I1 к конкретной глубине в битах, например, 10 бит путем применения функции преобразования к исходному изображению I1. Например, может использоваться функция преобразования PQ или HLG (Rec. ITU-R BT.2100-0).
Более детально, стадия 20 предобработки включает в себя этапы 200-202.
На этапе 200 осуществляется получение первой компоненты с1 выходного изображения I12 путем отображения первой компоненты C1 исходного изображения I1:
Figure 00000005
,
где
Figure 00000006
- функция отображения. Функция TM отображения может уменьшать или увеличивать динамический диапазон яркости исходного изображения I1, а ее обратная функция может уменьшать или увеличивать динамический диапазон яркости изображения.
На этапе 201 осуществляется получение второй и третьей компонент u', v' выходного изображения I12 путем коррекции второй и третьей компонент U', V' исходного изображения I1 в соответствии с первой компонентой
Figure 00000007
.
Коррекция компонент цветности может контролироваться путем настройки параметров отображения. Тем самым контролируются цветовая насыщенность и оттенок.
В соответствии с одним из вариантов осуществления этапа 201, получение второй и третьей компонент U' и V' осуществляется с помощью масштабирующей функции
Figure 00000008
, значение которой зависит от первой компоненты
Figure 00000007
.
С математической точки зрения, вторая и третья компоненты u', v' имеют вид:
Figure 00000009
При необходимости на этапе 202 первая компонента
Figure 00000010
может регулироваться для дополнительного контроля воспринимаемой насыщенности следующим образом:
Figure 00000011
,
где a и b - два параметра из набора SP параметров.
Этап 202 позволяет контролировать яркость выходного изображения I12 для обеспечения согласования воспринимаемых цветов между цветами выходного изображения I12 и цветами исходного изображения I1.
Набор SP параметров может содержать параметры, относящиеся к функции ТМ или ее обратной функции ITM - масштабирующей функции
Figure 00000012
. Эти параметры связаны с динамическими метаданными и передаются в битовом потоке, например, битовом потоке В. Параметры a и b могут также передаваться в битовом потоке.
Более детально, в части постобработки - на этапе 10 - осуществляется получение набора SP параметров, как объясняется на фиг. 1.
В соответствии с одним из вариантов осуществления этапа 10, набор SP параметров передается с помощью статических/динамических метаданных, получаемых из конкретного канала или из битового потока, включая битовый поток В, и, возможно, хранящихся на носителе данных.
На этапе 11 модуль М1 получает декодированное изображение
Figure 00000001
путем декодирования битового потока В, и декодированное изображение
Figure 00000001
после этого доступно для СЕ-дисплея с поддержкой либо SDR, либо HDR.
Более детально, стадия 12 постобработки включает в себя этапы 120-122.
На необязательном этапе 120 первая компонента
Figure 00000013
декодированного изображения
Figure 00000001
может корректироваться следующим образом:
Figure 00000014
c
Figure 00000015
,
где a и b - два параметра из набора SP параметров.
На этапе 121 осуществляется получение первой компоненты C1 изображения I3 путем обратного отображения первой компоненты
Figure 00000007
:
Figure 00000016
На этапе 122 осуществляется получение второй и третьей компонент U', V' изображения I3 путем обратной коррекции второй и третьей компонент u', v' декодированного изображения
Figure 00000001
в соответствии с компонентой
Figure 00000007
.
В соответствии с одним из вариантов осуществления, вторая и третья компоненты u' и v' умножаются на масштабирующую функцию
Figure 00000008
, значение которой зависит от первой компоненты
Figure 00000007
.
С математической точки зрения, две компоненты - первая и вторая компоненты U', V' - имеют вид:
Figure 00000017
В соответствии с первым вариантом осуществления изображенного на фиг. 2 способа, как показано на фиг. 3, в части предобработки первая компонента C1 исходного изображения I1 является компонентой L яркости линейного света, получаемой по RGB-компоненте исходного изображения I1 следующим образом:
Figure 00000018
,
а вторая и третья компоненты U', V' получаются применением псевдо-гаммирования с использованием квадратного корня (подобно BT.709 OETF) к RGB-компонентам исходного изображения I1:
Figure 00000019
На этапе 200 осуществляется получение первой компоненты
Figure 00000020
выходного изображения I12 путем отображения упомянутой компоненты L яркости линейного света:
Figure 00000021
На этапе 201 осуществляется получение второй и третьей компонент u', v' выходного изображения I12 путем коррекции первой и второй компонент U', V' в соответствии с первой компонентой
Figure 00000020
.
В части постобработки на этапе 201 осуществляется получение компоненты L яркости линейного света изображения I3 путем обратного отображения первой компоненты
Figure 00000007
:
Figure 00000022
На этапе 122 осуществляется получение второй и третьей компонент U', V' изображения I3 путем обратной коррекции второй и третьей компонент u', v' выходного изображения I12 в соответствии с первой компонентой
Figure 00000020
.
В соответствии с одним из вариантов осуществления этапа 122, вторая и третья компоненты u' и v' умножается на масштабирующую функцию
Figure 00000023
, значение которой зависит от первой компоненты
Figure 00000020
.
С математической точки зрения, две компоненты - первая и вторая компоненты U', V' - имеют вид:
Figure 00000024
В соответствии со вторым вариантом осуществления изображенного на фиг. 2 способа, как показано на фиг. 4, в части предобработки первая компонента C1 исходного изображения I1 является компонентой Y', получаемой по прошедшим гамма-компрессию RGB-компонентам исходного изображения I1 следующим образом:
Figure 00000025
и второй и третьей компонентам U', V' путем применения гаммирования к RGB-компонентам исходного изображения I1:
Figure 00000026
,
где
Figure 00000027
может являться коэффициентом гамма, предпочтительно равным 2,4.
Необходимо отметить, что компонента Y', которая является нелинейным сигналом, отличается от компоненты L яркости линейного света.
На этапе 200 осуществляется получение первой компоненты
Figure 00000028
выходного изображения I12 путем отображения упомянутой компоненты Y':
Figure 00000029
На этапе 121 осуществляется получение реконструированной компоненты
Figure 00000030
путем обратного отображения первой компоненты
Figure 00000031
:
Figure 00000032
,
где ITM - обратная функция функции ТМ отображения.
Значения реконструированной компоненты
Figure 00000030
принадлежат при этом динамическому диапазону значений компоненты Y'.
На этапе 201 осуществляется получение второй и третьей компонент u', v' выходного изображения I12 путем коррекции первой и второй компонент U', V' в соответствии с первой компонентой
Figure 00000031
и реконструированной компонентой
Figure 00000030
.
Данный этап 201 позволяет контролировать цвета выходного изображения I12 и обеспечивает их согласование с цветами исходного изображения I1.
Коррекция компонент сигнала цветности может контролироваться путем настройки параметров отображения (обратного отображения). Тем самым контролируются цветовая насыщенность и оттенок. Обычно такой контроль невозможен в тех случаях, когда используется непараметрическая функция передачи восприятия.
В соответствии с одним из вариантов осуществления этапа 201, получение второй и третьей компонент U' и V' осуществляется с помощью масштабирующей функции
Figure 00000033
, значение которой зависит от отношения реконструированной компоненты
Figure 00000030
к компоненте
Figure 00000031
:
Figure 00000034
где
Figure 00000035
- постоянная величина, зависящая от основных цветов исходного изображения I1 (например, равна 1,3 для BT.2020).
В части постобработки на этапе 121 осуществляется получение компоненты
Figure 00000036
изображения I3 путем обратного отображения первой компоненты
Figure 00000028
:
Figure 00000037
На этапе 122 осуществляется получение второй и третьей компонент U', V' изображения I3 путем обратной коррекции второй и третьей компонент u', v' декодированного изображения
Figure 00000001
в соответствии с первой компонентой
Figure 00000028
и компонентой
Figure 00000036
.
В соответствии с одним из вариантов осуществления этапа 122, вторая и третья компоненты u' и v' умножаются на масштабирующую функцию
Figure 00000038
.
С математической точки зрения, две компоненты - первая и вторая компоненты U', V' - имеют вид:
Figure 00000039
Функция ТМ отображения основана на функции передачи восприятия, цель которой состоит в преобразовании компоненты исходного изображения I1 в компоненту выходного изображения I12, тем самым уменьшая (или увеличивая) динамический диапазон значений их яркости. Значения компоненты выходного изображения I12 принадлежат при этом меньшему (или большему) динамическому диапазону, чем значения компоненты исходного изображения I1.
Упомянутая функция передачи восприятия использует ограниченный набор управляющих параметров.
На фиг. 5а изображена иллюстрация функции передачи восприятия, которая может использоваться для отображения компонент яркости, но может использоваться и аналогичная функции передачи восприятия для отображения компонент сигнала яркости.
Отображение контролируется параметром пиковой яркости используемого для мастеринга дисплея (равным 5000 кд/м2 на фиг. 5а). Для лучшего контроля уровней черного и белого между зависящими от контента уровнями черного и белого используется вытягивание сигнала. Затем преобразованный сигнал отображается с использованием кусочно-заданной кривой, построенной из трех частей, как показано на фиг. 5b. Нижний и верхний участки являются линейными, при этом крутизна определяется параметрами shadowGain и highlightGain соответственно. Средний участок представляет собой параболу, обеспечивающую плавный переход между двумя линейными участками. Ширина области перехода определяется параметром midToneWidthAdjFactor.
Все параметры, контролирующие отображение, могут передаваться в виде метаданных, например, путем использования сообщения с SEI, как задано в JCTVC-W0133 для передачи метаданных SMPTE ST 2094-20.
На фиг. 5с изображен пример функции, обратной функции передачи восприятия (фиг. 5а), для иллюстрации того, как оптимизированный видеосигнал восприятия может быть преобразован обратно в область линейного света на основе целевой традиционной максимальной яркости дисплея, например, 100 кд/м2.
На этапе 10 (фиг. 1) осуществляется получение набора SP параметров для реконструкции изображения I3 по декодированному изображению
Figure 00000001
.
Эти параметры могут быть получены по метаданным, полученным из битового потока, например, битового потока В.
В рекомендации ETSI TS 103 433 V1.1.1, статья 6, 2016-08 приведен пример синтаксиса упомянутых метаданных.
Синтаксис из рекомендации ETSI TS 103 433 v1.1.1 описывается для реконструкции HDR-видео по SDR-видео, но данный синтаксис может распространяться на реконструкцию изображения I3 по любому декодированному изображению
Figure 00000001
.
Постобработка (этап 12) работает на функции ITM обратного преобразования и масштабирующей функции
Figure 00000040
, получение которых осуществляется по динамическим метаданным, поскольку они зависят от первой компоненты c1.
В соответствии с рекомендацией ETSI TS 103 433 V1.1.1, упомянутые динамические метаданные могут передаваться в соответствии либо с так называемым основанным на параметрах режимом, либо с основанным на таблицах режимом.
Основанный на параметрах режим может представлять интерес для потоков действий распределения, основная цель которых состоит в обеспечении прямых обратно совместимых услуг SDR с весьма низкой дополнительной полезной нагрузкой или коэффициентом использования полосы частот для передачи динамических метаданных. Основанный на таблицах режим может представлять интерес для потоков действий, оснащенных терминалами низкого уровня, или в тех случаях, когда для надлежащего представления как HDR-, так и SDR-потоков требуется более высокий уровень адаптации.
В основанном на параметрах режиме передаваемые динамические метаданные представляют собой параметры отображения яркости, характеризующие обратную функцию ITM, т.е., следующие параметры:
tmInputSignalBlackLevelOffset;
tmInputSignalWhiteLevelOffset;
shadowGain;
highlightGain;
midToneWidthAdjFactor;
tmOutputFineTuning.
Кроме того, прочие передаваемые динамические метаданные представляют собой параметры цветовой коррекции (saturationGainNumVal, saturationGainX(i) и saturationGainY(i)), используемые для задания функции
Figure 00000040
(рекомендация ETSI - ETSI TS 103 433 V1.1.1, статьи 6.3.5 и 6.3.6).
Необходимо отметить, что параметры a и b могут, соответственно, быть переданы/скрыты в параметрах функции saturationGain, как объяснялось выше.
Указанные динамические метаданные могут передаваться с использованием пользовательских данных Информации о Реконструкции Объема Цвета (CVRI) HEVC, регистрируемых в сообщении с SEI, синтаксис которого основан на спецификации SMPTE ST 2094-20 (рекомендация ETSI TS 103 433 V1.1.1, Приложение A.3).
Типичная полезная нагрузка динамических метаданных составляет около 25 байт на сцену.
На этапе 101 сообщение с SEI CVRI представляет собой прошедшее синтаксический анализ сообщение с SEI для получения параметров отображения и параметров цветовой коррекции.
На этапе 12 осуществляется реконструкция (получение) функции ITM обратного отображения (так называемой lutMapY) по полученным параметрам отображения (для получения дополнительной информации см. рекомендацию ETSI TS 103 433 V1.1.1, статья 7.2.3.1).
На этапе 12 осуществляется также реконструкция (получение) масштабирующей функции
Figure 00000041
(так называемой lutCC) по полученным параметрам цветовой коррекции (для получения дополнительной информации см. рекомендацию ETSI TS 103 433 V1.1.1, статья 7.2.3.2).
В основанном на таблицах режиме передаваемые динамические данные являются точками поворота кусочно-заданной линейной кривой, характеризующей функцию ITM обратного отображения. Например, динамические метаданные представляют собой luminanceMappingNumVal , указывающее на число точек поворота, luminanceMappingX, указывающее на значения х точек поворота, и luminanceMappingY, указывающее на значения y точек поворота (для получения дополнительной информации см. рекомендацию ETSI TS 103 433 V1.1.1, статьи 6.2.7 и 6.3.7).
Кроме того, прочие передаваемые динамические метаданные могут являться точками поворота кусочно-заданной линейной кривой, характеризующей масштабирующую функцию
Figure 00000042
. Например, динамические метаданные представляют собой colorCorrectionNumVal, указывающее на число точек поворота, colorCorrectionX, указывающее на значения х точек поворота, и colorCorrectionY, указывающее на значения y точек поворота (для получения дополнительной информации см. рекомендацию ETSI TS 103 433 V1.1.1, статьи 6.2.8 и 6.3.8).
Указанные динамические метаданные могут передаваться с использованием сообщения с SEI Информации о Реконструкции Объема Цвета (CVRI) HEVC, синтаксис которого основан на спецификации SMPTE ST 2094-30 (рекомендация ETSI TS 103 433 V1.1.1, Приложение A.4).
Типичная полезная нагрузка составляет около 160 байт на сцену.
На этапе 102 осуществляется синтаксический анализ сообщения с SEI Информации Повторного Преобразования Цвета (CRI) (как задано в версии HEVC/H.265, опубликованной в декабре 2016 г.) для получения точек поворота кусочно-заданной линейной кривой, характеризующей функцию ITM обратного отображения, и точек поворота кусочно-заданной линейной кривой, характеризующей масштабирующую функцию
Figure 00000042
, а также параметров a и b введения сигнала цветности в сигнал яркости.
На этапе 12 осуществляется получение функции ITM обратного отображения по указанным точкам поворота, относящимся к кусочно-заданной линейной кривой, характеризующей функцию ITM обратного отображения (для получения дополнительной информации см. рекомендацию ETSI TS 103 433 V1.1.1, статья 7.2.3.3).
На этапе 12 осуществляется также получение масштабирующей функции
Figure 00000042
по указанным точкам поворота, относящимся к кусочно-заданной линейной кривой, характеризующей масштабирующую функцию
Figure 00000042
(для получения дополнительной информации см. рекомендацию ETSI TS 103 433 V1.1.1, статья 7.2.3.4).
Необходимо отметить, что статические метаданные, также используемые стадией постобработки, могут передаваться с помощью сообщения с SEI. Например, выбор либо основанного на параметрах режима, либо основанного на таблицах режима может осуществляться с помощью пользовательских данных Информации (TSI), зарегистрировавших сообщение с SEI (payloadMode), как задано в рекомендации ETSI TS 103 433 V1.1.1 (статья A.2.2). Статические метаданные, например, основные цвета или максимальная яркость дисплея, используемого для мастеринга, передаются с помощью сообщения с SEI Объема Цвета Дисплея, используемого для Мастеринга (MDCV), как задано в AVC, HEVC.
В соответствии с одним из вариантов осуществления этапа 103, информационные данные ID явно сигнализируются с помощью элемента синтаксиса в битовом потоке и, следовательно, получаются с помощью синтаксического анализа битового потока.
Например, упомянутый элемент синтаксиса является частью сообщения с SEI.
В соответствии с одним из вариантов осуществления, упомянутые информационные данные ID идентифицируют, какая обработка применяется к исходному изображению I1 для обработки набора SP параметров.
В соответствии с этим вариантом осуществления, информационные данные ID могут после этого использоваться, чтобы установить, как использовать параметры для реконструкции изображения I3 (этап 12).
Например, в тех случаях, когда они равны 1, информационные данные ID указывают, что параметры SP получены путем применения стадии предобработки (этапа 20) к исходному HDR-изображению I1, и что декодированное изображение
Figure 00000001
представляет собой SDR-изображение.
В тех случаях, когда они равны 2, информационные данные ID указывают, что параметры получены путем применения стадии предобработки (этапа 20) к изображению HDR10bits (вход этапа 20), что декодированное изображение
Figure 00000001
представляет собой изображение HDR10, и что функция ТМ отображения представляет собой функцию PQ преобразования.
В тех случаях, когда они равны 3, информационные данные ID указывают, что параметры получены путем применения стадии предобработки (этапа 20) к изображению HDR10 (вход этапа 20), что декодированное изображение
Figure 00000001
представляет собой изображение HLG10, а функция ТМ отображения представляет собой функцию передачи HLG в исходное изображение I1.
В соответствии с одним из вариантов осуществления этапа 103, информационные данные ID сигнализируются неявно.
Например, элемент синтаксиса «характеристики передачи», присутствующий в VUI из HEVC (приложение E) или AVC (приложение E) обычно идентифицирует используемую функцию передачи (функцию ТМ отображения). Поскольку различные одноуровневые решения распределения используют различные функции передачи PQ, HLG,…), элемент синтаксиса «характеристики передачи» может использоваться для неявной идентификации используемого режима восстановления.
Информационные данные ID могут также неявно сигнализироваться с помощью услуги, заданной на более высоком транспортном или системном уровне.
В соответствии с еще одним примером, пиковое значение яркости и цветовое пространство изображения I3 могут быть получены путем синтаксического анализа сообщения с SEI MDCV, передаваемого с помощью битового потока, а информационные данные ID могут быть установлены по конкретным комбинациям пиковых значений яркости и цветовым пространствам (основным цветам).
В соответствии с одним из вариантов осуществления этапа 102, параметр Р считается потерянным, когда он отсутствует в битовом потоке (не извлекается из него).
Например, когда параметры Р передаются с помощью сообщения с SEI, такого как сообщения с SEI CVRI или CRI, как описано выше, параметр Р считается потерянным (отсутствующим), когда сообщение с SEI не передается в битовом потоке, либо, когда синтаксический анализ сообщения с SEI завершается неуспехом.
В соответствии с одним из вариантов осуществления этапа 103, параметр Р считается искаженным, когда выполняется, по меньшей мере, одно из следующих условий:
- его значение находится за пределами определенного диапазона значений (например, saturation_gain_num_val равно 10, когда соответствующий диапазон составляет от 0 до 6);
- упомянутый параметр не имеет согласованного значения в соответствии с другими значениями параметра (например, saturation_gain_y[i] содержит выброс, т.е., значение, которое далеко от других значений saturation_gain_y[i]; как правило значения с saturation_gain[0] по saturation_gain[4] равны значению в диапазоне от 0 до 16, а saturation_gain[1]=255).
В соответствии с одним из вариантов осуществления способа, режим RMi восстановления состоит в замене всех параметров Р восстановленными параметрами Pr, даже если лишь некоторые из параметров Р не искажены, потеряны или не согласованы с декодированным изображением
Figure 00000001
, к которому добавляется графика или наложение.
В соответствии с одним из вариантов осуществления способа, еще один режим RMi восстановления состоит в замене каждого потерянного, искаженного или несогласованного параметра Р восстановленным параметром Pr.
В соответствии с одним из вариантов осуществления способа, режим RMi восстановления состоит в замене потерянного, искаженного или несогласованного параметра Р некоторым значением из набора ранее сохраненных предопределенных значений параметра.
Например, набор предопределенных значений параметра может включать в себя предопределенное значение, по меньшей мере, для одних метаданных, передаваемых с помощью сообщения с SEI CRI и/или CVRI.
Конкретный набор предопределенных значений параметра может определяться, например, для каждого основанного на одном уровне решения распределения, идентифицируемого информационными данными ID.
Таблица 1 представляет собой неограничительный набор предопределенных значений для 3 различных основанных на одном уровне решений распределения.
Информационные данные ID Параметры ETSI TS 103 433
0 Усиление теней: 1,16
Усиление ярких участков: 2,0
Коррекция средних тонов: 1,5
Растяжение белого: 0
Растяжение черного: 0
Усиление в режиме насыщения []:{(0,64); (24,64); (62,59); (140,61); (252,64); (255,64)}
1 Усиление теней: 1,033
Усиление ярких участков: 2,0
Коррекция средних тонов: 1,5
Растяжение белого: 0
Растяжение черного: 0
2 Усиление теней: 1,115
Усиление ярких участков: 2,0
Коррекция средних тонов: 1,5
Растяжение белого: 0
Таблица 1
В соответствии с Таблицей 1, в соответствии с информационными данными ID задаются три различных набора предопределенных значений параметра. Эти наборы предопределенных значений параметра задают восстановленные значения для некоторых параметров, используемых стадией постобработки. Остальные параметры устанавливаются равными фиксированным значениям, которые являются общими для различных одноуровневых решений.
В соответствии с одним из вариантов осуществления этапа 104, режим RMi восстановления выбирается в соответствии либо, по меньшей мере, с одной характеристикой исходного видео (изображения I1), как правило, пиковой яркостью исходного контента или используемого для мастеринга дисплея, используемого для градуировки входных данных изображений или восстанавливаемых данных изображений, либо, по меньшей мере, с одной характеристикой другого видео, как правило, пиковой яркостью реконструированного изображения I3 или целевого дисплея.
В соответствии с одним из вариантов осуществления, режим RMi восстановления состоит в проверке того, присутствует ли характеристика исходного видео (I1) или используемого для мастеринга дисплея, используемого для градуировки входных данных изображений или восстанавливаемых данных изображений (например, характеристика, заданная в ST 2086), и в вычислении, по меньшей мере, одного восстановленного параметра по упомянутой характеристике. Если упомянутая характеристика входного видео отсутствует, и характеристика используемого для мастеринга дисплея отсутствует, проверяют, присутствует ли характеристика реконструированного изображения I3 или целевого дисплея (например, пиковая яркость, заданная в CTA-861.3), и вычисляют, по меньшей мере, один восстановленный параметр по упомянутой характеристике. Если упомянутая характеристика реконструированного изображения I3 отсутствует, и упомянутая характеристика целевого дисплея отсутствует, по меньшей мере, один восстановленный параметр является фиксированным значением (например, фиксированным комитетом по стандартизации видеоинформации или отраслевым сообществом, например, 1000 кд/м2).
В соответствии с неограничительным примером, в Таблице 2 приведены примеры значений восстановления для некоторых параметров, используемых стадией постобработки, который зависит от наличия доступной информации по входному/выходному контенту и используемым для мастеринга/целевым дисплеям.
Элемент синтаксиса Значение восстановления
matrix_coefficient_value[ i ] {889; 470; 366; 994}, если BT.2020
{915; 464; 392; 987}, если BT.709
shadow_gain_control если сообщение с SEI MDCV отсутствует, режим 1 восстановления, в остальных случаях режим 2 восстановления
Таблица 2
Параметры matrix_coefficient_value[ i ] могут устанавливаться в соответствии с цветовым пространством входного/выходного видео - BT.709 или BT.2020 (характеристикой входного или выходного видео) - получаемой путем синтаксического анализа сообщения с SEI MDCV/ST 2086 при его наличии. Режим восстановления зависит от упомянутых цветовых пространств.
Параметр shadow_gain_control может вычисляться в соответствии со значением, получаемым путем синтаксического анализа сообщения с SEI MDCV/ST 2086 при его наличии.
Например, осуществляется получение информации, характеризующей пиковую яркость используемого для мастеринга дисплея, по упомянутому сообщению с SEI MDCV/ST 2086, при этом параметр shadow_gain_control вычисляется (режим 1 восстановления) следующим образом:
shadow_gain_control =Clip(0; 255; Floor( rs( hdrDisplayMaxLuminance ) x 127,5 +0,5)),
при этом
Figure 00000043
и
Figure 00000044
По-видимому, в информации на уровне услуг или для конкретного потока действий значение hdrDisplayMaxLuminance известно. Это значение может также устанавливаться равным пиковой яркости целевого (демонстрационного) дисплея, когда эта характеристика доступна. В иных случаях (режим 2 восстановления) она произвольно устанавливается равной заданному по умолчанию значению, как правило, 1000 кд/м2. Это заданное по умолчанию значение соответствует наблюдаемой в настоящее время опорной максимальной яркости мастеринга дисплея на большей части текущих HDR-рынков.
На фиг. 6 изображен еще один пример использования способа реконструкции изображения I3 по декодированным данным
Figure 00000001
изображений и набору SP параметров, получаемым из битового потока В, в соответствии с одним из примеров настоящих принципов.
Упомянутый пример предназначен для реализации, по меньшей мере, частично в любом (промежуточном) устройстве, реализующем механизм вставки и микширования наложения (например, в телевизионной приставке или UltraHD-проигрывателе дисков Blu-ray) и сигнализирующем/отправляющем в решающий модуль событие (как правило, overlay_present_flag, установленный равным 1), состоящее в том, что к декодированному изображению
Figure 00000001
должно быть добавлено наложение.
В тех случаях, когда наложение (графика) не должно добавляться к декодированному изображению
Figure 00000001
, осуществляется получение набора SP параметров (этап 10), осуществляется получение декодированного изображения
Figure 00000001
(этап 11), и реконструируется изображение I3 (этап 12), как описано на фиг. 1.
В тех случаях, когда к декодированному изображению
Figure 00000001
должно добавляться наложение, осуществляется получение декодированного изображения
Figure 00000001
(этап 11), а на этапе 60 осуществляется получение составного изображения I'2 путем добавления графики (наложения) к декодированному изображению
Figure 00000001
.
Затем осуществляется получение информационных данных ID (этап 103), выбирается режим восстановления (этап 104), и выбранный режим RMi восстановления применяется (этап 105) для получения реконструированных параметров Pr.
После этого изображение I3 реконструируется (этап 12) по восстановленным параметрам Pr и декодированному изображению
Figure 00000001
.
В соответствии с одним из вариантов осуществления, получение параметров Pr осуществляется путем обучения на большом наборе изображений различного вида (ярких, темных, с логотипами...).
При необходимости (не показано на фиг. 6) этап 12 может быть реализован в удаленном устройстве, таком как телевизор. В этом случае на упомянутый телевизор передаются либо декодированное изображение
Figure 00000001
плюс параметры Р, либо составное изображение I'2 плюс параметры Pr.
На фиг. 1-6 модули являются функциональными блоками, которые могут иметь или не иметь отношение к различным физическим блокам. Например, эти модули или некоторые из них могут быть объединены в едином компоненте или схеме, либо вносить вклад в функциональности программных средств. В противоположность этому, некоторые модули могут потенциально состоять из отдельных физических объектов. Устройства, которые соответствуют настоящим принципам, реализуются либо с помощью исключительно аппаратных средств, например, с помощью специализированных аппаратных средств, таких как ASIC, либо FPGA, либо VLSI - соответственно, «Специализированной интегральной схемы», «Программируемой пользователем вентильной матрицы», «Сверхбольшой интегральной схемы», либо из нескольких интегральных электронных компонентов, встроенных в устройство, либо из комбинации аппаратных и программных компонентов.
На фиг. 7 представлен пример архитектуры устройства 70, которое может быть конфигурировано для реализации способа, описываемого применительно к фиг. 1-6.
Устройство 70 содержит следующие элементы, которые связаны друг с другом шиной 71 данных и адреса:
- микропроцессор 72 (или CPU), который представляет собой, например, DSP (или Цифровой Сигнальный Процессор);
- ROM (или Постоянное Запоминающее Устройство) 73;
- RAM (или Оперативное Запоминающее Устройство) 74;
- интерфейс 75 ввода-вывода для приема передаваемых данных от приложения; и
- батарею 76.
В соответствии с одним из примеров, батарея 76 является внешней по отношению к устройству. В каждой упоминаемой памяти слово «регистр», используемое в описании, может соответствовать области небольшой емкости (несколько бит) или очень большой области (например, программе в целом или большому объему принятых или декодированных данных). ROM 73 содержит, по меньшей мере, программу и параметры. ROM 73 может хранить алгоритмы и команды для осуществления методов в соответствии с настоящими принципами. При включении CPU 72 загружает программу в RAM и исполняет соответствующие команды.
RAM 64 содержит в регистре программу, исполняемую CPU 72 и загружаемую после включения устройства 70, входные данные в регистре, промежуточные данные в различных состояниях способа в регистре и прочие переменные, используемые для исполнения способа в регистре.
Реализации, описываемые в данном документе, могут быть выполнены, например, в способе или процессе, устройстве, программном продукте, потоке данных или сигнале. Даже если это рассматривалось применительно к одной форме реализации (например, рассматривалось только в качестве способа или устройства), реализация рассматриваемых признаков может также быть выполнена в других формах (например, в программе). Устройство может быть выполнено в виде, например, соответствующих аппаратных средств, программных средств и микропрограммных средств. Способы могут быть выполнены в виде, например, устройства, например, процессора, который относится к устройствам обработки в общем смысле, включая, например, компьютер, микропроцессор, интегральную схему или программируемое логическое устройство. Процессоры также включают в себя устройства связи, например, компьютеры, сотовые телефоны, портативные/персональные цифровые помощники («PDA») и прочие устройства, которые обеспечивают передачу информации между конечными пользователями.
В соответствии с одним из примеров, получение входного видео или исходного изображения входного видео осуществляется из источника. Например, источник принадлежит группе, включающей в себя:
- локальную память (73 или 74), например, память видеоданных или RAM (или Оперативное Запоминающее Устройство), флэш-память, ROM (или Постоянное Запоминающее Устройство), жесткий диск;
- интерфейс хранения (75), например, интерфейс с массовым запоминающим устройством, RAM, флэш-памятью, ROM, оптическим диском или магнитным носителем;
- интерфейс передачи данных (75), например, проводной интерфейс (например, интерфейс шины, интерфейс глобальной сети, интерфейс локальной сети) или беспроводной интерфейс (такой как интерфейс IEEE 802.11 или интерфейс Bluetooth); и
- цепь захвата изображений (например, датчик, например, CCD (или Прибор с Зарядовой Связью) или CMOS (или Комплементарная структура Металл-Оксид-Полупроводник)).
В соответствии с примерами, битовые потоки, передающие метаданные, отправляются адресату. Например, один или оба из этих битовых потоков хранятся в локальной или удаленной памяти, например, памяти видеоданных (74) или RAM (74), жестком диске (73). В одном из вариантов, по меньшей мере, один из битовых потоков отправляется в интерфейс хранения (75), например, интерфейс с массовым запоминающим устройством, RAM, флэш-памятью, ROM, оптическим диском или магнитным носителем и/или передается через интерфейс связи (75), например, интерфейс с двухточечным соединением, шиной связи, соединением «точка-многоточка» или широковещательной сетью.
В соответствии с другими примерами, получение битового потока, передающего метаданные, осуществляется из источника. Например, битовый поток считывается из локальной памяти, например, памяти видеоданных (74), RAM (74), ROM (73), флэш-памяти (73) или жесткого диска (73). В одном из вариантов битовый поток принимается из интерфейса хранения (75), например, интерфейса с массовым запоминающим устройством, RAM, ROM, флэш-памятью, оптическим диском или магнитным носителем и/или принимается из интерфейса связи (75), например, интерфейса с двухточечным соединением, шиной, соединением «точка-многоточка» или широковещательной сетью.
В соответствии с примерами, устройство 70, выполненное с возможностью реализации способа, описанного выше, принадлежит группе, включающей в себя:
- мобильное устройство;
- устройство связи;
- игровое устройство;
- планшет (или планшетный компьютер);
- ноутбук;
- камеру получения неподвижных изображений;
- видеокамеру;
- микросхему шифрования/дешифрирования;
- телевизор;
- телевизионную приставку;
- дисплей;
- сервер неподвижных изображений; и
- видеосервер (например, сервер широковещательной рассылки, сервер видео по запросу или веб-сервер).
Реализации различных процессов и признаков, описываемых в данном документе, могут быть выполнены в самом разнообразном оборудовании или приложениях. К примерам такого оборудования относятся кодер, декодер, постпроцессор, обрабатывающий выход с декодера, препроцессор, обеспечивающий вход в кодер, видеокодер, видеодекодер, видеокодек, веб-сервер, телевизионная приставка, ноутбук, персональный компьютер, сотовый телефон, PDA и любое другое устройство для обработки изображения или видео, либо иные устройства связи. Как должно быть ясно, оборудование может являться передвижным или даже установленным на передвижном средстве.
Кроме того, способы могут быть реализованы с помощью команд, выполняемых процессором, и такие команды (и/или значения данных, создаваемые реализацией) могут храниться на машиночитаемом носителе данных. Машиночитаемый носитель данных может принимать вид машиночитаемого программного продукта, осуществляемого на одной или более машиночитаемой среде (средах) и имеющего осуществляемый на нем машиночитаемый программный код, который может исполняться компьютером. Машиночитаемым носителем данных в контексте данного документа считается постоянный носитель данных, обладающий присущими ему способностями хранения информации, а также присущими ему способностями обеспечения извлечения из него информации. Машиночитаемый носитель данных может представлять собой, например, но не ограничиваясь этим, электронную, магнитную, оптическую, электромагнитную, инфракрасную или полупроводниковую систему, устройство или приспособление, либо любую комбинацию вышеперечисленного. Следует понимать, что нижеследующее, хотя и приводя более конкретные примеры машиночитаемых носителей данных, к которым могут применяться настоящие принципы, является лишь наглядным и не исчерпывающим перечнем, как нетрудно понять специалистам в данной области техники: дискета портативного компьютера; жесткий диск; постоянное запоминающее устройство (ROM); стираемое программируемое постоянное запоминающее устройство (EPROM или Флэш-память); портативное постоянное запоминающее устройство на компакт-дисках (CD-ROM); оптическое запоминающее устройство; магнитное запоминающее устройство; или любая подходящая комбинация вышеперечисленного.
Команды могут образовывать прикладную программу, практически осуществленную в считываемой процессором среде.
Программы могут находиться, например, в аппаратных средствах, микропрограммных средствах, программных средствах или их комбинации. Команды могут иметься, например, в операционной системе, отдельном приложении или комбинации перечисленного. Вследствие этого процессор может характеризоваться, например, и как устройство, выполненное с возможностью осуществления процесса, и как устройство, которое содержит считываемый процессором носитель (такой как устройство хранения), имеющий команды для осуществления процесса. Кроме того, считываемый процессором носитель может хранить - помимо или вместо команд - значения данных, создаваемые реализацией.
Как будет очевидно специалистам в данной области техники, реализации могут создавать различные сигналы, форматируемые для переноса информации, которые могут, например, храниться или передаваться. Информация может содержать, например, команды для осуществления способа или данные, создаваемые одной из описываемых реализаций. Например, сигнал может форматироваться для переноса в качестве данных правил записи или считывания синтаксиса описанного примера настоящих принципов, либо для переноса в качестве данных действительных значений синтаксиса, записанных описанным примером настоящих принципов. Такой сигнал может форматироваться, например, как электромагнитная волна (например, с использованием радиочастотной части спектра) или как модулирующий сигнал. Форматирование может включать в себя, например, кодирование потока данных и модулирование несущей кодированным потоком данных. Информация, которую может переносить сигнал, может представлять собой, например, аналоговую или цифровую информацию. Как известно, сигнал может передаваться по множеству различных проводных или беспроводных линий связи. Сигнал может храниться в считываемом процессором носителе.
Описан ряд реализаций. Тем не менее, ясно, что могут быть выполнены различные модификации. Например, элементы различных реализаций могут быть объединены, дополнены, модифицированы или удалены для создания других реализаций. Кроме того, специалистам будет понятно, что другие структуры и процессы могут быть заменены на описанные, и полученные в результате этого реализации будут выполнять, по меньшей мере, в основном ту же функцию (функции) для достижения, по меньшей мере, в основном того же результата (результатов), что и описанные реализации. В этой связи, указанные и прочие реализации предусматриваются данной заявкой.

Claims (30)

1. Способ реконструкции данных (I3) изображений, характеризующих исходные данные (I1) изображений, по декодированным данным (
Figure 00000045
) изображений и по параметрам, полученным из битового потока (101), причем упомянутые параметры обработаны по упомянутым исходным данным (I1) изображений, отличающийся тем, что способ содержит:
- проверку (102) того, являются ли упомянутые параметры потерянными, искаженными или несогласованными с декодированными данными изображений с вставленной поверх их графикой или наложением;
- когда по меньшей мере один из упомянутых параметров является потерянным, искаженным или несогласованным с декодированными данными изображений, к которым добавляется графика или наложение, выбор (104) режима (RMi) восстановления в соответствии с информационными данными (ID, 103), указывающими, как обработаны упомянутые параметры; и
- восстановление (105) упомянутого по меньшей мере одного потерянного, искаженного или несогласованного параметра путем применения выбранного режима (RMi) восстановления; и
- реконструкцию (12) данных изображений на основании декодированных данных изображений и по меньшей мере одного восстановленного параметра, при этом реконструкция изображений содержит по меньшей мере обратное отображение яркости и коррекцию цветности.
2. Способ по п. 1, в котором информационные данные (ID) явно сигнализируются элементом синтаксиса в битовом потоке.
3. Способ по одному из пп. 1 или 2, в котором параметр считается потерянным в тех случаях, когда он не извлечен из битового потока.
4. Способ по одному из пп. 1-3, в котором параметр считается искаженным в тех случаях, когда выполняется по меньшей мере одно из следующих условий:
- его значение находится за пределами диапазона значений;
- упомянутый параметр не имеет согласованного значения в соответствии с другими значениями параметра.
5. Способ по одному из пп. 1-4, в котором режим восстановления состоит в замене всех параметров восстановленными параметрами, даже если только некоторые из параметров не искажены, потеряны или не согласованы с декодированными данными изображений, к которым добавляется графика или наложение.
6. Способ по одному из пп. 1-5, в котором режим восстановления состоит в замене каждого из потерянных, искаженных или несогласованных параметров восстановленным параметром.
7. Способ по одному из пп. 1-4, в котором режим восстановления состоит в замене потерянного, искаженного или несогласованного параметра значением из набора ранее сохраненных предварительно определенных значений параметра.
8. Способ по одному из пп. 1-7, в котором режим восстановления выбирается в соответствии либо по меньшей мере с одной характеристикой исходных данных изображений или применяемого для мастеринга дисплея, используемого для градуировки исходных данных изображений или подлежащих реконструкции данных изображений, либо по меньшей мере с одной характеристикой реконструированных данных изображений или целевого дисплея.
9. Устройство для реконструкции данных изображений, характеризующих исходные данные изображений, по декодированным данным изображений и по параметрам, полученным из битового потока, причем упомянутые параметры обработаны по упомянутым исходным данным изображений, отличающееся тем, что устройство содержит средства для:
- проверки того, являются ли упомянутые параметры потерянными, искаженными или несогласованными с декодированными данными изображений с вставленной поверх их графикой или наложением;
- когда по меньшей мере один из упомянутых параметров является потерянным, искаженным или несогласованным с декодированными данными изображений, к которым добавляется графика или наложение, получения (103) информационных данных (ID), указывающих, как обработаны упомянутые параметры;
- выбора режима восстановления в соответствии с указанными информационными данными; и
- восстановления упомянутого по меньшей мере одного потерянного, искаженного или несогласованного параметра путем применения выбранного режима восстановления; и
- реконструкции (12) данных изображений на основании декодированных данных изображений и по меньшей мере одного восстановленного параметра, при этом реконструкция изображений содержит по меньшей мере обратное отображение яркости и коррекцию цветности.
10. Устройство по п. 9, в котором информационные данные (ID) явно сигнализируются элементом синтаксиса в битовом потоке.
11. Устройство по одному из пп. 9 или 10, в котором параметр считается потерянным в тех случаях, когда он не извлечен из битового потока.
12. Устройство по одному из пп. 9-11, в котором параметр считается искаженным в тех случаях, когда выполняется по меньшей мере одно из следующих условий:
- его значение находится за пределами диапазона значений;
- упомянутый параметр не имеет согласованного значения в соответствии с другими значениями параметра.
13. Устройство по одному из пп. 9-12, в котором режим восстановления состоит в замене всех параметров восстановленными параметрами, даже если только некоторые из параметров не искажены, потеряны или не согласованы с декодированными данными изображений, к которым добавляется графика или наложение.
14. Устройство по одному из пп. 9-13, в котором режим восстановления состоит в замене каждого из потерянных, искаженных или несогласованных параметров восстановленным параметром.
15. Устройство по одному из пп. 9-12, в котором режим восстановления состоит в замене потерянного, искаженного или несогласованного параметра значением из набора ранее сохраненных предварительно определенных значений параметра.
16. Устройство по одному из пп. 9-15, в котором режим восстановления выбирается в соответствии либо по меньшей мере с одной характеристикой исходных данных изображений или применяемого для мастеринга дисплея, используемого для градуировки исходных данных изображений или подлежащих реконструкции данных изображений, либо по меньшей мере с одной характеристикой реконструированных данных изображений или целевого дисплея.
17. Постоянный машиночитаемый носитель данных, программный код которого выдает команды на исполнение этапов способа по одному из пп. 1-8 при исполнении данной программы на компьютере.
RU2017144024A 2017-02-24 2017-12-15 Способ и устройство для реконструкции данных изображений по декодированным данным изображений RU2758035C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP17305212.7 2017-02-24
EP17305212.7A EP3367684A1 (en) 2017-02-24 2017-02-24 Method and device for decoding a high-dynamic range image
EP17158481.6 2017-02-28
EP17158481 2017-02-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2021128023A Division RU2836275C2 (ru) 2017-02-24 2021-09-24 Способ и устройство для реконструкции данных изображений по декодированным данным изображений

Publications (3)

Publication Number Publication Date
RU2017144024A RU2017144024A (ru) 2019-06-17
RU2017144024A3 RU2017144024A3 (ru) 2021-04-19
RU2758035C2 true RU2758035C2 (ru) 2021-10-25

Family

ID=60811990

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017144024A RU2758035C2 (ru) 2017-02-24 2017-12-15 Способ и устройство для реконструкции данных изображений по декодированным данным изображений

Country Status (10)

Country Link
US (1) US11257195B2 (ru)
EP (2) EP3367685B1 (ru)
JP (1) JP7086587B2 (ru)
KR (2) KR102458747B1 (ru)
CN (2) CN108513134B (ru)
BR (1) BR102017027195A2 (ru)
CA (2) CA2989134A1 (ru)
MX (2) MX2022003583A (ru)
RU (1) RU2758035C2 (ru)
WO (1) WO2018153800A1 (ru)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11310532B2 (en) 2017-02-24 2022-04-19 Interdigital Vc Holdings, Inc. Method and device for reconstructing image data from decoded image data
US11928796B2 (en) * 2017-12-01 2024-03-12 Interdigital Patent Holdings, Inc. Method and device for chroma correction of a high-dynamic-range image
CN109598671A (zh) * 2018-11-29 2019-04-09 北京市商汤科技开发有限公司 图像生成方法、装置、设备及介质
EP3709272A1 (en) * 2019-03-15 2020-09-16 InterDigital VC Holdings, Inc. Processing a point cloud
EP4139884B1 (en) * 2020-04-22 2024-02-21 Dolby Laboratories Licensing Corporation Iterative optimization of reshaping functions in single-layer hdr image codec
BR112022022354A2 (pt) 2020-05-05 2023-01-03 Interdigital Vc Holdings France Método, dispositivo, sinal, programa de computador, e, mídia para armazenamento de informações
CN111654707B (zh) * 2020-06-03 2022-03-15 福建师范大学福清分校 一种基于俄罗斯方块的信息隐藏方法及终端
CN112188179B (zh) * 2020-08-28 2022-07-08 北京小米移动软件有限公司 图像缩略图显示方法、图像缩略图显示装置及存储介质
JP2022085475A (ja) * 2020-11-27 2022-06-08 シャープ株式会社 動画像符号化装置、復号装置
CN113592770B (zh) * 2021-06-23 2024-02-23 中国科学院南京地理与湖泊研究所 一种去除水草影响的藻华遥感识别方法
US11606605B1 (en) 2021-09-30 2023-03-14 Samsung Electronics Co., Ltd. Standard dynamic range (SDR) / hybrid log-gamma (HLG) with high dynamic range (HDR) 10+
CN115564659B (zh) * 2022-02-28 2024-04-05 荣耀终端有限公司 视频处理方法和装置
CN114936174B (zh) * 2022-06-09 2024-01-30 中国兵器工业计算机应用技术研究所 基于地面无人平台的图像处理与融合计算方法
US12530757B2 (en) * 2022-11-09 2026-01-20 Apple Inc. Techniques for generating gain maps based on acquired images

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010151555A1 (en) * 2009-06-24 2010-12-29 Dolby Laboratories Licensing Corporation Method for embedding subtitles and/or graphic overlays in a 3d or multi-view video data
US20130250052A1 (en) * 2010-12-03 2013-09-26 Lg Electronics Inc. Receiving device and method for receiving multiview three-dimensional broadcast signal
EP2866450A1 (en) * 2013-10-24 2015-04-29 Dolby Laboratories Licensing Corporation Error control in multi-stream EDR video codec
US20150189298A1 (en) * 2014-01-02 2015-07-02 Vid Scale, Inc. Methods, apparatus and systems for scalable video coding with mixed interlace and progressive content
RU2571550C2 (ru) * 2010-04-12 2015-12-20 Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка Способ пространственного прогнозирования, способ декодирования изображений и способ кодирования изображений

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5856973A (en) * 1996-09-10 1999-01-05 Thompson; Kenneth M. Data multiplexing in MPEG server to decoder systems
JP2006279388A (ja) 2005-03-29 2006-10-12 Matsushita Electric Ind Co Ltd 動画像復号化装置および動画像復号化方法
US8406569B2 (en) * 2009-01-19 2013-03-26 Sharp Laboratories Of America, Inc. Methods and systems for enhanced dynamic range images and video from multiple exposures
TWI479898B (zh) * 2010-08-25 2015-04-01 Dolby Lab Licensing Corp 擴展影像動態範圍
TWI800092B (zh) * 2010-12-03 2023-04-21 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
US9075806B2 (en) * 2011-02-22 2015-07-07 Dolby Laboratories Licensing Corporation Alignment and re-association of metadata for media streams within a computing device
WO2012147018A2 (en) * 2011-04-28 2012-11-01 Koninklijke Philips Electronics N.V. Apparatuses and methods for hdr image encoding and decoding
JP2013066075A (ja) * 2011-09-01 2013-04-11 Sony Corp 送信装置、送信方法および受信装置
WO2013046096A1 (en) * 2011-09-27 2013-04-04 Koninklijke Philips Electronics N.V. Apparatus and method for dynamic range transforming of images
WO2014128586A1 (en) * 2013-02-21 2014-08-28 Koninklijke Philips N.V. Improved hdr image encoding and decoding methods and devices
KR102654563B1 (ko) * 2014-02-25 2024-04-05 애플 인크. 비디오 인코딩 및 디코딩을 위한 적응형 전달 함수
US20150264345A1 (en) * 2014-03-13 2015-09-17 Mitsubishi Electric Research Laboratories, Inc. Method for Coding Videos and Pictures Using Independent Uniform Prediction Mode
RU2667034C2 (ru) * 2014-05-28 2018-09-13 Конинклейке Филипс Н.В. Способы и устройства для кодирования hdr-изображений и способы и устройства для использования таких кодированных изображений
EP3051486A1 (en) * 2015-01-30 2016-08-03 Thomson Licensing Method and apparatus for encoding and decoding high dynamic range (HDR) videos
US10249263B2 (en) 2015-06-05 2019-04-02 Apple Inc. Rendering and displaying high dynamic range content
EP3113496A1 (en) * 2015-06-30 2017-01-04 Thomson Licensing Method and device for encoding both a hdr picture and a sdr picture obtained from said hdr picture using color mapping functions
TWI764870B (zh) 2015-07-28 2022-05-21 法商內數位麥德遜專利控股有限公司 視訊訊號處理裝置及方法
EP3131284A1 (en) * 2015-08-13 2017-02-15 Thomson Licensing Methods, systems and aparatus for hdr to hdr inverse tone mapping
KR102140237B1 (ko) * 2015-09-23 2020-07-31 애리스 엔터프라이지즈 엘엘씨 높은 동적 범위 비디오 데이터의 재형성 및 적응을 위한 시스템 및 방법
CN106937121B (zh) 2015-12-31 2021-12-10 中兴通讯股份有限公司 图像解码和编码方法、解码和编码装置、解码器及编码器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010151555A1 (en) * 2009-06-24 2010-12-29 Dolby Laboratories Licensing Corporation Method for embedding subtitles and/or graphic overlays in a 3d or multi-view video data
RU2571550C2 (ru) * 2010-04-12 2015-12-20 Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка Способ пространственного прогнозирования, способ декодирования изображений и способ кодирования изображений
US20130250052A1 (en) * 2010-12-03 2013-09-26 Lg Electronics Inc. Receiving device and method for receiving multiview three-dimensional broadcast signal
EP2866450A1 (en) * 2013-10-24 2015-04-29 Dolby Laboratories Licensing Corporation Error control in multi-stream EDR video codec
US20150189298A1 (en) * 2014-01-02 2015-07-02 Vid Scale, Inc. Methods, apparatus and systems for scalable video coding with mixed interlace and progressive content

Also Published As

Publication number Publication date
MX391034B (es) 2025-03-21
BR102017027195A2 (pt) 2018-10-30
JP7086587B2 (ja) 2022-06-20
EP3367685B1 (en) 2024-04-24
RU2017144024A (ru) 2019-06-17
EP3586509A1 (en) 2020-01-01
US11257195B2 (en) 2022-02-22
WO2018153800A1 (en) 2018-08-30
CN110574376A (zh) 2019-12-13
CN110574376B (zh) 2022-10-21
RU2021128023A (ru) 2021-10-28
CA3054488A1 (en) 2018-08-30
BR112019017651A2 (pt) 2020-03-31
KR20190117686A (ko) 2019-10-16
JP2018191269A (ja) 2018-11-29
CN108513134B (zh) 2023-05-26
RU2017144024A3 (ru) 2021-04-19
EP3367685A1 (en) 2018-08-29
MX2022003583A (es) 2022-05-26
CA2989134A1 (en) 2018-08-24
US20200394774A1 (en) 2020-12-17
MX2017016554A (es) 2018-11-09
KR102458747B1 (ko) 2022-10-24
CN108513134A (zh) 2018-09-07
EP3586509B1 (en) 2024-05-29
KR20180098117A (ko) 2018-09-03

Similar Documents

Publication Publication Date Title
RU2758035C2 (ru) Способ и устройство для реконструкции данных изображений по декодированным данным изображений
US11024017B2 (en) Tone mapping adaptation for saturation control
US20220167019A1 (en) Method and device for reconstructing image data from decoded image data
US10600163B2 (en) Method and device for reconstructing a display adapted HDR image
US11741585B2 (en) Method and device for obtaining a second image from a first image when the dynamic range of the luminance of the first image is greater than the dynamic range of the luminance of the second image
US11989855B2 (en) Saturation control for high-dynamic range reconstruction
JP2019097013A (ja) ディスプレイ適合hdr画像を再構成する方法およびデバイス
WO2019203973A1 (en) Method and device for encoding an image or video with optimized compression efficiency preserving image or video fidelity
CA2986520A1 (en) Method and device for reconstructing a display adapted hdr image
RU2836275C2 (ru) Способ и устройство для реконструкции данных изображений по декодированным данным изображений
CN112425168B (zh) 编码图像的方法和装置
RU2776101C1 (ru) Способ и устройство для восстановления адаптированного к дисплею изображения hdr
KR102369771B1 (ko) 디스플레이 적응형 hdr 이미지를 재구성하기 위한 방법 및 디바이스
EP3528201A1 (en) Method and device for controlling saturation in a hdr image
BR102017025044B1 (pt) Método e dispositivo para reconstruir uma imagem em hdr adaptada para exibição
BR102017025044A2 (pt) Método e dispositivo para reconstruir uma imagem em hdr adaptada para exibição

Legal Events

Date Code Title Description
HZ9A Changing address for correspondence with an applicant