MX2012000614A

MX2012000614A - Metodo y aparato de codificacion y decodificacion de imagen que utilizan gran unidad de transformacion.

Info

Publication number: MX2012000614A
Application number: MX2012000614A
Authority: MX
Inventors: Woo-Jin Han; Tammy Lee; Hae-Kyung Jung; Jianle Chen
Original assignee: Samsung Electronics Co Ltd
Priority date: 2009-08-13
Filing date: 2010-08-13
Publication date: 2012-01-27
Also published as: SI3282696T1; EP2449778A2; US20120236938A1; JP2015109686A; PT2629518T; LT2866442T; CA2877241C; CN102484703A; RU2014104796A; RU2510945C1; BR112012001757A2; PT3282696T; EP2629518B1; HUE043938T2; LT2629526T; PL2629526T3; RU2543519C2; US8971650B2; MY157499A; CN103220525A

Abstract

Se describe un método de codificación de imagen y un aparato para la codificación de una imagen agrupando una pluralidad de unidades adyacentes de predicción en una unidad de transformación y transformando la pluralidad de unidades adyacentes de predicción en un dominio de frecuencia y un método de decodificación de imagen y un aparato para la decodificación de una imagen codificada utilizando el método y aparato de codificación de imagen.

Description

METODO Y APARATO DE CODIFICACION Y DECODIFICACION DE IMAGEN QUE UTILIZAN GRAN UNIDAD DE TRANSFORMACION Campo de la Invención Las modalidades de ejemplo se refieren a un método y un aparato de codificación y decodificación de una imagen, y de manera más particular, se refieren a un método y aparato de codificación y decodificación de una imagen mediante la transformación de una imagen de un dominio de píxel en coeficientes de un dominio de frecuencia.

Antecedentes de la Invención Con el propósito de realizar la compresión de imagen, la mayoría de métodos y aparatos de codificación y decodificación de imagen codifican una imagen mediante la transformación de una imagen de un dominio de píxel en coeficientes de un dominio de frecuencia. Una Transformada del Coseno Discreto (DCT) , que es una de las técnicas de transformada de frecuencia, es una técnica bien conocida que es ampliamente utilizada en la compresión de imagen o sonido. Un método de codificación de imagen que utiliza la DCT involucra la realización de la DCT en una imagen de un dominio de píxel, generando los coeficientes de coseno discreto, cuantificando los coeficientes generados de coseno discreto y realizando la codificación por entropía en los coeficientes generados de coseno discreto.

REF. 226565 Breve Descripción de la Invención Solución al Problema Las modalidades de ejemplo proporcionan un método y aparato de codificación y decodificación de una imagen mediante la utilización de una transformada de coseno discreto más eficiente (DCT) y también proporcionan un medio de grabación susceptible de ser leído en computadora que tiene grabado en el mismo un programa para la ejecución del método .

Efectos Ventajosos de la Invención De acuerdo con una o más de las modalidades de ejemplo, es posible establecer o ajustar la unidad de transformación de modo que sea más grande que la unidad de predicción y realizar la DCT, de modo que una imagen podría ser comprimida y codificada, de manera eficiente.

Breve Descripción de las Figuras Las características anteriores y otras características de las modalidades de ejemplo serán más aparentes mediante la descripción en detalle de las modalidades de ejemplo de las mismas con referencia a las figuras adjuntas, en las cuales: La Figura 1 es un diagrama de bloques de un aparato de codificación de imagen de acuerdo con una modalidad de ejemplo; La Figura 2 es un diagrama de un aparato de decodificación de imagen de acuerdo con otra modalidad de ej emplo ; La Figura 3 es un diagrama de una unidad de codificación jerárquica de acuerdo con otra modalidad de ejemplo; La Figura 4 es un diagrama de bloques de un codificador de imagen basado en una unidad de codificación de acuerdo con otra modalidad de ejemplo; La Figura 5 es un diagrama de bloques de un decodificador de imagen basado en una unidad de codificación de acuerdo con otra modalidad de ejemplo; La Figura 6 ilustra una unidad de codificación máxima, unidades de sub-codificación y las unidades de predicción de acuerdo con otra modalidad de ejemplo; La Figura 7 es un diagrama de una unidad de codificación y una unidad de transformación de acuerdo con otra modalidad de ejemplo; Las Figuras 8A y 8B ilustran las formas de división de una unidad de codificación máxima, una unidad de predicción y una unidad de transformación de acuerdo con otra modalidad de ejemplo; La Figura 9 es un diagrama de bloques de un aparato de codificación de imagen de acuerdo con otra modalidad de ejemplo; La Figura 10 es un diagrama del transformador; Las Figuras 11A-11C ilustran tipos de una unidad de transformación de acuerdo con otra modalidad de ejemplo; La Figura 12 ilustra diferentes unidades de transformación de acuerdo con otra modalidad de ejemplo; La Figura 13 es un diagrama de bloques de un aparato de decodificación de imagen de acuerdo con otra modalidad de ej emplo; La Figura 14 es un diagrama de flujo de un método de codificación de imagen, de acuerdo con una modalidad de ejemplo; y La Figura 15 es un diagrama de flujo de un método de decodificación de imagen, de acuerdo con otra modalidad de ej emplo .

Descripción Detallada de la Invención De acuerdo con un aspecto de una modalidad de ejemplo, se proporciona un método de codificación de imagen que incluye las operaciones de ajuste de una unidad de transformación seleccionando una pluralidad de unidades adyacentes de predicción; y la transformación de la pluralidad de unidades adyacentes de predicción en un dominio de frecuencia de acuerdo con la unidad de transformación y la generación de los coeficientes de componente de frecuencia; la cuantificación de los coeficientes de componente de frecuencia; y la realización de la codificación por entropía en los coeficientes cuantificados de componente de frecuencia .

La operación de ajuste de la unidad de transformación podría ser realizada en función de una profundidad que indica el nivel de reducción de tamaño que es realizado, en forma gradual, de una unidad de codificación máxima de una rebanada actual o una imagen actual a una unidad de sub-codificación que comprende la pluralidad de unidades adyacentes de predicción.

La operación de ajuste de la unidad de transformación podría ser realizada seleccionando una pluralidad de unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con un mismo modo de predicción.

El mismo modo de predicción podría ser un modo de inter-predicción o un modo de intra-predicción .

El método de codificación de imagen además podría incluir la operación de ajuste de una unidad de transformación óptima al realizar, en forma repetida, las operaciones mencionadas con anterioridad en diferentes unidades de transformación, en donde las operaciones mencionadas con anterioridad incluyen las operaciones de ajuste de la unidad de transformación seleccionando una pluralidad de unidades adyacentes de predicción, la transformación de la pluralidad de unidades adyacentes de predicción en el dominio de frecuencia de acuerdo con la unidad de transformación y la generación de los coeficientes de componente de frecuencia, la cuantificación de los coeficientes de componente de frecuencia y la realización de la codificación por entropía en los coeficientes cuantificados de componente de frecuencia.

De acuerdo con otro aspecto de una modalidad de ejemplo, se proporciona un aparato de codificación de imagen que incluye un transformador que establece o ajusta una unidad de transformación seleccionando una pluralidad de unidades adyacentes de predicción, la transformación de la pluralidad de unidades adyacentes de predicción en un dominio de frecuencia de acuerdo con la unidad de transformación y la generación de los coeficientes de componente de frecuencia; una unidad de cuantificación que cuantifica los coeficientes de componente de frecuencia; y una unidad de codificación por entropía que realiza la codificación por entropía en los coeficientes cuantificados de componente de frecuencia.

De acuerdo con otro aspecto de una modalidad de ejemplo, se proporciona un método de decodificación de imagen que incluye las operaciones de decodificación por entropía de los coeficientes de componente de frecuencia que son generados al ser transformados en un dominio de frecuencia de acuerdo con una unidad de transformación; la cuantificación inversa de los coeficientes de componente de frecuencia; y la transformación inversa de los coeficientes de componente de frecuencia en un dominio de píxel y la reconstrucción de una pluralidad de unidades adyacentes de predicción comprendida en la unidad de transformación.

De acuerdo con otro aspecto de una modalidad de ejemplo, se proporciona un aparato de decodificación de imagen que incluye un decodificador de entropía para la decodificación por entropía de los coeficientes de componente de frecuencia que son generados al ser transformados en un dominio de frecuencia de acuerdo con una unidad de transformación; una unidad de cuantificación inversa para la cuantificación inversa de los coeficientes de componente de frecuencia; y un transformador inverso para la transformación inversa de los coeficientes de componente de frecuencia en un dominio de píxel y la reconstrucción de una pluralidad de unidades adyacentes de predicción comprendida en la unidad de transformación .

De acuerdo con otro aspecto de una modalidad de ejemplo, se proporciona un medio de grabación susceptible de ser leído en computadora que tiene grabado en el mismo un programa para la ejecución de los métodos de codificación y decodificación de imagen.

Modo para la Invención De aquí en adelante, las modalidades de ejemplo serán descritas en detalle con referencia a las figuras adjuntas. En las modalidades de ejemplo, el término "unidad" podría referirse o no a una unidad de tamaño, en función de su contexto y el término "imagen" podría denotar una imagen fija para un video o una imagen en movimiento, es decir, el video por sí mismo.

La Figura 1 es un diagrama de bloques de un aparato 100 para la codificación de la imagen, de acuerdo con una modalidad de ejemplo.

Con referencia a la Figura 1, el aparato 100 incluye una unidad de división de unidad de codificación máxima 110, una unidad de determinación de profundidad de codificación 120, un codificador de datos de imagen 130 y un codificador de información de codificación 140.

La unidad de división de unidad de codificación máxima 110 puede dividir una imagen o rebanada actual en función de una unidad de codificación máxima que es una unidad de codificación del tamaño más grande. Es decir, la unidad de división de unidad de codificación máxima 110 puede dividir la imagen o rebanada actual para obtener por lo menos una unidad de codificación máxima.

De acuerdo con una modalidad de ejemplo, una unidad de codificación puede ser representada utilizando una unidad de codificación máxima y una profundidad. Como es descrito con anterioridad, la unidad de codificación máxima indica una unidad de codificación que tiene el tamaño más grande de entre las unidades de codificación de la imagen actual y la profundidad indica el tamaño de una unidad de sub-codificación obtenida al disminuir en forma jerárquica la unidad de codificación. A medida que se incrementa la profundidad, la unidad de codificación puede disminuir en tamaño de una unidad de codificación máxima a una unidad de codificación mínima, en donde una profundidad de la unidad de codificación máxima es definida como la profundidad mínima y una profundidad de la unidad de codificación mínima es definida como la profundidad máxima. Debido a que el tamaño de la unidad de codificación máxima disminuye a medida que se incrementa la profundidad, una unidad de sub-codificación de una profundidad kth puede incluir una pluralidad de unidades de sub-codificación de una profundidad (k+n) th (k y n son enteros iguales o más grandes que 1) .

De acuerdo con el incremento del tamaño de la imagen que será codificada, la codificación de una imagen en una unidad de codificación más grande puede originar una relación de compresión de imagen más grande. Sin embargo, si es fijada una unidad de codificación más grande, la imagen no puede ser codificada de manera eficiente tomando en cuenta las características de imagen de cambio continuo.

Por ejemplo, cuando una imagen suave es codificada, tal como el mar o el cielo, cuando es más grande la unidad de codificación, puede incrementarse la relación de compresión. Sin embargo, cuando el área compleja es codificada, tal como la gente o los edificios, cuando es más pequeña la unidad de codificación, puede incrementarse más la relación de compresión.

En consecuencia, de acuerdo con una modalidad de ejemplo, la unidad diferente de codificación de imagen máxima y la profundidad máxima diferente son ajustadas para cada imagen o rebanada. Debido a que la profundidad máxima denota el número máximo de veces a través del cual puede disminuir la unidad de codificación, el tamaño de cada unidad de codificación mínima incluido en la unidad de codificación máxima de imagen puede ser ajustado, en forma variable, de acuerdo con una profundidad máxima .

La unidad de determinación de profundidad de codificación 120 determina la profundidad máxima. La profundidad máxima puede ser determinada en función del cálculo del costo de la Relación-Distorsión (R-D) . La profundidad máxima podría ser determinada, de manera diferente, para cada imagen o rebanada o para cada unidad de codificación máxima. La profundidad máxima determinada es proporcionada al codificador de información de codificación 140 y los datos de imagen de acuerdo con unidades de codificación máxima son proporcionados al codificador de datos de imagen 130.

La profundidad máxima denota una unidad de codificación que tiene el tamaño más pequeño, el cual puede ser incluido en una unidad de codificación máxima, es decir, una unidad de codificación mínima. En otras palabras, una unidad de codificación máxima puede ser dividida en unidades de sub-codificación que tienen diferentes tamaños de acuerdo con diferentes profundidades. Esto es descrito en detalle más adelante con referencia a las Figuras 8A y 8B. Además, las unidades de sub-codificación que tienen diferentes tamaños, los cuales son incluidos en la unidad de codificación máxima, pueden ser previstas o transformarlas en función de las unidades de procesamiento que tienen diferentes tamaños. En otras palabras, el aparato 100 puede realizar una pluralidad de operaciones de procesamiento para la codificación de imagen en función de las unidades de procesamiento que tienen varios tamaños y varias formas. Para codificar los datos de imagen, son realizadas las operaciones de procesamiento, tales como la predicción, transformación y codificación por entropía, en donde las unidades de procesamiento que tienen el mismo tamaño podrían ser utilizadas para cada operación o las unidades de procesamiento que tienen diferentes tamaños podrían ser utilizadas para cada operación.

Por ejemplo, el aparato 100 puede seleccionar una unidad de procesamiento que es diferente de una unidad de codificación para predecir la unidad de codificación.

Cuando el tamaño de una unidad de codificación es 2Nx2N (en donde N es un entero positivo) , las unidades de procesamiento para la predicción podrían ser 2Nx2N, 2Nx , Nx2N y NxN. En otras palabras, la predicción de movimiento podría ser realizada en función de una unidad de procesamiento que tiene una forma, por medio de lo cual, por lo menos uno de la altura y el ancho de una unidad de codificación es igualmente dividido entre dos. De aquí en adelante, una unidad de procesamiento, que es la base de la predicción, es definida como una 'unidad de predicción' .

Un modo de predicción podría ser por lo menos uno de un intra-modo, un inter-modo y un modo de salto y un modo específico de predicción puede ser realizado sólo para una unidad de predicción que tiene un tamaño o forma específica. Por ejemplo, el intra-modo puede ser realizado sólo para las unidades de predicción que tienen los tamaños de 2Nx2N y NxN de los cuales la forma es un cuadrado. Además, el modo de salto puede ser realizado sólo para una unidad de predicción que tiene el tamaño de 2Nx2N. Si existe una pluralidad de las unidades de predicción en una unidad de codificación, el modo de predicción con los menores errores de codificación puede ser seleccionado después de realizar la predicción para cada unidad de predicción.

De manera alternativa, el aparato 100 puede realizar la transformación de frecuencia en los datos de imagen en función de una unidad de procesamiento que tiene un tamaño diferente de una unidad de codificación. Para la transformación de frecuencia en la unidad de codificación, la transformación de frecuencia puede ser realizada en función de una unidad de procesamiento que tiene un tamaño igual o más grande que el tamaño de la unidad de codificación. De aquí en adelante, una unidad de procesamiento, que es la base de la transformación de frecuencia, es definida como una 'unidad de transformación' . La transformación de frecuencia podría ser la Transformada del coseno discreto (DCT) o la Transformada de Karhunen Loeve (KLT) .

La unidad de determinación de profundidad de codificación 120 puede determinar las unidades de sub-codificación incluidas en una unidad de codificación máxima utilizando la optimización RD en función de un multiplicador Lagrangiano. En otras palabras, la unidad de determinación de profundidad de codificación 120 puede determinar las formas de una pluralidad de las unidades de sub-codificación divididas de la unidad de codificación máxima, en donde la pluralidad de las unidades de sub-codificación tiene diferentes tamaños de acuerdo con sus profundidades. El codificador de datos de imagen 130 da salida a un flujo de bits mediante la codificación de la unidad de codificación máxima en función de las formas de división, es decir, las formas que dividen la unidad de codificación máxima, como es determinado por la unidad de determinación de profundidad de codificación 120.

El codificador de información de codificación 140 codifica la información acerca de un modo de codificación de la unidad de codificación máxima determinado por la unidad de determinación de profundidad de codificación 120. En otras palabras, el codificador de información de codificación 140 da salida a un flujo de bits mediante la codificación de la información acerca de una forma de división de la unidad de codificación máxima, la información acerca de la profundidad máxima y la información acerca de un modo de codificación de una unidad de sub-codificación para cada profundidad. La información acerca del modo de codificación de la unidad de sub-codificación puede incluir la información acerca de una unidad de predicción de la unidad de sub-codificación, la información acerca de un modo de predicción para cada unidad de predicción y la información acerca de una unidad de transformación de la unidad de sub-codificación .

Debido a que las unidades de sub-codificación que tiene diferentes tamaños existen para cada unidad de codificación máxima y la información acerca de un modo de codificación tiene que ser determinada para cada unidad de sub-codificación, la información acerca al menos de un modo de codificación puede ser determinada para una unidad de codificación máxima.

El aparato 100 puede generar las unidades de sub-codificación dividiendo por igual, tanto la altura como el ancho de una unidad de codificación máxima entre dos de acuerdo con el incremento de la profundidad. Es decir, cuando el tamaño de una unidad de codificación de una profundidad kth es 2Nx2N, el tamaño de una unidad de codificación de una profundidad (k+l)th es Nx .

En consecuencia, el aparato 100 de acuerdo con una modalidad de ejemplo puede determinar una forma de división óptima para cada unidad de codificación máxima en función de los tamaños de las unidades de codificación máxima y una profundidad máxima en consideración de las características de imagen. Al ajustar, en forma variable, el tamaño de una unidad de codificación máxima en consideración de las características de imagen y la codificación de una imagen a través de la división de una unidad de codificación máxima en unidades de sub-codificación de profundidades diferentes, las imágenes que tienen varias resoluciones pueden ser codificadas, de manera más eficiente.

La Figura 2 es un diagrama de bloques de un aparato 200 para la decodificación de una imagen de acuerdo con una modalidad de ejemplo.

Con referencia a la Figura 2, el aparato 200 incluye una unidad de obtención de datos de imagen 210, una unidad de extracción de información de codificación 220 y un decodificador de datos de imagen 230.

La unidad de obtención de datos de imagen 210 adquiere los datos de imagen de acuerdo con las unidades de codificación máxima mediante el análisis de un flujo de bits recibido por medio del aparato 200 y da salida a los datos de imagen hacia el decodificador de datos de imagen 230. La unidad de obtención de datos de imagen 210 puede extraer la información acerca de una unidad de codificación máxima de una imagen o rebanada actual de un encabezado de la imagen o rebanada actual. En otras palabras, la unidad de obtención de datos de imagen 210 divide el flujo de bits en la unidad de codificación máxima de modo que el decodificador de datos de imagen 230 puede decodificar los datos de imagen de acuerdo con las unidades de codificación máxima.

La unidad de extracción de información de codificación 220 extrae la información acerca de la unidad de codificación máxima, la profundidad máxima, la forma de división de la unidad de codificación máxima, el modo de codificación de las unidades de sub-codificación del encabezado de la imagen actual mediante el análisis del flujo de bits recibido por el aparato 200. La información acerca de una forma de división y la información acerca de un modo de codificación son proporcionadas al decodificador de datos de imagen 230.

La información acerca de una forma de división de la unidad de codificación máxima puede incluir la información acerca de las unidades de sub-codificación que tienen diferentes tamaños de acuerdo con las profundidades incluidas en la unidad de codificación máxima y la información acerca de un modo de codificación puede incluir la información acerca de una unidad de predicción de acuerdo con una unidad de sub-codificación, la información acerca de un modo de predicción y la información acerca de las unidades de transformación .

El decodificador de datos de imagen 230 restaura la imagen actual mediante la decodificación de los datos de imagen de cada unidad de codificación máxima en función de la información extraída por la unidad de extracción de información de codificación 220. El decodificador de datos de imagen 230 puede decodificar las unidades de sub-codificación incluidas en una unidad de codificación máxima en función de la información acerca de una forma de división de la unidad de codificación máxima. El proceso de decodificación puede incluir un proceso de predicción que incluye la intra-predicción y la compensación de movimiento y un proceso de transformación inversa.

El decodificador de datos de imagen 230 puede realizar la intra-predicción o la inter-predicción en función de la información acerca de una unidad de predicción y la información acerca de un modo de predicción con el propósito de predecir la unidad de predicción. El decodificador de datos de imagen 230 también puede realizar la transformación inversa para cada unidad de sub-codificación en función de la información acerca de una unidad de transformación de una unidad de sub-codificación.

La Figura 3 ilustra las unidades de codificación jerárquica de acuerdo con una modalidad de ejemplo.

Con referencia a la Figura 3, las unidades de codificación jerárquica de acuerdo con una modalidad de ejemplo pueden incluir las unidades de codificación cuyos anchos x alturas son 64x64, 32x32, 16x16, 8x8 y 4x4. Además de estas unidades de codificación que tienen las formas de cuadro perfecto, también podrían existir las unidades de codificación cuyos anchos x alturas son 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4 y 4x8.

Con referencia a la Figura 3, para los datos de imagen 310 cuya resolución es de 1920x1080, el tamaño de una unidad de codificación máxima es establecido en 64x64 y la profundidad máxima es establecida en 2.

Para los datos de imagen 320 cuya resolución es de 1920x1080, el tamaño de una unidad de codificación máxima es establecido en 64x64 y la profundidad máxima es establecida en 4. Para los datos de imagen 330 cuya resolución es de 352x288, el tamaño de una unidad de codificación máxima es establecido en 16x16 y la profundidad máxima es establecida en 1.

Cuando la resolución es alta o la cantidad de datos es grande, es preferible, aunque no es necesario, que el tamaño máximo de la unidad de codificación sea relativamente grande para incrementar la relación de compresión y reflejar con exactitud las características de imagen. En consecuencia, para los datos de imagen 310 y 320 que tienen una resolución más alta que los datos de imagen 330, puede ser seleccionado 64x64 como el tamaño de la unidad de codificación máxima.

Una profundidad máxima indica el número total de capaz en las unidades de codificación jerárquica. Debido a que la profundidad máxima de los datos de imagen 310 es 2, una unidad de codificación 315 de los datos de imagen 310 puede incluir una unidad de codificación máxima cuyo tamaño de eje más largo es de 64 y las unidades de sub-codificación cuyos tamaños de eje más largo son de 32 y 16, de acuerdo con el incremento de una profundidad.

Por otro lado, debido a que la profundidad máxima de los datos de imagen 330 es 1, una unidad de codificación 335 de los datos de imagen 330 puede incluir una unidad de codificación máxima cuyo tamaño de eje más largo es de 16 y las unidades de codificación cuyos tamaños de eje más largo es de 8, de acuerdo con el incremento de una profundidad.

Sin embargo, debido a que la profundidad máxima de los datos de imagen 320 es 4, una unidad de codificación 325 de los datos de imagen 320 puede incluir una unidad de codificación máxima cuyo tamaño de eje más largo es de 64 y unidades de sub-codificación cuyos tamaños de eje más largo son de 32, 16, 8 y 4 de acuerdo con el incremento de una profundidad. Debido a que una imagen es codificada en función de una unidad más pequeña de sub-codificación a medida que se incrementa la profundidad, la modalidad de ejemplo es adecuada para la codificación de una imagen que incluye detalles más insignificantes o mínimos en las escenas.

La Figura 4 es un diagrama de bloques de un codificador de imagen 400 en función de una unidad de codificación, de acuerdo con una modalidad de ejemplo.

Un intra-predictor 410 realiza la intra-predicción en las unidades de predicción del intra-modo en un cuadro actual 405 y una unidad de estimación de movimiento 420 y una unidad de compensación de movimiento 425 realizan la inter-predicción y la compensación de movimiento en las unidades de predicción del inter-modo utilizando el cuadro actual 405 y un cuadro de referencia 495.

Los valores residuales son generados en función de las unidades de predicción salidas del intra-predictor 410, la unidad de estimación de movimiento 420 y la unidad de compensación de movimiento 425 y los valores residuales generados son salidos como los coeficientes cuantificados de transformada al pasarlos a través de un transformador 430 y una unidad de cuantificación 440.

Los coeficientes cuantificados de transformada son restaurados en los valores residuales al pasarlos a través de una unidad de cuantificación inversa 460 y un transformador inverso de frecuencia 470 y los valores residuales restaurados son posteriormente procesados al pasarlos a través de una unidad de desbloqueo 480 y una unidad de filtrado de circuito 490 y son salidos como el cuadro de referencia 495. Los coeficientes cuantificados de transformada pueden ser salidos como un flujo de bits 455 al pasarlos a través de un codificador de entropía 450.

Para realizar la codificación en función de un método de codificación de acuerdo con una modalidad de ejemplo, los componentes del codificador de imagen 400, es decir, el intra-predictor 410, la unidad de estimación de movimiento 420, la unidad de compensación de movimiento 425, el transformador 430, la unidad de cuantificación 440, el codificador de entropía 450, la unidad de cuantificación inversa 460, el transformador inverso de frecuencia 470, la unidad de desbloqueo 480 y la unidad de filtrado de circuito 490, realizan los procesos de codificación de imagen en función de una unidad de codificación máxima, una unidad de sub-codificación de acuerdo con las profundidades, la unidad de predicción y la unidad de transformación.

La Figura 5 es un diagrama de bloques de un decodificador de imagen 500 en función de una unidad de codificación, de acuerdo con una modalidad de ejemplo.

Un flujo de bits 505 pasa a través de una unidad de análisis 510 de modo que los datos codificados de imagen que serán decodificados y la información de codificación necesaria para la decodificación son analizados. Los datos codificados de imagen son salidos como los datos cuantificados inversos al pasarlos a través de un decodificador de entropía 520 y una unidad de cuantificación inversa 530 y son restaurados en los valores residuales al pasarlos a través de un transformador inverso de frecuencia 540. Los valores residuales son restaurados de acuerdo con las unidades de codificación al ser agregados a un resultado de intra-predicción de un intra-predictor 550 o el resultado de compensación de movimiento de una unidad de compensación de movimiento 560. Las unidades restauradas de codificación son utilizadas para la predicción de las siguientes unidades de codificación o una siguiente imagen al pasarlas a través de una unidad de desbloqueo 570 y una unidad de filtrado de circuito 580.

Para realizar la decodificación en función de un método de decodificación de acuerdo con una modalidad de ejemplo, los componentes del decodificador de imagen 500, es decir, la unidad de análisis 510, el decodificador de entropía 520, la unidad de cuantificación inversa 530, el transformador inverso de frecuencia 540, el intra-predictor 550, la unidad de compensación de movimiento 560, la unidad de desbloqueo 570 y la unidad de filtrado de circuito 580, realizan los procesos de decodificación de imagen en función de una unidad de codificación máxima, una unidad de sub-codificación de acuerdo con las profundidades, la unidad de predicción y la unidad de transformación.

En particular, el intra-predictor 550 y la unidad de compensación de movimiento 560 determinan una unidad de predicción y un modo de predicción en una unidad de sub-codificación considerando una unidad de codificación máxima y una profundidad y el transformador inverso de frecuencia 540 realiza la transformación inversa considerando el tamaño de una unidad de transformación.

La Figura 6 ilustra una unidad de codificación máxima, una unidad de sub-codif cación y una unidad de predicción, de acuerdo con una modalidad de ejemplo.

El aparato 100 y el aparato 200 de acuerdo con una modalidad de ejemplo utilizan las unidades de codificación jerárquica para realizar la codificación y decodificación en consideración de las características de imagen. Una unidad de codificación máxima y una profundidad máxima pueden ser ajustadas, de manera adaptiva, de acuerdo con las características de imagen o pueden ser ajustadas, en forma variable, de acuerdo con los requerimientos de un usuario.

Una estructura de unidad de codificación jerárquica 600 de acuerdo con una modalidad de ejemplo ilustra una unidad de codificación máxima 610 cuya altura y ancho son 64 y la profundidad máxima es 4. La profundidad se incrementa a lo largo del eje vertical de la estructura de unidad de codificación jerárquica 600 y a medida que se incrementa la profundidad, disminuyen las alturas y los anchos de las unidades de sub-codificación 620 a 650. Las unidades de predicción de la unidad de codificación máxima 610 y las unidades de sub-codificación 620 a 650 son mostradas a lo largo del eje horizontal de la estructura de unidad de codificación jerárquica 600.

La unidad de codificación máxima 610 tiene una profundidad de 0 y el tamaño de una unidad de codificación, es decir, la altura y el ancho, de 64x64. La profundidad se incrementa a lo largo del eje vertical y existe una unidad de sub-codificación 620 cuyo tamaño es 32x32 y la profundidad es 1, una unidad de sub-codificación 630 cuyo tamaño es 16x16 y la profundidad es 2, una unidad de sub-codificación 640 cuyo tamaño es 8x8 y la profundidad es 3 y una unidad de sub-codificación 650 cuyo tamaño es 4x4 y la profundidad es 4. La unidad de sub-codificación 650 cuyo tamaño es 4x4 y la profundidad es 4 es una unidad de codificación mínima y la unidad de codificación mínima podría ser dividida en las unidades de predicción, cada una de las cuales es menor que la unidad de codificación mínima.

Con referencia a la Figura 6, son mostrados ejemplos de una unidad de predicción a lo largo del eje horizontal de acuerdo con cada profundidad. Es decir, una unidad de predicción de la unidad de codificación máxima 610 cuya profundidad es 0 podría ser una unidad de predicción cuyo tamaño es igual a la unidad de codificación 610, es decir, 64x64, o una unidad de predicción 612 cuyo tamaño es 64x32, una unidad de predicción 614 cuyo tamaño es 32x64, o una unidad de predicción 616 cuyo tamaño es 32x32, que tiene un tamaño más pequeño que la unidad de codificación 610 cuyo tamaño es 64x64.

Una unidad de predicción de la unidad de codificación 620 cuya profundidad es 1 y el tamaño es 32x32 podría ser una unidad de predicción cuyo tamaño es igual a la unidad de codificación 620, es decir, 32x32, o una unidad de predicción 622 cuyo tamaño es 32x16, una unidad de predicción 624 cuyo tamaño es 16x32, o una unidad de predicción 626 cuyo tamaño es 16x16, que tiene un tamaño más pequeño que la unidad de codificación 620 cuyo tamaño es 32x32.

Una unidad de predicción de la unidad de codificación 630 cuya profundidad es 2 y el tamaño es 16x16 podría ser una unidad de predicción cuyo tamaño es igual a la unidad de codificación 630, es decir, 16x16, o una. unidad de predicción 632 cuyo tamaño es 16x8, una unidad de predicción 634 cuyo tamaño es 8x16, o una unidad de predicción 636 cuyo tamaño es 8x8, que tiene un tamaño más pequeño que la unidad de codificación 630 cuyo tamaño es 16x16.

Una unidad de predicción de la unidad de codificación 640 cuya profundidad es 3 y el tamaño es 8x8 podría ser una unidad de predicción cuyo tamaño es igual a la unidad de codificación 640, es decir, 8x8, o una unidad de predicción 642 cuyo tamaño es 8x4, una unidad de predicción 644 cuyo tamaño es 4x8, o una unidad de predicción 646 cuyo tamaño es 4x4, que tiene un tamaño más pequeño que la unidad de codificación 640 cuyo tamaño es 8x8.

Finalmente, la unidad de codificación 650 cuya profundidad es 4 y el tamaño es 4x4 es una unidad de codificación mínima y una unidad de codificación de una profundidad máxima y una unidad de predicción de la unidad de codificación 650 podría ser una unidad de predicción 650 cuyo tamaño es 4x4, una unidad de predicción 652 que tiene un tamaño de 4x2, una unidad de predicción 654 que tiene un tamaño de 2x4, o una unidad de predicción 656 que tiene un tamaño de 2x2.

La Figura 7 ilustra una unidad de codificación y una unidad de transformación, de acuerdo con una modalidad de ejemplo.

El aparato 100 y el aparato 200, de acuerdo con una modalidad de ejemplo, realizan la codificación con una unidad de codificación máxima por sí misma o con unidades de sub-codificación, las cuales son iguales o más pequeñas que la unidad de codificación máxima, dividida a partir de la unidad de codificación máxima.

En el proceso de codificación, el tamaño de una unidad de transformación para la transformación de frecuencia es seleccionado para que sea no más grande que el tamaño de una correspondiente unidad de codificación. Por ejemplo, cuando la unidad de codificación 710 tiene el tamaño de 64x64, la transformación de frecuencia puede ser realizada utilizando una unidad de transformación 720 que tiene el tamaño de 32x32.

Las Figuras 8A y 8B ilustran las formas de división de una unidad de codificación, una unidad de predicción y una unidad de transformación, de acuerdo con una modalidad de ej emplo .

La Figura 8A ilustra una unidad de codificación y una unidad de predicción, de acuerdo con una modalidad de ej emplo .

El lado izquierdo de la Figura 8A muestra una forma de división seleccionada por el aparato 100, de acuerdo con una modalidad de ejemplo, con el propósito de decodificar una unidad de codificación máxima 810. El aparato 100 divide la unidad de codificación máxima 810 en varias formas, además, realiza la codificación y selecciona una forma de división óptima comparando los resultados de la codificación de varias formas de división entre sí en función del costo R-D. Cuando es óptima la codificación de la unidad de codificación máxima 810 como es, la unidad de codificación máxima 810 podría ser codificada sin dividir la unidad de codificación máxima 810 como es ilustrado en las Figuras 8A y 8B .

Con referencia al lado izquierdo de la Figura 8A, la unidad de codificación máxima 810 cuya profundidad es 0 es codificada al dividirla en unidades de sub-codificación cuyas profundidades son iguales o más grandes que 1. Es decir, la unidad de codificación máxima 810 es dividida en 4 unidades de sub-codificación cuyas profundidades son 1 y todas o algunas de las unidades de sub-codificación cuyas profundidades son 1 son divididas en unidades de sub-codificación cuyas profundidades son 2.

Una unidad de sub-codificación localizada en el lado derecho superior y una unidad de sub-codificación localizada en el lado izquierdo inferior entre las unidades de sub-codificación cuyas profundidades son 1 son divididas en unidades de sub-codificación cuyas profundidades son iguales o más grandes que 2. Algunas de las unidades de sub-codificación cuyas profundidades son iguales o más grandes que 2 podrían ser divididas en unidades de sub-codificación cuyas profundidades son iguales o más grandes que 3.

El lado derecho de la Figura 8A muestra una forma de división de una unidad de predicción para la unidad de codificación máxima 810.

Con referencia al lado derecho de la Figura 8A, una unidad de predicción 860 para la unidad de codificación máxima 810 puede ser dividida, de manera diferente, de la unidad de codificación máxima 810. En otras palabras, una unidad de predicción para cada una de las unidades de sub-codificación puede ser más pequeña que una correspondiente unidad de sub-codificación .

Por ejemplo, una unidad de predicción para una unidad de sub-codificación 854 localizada en el lado derecho inferior entre las unidades de sub-codificación cuyas profundidades son 1 puede ser más pequeña que la unidad de sub-codificación 854. Además, las unidades de predicción para algunas (814, 816, 850 y 852) de las unidades de sub-codificación 814, 816, 818, 828, 850 y 852 cuyas profundidades son 2 pueden ser más pequeñas que la unidades de sub-codificación 814, 816, 850 y 852, de manera respectiva. Además, las unidades de predicción para las unidades de sub-codificación 822, 832 y 848 cuyas profundidades son 3 pueden ser más pequeñas que las unidades de sub-codificación 822, 832 y 848, de manera respectiva. Las unidades de predicción podrían tener una forma, por medio de lo cual, las respectivas unidades de sub-codificación son igualmente divididas entre dos en una dirección de altura o ancho o podrían tener una forma, por medio de lo cual, las respectivas unidades de sub-codificación son igualmente divididas entre cuatro en las direcciones de altura y ancho.

La Figura 8B ilustra una unidad de predicción y una unidad de transformación, de acuerdo con una modalidad de ejemplo.

El lado izquierdo de la Figura 8B muestra una forma de división de una unidad de predicción para la unidad de codificación máxima 810 mostrada en el lado derecho de la Figura 8A y el lado derecho de la Figura 8B muestra una forma de división de una unidad de transformación de la unidad de codificación máxima 810.

Con referencia al lado derecho de la Figura 8B, una forma de división de una unidad de transformación 870 puede ser establecida o ajustada, de manera diferente, de la unidad de predicción 860.

Por ejemplo, aun cuando una unidad de predicción para la unidad de codificación 854 cuya profundidad es 1 es seleccionada con una forma, por medio de lo cual, la altura de la unidad de codificación 854 es igualmente dividida entre dos, una unidad de transformación puede ser seleccionada con el mismo tamaño como la unidad de codificación 854. Del mismo modo, aun cuando las unidades de predicción para las unidades de codificación 814 y 850 cuyas profundidades son 2 son seleccionadas con una forma, por medio de lo cual, la altura de cada una de las unidades de codificación 814 y 850 es igualmente dividida entre dos, una unidad de transformación puede ser seleccionada con el mismo tamaño que el tamaño original de cada una de las unidades de codificación 814 y 850.

Una unidad de transformación podría ser seleccionada con un tamaño más pequeño que una unidad de predicción. Por ejemplo, cuando una unidad de predicción para la unidad de codificación 852 cuya profundidad es 2 es seleccionada con una forma, por medio de lo cual, el ancho de la unidad de codificación 852 es igualmente dividido entre dos, una unidad de transformación puede ser seleccionada con una forma, por medio de lo cual, la unidad de codificación 852 es igualmente dividida entre cuatro en las direcciones de altura y ancho, que tiene un tamaño más pequeño que la forma de la unidad de predicción .

La Figura 9 es un diagrama de bloques de un aparato de codificación de imagen 900 de acuerdo con otra modalidad de ejemplo.

Con referencia a la Figura 9, el aparato de codificación de imagen 900 de acuerdo con la presente modalidad de ejemplo incluye un transformador 910, una unidad de cuantificación 920 y un codificador de entropía 930.

El transformador 910 recibe una unidad de procesamiento de imagen de un dominio de píxel y transforma la unidad de procesamiento de imagen en un dominio de frecuencia. El transformador 910 recibe una pluralidad de unidades de predicción que incluyen los valores residuales generados debido a la intra-predicción o la inter-predicción y transforma las unidades de predicción en un dominio de frecuencia. Como resultado de la transformada al dominio de frecuencia, son generados los coeficientes de los componentes de frecuencia. De acuerdo con la presente modalidad de ejemplo, la transformada para el dominio de frecuencia podría ocurrir por medio de una Transformada del coseno discreto (DCT) o la Transformada de Karhunen Loeve (KLT) y como resultado de la DCT o KLT, son generados los coeficientes del dominio de frecuencia. De aquí en adelante, la transformada para el dominio de frecuencia podría ser la DCT, sin embargo, es obvio para una persona de experiencia ordinaria en la técnica que la transformada para el dominio de frecuencia podría ser cualquier transformada que involucre la transformación de una imagen de un dominio de píxel en un dominio de frecuencia.

Asimismo, de acuerdo con la presente modalidad de ejemplo, el transformador 910 establece o ajusta una unidad de transformación agrupando una pluralidad de unidades de predicción y realiza la transformación de acuerdo con la unidad de transformación. Este proceso será descrito en detalle con referencia a las Figuras 10, 11A, 11B y 12.

La Figura 10 es un diagrama del transformador 910. Con referencia a la Figura 10, el transformador 910 incluye una unidad de selección 1010 y una unidad de realización de transformada 1020.

La unidad de selección 1010 establece o ajusta una unidad de transformación seleccionando una pluralidad de unidades adyacentes de predicción.

Un aparato de codificación de imagen de acuerdo con la técnica relacionada realiza la intra-predicción o la inter-predicción de acuerdo con un bloque que tiene un tamaño predeterminado, es decir, de acuerdo con una unidad de predicción y realiza la DCT en función de un tamaño que es menor que o igual al tamaño de la unidad de predicción. En otras palabras, el aparato de codificación de imagen de acuerdo con la técnica relacionada realiza la DCT utilizando las unidades de transformación que son menores o iguales a la unidad de predicción.

Sin embargo, debido a la pluralidad de piezas de la información de encabezado agregadas a las unidades de transformación, los encabezados agregados son incrementados a medida que son disminuidas las unidades de transformación, de manera que la relación de compresión de una operación de codificación de imagen se deteriora. Con el propósito de resolver este problema, el aparato de codificación de imagen 900 de acuerdo con la presente modalidad de ejemplo agrupa una pluralidad de unidades adyacentes de predicción en una unidad de transformación y realiza la transformación de acuerdo con la unidad de transformación que es generada por el agrupamiento . Existe una alta posibilidad que las unidades adyacentes de predicción pudieran incluir valores similares residuales, de modo que si las unidades adyacentes de predicción son agrupadas en una unidad de transformación y posteriormente, la transformación es realizada en las mismas, la relación de compresión de una operación de codificación podría ser altamente incrementada.

Para este incremento, la unidad de selección 1010 selecciona las unidades adyacentes de predicción para que sean agrupadas en una unidad de transformación. Este proceso será descrito en detalle con referencia a las Figuras 11A-11C y 12.

Las Figuras 11A-11C ilustran los tipos de una unidad de transformación de acuerdo con otra modalidad de ejemplo.

Con referencia a las Figuras 11A-11C, una unidad de predicción 1120 con respecto a una unidad de codificación 1110 podría tener una forma de división obtenida al dividir en dos el ancho de la unidad de codificación 1110. La unidad de codificación 1110 podría ser una unidad de codificación máxima, o podría ser una unidad de sub-codificación que tiene un tamaño más pequeño que la unidad de codificación máxima.

Como es ilustrado en la Figura 11A, el tamaño de la unidad de transformación 1130 podría ser menor que la unidad de predicción 1120, o como es ilustrado en la Figura 11B, el tamaño de la unidad de transformación 1140 podría ser igual a la unidad de predicción 1120. Asimismo, como es ilustrado en la Figura 11C, el tamaño de la unidad de transformación 1150 podría ser más grande que la unidad de predicción 1120. Es decir, las unidades de transformación 1130-1150 podrían ser establecidas o ajustadas mientras no se tenga conexión con la unidad de predicción 1120.

Asimismo, la Figura 11C ilustra un ejemplo en el cual la unidad de predicción 1120 es ajustada agrupando una pluralidad de las unidades de predicción 1120 incluidas en la unidad de codificación 1110. Sin embargo, una unidad de transformación podría ser ajustada para que sea más grande que una unidad de codificación en un modo en el que una pluralidad de las unidades de predicción, las cuales son incluidas no en una unidad de codificación sino en una pluralidad de las unidades de codificación, es ajustada como una unidad de transformación. En otras palabras, como es descrito con referencia a las Figuras 11A-11C, una unidad de transformación podría ser ajustada para que sea igual o menor que el tamaño de una unidad de codificación, o para que sea más grande que el tamaño de la unidad de codificación. Es decir, la unidad de transformación podría ser ajustada mientras no tenga conexión con la unidad de predicción y la unidad de codificación.

Aunque las Figuras 11A-11C ilustran ejemplos en los cuales la unidad de transformación tiene una forma cuadrada. Sin embargo, de acuerdo con un método de agrupamiento de las unidades adyacentes de predicción, la unidad de transformación podría tener una forma rectangular. Por ejemplo, en un caso en donde la unidad de predicción no es ajustada para tener formas rectangulares como es ilustrado en las Figuras 11A-11C aunque es establecida o ajustada para tener cuatro formas de cuadro obtenidas al colocar en cuadros la unidad de codificación 1110, las unidades superiores e inferiores de predicción, o las unidades izquierdas y derechas de predicción son agrupadas, de modo que la unidad de transformación podría tener una forma rectangular cuyo lado horizontal o lado vertical es largo.

Con referencia de regreso a la Figura 10, no existe límite en un criterio por medio del cual la unidad de selección 1010 selecciona las unidades adyacentes de predicción. Sin embargo, de acuerdo con la modalidad de ejemplo, la unidad de selección 1010 podría seleccionar la unidad de transformación de acuerdo con una profundidad. Como es descrito con anterioridad, la profundidad indica el nivel de reducción de tamaño que es gradualmente realizado de una unidad de codificación máxima de una rebanada actual o una imagen actual a una unidad de sub-codificación . Como se describe con anterioridad con referencia a las Figuras 3 y 6, a medida que es incrementada la profundidad, es disminuido el tamaño de una unidad de sub-codificación y de esta manera, la unidad de predicción incluida en la unidad de sub-codificación también es disminuida. En este caso, si la transformación es realizada de acuerdo con una unidad de transformación que es menor o igual a la unidad de predicción, la relación de compresión de una operación de codificación de imagen se deteriora debido a que la información de encabezado es agregada a cada unidad de transformación .

De esta manera, con respecto a una unidad de sub-codificación en una profundidad de un valor predeterminado, es preferible, aunque no es necesario, que las unidades de predicción incluidas en la unidad de sub-codificación sean agrupadas y establecidas como una unidad de transformación y posteriormente, la transformación es realizada en las mismas. Para esto, la unidad de selección 1010 ajusta la unidad de transformación en función de la profundidad de la unidad de sub-codificación. Por ejemplo, en el caso en donde una profundidad de la unidad de codificación 1110 en la Figura 11C es más grande que k, la unidad de selección 1010 agrupa las unidades de predicción 1120 y las ajusta como una unidad de transformación 1150.

Asimismo, de acuerdo con otra modalidad de ejemplo, la unidad de selección 1010 podría agrupar una pluralidad de unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con el mismo modo de predicción y podría ajustarías o establecerlas como una unidad de transformación. La unidad de selección 1010 agrupa las unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con la intra-predicción o la inter-predicción y posteriormente, las ajusta como una unidad de transformación. Debido a que existe una alta posibilidad que las unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con el mismo modo de predicción incluyan valores similares residuales, es posible agrupar las unidades adyacentes de predicción en la unidad de transformación y posteriormente, realizar la transformación en las unidades adyacentes de predicción.

Cuando la unidad de selección 1010 ajusta la unidad de transformación, la unidad de realización de transformada 1020 transforma las unidades adyacentes de predicción en el dominio de frecuencia, de acuerdo con la unidad de transformación. La unidad de realización de transformada 1020 realiza la DCT en las unidades adyacentes de predicción de acuerdo con la unidad de transformación y genera los coeficientes de coseno discreto.

Con referencia de regreso a la Figura 9, la unidad de cuantificación 920 cuantifica los coeficientes de componente de frecuencia generados por el transformador 910, por ejemplo, los coeficientes de coseno discreto. La unidad de cuantificación 920 podría cuantificar los coeficientes de coseno discreto que son entrados de acuerdo con una etapa predeterminada de cuantificación.

El codificador de entropía 930 realiza la codificación por entropía en los coeficientes de componente de frecuencia que son cuantificados por la unidad de cuantificación 920. El codificador de entropía 930 podría realizar la codificación por entropía en los coeficientes de coseno discreto utilizando la codificación aritmética de variable adaptiva de contexto (CABAC) o la codificación de longitud variable adaptiva de contexto (CAVLC) .

El aparato de codificación de imagen 900 podría determinar la unidad de transformación óptima al realizar, en forma repetida, la DCT, la cuantificación y la codificación por entropía en las diferentes unidades de transformación. Un procedimiento para la selección de las unidades adyacentes de predicción podría ser repetido para determinar la unidad de transformación óptima. La unidad de transformación óptima podría ser determinada en consideración de un cálculo de costo RD y esto será descrito en detalle con referencia a la Figura 12.

La Figura 12 ilustra diferentes unidades de transformación de acuerdo con otra modalidad de ejemplo.

Con referencia a la Figura 12, el aparato de codificación de imagen 900 realiza en forma repetida una operación de codificación en las diferentes unidades de transformación .

Como es ilustrado en la Figura 12, una unidad de codificación 1210 podría ser prevista y codificada en función de una unidad de predicción 1220 que tiene un tamaño más pequeño que la unidad de codificación 1210. La transformación es realizada en los valores residuales que son generados por el resultado de la predicción y aquí, como es ilustrado en la Figura 12, la DCT podría ser realizada en los valores residuales en función de las diferentes unidades de transformación .

Una primera unidad de transformación ilustrada 1230 tiene el mismo tamaño que la unidad de codificación 1210 y tiene un tamaño obtenido por el agrupamiento dé todas las unidades de predicción incluidas en la unidad de codificación 1210.

Una segunda unidad de transformación ilustrada 1240 tiene tamaños obtenidos al dividir en dos el ancho de la unidad de codificación 1210 y los tamaños son obtenidos al agrupar cada una de las dos unidades de predicción adyacentes entre sí en la dirección vertical, de manera respectiva.

Una tercera unidad de transformación ilustrada 1250 tiene tamaños obtenidos al dividir en dos la altura de la unidad de codificación 1210 y los tamaños son obtenidos al agrupar cada una de las dos unidades de predicción adyacentes entre sí en la dirección horizontal, de manera respectiva.

Una cuarta unidad de transformación ilustrada 1260 es utilizada cuando la transformación es realizada en función ' de la cuarta unidad de transformación ilustrada 1260 que tiene el mismo tamaño que la unidad de predicción 1220.

La Figura 13 es un diagrama de bloques de un aparato de decodificación de imagen 1300 de acuerdo con otra modalidad de ejemplo.

Con referencia a la Figura 13, el aparato de decodificación de imagen 1300 de acuerdo con la presente modalidad de ejemplo incluye un decodificador de entropía 1310, una unidad de cuantificación inversa 1320 y un transformador inverso 1330.

El decodificador de entropía 1310 realiza la decodificación por entropía en los coeficientes de componente de frecuencia con respecto a una unidad predeterminada de transformación. Como se describe con anterioridad con referencia a las Figuras 11A-11C y 12, la unidad predeterminada de transformación podría ser una unidad de transformación generada por el agrupamiento de una pluralidad de unidades adyacentes de predicción.

Como se describe con anterioridad con referencia al aparato de codificación de imagen 900, la unidad de transformación podría ser generada agrupando las unidades adyacentes de predicción de acuerdo con una profundidad, o podría ser generada agrupando una pluralidad de unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con el mismo modo de predicción, es decir, de acuerdo con un modo de intra-predicción o un modo de inter-predicción.

La pluralidad de las unidades de predicción no podría ser incluida en una unidad de codificación sino que podría ser incluida en una pluralidad de las unidades de codificación. En otras palabras, como se describe con anterioridad con referencia a las Figuras 11A-11C, la unidad de transformación que es decodificada por entropía por el decodificador de entropía 1310 podría ser ajustada para que sea igual o menor que el tamaño de la unidad de codificación, o que sea más grande que el tamaño de la unidad de codificación .

Asimismo, como se describe con anterioridad con referencia a la Figura 12, la unidad de transformación podría ser una unidad de transformación óptima seleccionada mediante la repetición de un procedimiento para el agrupamiento de una pluralidad de unidades adyacentes de predicción y mediante la realización, en forma repetida, de la transformación, cuantificación y decodificación por entropía en las diferentes unidades de transformación.

La unidad de cuantificación inversa 1320 realiza la cuantificación inversa de los coeficientes de componente de frecuencia que son decodificados por entropía por el decodificador de entropía 1310.

La unidad de cuantificación inversa 1320 realiza la cuantificación inversa de los coeficientes de componente de frecuencia decodificados por entropía de acuerdo con una etapa de cuantificación que es. utilizada en la codificación de la unidad de transformación.

El transformador inverso 1330 realiza la transformada inversa de los coeficientes de componente de frecuencia cuantificados inversos en un dominio de píxel . El transformador inverso podría realizar la DCT- inversa en los coeficientes de coseno discreto cuantificados inversos (es decir, los coeficientes de componente de frecuencia cuantificados inversos) y posteriormente, podría reconstruir una unidad de transformación del dominio de píxel. La unidad de transformación reconstruida podría incluir las unidades adyacentes de predicción.

La Figura 14 es un diagrama de flujo de un método de codificación de imagen, de acuerdo con una modalidad de ejemplo.

Con referencia a la Figura 14, en la operación 1410, un aparato de codificación de imagen ajusta una unidad de transformación seleccionando una pluralidad de unidades adyacentes de predicción. El aparato de codificación de imagen podría seleccionar una pluralidad de unidades adyacentes de predicción de acuerdo con una profundidad, o podría seleccionar una pluralidad de unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con el mismo modo de predicción.

En la operación 1420, el aparato de codificación de imagen transforma las unidades adyacentes de predicción en un dominio de frecuencia de acuerdo con la unidad de transformación ajustada en la operación 1420. El aparato de codificación de imagen agrupa las unidades adyacentes de predicción, después, realiza una DCT en las unidades adyacentes de predicción y posteriormente, genera los coeficientes de coseno discreto.

En la operación 1430, el aparato de codificación de imagen cuantifica los coeficientes de componente de frecuencia, generados en la operación 1420, de acuerdo con la etapa de cuantificación .

En la operación 1440, el aparato de codificación de imagen realiza la codificación por entropía en los coeficientes de componente de frecuencia cuantificados en la operación 1430. El aparato de codificación de imagen realiza la codificación por entropía en los coeficientes de coseno discreto utilizando CABAC o CAVLC .

Un método de codificación de imagen de acuerdo con otra modalidad de ejemplo además podría incluir la operación de ajuste de una unidad de transformación óptima al realizar, en forma repetida, las operaciones 1410-1440 en diferentes unidades de transformación. Es decir, al realizar, en forma repetida, las operaciones de transformación, cuantificación y codificación por entropía en las diferentes unidades de transformación como es ilustrado en la Figura 12, es posible ajustar la unidad de transformación óptima.

La Figura 15 es un diagrama de flujo de un método de decodificación de imagen, de acuerdo con otra modalidad de ej emplo .

Con referencia a la Figura 15, en la operación 1510, un aparato de decodificación de imagen realiza la decodificación por entropía en los coeficientes de componente de frecuencia con respecto a una unidad de transformación predeterminada. Los coeficientes de componente de frecuencia podrían ser los coeficientes de coseno discreto.

En la operación 1520, el aparato de decodificación de imagen realiza la cuantificación inversa de los coeficientes de componente de frecuencia que son decodificados por entropía en la operación 1510. El aparato de decodificación de imagen realiza la cuantificación inversa de los coeficientes de coseno discreto utilizando la etapa de cuantificación utilizada en la operación de codificación.

En la operación 1530, el aparato de decodificación de imagen realiza la transformada inversa de los coeficientes de componente de frecuencia, los cuales han sido cuantificados inversos en la operación 1520, en un dominio de píxel y posteriormente, reconstruye la unidad de transformación. La unidad de transformación reconstruida es ajustada agrupando una pluralidad de unidades adyacentes de predicción. Como es descrito con anterioridad, la unidad de transformación podría ser ajustada agrupando las unidades adyacentes de predicción de acuerdo con una profundidad, o podría ser ajustada agrupando una pluralidad de unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con el mismo modo de predicción.

De acuerdo con una o más de las modalidades de ejemplo, es posible ajustar la unidad de transformación de modo que sea más grande que la unidad de predicción y realizar la DCT, de modo que una imagen podría ser comprimida y codificada, de manera eficiente.

Las modalidades de ejemplo también pueden ser incluidas como códigos susceptibles de ser leídos en computadora en un medio de grabación susceptible de ser leído en computadora. El medio de grabación susceptible de ser leído en computadora es cualquier dispositivo de almacenamiento de datos que pueda almacenar datos, los cuales pueden ser posteriormente leídos por un sistema de computadora. Los ejemplos del medio de grabación susceptible de ser leído en computadora incluyen una memoria sólo de lectura (ROM) , una memoria de acceso aleatorio (RAM) , CD-ROMs, cintas magnéticas, discos flexibles y dispositivos ópticos de almacenamiento de datos. El medio de grabación susceptible de ser leído en computadora también puede ser distribuido a través de sistemas de computadora acoplados por red, de modo que el código susceptible de ser leído en computadora es almacenado y ejecutado en un modo distribuido.

Por ejemplo, cada uno del aparato de codificación de imagen, el aparato de decodificación de imagen, el codificador de imagen y el decodificador de imagen de acuerdo con una o más de las modalidades, podría incluir un bus acoplado con cada unidad en un aparato como es ilustrado en las Figuras 1-2, 4-5, 9-10, y 14 y al menos un procesador acoplado con el bus. Asimismo, cada uno del aparato de codificación de imagen, el aparato de decodificación de imagen, el codificador de imagen y el decodificador de imagen de acuerdo con una o más de las modalidades, podría incluir una memoria acoplada por lo menos con un procesador que es acoplado con el bus para así almacenar comandos, los mensajes recibidos o los mensajes generados y para ejecutar los comandos .

Mientras que esta invención ha sido particularmente mostrada y descrita con referencia a las modalidades de ejemplo de la misma, se entenderá por aquellas personas de experiencia ordinaria en la técnica que podrían realizarse varios cambios en la forma y los detalles en la misma sin apartarse del espíritu y alcance de la invención como es definido por las reivindicaciones adjuntas. Las modalidades de ejemplo tienen que ser consideradas sólo en un sentido descriptivo y no con propósitos de limitación. Por lo tanto, el alcance de la invención es definido no por la descripción detallada de la invención sino por las reivindicaciones adjuntas y todas las diferencias dentro del alcance serán interpretadas como incluidas en la presente invención.

Se hace constar que con relación a esta fecha el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones:

1. Un método de codificación de imagen, caracterizado porque comprende ajustar una unidad de transformación seleccionando una pluralidad de unidades adyacentes de predicción; transformar la unidad de transformación en un dominio de frecuencia y generar los coeficientes de componente de frecuencia; cuantificar los coeficientes de componente de frecuencia; y codificar por entropía los coeficientes cuantificados de componente de frecuencia.

2. El método de codificación de imagen de conformidad con la reivindicación 1, caracterizado porque el ajuste de la unidad de transformación es realizado en función de la profundidad que indica el nivel de reducción de tamaño que es gradualmente realizado de una unidad de codificación máxima de una rebanada actual o una imagen actual a una unidad de sub-codificación que comprende la pluralidad de unidades adyacentes de predicción.

3. El método de codificación de imagen de conformidad con la reivindicación 1, caracterizado porque el ajuste de la unidad de transformación es realizado seleccionando la pluralidad de unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con un mismo modo de predicción.

4. El método de codificación de imagen de conformidad con la reivindicación 3, caracterizado porque el mismo modo de predicción es un modo de inter-predicción o un modo de intra-predicción .

5. El método de codificación de imagen de conformidad con la reivindicación 1, caracterizado porque además comprende el ajuste de una unidad de transformación óptima realizando en forma repetida el ajuste, la transformación, la cuantificación y la codificación por entropía en las diferentes unidades de transformación.

6. Un aparato de codificación de imagen, caracterizado porque comprende: un transformador que ajusta una unidad de transformación seleccionando una pluralidad de unidades adyacentes de predicción, transforma la unidad de transformación en un dominio de frecuencia y genera los coeficientes de componente de frecuencia; una unidad de cuantificación que cuantifica los coeficientes de componente de frecuencia; y un codificador de entropía que codifica por entropía los coeficientes cuantificados de componente de frecuencia.

7. Un método de decodificación de imagen, caracterizado porque comprende: decodificar por entropía los coeficientes de componente de frecuencia que son generados al ser transformados en un dominio de frecuencia de acuerdo con una unidad de transformación; realizar la cuantificación inversa de los coeficientes de componente de frecuencia decodificados por entropía; realizar la transformación inversa de los coeficientes de componente de frecuencia cuantificados inversos en un dominio de píxel; y reconstruir una pluralidad de unidades adyacentes de predicción en la unidad de transformación.

8. El método de decodificación de imagen de conformidad con la reivindicación 7, caracterizado porque la unidad de transformación es ajustada en función de la profundidad que indica el nivel de reducción de tamaño que es gradualmente realizado de una unidad de codificación máxima de una rebanada actual o una imagen actual a una unidad de sub-codificación que comprende la pluralidad de unidades adyacentes de predicción.

9. El método de decodificación de imagen de conformidad con la reivindicación 7, caracterizado porque la unidad de transformación es ajustada seleccionando la pluralidad de unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con un mismo modo de predicción.

10. El método de decodificación de imagen de conformidad con la reivindicación 9, caracterizado porque el mismo modo de predicción es un modo de inter-predicción o un modo de intra-predicción .

11. Un aparato de decodificación de imagen, caracterizado porque comprende: un decodificador de entropía que decodifica por entropía los coeficientes de componente de frecuencia que son generados al ser transformados en un dominio de frecuencia de acuerdo con una unidad de transformación; una unidad de cuantificación inversa que realiza la cuantificación inversa de los coeficientes de componente de frecuencia; y un transformador inverso que realiza la transformación inversa de los coeficientes de componente de frecuencia en un dominio de píxel y reconstruye una pluralidad de unidades adyacentes de predicción en la unidad de transformación.

12. El aparato de decodificación de imagen de conformidad con la reivindicación 11, caracterizado porque la unidad de transformación es ajustada en función de la profundidad que indica el nivel de reducción de tamaño que es gradualmente realizado de una unidad de codificación máxima de una rebanada actual o una imagen actual a una unidad de sub-codificación que comprende la pluralidad de unidades adyacentes de predicción.

13. El aparato de decodificación de imagen de conformidad con la reivindicación 11, caracterizado porque la unidad de transformación es ajustada seleccionando la pluralidad de unidades adyacentes de predicción en las cuales es realizada la predicción de acuerdo con un mismo modo de predicción.

14. El medio de grabación susceptible de ser leído en computadora, caracterizado porque tiene grabado en el mismo un programa para la ejecución del método de conformidad con la reivindicación 1.

15. El medio de grabación susceptible de ser leído en computadora, caracterizado porque tiene grabado en el mismo un programa para la ejecución del método de conformidad con la reivindicación 7.