MX2008012360A

MX2008012360A - Metodo de asignar prioridad para controlar la velocidad binaria de un flujo de bits, metodo para controlar la velocidad binaria de un flujo de bits, metodo de decodificacion de video y aparato que usa el mismo.

Info

Publication number: MX2008012360A
Application number: MX2008012360A
Authority: MX
Inventors: Manu Mathew; Kyo-Hyuk Lee; Woo-Jin Han
Original assignee: Samsung Electronics Co Ltd
Priority date: 2006-03-27
Filing date: 2007-03-27
Publication date: 2008-10-09
Also published as: CN101411194A; CN101411194B; JP2009531941A; JP5063678B2

Abstract

Se describe un método para asignar una prioridad para controlar una velocidad binaria de un flujo de bits que tiene una pluralidad de capas de calidad. El método incluye componer primeras capas de calidad para una imagen de referencia, componer segundas capas de calidad para una imagen actual que sea codificada con referencia a la imagen de referencia, y asignar una prioridad a cada una de las primera y segunda capas de calidad, en donde una baja prioridad se asigna a una capa de calidad que tiene una pequeña influencia en una reducción de calidad de video de la imagen actual cuando la capa de calidad es truncada.

Description

METODO DE ASIGNAR PRIORIDAD PARA CONTROLAR LA VELOCIDAD BINARIA DE UN FLUJO DE BITS, METODO PARA CONTROLAR LA VELOCIDAD BINARIA DE UN FLUJO DE BITS, METODO DE DECODIFICACION DE VIDEO Y APARATO QUE USA EL MISMO CAMPO DE LA INVENCION La presente invención se refiere a una tecnología de codificación de video, y más particularmente, a un método para controlar una velocidad binaria de un flujo de bits compuesto de una pluralidad de capas de calidad.

ANTECEDENTES DE LA INVENCION Con el desarrollo de las tecnologías de información y comunicación, las comunicaciones de multimedia se están incrementando además de las comunicaciones de texto y voz. Los sistemas de comunicación a base de texto existentes son insuficientes para satisfacer las diversas necesidades de los clientes, y de esta manera los servicios de multimedia que pueden recibir diversas formas de información, tales como texto, imagen, música y otros, se están incrementando. Ya que los datos de multimedia son grandes, medios de almacenamiento en masa y amplios anchos de banda se requieren respectivamente para almacenarlos y transmitirlos. En consecuencia, se requieren técnicas de codificación por compresión para transmitir los datos de multimedia.

REF. : 196414 El principio básico de compresión de datos es eliminar la redundancia de datos. Los datos pueden ser comprimidos al eliminar la redundancia espacial tal como una repetición del mismo color u objeto en imágenes, redundancia temporal tal como cuadros adyacentes similares en imágenes en movimiento o repetición continua de sonidos, y redundancia visual/perceptual que considera la insensibilidad humana a altas frecuencias. En un método de codificación de video general, la redundancia temporal se elimina por filtración temporal con base en compensación de movimiento y la redundancia espacial se elimina por una transformación espacial . Para transmitir datos de multimedia después de que se elimina la redundancia de datos, se requieren medios de transmisión, los rendimientos de los cuales difieren. Los medios de transmisión actualmente usados tienen diversas velocidades de transmisión. Por ejemplo, una red de comunicación de ultra-alta velocidad puede transmitir varias décimas de megabits de datos por segundo y una red de comunicación móvil tiene una velocidad de transmisión de 384 kilobits por segundo. Para soportar los medios de transmisión en este ambiente de transmisión, y para transmitir multimedia con una velocidad de transmisión adecuada para el ambiente de transmisión, es muy adecuado un método de codificación de video escalable.

El método de codificación de video escalable es un método de codificación que puede ajusfar una resolución de video, una velocidad de cuadros y una relación señal a ruido (SNR), es decir, un método de codificación que soporta diversas escalabilidades al truncar una parte de un flujo de bits comprimido de acuerdo con condiciones periféricas tales como una velocidad binaria de transmisión, un tasa de errores de transmisión y recursos del sistema. En la norma de codificación de video escalable (SVC) actual, creada por el Equipo de Video Conjunto ( JVT) , el cual es un grupo de trabajo conjunto del Grupo de Expertos en Imágenes en Movimiento (MPEG) y el Sindicato Internacional de Telecomunicaciones (ITU), se basa en H.264. La norma SVC contiene tecnología de escalabilidad de granularidad fina (FGS) para soportar escalabilidad SNR. La figura 1 muestra un ejemplo de un decodificador de video escalable que utiliza una estructura de capas múltiples. En referencia a la figura 1, una primera capa tiene una resolución de Formato Intermedio Común de Cuarto (QCIF) y una velocidad de cuadros de 15 Hz, una segunda capa tiene una resolución de Formato Intermedio Común (CIF) y una velocidad de cuadros de 30 Hz, y una tercera capa tiene una resolución de Definición Estándar (SD) y una velocidad de cuadros de 60 Hz. Una correlación de capas puede usarse para codificar cuadros de video de capas múltiples que tengan varias resoluciones y/o velocidades de cuadros. Por ejemplo, un área 12 de un primer cuadro de capa de mejora es codificada eficientemente a través de una predicción de un área 13, que corresponde al área 12, de un cuadro de capa base. Un área 11 de un segundo cuadro de capa de mejora puede codificarse eficientemente a través de una predicción usando el área 12. La figura 2 es un diagrama esquemático para explicar la inter predicción y predicción intra-base de un método de codificación de video escalable. Un bloque 24 en un cuadro de capa actual 21 puede ser predicho con referencia a un bloque 25 en otro cuadro de capa actual 22, lo cual es llamado inter predicción. La inter predicción incluye cálculo de movimiento para obtener un vector de movimiento que muestre un bloque correspondiente. El bloque 24 puede ser predicho con referencia a un bloque 26 en el cuadro de capa baja (capa base) 23 que se ubica en la misma posición temporal y conteo de orden de imágenes (POC) que el cuadro 21, lo cual es llamado predicción intra-base. En la predicción intra-base, no se requiere el cálculo de movimiento. La figura 3 ilustra un ejemplo de aplicar FGS a una imagen residual a través de la predicción de la figura 2. La imagen residual 30 puede ser representada como una pluralidad de capas de calidad para soportar la escalabilidad SNR. Estas capas de calidad se requieren para expresar diversamente una calidad de video, lo cual es diferente de la capa para resoluciones y/o velocidades de cuadros. La pluralidad de capas de calidad puede consistir en una capa individual 31 y al menos una de las capas FGS 32, 33 y 34. La calidad de video medida en el decodificador de video es la más baja cuando únicamente una sola capa 31 es recibida, seguida por cuando la capa individual 31 y una primera capa FGS 32 son recibidas, cuando la capa individual 31 y la primera y una segunda capas FGS 32 y 33, y cuando todas las capas 31, 32, 33 y 34 son recibidas. La figura 4 ilustra un proceso para expresar una sola imagen o segmento como una capa individual y dos capas FGS. Una imagen (o segmento) original 41 se cuantifica por un primer parámetro de cuantificación QPX (SI) . La imagen cuantificada 42 forma una capa individual. La imagen cuantificada 42 es cuantificada inversamente (S2) y provista a un sustractor 44. El sustractor 44 sustrae la imagen 43 provista de la imagen original 41 (S3). El resultado de la sustracción se cuantifica de nuevo usando un segundo parámetro de cuantificación QP2 (S4). El resultado cuantificado 45 forma la primera capa FGS. El resultado cuantificado 45 es cuantificado inversamente (S5), y provisto a un sumador 47. La imagen 46 proporcionada y la imagen 43 proporcionada se suman por el sumador 47 (S6), y se proporcionan a un sustractor 48. El sustractor 48 sustrae el resultado sumado de la imagen original 41 (S7) . El resultado sustraído se cuantifica de nuevo usando un tercer parámetro de cua n t i f i ca c i ón QP3 (S8) . El resultado cuantificado 49 forma la segunda capa FGS. A través de las operaciones anteriores, se puede formar la pluralidad de capas de calidad como se ilustra en la figura 3. Las figuras 5 y 6 ilustran el método de truncamiento de capa de calidad usado en la norma SVC actual. Como se ilustra en la figura 5, una imagen actual 30 es expresada como una imagen residual al ser predicha a partir de una imagen de referencia 35 a través de la ínter predicción o la predicción intra-base. La imagen actual 30 expresada como la imagen residual consiste en una pluralidad de capas de calidad 31, 32, 33 y 34. La imagen de referencia 35 consiste también en una pluralidad de capas de calidad 36, 37, 38 y 39.

BREVE DESCRIPCION DE LA INVENCION De acuerdo con la norma SVC actual, un extractor de flujo de bits trunca una parte de capas de calidad para de esta manera controlar flujos de bits SNR como se ilustra en la figura 6. Es decir, el extractor de flujos de bits trunca las capas de calidad de la imagen actual 30 que se ubica en la capa de velocidad de cuadros y/o alta resolución (en adelante referida como 'capa' para distinguirla de la 'capa de calidad') desde la más alta y hacia abajo. Después de que todas las capas de calidad de la imagen actual 30 son truncadas, las capas de calidad de la imagen de referencia 35 se truncan desde la más alta y hacia abajo. El truncamiento anterior es mejor para reconstruir una imagen (imagen de referencia) de una capa más baja (por ejemplo, QCIF) , pero no es mejor para reconstruir una imagen (imagen actual) de una capa alta (por ejemplo, CIF) . Las capas de calidad de algunas imágenes de capa baja pueden ser menos importantes que aquellas de imágenes de capa alta. En consecuencia, se requiere que una e s c a 1 ab i 1 i da d SNR eficiente pueda incorporarse al truncar capas de calidad de acuerdo con si un codificador de video se enfoca principalmente en una imagen de alta capa o una imagen de capa baja. La presente invención proporciona un método y aparato para controlar la SNR de un flujo de bits que se enfoca en capas altas. La presente invención proporciona también un método y aparato para controlar la SNR de acuerdo con si un codificador de video se enfoca principalmente en una imagen de capa alta o una imagen de capa baja. De acuerdo con un aspecto de la presente invención, se proporciona un método para asignar una prioridad para controlar una velocidad binaria de un flujo de bits, el método incluye componer primeras capas de calidad para una imagen de referencia, componer segundas capas de calidad para una imagen actual que sea codificada con referencia a la imagen de referencia y asignar una prioridad a cada una de las primera y segunda capas de calidad, en donde una baja prioridad se asigna a una capa de calidad que tiene una pequeña influencia en una reducción de calidad de video de la imagen actual cuando la capa de calidad es truncada. De acuerdo con otro aspecto de la presente invención, se proporciona un método para controlar una velocidad binaria de un flujo de bits, el método incluye recibir un flujo de bits de video, fijar una velocidad binaria objetivo para el flujo de bits de video, leer primeras capas de calidad para una imagen de referencia y segundas capas de calidad para una imagen actual, y truncar de una capa de calidad que tenga una baja prioridad y hacia arriba, entre las primera y segunda capas de calidad con base en la velocidad binaria objetivo. De acuerdo con otro aspecto de la presente invención, se proporciona un método de decodificación de video que incluye recibir un flujo de bits de video; leer primeras capas de calidad para una imagen de referencia, segundas capas de calidad para una imagen actual e IDs de dependencia de las primeras y las segundas capas de calidad; ajustar el ID de dependencia como indicando la capa de calidad más alta de las primeras capas de calidad, si no hay una capa de calidad indicada por el ID de dependencia entre las primeras capas de calidad; y reconstruir la imagen actual de acuerdo con una relación indicada por el ID de dependencia . De acuerdo con otro aspecto de la presente invención, se proporciona un aparato para asignar una prioridad para controlar una velocidad binaria de un flujo de bits, el aparato incluye un codificador de imágenes de referencia que compone primeras capas de calidad para una imagen de referencia, un codificador de imagen actual que compone segundas capas de calidad para una imagen actual que es codificada con referencia a la imagen de referencia y un asignador de nivel de calidad que asigna una prioridad a cada una de las primera y segundas capas de calidad, en donde una baja prioridad se asigna a una capa de calidad que tiene una pequeña influencia en una reducción de calidad de video de la imagen actual cuando la capa de calidad es truncada. De acuerdo con otro aspecto de la presente invención, se proporciona un aparato para controlar una velocidad binaria de un flujo de bits, el aparato incluye una unidad de entrada de flujo de bits que recibe un flujo de bits de video, una unidad de ajuste de velocidad binaria objetivo que ajusta una velocidad binaria objetivo para el flujo de bits de video, un analizador de flujo de bits que lee primeras capas de calidad para una imagen de referencia y segundas capas de calidad para una imagen actual, y un truncador de flujo de bits que trunca de una capa de calidad que tiene una baja prioridad y hacia arriba, entre las primera y segunda capas de calidad con base en la velocidad binaria objetivo. De acuerdo con otro aspecto de la presente invención, se proporciona un aparato de decodificación de video que incluye una unidad de decodificación por entropía que recibe un flujo de bits de video, un analizador de flujos de bits que lee primeras capas de calidad para una imagen de referencia, segundas capas de calidad para una imagen actual e IDs de dependencia de las primera y segunda capas de calidad, una unidad de ajuste de ID de dependencia que ajusta el ID de dependencia como indicando la capa de calidad más alta de las primeras capas de calidad, si no hay una capa de calidad indicada por el ID de dependencia entre las primeras capas de calidad, y un decodificador de imagen actual que reconstruye la imagen actual de acuerdo con una relación indicada por el ID de dependencia.

BREVE DESCRIPCION DE LAS FIGURAS Los anteriores y otros aspectos de la presente invención se harán aparentes al describir en detalle modalidades ejemplares de la misma con referencia a las figuras anexas, en las cuales: La figura 1 ilustra un ejemplo de un método de codificación de video escalable usando una estructura de capas múltiples. La figura 2 es un diagrama esquemático para explicar la ínter predicción y predicción intra-base de un método de codificación de video escalable. La figura 3 ilustra un ejemplo de aplicar FGS a una imagen residual a través de la predicción de la figura 2. La figura 4 ilustra un proceso para expresar una sola imagen o segmento como una capa individual y dos capas FGS . Las figuras 5 y 6 ilustran un método de truncamiento de capas de calidad usado en una norma SVC actual . La figura 7 ilustra una configuración de un sistema SVC actual. La figura 8 ilustra una configuración de un sistema SVC de acuerdo con una modalidad ejemplar de la presente invención . La figura 9 ilustra un ejemplo de truncar una capa de calidad de acuerdo con una modalidad ejemplar de la presente invención. La figura 10 ilustra un flujo de bits al que se le asigna un ID de prioridad de acuerdo con una modalidad ejemplar de la presente invención. La figura 11 ilustra un caso en el que una capa de calidad indicada por un ID de dependencia no existe en una imagen de referencia, de acuerdo con una modalidad ejemplar de la presente invención. La figura 12 es un diagrama de bloques que muestra una configuración de un aparato de asignación de prioridad de acuerdo con una modalidad ejemplar de la presente invención. La figura 13 es un diagrama de bloques que muestra una configuración de un extractor de flujo de bits de acuerdo con una modalidad ejemplar de la presente invención y La figura 14 es un diagrama de bloques que muestra una configuración de un decodificador de video de acuerdo con una modalidad ejemplar de la presente invención.

DESCRIPCION DETALLADA DE LA INVENCION Las ventajas y características de los aspectos de la presente invención y métodos para lograr los mismos pueden entenderse más fácilmente al hacer referencia a la siguiente descripción detallada de modalidades ejemplares y las figuras acompañantes . Los aspectos de la presente invención pueden, no obstante, incorporarse en muchas formas diferentes y no se deben considerar como estando limitados a las modalidades mostradas en la presente. En lugar de ello, estas modalidades se proporcionan de tal manera que esta descripción sea detallada y completa y transmita completamente el concepto de la invención a aquellos capacitados en la técnica, y la presente invención sólo será definida por las reivindicaciones anexas. La figura 7 ilustra una configuración de un sistema SVC actual. La figura 8 ilustra una configuración de un sistema SVC de acuerdo con una modalidad ejemplar de la presente invención. En referencia a la figura 7, un codificador de video 61 genera un flujo de bits escalable de capas múltiple, por ejemplo, un flujo de bits CIF. Un extractor de flujos de bits 62 puede transmitir el flujo de bits CIF generado a un primer decodificador de video 63 como tal, o puede extraer un flujo de bits QCIF que tenga una baja resolución al truncar parte de capas superiores, y transmitir el flujo de bits QCIF a un segundo decodificador de video 64. En los dos casos anteriores, el extractor de flujos de bits 62 puede hacer la resolución de los flujos de bits la misma y cambiar sólo su SNR. En referencia a la figura 8, un nivel de calidad (prioridad) de un flujo de bits CIF generado en un codificador de video 50 se asigna por un asignador de nivel de calidad 100. Es decir, un ID de prioridad se asigna por una unidad de capa de abstracción de red (NAL) que compone el flujo de bits CIF, la cual sigue un método de asignación de ID de prioridad considerando capas múltiples de la modalidad ejemplar de la presente invención. Cuando se transmite un flujo de bits a un segundo decodificador de video 300b, un extractor de flujos de bits 200 trunca una capa superior y transmite el flujo de bits optimizado a QCIF (una capa más baja) . Cuando una capa de calidad es truncada para controlar la SNR, se usa el método tradicional. Cuando se transmite un flujo de bits a un primer decodificador de video 300a, sin embargo, el extractor de flujos de bits 200 transmite un flujo de bits CIF que incluye todas las capas. Cuando una capa de calidad es truncada para controlar la SNR, el extractor de flujos de bits 200 trunca capas de calidad que tienen un ID de baja prioridad y hacia arriba, con base en el ID de prioridad asignado por el asignador de nivel de calidad 100. La figura 9 ilustra un ejemplo de truncar una capa de calidad de acuerdo con una modalidad ejemplar de la presente invención. En referencia a la figura 9, el asignador de nivel de calidad 100 asigna IDs de prioridad de acuerdo con el siguiente orden y el extractor de flujos de bits 200 incorpora una escalabilidad de SNR al truncar una capa de calidad que tenga un ID de baja prioridad y hacia arriba . El asignador de nivel de calidad 100 verifica una relación de referencia en el flujo de bits ingresado. La relación de referencia se usa para una predicción que incluye ínter predicción y predicción intra-base. Para el método de predicción, una imagen a la que se esté refiriendo es una imagen actual 30, y una imagen a la que se haya referido es una imagen de referencia 35. Especialmente, la figura 9 ilustra que el número de capas de calidad de la imagen actual 30 es idéntico al de la imagen de referencia 35, el número de capas de calidad de la imagen actual 30 también puede ser diferente al de la imagen de referencia 35. Para asignar el ID de prioridad, después de comparar un primer caso, en el cual la capa de calidad más alta de la imagen actual 30 es truncada, y un segundo caso, en el cual la capa de calidad más alta de la imagen de referencia 30 es truncada, se selecciona el caso más adecuado, en términos de calidad de imagen. El primer caso significa un caso de reconstruir una imagen de una capa a la cual pertenece la imagen actual a partir de tres capas de calidad 31, 32 y 33 de la imagen actual 30 y cuatro capas de calidad 36, 37, 38 y 39 de la imagen de referencia 35. El segundo caso significa un caso de reconstruir una imagen de una capa a la cual pertenece la imagen actual a partir de cuatro capas de calidad 31, 32, 33 y 34 de la imagen actual 30 y tres capas de calidad 36, 37 y 38 de la imagen de referencia 35. Un proceso detallado para reconstruir una imagen incluye reconstruir la imagen de referencia 35 a partir de capas de calidad que compongan la imagen de referencia 35, reconstruir una señal residual de la imagen actual 30 a partir de las capas de calidad que compongan la imagen actual 30 y añadir la imagen de referencia reconstruida 35 y la señal residual reconstruida. Cuando se obtienen el primero y segundo casos, el costo de cada caso se compara. La función de distorsión de velocidad se usa generalmente como un método para cálculo de costo. La siguiente ecuación 1 muestra un proceso para calcular costo: C = E + ???. (Ecuación 1) en donde 'C es costo y ??' es la diferencia de una señal original (por ejemplo, la cual puede calcularse por error cuadrado medio (MSE) ) . ??' es la velocidad binaria consumida cuando los datos son comprimidos y ? es un multiplicador Lagrangiano. El multiplicador Lagrangiano se usa para controlar una velocidad de reflexión de E y B . C se vuelve más pequeño al reducirse E y B, lo cual significa que se llevó a cabo codificación eficiente. Cuando se selecciona un caso del cual el costo es menos del primero y el segundo casos, un ID de prioridad se asigna de acuerdo con el caso seleccionado. Si se selecciona el primer caso, un ID de prioridad más baja, es decir, ?0' se asigna a la capa de calidad 34 de la imagen actual 30 debido a que la capa de calidad 34 tiene una influencia más pequeña en una calidad de video total, cuando la capa de calidad 34 es truncada. El ID de prioridad se asigna para las capas de calidad restantes 31, 32 y 33 de la imagen actual 30, y las capas de calidad restantes 36, 37, 38 y 39 de la imagen de referencia 35, la cual es la misma que la comparación del primero y el segundo casos. Es decir, después de comparar un primer caso, en el cual la capa de calidad más alta de las capas de calidad restantes 31, 32 y 33 es truncada, y un segundo caso, en el cual la capa de calidad más alta de las capas de calidad de imagen restantes 36, 37, 38 y 39 es truncada, se selecciona el caso del cual el costo sea menos. En el proceso de seleccionar uno de un caso, en el cual la capa de calidad más alta de las capas de calidad restantes en donde un ID de prioridad no se asigna es truncada en la imagen actual 30, y un caso, en el cual la capa de calidad más alta de las capas de calidad restantes en donde un ID de prioridad no se asigna es truncada en la imagen de referencia 35, se repite, el ID de prioridad se asigna para cada capa de calidad de la imagen actual 30 y la imagen de referencia 35. El asignador de nivel de calidad 100 registra el ID de prioridad en un encabezado de la unidad NAL (encabezado NAL) que corresponde a cada capa de calidad. La figura 10 ilustra un flujo de bits 80 en el cual un ID de prioridad se asigna de acuerdo con una modalidad ejemplar de la presente invención. Las capas de calidad para la imagen actual 30 se registran como una pluralidad de unidades NAL 81, 82, 83 y 84. Las capas de calidad para la imagen de referencia 35 se registran como una pluralidad de unidades NAL 86, 87, 88 y 89. Una unidad NAL consiste en un encabezado NAL y un campo de datos NAL. El encabezado NAL incluye el ID de prioridad como una parte que indica información adicional sobre los datos NAL. Los datos de codificación que corresponden a cada capa de calidad se registran en el campo de datos NAL. En la figura 10, el ID de prioridad asignado por el asignador de nivel de calidad 100 es mostrado en el encabezado NAL. El extractor de flujo de bits 200 controla la SNR del flujo de bits con referencia al ID de prioridad. El extractor de flujo de bits 200 trunca las unidades NAL del ID de prioridad más baja y hacia arriba (es decir, en el orden de 81, 82, 86, 83, 87, 84, 88 y 89), minimizando asi una reducción de calidad de video debido a un truncamiento de las unidades' NAL. El proceso anterior se optimiza para una calidad de video de la capa superior (cuando se transmite un flujo de bits al primer decodificador de video 300a en la figura 8). Para optimizar una calidad de video de la capa más baja (cuando se transmite un flujo de bits al segundo decodificador de video 300b en la figura 8), se puede usar el método tradicional de truncar desde la capa de calidad más alta y hacia abajo, no obstante el ID de prioridad. Como se sugiere en la modalidad ejemplar de la presente invención, las capas de calidad de una capa base (a la cual pertenece la imagen de referencia) pueden ser truncadas que aquellas de una capa actual (a la cual pertenece la imagen actual) . En este caso, una capa de calidad de la capa base, indicada por un ID de dependencia de una capa de calidad de la capa actual podría no existir. El ID de dependencia muestra una relación de dependencia entre datos, los cuales son decodificados primero y se les hace referencia, para decodificar datos. En consecuencia, si una capa de calidad de la capa base referida por el ID de dependencia no existe en el proceso de decodificación de video, el ID de dependencia puede usar un método para referirse a la capa de calidad más alta de las capas de calidad restantes. En referencia a la figura 11, la capa de calidad más alta 34 de la imagen actual 30 y la capa de calidad más alta 39 de la imagen de referencia 35 son truncadas por el extractor de flujo de bits 200. De acuerdo con una modalidad ejemplar de la presente invención, ya que una capa de calidad de la capa más baja puede ser truncada antes que todas las capas de calidad de la capa superior sean truncadas, un ID de dependencia de la capa de calidad 33 en la imagen actual 30 puede indicar la capa de calidad 39 que ya fue truncada. Este caso tiene que ser modificado ya que el ID de dependencia de la capa de calidad en el decodificador de video indica la capa de calidad más alta 38 entre las capas de calidad restantes 36, 37 y 38 de la imagen de referencia 35. Las figuras 12 a 14 son diagramas de bloques que muestran configuraciones de un aparato de acuerdo con una modalidad ejemplar de la presente invención. La figura 12 es un diagrama de bloques que muestra una configuración de un aparato de asignación de prioridad de acuerdo con una modalidad ejemplar de la presente invención. El aparato de asignación de prioridad 100 asigna una prioridad por un nivel de calidad para de esta manera controlar una velocidad binaria del flujo de bits.

El aparato de asignación de prioridad 100 puede incluir un encabezado de imagen actual 100, un encabezado de imagen de referencia 120, un asignador de nivel de calidad 140 y una unidad de codificación por entropía 150. El codificador de imágenes de referencia 120 comprende capas de calidad (referidas como primeras capas de calidad) para una imagen de referencia. El codificador de imágenes de referencia 120 incluye un predictor 121, un transformador 122, un cuantificador 123 y un generador de capas de calidad 124. Un predictor 121 obtiene una señal residual al restar la imagen predicha de acuerdo con una predicción predeterminada. Como la predicción predeterminada, hay ínter predicción y predicción intra-base como se ilustra en la figura 2. La inter predicción incluye el cálculo de movimiento que obtiene un vector de movimiento para expresar un movimiento relativo entre una imagen actual y una imagen que tenga la misma resolución que la imagen actual y una posición temporal diferente de la imagen actual. La imagen actual puede ser predicha con referencia a una capa más baja (capa base) que se ubique sobre la misma posición temporal con la imagen actual y tenga una resolución diferente, la cual es llamada la predicción intra-base. En la predicción intra-base, no se requiere el cálculo en movimiento.

El transformador 122 lleva a cabo un método de transformación espacial en el cuadro residual para crear un coeficiente de transformación. El método de transformación espacial puede incluir una Transformación de Coseno Individual (DCT) , o transformación de onda pequeña. Específicamente, los coeficientes DCT pueden ser creados en caso de que se emplee DCT, y los coeficientes de onda pequeña pueden crearse en caso de que se emplee transformación de ondas pequeñas. El cuantificador 123 cuantifica el coeficiente de transformación recibido desde el transformador 122. Cuantificación significa el proceso de expresar los coeficientes de transformación formados en valores reales arbitrarios por valores individuales. Como la cuantificación, existe cuantificación escalar y cuantificación por vectores. La cuantificación escalar significa el proceso de dividir los coeficientes de transformación entre un parámetro de cuantificación y redondear a un entero. El generador de capas de calidad 124 genera una pluralidad de capas de calidad a través del proceso descrito en la figura 4. La pluralidad de capas de calidad puede consistir en una capa individual y al menos dos capas FGS . El codificador de imágenes actuales 110, al igual que el codificador de imágenes de referencia 120, incluye un predictor 111, un transformador 112, un cuantificador 113 y un generador de capas de calidad 114. Las operaciones de cada elemento del codificador de imágenes actuales 110 son iguales a las del codificador de imágenes de referencia 120. Sin embargo, la entrada de imágenes de referencia al codificador de imágenes de referencia 120 se usa como una imagen usada para predecir la imagen actual en el predictor 111. El predictor 111 lleva a cabo la ínter predicción o la predicción intra-base usando la imagen de referencia ingresada, y genera una señal residual. El codificador de imágenes actuales 110 compone capas de calidad (referidas como segundas capas de calidad) para la imagen actual, en forma más precisa, para una señal residual de la imagen actual. La imagen de referencia ingresada puede ser diferente a la imagen actual en su resolución, en caso de la predicción intra-base, y su nivel temporal, en caso de inter predicción. El asignador de nivel de calidad 140 asigna un ID de prioridad a cada una de las primera y segunda capas de calidad. La asignación de prioridad se lleva a cabo por un método de asignar una prioridad más baja a una capa de calidad que tenga una pequeña influencia en una reducción de colección de video de la imagen actual, y asignar una prioridad más alta a una capa de calidad que tenga una gran influencia (véase figura 9) .

Como una norma para determinar la reducción de calidad de video, puede usarse una función de costo como la ecuación 1. La función de costo puede ser expresada al añadir una diferencia de una imagen original y una velocidad binaria consumida en codificación. La unidad de codificación por entropía 150 codifica el ID de prioridad determinado por el asignador de nivel de calidad 140, las primeras capas de calidad para la imagen de referencia y las segundas capas de calidad para la imagen actual para generar así un flujo de bits. La codificación por entropía es un método de codificación sin pérdidas que usa una característica estadística de datos, la cual incluye codificación aritmética, codificación por longitud variable y así sucesivamente. La figura 13 es un diagrama de bloques que muestra una configuración de un extractor de flujos de bits de acuerdo con una modalidad ejemplar de la presente invención. El extractor de flujos de bits 200 incluye una unidad de entrada de flujos de bits 210, un analizador de flujos de bits 220, un truncador de flujos de bits 230, una unidad de ajuste de velocidad binaria objetivo 240 y una unidad de transmisión de flujos de bits 250. La unidad de entrada de flujos de bits 210 recibe un flujo de bits de video desde el aparato de asignación de prioridad 100. La unidad de transmisión de flujos de bits 250 transmite el flujo de bits de la cual se cambia la velocidad binaria a un decodificador de video. La unidad de entrada de flujos de bits 210 corresponde a una unidad receptora de una interfaz de red. La unidad de transmisión de flujos de bits 250 corresponde a una unidad de transmisión de la interfaz de red. La unidad de ajuste de velocidad binaria objetivo 240 establece una velocidad binaria objetivo del flujo de bits de video. El flujo de bits objetivo puede determinarse en consideración colectiva de una velocidad binaria de el flujo de bits de transmisión, un estado de red y una función de dispositivos de capa de recepción (decodificador de video) . El analizador de flujo de bits 220 lee IDs de prioridad de las primeras capas de calidad para la imagen de referencia y las segundas capas de calidad para las imágenes actuales. El ID de prioridad se asigna por el asignador de nivel de calidad 140 del aparato de asignación de prioridad 100. El truncador de flujo de bits 230 trunca de una capa de calidad más baja y hacia arriba de la primera y segunda capas de calidad de acuerdo con la velocidad binaria objetivo. El truncamiento se repite hasta que se logre la velocidad binaria objetivo. La figura 14 es un diagrama de bloques que muestra una configuración de un decodificador de video de acuerdo con una modalidad ejemplar de la presente invención. El decodificador de video 300 incluye una unidad de decodificación por entropía 310, un analizador de flujo de bits 320, una unidad de decodificación de imágenes actuales 330, una unidad de decodificación de imágenes de referencia 340 y una unidad de ajuste de ID de dependencia 350. La unidad de decodificación por entropía 310 recibe un flujo de bits de video del extractor de flujos de bits 200, y la decodifica sin pérdidas. La decodificación sin pérdidas se lleva a cabo como una operación inversa de la codificación sin pérdidas en la unidad de codificación por entropía 150 del aparato de asignación de prioridad 100. El analizador de flujo de bits 320 lee datos codificados para la imagen de referencia (primeras capas de calidad) , datos codificados para las segundas imágenes (segundas capas de calidad), IDs de dependencia de las primeras capas de calidad para la imagen de referencia e IDs de dependencia de las segundas capas de calidad para las imágenes actuales. El ID de dependencia muestra que información sobre una capa de calidad de la imagen de referencia se requiere para reconstruir una capa de calidad de la capa actual, es decir, una relación de dependencia. Como se describe en la figura 11, ya que capas de calidad de una capa más baja pueden ser truncadas antes que aquellas de una capa superior, una capa de calidad de la capa actual puede indicar una capa de calidad de la cual ya se haya truncado el ID de dependencia. La unidad de ajuste de ID de dependencia 350 puesta como el ID de dependencia indica la capa de calidad más alta de las capas de calidad restantes. La unidad de decodificación de imágenes de referencia 340 incluye un cuantificador inverso 341, un transformador inverso 342 y un predictor inverso 343 para de esta manera decodificar los datos codificados de la imagen de referencia . El cuantificador inverso 341 cuantifica en forma inversa los datos codificados de la imagen de referencia. El transformador inverso 342 lleva a cabo una transformación inversa del resultado cuantificado en forma inversa. La transformación inversa se lleva a cabo como una operación inversa de la transformación en el transformador 122 de la figura 12. El predictor inverso 343 añade la señal residual reconstruida provista por el transformador inverso 342 y una señal de predicción para reconstruir la imagen de referencia. En este momento, la señal de predicción se obtiene por la inter predicción o la predicción intra-base al igual que en el codificador de video. La unidad de decodificación de imágenes actuales 330 decodifica datos codificados de la imagen actual de acuerdo con el ID de dependencia. La unidad de decodificación de imágenes actuales 330 incluye un cuantificador inverso 331, un transformador inverso 332 y un predictor inverso 333. Las operaciones de cada elemento de la unidad de decodificación de imágenes actuales 330 son iguales a las del decodificador de imágenes de referencia 340. Sin embargo, el predictor inverso 333 reconstruye la imagen actual a partir de la señal residual reconstruida de la imagen actual proporcionada por el transformador inverso 332 usando la imagen de referencia reconstruida como la señal de predicción, es decir, añade la señal residual y la señal de predicción. En este momento, un ID de dependencia leído por el analizador de flujos de bits 320 o un ID de dependencia modificado se usa. El ID de dependencia indica las primeras capas de calidad para la imagen de referencia que se requiere para reconstruir las segundas capas de calidad para la imagen actual. El término 'imagen', según se usa en la presente, significa un solo cuadro. Sin embargo, la imagen puede ser un 'segmento' , lo cual se entenderá por aquellos expertos en la técnica. Los componentes mostrados en las figuras 12 y 14 pueden ser implementados en software tal como una tarea, clase, sub-rutina, proceso, objeto, cadena de ejecuciones o programa, el cual se lleve a cabo en cierta área de memoria, y/o hardware tal como una Disposición de Puertas Programable en Campo (FPGA) o un Circuito Integrado Especifico de Aplicación (ASIC) . Los componentes también pueden ser implementados como una combinación de software y hardware. Además, los componentes pueden configurarse adecuadamente para residir en medios de almacenamiento legibles por computadora, o para ejecutar uno o más procesadores.

Aplicabilidad industrial Como se describió arriba, una modalidad ejemplar de la presente invención puede controlar la velocidad binaria de flujos de bits simplemente al enfocarse en una calidad de video de una imagen de capa alta. Aunque la presente invención ha sido mostrada y descrita particularmente con referencia a modalidades ejemplares de la misma, se entenderá por aquellos expertos en la técnica que varios cambios en forma y detalles pueden hacerse en la misma sin alejarse del espíritu y alcance de la presente invención como el definido por las siguientes reivindicaciones . Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones: 1. Un método para asignar una prioridad para controlar una velocidad binaria de un flujo de bits, caracterizado porque comprende: componer primeras capas de calidad para una imagen de referencia; componer segundas capas de calidad para una imagen actual que sea codificada con referencia a la imagen de referencia y asignar una prioridad a cada una de las primera y segunda capas de calidad, en donde una baja prioridad se asigna a una capa de calidad que tiene una pequeña influencia en una reducción de calidad de video de la imagen actual, cuando la capa de calidad es truncada.
2. El método de conformidad con la reivindicación 1, caracterizado porque la imagen de referencia y la imagen actual son cuadros o segmentos.
3. El método de conformidad con la reivindicación 1, caracterizado porque la imagen de referencia y la imagen actual tienen una resolución diferente o un nivel temporal diferente.
4. El método de conformidad con la reivindicación 1, caracterizado porque las primera y segunda capas de calidad comprenden una capa individual y por lo menos dos capas de escalabilidad por granularidad fina (FGS), respectivamente.
5. El método de conformidad con la reivindicación 4, caracterizado porque comprende componer las primeras capas de calidad y componer las segundas capas de calidad comprende : obtener una señal residual al predecir la imagen de referencia o la imagen actual; generar un coeficiente de transformación al transformar la señal residual; componer la capa individual al cuantificar el coeficiente de transformación a través de un primer parámetro de cuantificación; restar el resultado cuantificado de la señal residual y componer las por lo menos dos capas FGS al cuantificar el resultado restado a través de un segundo parámetro de cuantificación .
6. El método de conformidad con la reivindicación 1, caracterizado porque la capa de calidad que tiene una pequeña influencia en la reducción de calidad de video es una capa de calidad de la cual el costo para codificación es menor que el de otras capas de calidad.
7. El método de conformidad con la reivindicación 6, caracterizado porque el costo es sumar una diferencia de una imagen original y una velocidad binaria consumida en codificación.
8. Un método para controlar una velocidad binaria de un flujo de bits, caracterizado porque comprende: recibir un flujo de bits de video; establecer una velocidad binaria objetivo para el flujo de bits de video; leer primeras capas de calidad para una imagen de referencia y segundas capas de calidad para una imagen actual y truncar de una capa de calidad que tenga una baja prioridad y hacia arriba, entre las primeras y las segundas capas de calidad, con base en la velocidad binaria objetivo.
9. El método de conformidad con la reivindicación 8, caracterizado porque la imagen de referencia y la imagen actual son cuadros o segmentos.
10. El método de conformidad con la reivindicación 8, caracterizado porque la imagen de referencia y la imagen actual tienen diferente resolución o un nivel temporal diferente .
11. El método de conformidad con la reivindicación 8, caracterizado porque las primeras y las segundas capas de calidad comprenden una capa individual y por lo menos dos capas de escalabilidad por granularidad fina (FGS), respectivamente .
12. Un método de decodificación de video, caracterizado porque comprende: recibir un flujo de bits de video; leer primeras capas de calidad para una imagen de referencia, segundas capas de calidad para una imagen actual e IDs de dependencia de las primera y segunda capas de calidad, establecer el ID de dependencia como indicando la' capa de calidad más alta de las primeras capas de calidad, si no hay capa de calidad indicada por el ID de dependencia entre las primeras capas de calidad y reconstruir la imagen actual de acuerdo con una relación indicada por el ID de dependencia.
13. El método de conformidad con la reivindicación 12, caracterizado porque la imagen de referencia y la imagen actual son cuadros o segmentos.
14. El método de conformidad con la reivindicación 12, caracterizado porque la imagen de referencia y la imagen actual tienen diferentes resoluciones o diferentes niveles temporales .
15. El método de conformidad con la reivindicación 12, caracterizado porque las primeras capas de calidad y las segundas capas de calidad comprenden una capa individual y por lo menos dos capas de escalabilidad por granularidad fina (FGS), respectivamente.
16. El método de conformidad con la reivindicación 12, caracterizado porque la reconstrucción de la imagen actual comprende: reconstruir la imagen de referencia de acuerdo con el ID de dependencia; reconstruir una señal residual de la imagen actual y sumar la imagen de referencia reconstruida y la señal residual reconstruida.
17. Un aparato para asignar una prioridad para controlar una velocidad binaria de un flujo de bits, caracterizado porque comprende: un codificador de imágenes de referencia que compone primeras capas de calidad para una imagen de referencia ; un codificador de imágenes actuales que compone segundas capas de calidad para una imagen actual que es codificada con referencia a la imagen de referencia y un asignador de nivel de calidad que asigna una prioridad a cada una de las primeras y las segundas capas de calidad, en donde una baja prioridad se asigna a una capa de calidad que tiene una pequeña influencia en una reducción de calidad de video de la imagen actual cuando la capa de calidad es truncada.
18. Un aparato para controlar una velocidad binaria de un flujo de bits, caracterizado porque comprende: una unidad de entrada de flujo de bits que recibe un flujo de bits de video; una unidad de ajuste de velocidad binaria objetivo que ajusta una velocidad binaria objetivo para el flujo de bits de video; un analizador de flujos de bits que lee primeras capas de calidad para una imagen de referencia y segundas capas de calidad para una imagen actual, y un truncador de flujos de bits que trunca de una capa de calidad que tiene una baja prioridad y hacia arriba, entre las primeras y las segundas capas de calidad, con base en la velocidad binaria objetivo.
19. Un aparato de decodificación de video, caracterizado porque comprende: una unidad de decodificación por entropía que recibe un flujo de bits de video; un analizador de flujos de bits que lee primeras capas de calidad para una imagen de referencia, segundas capas de calidad para una imagen actual e IDs de dependencia de las primeras y las segundas capas de calidad; una unidad de ajuste de ID de dependencia que ajusta el ID de dependencia como indicando la capa de calidad más alta de las primeras capas de calidad, si no hay una capa de calidad indicada por el ID de dependencia entre las primeras capas de calidad, y un decodificador de imágenes actuales que reconstruye la imagen actual de acuerdo con una relación indicada por el ID de dependencia.