[go: up one dir, main page]

MXPA02011734A - Flexibilidad de error de video. - Google Patents

Flexibilidad de error de video.

Info

Publication number
MXPA02011734A
MXPA02011734A MXPA02011734A MXPA02011734A MXPA02011734A MX PA02011734 A MXPA02011734 A MX PA02011734A MX PA02011734 A MXPA02011734 A MX PA02011734A MX PA02011734 A MXPA02011734 A MX PA02011734A MX PA02011734 A MXPA02011734 A MX PA02011734A
Authority
MX
Mexico
Prior art keywords
video
video frame
frames
format
compressed
Prior art date
Application number
MXPA02011734A
Other languages
English (en)
Inventor
Miska Hannuksela
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of MXPA02011734A publication Critical patent/MXPA02011734A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

La invencion provee un metodo que reduce la degradacion en la calidad percibida de imagenes en una secuencia de video debido a la perdida de datos. Este efecto se logra al retardar de manera efectiva la insercion de un cuadro codificado INTRA (50) despues de una reposicion de cuadro INTRA periodica, solicitud de actualizacion INTRA o corte de escena. Los cuadros asociados con solicitudes de cuadro INTRA son por si mismos codificados en formato INTRA, pero en vez de ello un cuadro (50) que ocurre mas tarde en la secuencia de video se escoge para codificarse en formato INTRA. Preferiblemente, el cuadro INTRA real se selecciona de tal manera que queda aproximadamente a la mitad entre solicitudes INTRA periodicas. Los cuadros (P2, P3) que ocurren antes del cuadro codificado INTRA real (50) son codificados mediante el uso de prediccion temporal, en orden inverso, que empieza a partir del cuadro INTRA real, mientras que aquellos cuadros (P4, p5) que ocurren despues del cuadro codificado INTRA real (50) son codificados mediante el uso de prediccion temporal en la direccion hacia adelante.

Description

FLEXIBILIDAD DE ERROR DE VIDEO ANTECEDENTES DE LA INVENCIÓN La presente invención se refiere a la transmisión de datos de multimedia en redes de comunicaciones. Muy específicamente, se refiere a la transmisión de datos de video en redes que están sujetas a errores. La invención provee un nuevo método por el cual se puede mitigar la degradación en la calidad percibida de imágenes de video debido a pérdida de datos. Para apreciar los beneficios provistos por la invención, es ventajoso revisar el marco de trabajo de un sistema de creación y recuperación de contenido de multimedia típico conocido de la técnica anterior e introducir las características de secuencias de video comprimido. Aunque la descripción en los siguientes párrafos se concentra en la recuperación de datos de multimedia almacenados en redes en donde la información es transmitida usando protocolos de datos basados en paquetes (por ejemplo la Internet), se debe apreciar que la invención es igualmente aplicable a redes conmutadas de circuitos tales como sistemas telefónicos PSTN de línea fija (red telefónica de servicio al público) o PLMN móvil (red móvil terrestre pública). También se puede aplicar en redes que usan una combinación de protocolos de transmisión de datos basados en paquetes y conmutados en circuito. Por ejemplo, el sistema de teléfono móvil universal (UMTS) actualmente bajo estandarización puede contener tanto elementos conmutados de circuito como basados en paquetes. La invención es aplicable a Ref. 143342 aplicaciones de tiempo no real, tales como envío mediante paquetes de video, así como a aplicaciones de comunicaciones de tiempo real tales como telefonía de video. Un sistema de creación y recuperación de contenidos de multimedia típico se presenta en la figura 1. El sistema, referido en general por el número de referencia 1 , tiene una o más fuentes de contenido de multimedia 10. Estas fuentes pueden comprender, por ejemplo, una cámara de video y un micrófono, pero también pueden estar presentes otros elementos. Por ejemplo, el contenido de multimedia también puede incluir gráficos animados por computadora, o una biblioteca de archivos de datos almacenados en un medio de almacenamiento en masa tal como una unidad de disco duro en red. Para componer un clip (recorte) de multimedia que comprende diferentes tipos de medios (referidos como "pistas"), se combinan datos en forma bruta capturados o recuperados de varias fuentes 10. En el sistema de creación y recuperación de multimedia mostrado en la figura 1 , esta tarea es realizada por un editor 12. El espacio de almacenamiento requerido para datos de multimedia en bruto es grande, típicamente de muchos megabits. Por lo tanto, a fin de facilitar los servicios de recuperación de multimedia atractivos, particularmente en canales de velocidades de bits bajas, los clips de multimedia son típicamente comprimidos durante el proceso de edición. Una vez que las diversas fuentes de datos en bruto se han combinado y comprimido para formar clip de multimedia, los clips son enviados a un servidor de multimedia 14. Típicamente, un número de clientes 16 puede tener acceso al servidor en alguna forma de red, aunque para facilidad de comprensión sólo se ilustra uno de estos clientes en la figura 1. El servidor 14 puede responder a solicitudes y comando de control 15 presentados por los clientes. La tarea principal para el servidor es transmitir un clip de multimedia deseado al cliente 16. Una vez que el clip ha sido recibido por el cliente, es descomprimido en el equipo terminal del cliente y el contenido de multimedia es "reproducido". En la fase de reproducción, cada componente del clip de multimedia se presenta en un medio de reproducción apropiado 18 provisto en el equipo terminal del cliente, por ejemplo, contenido de video que es presentado en la pantalla del equipo terminal y contenido de audio es reproducido por una bocina o similar. Las operaciones realizadas por el editor de clip de multimedia 12 se explicará ahora con mayor detalle con referencia a la figura 2. Los datos en bruto son capturados por un dispositivo de captura 20 de una o más fuentes de datos 10. Los datos son capturados usando hardware, unidades de dispositivo dedicadas (es decir, software) y un programa de aplicación de captura que utiliza el hardware al controlar sus unidades de dispositivo. Por ejemplo, si la fuente de datos es una cámara de video, el hardware necesario para capturar datos de video puede consistir de una tarjeta de captación de video fijada a una computadora personal. Las salidas del dispositivo de captura 20 generalmente es ya sea un flujo de datos no comprimidos o datos ligeramente comprimidos con degradaciones de calidad irrelevantes cuando se compara con datos no comprimidos. Por ejemplo, la salida de una tarjeta de captura de video podría ser cuadros de video en un formato de YUV 4:2:0 no comprimido, o en un formato de imagen de movimiento- JPEG. El término "flujo" se usa para denotar al hecho de que, en muchas situaciones, los datos de multimedia son capturados desde las diversas fuentes en tiempo real, desde un "flujo" continuo de datos en bruto. Alternativamente, las fuentes de datos de multimedia pueden estar en forma de archivos prealmacenados, que residen en un medio de almacenamiento en masa tal como una unidad de disco duro de red. Un editor 22 enlaza entre sí flujos de medios separados, obtenidos de las fuentes de medios individuales 10, en una sola línea de tiempo. Por ejemplo, los flujos de multimedia que deben ser reproducidos en forma sincrónica, tales como contenido de audio y video, son enlazados al proveer indicaciones de los tiempos de reproducción deseados de cada cuadro. Las indicaciones referentes al tiempo de reproducción deseado de otros flujos de medios también se pueden proveer. Para indicar que las corrientes de multimedia inicialmente independientes están ahora ligadas de esta manera, el término "pista" de multimedia se usa desde este punto en adelante como un término genérico para describir el contenido de multimedia. También puede ser posible que el editor 22 edite las pistas de medios en varias formas. Por ejemplo, la velocidad de cuadro de video puede ser reducida a la mitad o la resolución espacial de imágenes de video pueden reducirse. En la fase de compresión 24, cada pista de medio puede ser comprimida en forma independiente, en una manera apropiada para el tipo de medio en cuestión. Por ejemplo, una pista de video YUV 4:2:0 no comprimida podría ser comprimida usando la recomendación ITU-T de H.263 para codificación de video de velocidad de bits baja. En la fase de multiplexión 26, las pistas de medios comprimidos son intercaladas de modo que forman un flujo de bits individual. El flujo de bits individual, que comprende una multiplicidad de diferentes tipos de medios se denomina un "clip de multimedia". Sin embargo, se debe notar que la multiplexión no es esencial para proveer un flujo de bits de multimedia. El clip es enviado enseguida al servidor de multimedia 14. La operación del servidor de multimedia 14 se describe ahora con más detalle con referencia al diagrama de flujo presentado en la figura 3. Típicamente, el servidor de multimedia tiene dos modos de operación, tiempo no real y tiempo real. En otras palabras, un servidor de multimedia puede suministrar clips de multimedia prealmacenados o bien un flujo de multimedia en vivo (tiempo real). En el primer caso, los clips primero deben almacenarse en una base de datos 30 del servidor, ia cual después es accesada por el servidor en una forma "sobre demanda". En el último caso, los clips de multimedia son enviados al servidor por el editor 12 como un flujo de medio continuo que es inmediatamente transmitido a los clientes 16. Un servidor puede remover y comprimir algo de la información de cabecera usada en el formato de multiplexión y puede encapsular el clip de medios en paquetes adecuados para suministrar en la red. Los clientes controlan la operación del servidor mediante el uso de un "protocolo de control" 15. La serie mínima de controles provista por el protocolo de control consiste de una función para seleccionar un clip de medios deseado. Además, los servidores pueden soportar controles más avanzados. Por ejemplo, los clientes 16 pueden ser capaces de almacenar la transmisión de un clip, o pausar y reanudar su transmisión. Además, los clientes pueden ser capaces de controlar el flujo de medios si las salidas del canal de transmisión varía por alguna razón. En este caso, el servidor dinámicamente ajusta el flujo de bits para utilizar el ancho de banda disponible para la transmisión. Los módulos que pertenecen a un cliente de recuperación de multimedia típico 16 se presentan en la figura 4. Cuando se recupera un clip de medio comprimido y multiplexado de un servidor de multimedia, el cliente primero desmultiplexa el clip 40 a fin de separar las diferentes pistas de medios contenidas dentro del clip. Entonces, las pistas de medios separadas son descomprimidas 42. Enseguida, las pistas de medios descomprimidas (reconstruidas) son reproducidas usando los dispositivos de salida 18 del cliente. Además de estas operaciones, el cliente incluye una unidad controladora 46 que hace interfaz con el usuario final, controla la reproducción de acuerdo con la entrada del usuario y manipula el tráfico de control del servidor del cliente. Se debe notar que las operaciones de desmultiplexión, descompresión y reproducción se pueden realizar mientras se están descargando partes subsecuentes del clip. El enfoque comúnmente se refiere como "envío por paquetes". Alternativamente, el cliente puede descargar el clip entero, desmultiplexarlo, descomprimir el contenido de las pistas de medios individuales y sólo después iniciar la función de reproducción. Enseguida se describirá la naturaleza de secuencias de video digitales adecuadas para transmisión en redes de comunicación. Las secuencias de video, igual que las imágenes de movimiento ordinarias registradas en una película, comprenden una secuencia de imágenes fijas, la ilusión de movimiento es creada al desplegar las imágenes una después de la otra a una velocidad relativamente rápida, típicamente de 15-30 cuadros por segundo. Debido a la velocidad de cuadros relativamente rápida, las imágenes en cuadros consecutivos tienden a ser muy similares y por lo tanto contener una cantidad considerable de información redundante. Por ejemplo, una escena típica comprende algunos elementos estacionarios, por ejemplo, el escenario de fondo, y algunas áreas en movimiento que pueden adoptar muchas formas diferentes, por ejemplo, la cara de una persona que lee el periódico, tráfico en movimiento y así sucesivamente. En forma alternativa, la cámara que graba la escena puede por si misma estar en movimiento, en cuyo caso todos los elementos de la imagen tienen el mismo tipo de movimiento. En muchos casos, esto significa que el cambio global entre un cuadro de video y el siguiente es más bien pequeño. Desde luego, esto depende de la naturaleza del movimiento. Por ejemplo, mientras más rápido es el movimiento, mayor es el cambio de un cuadro al siguiente. De manera similar, si una escena contiene un número de elementos en movimiento, el cambio de un cuadro al siguiente es mayor que en una escena en donde sólo está en movimiento un elemento. Los métodos de compresión de video se basan en la reducción de las partes redundantes y perceptualmente irrelevantes de secuencias de video. La redundancia en secuencias de video se puede categorizar en redundancia espacial, temporal y espectral. La "redundancia espacial" es el término usado para describir la correlación entre los pixeles circundantes. El término "redundancia temporal" expresa el hecho de que los objetos que aparecen en una imagen probablemente aparecen en imágenes subsecuentes, mientras que la "redundancia espectral" se refiere a la correlación entre diferentes componentes de color de la misma imagen. Una compresión suficientemente eficiente por lo general no puede lograrse al reducir simplemente las diversas formas de redundancia en una secuencia de imágenes dada. De esta manera, la mayoría de los codificadores de video actuales también reducen la calidad de aquellas partes de la secuencia de video que son subjetivamente las menos importantes. Además, la redundancia del flujo de bits codificado mismo se reduce por medio de codificación sin pérdida eficiente de parámetros y coeficientes de compresión. Típicamente, esto se logra usando una técnica conocida como "codificación de longitud variable" (VLC). Los métodos de compresión de video típicamente utilizan la "predicción temporal compensada por movimiento". Esta es una forma de reducción de redundancia temporal en la cual el contenido de algunos (a menudo muchos) cuadros en una secuencia de video se pueden "predecir" a partir de otros cuadros en la secuencia rastreando el movimiento de objetos o regiones de una imagen entre cuadros. Las imágenes comprimidas que no utilizan métodos de reducción de redundancia temporal generalmente se denominan cuadros INTRA o cuadros I, mientras que las imágenes temporalmente predichas se denominan cuadros ÍNTER o cuadros P. En el caso de los cuadros ÍNTER, la imagen predicha (compensada por movimiento) rara vez es suficientemente precisa, y por lo tanto una imagen de error de predicción comprimida también está asociada con cada cuadro ÍNTER. Muchos esquemas de compresión de video también introducen cuadros bidireccionalmente predichos, que comúnmente se refieren como imágenes B o cuadros B. Las imágenes B se insertan entre pares de imagen de referencia o la llamada imagen de "anclaje" (cuadros I o P) y son predichos a partir ya sea de una o ambas de las imágenes de anclaje, como se ilustra en la figura 5. Como se puede ver a partir de la figura, la secuencia empieza con una imagen INTRA o I 50. Las imágenes B (denotadas generalmente por el número de referencia 52) normalmente producen compresión incrementada en comparación con las imágenes P predichas en dirección hacia adelante 54. En la figura 5, las flechas 51a y 51b ilustran el procedimiento de predicción bidireccional, mientras que las flechas 53 denotan predicción en dirección hacia adelante. Las imágenes B no se usan como imágenes de anclaje, es decir, no se predicen otros cuadros a partir de ellas y por lo tanto, se pueden descartar de la secuencia de video sin causar deterioro en la calidad de imágenes futuras. Se debe notar que las imágenes B pueden mejorar el rendimiento de compresión cuando se comparan con imágenes P, requieren más memoria para su construcción, sus requerimientos de procesamiento son más complejos y su uso introduce demoras adicionales. A partir de la discusión anterior de predicción temporal, será evidente que los efectos de pérdida de datos, que conduce a la corrupción de contenido de imagen en un cuadro dado, se propagará en el tiempo, y ocasionará corrupción de cuadros subsecuentes predichos a partir de ese cuadro. También será evidente que la codificación de una secuencia de video empieza con un cuadro INTRA, debido a que al principio de una secuencia no están disponibles cuadros previos para formar una referencia para predicción. Sin embargo, se debe notar que, cuando se despliega, por ejemplo en un equipo terminal 18 de un cliente, el orden de reproducción de los cuadros puede no ser el mismo que el orden de codificación/decodificación. De esta manera, aunque la operación de codificación/decodificación empieza con un cuadro INTRA, esto no significa que los cuadros deben ser reproducidos empezando con un cuadro INTRA. Más información acerca de los diferentes tipos de imagen usado en la codificación de video de velocidad de bits baja se pueden encontrar en el artículo "H.263+: Video Coding at Low Bit-rates", G. Cote, B. Erol, M. Gallant and F. Kossentini, in IEEE Transactions on Circuits and Systems for Video Technology, noviembre de 1998. A la luz de la información provista anteriormente en relación con la naturaleza de sistemas de recuperación de multimedia actualmente conocidos y técnicas de codificación de video (compresión) se apreciará que puede surgir un problema significativo en la recuperación/envío en paquetes de secuencias de video en redes de comunicación. Puesto que los cuadros de video típicamente se predicen uno a partir del otro, las secuencias de video comprimidas están particularmente sujetas a errores de transmisión. Si la pérdida de datos ocurre debido a un error de transmisión de red, la información acerca del contenido del envío en paquetes de video se perderá. El efecto del error de transmisión puede variar. Si la información vital para la reconstrucción de un cuadro de video se pierde (por ejemplo, la información almacenada en una cabecera de imagen), puede no ser posible desplegar la imagen en el cliente receptor. Por lo tanto, el cuadro completo y cualquier secuencia de cuadros predicha a partir del mismo se pierde (es decir, no puede ser reconstruida y desplegada). En un caso menos severo, sólo una parte del contenido de imagen es afectado. Sin embargo, los cuadros predichos a partir del cuadro corrompido son sin embargo afectados y el error se propaga tanto temporalmente como espacialmente dentro de la secuencia de imagen hasta que el siguiente cuadro INTF?A es transmitido y reconstruido correctamente. Ese es un problema particularmente severo en comunicaciones de velocidad de bits muy baja, en donde los cuadros INTRA se pueden transmitir únicamente de manera poco frecuente (por ejemplo, un cuadro INTRA cada 10 segundos). La naturaleza de errores de transmisión varía dependiendo de la red de comunicaciones en cuestión. En redes conmutadas de circuito, tales como sistemas de teléfono de línea fija y móviles, los errores de transmisión generalmente adoptan la forma de inversiones de bits. En otras palabras, los datos digitales que representan por ejemplo el contenido de video de un envío en paquetes de multimedia, es corrompido de tal manera que los 1's son cambiados a 0's y viceversa, lo que conduce a la representación errónea del contenido de imagen. En redes de teléfono móvil, los errores de inversión de bits típicamente surgen como resultado de una disminución en la calidad del enlace de radio. En redes que utilizan comunicación de datos conmutada en paquetes, los errores de transmisión adoptan la forma de pérdidas de paquete. En este tipo de red, los paquetes de datos generalmente se pierden como resultado de congestión en la red. Si la red se congestiona, los elementos de red, tales como enrutadores de compuerta, pueden descartar datos y paquetes y, si se usa un protocolo de transporte no confiable tal como UDP (protocolo de datagrama de usuario), los paquetes perdidos no son retransmitidos. Además, desde el punto de vista de la red, es benéfico transmitir paquetes relativamente grandes que contengan varios cientos de bits y consecuentemente, un paquete perdido puede contener varias imágenes de una secuencia de video de velocidad de bits baja. Normalmente, la mayoría de los cuadros de video son cuadros ÍNTER temporalmente predichos y por lo tanto la pérdida de una o más de estas imágenes tiene graves consecuencias para la calidad de la secuencia de video como se reconstruye en la terminal del cliente. No sólo se pueden perder uno o más cuadros, sino que todas las imágenes subsecuentes predichas a partir de esos cuadros serán corrompidas. Un número de métodos de la técnica anterior resuelve los problemas asociados con la corrupción de secuencias de video comprimido debido a errores de transmisión. En general, se refieren como métodos de "flexibilidad de error" y típicamente caen en dos categorías: métodos de corrección y ocultamiento de errores. La corrección de errores se refiere a la capacidad de recuperar datos erróneos perfectamente como si no se hubiesen introducido errores en primer lugar. Por ejemplo, la retransmisión se puede considerar un método de corrección de error. El ocultamiento de error se refiere a la capacidad para ocultar los efectos de errores de transmisión de manera que sean difícilmente visibles en el video reconstruido. Los métodos de ocultamiento de error típicamente caen en tres categorías: ocultamiento de error hacia adelante, ocultamiento de error por posprocesamiento y ocultamiento de error interactivo. El ocultamiento de error hacia delante se refiere a aquellas técnicas en las cuales la terminal de transmisión añade cierto grado de redundancia a los datos transmitidos de modo que el receptor debe recuperar fácilmente los datos aun cuando ocurran errores de transmisión. Por ejemplo, el codificador de video de trasmisión puede acortar las trayectorias de predicción de la señal de video comprimida. Por otra parte, el ocultamiento de error por posprocesamiento es totalmente orientado al receptor. Estos métodos intentan estimar ia representación correcta de datos erróneamente recibidos. El transmisor y receptor también puede cooperar a fin de reducir al mínimo el efecto de errores de transmisión. Estos métodos se basan fuertemente en información de retroalimentación provista por el receptor. El ocultamiento de error por posprocesamiento también se puede referir como ocultamiento de error pasivo mientras que las otras dos categorías representan formas de ocultamiento de error activo. La presente invención pertenece a la categoría de métodos que acortan las trayectorias de predicción usadas en la compresión de video. Se debe notar que los métodos introducidos más adelante son igualmente aplicables a envíos en paquetes de video comprimidos transmitidos en redes conmutadas o paquetes o redes conmutadas en circuito. La naturaleza de la red de datos subyacente y el tipo de errores de transmisión que ocurren son esencialmente irrelevantes, tanto para esta descripción de la técnica anterior como para la aplicación de la presente invención. Los métodos de flexibilidad de error que acortan las trayectorias de predicción dentro de las secuencias de video se basan en el siguiente principio. Si una secuencia de video contiene un tren largo de cuadro ÍNTER, la pérdida de datos de imagen como resultado de errores de transmisión conducirá a la corrupción de todos los cuadros ÍNTER subsecuente decodificados y el error se propagará y será visible durante un tiempo largo en el envío en paquetes de video decodificado. Consecuentemente, la flexibilidad de error del sistema se puede mejorar reduciendo la longitud de las secuencias de cuadro ÍNTER dentro del flujo de bits de video. Esto se puede lograr: 1 al incrementar la frecuencia de cuadros INTRA dentro del envío en paquetes de video, 2 mediante el uso de cuadros B, 3 mediante el uso de selección de imagen de referencia y 4 al emplear una técnica conocida como codificación de redundancia de video. Se puede mostrar que los métodos de la técnica anterior para reducir la longitud de la trayectoria de predicción dentro de las secuencias de video conducirá al incremento en la velocidad de bits de la secuencia comprimida. Este es un efecto indeseable, particularmente en canales de transmisión de velocidad de bits baja o en canales en donde el ancho de banda disponible total debe ser compartido entre una multiplicidad de usuarios. El incremento en la velocidad de bits depende del método empleado y la naturaleza exacta de la secuencia de video que ha de ser codificada. A la luz de los argumentos anteriormente presentados, referentes a la naturaleza de sistemas de recuperación de multimedia y secuencias de video comprimidas, se apreciará que existe un problema significativo relacionado con la limitación del efecto de los errores de transmisión sobre la calidad de imagen percibida. Aunque algunos métodos de la técnica anterior enfrentan este problema al limitar la longitud de la trayectoria de previsión usada en las secuencias de video comprimidas, en la mayoría de los casos su uso da por resultado un incremento en la velocidad de bits requerida para codificar la secuencia. Por lo tanto, un objeto de la presente invención es mejorar la flexibilidad de las secuencias de video comprimidas a errores de transmisión mientras mantienen una velocidad de bits aceptablemente baja.
SUMARIO DE LA INVENCIÓN De conformidad con el objetivo anteriormente planteado y en un primer aspecto, se provee un método de codificación de una secuencia de cuadros de video para formar una secuencia de video comprimido, la secuencia de video comprimido comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer cuadro de formato comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el método comprende los pasos de identificar una primera indicación asociada con un primer cuadro de video de tal manera que el primer cuadro de video deberá ser codificado en el primer formato de cuadro de video comprimido; asociar la primera indicación con un segundo cuadro de video; codificar el segundo cuadro de video en el primer formato de cuadro de video comprimido; definir una primera serie de cuadros de video que comprende cuadros de video N que ocurren antes del segundo cuadro de video; codificar la primera serie de cuadros de video en el segundo formato de cuadro de video comprimido; definir una segunda serie de cuadros de video que comprende cuadros de video M que ocurren después del segundo cuadro de video; y codificar la segunda serie de cuadros de video en el segundo formato de cuadros de video comprimido. De conformidad con un segundo aspecto de la invención se provee un codificador de video para codificar una secuencia de cuadros de video para formar una secuencia de video comprimida, la secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el codificador comprende medios para identificar una primera indicación asociada con un primer cuadro de video de tal manera que el primer cuadro de video deberá ser codificado en el primer formato de cuadro de video comprimido; medios para asociar la primera indicación con un segundo cuadro de video; medios para codificar el segundo cuadro de video en el primer formato de cuadro de video comprimido; medios para definir una primera serie de cuadros de video que comprenden cuadros de video N que ocurren antes del segundo cuadro de video; medios para codificar la primera serie de cuadros de video en el segundo formato de cuadro de video comprimido; medios para definir una segunda serie de cuadros de video que comprende cuadros de video M que ocurren después del segundo cuadro de video; y medios para codificar la segunda serie de cuadros de video en el segundo formato de cuadros de video comprimido. De conformidad con un tercer aspecto de la invención, se provee un codificador-decodificador de video que incluye un codificador de video de conformidad con el segundo aspecto de la invención. De conformidad con un cuarto aspecto de la invención, se provee un sistema de creación de contenido de multimedia que incluye un codificador de video de conformidad con el segundo aspecto de la invención. De conformidad con un quinto aspecto de la invención, se provee una terminal de multimedia que incluye un codificador de video de conformidad con el segundo aspecto de la invención. De conformidad con un sexto aspecto de la invención, se provee una terminal de multimedia de conformidad con el quinto aspecto de la invención caracterizada porque la terminal es un dispositivo de radio telecomunicaciones. De conformidad con un séptimo aspecto de la invención, se provee un método de decodificación de una secuencia de video comprimida para formar una secuencia de cuadros de video descomprimidos, ia secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadros de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el método comprende los pasos de identificar una primera indicación asociada con un primer cuadro de video de tal manera que el primer cuadro de video es codificado en el primer formato de cuadro de video comprimido; decodificar el primer cuadro de video; recibir una primera serie de cuadros N en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida antes del primer cuadro de video; decodificar la primera serie de cuadros de video N; reordenar los cuadros de la primera serie de cuadros de conformidad con información de reproducción asociada con los cuadros de la primera serie; recibir una segunda serie de cuadros de video M en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida después del primer cuadro de video; y decodificar la segunda serie de cuadros de video. De conformidad con un octavo aspecto de la invención, se provee un decodificador de video para decodificar una secuencia de video comprimida para formar una secuencia de cuadros de video descomprimidos, la secuencia de video comprimida comprendiendo cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el decodificador comprende medios para identificar una primera indicación asociada con un primer cuadro de video de tal manera que el primer cuadro de video es codificado en el primer formato de cuadro de video comprimido; medios para decodificar el primer cuadro de video; medios para recibir una primera serie de cuadros N en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida antes del primer cuadro de video; medios para decodificar la primera serie de cuadros de video N; medios para ordenar los cuadros de la primera serie de cuadro de conformidad con información de reproducción asociada con los cuadros de la primera serie; medios para recibir una segunda serie de cuadros de video M en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida después del primer cuadro de video; y medios para decodificar la segunda serie de cuadros de video. De conformidad con un noveno aspecto de la invención, se provee un codificador-decodificador de video que incluye un decodificador de video de conformidad con al octavo aspecto de la invención. De conformidad con un décimo aspecto de la invención, se provee un sistema de recuperación de contenido de multimedia que incluye un decodificador de video de conformidad con el octavo aspecto de la invención. De conformidad con un décimo primer aspecto de la invención, se provee una terminal de multimedia que incluye un decodificador de video de conformidad con el octavo aspecto de la invención. De conformidad con un décimo segundo aspecto de la invención, se provee una terminal de multimedia de conformidad con el décimo primer aspecto de la invención caracterizado porque la terminal es un dispositivo de radio telecomunicaciones. De conformidad con un décimo tercer aspecto de la invención, se provee un programa de computadora para operar una computadora como un codificador de video para codificar una secuencia de cuadros de video para formar una secuencia de video comprimida, la secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadros de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el programa de computadora comprende un código ejecutable por computadora para identificar una primera indicación asociada con el primer cuadro de video de tal manera que el primer cuadro de video deberá ser codificado en el primer formato de cuadro de video comprimido; un código ejecutable por computadora para asociar la primera indicación con el segundo cuadro de video; un código ejecutable por computadora para asociar la primera indicación con el segundo cuadro de video; un código ejecutable por computadora para codificar el segundo cuadro video en el primer formato de cuadro de video comprimido; un código ejecutable por computadora para definir una primera serie de cuadros de video que comprenden cuadros de video N que ocurren antes del segundo cuadro de video; un código ejecutable por computadora para codificar la primera serie de cuadros de video en el segundo formato de cuadro de video comprimido; un código ejecutable por computadora para definir una segunda serie de cuadros de video que comprende cuadros de video M que ocurren después del segundo cuadro de video; y un código ejecutable por computadora para codificar la segunda serie de cuadros, de video en el segundo formato de cuadro de video comprimido. De acuerdo con un décimo cuarto aspecto de la invención, se provee un programa de computadora para operar una computadora como un decodificador de video para decodificar una secuencia de video comprimida para formar una secuencia de cuadros de video descomprimidos, la secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el programa de computadora comprende un código ejecutable por computadora para identificar una primera indicación asociada con el primer cuadro de video de tal manera que el primer cuadro de video es codificado en el primer formato de cuadro de video comprimido; un código ejecutable por computadora para decodificar el primer cuadro de video; un código ejecutable por computadora para recibir una primera serie de cuadros N en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida antes del primer cuadro de video; un código ejecutable por computadora para decodificar la primera serie de cuadros de video N; un código ejecutable por computadora para ordenar los cuadros de la primera serie de cuadros de conformidad con información de reproducción asociada con los cuadros de la primera serie; un código ejecutable por computadora para recibir una segunda serie de cuadros de video M en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida después del primer cuadro de video; y un código ejecutable por computadora para decodificar la segunda serie de cuadros de video. De conformidad con un décimo quinto aspecto de la invención, se provee un programa de computadora de conformidad con el décimo tercer y décimo cuarto aspecto de la invención. De conformidad con un aspecto adicional de la invención, se provee un medio de almacenamiento que comprende un programa de computadora para operar una computadora como un codificador de video para codificar una secuencia de cuadros de video para formar una secuencia de video comprimida, la secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el medio de almacenamiento comprende: - código ejecutable por computadora para identificar una primera indicación asociada con un primer cuadro de video de modo que el primer cuadro de video sea codificado en el primer formato de cuadro de video comprimido; - código ejecutable por computadora para asociar la primera indicación con un segundo cuadro de video; - código ejecutable por computadora para codificar el segundo cuadro de video en el primer formato de cuadro de video comprimido; - código ejecutable por computadora para definir una primera serie de cuadros de video que comprende cuadros de video N que ocurren antes del segundo cuadro de video; - código ejecutable por computadora para codificar la primera serie de cuadros de video en el segundo formato de cuadros de video comprimido; - código ejecutable por computadora para definir una segunda serie de cuadros de video que comprende cuadros de video M que ocurren después del segundo cuadro de video; - código ejecutable por computadora para codificar la segunda serie de cuadros de video en el segundo formato de cuadros de video comprimido. De conformidad con un aspecto adicional de la invención, se provee un medio de almacenamiento que comprende un programa de computadora para operar una computadora como un decodificador de video para decodificar una secuencia de video comprimido para formar una secuencia de cuadros de video descomprimidos, la secuencia de video comprimido comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el medio de almacenamiento comprende: - código ejecutable por computadora para identificar una primera indicación asociada con un primer cuadro de video de modo que el primer cuadro de video sea codificado en el primer formato de cuadro de video comprimido; - código ejecutable por computadora para descodificar el primer cuadro de video - código ejecutable por computadora para recibir una primera serie de cuadros N en el segundo formato de cuadros de video comprimido para incluirse en la secuencia de video descomprimido antes del primer cuadro de video; - código ejecutable por computadora para decodificar la primera serie de cuadro de video N; - código ejecutable por computadora para ordenar los cuadros de la primera serie de cuadros de acuerdo con información de reproducción asociada con los cuadros de la primera serie; - código ejecutable por computadora para recibir una segunda serie de cuadros de video M en el segundo formato de cuadros de video comprimidos para incluirse en la secuencia de video descomprimido después del primer cuadro de video; - código ejecutable por computadora para decodificar la segunda serie de cuadros de video. De conformidad con un aspecto adicional de la invención, se provee un método de codificación de una secuencia de cuadros de video para formar una secuencia de video comprimido, la secuencia de video comprimido comprende cuadros codificados en por lo menos un primer formato de cuadros de video comprimido y un segundo formato de cuadros de video comprimidos, el primer formato de cuadros de video comprimidos es un formato no temporalmente predicho y el segundo formato de cuadros de video comprimido es un formato temporalmente predicho caracterizado porque el método comprende los pasos de: - identificar una primera indicación asociada con un primer cuadro de video de modo que el primer cuadro de video sea codificado en el primer formato de cuadro de video comprimido; y - asociar la primera indicación con un segundo cuadro de video de tal manera que reduzca una longitud de trayectoria de predicción en la secuencia de video comprimido. El método de codificación de video de conformidad con la presente invención provee un flujo de datos de video codificados con flexibilidad de error mayor que los envíos en paquete de vídeos codificados usando métodos convencionales. De manera más específica, la invención provee un sistema de codificación/decodificación de video en el cual los efectos de pérdida de datos que conducen a la corrupción de imágenes temporalmente predichas, se propagan a un menor grado que cuando se usan codificadores-decodificadores de video de la técnica anterior. De conformidad con la invención, la corrupción de cuadros temporalmente predichos se reduce al acortar las trayectorias de predicción dentro de secuencias de video. Esto se logra al retardar de manera efectiva la inserción de un cuadro codificado INTRA. Esto se puede hacer, por ejemplo, después de una solicitud de cuadro INTRA periódica, una solicitud actualizada de cuadros 1NTRA desde una terminal remota, o un corte de escena. De conformidad con la invención, los cuadros que convencionalmente se codificarían en formato INTRA, tales como aquellos asociados con solicitudes INTRA periódicas, solicitudes de actualización periódicas o cortes de escena, no son codificados por si mismos en formato INTRA. En vez de ello, un cuadro que ocurre posteriormente en la secuencia de video se escoge para codificarse en formato INTRA. Preferiblemente, el cuadro actualmente codificado en formato INTRA (denominado el cuadro INTRA "real") se selecciona de tal manera que queda aproximadamente a medio camino entre las solicitudes INTRA periódicas, solicitudes de cuadro INTRA o cortes de escena. Los cuadros que ocurren antes del cuadro INTRA real son codificados usando predicción temporal, en orden inverso, que inician desde el cuadro INTRA real, mientras que aquellos cuadros que ocurren después son codificados usando predicción temporal en la dirección hacia adelante. De conformidad con una modalidad preferida de la invención, aquellos cuadros predichos en orden inverso son codificados en formato INTRA (cuadro P). En una modalidad alternativa, se usa la predicción hacia atrás que usa cuadros codificados en formato de cuadro B. La presente invención provee flexibilidad de error sustancialmente mejorada en comparación con métodos de codificación de video convencionales, en la cual los cuadros asociados con solicitudes INTRA periódicas, solicitudes de actualización de cuadro INTRA o cortes de escena son por si mismo codificados en formato INTRA. De manera específica, el porcentaje de cuadros perdidos debido a errores de transmisión es reducido en forma significativa cuando se emplea el método de conformidad con la invención. En comparación con métodos convencionales que buscan proveer flexibilidad de error incrementada al reducir las longitudes de trayectoria de predicción, la presente invención no produce un incremento significativo en velocidad de bits. La invención también se puede poner en práctica, por ejemplo, en un sistema de recuperación de multimedia en donde el video es enviado en paquetes sobre un protocolo de transporte basado en paquetes no confiable tal como UDP.
También se puede poner en práctica en aplicaciones de videotelefonía de tiempo real. La invención está particularmente adaptada para aplicaciones móviles en donde por lo menos parte del enlace de comunicaciones se forma por un canal de radio. Debido a que los enlaces de radiocomunicaciones tienden a exhibir velocidad de error de bits comparativamente alta y tienen un ancho de banda restringido, la flexibilidad de error incrementada provista por la invención es especialmente ventajosa, particularmente dado que no introduce un incremento significativo en velocidad de bits. Se hace énfasis además en que la naturaleza exacta de la red, el tipo de conexión y el protocolo de transmisión no es significativo para poner en práctica la invención. La red puede incluir tanto línea fija (PSTN) como redes de telecomunicaciones móviles (PLMN), en las cuales por lo menos parte del enlace de comunicaciones se forma por medio de un canal de radio. La transmisión de datos en la red se puede basar completamente en paquetes, completamente conmutada en circuito o puede incluir transmisión de datos conmutada en circuito y conmutada en paquetes. Por ejemplo, la red puede incluir algunos elementos (por ejemplo, una red de núcleo) que emplea transmisión de datos basada en paquetes acoplada con otros elementos de red en los cuales se usa transmisión de datos conmutada en circuito. Un ejemplo de este tipo de sistema es la red de telefonía móvil de tercera generación resultado actualmente propuesta, en la cual por lo menos parte de la red se puede basar en transmisión conmutada en circuito. La naturaleza exacta de los errores de transmisión que afectan el flujo de datos es irrelevante a la aplicación de la presente invención. Además, los métodos de codificación, decodificación y reproducción de conformidad con la invención se pueden aplicar a video sobre demanda prealmacenados así como compresión de video en vivo (tiempo real). Se debe hacer énfasis en que la invención se puede usar ya sea de manera independientemente o junto con métodos de corrección de errores, ocultamientos de errores y flexibilidad de errores de la técnica anterior que incluyen métodos convencionales para acortar trayectorias de predicción en secuencias de video, tales como aquellas mencionadas anteriormente.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La invención se describirá ahora, a manera de ejemplo únicamente, con referencia a los dibujos anexos, en los cuales: la figura 1 ¡lustra un sistema de creación y recuperación de contenido de multimedia de conformidad con la técnica anterior; la figura 2 muestra las operaciones realizadas por un editor de clip de multimedia típico; la figura 3 muestra las entradas y salidas de un servidor de multimedia típico; la figura 4 ilustra las operaciones realizadas por una terminal de cliente típica durante la recuperación de un clip de multimedia; la figura 5 ilustra la dependencia de predicción entre cuadros I, P y B en una secuencia de video comprimido; la figura 6 muestra un ejemplo de secuencia de video que emplea codificación de cuadro ÍNTER; la figura 7 muestra la inserción de un cuadro INTRA en la secuencia de cuadros de video inmediatamente después de un corte de escena; la figura 8 ilustra un ejemplo de una secuencia de video producida por un método de codificación de video de conformidad con la invención; la figura 9 es un diagrama de flujo que ilustra la operación de un codificador de video de conformidad con la técnica anterior; la figura 10 es un diagrama de flujo que ilustra un método de codificación de video de conformidad con una modalidad preferida de la invención; la figura 11 es un diagrama de flujo que ilustra el manejo de cuadros INTRA de conformidad con el método de la invención; la figura 12 es un diagrama de flujo que ¡lustra los pasos de procedimiento de un método de codificación de video de conformidad con una modalidad preferida de la invención; la figura 13 es un diagrama de flujo que ilustra la operación del método de conformidad con la invención durante la reproducción de video; la figura 14 ilustra los pasos de procedimiento de un método de codificación de video de conformidad con una modalidad alternativa de la invención en la cual se usan cuadros B; la figura 15 presenta un sistema de creación y recuperación de contenido de multimedia que incorpora un codificador de video puesto en práctica de conformidad con la invención; y la figura 16 es un diagrama de bloques de una terminal de multimedia H.324 genérica que incluye un codificador-decodificador de video que comprende un codificador de video y un decodificador de video, adaptado para poner en práctica los métodos de codificación y decodificación de video de conformidad con la invención.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN A fin de comprender mejor la invención y las ventajas que provee, una modalidad preferida de un método de codificación de video de conformidad con la invención se describirá a manera de ejemplo y por comparación de las figuras 7 y 8. La figura 7 ilustra una secuencia de video comprimido dispuesta de una manera convencional, mientras que la figura 8 ilustra una secuencia de video comprimido, construida de conformidad con el método de la invención. Ambas secuencias representan el mismo contenido de imagen y comprenden algunos cuadros consecutivos de video que forman parte de una secuencia más larga.
Igual que antes, los cuadros codificados en formato INTRA son marcados genéricamente mediante el uso del número de referencia 50, y los cuadros ÍNTER son referenciados por el número 54. El proceso de predicción hacia adelante por eí cual los cuadros ÍNTER son construidos es marcado con el número 53, de acuerdo con la convención anteriormente usada. Al principio de ambas secuencias hay un corte de escena 70. Aunque la siguiente descripción se concentra en la aplicación del método de conformidad con la invención en conexión con un corte de escena en una secuencia de video, se deberá apreciar que la invención se puede aplicar igualmente bien en cualquier situación que conduzca de manera convencional a la codificación de un cuadro en formato INTRA que incluya, pero no se limite a, cortes de escena, solicitudes de cuadro INTRA desde una terminal remota u operaciones de reposición de cuadro INTRA periódicas. La serie de cuadros mostrada en la figura 7 representa un esquema de codificación convencional en la cual un cuadro INTRA 50 se inserta en la secuencia inmediatamente después de un corte de escena 70. Cuando ocurre un corte de escena, el contenido de imagen subsecuente es sustancialmente diferente del que precede al corte. Por lo tanto, es ya sea imposible o poco práctico codificar el cuadro inmediatamente después del corte de escena como un cuadro ÍNTER, predicho hacia adelante desde el cuadro previo. Por lo tanto, de conformidad con este esquema de codificación convencional, un cuadro INTRA 50 (11) se inserta inmediatamente después del corte de escena. Los cuadros subsecuentes son después predichos hacia adelante (ÍNTER codificado) desde ese cuadro INTRA hasta que, por ejemplo, ocurre el siguiente corte de escena, solicitud INTRA periódica o solicitud de actualización de cuadro INTRA (70). Como se explicó en un principio, el método de conformidad con la invención se basa en la demora de inserción de un cuadro INTRA, como se ilustra en la figura 8. De conformidad con la invención, un cuadro INTRA no se inserta en el envío en paquetes de video inmediatamente, sino que más bien un cuadro que ocurre posteriormente en la secuencia de video se escoge para ser codificado en el formato INTRA. El cuadro es denotado como 11 en la figura 8. Como se puede ver en la figura 8, los cuadros entre el corte de escena 70 y 11 (marcado como P2 y P3 en la figura 8) se predicen como cuadros ÍNTER en orden inverso a partir de 11, como se indica mediante las flechas 80. Consecuentemente, no pueden ser decodificados antes de que 11 sea decodificado, ya que 11 necesita ser reconstruido antes de que se pueda llevar a cabo la codificadón del contenido de la imagen precedente. Esto significa que la demora de memoria intermedia inicial requerida durante la reproducción de la secuencia de video de conformidad con el método de la invención debe ser típicamente mayor que el tiempo entre el corte de escena y el cuadro INTRA siguiente. El principal beneficio de un método de conformidad con la invención se puede demostrar considerando cuántos cuadros deben ser exitosamente transmitidos para poder decodificar el cuadro ÍNTER P5. Con el uso del esquema de ordenamiento de cuadros convenaonal ilustrado en la figura 7, la decodificación exitosa de P5 requiere que 11 , P2, P3, P4 y P5 sean transmitidos y decodificados correctamente. Por lo tanto, la pérdida de datos (por ejemplo, una pérdida de paquete) temprano en la secuencia, por ejemplo en el cuadro 11, ocasionará errores en el contenido de imagen decodificada que se propagará a través de la secuencia hasta el cuadro P5. En el método de conformidad con la invención, la decodificacíón exitosa de P5 sólo requiere que 11, P4 y P5 sean transmitidos y decodificados correctamente. En otras palabras, mediante el uso del método de conformidad con la invención, la trayectoria de predicción en la secuencia de imagen es efectivamente reducida y consecuentemente la probabilidad de que el cuadro P5 sea correctamente decodificado se incrementa.
Además, la propagación temporal de errores dentro de la secuencia se reduce. La pérdida de datos temprano en la secuencia, por ejemplo, en el cuadro P2, sólo ocasionará errores en el contenido de imagen de codificada del cuadro P2 y P3. El método de codificación de video de conformidad con la invención se describirá ahora con detalle. La función de un codificador de video puesto en práctica de conformidad con el método de la invención se comparará y contrastará con la operación de un codificador de video convencional, cuya estructura de operación 90 se presenta en la figura 9. El decodificador de video de la técnica anterior 90, una imagen en bruto no codificada es enviada primero al codificador desde una fuente de video, tal como una cámara de video acoplada a una grabadora de cuadros, o un dispositivo de almacenamiento, tal como una unidad de disco duro de computadora en donde se almacenan cuadros de video en bruto. De manera alternativa, el codificador puede requerir que un nuevo cuadro sea comprimido, mediante el uso de un comando de control a la fuente de video o dispositivo de almacenamiento. Este proceso de adquirir un nuevo cuadro de video para compresión se ilustra en el paso 91 de la figura 9. La velocidad a la cual los cuadros no codificados son suministrados al codificador puede ser fija o puede variar. Típicamente, la velocidad de bits de una secuencia de video se puede reducir mediante salto de cuadros, es decir, omitiéndolos desde la secuencia de video. La decisión en cuanto a si un cuadro particular debe ser codificado o no, se hace por el algoritmo de control de velocidad de bits del codificador de video. Este proceso está representado por el paso 92 en la figura 9. Si la lógica de control de velocidad de bits determina que un cuadro dado ha de ser codificado, un codificador de video convencional enseguida decide el modo en el cual codificar el cuadro. El proceso de toma de decisiones está representado por el paso 94. En el caso en que se haya solicitado una reposición INTRA periódica, una solicitud de actualización de cuadro INTRA ha sido recibida desde una terminal remota, o un corte de escena ha ocurrido, el cuadro es codificado en formato INTRA, como se ilustra en el paso 98. De otra manera, el cuadro es codificado en formato de cuadro ÍNTER, paso 96. Para facilidad de comprensión, esta descripción se ha simplificado un poco y el manejo de otros tipos de cuadros, es decir, cuadros B bidireccionalmente predichos no se considera aquí. Sin embargo, esta simplificación no es significativa en términos de comprensión de la operación de un codificador de conformidad con la técnica anterior. Para fines de comparación, los elementos de procedimiento de un método de codificación de video de conformidad con la invención se ilustran en la figura 10. Elementos de un nuevo método que realiza funciones equivalentes al codificador de video de la técnica anterior que se describieron anteriormente se denotan por los mismos números de referencia que se usaron en conexión con la figura 9. Primero, un cuadro de video en bruto no codificado es enviado al codificador, o el codificador puede solicitar que se comprima un nuevo cuadro. Esto está representado por el paso 91 en la figura 10. Enseguida, el codificador determina (paso 94) si el contenido de imagen debe ser codificado en formato INTRA, por ejemplo, como resultado de un corte de escena, la expiración de un intervalo de recupera ón de cuadro INTRA periódico, o recepción de una solicitud de actualización de cuadro INTRA a partir de una terminal remota. De conformidad con la invención, si el codificador determina que un cuadro INTRA es solicitado por cualquier razón, hace un registro de que se necesita un cuadro INTRA, como se muestra en la figura 10, paso 101. Ese registro que indica que la necesidad de un cuadro INTRA, se puede hacer, por ejemplo, al fijar una bandera para el cuadro y almacenar la bandera en una memoria intermedia de cuadro. La forma en la cual se indica una solicitud para un cuadro INTRA se describe con detalle más adelante, aunque se deberá apreciar que la forma exacta en la cual una solicitud INTRA es indicada no es importante para la aplicación de la invención. El cuadro es después almacenado en memoria intermedia (102). El codificador de conformidad con la invención mantiene una memoria intermedia que se usa para almacenar datos de imagen en bruto antes de la compresión. Ventajosamente, la memoria intermedia es suficientemente grande para contener numerosos cuadros de imagen en bruto correspondientes a un periodo (T). Algunos datos denominados "meta" se asocian con cada cuadro de datos de imagen. Los datos meta proveen información acerca de los cuadros que han de ser codificados y pueden incluir la indicación de una solicitud de cuadro INTRA, como se describió antes, si se hace esa solicitud. Para cuadros que han de ser codificados en formato ÍNTER, los datos meta pueden incluir el número del cuadro de referencia que ha de ser usado para compensación de movimiento (si el cuadro de referencia no es el cuadro anteriormente codificado). Los datos meta para todos los cuadros contienen un número de orden de compresión CO, que indica el orden en el cual los cuadros de video no comprimidos han de ser codificados. Cada cuadro entrante es almacenado en la memoria intermedia. Inicialmente, antes de que empiece la codificación, la memoria intermedia está vacía. Cuando inida la codificación, la memoria intermedia se va llenado (102) hasta que contiene un número de cuadros correspondientes a un periodo T. La memoria intermedia es monitoreada para determinar cuando se llena (paso 103). Cuando la memoria completa está llena, el cuadro "más antiguo" es removido de la memoria intermedia, es decir, aquel que se cargó primero en la memoria intermedia. Esta operación está representada por el paso 104 en la figura 10. El codificador determina si el cuadro en cuestión está asociado con una solicitud de cuadro INTRA (paso 105), por ejemplo, al examinar los datos meta correspondientes del cuadro y determinar si se fija una bandera de solicitud INTRA. Si el cuadro no está asociado con una solicitud INTRA, el algoritmo de control de velocidad de bits del codificador decide si el cuadro debe ser saltado (paso 92) o si codifica el cuadro como un cuadro ÍNTER (cuadro 107). Si un cuadro es saltado y contiene una indicación de que un cuadro distinto al cuadro anterior se debe usar como referencia para compensación de movimiento, esa indicación es copiada a los datos meta que describen el siguiente cuadro en la memoria intermedia. Si se hace una decisión de no saltar el cuadro, se codifica en el formato ÍNTER (paso 107), mediante el uso del cuadro anterior en la secuencia como referencia, o aquel indicado como la referencia de compensación de movimiento por los datos meta.
Si el cuadro recuperado de la memoria intermedia está asociado con una solicitud de cuadro INTRA, se ejecuta un procedimiento de manejo de cuadro INTRA, denotado en general por el número de referencia 108. La figura 11 presenta los elementos de procedimiento del paso 108 en detalle. La solicitud de cuadro INTRA actual ocurre en el tiempo T1. El primer paso en el procedimiento de manejo de cuadro INTRA es buscar la memoria intermedia del cuadro para localizar la siguiente solicitud de cuadro INTRA, es decir, la solicitud de cuadro INTRA que sigue a la que está siendo actualmente procesada. Esto se ilustra mediante el paso 110 en la figura 11. El tiempo de ocurrencia T2 de la siguiente solicitud INTRA se determina a partir de sus datos meta asociados. Enseguida, el cuadro real que ha de ser codificado en formato INTRA se determina de tal manera que la diferencia en tiempo de los dos cuadros INTRA solicitados es aproximadamente igual. En otras palabras, si la solicitud INTRA actual está asociada con un cuadro cuyo tiempo de ocurrencia es T1 , se selecciona un cuadro de la memoria intermedia cuyo tiempo de ocurrencia T3, de tal manera que T3-T1 es aproximadamente igual a T2-T3. Este cuadro recién localizado se selecciona para codificarse en formato INTRA. El proceso apenas descrito es denotado por el número de referencia 112 en la figura 11. Se debe notar que de conformidad con la invención, el cuadro que es realmente codificado en formato INTRA (de aquí en adelante referido como el cuadro INTRA "real") no es aquel asociado con la solicitud de codificación INTRA inicial, sino generalmente algún otro cuadro que ocurre posteriormente en la secuencia de video. Si la memoria intermedia no contiene otro cuadro asociado con una solicitud de cuadro INTRA, el cuadro real que ha de ser codificado en formato INTRA se selecciona de modo que la diferencia en tiempo entre su tiempo de ocurrencia T3 y la solicitud INTRA en el tiempo T1 es aproximadamente igual a la diferencia en tiempo entre T3 y el último cuadro de la memoria intermedia. Enseguida, en el paso 114, el cuadro real que ha de ser codificado en formato INTRA es removido de la memoria intermedia y el orden de los cuadros que preceden el cuadro INTRA real es invertido. El cuadro que precede inmediatamente al cuadro INTRA real y que inmediatamente después es marcado de modo que contiene una indicación de que el cuadro INTRA real, se debe usar como una referencia para compensación de movimiento. Finalmente, el cuadro seleccionado para codificarse en formato INTRA es codificado como un cuadro INTRA (paso 116) y los cuadros restantes hasta el cuadro correspondiente a T2, pero sin incluir éste, son codificados mediante el uso de codificación pronosticadora temporal compensada. Aquellos cuadros que ocurren antes del cuadro INTRA real son codificados en orden inverso, los cuales empiezan desde el cuadro INTRA real, mientras que aquellos cuadros que ocurren después del mismo son codificados en la dirección hacia delante. Se debe apreciar que al invertir el orden de los cuadros que preceden al cuadro INTRA real no necesariamente se requiere reordenamiento físico de la memoria intermedia. Como se describirá con más detalle más adelante, la invención efectiva dentro de los cuadros de la memoria intermedia se puede lograr mediante el uso de un número de orden de compresión (CO) asignado a cada cuadro. A fin de comprender en forma más completa el procedimiento de manejo de cuado INTRA anteriormente descrito, es ventajoso considerar un ejemplo. Aquí se supone que el codificador de video de un sistema de captura y recuperación de video ha sido diseñado para poner en práctica el método de conformidad con la invención. El codificador incluye una memoria intermedia capaz de almacenar cinco segundos (más un cuadro) de datos de video en formato no comprimido. El codificador es suministrado con cuadros de video no comprimidos (es decir, en bruto) por una fuente de cuadro de video, a una velocidad constante de 25 cuadros por segundo y por lo tanto la diferencia en tiempo entre los cuadros consecutivos es consistentemente de 40 milisegundos. En un instante de tiempo arbitrario dentro de la secuencia, el contenido de la memoria intermedia es como se muestra en la tabla 1 : TABLA 1 E em lo de contenido de memoria intermedia del codificador de video En la tabla 1 , el tiempo de reproducción/captura de un cuadro de video en bruto dado está indicado en milisegundos con referencia el tiempo t. Como se describió antes, los datos meta se usan para almacenar información adicional acerca de los cuadros de vídeo no comprimidos, que incluye el número de orden de compresión (CO) que se usa para indicar el orden en el cual los cuadros han de ser comprimidos y descomprimidos. En la secuencia de video particular considerada en este ejemplo, no hay cortes de escena, sino más bien una recuperación INTRA periódica se requiere cada 5 segundos. Asociadas con la solicitud de cuadro INTRA se presentan indicaciones en los datos META provistas con cada cuadro de video no comprimido. Como se puede ver a partir de la tabla 1 , para los propósitos de este ejemplo, se supone que una solicitud INTRA inicial ocurre en el tiempo t. Puesto que las solicitudes INTRA se hacen cada 5 segundos, la siguiente solicitud ocurrirá en t+5000 ms. Los datos meta provistos con los cuadros de video no comprimidos permite al codificador determinar cuando se hacen las solicitudes INTRA. Mediante el uso del método de conformidad con la invención, el codificador no aplica codificación INTRA a los cuadros directamente asociados con solicitudes INTRA, sino que selecciona un cuadro que ha de ser codificado en formato INTRA aproximadamente a la mitad del tiempo entre la solicitud INTRA actual y la siguiente solicitud INTRA. Se debe apreciar que no es necesariamente posible seleccionar un cuadro exactamente equidistante entre las solicitudes INTRA consecutivas, ya que esto depende del intervalo de tiempo entre solicitudes INTRA sucesivas y la velocidad de cuadro de la secuencia de video. En el ejemplo que aquí se da, en donde los cuadros se separan por 40 ms y las solicitudes INTRA ocurren a intervalos regulares de 5000 ms, los cuadros más apropiados que han de ser codificados en formato INTRA, de acuerdo con la invención, son aquellos que ocurren a t+2480 ms o t+2520 ms (véase tabla 1). Por lo tanto, el codificador puede seleccionar ya sea el cuadro que ocurre a t+2480 o aquel que ocurre a t+2520 ms para ser el cuadro INTRA real. Cualquiera de estos dos cuadros se puede considerar una elección igualmente apropiada para codificarse en formato INTRA. El criterio usado para decidir la elección de cuadro INTRA real puede variar de acuerdo con la aplicación del método, pero en este caso se supone que el cuadro que ocurre a t+2480 ms se escoge como el cuadro INTRA real. Ventajosamente, el codificador enseguida asigna números de orden de compresión (CO) a los cuadros no comprimidos en la memoria intermedia. Todos los cuadros en la memoria intermedia se marcan con números de orden de compresión que se refieren al cuadro INTRA real, es decir, aquel cuadro previamente escogido para ser codificado en formato INTRA. Preferiblemente, esta información de orden de compresión se almacena en los datos meta asociados con cada cuadro, como se muestra en la tabla 2.
TABLA 2 Contenido de memoria intermedia de video de ejemplo después de la asignación de número de orden de compresión y selección de imagen de referencia Los cuadros no comprimidos que preceden al cuadro INTRA real en la memoria intermedia del codificador se les da número de orden de compresión secuencialmente de tal manera que los cuadros que ocurren temprano en la memoria intermedia reciben números de orden de compresión más grandes. Al cuadro INTRA real se da el número de orden de compresión CO=0. De esta manera, en el ejemplo aquí considerado, al cuadro que precede inmediatamente al cuadro INTRA real (es decir, aquel que ocurre a t+2400 ms) se da el número de orden de compresión CO=1. El cuadro anterior a este recibe el número de orden de compresión CO=2, al que está antes que éste se da el número de orden de compresión CO=3 y así sucesivamente. En el ejemplo aquí considerado, el esquema de mareaje da por resultado el primer cuadro en la memoria intermedia que recibe un número de orden de compresión de CO=62. Será evidente para un experto en la técnica que este esquema de mareaje indica de manera efectiva que los cuadros que preceden al cuadro INTRA real deben predecirse en orden inverso desde el cuadro INTRA real y no hacia adelante desde el cuadro que estaba asociado con la solicitud INTRA inicial (es decir, aquel que ocurre en el tiempo t). El número de orden de compresión del cuadro que sigue inmediatamente al cuadro INTRA real (es decir, aquel que ocurre a t+2520 ms), y los número de orden de compresión de cuadros subsecuentes, siguen en secuencia del número de orden de compresión del cuadro más temprano en la secuencia que precede al cuadro INTRA real. Por lo tanto, en el ejemplo aquí considerado, el cuadro de video no comprimido que ocurre inmediatamente después del cuadro INTRA real en la memoria intermedia del cuadro del codificador se da el número de orden de compresión CO=63, el cuadro que sigue a éste recibe el número de orden de compresión CO=64, al siguiente cuadro se da el número de orden de compresión CO=65 y así sucesivamente. Además, de conformidad con el método de la invención, el cuadro que sigue inmediatamente al cuadro INTRA real es marcado de tal manera que su imagen de referencia (el cuadro a partir del cual se ha de predecir) no es el cuadro con el número de orden de compresión anterior, sino el cuadro INTRA real con el número de orden de compresión CO=0. Ventajosamente, esta indicación se incluye en los datos meta asociados con el cuadro que ocurre inmediatamente después del cuadro INTRA real. En el ejemplo que aquí se presenta, esto significa que el cuadro que recibe inmediatamente después del cuadro INTRA real, que tiene números de orden de compresión CO=63, no se predice del cuadro con número de orden de compresión CO=62, sino el cuadro INTRA real mismo, que tiene el número de orden de compresión CO=0. El contenido de la memoria intermedia de video, después de la asignación de números de orden de compresión, se muestra en la tabla 2. El codificador enseguida remueve el cuadro INTRA real de la memoria intermedia, reordena la memoria intermedia de acuerdo con los números de orden de compresión previamente asignados y codifica el cuadro INTRA seleccionados (es decir, real). Se hace énfasis en que el requerimiento para reordenamiento físico de la memoria intermedia depende del tipo de memoria intermedia usada. Si el codificador puede buscar la memoria intermedia y tener acceso a su contenido en forma aleatoria (es decir, la memoria intermedia es alguna memoria intermedia de acceso aleatorio), entonces los cuadros se pueden seleccionar directamente para codificación en el orden indicado por los números de orden de compresión y no se requiere reordenamiento físico. Si, por otra parte, como se supone en este ejemplo, es más fácil tener acceso a la memoria intermedia de una manera de primero entrada - primero salida (FIFO) el reordenamíento físico de los cuadros de acuerdo con el número de orden de compresión es benéfico. El cuadro INTRA real se puede codificar usando cualquier método adecuado. La exacta elección del método de codificación puede depender, por ejemplo, de las características del canal de comunicación que se usarán para transmisión subsecuente de los datos de video comprimido. La velocidad de bits disponible es un criterio posible que podría determinar la elección del método de codificadón. Por ejemplo, en un sistema de recuperación de video en línea fija o de videotelefonía, puede ser apropiado codificar el cuadro INTRA seleccionado (rea!) de acuerdo con la recomendación H.261 de ITU-T, que se designa específicamente para proveer rendimiento óptimo en sistemas de comunicaciones con una velocidad de bits disponible de p x 64 kbits/s. En forma alternativa, si los datos de video se han de incluir en un flujo de bits de multimedia, la codificación de acuerdo con el estándar de MPEG40 podría ser más apropiado. En comunicaciones de velocidad de bits muy baja y particularmente en canales de radiocomunicaciones, la recomendación H.263 de ITU-T es otro esquema de codificación de video alternativo. Después de la operación de reordenamiento anteriormente descrita, el contenido de la memoria intermedia se muestra en la tabla 3.
TABLA 3 Contenido de la memoria intermedia de video de ejemplo después del reordßnamiento Los cuadros restantes en la memoria intermedia (excepto el cuadro correspondiente a t+5000) se codifican en formato ÍNTER, la secuencia en la cual los cuadros se predicen uno de otros es determinada por su número de orden de compresión y la información referente a la selección de imagen de referencia provista en los datos meta asociados. Nuevamente, los detalles exactos de la codificación ÍNTER usada no son importantes para la aplicación del método de conformidad con la invención. Debido a que el orden en el cual los cuadros de video son purificados se determinar por sus números de orden de compresión asignados, el proceso de codificación ahora procede de la siguiente manera. Los cuadros con número de orden de compresión CO=1 a CO=62 se predicen en secuencia, uno del otro, lo cual empieza a partir del cuadro INTRA real (orden de compresión CO=0). En otras palabras, el cuadro con el número de orden de compresión CO=1 es INTER-codificado usando el cuadro INTRA como una imagen de referencia, el cuadro con número de orden de compresión CO=2 se predice a partir del cuadro INTER-codificado decodificado cuyo número de orden de compresión es CO=1 y así sucesivamente. Este proceso parece ser de pronóstico hacia adelante. Sin embargo, debido al hecho de que a los cuadros no comprimidos se dan números de orden de compresión en orden inverso, los cuadros CO=1 a CO=62 se predicen de manera efectiva en orden inverso a partir de cuadro INTRA real. Este proceso continúa hasta que se alcanza el cuadro con número de orden de compresión CO=63. Este cuadro debe ser codificado en formato ÍNTER, predicho hacia adelante a partir del cuadro INTRA real (CO=0) y no se debe predecir a partir del cuadro CO=62. En el método de conformidad con la invención, esto se indica en los datos meta asociados con el cuadro CO=63. Los datos meta indican que el número de orden de compresión de la imagen de referencia que ha de ser usada en la codificación pronosticadora ÍNTER del cuadro CO=63 es CO=0, el cuadro INTRA real. Una vez que el origen de predicción se ha reiniciado al cuadro CO=0, el codificador sigue codificando los cuadros de video no comprimidos restantes en la memoria intermedia (aquellos con números de orden de compresión de CO=63 a CO=124) en secuencia, uno del otro. En otras palabras, el cuadro CO=63 es codificado en formato ÍNTER mediante el uso de CO=0 (es decir, el cuadro INTRA real) ya que su imagen de referencia, cuadro CO=64 se predice a partir de CO=63, cuadro CO=65 se predice a partir de CO=64 y así sucesivamente. En la descripción anterior, el método de codificación de video de conformidad con la invención se describió mediante el uso de un ejemplo en el cual la secuenda de video se codificó sobre la base de principalmente dos tipos de cuadro de video, cuadros INTRA no temporalmente predichos y cuadros ÍNTER temporalmente predichos. Sin embargo, un experto en la técnica deberá apreciar que el método también se puede extender en una forma tal que incluya el uso de otros tipos de cuadro de video. Específicamente, las imágenes B que emplean predicción temporal en las direcciones hacia adelante, inversa o tanto hacia adelante como inversa también se pueden usar en conexión con la presente invención. En otras palabras, el cuadro INTRA real o cualquiera de los cuadros de formato ÍNTER predichos en orden inverso a partir del cuadro INTRA real se pueden usar como imágenes de anclaje para la construcción de imágenes B. Las imágenes B se puede construir mediante el uso de predicción hacia adelante, predicción inversa o una combinación de las dos. De manera similar, las imágenes B también se pueden incluir en la parte de la secuencia que comprende cuadro de formato ÍNTER predichos hacia adelante a partir del cuadro INTRA real. El procedimiento apenas descrito permite que los cuadros individuales de datos de video sean codificados de una manera directa con referencia al cuadro INTRA selecdonado (real). Sin embargo, aunque la codificación de cuadros de video de acuerdo con su número de orden de compresión asignado facilita el proceso de codificación, puede dar origen a un problema cuando se decodifican los cuadros. Específicamente, los cuadros de video no pueden ser codificados en el orden correcto para reproducción. Esto se puede apreciar viendo los tiempos de reproducción/captura mostrados en la tabla 3. De esta manera, cuando los cuadros son codificados y subsecuentemente transmitidos en un canal de comunicación a un decodificador en este orden, el decodificador reordena los cuadros de acuerdo con su tiempo de reproducción pretendido para asegurar que son reproducidos en la secuencia correcta. Este proceso se describirá con más detalle más adelante en el texto, pero aquí se nota que la información está asociada con cada cuadro referente a su tiempo de reproducción deseado en el decodificador. Este es transmitido al decodificador junto con los datos de imagen mismos y los datos meta que incluyen el número de orden de compresión para cada cuadro. Se debe notar que en ciertas redes conmutadas en paquetes, los paquetes de datos no pueden llegar al receptor en el mismo orden en el cual son transmitidos. Algunos protocolos de transmisión, tales como RTP (protocolo de transmisión confiable), proveen una indicación del orden en el cual los paquetes de datos son transmitidos, y que se denominan "numeración de secuenda". Esto permite que los paquetes de datos sean ensamblados en su orden correcto en el receptor. En este tipo de sistemas, es estrictamente innecesario enviar el número de orden de compresión con los datos de video, ya que el orden en el cual los cuadros de video son codificados pueden ser implicados desde la numeración de secuencia de los paquetes de datos recibidos. Sin embargo, en sistemas en donde no se provee numeración de secuencia por el protocolo de trasmisión, la transmisión de información de orden de compresión es necesaria. La información acerca del tiempo de reproducción programado de cada cuadro de video pueden incorporarse fácilmente en el archivo o en las cabeceras de formato de multiplexión/transmisión usadas cuando se transmiten los datos de video en un enlace de comunicaciones y se pueden incluir en el formato de codificación de video/sintaxis misma. Puesto que la invención esencialmente retrasa la inserción del cuadro INTRA después de una solicitud INTRA, también es necesario que los cuadros ÍNTER predichos en dirección hacia atrás sean desplegados antes del cuadro que es realmente codificado en el formato INTRA. En una modalidad alternativa del método de conformidad con la invención, como se ilustra en ia figura 14, se pueden usar cuadros B. Este enfoque puede ser ventajoso en situaciones en donde la sintaxis de video comprimido o el archivo o formato de transmisión circundante no permite la reproducción de cuadros predichos en orden inverso (por ejemplo, cuadros P2 y P3 INTER-codificados en la figura 8) antes del siguiente cuadro de anclaje (11). Típicamente, como por ejemplo en la recomendación H.263 de ITU-T, los cuadros B soportan la predicción en dirección hacia atrás, hacia adelante o bidireccional. De esta manera, el método de codificación de conformidad con la invención se puede poner en práctica usando cuadros B predichos en dirección hacia atrás a partir del siguiente cuadro de anclaje (11). Sin embargo, esta técnica provee eficiencia de compresión peor que el método anteriormente descrito en la modalidad preferida de la invención. Con referencia a la figura 14, el método de codificación de conformidad con esta modalidad alternativa de la invención procede de una manera similar a la modalidad preferida, siempre que el punto en el cual el cuadro INTRA real haya sido selecdonado. Los cuadros que preceden al cuadro INTRA real en la memoria intermedia del codificador son después codificados como cuadros B 52, cada cuadro B siendo predicho en dirección hacia atrás 51b directamente a partir de cuadro INTRA real, como se muestra en la figura 14. Puesto que la predicción en dirección hacia atrás de los cuadros B es ya soportada por recomendaciones de codificación de video, tales como H.263 de ITU-T, en esta modalidad alternativa no es necesario asignar números de CO ordenados inversos a los cuadros que preceden el cuadro INTRA real. Basta con indicar que cada uno de los cuadros sea codificado en formato de cuadro B mediante el uso del cuadro INTRA real como la referencia de predicción. Esta información se puede incluir en los datos meta asociados con cada cuadro que precede al cuadro INTRA real. Aquellos cuadros que siguen al cuadro INTRA real en la memoria intermedia son después codificados en formato ÍNTER, uno del otro. Una indicación que el cuadro INTRA real ha de usar como la referencia de predicción para el cuadro que sigue inmediatamente al cuadro INTRA real se incluye en los datos meta para ese cuadro. Otra modalidad alternativa del método se puede usar en situaciones en donde el método de compresión de video no soporta la selección de imagen de referencia. En este caso, el estrato (por ejemplo, programa de control) que controla o requiere el codificador-decodificador de video puede reemplazar el contenido de la memoria intermedia del cuadro de referenda del codificador-decodificador con el cuadro INTRA real en un tiempo inmediatamente antes al instante se debe referenciar. Haciendo referencia al ejemplo presentado en detalle anteriormente, esto significa que la memoria intermedia del cuadro de referencia debe ser cargada con el cuadro CO=0 cuando empieza a codificar o decodificar el cuadro CO=63. Para permitir esta modalidad alternativa de la invención, las sintaxis de video comprimido, o formato de multiplexión/transmísión debe portar información que identifique al cuadro INTRA real y cual de los cuadros la requiere como referencia. Enseguida, modalidades ilustrativas de un método de decodificación y un método de reproducción de video adecuado para usarse junto con el método de codificación de video ya presentado se describirá. Un método de decodificación de acuerdo con la invención se ilustra en la figura 12. En el proceso de decodificación, el decodificador recibe cuadros codificados a partir del canal de transmisión y coloca en memorias intermedias (120) los cuadros. El decodificador entonces decodifica los cuadros que están almacenados en memoria intermedia 122. En este contexto, el canal de transmisión puede ser cualquier canal de comunicación adecuado para transmisión de datos de video comprimido o multimedia. La transmisión puede tener lugar a través de una red de línea fija tal como la Internet, ISDN o PSTN (red de teléfono conmutado público); alternativamente, por lo menos parte de la red puede comprender un enlace de radio, de tal manera que sea provisto por PLMN (red móvil terrestre pública). El término genérico "canal de transmisión" se debe entender para incluir la transmisión de datos que tiene lugar cuando los archivos almacenados son recuperados de un medio de almacenamiento, por ejemplo, de una unidad de disco duro de computadora para despliegue o procesamiento posterior. Cada cuadro de la secuencia de video comprimida es decodificada de una manera esencialmente estándar, bien conocida por los expertos en la técnica, de acuerdo con el método en el cual se codificó. Esto es posible debido a que el método de conformidad con la invención no necesariamente hace cambios al formato de los cuadros INTRA e INTER-codificados mismos. Por lo tanto, la codificación de cuadros de video no comprimidos individuales puede tener lugar de acuerdo con cualquier esquema apropiado, estandarizado o de propiedad, como se explicó antes. Después de la codificación, los cuadros no comprimidos se almacenan (124) en una memoria intermedia de reproducción. Si la longitud de la memoria intermedia usada en el codificador es T (véase la definición anterior de la fase de codificación), la memoria intermedia usada en el decodificador debe ventajosamente poderse mantener a por lo menos 0.5 x T segundos de imágenes de video no comprimido. Enseguida, los cuadros de video descomprimidos son ordenados en su secuencia de reproducción correcta. El decodificador ordena los cuadros mediante el uso de la información de tiempo de reproducción asociada con cada cuadro. Como se describió antes, esta información se puede incorporar en la estructura de datos cuando se almacenan los cuadros de video en la memoria intermedia del codificador y se pueden llevar a cabo dentro de la sintaxis de video comprimida o mediante el uso del formato de multiplexión/transmisión cuando se transmiten los cuadros de- video comprimidos ai decodificador. En algunas situaciones, por ejemplo cuando el resultado del canal de comunicaciones cae, el decodificador realmente puede recibir el cuadro después de su tiempo de reproducción programado. Si un cuadro es recibido después de su tiempo de reproducción programado, o si es recuperado antes de su tiempo de reproducción programado no puede ser decodificado lo suficientemente rápido para asegurarse de que sea reproducido en forma puntual, entonces dicho cuadro puede no ser almacenado en la memoria intermedia de entrada del decodificador en absoluto. Sin embargo, debe ser ventajoso almacenar cuadros que lleguen tarde, o que no puedan ser decodificados en el tiempo para su reproducción programada, como se pueden usar, por ejemplo, para mejorar el ocultamiento de error para otros cuadros. Los pasos de procedimiento de una "máquina" de reproducción de video de conformidad con una modalidad ilustrativa de la invención se presentan en la figura 13. La máquina de reproducción recibe como su entrada cuadros de video descomprimidos, correctamente ordenados de acuerdo con sus tiempos de reproducción programados, de la memoria intermedia 124 del decodificador de video. Cuando la reproducción de una nueva secuencia de video empieza, los cuadros de video entrantes son guardados en la memoria intermedia en una memoria intermedia de reproducción 132. A fin de asegurar la reproducción de la secuencia de video sin pausas, ese tiempo de memoria intermedia inicial debe ser por lo menos de aproximadamente 0.5 x T segundos. Después del tiempo de memoria intermedia inicial, el proceso de reproducción entra al bucle de reproducción normal, que comprende los pasos 134, 136 y 138. El primer paso del bucle 134 determina si hay un cuadro en la memoria intermedia de reproducción programada para ser reproducida de nuevo. Si existe dicho cuadro, se despliega 136. Si dicho cuadro no existe, o si el cuadro ha sido desplegado, el proceso entra a una estera periódica o estado de odo 138. Ventajosamente, la velocidad de operación del bucle de reproducción es la velocidad de cuadro (máxima) de la secuencia capturada original. Por ejemplo, si una secuencia es capturada a una velocidad de 25 cuadros por segundos, el bucle de reproducción es ejecutado cada 40 milisegundos. La figura 15 presenta una modalidad ilustrativa de un sistema de creación de contenido de multimedia de conformidad con la invención. Aquí, se muestra el sistema que incluye tres fuentes de medios 10: una fuente de audio 151a, una fuente de video 151b y una fuente de datos 151b. Será evidente para un experto en la técnica que el número de fuentes de medios no se limita a los tres ejemplos aquí presentados. También es evidente que cada fuente pueda tomar un número de formas diferentes, incluyendo pero sin limitarse a, fuentes de contenido de medio "en vivo" es decir tiempo real y fuentes de medio de tiempo no real, tales como archivos de contenido de medios que residen en un medio de almacenamiento en masa, por ejemplo, un dispositivo de disco duro en red o similar. El sistema de creación de contenido de multimedia de conformidad con la invención incluye medios de captura de multimedia, denotados generalmente por el número de referencia 20. En la modalidad ilustrativa aquí presentada, el equipo de captura dedicado se provee para cada fuente de medio. Por lo tanto, los medios de captura 20 incluyen equipo de captura de audio 152a, equipo de captura de video 152b y equipo de captura de datos 152c. El equipo de captura de audio puede incluir, por ejemplo un micrófono, un convertidor de análogo a digital y electrónicas de procesamiento de seña para formar cuadros de datos de audio digital izados. El equipo de captura de video, como se describió anteriormente, puede incluir una tarjeta grabadora de video para producir cuadros de video digitales a partir de una entrada de video análogo. Para cada fuente de medios, el equipo de captura también puede incluir software tal como unidades de dispositivo dedicados y programas de aplicación necesarios para operación de control de la fuente de medio y su equipo de captura asociado. La salida de los medios de captura de multimedia 20 es una serie de flujos de media no comprimidos, cada flujo correspondiente a una de las fuentes de medios 151a-151c. Alternativamente, si una o más de las fuentes de medios provee su contenido en una forma ya adecuada para aplicarse al editor de contenido de multimedia 22, este contenido de medios se puede aplicar directamente al editor.
Este puede ser el caso, por ejemplo, cuando la fuente de medio es un archivo de, por ejemplo, cuadros de audio o video recuperados en forma digital a partir de archivos almacenados en un medio de almacenamiento en masa. El editor de contenido de multimedia 22 recibe los flujos de media separados provistos por lo medios de captura de multimedia y los enlaza en conjunto en una sola línea de tiempo. Por ejemplo, los flujos de multimedia que serían reproducidos en forma sincrónica, tales como contenido de audio y video, son enlazados al proveer indicaciones de cada tiempo de reproducción deseado del cuadro. Las indicaciones referentes al tiempo de reproducción deseado de otros flujos de multimedia también se puede proveer. Una vez enlazado de esta manera, cada componente del contenido de multimedia se refiere como una "pista". El editor 22 también puede proveer una posibilidad para editar las pistas de medios en varias formas. Por ejemplo, la velocidad de cuadros de video se puede reducir a la mitad o la resolución espacial de imágenes de video se puede reducir. Del editor 22, las pistas de medios son recibidas por una unidad de codificación 24. En la modalidad ilustrativa que aquí se presenta, cada pista es codificada independientemente de una manera apropiada para el tipo de medio en cuestión y se proveen codificadores individuales para cada tipo de medio. Por lo tanto, en este ejemplo, se proveen tres codificadores, un codificador de audio, 157a, un codificador de video 157b y un codificador de datos 157c. Nuevamente, se apreciará que el número preciso de codificadores individuales no es importante para la aplicación del método de conformidad con la invención. También se debe notar que en el caso del codificador de datos, el método de codificación puede diferir dependiendo de la naturaleza de los datos. Los codificadores respectivos remueven información redundante en cada una de las pistas de medios de modo que son representadas en una forma más compacta, adecuada, por ejemplo, para transmisión en un enlace de comunicaciones que tiene un ancho de banda limitado. Las técnicas de compresión usadas pueden incluir métodos de compresión sin pérdida y con pérdida. Las pistas de audio y datos se pueden codificar mediante el uso de cualquier método apropiado, cuya elección puede depender de la naturaleza del canal de comunicaciones usado o además transmitir los datos de multimedia a un cliente receptor. Por ejemplo, la pista de audio puede ser codificada mediante el uso de un codificador-decodificador de voz GSM EFR. El codificador de video 157b se aplica de acuerdo con el método presentado en un principio en este texto. Emplea predicción temporal compensada en movimiento y, como se describió en un principio, opera de tal manera que reduce la trayectoria de predicción usada dentro de secuencias de imagen de acuerdo con el método de la invención, al proveer la pista de video comprimido con mayor flexibilidad a errores que resultan de la pérdida de datos. Las pistas de medios comprimidas creadas por la unidad de codificación 24 son recibidas por un multiplexor 26. Aquí son intercaladas de manera que forman un flujo de bits individual, referido como un "clip" de multimedia. El clip es después enviado a un servido de multimedia 14, desde donde puede ser transmitido además en un enlace de comunicaciones a un cliente receptor. La figura 16 presenta una situación alternativa en la cual el método de conformidad con la invención se puede adoptar. La figura ilustra una terminal de multimedia 160 aplicada de acuerdo con la recomendación H.324 de ITU-T. La terminal puede referirse como un dispositivo transmisor-receptor de multimedia. Incluye elementos que capturan, codifican y multiplican flujos de datos de multimedia para transmisión a través de una red de comunicaciones, así como elementos que reciben, desmultiplexan, decodifican y reproducen contenido de multimedia recibido. La recomendación H.324 de ITU-T define la operación de la terminal como un todo y se refiere a otras recomendaciones que gobiernan la operación de los diversos elementos del equipo terminal. Típicamente, la terminal de multimedia se usa en aplicaciones de multimedia de tiempo real tales como videotelefonía, aunque su uso de ninguna manera está limitado a esa aplicación. Por ejemplo, una terminal de multimedia de H.324 también se puede usar como un cliente de recuperación de contenido de multimedia para descargar o enviar contenido de multimedia desde por ejemplo un servidor de contenido de multimedia. En el contexto de la presente invención, se apreciará que la terminal H.324 mostrada en la figura 16 es sólo uno de un número de aplicaciones de terminal de multimedia alternativas adecuadas para aplicar el método de la invención. También se debe notar que existe un número de alternativas en relación con la localización y aplicación del equipo terminal. Como se ¡lustra en la figura 16, la terminal de multimedia puede ser localizada en equipo de comunicaciones conectado a una red de teléfono de línea fija tal como un PSTN análogo (red de teléfono conmutado público). En este caso, la terminal de multimedia es equipada con un módem 171 , de acuerdo con las recomendaciones V.8, V.34 de ITU-T y opcionalmente V.8bis. Alternativamente, la terminal de multimedia puede ser conectada a un módem externo. El módem permite la conversión de los datos digitales multiplexados y señales de control producidas por la terminal de multimedia en una forma análoga adecuada para transmitirse en el PSTN. Además, permite que la terminal de multimedia reciba datos y control de señales en forma análoga del PSTN y la convierta en un flujo de datos digital que puede ser desmultiplexado y proceso de una manera apropiada por la terminal. Una terminal de multimedia H.324 también puede ser aplicada de tal manera que se pueda conectar directamente a una red de línea fija digital, tal como un ISDN (red digital de servicios integrados). En este caso, la terminal se aplica de acuerdo con H.324/I (anexo D de la recomendación H.324 de ITU-T) y el módem 171 es reemplazado por una interfaz de red de usuario ISDN de acuerdo con la serie de recomendaciones 1.400 de 1TU-T. En la figura 16, esta interfaz de red de usuario ISDN está representada por el bloque 172. Las terminales de multimedia H.324 también se pueden aplicar para usarse en aplicaciones de comunicaciones móviles. El anexo C de la recomendación H.324 presenta un número de modificaciones que adaptan una terminal H.324 para usarse en ambientes de transmisión sujetos a errores. La mayoría de estas modificaciones se aplican específicamente al protocolo de multiplexión usado para combinar flujos de datos (recomendación H.223 de ITU-T) y están diseñados para producir un flujo de bits que es más fuerte a la pérdida de datos y corrupción debido a errores de canales. Aunque el uso de estas modificaciones no se restringe a comunicaciones móviles, son particularmente adecuadas para usarse en aplicadones móviles debido a las velocidades de error de bits comparativamente altas típicamente experimentadas en este tipo de enlace de comunicaciones. El anexo C de H.324 también establece (párrafo C.3) que en las aplicaciones móviles, el módem 171 puede ser reemplazado por cualquier interfaz inalámbrica apropiada, como lo representa el bloque 173 en la figura 16. Por lo tanto, una terminal de multimedia móvil puesta en práctica de acuerdo con el anexo C de H.324 (comúnmente referida como una terminal H.324/M) puede incorporar una parte de radio adecuada para usarse en cualquier red de telecomunicaciones móviles actuales futuras. Por ejemplo, una terminal de multimedia H.324/M puede incluir un transmisor-receptor de radio que permita la conexión a la red de teléfono móvil GSM de segunda generación actual, o al UMTS de tercera generación propuesto (sistema de teléfono móvil universal). Sin embargo, la terminal de multimedia se aplica y no importa donde esté ubicada, es probable que intercambie su contenido de multimedia con una red de comunicaciones que comprenda tanto enlaces de telecomunicaciones conmutada como basada en paquetes y que pueda incluir una red de telecomunicaciones móvil que incluya un enlace de radio. Por ejemplo, una terminal de multimedia H.324/I conectada a una red ISDN puede formar una conexión con una terminal H.324/M en una red de teléfono móvil PLMN. Los datos de multimedia transmitidos entre las terminales a través de la red se someterán a varias fuentes de error y pérdida de datos. Estos es probable que incluyan errores de reversificación de bits, por ejemplo, debido a la interferencia que afecta el enlace de radiocomunicaciones y pérdida de paquetes debido a posible congestión en la red de ISDN de núcleo. Por lo tanto, es ventajoso poner en práctica los codificadores de video de las terminales de multimedia comunicadoras de tal manera que provean un flujo de bits de video con un alto grado de flexibilidad a errores de transmisión. Como se describió en un principio en el texto, el método de codificación de video de conformidad con la presente invención provee secuencias de video comprimidas mediante el uso de técnicas de predicdón con flexibilidad a errores adicional. Por lo tanto, es idealmente adecuado para la aplicación en terminales de multimedia y particularmente en dispositivos que es probable que se usen en canales de comunicación susceptibles a errores. Se debe notar que en terminales de multimedia diseñadas para comunicación en dos sentidos, es decir, para transmisión y recepción de datos de video, es necesario proveer tanto un codificador de video como un decodificador de video aplicado de conformidad con la presente invención. Debido a que un codificador de video de conformidad con una modalidad de la invención puede cambiar el orden en el cual los cuadros son comprimidos, es necesario que el decodificador de video de la terminal receptora ordene los cuadros recibidos correctamente antes de desplegarlos. Por lo tanto, una terminal de multimedia típica de conformidad con la invención incluirá un par de codificador/decodificador que ponga en práctica los métodos de codificación/decodificación anteriormente descritos. Dicho par de codificador y decodificador a menudo se aplica como una unidad funcional combinada individual referida como un codificador-decodificador.
Por otra parte, si la terminal de multimedia está diseñada para usarse únicamente como un cliente de recuperación de multimedia, es necesario únicamente incluir un decodificador puesto en práctica .de conformidad con la presente invención. Una terminal de multimedia H.324 se describirá ahora con detalle adicional con referencia a la figura 16. La terminal de multimedia 160 incluye una variedad del denominado "equipo terminal". Este incluye dispositivo de video, audio y telemática, denotados genéricamente por los números de referencia 161 , 162 y 163, respectivamente. El equipo de video 161 puede incluir, por ejemplo, una cámara de video para capturar imágenes de video, un monitor para desplegar el contenido de video recibido y equipo de procesamiento de video opcional. El equipo de audio 162 típicamente incluye un micrófono, por ejemplo, para capturar mensajes hablados, y una bocina para reproducir el contenido de audio recibido. El equipo de audio también puede incluir unidades de procesamiento de audio adicionales. El equipo de telemática 163, puede incluir una terminal de datos, un teclado, una tarjeta electrónica o incluso un transmisor-receptor de imagen, tal como una unidad de fax. El equipo de video es acoplado a un codificador-decodificador de video 165. El codificador-decodificador de video comprende un codificador de video y un decodificador de video correspondiente. Es responsable de codificar datos de video capturados en una forma apropiada para transmisión posterior en un enlace de comunicaciones y decodificar el contenido de video comprimido recibido de la red de comunicaciones. En el ejemplo ilustrado en la figura 16, el codificador-decodificador de video se aplica de acuerdo con la recomendación H.263 de ITU-T, que es particularmente adecuada para usarse en aplicaciones de video conferen a de velocidad de bits baja, en donde el enlace de comunicaciones es un canal de radio con una banda ancho disponible de por ejemplo, 20 kbps. De manera similar, el equipo de audio de la terminal es acoplado a un codificador-decodificador de audio, denotado en la figura 16 por el número de referencia 166. En este ejemplo, el codificador-decodificador de audio se aplica de acuerdo con la recomendación G.723.1 de ITU-T. Igual que con el codificador-decodificador de video, el codificador-decodificador de audio comprende un par de codificador/decodificador. Convierte datos de audio capturados por el equipo de audio de la terminal en una forma adecuada la transmitirse en el enlace de codificaciones y transforma datos de audio codificados recibidos de la red de nuevo hacia una forma adecuada para reproducción, por ejemplo, en la bocina de la terminal. La salida del codificador-decodificador de video se hace pasar a un bloque de demora 167. Este compensa las demoras introducidas por el proceso de codificación de video y de esta manera asegura la sincronización de contenido de audio y video. El bloque de control del sistema 164 de la terminal de multimedia controla la señalización de terminación a red para establecer un modo común de operación entre una terminal transmisora y una receptora. H.324 especifica que la señalización de extremo a extremo se ha de realizar mediante el uso de un protocolo de control definido en la recomendación H.245 de ITU-T. El protocolo de control H.245, denotado por el número de referencia 168 en la figura 16, intercambia información a cerca de las capacidades de codificación y decodificación de las terminales transmisoras y receptoras y se puede usar para permitir los diversos modos de codificación del codificador de video. El bloque de control del sistema 164 también controla el uso de cifrado de datos de acuerdo con la recomendación H.233 de ITU-T. La información referente al tipo de cifrado que ha de ser usado en la transmisión de datos se hace pasar de un bloque de cifrado 169 al multiplexor/desmultiplexor (unidad MUX/DMUX) 170. Durante la trasmisión de datos desde la terminal de multimedia, la unidad de MUX/DMUX 170 combina envíos en paquetes de video y audio codificados y sincronizados con datos introducidos desde el equipo de telemática 163, para formar un solo flujo de bits. La información referente al tipo de cifrado de datos (si acaso hay alguno) que ha de ser aplicado al flujo de bits, provisto por el bloque de cifrado 169, se usa para seleccionar un modo de cifrado. De manera correspondiente, cuando un flujo de bits de multimedia posiblemente cifrado es recibido, la unidad de MUX/DMUX 170 es responsable de descifrar el flujo de bits, dividiéndolo en sus componentes de multimedia constituyentes y haciendo pasar esos componentes al codificador-decodificador apropiado y/o equipo terminal para la decodificación y reproducción. De acuerdo con el estándar H.324, la unidad de MUX/DMUX 170 debe aplicar la recomendación H.223de ITU-T. Se debe notar que los elementos funcionales del sistema de creación de contenido de multimedia, terminal de multimedia, cliente de recuperación de multimedia, codificador de video, decodificador y codificador-decodificador de video de conformidad con la invención se pueden aplicar como software o hardware dedicado, o una combinación de los dos. Los métodos de codificación y decodificación de video de conformidad con la invención son particularmente adecuados para aplicarse en forma de un programa de computadora que comprenda instrucciones legibles por máquina para realizar los pasos funcionales de la invención. Como tales, el codificador y decodificador de conformidad con esta invención se pueden aplicar como un código de software almacenado en un medio de almacenamiento y ejecutado en una computadora, tal como una computadora de escritorio personal, a fin de proveer a la computadora la funcionalidad de codificación y/o decodificación. A fin de resaltar las ventajas provistas por la invención, su comportamiento en la situación de pérdida de paquete se examinará mediante la consideración de los resultados de un experimento de simulación. En este ejemplo, se supone que un codificador de video, diseñado para poner en práctica el método de codificación de conformidad con la invención, se usa para codificar QCIF (formato intermedio común de un cuarto) cuadros de video a una velocidad de 10 cuadros por segundo. Las solicitudes de cuadro INTRA periódicas ocurren a intervalos de 5 segundos, pero no surgen solicitudes de cuadros INTRA debido a cortes de escena entro de la secuencia de video. La cantidad de datos requeridos para representar un cuadro INTRA-codificado se supone que es de 2000 bytes y el tamaño de un cuadro ÍNTER es de aproximadamente de 200 bytes. Estas cifras son típicas de cuadros de formato de QCIF INTRA e INTER-codificados de acuerdo con estándares de codificación de video actualmente usados tales como la recomendación H.263 de ITU-T.
Un tamaño máximo típico de una unidad de datos de protocolo usada para la transmisión de datos en la Internet y redes de área local (LANs) es de aproximadamente 1500 bytes. Al suponer este tamaño de paquete, un cuadro INTRA-codificado típico requiere dos paquetes para su transmisión. Por otra parte, un paquete puede portar siete cuadros ÍNTER. Esto significa que a fin de transmitir 50 cuadros, que constituyen 5 segundos de video, se requiere un total de 9 paquetes. Al suponer que la secuencia empieza con un cuadro INTRA (como es usual), una secuencia de 5 segundos ica de video comprende un cuadro INTRA y 49 cuadros INTER-codificados. Como se describió antes, el cuadro INTRA requiere dos paquetes para su transmisión, mientras que los restantes de 49 cuadros INTER-codificados pueden ser ajustados en siete paquetes, por lo que hay un requerimiento total de nueve paquetes. Se debe notar que es ventajoso usar paquetes grandes para transmisión de datos en la Internet. Primero, dentro de la estructura central de la Internet, la probabilidad de pérdida de paquete es esencialmente independiente del tamaño del paquete y segundo, la cabecera de paquete superior se reduce si se usan paquetes grandes. Al aplicar el método de codificación de conformidad con la invención, el codificador usa una memoria intermedia cuya duración es de 5 segundos +1 cuadro para almacenar los cuadros de video entrantes en formato de QCIF. Cuando se inicia el proceso de codificación, la memoria intermedia es inicialmente vacía y se llena con cuadros de video QCIF no comprimidos. El primer cuadro en la secuencia está asociado con una solicitud INTRA. Puesto que la longitud de la memoria intermedia en este ejemplo se escoge para coincidir con la veloddad de solicitud de recuperación INTRA periódica y puesto que se supone que no ocurren cortes de escena o solicitudes de actualización de cuadro INTRA durante el periodo considerado, el último cuadro almacenado en la memoria intermedia se asociará con la siguiente solicitud INTRA. Por lo tanto, el codificador puede localizar un cuadro no comprimido dentro de la memoria intermedia cuyo tiempo de ocurrencia es aproximadamente la mitad entre las dos solicitudes de cuadro INTRA. El cuadro se selecciona para codificar en formato INTRA (es decir, se selecciona para ser el cuadro INTRA real) y el proceso de codificación anteriormente descrito se aplica a los cuadros dentro de la memoria intermedia. En la simulación aquí considerada, se supone además que, una vez que se han codificado, los cuadros de video ahora comprimidos son transmitidos en una red de comunicaciones basada en paquete y que el canal de comunicaciones está sujeto a congestión, lo que da por resultado la pérdida de cierta proporción de los paquetes transmitidos. La velocidad de bits simulada es de 18880bps, la velocidad de bits objetivo para el envío en paquetes audiovisual en la lnter.net usa un módem de 28.8 kbps. Las siguientes tablas comparan la flexibilidad a error del método de codificación de conformidad con la invención con el de un esquema de codificación convencional, en el cual los cuadros asociados con las solidtudes INTRA son por si mismos codificados en formato INTRA (es decir, como se ilustra en la figura 7). La tabla 4 despliega cifras de pérdida de cuadro para un caso en el cual, en promedio, un paquete de cada nueve se pierde (11% de pérdida de paquete), mientras que la tabla 5 presenta cifras equivalentes para una situación en la cual 2 paquetes de cada nueve se pierden (22% de pérdida de paquetes).
TABLA 4 Las velocidades de pérdida de cuadro para métodos convencionales v de la invención con 11% de pérdida de pagúete TABLA 5 Las velocidades de pérdida de cuadro de métodos convencional y de la invención con 22% de pérdida de pagúete Ambos casos anteriormente presentados muestran que se pierden menos cuadros cuando se usa el método de la invención. En el siguiente texto, el método de conformidad con la invención se ha descrito con la ayuda de modalidades ilustrativas. Será evidente para un experto en la técnica que la invención no se limita a los detalles precisos de las modalidades anteriormente ilustrativas y que se pueden aplicar otras formas sin apartarse de sus atributos y características esenciales. Por lo tanto, las modalidades de ejemplo anteriormente presentadas deben considerarse ilustrativas más no limitativas. Por consiguiente, se debe hacer referencia a las reivindicaciones anexas y a los enunciados generales del concepto de la invención presentado aquí como una indicación del alcance de la presente invención. Además, cada característica descrita en esta especificación (término que induye las reivindicaciones) y/o mostrada en los dibujos se puede incorporar en la invención independientemente de otras características descritas y/o ilustradas. A este respecto, la invención incluye cualesquiera características o combinación de características novedosas descritas aquí ya sea en forma explícita o cualquier generaíización de las mismas, independientemente de si se refieren a la invención reivindicada o mitiga cualesquiera o todos los problemas a los que se enfrenta. El resumen anexo como se presenta con la presente se incluye en la especificación por referencia. Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (34)

  1. REIVINDICACIONES
  2. Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones. 1. Un método de codificación de una secuencia de cuadros de video para formar una secuencia de video comprimido, la secuencia de video comprimido comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el método comprende los pasos de: identificar una primera indicación asociada con un primer cuadro de video de tal manera que el primer cuadro de video deberá ser codificado en el primer formato de cuadro de video comprimido; asociar la primera indicación con un segundo cuadro de video; codificar el segundo cuadro de video en el primer formato de cuadro de video comprimido; definir una primera serie de cuadros de video que comprende cuadros de video N que ocurren antes del segundo cuadro de video; codificar la primera serie de cuadros de video en el segundo formato de cuadro de video comprimido; definir una segunda serie de cuadros de video que comprende cuadros de video M que ocurren después del segundo cuadro de video; y codificar la segunda serie de cuadros de video en el segundo formato de cuadros de video comprimido. 2. Un método de conformidad con la reivindicación 1 , caracterizado porque: el formato no temporalmente predicho es un formato de cuadro INTRA; el formato temporalmente predicho es un formato de cuadro ÍNTER predicho en dirección hacia adelante.
  3. 3. Un método de conformidad con la reivindicación 1, caracterizado porque: el formato no temporalmente predicho es un formato de cuadro INTRA; el formato temporalmente predicho es un formato de cuadro B predicho en dirección hacia atrás.
  4. 4. Un método de conformidad con la reivindicación 2, caracterizado porque: la codificación de la primera serie de cuadros de video N se logra al: asignar a cada uno de los cuadros de video N un número de orden de compresión secuencial, al cuadro de video que ocurre más tarde de la primera serie se asigna un número de orden de compresión más bajo y al cuadro de video que ocurre más temprano se asigna un número de orden de compresión más alto; indicar el segundo cuadro de video como un cuadro de referencia de predicción para codificar el uadro de video que tiene un número de orden de compresión más bajo; codificar la primera serie de cuadros de video en el formato de cuadro ÍNTER predicho en dirección hacia adelante en orden ascendente de número de orden de compresión.
  5. 5. Un método de conformidad con la reivindicación 3, caracterizado porque: la codificación de la primera serie de cuadros de video se logra al: - . indicar el segundo cuadro de video como un cuadro de referencia de predicción para cada uno de los cuadros de video N; - codificar cada uno de los cuadros de video N en el formato de cuadro B predicho en dirección hacia atrás.
  6. 6. Un método de conformidad con cualquiera de las reivindicaciones anteriores, caracterizado porque: la codificación de la segunda serie de cuadros de video M se logra al: - asignar a cada uno de los cuadros de vídeo M un número de orden de compresión secuencial, al cuadro de video que ocurre más temprano de la segunda serie se asigna un número de orden de compresión más bajo y al cuadro de video que ocurre más tarde se asigna un número de orden de compresión más alto; indicar el segundo cuadro de video como un cuadro de referencia de predicción para codificar el cuadro de video que tiene un número de orden de compresión más bajo; codificar la segunda serie de cuadros de video en el formato de cuadro ÍNTER predicho en orden ascendente de número de orden de compresión.
  7. 7. Un método de conformidad con la reivindicación 1 , caracterizado porque la primera indicación es una solicitud de cuadro INTRA asociado con un corte de escena.
  8. 8. Un método de conformidad con la reivindicación 1 , caracterizado porque la primera indicación es una solicitud de cuadro INTRA periódica.
  9. 9. Un método de conformidad con cualquiera de las reivindicaciones anteriores, caracterizado porque consiste en: identificar una segunda indicación de que un formato de cuadro de video adicional se debe codificar en el primer cuadro de video comprimido; y - para un grupo de cuadros que incluyen el primer cuadro de video y los cuadros que ocurren entre el primer cuadro de video y el cuadro de video que está más adelante, definir al segundo cuadro de video como el cuadro que ocurre sustancialmente en forma central dentro del grupo de cuadros.
  10. 10. Un método de conformidad con la reivindicación 9, caracterizado porque la segunda indicación es una solicitud de cuadro INTRA asociado con un corte de escena.
  11. 11. Un método de conformidad con la reivindicación 9, caracterizado porque la segunda indicación es una solicitud INTRA periódica.
  12. 12. Un método de conformidad con la reivindicación 9, caracterizado porque ia segunda indicación es una solicitud de actualización de cuadro INTRA recibida como retroalimentación desde una terminal receptora.
  13. 13. Un método de conformidad con la reivindicación 9, caracterizado porque para un grupo de cuadros n, el segundo cuadro es el cuadro n/2 del grupo de cuadros, en donde n es un entero par, positivo.
  14. 14. Un método de conformidad con la reivindicación 9, caracterizado porque para un grupo de cuadros n, el segundo cuadro es el cuadro (n/2 + 1) del grupo de cuadros, en donde n es un entero par, positivo.
  15. 15. Un método de conformidad con la reivindicación 9, caracterizado porque para un grupo de cuadros n, el segundo cuadro es el cuadro (n+1)/2 del grupo de cuadros, en donde n es un entero non, positivo.
  16. 16. Un método de conformidad con cualquiera de las reivindicaciones anteriores, caracterizado porque consiste además en asociar con la información de secuencia de video comprimido información relacionada con el orden de reproducción destinado de los cuadros de la secuencia de video comprimido.
  17. 17. Un método de conformidad con cualquiera de las reivindicaciones anteriores, caracterizado porque consiste además en asociar con la información de secuencia de video comprimido información relacionada con el tiempo de reproducción destinado de los cuadros de la secuencia de video comprimido.
  18. 18. Un codificador de video para codificar una secuencia de cuadros de video para formar una secuencia de video comprimida, la secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el codificador comprende: medios para identificar una primera indicación asociada con un primer cuadro de video de tal manera que el primer cuadro de video deberá ser codificado en el primer formato de cuadro de video comprimido; medios para asociar la primera indicación con un segundo cuadro de video; - medios para codificar el segundo cuadro de video en el primer formato de cuadro de video comprimido; medios para definir una primera serie de cuadros de video que comprenden cuadros de video N que ocurren antes del segundo cuadro de video; medios para codificar la primera serie de cuadros de video en el segundo formato de cuadro de video comprimido; medios para definir una segunda serie de cuadros de video que comprende cuadros de video M que ocurren después del segundo cuadro de video; y medios para codificar la segunda serie de cuadros de video en el segundo formato de cuadro de video comprimido.
  19. 19. Un codificador-decodificador de video que incluye un codificador de video de conformidad con la reivindicación 18.
  20. 20. Un sistema de creación de contenido de multimedia que incluye un codificador de video de conformidad con la reivindicación 18.
  21. 21. Una terminal de multimedia que incluye un codificador de video de conformidad con la reivindicación 18.
  22. 22. Una terminal de multimedia de conformidad con la reivindicación 21 , caracterizada porque la terminal es un dispositivo de radio telecomunicaciones.
  23. 23. Un método de decodificación de una secuencia de video comprimida para formar una secuencia de cuadros de video descomprimidos, la secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el método comprende los pasos de: identificar una primera indicación asociada con un primer cuadro de video de tal manera que el primer cuadro de video es codificado en el primer formato de cuadro de video comprimido; decodificar el primer cuadro de video; recibir una primera serie de cuadros N en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida antes del primer cuadro de video; decodificar la primera serie de cuadros de video N; ordenar los cuadros de la primera serie de cuadros de conformidad con información de reproducción asociada con los cuadros de la primera serie; recibir una segunda serie de cuadros de video M en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida después del primer cuadro de video; y decodificar la segunda serie de cuadros de video.
  24. 24. Un decodificador de video para decodificar una secuencia de video comprimida para formar una secuencia de cuadros de video descomprimidos, la secuencia de video comprimida comprendiendo cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predícho caracterizado porque el decodificador comprende: medios para identificar una primera indicación asociada con un primer cuadro de video de tal manera que el primer cuadro de video es codificado en el primer formato de cuadro de video comprimido; medios para decodificar el primer cuadro de video; medios para recibir una primera serie de cuadros N en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida antes del primer cuadro de vídeo; - medios para decodificar la primera serie de cuadros de video N; medios para ordenar los cuadros de la primera serie de cuadro de conformidad con Información de reproducción asociada con los cuadros de la primera serie; medios para recibir una segunda serie de cuadros de video M en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida después del primer cuadro de video; y medios para decodificar la segunda serie de cuadros de video.
  25. 25. Un codificador-decodificador de video que incluye un decodificador de video de conformidad con la reivindicación 24.
  26. 26. Un sistema de recuperación de contenido de multimedia que incluye un decodificador de video de conformidad con la reivindicación 24.
  27. 27. Una terminal de multimedia que incluye un decodificador de video de conformidad con la reivindicación 24.
  28. 28. Una terminal de multimedia de conformidad con la reivindicación 27, caracterizada porque la terminal es un dispositivo de radio telecomunicaciones.
  29. 29. Un programa de computadora para operar una computadora como un codificador de video para codificar una secuencia de cuadros de video para formar una secuencia de video comprimida, la secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadros de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de vídeo comprimido es un formato temporalmente predicho caracterizado porque el programa de computadora comprende un código ejecutable por computadora para identificar una primera indicación asociada con el primer cuadro de video de tal manera que el primer cuadro de video deberá ser codificado en el primer formato de cuadro de video comprimido; un código ejecutable por computadora para asociar la primera indicación con el segundo cuadro de video; un código ejecutable por computadora para asociar la primera indicación con el segundo cuadro de video; un código ejecutable por computadora para codificar el segundo cuadro vídeo en el primer formato de cuadro de video comprimido; - un código ejecutable por computadora para definir una primera serie de cuadros de video que comprenden cuadros de video N que ocurren antes del segundo cuadro de video; un código ejecutable por computadora para codificar la primera serie de cuadros de video en el segundo formato de cuadro de video comprimido; - un código ejecutable por computadora para definir una segunda serie de cuadro de video que comprende cuadros de video M que ocurren después del segundo cuadro de video; y un código ejecutable por computadora para codificar la segunda serie de cuadros de video en el segundo formato de cuadro de video comprimido.
  30. 30. Un programa de computadora para operar una computadora como un decodificador de video para decodificar una secuencia de video comprimida para formar una secuencia de cuadros de video descomprimidos, la secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el programa de computadora comprende un código ejecutable por computadora para identificar una primera indicación asociada con el primer cuadro de video de tal manera que el primer cuadro de vídeo es codificado en el primer formato de cuadro de video comprimido; - un código ejecutable por computadora para decodificar el primer cuadro de video; un código ejecutable por computadora para recibir una primera serie de cuadros N en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida antes del primer cuadro de video; - un código ejecutable por computadora para decodificar la primera serie de cuadros de video N; un código ejecutable por computadora para ordenar los cuadros de la primera serie de cuadros de conformidad con información de reproducción asociada con los cuadros de la primera serie; - un código ejecutable por computadora para recibir una segunda serie de cuadros de video M en el segundo formato de cuadro de video comprimido para incluirse en la secuencia de video descomprimida después del primer cuadro de video; y un código ejecutable por computadora para decodificar la segunda serie de cuadros de video.
  31. 31. Un programa de computadora de conformidad con las reivindicaciones 29 y 30.
  32. 32. Un medio de almacenamiento que comprende un programa de computadora para operar una computadora como un codificador de video para codificar una secuencia de cuadros de video para formar una secuencia de video comprimida, la secuencia de video comprimida comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el medio de almacenamiento comprende: un código ejecutable por computadora para identificar una primera indicación asociada con un primer cuadro de video de modo que el primer cuadro de video sea codificado en el primer formato de cuadro de video comprimido; un código ejecutable por computadora para asociar la primera indicación con un segundo cuadro de video; un código ejecutable por computadora para codificar el segundo cuadro de video en el primer formato de cuadro de video comprimido; un código ejecutable por computadora para definir una primera serie de cuadros de video que comprende cuadros de video N que ocurren antes del segundo cuadro de vídeo; un código ejecutable por computadora para codificar la primera serie de cuadros de video en el segundo formato de cuadro de video comprimido; un código ejecutable por computadora para definir una segunda serie de cuadros de video que comprende cuadros de video M que ocurren después del segundo cuadro de video; un código ejecutable por computadora para codificar la segunda serie de cuadros de video en el segundo formato de cuadro de video comprimido.
  33. 33. Un medio de almacenamiento que comprende un programa de computadora para operar una computadora como un decodificador de video para decodificar una secuencia de video comprimido para formar una secuencia de cuadros de video descomprimidos, la secuencia de video comprimido comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimido, el primer formato de cuadro de video comprimido es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el medio de almacenamiento comprende: un código ejecutable por computadora para identificar una primera indicación asociada con un primer cuadro de video de modo que el primer cuadro de video sea codificado en el primer formato de cuadro de video comprimido; un código ejecutable por computadora para descodificar el primer cuadro de video un código ejecutable por computadora para recibir una primera serie de cuadros N en el segundo formato de cuadros de video comprimido para incluirse en la secuencia de video descomprimido antes del primer cuadro de video; un código ejecutable por computadora para decodificar la primera serie de cuadro de video N; un código ejecutable por computadora para ordenar los cuadros de la primera serie de cuadros de acuerdo con información de reproducción asociada con los cuadros de la primera serié; un código ejecutable por computadora para recibir una segunda serie de cuadros de video M en el segundo formato de cuadros de video comprimidos para incluirse en la secuencia de video descomprimido después del primer cuadro de video; un código ejecutable por computadora para decodificar la segunda serie de cuadros de video.
  34. 34. Un método de codificación de una secuencia de cuadros de video para formar una secuencia de video comprimido, la secuencia de video comprimido comprende cuadros codificados en por lo menos un primer formato de cuadro de video comprimido y un segundo formato de cuadro de video comprimidos, el primer formato de cuadro de video comprimidos es un formato no temporalmente predicho y el segundo formato de cuadro de video comprimido es un formato temporalmente predicho caracterizado porque el método comprende los pasos de: identificar una primera indicación asociada con un primer cuadro de video de modo que el primer cuadro de video sea codificado en el primer formato de cuadro de video comprimido; y - asociar la primera indicación con un segundo cuadro de video de tal manera que reduzca una longitud de trayectoria de predicción en la secuencia de video comprimido.
MXPA02011734A 2000-06-30 2001-06-28 Flexibilidad de error de video. MXPA02011734A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0016243A GB2364459B (en) 2000-06-30 2000-06-30 Video error resilience
PCT/EP2001/007366 WO2002001882A2 (en) 2000-06-30 2001-06-28 Video error resilience

Publications (1)

Publication Number Publication Date
MXPA02011734A true MXPA02011734A (es) 2003-03-27

Family

ID=9894877

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA02011734A MXPA02011734A (es) 2000-06-30 2001-06-28 Flexibilidad de error de video.

Country Status (14)

Country Link
US (2) US20020041629A1 (es)
EP (1) EP1300024A2 (es)
JP (1) JP4949591B2 (es)
KR (1) KR100945548B1 (es)
CN (2) CN1738432B (es)
AU (1) AU2001291657A1 (es)
BR (1) BR0111218A (es)
CA (1) CA2412722C (es)
EE (1) EE200200719A (es)
GB (1) GB2364459B (es)
HU (1) HUP0302078A3 (es)
MX (1) MXPA02011734A (es)
WO (1) WO2002001882A2 (es)
ZA (1) ZA200208713B (es)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002034021A (ja) * 2000-07-14 2002-01-31 Mitsubishi Electric Corp 画像信号蓄積再生装置および画像信号送信装置
KR20050030955A (ko) * 2002-07-24 2005-03-31 코닌클리케 필립스 일렉트로닉스 엔.브이. 디지털 비디오 신호를 엔코딩하는 방법 및 엔코더
US7796499B2 (en) * 2003-12-05 2010-09-14 Telefonaktiebolaget L M Ericsson (Publ) Method of and system for video fast update
US7676722B2 (en) * 2004-03-31 2010-03-09 Sony Corporation Multimedia content delivery using pre-stored multiple description coded video with restart
US7958252B2 (en) * 2004-05-04 2011-06-07 Qualcomm Incorporated System for scalable transmission of content in a data network
US20080018803A1 (en) * 2004-07-07 2008-01-24 Tourapis Alexandros M Fast Channel Change in Digital Video Broadcast Systems over Dsl Using Redundant Video Streams
US7561620B2 (en) * 2004-08-03 2009-07-14 Microsoft Corporation System and process for compressing and decompressing multiple, layered, video streams employing spatial and temporal encoding
US8139646B2 (en) * 2004-10-29 2012-03-20 Nxp B.V. Splicing MPEG streams comparing offset and reference time value
US8006279B2 (en) * 2004-12-10 2011-08-23 Alcatel Lucent Distributive system for marking and blocking video and audio content related to video and audio programs
JP2007214010A (ja) 2006-02-10 2007-08-23 Seiko Epson Corp 放電灯点灯装置及びプロジェクタ
KR100775176B1 (ko) * 2006-03-10 2007-11-12 엘지전자 주식회사 동영상 정보를 썸네일로 재생하는 방법 및 이를 이용한단말기
DE102006012449A1 (de) * 2006-03-17 2007-09-20 Benq Mobile Gmbh & Co. Ohg Verfahren zum Dekodieren eines Datenstroms und Empfänger
US8279928B2 (en) * 2006-05-09 2012-10-02 Canon Kabushiki Kaisha Image encoding apparatus and encoding method, image decoding apparatus and decoding method
US7868879B2 (en) * 2006-05-12 2011-01-11 Doremi Labs, Inc. Method and apparatus for serving audiovisual content
EP2060120A4 (en) * 2006-09-07 2012-01-04 Thomson Licensing METHOD AND APPARATUS FOR COORDING GROUPS OF IMAGES OF A VIDEO SEQUENCE, IN WHICH EACH OF THE GROUPS CONTAINS AN INTRA-CODED IMAGE AND MORE THAN TWO PREPARED CODED IMAGES
US9247260B1 (en) 2006-11-01 2016-01-26 Opera Software Ireland Limited Hybrid bitmap-mode encoding
US8711929B2 (en) * 2006-11-01 2014-04-29 Skyfire Labs, Inc. Network-based dynamic encoding
DE102006057983A1 (de) * 2006-12-08 2008-06-12 Siemens Ag Verfahren zur Vidoecodierung einer Folge digitalisierter Bilder
US20080184128A1 (en) * 2007-01-25 2008-07-31 Swenson Erik R Mobile device user interface for remote interaction
US8055779B1 (en) 2007-05-10 2011-11-08 Adobe Systems Incorporated System and method using data keyframes
WO2008139465A2 (en) * 2007-05-10 2008-11-20 Yeda Research And Development Co. Ltd. Bidirectional similarity of signals
US9979931B2 (en) * 2007-05-30 2018-05-22 Adobe Systems Incorporated Transmitting a digital media stream that is already being transmitted to a first device to a second device and inhibiting presenting transmission of frames included within a sequence of frames until after an initial frame and frames between the initial frame and a requested subsequent frame have been received by the second device
US8180029B2 (en) * 2007-06-28 2012-05-15 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8194741B2 (en) * 2007-10-12 2012-06-05 Broadcom Corporation Method and system for processing B pictures with missing or invalid forward reference pictures
US8706907B2 (en) 2007-10-19 2014-04-22 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8145780B2 (en) * 2007-10-19 2012-03-27 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8699678B2 (en) 2007-10-19 2014-04-15 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8321581B2 (en) * 2007-10-19 2012-11-27 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8682336B2 (en) * 2007-10-19 2014-03-25 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8391312B2 (en) 2007-10-19 2013-03-05 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8090867B2 (en) * 2007-10-19 2012-01-03 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8001261B2 (en) 2007-10-19 2011-08-16 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8380874B2 (en) 2007-10-19 2013-02-19 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US20090103529A1 (en) * 2007-10-19 2009-04-23 Rebelvox, Llc Telecommunication and multimedia management method and apparatus
US8111713B2 (en) 2007-10-19 2012-02-07 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
CN101192903B (zh) * 2007-11-28 2011-08-03 腾讯科技(深圳)有限公司 数据帧编解码控制方法
CN101232619B (zh) * 2008-01-25 2011-05-11 浙江大学 嵌入帧内编码块的视频编码方法
US8902996B2 (en) 2008-02-26 2014-12-02 Richwave Technology Corp. Adaptive wireless video transmission systems and methods
US8265171B2 (en) * 2008-02-26 2012-09-11 Richwave Technology Corp. Error resilient video transmission using instantaneous receiver feedback and channel quality adaptive packet retransmission
CN101931807B (zh) * 2010-06-29 2016-07-06 无锡中感微电子股份有限公司 验证多媒体播放器容错性的方法和装置
JP5978574B2 (ja) * 2011-09-12 2016-08-24 ソニー株式会社 送信装置、送信方法、受信装置、受信方法および送受信システム
US9407923B2 (en) 2013-05-20 2016-08-02 Gamefly Israel Ltd. Overconing lost IP packets in streaming video in IP networks
WO2015058397A1 (en) 2013-10-25 2015-04-30 Microsoft Technology Licensing, Llc Representing blocks with hash values in video and image coding and decoding
US10521086B1 (en) * 2013-12-17 2019-12-31 Amazon Technologies, Inc. Frame interpolation for media streaming
EP3114838B1 (en) 2014-03-04 2018-02-07 Microsoft Technology Licensing, LLC Hash table construction and availability checking for hash-based block matching
WO2015196322A1 (en) * 2014-06-23 2015-12-30 Microsoft Technology Licensing, Llc Encoder decisions based on results of hash-based block matching
RU2679981C2 (ru) 2014-09-30 2019-02-14 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Основанные на хешах решения кодера для кодирования видео
US9900643B2 (en) 2014-10-10 2018-02-20 At&T Intellectual Property I, L.P. Method and apparatus for transmitting media content
CN105376595A (zh) * 2015-12-17 2016-03-02 杭州雄迈信息技术有限公司 一种视频混合编码系统和方法
US11095877B2 (en) 2016-11-30 2021-08-17 Microsoft Technology Licensing, Llc Local hash-based motion estimation for screen remoting scenarios
US10291936B2 (en) 2017-08-15 2019-05-14 Electronic Arts Inc. Overcoming lost or corrupted slices in video streaming
CN111641824B (zh) * 2019-03-01 2022-08-05 杭州海康威视数字技术股份有限公司 视频倒放方法及装置
US11202085B1 (en) 2020-06-12 2021-12-14 Microsoft Technology Licensing, Llc Low-cost hash table construction and hash-based block matching for variable-size blocks
CN115225902B (zh) * 2022-07-21 2025-05-23 北京蔚领时代科技有限公司 基于分散编码的高分辨率vr云游戏解决方法及计算机设备

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02200084A (ja) * 1989-01-30 1990-08-08 Victor Co Of Japan Ltd 高能率符号化方式
JPH02234586A (ja) * 1989-03-08 1990-09-17 Victor Co Of Japan Ltd 高能率符号化方式
US5146325A (en) 1991-04-29 1992-09-08 Rca Thomson Licensing Corporation Video signal decompression apparatus for independently compressed even and odd field data
KR0134177B1 (ko) * 1992-03-24 1998-04-22 Toshiba Kk 가변장 부호의 기록 재생 장치
JP2565057B2 (ja) 1992-06-30 1996-12-18 日本ビクター株式会社 フレ−ム間又はフィ−ルド間予測符号化方法
TW224553B (en) 1993-03-01 1994-06-01 Sony Co Ltd Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture
US5592226A (en) * 1994-01-26 1997-01-07 Btg Usa Inc. Method and apparatus for video data compression using temporally adaptive motion interpolation
US5874997A (en) * 1994-08-29 1999-02-23 Futuretel, Inc. Measuring and regulating synchronization of merged video and audio data
JP3711571B2 (ja) * 1994-09-29 2005-11-02 ソニー株式会社 画像符号化装置及び画像符号化方法
JP3591033B2 (ja) * 1995-02-15 2004-11-17 ソニー株式会社 符号化データの特殊再生方法および特殊再生装置
GB2301973B (en) * 1995-06-06 1999-10-20 Sony Uk Ltd Motion compensated video processing
US5774593A (en) * 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
JPH0974566A (ja) * 1995-09-04 1997-03-18 Sony Corp 圧縮符号化装置及び圧縮符号化データの記録装置
JP3068002B2 (ja) * 1995-09-18 2000-07-24 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US6057893A (en) * 1995-12-28 2000-05-02 Sony Corporation Picture encoding method, picture encoding apparatus, picture transmitting method and picture recording medium
JP3823275B2 (ja) * 1996-06-10 2006-09-20 富士通株式会社 動画像符号化装置
JP3606306B2 (ja) * 1998-10-08 2005-01-05 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US6526097B1 (en) * 1999-02-03 2003-02-25 Sarnoff Corporation Frame-level rate control for plug-in video codecs

Also Published As

Publication number Publication date
WO2002001882A8 (en) 2004-04-29
JP2004502359A (ja) 2004-01-22
CN1449628A (zh) 2003-10-15
WO2002001882A2 (en) 2002-01-03
KR20030014709A (ko) 2003-02-19
EP1300024A2 (en) 2003-04-09
EE200200719A (et) 2004-08-16
JP4949591B2 (ja) 2012-06-13
KR100945548B1 (ko) 2010-03-08
WO2002001882A3 (en) 2002-09-12
CA2412722C (en) 2012-02-07
US20020041629A1 (en) 2002-04-11
US8355437B2 (en) 2013-01-15
BR0111218A (pt) 2003-03-18
HUP0302078A2 (hu) 2003-09-29
GB2364459B (en) 2004-03-31
CA2412722A1 (en) 2002-01-03
HK1088161A1 (en) 2006-10-27
HUP0302078A3 (en) 2005-10-28
GB0016243D0 (en) 2000-08-23
GB2364459A (en) 2002-01-23
ZA200208713B (en) 2003-08-06
US20050123045A1 (en) 2005-06-09
CN1738432B (zh) 2011-02-09
CN100473169C (zh) 2009-03-25
AU2001291657A1 (en) 2002-01-08
CN1738432A (zh) 2006-02-22

Similar Documents

Publication Publication Date Title
CA2412722C (en) Video error resilience
RU2297729C2 (ru) Группирование кадров изображения на видеокодировании
RU2395173C2 (ru) Группирование кадров изображения на видеокодировании
US7289506B1 (en) Data transmission
JP5341629B2 (ja) ピクチャ復号化方法
US7058129B2 (en) Decoding method and apparatus and recording method and apparatus for moving picture data
JP4538908B2 (ja) データ変換装置及び方法
JP3840895B2 (ja) 動画像符号化データ変換装置及びその方法
EP1439705A2 (en) Method and apparatus for processing, transmitting and receiving dynamic image data
JP2004507178A (ja) ビデオ信号符号化方法
US20060140591A1 (en) Systems and methods for load balancing audio/video streams
US20020015577A1 (en) Data distribution apparatus and method, and data distribution system
JP4255685B2 (ja) 画像伝送方法および画像伝送装置
JPH10271482A (ja) 符号化映像の同期再生制御方法およびシステム
JP4892541B2 (ja) 画像伝送方法および画像伝送システム
HK1088161B (en) Video error resilience

Legal Events

Date Code Title Description
FG Grant or registration