MX2013008757A

MX2013008757A - Control de velocidad de bits adaptativa basado en escenas.

Info

Publication number: MX2013008757A
Application number: MX2013008757A
Authority: MX
Inventors: Rodolfo Vargas Guerrero
Original assignee: Eye Io Llc
Priority date: 2011-01-28
Filing date: 2012-01-26
Publication date: 2014-02-28
Also published as: WO2012103326A3; TW201238356A; IL227673A0; EP2668779A2; AU2016250476A1; AU2012211243A1; JP6134650B2; EP2668779A4; US20120195369A1; IL227673A; CN103493481A; TWI586177B; CA2825929A1; BR112013020068A2; WO2012103326A2; JP2014511137A; KR20140034149A

Abstract

En la presente se describe un codificador para codificar una secuencia de video. El codificador recibe una secuencia de video de entrada, información de límite de escena que indica posiciones en la secuencia de video de entrada donde ocurren transiciones de escena y velocidad de bits de imagen para cada escena. El codificador divide la secuencia de video de entrada en una pluralidad de secciones basado en la información de límite de escena. Cada sección comprende una pluralidad de cuadros de imagen temporalmente contiguos. El codificador codifica cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco, proporcionando un control de velocidad de bits adaptativa basada en escenas. Si se cumple con la barra de la calidad del video a una velocidad de bits más baja, no hay necesidad de codificar misma sección a una velocidad de bits más alta ya que la barra de calidad ya se ha cumplido.

Description

CONTROL DE VELOCIDAD DE BITS ADAPTATIVA BASADO EN ESCENAS Referencia Cruzada a Solicitudes de Patentes Relacionadas Esta solicitud de patente reivindica prioridad de la Solicitud de Patente Provisoria Estadounidense N° 51/437.193, presentada el 28 de enero de 2011 y de la Solicitud de Patente Provisoria Estadounidense N° 61/437.223, presentada el 28 de enero de 2011, cuyos contenidos se incorporan expresamente como referencia en la presente .

Campo de la invención La presente invención se relaciona con una técnica de -compresión de video y de imagen y más específicamente, con una técnica de compresión de video y de imagen usando el control de velocidad de bits adaptativa basado en escenas.

Antecedentes de la invención Si bien la popularidad de la difusión de video continúa creciendo y sigue aumentando su uso entre los usuarios cotidianos, existen varias limitaciones implícitas que es necesario resolver. Por ejemplo, los usuarios suelen querer mirar un video por Internet que tiene un ancho de banda sólo limitado para obtener esa secuencia de video. En algunos casos, los usuarios podrían querer obtener la secuencia de video por una conexión de teléfono móvil una conexión inalámbrica hogareña. En algunas situaciones, los usuarios compensan la falta un ancho de banda ¦ suficiente operaciones simultáneas periféricas en linea del contenido (es decir, la descarga del contenido al almacenamiento local para finalmente mirarlo) . Este método está repleto de varias desventajas. En primer lugar, el usuario no puede tener una experiencia de "tiempo de ejecución" real, es decir, el usuario no puede mirar un programa cuando decide mirarlo. En cambio, tiene que experimentar retardos importantes para el contenido que se debe someter a operaciones simultáneas periféricas en linea antes de mirar el programa. Otra desventaja está en la disponibilidad de almacenamiento, el prestador o el usuario tiene que explicar los recursos de almacenamiento para asegurar que el contenido sometido a operaciones simultáneas periféricas en linea que se puede almacenar, aún durante un corto periodo de tiempo, que deriva en la utilización innecesaria de recursos de almacenamiento costosos.

Una secuencia de video que normalmente contiene una parte de imagen y una parte de sonido puede necesitar un ancho de banda considerable, especialmente a una alta resolución (por ejemplo, videos en HD (alta definición) ) . El sonido normalmente necesita un ancho de banda mucho menor, pero aún algunas veces se necesita tenerlo en cuenta. Un enfoque de difusión de video es comprimir fuertemente la secuencia de video que permite la entrega rápida del video para permitir que un usuario mire el contenido en el tiempo de ejecución o sustancialmente en forma instantánea (es decir, sin experimentar retardos de operaciones simultáneas periféricas en linea sustanciales) . Normalmente, la compresión con pérdidas (es decir, la compresión que no es completamente reversible) provee mayor compresión que la compresión sin pérdidas, pero la compresión con- pérdidas fuertes provee una experiencia de usuario indeseable.

Para reducir el ancho de banda necesario para transmitir señales de video digital, se conoce bien el uso de la codificación de video digital eficiente donde la velocidad de datos de una señal de video digital se puede reducir sustancialmente (con el fin de la compresión de datos de video) . Para asegurar la interoperabilidad, las normas de codificación de video han cumplido un papel fundamental en facilitar la adopción del video digital en muchas aplicaciones de profesionales y consumidores. Las normas más influyentes tradicionalmente se desarrollan por la Unión Internacional de Telecomunicaciones (ITU-T) o la comisión 15 del MPEG (Grupo de Expertos de Imágenes en Movimiento) de la ISO/IEC (la Organización Internacional de Normalización/Comisión Electrotécnica Internacional. Las normas de la ITU-T, denominadas recomendaciones, normalmente apuntan a las comunicaciones en tiempo real (por ejemplo, videoconferencia) mientras que la mayor parte de las normas del MPEG se optimizan para el almacenamiento (por ejemplo, para el Disco Versátil Digital (DVD) y la transmisión (por ejemplo, para la norma de Transmisión de Video Digital (OVB) ) .

En la actualidad, la mayor parte de los algoritmos de codificación de video normalizados están basados en la codificación de video híbrida. Los métodos de codificación de video híbrida normalmente combinan varios esquemas diferentes de compresión sin pérdida y con pérdida para lograr el aumento de compresión deseado. La codificación de video híbrida también es el fundamento para las normas de ITV-T (normas H.26x tales como H.261, H.263) así como las normas ISO/IEC (normas MPEG-X tales como MPEG-1, MPEG-2 y MPEG-4). La norma' de codificación de video más reciente y avanzada es actualmente la norma indicada como codificación de video avanzada H.264/MPEG-4 (AVC) que es el resultado de los esfuerzos de normalización realizados por el equipo conjunto de video ( JVT) , un equipo conjunto de ITV-T y grupos de MPEG de ISO/IEC.

La norma H.264 emplea los mismos principios de la codificación de transformada híbrida compensada por el movimiento basado en bloques que se conocen a partir de las normas establecidas tales como MPEG-2. En consecuencia, la sintaxis de H.264 se organiza como la jerarquía de encabezados habitual, tal como encabezados de imagen, de segmento, y datos, tales como vectores de movimiento, coeficientes de transformada de bloque, escala de cuantificador, etc. Sin embargo, la norma H.264 separa la Capa de Codificación de Video (VCL) , que representa el contenido de los datos de video, y la Capa de Adaptación de Red (NAL) , que da un formato a los datos y provee información del encabezado.

Además, H.264 permite una elección muy aumentada de parámetros de codificación. Por ejemplo, permite una segmentación y manipulación más elaborada de macro-bloques de 16 x 16 por lo cual por ejemplo el proceso de compensación por movimiento se puede realizar al segmentar un macro-bloque tan pequeño como 4x4 de tamaño. Además, el proceso de selección para la predicción compensada por movimiento de un bloque de muestra puede comprender un número de imágenes decodificadas previamente almacenadas, en lugar de solamente las imágenes adyacentes. Aún con la intracodificación dentro de un solo cuadro, es posible formar una predicción de un bloque usando muestras decodificadas previamente del mismo cuadro. Además, el error de predicción resultante posterior a la compensación por movimiento se puede transformar y cuantificar basado en un tamaño de bloque de 4x4, en lugar del tamaño de 8x8 tradicional. También un filtro de desbloqueo en bucle es ahora obligatorio.

La norma H.264 se puede considerar un superconjunto de la sintaxis de codificación de video de H.262/MPEG-2 en que usa la misma estructuración global de datos de video mientras que extiende el número de decisiones y parámetros de codificación posibles. Una consecuencia de tener una variedad de decisiones de codificación es que se puede conseguir una buena compensación entre la velocidad de bits y la calidad de la imagen. Sin embargo, aunque comúnmente se reconoce que si bien la norma H.264 puede reducir mucho los artefactos típicos de la codificación basada en bloques, también puede acentuar otros artefactos. El hecho de que H.264 permita un número aumentado de valores posibles para diferentes parámetros de codificación por lo tanto deriva en un potencial aumentado para mejorar el proceso de codificación pero también deriva en una sensibilidad aumentada a la elección de los parámetros de codificación de video.

En forma similar a las demás normas, H.264 no especifica un procedimiento normativo para seleccionar parámetros de codificación de video, pero describe a través de una implementación de referencia, numerosos criterios que se pueden usar para seleccionar parámetros de codificación de video tales como para lograr una compensación adecuada entre la eficiencia de codificación, la calidad del video y la practicidad de implementación. Sin embargo, los criterios descritos no siempre pueden derivar en una selección óptima o adecuada de los parámetros de codificación adecuados para todos los tipos de contenidos y aplicaciones. Por ejemplo, los criterios pueden no derivar en la selección de parámetros de codificación de video óptimos o deseables para las características de la señal de video o los criterios pueden estar basados en lograr características de la señal codificada que no son apropiadas para la aplicación actual .

Se conoce la codificación de datos de video usando la codificación de velocidad de bits constante ("CBR") o la codificación de velocidad de bits variable ("VBR"). En ambos casos, el número de bits por unidad de tiempo se cierre, es decir, la velocidad de bits no puede exceder algún umbral. Con frecuencia, la velocidad de bits se expresa en bits por segundo. La codificación de CBR suele ser solamente un tipo de codificación de VBR con relleno adicional hasta la velocidad de bits constante (por ejemplo, relleno de la secuencia de bits con ceros) .

La red de TCP/IP (Protocolo de Control de Transmisiones/Protocolo de Internet) , tal como Internet, no es una tubería "secuencia de bits", sino el mejor esfuerzo de red que la capacidad de transmisión varía en cualquier momento. La codificación y la transmisión de videos usando un enfoque de CBR o de VBR no es ideal en el mejor esfuerzo de red. Se han diseñado algunos protocolos para entregar video por Internet. Un buen ejemplo es la Difusión de Video de Velocidad de Bits Adaptativa, en donde la secuencia de video se segmenta en archivos, que se entregan como archivos por conexiones de HTTP (protocolo de transporte de hipertexto) . Cada uno de estos archivos contiene una secuencia de video que tiene un tiempo de reproducción predeterminado y las velocidades de bits pueden variar y el tamaño del archivo puede variar. Por lo tanto, algunos archivos pueden ser más cortos que otros .

Por consiguiente, seria ventajoso un sistema mejorado para la codificación de video.

Los ejemplos precedentes del arte relacionado y las limitaciones relacionadas con ellos están destinados a ser ilustrativos y no excluyentes. Otras limitaciones del arte relacionado se harán evidentes al leer la memoria descriptiva y estudiar los dibujos.

Extracto de la invención En la presente se describe un codificador para codificar una secuencia de video. El codificador recibe una secuencia de video de entrada, información de limite de escena que indica posiciones en la secuencia de video de entrada donde ocurren transiciones de escena y la velocidad de bits blanco para cada escena. El codificador divide la secuencia de video de entrada en una pluralidad de secciones basado en la información de limite de escena. Cada sección comprende una pluralidad de cuadros de imagen contiguos temporalmente. El codificador codifica cada una de la pluralidad de escenas de acuerdo con la velocidad de bits blanco, proporcionando un control de velocidad de bits adaptativa basado en el las escenas.

El presente Resumen se proporciona para presentar una selección de conceptos en una forma simplificada que se describen adicionalmente a continuación en la Descripción Detallada. El presente Resumen no está destinado a identificar características fundamentales o características esenciales del objeto reivindicado, no está destinado a ser usado para limitar el alcance del objeto reivindicado.

Breve Descripción de los Dibujos Una o más realizaciones de la presente invención se ilustran a modo de ejemplo y no están limitadas por las figuras de los dibujos adjuntos, en donde las referencias similares indican elementos similares.

La Figura 1 ilustra un ejemplo de un codificador.

La Figura 2 ilustra pasos de un método de muestra para codificar una secuencia de video de entrada.

La Figura 3 es un diagrama de bloques de un sistema de procesamiento que se puede usar para implementar un codificador que implementa determinadas técnicas descritas en la presente.

Descripción detallada de la invención Se describirán ahora diferentes aspectos de la invención. La siguiente descripción proporciona detalles específicos para una comprensión completa y una descripción de estos ejemplos. Un experto en el arte entenderá, sin embargo, que la invención se puede practicar sin muchos de estos detalles. Además, algunas estructuras o funciones conocidas no se pueden mostrar o describir en detalle, de manera tal que se evite confundir innecesariamente la descripción pertinente. Aunque los diagramas ilustran componentes como funcionalmente separados, tal ilustración tiene fines sólo ilustrativos. Será evidente para los expertos en el arte que los componentes retratados en esta figura se pueden combinar o dividir arbitrariamente en componentes por separado .

La terminología usada en la descripción presentada a continuación está destinada a ser interpretada en su forma razonable más amplia, aun cuando se esté usando en conjunto con una descripción detallada de determinados ejemplos de la invención. Determinados términos aún pueden resaltarse a continuación; sin embargo, toda la terminología destinada a ser interpretada en cualquier forma se definirá abierta y específicamente como tal en la presente sección de la Descripción detallada.

Las referencias en la memoria descriptiva a "una realización", "una de las realizaciones", o similares significan que el rasgo, la estructura o la característica particular que se está describiendo está incluida en por lo menos en una de las realizaciones de la presente invención. Las apariciones de tales frases en la memoria descriptiva no necesariamente todas se refieren a la misma realización.

La Figura 1 ilustra un ejemplo de un codificador 100, de acuerdo con una de las realizaciones de la presente invención. El codificador 100 recibe una secuencia de video de entrada 110 y emite una secuencia de video codificada 120 que se puede decodificar en un decodificador para recuperar, por lo menos aproximadamente, una instancia de la secuencia de video de entrada 110. El codificador comprende un módulo de entrada 102, un módulo de procesamiento de video 104 y un módulo de codificación de video 106. El codificador 100 se puede implementar en un hardware, software o cualquier combinación adecuada. El codificador 100 puede incluir otros componentes tales como un módulo de transmisión de video, un módulo de entrada de parámetros, una memoria para almacenar parámetros, etc. El codificador 100 puede cumplir otras funciones de procesamiento de video que no se describen específicamente en la presente .

El módulo de entrada 102 recibe la secuencia de video de entrada 110. La secuencia de video de entrada 110 puede tomar cualquier forma adecuada, y puede tener origen en cualquiera de una variedad de fuentes tales como la memoria, o aún una carga en vivo. El módulo de entrada 102 además recibe información de limite de escena y la velocidad de bits blanco para cada escena. La información de limite de escena indica posiciones en la secuencia de video de entrada donde ocurren transiciones de escenas .

El módulo de procesamiento de video 104 analiza una secuencia de video de entrada 110 y divide la secuencia de video 110 en una pluralidad de secciones para cada una de la pluralidad de escenas basado en la información de limite de escena. Cada sección comprende una pluralidad de cuadros de imagen temporalmente continuos. En una de las realizaciones, el módulo de procesamiento de video también segmenta la secuencia de video de entrada en una pluralidad de archivos. Cada archivo contiene una o más secciones. En otra realización la posición, la resolución y el reloj fechador o el número de cuadro de inicio de cada secuencia de un archivo de video se registra en un archivo o base de datos. Un módulo de codificación de video codifica cada sección usando la velocidad de bits blanco asociada o la calidad del video con una limitación de velocidad de bits. En una de las realizaciones, el codificador también comprende un módulo de transmisión de video para transmitir los archivos por una conexión de red tal como una conexión de HTTP.

En algunas realizaciones, la resolución óptica de los cuadros de imagen de video se detecta y se analiza para determinar las dimensiones de video de escenas verdaderas u óptimas y la división de la escena. La resolución óptica describe una resolución a la cual uno o más cuadros de imagen de video pueden resolver continuamente los detalles. Debido a las limitaciones de la óptica de captura, de los medios de registro, del formato original, la resolución óptica de un cuadro de imagen de video puede ser mucho menor que la resolución técnica del cuadro de imagen de video. El módulo de procesamiento de video puede detectar una resolución óptica de los cuadros de imagen dentro de cada sección. Un tipo de escena se puede determinar basado en la resolución óptica de los cuadros de imagen dentro de la sección. Además, la velocidad de bits blanco de una sección se puede determinar basado en una resolución óptica de los cuadros de imagen dentro de la sección. Para una sección determinada con una baja resolución óptica, la velocidad de bits blanco puede ser más baja porque la velocidad de bits alta no contribuye a retener la fidelidad de la sección. En algunos casos de dispositivos que mejoran la resolución electrónicos, esos dispositivos que mejoran la resolución que convierten una imagen de baja resolución para ajustaría a un cuadro de video de resolución más alta además también pueden producir artefactos no deseados. Esto es especialmente cierto en las tecnologías de mejoramiento de la resolución antiguas. Mediante la recuperación de la resolución original, permitiremos gue los procesadores de video modernos mejoren la resolución de la imagen en una forma más eficiente y evitaremos codificar artefactos no deseados que no forman parte de la imagen original.

El módulo de codificación de video puede codificar cada sección usando cualquier norma de codificación tal como la norma H.264/MPEG-4 AVC (Codificación de Video Avanzada).

Cada sección, basada en una escena diferente, se puede codificar a un nivel diferente de calidades de percepción que transmiten diferentes velocidades de bits (es decir, 500Kbps, IMbps, 2Mbps) . En una de las realizaciones, si se cumple con una barra de calidad óptica o de video a determinada velocidad de bits, es decir a 500 Kbps, entonces el proceso de codificación puede no ser necesario para velocidades de bits más altas, evitando la necesidad de codificar esa escena a una velocidad de bits más alta, es decir a IMbps o 2Mbps. Véase la tabla 1. En el caso del almacenamiento de esas escenas en un solo archivo, el único archivo solamente almacena las escenas que se necesitan codificar a una velocidad de bits más alta. Sin embargo, en algunos casos, puede ser necesario almacenar en un archivo a una velocidad de bits alta (es decir, a 1 Mbps) para todas las escenas (para el legado a algunos sistemas de velocidad de bits adaptativa antiguos), en este caso particular la sección o segmentos que se deben almacenar son los de baja velocidad de bits, es decir de 500 Kbps en lugar de los de alta velocidad de bits. En consecuencia, se ahorra espacio de almacenamiento. (Pero no tan importante como no almacenar las escenas). Véase la Tabla 2. En otro caso para sistemas que no soportan varias resoluciones en un solo archivo, el almacenamiento de las secciones ocurre en archivos con un tamaño de cuadro determinado. Para minimizar el número de archivos a cada resolución, algunos sistemas limitan el número de tamaños de cuadros tales como SDTV, HD720p, HD1080p. Véase la Tabla 3.

TABLA 1 TABLA 2 TABLA 3 Cada sección, basada en una escena diferente, se puede codificar a un nivel diferente de calidad de percepción y a .una velocidad de bits diferente. En una de las realizaciones, el codificador lee una secuencia de video de entrada y una base de datos u otro listado de escenas, y luego segmenta la secuencia de video en secciones basadas en la información de las escenas. En la Tabla 4 se muestra ejemplo de estructura de datos para un listado de escenas en un video. En algunas realizaciones, la estructura de datos se puede almacenar en una memoria legible por computadora o una base de datos y puede ser accesible por el codificador.

TABLA 4 Se pueden utilizar diferentes tipos de escenas para el listado de escenas, tales como "movimiento rápido", "estática", "cabeza hablando", "texto", "imágenes principalmente negras", "escena corta de cinco cuadros o menos", "pantalla negra", "bajo interés", "archivo", "agua", "humo", "títulos", "borrosa", "fuera de foco", "imagen que tiene una resolución más baja que el tamaño del contenedor de imágenes", etc. En algunas realizaciones, algunas secuencias de escenas pueden ser tipos de escenas "varias", "desconocidas" o "por defecto" asignados a tales escenas .

La Figura 2 ilustra .pasos de un método 200 para codificar una secuencia de video de entrada. El método 200 codifica la secuencia de video de entrada a una secuencia de bits de video codificado que se puede decodificar en un decodificador para recuperar, por lo menos aproximadamente, una instancia de la secuencia de video de entrada. En el paso 210, el método recibe una secuencia de video de entrada que se ha de codificar. En el paso 220, el método recibe información de límite de escena que indica posiciones en la secuencia de video de entrada donde ocurren transiciones de escenas y la velocidad de bits blanco para cada escena. En el paso 230, la secuencia de imagen de entrada se divide en una pluralidad de secciones basado en la información de límite de escena, cada sección comprende una pluralidad de cuadros de imagen temporalmente contiguos. Luego, en el paso 240, el método detecta la resolución óptica de los cuadros de imagen dentro de cada sección. En el paso 250, el método segmenta la secuencia de video de entrada en una pluralidad de archivos, cada archivo contiene una o más secciones. En el paso 260, cada una de la pluralidad de secciones se codifica de acuerdo con la velocidad de bits blanco. Luego en el paso 270, el método transmite la pluralidad de archivos por una conexión de HTTP.

La secuencia de video de entrada normalmente incluye varios cuadros de imagen. Cada cuadro de imagen puede normalmente identificarse basado en una "posición de tiempo distinguible" en la secuencia de video de entrada. En las realizaciones, la secuencia de video de entrada puede ser una secuencia que se pone a disposición del codificador en partes o en segmentos discretos. En esos casos, el codificador emite la secuencia de bits de video codificada (por ejemplo, a un dispositivo del consumidor final tal como una HDTV) como una secuencia en forma continua antes de siquiera recibir la secuencia de video de entrada completa.

En algunas realizaciones, la secuencia de video de entrada y la secuencia de bits de video codificada se almacenan como una secuencia de secuencias. Aquí, la codificación se puede realizar por anticipado en el tiempo y las secuencias de video codificadas entonces se pueden difundir a un dispositivo de consumidor en un tiempo posterior. Aquí, la codificación se realiza completamente sobre la secuencia de video completa antes de difundirla a un dispositivo de consumidor. Se entiende que otros ejemplos de codificación previa, posterior, o "en linea" de las secuencias de video, o una combinación de ellas, como lo puede contemplar un experto en el arte, también están contemplados en conjunto con las técnicas presentadas en la presente.

La Figura 3 es un diagrama de bloques de un sistema de procesamiento que se puede usar para implementar cualquiera de las técnicas descritas anteriormente, tal como un codificador. Obsérvese que en determinadas realizaciones, por lo menos algunos de los componentes ilustrados en la Figura 3 se pueden distribuir entre dos o más plataformas o cajas de computación físicamente separadas pero conectadas. El procesamiento puede representar una computadora de la clase de servidor convencional, una PC (computadora personal), un dispositivo de comunicación móvil (por ejemplo, un teléfono inteligente), o cualquier otro dispositivo de procesamiento/comunicación conocido o convencional.

El sistema de procesamiento 301 mostrado en la Figura 3 incluye uno o más procesadores 310, es decir una unidad de procesamiento central (CPU) , una memoria 320, por lo menos un dispositivo de comunicación 340 tal como un adaptador de Ethernet ylo un subsistema de comunicación inalámbrico (por ejemplo, un teléfono celular, iFi, Bluetooth o similar) y uno o más dispositivos de I/O (entrada/salida) 370, 380, todos conectados uno a otro a través de una interconexión 390.

El procesador ( es ) 310 controla (an) la operación del sistema de computación 301 y puede o no incluir uno o más microprocesadores de propósito general o de propósito especial programables, microcontroladores, circuitos integrados específicos de la aplicación (ASIC) , dispositivos lógicos programables (PLD), o una combinación de tales dispositivos. La interconexión 390 puede incluir una o más barras colectoras, conexiones directas y/u otros tipos de conexiones físicas, y pueden incluir diferentes puentes, controladores y/o adaptadores tales como los conocidos en el arte. La interconexión 390 también puede incluir una "barra colectora del sistema", que se puede conectar a través de uno o más adaptadores a una o más barras colectoras de expansión, tales como una forma de la barra colectora de Interconexión de Componentes Periféricos (PCI), la barra colectora de arquitectura industrial normal o de HiperTransporte (ISA), la barra colectora de interfaz pequeña de sistemas computacionales (SCSI), la barra colectora serial universal (USB) , o la barra colectora de la norma 1394 del Instituto de Ingenieros Eléctricos y Electrónicos (IEEE) (algunas veces denominada "Firewire") .

La memoria 320 puede ser o incluir uno o más dispositivos de memoria de uno o más tipos, tales como la memoria de sólo lectura (ROM), la memoria de acceso aleatorio (RAM), la memoria flash, las unidades de discos, etc. El adaptador de red 340 es un dispositivo adecuado para permitir que el sistema de procesamiento 301 comunique datos con un sistema de procesamiento remoto en una conexión de comunicación, y puede ser, por ejemplo, un modem telefónico convencional, un modem inalámbrico, un modem de Linea de Abonado Digital (DSL) , un modem de cable, un transceptor de radio, un transceptor satelital, un adaptador de Ethernet, o similares. Los dispositivos de entrada/salida 370, 380 pueden incluir, por ejemplo, uno o más dispositivos tales como: un dispositivo puntero tal como un mouse, una bola rodante, una palanca de juegos, una almohadilla sensible al tacto, o similar; un teclado; un micrófono con interfaz de reconocimiento de voz; altavoces de sonido; un dispositivo de presentación; etc. Obsérvese, sin embargo, que tales dispositivos de entrada/salida pueden ser innecesarios en un sistema que opera exclusivamente como un servidor y no provee ninguna interfaz de usuario directa, como es el caso con el servidor en lo menos algunas realizaciones. Otras variaciones en el grupo de componentes ilustrados se pueden implementar en una forma consistente con la invención .

Un software y/o un firmware 330 para programar el procesador (es ) 310 para llevar a cabo acciones descritas anteriormente se puede almacenar en la memoria 320. En determinadas realizaciones, se puede proporcionar tal software o firmware al sistema de computación 301 descargándolo desde un sistema remoto a través del sistema de computación 301 (por ejemplo, a través del adaptador de red 340) .

Las técnicas presentadas anteriormente se pueden implementar, por ejemplo, mediante un circuito programable (por ejemplo, uno o más microprocesadores) programado con un software y/o firmware, o completamente en un circuito de cable de propósito especial, o en una combinación de tales formas. El circuito de cable de propósito especial puede estar en la forma de, por ejemplo, uno o más circuitos integrados específicos de la aplicación (ASIC) , dispositivos lógicos programables (PLD), redes de compuertas programables en el campo (FPGA), etc.

El software o el firmware para su uso en la implementación de las técnicas presentadas en la presente se pueden almacenar sobre un medio de almacenamiento legible por una máquina y se puede ejecutar mediante uno o más microprocesadores programables de propósito general o de propósito especial. Un "medio de almacenamiento legible por una máquina", como se usa el término en la presente, incluye todos los mecanismos que pueden almacenar información en una forma accesible por una máquina (una máquina puede ser, por ejemplo, una computadora, un dispositivo de red, un teléfono celular, una agenda digital (PDA), una herramienta de fabricación, cualquier dispositivo con uno o más procesadores, etc.) . Por ejemplo, un medio de almacenamiento accesible por una máquina incluye medios grabables/no grabables (por ejemplo, una memoria de sólo lectura (ROM) , una memoria de acceso aleatorio (RAM) , medios de almacenamiento de disco magnético; medios de almacenamiento óptico; dispositivos de memoria flash; etc.), etc.

El término "lógica", como se usa en la presente, puede incluir, por ejemplo, un circuito programable programado con un software y/o firmware especifico, un circuito de cable de propósito especial, o una combinación de ellos.

La descripción precedente de diferentes realizaciones del objeto reivindicado se ha provisto con los fines de la ilustración y la descripción. No se desea ser taxativo o limitar el objeto reivindicado a las formas precisas reveladas. Muchas modificaciones y variaciones serán evidentes para el experto en el arte. Se eligieron y describieron realizaciones para describir mejor los principios de la invención y su aplicación práctica, permitiendo de ese modo que otros expertos en el arte comprendan el objeto reivindicado, las diferentes realizaciones y con diferentes modificaciones que son adecuadas para el uso particular contemplado.

Las enseñanzas de la invención provistas en la presente se pueden aplicar a otros sistemas, no necesariamente el sistema descrito anteriormente. Los elementos y actos de las diferentes realizaciones descritas anteriormente se pueden combinar para proporcionar otras realizaciones.

Si bien la descripción precedente describe determinadas realizaciones de la invención, y describe la mejor modalidad contemplada, no importa cuán detallado aparece lo anterior en el texto, la invención se puede practicar en muchas formas. Los detalles del sistema pueden variar considerablemente en sus detalles de implementación, aunque están abarcados por la invención revelada en la presente. Como se indicó anteriormente, la terminología particular usada cuando se describen determinadas características o aspectos de la invención no se debe tomar que implica que la terminología se está redefiniendo en la presente para ser restringida a ninguna característica, rasgo o aspecto de la invención con la cual está asociada esa terminología. En general, no se debe interpretar que los términos usados en las siguientes reivindicaciones limitan la invención a las realizaciones específicas reveladas en la memoria descriptiva, a menos que la sección de la Descripción Detallada precedente defina explícitamente esos términos. Por consiguiente, el alcance real de la invención comprende no solamente las realizaciones reveladas, sino también todas las formas equivalentes de poner en práctica o implementar la invención de acuerdo con las reivindicaciones .

Claims

REIVINDICACIONES

1. Un método para codificar una secuencia de video usando tipos de escenas, el método comprende: recibir una secuencia de video de entrada; recibir información de limite de escena que indica la posición en la secuencia de video de entrada donde ocurren transiciones de escenas y la velocidad de bits blanco para cada escena; dividir la secuencia de video de entrada en una pluralidad de secciones basado en la información de limite de escena, cada sección comprende una pluralidad de cuadros de imagen temporalmente contiguos; y codificar cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco.

2. El método para codificar una secuencia de video de acuerdo con la reivindicación 1., que además comprende: recibir un tamaño de contenedor máximo para cada escena.

3. El método para codificar una secuencia de video de acuerdo con la reivindicación 2, en donde el paso de codificar comprende codificar cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco y el tamaño de contenedor máximo.

4. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, que además comprende: segmentar la secuencia de video de entrada en una pluralidad de de archivos, cada archivo contiene una o más secciones.

5. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, que además comprende segmentar la secuencia de video de entrada en una base de datos y un solo archivo de video, cada archivo contiene ninguna o una o más secciones.

6. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, que además comprende: transmitir la pluralidad de archivos por una conexión de HTTP.

7. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, que además comprende: detectar la resolución óptica óptima de los cuadros de imagen dentro de cada sección.

8. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, en donde por lo menos uno de los tipos de escenas se determina basado en resolución óptica del cuadro de imagen dentro de la sección.

9. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, en donde por lo menos una de la velocidad de bits blanco de las secciones se determina basado en la resolución óptica de los cuadros de imagen dentro de la sección .

10. El método para codificar una secuencia de imagen de acuerdo con la reivindicación 1, en" donde por lo menos uno del tamaño de imagen de video de las secciones se determina basado en la resolución óptica más cercana de los cuadros de imagen dentro la sección.

11. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, en donde el paso de codificar comprende codificar cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco en una norma H.264/ PEG-4 AVC.

12. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, en donde un tipo de escena dado incluye uno o más de: un tipo de escena de movimiento rápido; un tipo de escena estático; una cabeza hablando; un texto; imágenes principalmente negras; una escena corta; 10 un tipo de escena de bajo interés; un tipo de escena de incendio; un tipo de escena de agua; un tipo de escena de humo; un tipo de escena de títulos; -j_5 un tipo de escena borrosa; un tipo de escena fuera de foco; una imagen que tiene una resolución más baja que el tipo de escena de tamaño de contenedor de imagen; varios; o 20 por defecto.

13. Un aparato de codificación de video para codificar una secuencia de video usando tipos de escenas, el aparato comprende: un módulo de entrada para recibir una secuencia de video de entrada; el módulo de entrada que recibe información de limite de escena que indica posiciones en la secuencia de video de entrada donde ocurren las transiciones de escenas y la velocidad de bits blanco para cada escena; un módulo de procesamiento de video para dividir la secuencia de video de entrada en una pluralidad secciones basado en la información de límite de escena, cada sección comprende una pluralidad de cuadros de imagen contiguos temporalmente; y un módulo de codificación de video para codificar cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco.

14. El aparato de codificación de video de acuerdo con la reivindicación 1, en donde el módulo de entrada además recibe el tamaño de imagen óptica para cada escena.

15. El aparato de codificación de video de acuerdo con la reivindicación 14, en donde el módulo de codificación de video además codifica cada una de la pluralidad de secciones de acuerdo con el tamaño de imagen óptica.

16. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde el módulo de procesamiento de video además comprende segmenta la secuencia de video de entrada en una pluralidad de archivos, y cada archivo contiene una o más secciones .

17. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde la secuencia de video se codifica como un solo archivo acompañado con un archivo que contiene la posición de cada segmento, cuadro de inicio, reloj fechador y resolución .

18. El aparato de codificación de video de acuerdo con la reivindicación 13, que además comprende: un módulo de codificación de video para transmitir la pluralidad de archivos por una conexión de HTTP.

19. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde el módulo de procesamiento de video además detecta una resolución óptica de los cuadros de imagen dentro de cada sección.

20. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde por lo menos uno de los tipos de escena se determina basado en una resolución óptica de los cuadros de imagen dentro de la sección.

21. El aparato de de codificación de video de acuerdo con la reivindicación 13, en donde por lo menos uno de la velocidad de bits blanco de la sección se determina basado en una resolución óptica de los cuadros de imagen dentro de la sección.

22. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde por lo menos uno de la barra de la calidad del video se determina basado en la resolución óptica de los cuadros de imagen dentro de la sección.

23. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde el módulo de codificación de video codifica cada uno de la pluralidad de secciones de acuerdo con la velocidad de bits blanco basado en la norma H .264 / PEG-4 AVC.

24. El aparato de codificación de video de acuerdo con 1 reivindicación 13, en donde un tipo de escena dado asignado po el módulo de codificación de video incluye uno o más de: un tipo de escena de movimiento rápido; un tipo de escena estático; una cabeza hablando; un texto; imágenes principalmente negras; una escena corta; un tipo de escena de bajo interés; un tipo de escena de incendio; un tipo de escena de agua; un tipo de escena de humo; un tipo de escena de títulos; un tipo de escena borrosa; un tipo de escena fuera de foco; una imagen que tiene una resolución más baja que el tipo de escena de tamaño de contenedor de imagen; varios; o por defecto.