MX2013008757A - Control de velocidad de bits adaptativa basado en escenas. - Google Patents
Control de velocidad de bits adaptativa basado en escenas.Info
- Publication number
- MX2013008757A MX2013008757A MX2013008757A MX2013008757A MX2013008757A MX 2013008757 A MX2013008757 A MX 2013008757A MX 2013008757 A MX2013008757 A MX 2013008757A MX 2013008757 A MX2013008757 A MX 2013008757A MX 2013008757 A MX2013008757 A MX 2013008757A
- Authority
- MX
- Mexico
- Prior art keywords
- scene
- video
- encoding
- video sequence
- sections
- Prior art date
Links
- 230000003044 adaptive effect Effects 0.000 title abstract description 7
- 230000007704 transition Effects 0.000 claims abstract description 6
- 238000000034 method Methods 0.000 claims description 35
- 230000003287 optical effect Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 16
- 239000000779 smoke Substances 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- UWHCKJMYHZGTIT-UHFFFAOYSA-N tetraethylene glycol Chemical compound OCCOCCOCCOCCO UWHCKJMYHZGTIT-UHFFFAOYSA-N 0.000 claims 2
- 238000003860 storage Methods 0.000 description 12
- 238000007906 compression Methods 0.000 description 9
- 230000006835 compression Effects 0.000 description 9
- 230000033001 locomotion Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
En la presente se describe un codificador para codificar una secuencia de video. El codificador recibe una secuencia de video de entrada, información de límite de escena que indica posiciones en la secuencia de video de entrada donde ocurren transiciones de escena y velocidad de bits de imagen para cada escena. El codificador divide la secuencia de video de entrada en una pluralidad de secciones basado en la información de límite de escena. Cada sección comprende una pluralidad de cuadros de imagen temporalmente contiguos. El codificador codifica cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco, proporcionando un control de velocidad de bits adaptativa basada en escenas. Si se cumple con la barra de la calidad del video a una velocidad de bits más baja, no hay necesidad de codificar misma sección a una velocidad de bits más alta ya que la barra de calidad ya se ha cumplido.
Description
CONTROL DE VELOCIDAD DE BITS ADAPTATIVA BASADO EN ESCENAS
Referencia Cruzada a Solicitudes de Patentes Relacionadas
Esta solicitud de patente reivindica prioridad de la Solicitud de Patente Provisoria Estadounidense N° 51/437.193, presentada el 28 de enero de 2011 y de la Solicitud de Patente Provisoria Estadounidense N° 61/437.223, presentada el 28 de enero de 2011, cuyos contenidos se incorporan expresamente como referencia en la presente .
Campo de la invención
La presente invención se relaciona con una técnica de -compresión de video y de imagen y más específicamente, con una técnica de compresión de video y de imagen usando el control de velocidad de bits adaptativa basado en escenas.
Antecedentes de la invención
Si bien la popularidad de la difusión de video continúa creciendo y sigue aumentando su uso entre los usuarios cotidianos, existen varias limitaciones implícitas que es necesario resolver. Por ejemplo, los usuarios suelen querer mirar un video por Internet que tiene un ancho de banda sólo limitado para obtener esa secuencia de video. En algunos casos, los usuarios podrían querer
obtener la secuencia de video por una conexión de teléfono móvil una conexión inalámbrica hogareña. En algunas situaciones, los usuarios compensan la falta un ancho de banda ¦ suficiente operaciones simultáneas periféricas en linea del contenido (es decir, la descarga del contenido al almacenamiento local para finalmente mirarlo) . Este método está repleto de varias desventajas. En primer lugar, el usuario no puede tener una experiencia de "tiempo de ejecución" real, es decir, el usuario no puede mirar un programa cuando decide mirarlo. En cambio, tiene que experimentar retardos importantes para el contenido que se debe someter a operaciones simultáneas periféricas en linea antes de mirar el programa. Otra desventaja está en la disponibilidad de almacenamiento, el prestador o el usuario tiene que explicar los recursos de almacenamiento para asegurar que el contenido sometido a operaciones simultáneas periféricas en linea que se puede almacenar, aún durante un corto periodo de tiempo, que deriva en la utilización innecesaria de recursos de almacenamiento costosos.
Una secuencia de video que normalmente contiene una parte de imagen y una parte de sonido puede necesitar un ancho de banda considerable, especialmente a una alta resolución (por ejemplo, videos en HD (alta definición) ) . El sonido normalmente necesita un ancho de banda mucho menor, pero aún algunas veces se necesita tenerlo en cuenta. Un enfoque de difusión de video es comprimir fuertemente la secuencia de video que permite la entrega rápida
del video para permitir que un usuario mire el contenido en el tiempo de ejecución o sustancialmente en forma instantánea (es decir, sin experimentar retardos de operaciones simultáneas periféricas en linea sustanciales) . Normalmente, la compresión con pérdidas (es decir, la compresión que no es completamente reversible) provee mayor compresión que la compresión sin pérdidas, pero la compresión con- pérdidas fuertes provee una experiencia de usuario indeseable.
Para reducir el ancho de banda necesario para transmitir señales de video digital, se conoce bien el uso de la codificación de video digital eficiente donde la velocidad de datos de una señal de video digital se puede reducir sustancialmente (con el fin de la compresión de datos de video) . Para asegurar la interoperabilidad, las normas de codificación de video han cumplido un papel fundamental en facilitar la adopción del video digital en muchas aplicaciones de profesionales y consumidores. Las normas más influyentes tradicionalmente se desarrollan por la Unión Internacional de Telecomunicaciones (ITU-T) o la comisión 15 del MPEG (Grupo de Expertos de Imágenes en Movimiento) de la ISO/IEC (la Organización Internacional de Normalización/Comisión Electrotécnica Internacional. Las normas de la ITU-T, denominadas recomendaciones, normalmente apuntan a las comunicaciones en tiempo real (por ejemplo, videoconferencia) mientras que la mayor parte de las normas del MPEG se optimizan para el almacenamiento (por ejemplo, para el Disco Versátil Digital (DVD) y la
transmisión (por ejemplo, para la norma de Transmisión de Video Digital (OVB) ) .
En la actualidad, la mayor parte de los algoritmos de codificación de video normalizados están basados en la codificación de video híbrida. Los métodos de codificación de video híbrida normalmente combinan varios esquemas diferentes de compresión sin pérdida y con pérdida para lograr el aumento de compresión deseado. La codificación de video híbrida también es el fundamento para las normas de ITV-T (normas H.26x tales como H.261, H.263) así como las normas ISO/IEC (normas MPEG-X tales como MPEG-1, MPEG-2 y MPEG-4). La norma' de codificación de video más reciente y avanzada es actualmente la norma indicada como codificación de video avanzada H.264/MPEG-4 (AVC) que es el resultado de los esfuerzos de normalización realizados por el equipo conjunto de video ( JVT) , un equipo conjunto de ITV-T y grupos de MPEG de ISO/IEC.
La norma H.264 emplea los mismos principios de la codificación de transformada híbrida compensada por el movimiento basado en bloques que se conocen a partir de las normas establecidas tales como MPEG-2. En consecuencia, la sintaxis de H.264 se organiza como la jerarquía de encabezados habitual, tal como encabezados de imagen, de segmento, y datos, tales como vectores de movimiento, coeficientes de transformada de bloque, escala de cuantificador, etc. Sin embargo, la norma H.264 separa la Capa de
Codificación de Video (VCL) , que representa el contenido de los datos de video, y la Capa de Adaptación de Red (NAL) , que da un formato a los datos y provee información del encabezado.
Además, H.264 permite una elección muy aumentada de parámetros de codificación. Por ejemplo, permite una segmentación y manipulación más elaborada de macro-bloques de 16 x 16 por lo cual por ejemplo el proceso de compensación por movimiento se puede realizar al segmentar un macro-bloque tan pequeño como 4x4 de tamaño. Además, el proceso de selección para la predicción compensada por movimiento de un bloque de muestra puede comprender un número de imágenes decodificadas previamente almacenadas, en lugar de solamente las imágenes adyacentes. Aún con la intracodificación dentro de un solo cuadro, es posible formar una predicción de un bloque usando muestras decodificadas previamente del mismo cuadro. Además, el error de predicción resultante posterior a la compensación por movimiento se puede transformar y cuantificar basado en un tamaño de bloque de 4x4, en lugar del tamaño de 8x8 tradicional. También un filtro de desbloqueo en bucle es ahora obligatorio.
La norma H.264 se puede considerar un superconjunto de la sintaxis de codificación de video de H.262/MPEG-2 en que usa la misma estructuración global de datos de video mientras que extiende el número de decisiones y parámetros de codificación posibles. Una consecuencia de tener una variedad de decisiones de
codificación es que se puede conseguir una buena compensación entre la velocidad de bits y la calidad de la imagen. Sin embargo, aunque comúnmente se reconoce que si bien la norma H.264 puede reducir mucho los artefactos típicos de la codificación basada en bloques, también puede acentuar otros artefactos. El hecho de que H.264 permita un número aumentado de valores posibles para diferentes parámetros de codificación por lo tanto deriva en un potencial aumentado para mejorar el proceso de codificación pero también deriva en una sensibilidad aumentada a la elección de los parámetros de codificación de video.
En forma similar a las demás normas, H.264 no especifica un procedimiento normativo para seleccionar parámetros de codificación de video, pero describe a través de una implementación de referencia, numerosos criterios que se pueden usar para seleccionar parámetros de codificación de video tales como para lograr una compensación adecuada entre la eficiencia de codificación, la calidad del video y la practicidad de implementación. Sin embargo, los criterios descritos no siempre pueden derivar en una selección óptima o adecuada de los parámetros de codificación adecuados para todos los tipos de contenidos y aplicaciones. Por ejemplo, los criterios pueden no derivar en la selección de parámetros de codificación de video óptimos o deseables para las características de la señal de video o los criterios pueden estar basados en lograr características de la señal codificada que no son apropiadas para la aplicación
actual .
Se conoce la codificación de datos de video usando la codificación de velocidad de bits constante ("CBR") o la codificación de velocidad de bits variable ("VBR"). En ambos casos, el número de bits por unidad de tiempo se cierre, es decir, la velocidad de bits no puede exceder algún umbral. Con frecuencia, la velocidad de bits se expresa en bits por segundo. La codificación de CBR suele ser solamente un tipo de codificación de VBR con relleno adicional hasta la velocidad de bits constante (por ejemplo, relleno de la secuencia de bits con ceros) .
La red de TCP/IP (Protocolo de Control de Transmisiones/Protocolo de Internet) , tal como Internet, no es una tubería "secuencia de bits", sino el mejor esfuerzo de red que la capacidad de transmisión varía en cualquier momento. La codificación y la transmisión de videos usando un enfoque de CBR o de VBR no es ideal en el mejor esfuerzo de red. Se han diseñado algunos protocolos para entregar video por Internet. Un buen ejemplo es la Difusión de Video de Velocidad de Bits Adaptativa, en donde la secuencia de video se segmenta en archivos, que se entregan como archivos por conexiones de HTTP (protocolo de transporte de hipertexto) . Cada uno de estos archivos contiene una secuencia de video que tiene un tiempo de reproducción predeterminado y las velocidades de bits pueden variar y el tamaño del archivo puede variar. Por lo tanto, algunos archivos pueden ser más cortos que
otros .
Por consiguiente, seria ventajoso un sistema mejorado para la codificación de video.
Los ejemplos precedentes del arte relacionado y las limitaciones relacionadas con ellos están destinados a ser ilustrativos y no excluyentes. Otras limitaciones del arte relacionado se harán evidentes al leer la memoria descriptiva y estudiar los dibujos.
Extracto de la invención
En la presente se describe un codificador para codificar una secuencia de video. El codificador recibe una secuencia de video de entrada, información de limite de escena que indica posiciones en la secuencia de video de entrada donde ocurren transiciones de escena y la velocidad de bits blanco para cada escena. El codificador divide la secuencia de video de entrada en una pluralidad de secciones basado en la información de limite de escena. Cada sección comprende una pluralidad de cuadros de imagen contiguos temporalmente. El codificador codifica cada una de la pluralidad de escenas de acuerdo con la velocidad de bits blanco, proporcionando un control de velocidad de bits adaptativa basado en el las escenas.
El presente Resumen se proporciona para presentar una selección de conceptos en una forma simplificada que se describen adicionalmente a continuación en la Descripción Detallada. El presente Resumen no está destinado a identificar características fundamentales o características esenciales del objeto reivindicado, no está destinado a ser usado para limitar el alcance del objeto reivindicado.
Breve Descripción de los Dibujos
Una o más realizaciones de la presente invención se ilustran a modo de ejemplo y no están limitadas por las figuras de los dibujos adjuntos, en donde las referencias similares indican elementos similares.
La Figura 1 ilustra un ejemplo de un codificador.
La Figura 2 ilustra pasos de un método de muestra para codificar una secuencia de video de entrada.
La Figura 3 es un diagrama de bloques de un sistema de procesamiento que se puede usar para implementar un codificador que implementa determinadas técnicas descritas en la presente.
Descripción detallada de la invención
Se describirán ahora diferentes aspectos de la invención. La siguiente descripción proporciona detalles específicos para una comprensión completa y una descripción de estos ejemplos. Un experto en el arte entenderá, sin embargo, que la invención se puede practicar sin muchos de estos detalles. Además, algunas estructuras o funciones conocidas no se pueden mostrar o describir en detalle, de manera tal que se evite confundir innecesariamente la descripción pertinente. Aunque los diagramas ilustran componentes como funcionalmente separados, tal ilustración tiene fines sólo ilustrativos. Será evidente para los expertos en el arte que los componentes retratados en esta figura se pueden combinar o dividir arbitrariamente en componentes por separado .
La terminología usada en la descripción presentada a continuación está destinada a ser interpretada en su forma razonable más amplia, aun cuando se esté usando en conjunto con una descripción detallada de determinados ejemplos de la invención. Determinados términos aún pueden resaltarse a continuación; sin embargo, toda la terminología destinada a ser interpretada en cualquier forma se definirá abierta y específicamente como tal en la presente sección de la Descripción detallada.
Las referencias en la memoria descriptiva a "una realización", "una de las realizaciones", o similares significan que el rasgo, la estructura o la característica particular que se está describiendo está incluida en por lo menos en una de las realizaciones de la presente invención. Las apariciones de tales frases en la memoria descriptiva no necesariamente todas se refieren a la misma realización.
La Figura 1 ilustra un ejemplo de un codificador 100, de acuerdo con una de las realizaciones de la presente invención. El codificador 100 recibe una secuencia de video de entrada 110 y emite una secuencia de video codificada 120 que se puede decodificar en un decodificador para recuperar, por lo menos aproximadamente, una instancia de la secuencia de video de entrada 110. El codificador comprende un módulo de entrada 102, un módulo de procesamiento de video 104 y un módulo de codificación de video 106. El codificador 100 se puede implementar en un hardware, software o cualquier combinación adecuada. El codificador 100 puede incluir otros componentes tales como un módulo de transmisión de video, un módulo de entrada de parámetros, una memoria para almacenar parámetros, etc. El codificador 100 puede cumplir otras funciones de procesamiento de video que no se describen específicamente en la presente .
El módulo de entrada 102 recibe la secuencia de video de entrada 110. La secuencia de video de entrada 110 puede tomar cualquier forma adecuada, y puede tener origen en cualquiera de una variedad de fuentes tales como la memoria, o aún una carga en vivo. El módulo de entrada 102 además recibe información de limite de escena y la velocidad de bits blanco para cada escena. La información de limite de escena indica posiciones en la secuencia de video de entrada donde ocurren transiciones de escenas .
El módulo de procesamiento de video 104 analiza una secuencia de video de entrada 110 y divide la secuencia de video 110 en una pluralidad de secciones para cada una de la pluralidad de escenas basado en la información de limite de escena. Cada sección comprende una pluralidad de cuadros de imagen temporalmente continuos. En una de las realizaciones, el módulo de procesamiento de video también segmenta la secuencia de video de entrada en una pluralidad de archivos. Cada archivo contiene una o más secciones. En otra realización la posición, la resolución y el reloj fechador o el número de cuadro de inicio de cada secuencia de un archivo de video se registra en un archivo o base de datos. Un módulo de codificación de video codifica cada sección usando la velocidad de bits blanco asociada o la calidad del video con una limitación de velocidad de bits. En una de las realizaciones, el codificador también comprende un módulo de transmisión de video para transmitir los archivos por una
conexión de red tal como una conexión de HTTP.
En algunas realizaciones, la resolución óptica de los cuadros de imagen de video se detecta y se analiza para determinar las dimensiones de video de escenas verdaderas u óptimas y la división de la escena. La resolución óptica describe una resolución a la cual uno o más cuadros de imagen de video pueden resolver continuamente los detalles. Debido a las limitaciones de la óptica de captura, de los medios de registro, del formato original, la resolución óptica de un cuadro de imagen de video puede ser mucho menor que la resolución técnica del cuadro de imagen de video. El módulo de procesamiento de video puede detectar una resolución óptica de los cuadros de imagen dentro de cada sección. Un tipo de escena se puede determinar basado en la resolución óptica de los cuadros de imagen dentro de la sección. Además, la velocidad de bits blanco de una sección se puede determinar basado en una resolución óptica de los cuadros de imagen dentro de la sección. Para una sección determinada con una baja resolución óptica, la velocidad de bits blanco puede ser más baja porque la velocidad de bits alta no contribuye a retener la fidelidad de la sección. En algunos casos de dispositivos que mejoran la resolución electrónicos, esos dispositivos que mejoran la resolución que convierten una imagen de baja resolución para ajustaría a un cuadro de video de resolución más alta además también pueden producir artefactos no deseados. Esto es especialmente cierto en las tecnologías de mejoramiento de la
resolución antiguas. Mediante la recuperación de la resolución original, permitiremos gue los procesadores de video modernos mejoren la resolución de la imagen en una forma más eficiente y evitaremos codificar artefactos no deseados que no forman parte de la imagen original.
El módulo de codificación de video puede codificar cada sección usando cualquier norma de codificación tal como la norma H.264/MPEG-4 AVC (Codificación de Video Avanzada).
Cada sección, basada en una escena diferente, se puede codificar a un nivel diferente de calidades de percepción que transmiten diferentes velocidades de bits (es decir, 500Kbps, IMbps, 2Mbps) . En una de las realizaciones, si se cumple con una barra de calidad óptica o de video a determinada velocidad de bits, es decir a 500 Kbps, entonces el proceso de codificación puede no ser necesario para velocidades de bits más altas, evitando la necesidad de codificar esa escena a una velocidad de bits más alta, es decir a IMbps o 2Mbps. Véase la tabla 1. En el caso del almacenamiento de esas escenas en un solo archivo, el único archivo solamente almacena las escenas que se necesitan codificar a una velocidad de bits más alta. Sin embargo, en algunos casos, puede ser necesario almacenar en un archivo a una velocidad de bits alta (es decir, a 1 Mbps) para todas las escenas (para el legado a algunos sistemas de velocidad de bits adaptativa antiguos), en este caso particular la sección o segmentos que se deben almacenar son los de baja velocidad de bits, es decir de
500 Kbps en lugar de los de alta velocidad de bits. En consecuencia, se ahorra espacio de almacenamiento. (Pero no tan importante como no almacenar las escenas). Véase la Tabla 2. En otro caso para sistemas que no soportan varias resoluciones en un solo archivo, el almacenamiento de las secciones ocurre en archivos con un tamaño de cuadro determinado. Para minimizar el número de archivos a cada resolución, algunos sistemas limitan el número de tamaños de cuadros tales como SDTV, HD720p, HD1080p. Véase la Tabla 3.
TABLA 1
TABLA 2
TABLA 3
Cada sección, basada en una escena diferente, se puede codificar a un nivel diferente de calidad de percepción y a .una velocidad de bits diferente. En una de las realizaciones, el codificador lee una secuencia de video de entrada y una base de datos u otro listado de escenas, y luego segmenta la secuencia de video en
secciones basadas en la información de las escenas. En la Tabla 4 se muestra ejemplo de estructura de datos para un listado de escenas en un video. En algunas realizaciones, la estructura de datos se puede almacenar en una memoria legible por computadora o una base de datos y puede ser accesible por el codificador.
TABLA 4
Se pueden utilizar diferentes tipos de escenas para el listado de escenas, tales como "movimiento rápido", "estática", "cabeza hablando", "texto", "imágenes principalmente negras", "escena corta de cinco cuadros o menos", "pantalla negra", "bajo interés", "archivo", "agua", "humo", "títulos", "borrosa", "fuera de foco", "imagen que tiene una resolución más baja que el tamaño del contenedor de imágenes", etc. En algunas realizaciones, algunas secuencias de escenas pueden ser tipos de escenas "varias", "desconocidas" o "por defecto" asignados a tales escenas .
La Figura 2 ilustra .pasos de un método 200 para codificar una secuencia de video de entrada. El método 200 codifica la secuencia de video de entrada a una secuencia de bits de video codificado que se puede decodificar en un decodificador para recuperar, por lo menos aproximadamente, una instancia de la secuencia de video de entrada. En el paso 210, el método recibe una secuencia de video de entrada que se ha de codificar. En el paso 220, el método recibe información de límite de escena que indica posiciones en la secuencia de video de entrada donde ocurren transiciones de escenas y la velocidad de bits blanco para cada escena. En el paso 230, la secuencia de imagen de entrada se divide en una pluralidad de secciones basado en la información de límite de escena, cada sección comprende una pluralidad de cuadros de imagen temporalmente contiguos. Luego, en el paso 240, el método detecta la resolución óptica de los
cuadros de imagen dentro de cada sección. En el paso 250, el método segmenta la secuencia de video de entrada en una pluralidad de archivos, cada archivo contiene una o más secciones. En el paso 260, cada una de la pluralidad de secciones se codifica de acuerdo con la velocidad de bits blanco. Luego en el paso 270, el método transmite la pluralidad de archivos por una conexión de HTTP.
La secuencia de video de entrada normalmente incluye varios cuadros de imagen. Cada cuadro de imagen puede normalmente identificarse basado en una "posición de tiempo distinguible" en la secuencia de video de entrada. En las realizaciones, la secuencia de video de entrada puede ser una secuencia que se pone a disposición del codificador en partes o en segmentos discretos. En esos casos, el codificador emite la secuencia de bits de video codificada (por ejemplo, a un dispositivo del consumidor final tal como una HDTV) como una secuencia en forma continua antes de siquiera recibir la secuencia de video de entrada completa.
En algunas realizaciones, la secuencia de video de entrada y la secuencia de bits de video codificada se almacenan como una secuencia de secuencias. Aquí, la codificación se puede realizar por anticipado en el tiempo y las secuencias de video codificadas entonces se pueden difundir a un dispositivo de consumidor en un tiempo posterior. Aquí, la codificación se realiza completamente sobre la secuencia de video completa antes de difundirla a un
dispositivo de consumidor. Se entiende que otros ejemplos de codificación previa, posterior, o "en linea" de las secuencias de video, o una combinación de ellas, como lo puede contemplar un experto en el arte, también están contemplados en conjunto con las técnicas presentadas en la presente.
La Figura 3 es un diagrama de bloques de un sistema de procesamiento que se puede usar para implementar cualquiera de las técnicas descritas anteriormente, tal como un codificador. Obsérvese que en determinadas realizaciones, por lo menos algunos de los componentes ilustrados en la Figura 3 se pueden distribuir entre dos o más plataformas o cajas de computación físicamente separadas pero conectadas. El procesamiento puede representar una computadora de la clase de servidor convencional, una PC (computadora personal), un dispositivo de comunicación móvil (por ejemplo, un teléfono inteligente), o cualquier otro dispositivo de procesamiento/comunicación conocido o convencional.
El sistema de procesamiento 301 mostrado en la Figura 3 incluye uno o más procesadores 310, es decir una unidad de procesamiento central (CPU) , una memoria 320, por lo menos un dispositivo de comunicación 340 tal como un adaptador de Ethernet ylo un subsistema de comunicación inalámbrico (por ejemplo, un teléfono celular, iFi, Bluetooth o similar) y uno o más dispositivos de I/O (entrada/salida) 370, 380, todos conectados uno a otro a través de una interconexión 390.
El procesador ( es ) 310 controla (an) la operación del sistema de computación 301 y puede o no incluir uno o más microprocesadores de propósito general o de propósito especial programables, microcontroladores, circuitos integrados específicos de la aplicación (ASIC) , dispositivos lógicos programables (PLD), o una combinación de tales dispositivos. La interconexión 390 puede incluir una o más barras colectoras, conexiones directas y/u otros tipos de conexiones físicas, y pueden incluir diferentes puentes, controladores y/o adaptadores tales como los conocidos en el arte. La interconexión 390 también puede incluir una "barra colectora del sistema", que se puede conectar a través de uno o más adaptadores a una o más barras colectoras de expansión, tales como una forma de la barra colectora de Interconexión de Componentes Periféricos (PCI), la barra colectora de arquitectura industrial normal o de HiperTransporte (ISA), la barra colectora de interfaz pequeña de sistemas computacionales (SCSI), la barra colectora serial universal (USB) , o la barra colectora de la norma 1394 del Instituto de Ingenieros Eléctricos y Electrónicos (IEEE) (algunas veces denominada "Firewire") .
La memoria 320 puede ser o incluir uno o más dispositivos de memoria de uno o más tipos, tales como la memoria de sólo lectura (ROM), la memoria de acceso aleatorio (RAM), la memoria flash, las unidades de discos, etc. El adaptador de red 340 es un dispositivo adecuado para permitir que el sistema de procesamiento 301 comunique datos con un sistema de procesamiento
remoto en una conexión de comunicación, y puede ser, por ejemplo, un modem telefónico convencional, un modem inalámbrico, un modem de Linea de Abonado Digital (DSL) , un modem de cable, un transceptor de radio, un transceptor satelital, un adaptador de Ethernet, o similares. Los dispositivos de entrada/salida 370, 380 pueden incluir, por ejemplo, uno o más dispositivos tales como: un dispositivo puntero tal como un mouse, una bola rodante, una palanca de juegos, una almohadilla sensible al tacto, o similar; un teclado; un micrófono con interfaz de reconocimiento de voz; altavoces de sonido; un dispositivo de presentación; etc. Obsérvese, sin embargo, que tales dispositivos de entrada/salida pueden ser innecesarios en un sistema que opera exclusivamente como un servidor y no provee ninguna interfaz de usuario directa, como es el caso con el servidor en lo menos algunas realizaciones. Otras variaciones en el grupo de componentes ilustrados se pueden implementar en una forma consistente con la invención .
Un software y/o un firmware 330 para programar el procesador (es ) 310 para llevar a cabo acciones descritas anteriormente se puede almacenar en la memoria 320. En determinadas realizaciones, se puede proporcionar tal software o firmware al sistema de computación 301 descargándolo desde un sistema remoto a través del sistema de computación 301 (por ejemplo, a través del adaptador de red 340) .
Las técnicas presentadas anteriormente se pueden implementar, por ejemplo, mediante un circuito programable (por ejemplo, uno o más microprocesadores) programado con un software y/o firmware, o completamente en un circuito de cable de propósito especial, o en una combinación de tales formas. El circuito de cable de propósito especial puede estar en la forma de, por ejemplo, uno o más circuitos integrados específicos de la aplicación (ASIC) , dispositivos lógicos programables (PLD), redes de compuertas programables en el campo (FPGA), etc.
El software o el firmware para su uso en la implementación de las técnicas presentadas en la presente se pueden almacenar sobre un medio de almacenamiento legible por una máquina y se puede ejecutar mediante uno o más microprocesadores programables de propósito general o de propósito especial. Un "medio de almacenamiento legible por una máquina", como se usa el término en la presente, incluye todos los mecanismos que pueden almacenar información en una forma accesible por una máquina (una máquina puede ser, por ejemplo, una computadora, un dispositivo de red, un teléfono celular, una agenda digital (PDA), una herramienta de fabricación, cualquier dispositivo con uno o más procesadores, etc.) . Por ejemplo, un medio de almacenamiento accesible por una máquina incluye medios grabables/no grabables (por ejemplo, una memoria de sólo lectura (ROM) , una memoria de acceso aleatorio (RAM) , medios de almacenamiento de disco magnético; medios de almacenamiento óptico; dispositivos de memoria flash; etc.), etc.
El término "lógica", como se usa en la presente, puede incluir, por ejemplo, un circuito programable programado con un software y/o firmware especifico, un circuito de cable de propósito especial, o una combinación de ellos.
La descripción precedente de diferentes realizaciones del objeto reivindicado se ha provisto con los fines de la ilustración y la descripción. No se desea ser taxativo o limitar el objeto reivindicado a las formas precisas reveladas. Muchas modificaciones y variaciones serán evidentes para el experto en el arte. Se eligieron y describieron realizaciones para describir mejor los principios de la invención y su aplicación práctica, permitiendo de ese modo que otros expertos en el arte comprendan el objeto reivindicado, las diferentes realizaciones y con diferentes modificaciones que son adecuadas para el uso particular contemplado.
Las enseñanzas de la invención provistas en la presente se pueden aplicar a otros sistemas, no necesariamente el sistema descrito anteriormente. Los elementos y actos de las diferentes realizaciones descritas anteriormente se pueden combinar para proporcionar otras realizaciones.
Si bien la descripción precedente describe determinadas realizaciones de la invención, y describe la mejor modalidad contemplada, no importa cuán detallado aparece lo anterior en el
texto, la invención se puede practicar en muchas formas. Los detalles del sistema pueden variar considerablemente en sus detalles de implementación, aunque están abarcados por la invención revelada en la presente. Como se indicó anteriormente, la terminología particular usada cuando se describen determinadas características o aspectos de la invención no se debe tomar que implica que la terminología se está redefiniendo en la presente para ser restringida a ninguna característica, rasgo o aspecto de la invención con la cual está asociada esa terminología. En general, no se debe interpretar que los términos usados en las siguientes reivindicaciones limitan la invención a las realizaciones específicas reveladas en la memoria descriptiva, a menos que la sección de la Descripción Detallada precedente defina explícitamente esos términos. Por consiguiente, el alcance real de la invención comprende no solamente las realizaciones reveladas, sino también todas las formas equivalentes de poner en práctica o implementar la invención de acuerdo con las reivindicaciones .
Claims (24)
1. Un método para codificar una secuencia de video usando tipos de escenas, el método comprende: recibir una secuencia de video de entrada; recibir información de limite de escena que indica la posición en la secuencia de video de entrada donde ocurren transiciones de escenas y la velocidad de bits blanco para cada escena; dividir la secuencia de video de entrada en una pluralidad de secciones basado en la información de limite de escena, cada sección comprende una pluralidad de cuadros de imagen temporalmente contiguos; y codificar cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco.
2. El método para codificar una secuencia de video de acuerdo con la reivindicación 1., que además comprende: recibir un tamaño de contenedor máximo para cada escena.
3. El método para codificar una secuencia de video de acuerdo con la reivindicación 2, en donde el paso de codificar comprende codificar cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco y el tamaño de contenedor máximo.
4. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, que además comprende: segmentar la secuencia de video de entrada en una pluralidad de de archivos, cada archivo contiene una o más secciones.
5. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, que además comprende segmentar la secuencia de video de entrada en una base de datos y un solo archivo de video, cada archivo contiene ninguna o una o más secciones.
6. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, que además comprende: transmitir la pluralidad de archivos por una conexión de HTTP.
7. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, que además comprende: detectar la resolución óptica óptima de los cuadros de imagen dentro de cada sección.
8. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, en donde por lo menos uno de los tipos de escenas se determina basado en resolución óptica del cuadro de imagen dentro de la sección.
9. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, en donde por lo menos una de la velocidad de bits blanco de las secciones se determina basado en la resolución óptica de los cuadros de imagen dentro de la sección .
10. El método para codificar una secuencia de imagen de acuerdo con la reivindicación 1, en" donde por lo menos uno del tamaño de imagen de video de las secciones se determina basado en la resolución óptica más cercana de los cuadros de imagen dentro la sección.
11. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, en donde el paso de codificar comprende codificar cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco en una norma H.264/ PEG-4 AVC.
12. El método para codificar una secuencia de video de acuerdo con la reivindicación 1, en donde un tipo de escena dado incluye uno o más de: un tipo de escena de movimiento rápido; un tipo de escena estático; una cabeza hablando; un texto; imágenes principalmente negras; una escena corta; 10 un tipo de escena de bajo interés; un tipo de escena de incendio; un tipo de escena de agua; un tipo de escena de humo; un tipo de escena de títulos; -j_5 un tipo de escena borrosa; un tipo de escena fuera de foco; una imagen que tiene una resolución más baja que el tipo de escena de tamaño de contenedor de imagen; varios; o 20 por defecto.
13. Un aparato de codificación de video para codificar una secuencia de video usando tipos de escenas, el aparato comprende: un módulo de entrada para recibir una secuencia de video de entrada; el módulo de entrada que recibe información de limite de escena que indica posiciones en la secuencia de video de entrada donde ocurren las transiciones de escenas y la velocidad de bits blanco para cada escena; un módulo de procesamiento de video para dividir la secuencia de video de entrada en una pluralidad secciones basado en la información de límite de escena, cada sección comprende una pluralidad de cuadros de imagen contiguos temporalmente; y un módulo de codificación de video para codificar cada una de la pluralidad de secciones de acuerdo con la velocidad de bits blanco.
14. El aparato de codificación de video de acuerdo con la reivindicación 1, en donde el módulo de entrada además recibe el tamaño de imagen óptica para cada escena.
15. El aparato de codificación de video de acuerdo con la reivindicación 14, en donde el módulo de codificación de video además codifica cada una de la pluralidad de secciones de acuerdo con el tamaño de imagen óptica.
16. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde el módulo de procesamiento de video además comprende segmenta la secuencia de video de entrada en una pluralidad de archivos, y cada archivo contiene una o más secciones .
17. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde la secuencia de video se codifica como un solo archivo acompañado con un archivo que contiene la posición de cada segmento, cuadro de inicio, reloj fechador y resolución .
18. El aparato de codificación de video de acuerdo con la reivindicación 13, que además comprende: un módulo de codificación de video para transmitir la pluralidad de archivos por una conexión de HTTP.
19. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde el módulo de procesamiento de video además detecta una resolución óptica de los cuadros de imagen dentro de cada sección.
20. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde por lo menos uno de los tipos de escena se determina basado en una resolución óptica de los cuadros de imagen dentro de la sección.
21. El aparato de de codificación de video de acuerdo con la reivindicación 13, en donde por lo menos uno de la velocidad de bits blanco de la sección se determina basado en una resolución óptica de los cuadros de imagen dentro de la sección.
22. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde por lo menos uno de la barra de la calidad del video se determina basado en la resolución óptica de los cuadros de imagen dentro de la sección.
23. El aparato de codificación de video de acuerdo con la reivindicación 13, en donde el módulo de codificación de video codifica cada uno de la pluralidad de secciones de acuerdo con la velocidad de bits blanco basado en la norma H .264 / PEG-4 AVC.
24. El aparato de codificación de video de acuerdo con 1 reivindicación 13, en donde un tipo de escena dado asignado po el módulo de codificación de video incluye uno o más de: un tipo de escena de movimiento rápido; un tipo de escena estático; una cabeza hablando; un texto; imágenes principalmente negras; una escena corta; un tipo de escena de bajo interés; un tipo de escena de incendio; un tipo de escena de agua; un tipo de escena de humo; un tipo de escena de títulos; un tipo de escena borrosa; un tipo de escena fuera de foco; una imagen que tiene una resolución más baja que el tipo de escena de tamaño de contenedor de imagen; varios; o por defecto.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201161437223P | 2011-01-28 | 2011-01-28 | |
| US201161437193P | 2011-01-28 | 2011-01-28 | |
| PCT/US2012/022710 WO2012103326A2 (en) | 2011-01-28 | 2012-01-26 | Adaptive bit rate control based on scenes |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| MX2013008757A true MX2013008757A (es) | 2014-02-28 |
Family
ID=46577355
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| MX2013008757A MX2013008757A (es) | 2011-01-28 | 2012-01-26 | Control de velocidad de bits adaptativa basado en escenas. |
Country Status (12)
| Country | Link |
|---|---|
| US (1) | US20120195369A1 (es) |
| EP (1) | EP2668779A4 (es) |
| JP (1) | JP6134650B2 (es) |
| KR (1) | KR20140034149A (es) |
| CN (1) | CN103493481A (es) |
| AU (2) | AU2012211243A1 (es) |
| BR (1) | BR112013020068A2 (es) |
| CA (1) | CA2825929A1 (es) |
| IL (1) | IL227673A (es) |
| MX (1) | MX2013008757A (es) |
| TW (1) | TWI586177B (es) |
| WO (1) | WO2012103326A2 (es) |
Families Citing this family (28)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20140019335A (ko) * | 2011-01-28 | 2014-02-14 | 아이 이오, 엘엘씨 | 장면 타입에 기초한 비디오 스트림 인코딩 |
| US10165274B2 (en) * | 2011-01-28 | 2018-12-25 | Eye IO, LLC | Encoding of video stream based on scene type |
| US9042441B2 (en) | 2012-04-25 | 2015-05-26 | At&T Intellectual Property I, Lp | Apparatus and method for media streaming |
| US8949440B2 (en) * | 2012-07-19 | 2015-02-03 | Alcatel Lucent | System and method for adaptive rate determination in mobile video streaming |
| US9185437B2 (en) | 2012-11-01 | 2015-11-10 | Microsoft Technology Licensing, Llc | Video data |
| US10708335B2 (en) | 2012-11-16 | 2020-07-07 | Time Warner Cable Enterprises Llc | Situation-dependent dynamic bit rate encoding and distribution of content |
| US9967300B2 (en) * | 2012-12-10 | 2018-05-08 | Alcatel Lucent | Method and apparatus for scheduling adaptive bit rate streams |
| KR20150106839A (ko) * | 2014-03-12 | 2015-09-22 | 경희대학교 산학협력단 | 가변 비트율 미디어 전송을 위한 보장 비트율 반환 방법 및 장치 |
| KR101415429B1 (ko) * | 2014-03-20 | 2014-07-09 | 인하대학교 산학협력단 | 블록 아티팩트 기반의 동영상 화질 최적화를 위한 비트레이트 결정 방법 |
| US9811882B2 (en) | 2014-09-30 | 2017-11-07 | Electronics And Telecommunications Research Institute | Method and apparatus for processing super resolution image using adaptive preprocessing filtering and/or postprocessing filtering |
| CN105323591B (zh) * | 2015-10-29 | 2018-06-19 | 四川奇迹云科技有限公司 | 一种基于psnr阈值的视频分段存储的方法 |
| CN105245813B (zh) * | 2015-10-29 | 2018-05-22 | 北京易视云科技有限公司 | 一种视频优化存储的处理器 |
| CN105307053B (zh) * | 2015-10-29 | 2018-05-22 | 北京易视云科技有限公司 | 一种基于视频内容的视频优化存储的方法 |
| US10742708B2 (en) | 2017-02-23 | 2020-08-11 | Netflix, Inc. | Iterative techniques for generating multiple encoded versions of a media title |
| US11153585B2 (en) | 2017-02-23 | 2021-10-19 | Netflix, Inc. | Optimizing encoding operations when generating encoded versions of a media title |
| US11166034B2 (en) | 2017-02-23 | 2021-11-02 | Netflix, Inc. | Comparing video encoders/decoders using shot-based encoding and a perceptual visual quality metric |
| US10917644B2 (en) | 2017-02-23 | 2021-02-09 | Netflix, Inc. | Iterative techniques for encoding video content |
| US10666992B2 (en) | 2017-07-18 | 2020-05-26 | Netflix, Inc. | Encoding techniques for optimizing distortion and bitrate |
| US12255940B2 (en) | 2017-07-18 | 2025-03-18 | Netflix, Inc. | Encoding techniques for optimizing distortion and bitrate |
| US10623744B2 (en) | 2017-10-04 | 2020-04-14 | Apple Inc. | Scene based rate control for video compression and video streaming |
| US11871052B1 (en) * | 2018-09-27 | 2024-01-09 | Apple Inc. | Multi-band rate control |
| US20210350581A1 (en) * | 2018-10-18 | 2021-11-11 | Sony Corporation | Encoding device, encoding method, and decoding device |
| US11470327B2 (en) * | 2020-03-30 | 2022-10-11 | Alibaba Group Holding Limited | Scene aware video content encoding |
| US11616993B1 (en) * | 2021-10-22 | 2023-03-28 | Hulu, LLC | Dyanamic parameter adjustment for adaptive bitrate algorithm |
| CN114511535B (zh) * | 2022-01-28 | 2025-11-11 | 北京百度网讯科技有限公司 | 一种白屏检测方法、装置、电子设备、介质及产品 |
| CN116170581B (zh) * | 2023-02-17 | 2024-01-23 | 厦门瑞为信息技术有限公司 | 一种基于目标感知的视频信息编解码方法和电子设备 |
| CN120547336A (zh) * | 2024-10-15 | 2025-08-26 | 支付宝(杭州)信息技术有限公司 | 一种视频码率控制方法、装置和设备 |
| CN119031135A (zh) * | 2024-10-18 | 2024-11-26 | 每日互动股份有限公司 | 一种基于采样的视频解码方法、装置、介质及设备 |
Family Cites Families (37)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3265818B2 (ja) * | 1994-04-14 | 2002-03-18 | 松下電器産業株式会社 | 動画符号化方法 |
| JP4416845B2 (ja) * | 1996-09-30 | 2010-02-17 | ソニー株式会社 | 符号化装置及びその方法、および、記録装置及びその方法 |
| JP2001245303A (ja) * | 2000-02-29 | 2001-09-07 | Toshiba Corp | 動画像符号化装置および動画像符号化方法 |
| JP4428680B2 (ja) * | 2000-11-06 | 2010-03-10 | パナソニック株式会社 | 映像信号符号化方法および映像信号符号化装置 |
| US6909745B1 (en) * | 2001-06-05 | 2005-06-21 | At&T Corp. | Content adaptive video encoder |
| AU2002366985A1 (en) * | 2001-12-26 | 2003-07-30 | Yeda Research And Development Co.Ltd. | A system and method for increasing space or time resolution in video |
| US7099389B1 (en) * | 2002-12-10 | 2006-08-29 | Tut Systems, Inc. | Rate control with picture-based lookahead window |
| WO2004090581A2 (en) * | 2003-03-31 | 2004-10-21 | Cdm Optics, Inc. | Systems and methods for minimizing aberrating effects in imaging systems |
| US7558320B2 (en) * | 2003-06-13 | 2009-07-07 | Microsoft Corporation | Quality control in frame interpolation with motion analysis |
| TWI264192B (en) * | 2003-09-29 | 2006-10-11 | Intel Corp | Apparatus and methods for communicating using symbol-modulated subcarriers |
| JP4180497B2 (ja) * | 2003-12-05 | 2008-11-12 | 富士通株式会社 | コード種類判別方法、およびコード境界検出方法 |
| US7280804B2 (en) * | 2004-01-30 | 2007-10-09 | Intel Corporation | Channel adaptation using variable sounding signal rates |
| US7869500B2 (en) * | 2004-04-27 | 2011-01-11 | Broadcom Corporation | Video encoder and method for detecting and encoding noise |
| DE102004034973A1 (de) * | 2004-07-16 | 2006-02-16 | Carl Zeiss Jena Gmbh | Verfahren zur Erfassung von Bildern einer Probe mit einem Lichtrastermikroskop |
| TWI279693B (en) * | 2005-01-27 | 2007-04-21 | Etoms Electronics Corp | Method and device of audio compression |
| BRPI0608282A2 (pt) * | 2005-03-10 | 2009-12-15 | Qualcomm Inc | processamento de multimìdia adaptativo em conteúdo |
| JP2006340066A (ja) * | 2005-06-02 | 2006-12-14 | Mitsubishi Electric Corp | 動画像符号化装置、動画像符号化方法及び記録再生方法 |
| US20070024706A1 (en) * | 2005-08-01 | 2007-02-01 | Brannon Robert H Jr | Systems and methods for providing high-resolution regions-of-interest |
| US20070074251A1 (en) * | 2005-09-27 | 2007-03-29 | Oguz Seyfullah H | Method and apparatus for using random field models to improve picture and video compression and frame rate up conversion |
| US8879635B2 (en) * | 2005-09-27 | 2014-11-04 | Qualcomm Incorporated | Methods and device for data alignment with time domain boundary |
| US7912123B2 (en) * | 2006-03-01 | 2011-03-22 | Streaming Networks (Pvt.) Ltd | Method and system for providing low cost robust operational control of video encoders |
| US8155454B2 (en) * | 2006-07-20 | 2012-04-10 | Qualcomm Incorporated | Method and apparatus for encoder assisted post-processing |
| TW200814785A (en) * | 2006-09-13 | 2008-03-16 | Sunplus Technology Co Ltd | Coding method and system with an adaptive bitplane coding mode |
| JP5766915B2 (ja) * | 2007-01-31 | 2015-08-19 | トムソン ライセンシングThomson Licensing | 潜在的なショット及びシーンの検出情報を自動的に分類する方法及び装置 |
| JP2009049474A (ja) * | 2007-08-13 | 2009-03-05 | Toshiba Corp | 情報処理装置および再符号化方法 |
| US8743963B2 (en) * | 2007-08-13 | 2014-06-03 | Ntt Docomo, Inc. | Image/video quality enhancement and super-resolution using sparse transformations |
| US9628811B2 (en) * | 2007-12-17 | 2017-04-18 | Qualcomm Incorporated | Adaptive group of pictures (AGOP) structure determination |
| WO2009087641A2 (en) * | 2008-01-10 | 2009-07-16 | Ramot At Tel-Aviv University Ltd. | System and method for real-time super-resolution |
| JP4539754B2 (ja) * | 2008-04-11 | 2010-09-08 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
| US8325800B2 (en) * | 2008-05-07 | 2012-12-04 | Microsoft Corporation | Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers |
| WO2009149100A1 (en) * | 2008-06-06 | 2009-12-10 | Amazon Technologies, Inc. | Client side stream switching |
| EP2356812B1 (en) * | 2008-11-12 | 2015-06-10 | Cisco Technology, Inc. | Processing of a video program having plural processed representations of a single video signal for reconstruction and output |
| US8396114B2 (en) * | 2009-01-29 | 2013-03-12 | Microsoft Corporation | Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming |
| US8270473B2 (en) * | 2009-06-12 | 2012-09-18 | Microsoft Corporation | Motion based dynamic resolution multiple bit rate video encoding |
| JP4746691B2 (ja) * | 2009-07-02 | 2011-08-10 | 株式会社東芝 | 動画像符号化装置および動画像符号化方法 |
| US8837576B2 (en) * | 2009-11-06 | 2014-09-16 | Qualcomm Incorporated | Camera parameter-assisted video encoding |
| CN102907092B (zh) * | 2010-05-26 | 2017-02-15 | 高通股份有限公司 | 相机参数辅助式视频帧速率上转换 |
-
2012
- 2012-01-26 JP JP2013551331A patent/JP6134650B2/ja not_active Expired - Fee Related
- 2012-01-26 CN CN201280015700.7A patent/CN103493481A/zh active Pending
- 2012-01-26 BR BR112013020068A patent/BR112013020068A2/pt not_active IP Right Cessation
- 2012-01-26 AU AU2012211243A patent/AU2012211243A1/en not_active Abandoned
- 2012-01-26 EP EP12738976.5A patent/EP2668779A4/en not_active Ceased
- 2012-01-26 CA CA2825929A patent/CA2825929A1/en not_active Abandoned
- 2012-01-26 KR KR1020137022649A patent/KR20140034149A/ko not_active Ceased
- 2012-01-26 MX MX2013008757A patent/MX2013008757A/es not_active Application Discontinuation
- 2012-01-26 US US13/358,877 patent/US20120195369A1/en not_active Abandoned
- 2012-01-26 WO PCT/US2012/022710 patent/WO2012103326A2/en not_active Ceased
- 2012-01-30 TW TW101102947A patent/TWI586177B/zh not_active IP Right Cessation
-
2013
- 2013-07-28 IL IL227673A patent/IL227673A/en not_active IP Right Cessation
-
2016
- 2016-10-28 AU AU2016250476A patent/AU2016250476A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| WO2012103326A3 (en) | 2012-11-01 |
| TW201238356A (en) | 2012-09-16 |
| IL227673A0 (en) | 2013-09-30 |
| EP2668779A2 (en) | 2013-12-04 |
| AU2016250476A1 (en) | 2016-11-17 |
| AU2012211243A1 (en) | 2013-08-22 |
| JP6134650B2 (ja) | 2017-05-24 |
| EP2668779A4 (en) | 2015-07-22 |
| US20120195369A1 (en) | 2012-08-02 |
| IL227673A (en) | 2017-09-28 |
| CN103493481A (zh) | 2014-01-01 |
| TWI586177B (zh) | 2017-06-01 |
| CA2825929A1 (en) | 2012-08-02 |
| BR112013020068A2 (pt) | 2018-03-06 |
| WO2012103326A2 (en) | 2012-08-02 |
| JP2014511137A (ja) | 2014-05-08 |
| KR20140034149A (ko) | 2014-03-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| MX2013008757A (es) | Control de velocidad de bits adaptativa basado en escenas. | |
| CN111277826B (zh) | 一种视频数据处理方法、装置及存储介质 | |
| US9554142B2 (en) | Encoding of video stream based on scene type | |
| US11743475B2 (en) | Advanced video coding method, system, apparatus, and storage medium | |
| AU2007202789B9 (en) | High-fidelity motion summarisation method | |
| US20010047517A1 (en) | Method and apparatus for intelligent transcoding of multimedia data | |
| CN109788316B (zh) | 码率控制、视频转码方法与装置、计算机设备及存储介质 | |
| US20150312575A1 (en) | Advanced video coding method, system, apparatus, and storage medium | |
| US10165274B2 (en) | Encoding of video stream based on scene type | |
| CN107211167A (zh) | 视频解码 | |
| US11601617B2 (en) | Method for forming an output image sequence from an input image sequence, method for reconstructing an input image sequence from an output image sequence, associated devices, server equipment, client equipment and computer programs | |
| EP2357842A1 (en) | Image processing device and method | |
| WO2016193949A1 (en) | Advanced video coding method, system, apparatus and storage medium | |
| US20230186054A1 (en) | Task-dependent selection of decoder-side neural network | |
| Meessen et al. | WCAM: smart encoding for wireless surveillance | |
| HK40024374A (en) | Video data processing method and device, and storage medium | |
| JPWO2001058096A1 (ja) | 圧縮ビットストリームをネットワークを通してユーザデバイスに配信するための装置及び方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FA | Abandonment or withdrawal |