MX2014003610A - Sistema y metodo para incrementar la eficiencia del ancho de banda de transmision ("ebt2"). - Google Patents
Sistema y metodo para incrementar la eficiencia del ancho de banda de transmision ("ebt2").Info
- Publication number
- MX2014003610A MX2014003610A MX2014003610A MX2014003610A MX2014003610A MX 2014003610 A MX2014003610 A MX 2014003610A MX 2014003610 A MX2014003610 A MX 2014003610A MX 2014003610 A MX2014003610 A MX 2014003610A MX 2014003610 A MX2014003610 A MX 2014003610A
- Authority
- MX
- Mexico
- Prior art keywords
- audio
- packets
- database
- compressed
- series
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 134
- 230000005540 biological transmission Effects 0.000 title claims abstract description 34
- 238000012986 modification Methods 0.000 claims abstract description 36
- 230000004048 modification Effects 0.000 claims abstract description 36
- 238000004458 analytical method Methods 0.000 claims abstract description 23
- 230000005236 sound signal Effects 0.000 claims abstract description 6
- 230000009466 transformation Effects 0.000 claims description 24
- 239000000284 extract Substances 0.000 claims description 22
- 230000002123 temporal effect Effects 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 7
- 230000000873 masking effect Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 abstract description 4
- 238000003786 synthesis reaction Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 73
- 239000003607 modifier Substances 0.000 description 29
- 230000015654 memory Effects 0.000 description 24
- 238000012545 processing Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 14
- 241000677635 Tuxedo Species 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000009792 diffusion process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 101100167365 Caenorhabditis elegans cha-1 gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/58—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H2201/00—Aspects of broadcast communication
- H04H2201/10—Aspects of broadcast communication characterised by the type of broadcast system
- H04H2201/18—Aspects of broadcast communication characterised by the type of broadcast system in band on channel [IBOC]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Se presentan sistemas y métodos para incrementar la eficiencia del ancho de banda de transmisión mediante el análisis y la síntesis de los componentes finales del contenido transmitido. Para implementar este sistema, un diccionario o base de datos de contraseñas elementales se puede generar a partir de un conjunto de extractos cortos de audio. Utilizando esta base de datos, una canción arbitraria dada u otro archivo de audio se puede expresar como una serie de estas contraseñas, donde cada contraseña dada en la serie es un paquete de audio comprimido que se puede utilizar como está, o por ejemplo, se puede etiquetar para ser modificado para coincidir mejor con la porción correspondiente del archivo de audio original. Cada contraseña en la base de datos tiene un número de índice o identificador único. Para un número relativamente pequeño de bits utilizados en un ID único, por ejemplo 27-30, varios cientos de millones de contraseñas se pueden identificar de manera única. Al proporcionar de antemano la base de datos de contraseñas a receptores de un sistema de difusión o suministro de contenido, en lugar de difundir o transmitir ininterrumpidamente la señal de audio comprimida real, todo lo que se necesita transmitir es la serie de identificadores junto con algunas instrucciones de modificación para las contraseñas identificadas. Después de la recepción, la inteligencia en el receptor que tiene acceso a una copia almacenada localmente del diccionario puede reconstruir el extracto corto de audio original al tener acceso a las contraseñas por vía de los IDs recibidos, modificarlos como se indica por las instrucciones de modificación, modificar adicionalmente las contraseñas ya sea individualmente o en grupos utilizando el perfil de audio del archivo de audio original (también enviado por el codificador) y reproducir una secuencia generada de contraseñas corregidas por fase y contraseñas modificadas como se indicó. En modalidades ejemplares de la presente invención, esta modificación puede extenderse en contraseñas adyacentes, y puede utilizar cualquiera o ambos de (i) el alineamiento temporal basado en la correlación cruzada y (ii) la continuidad de fase entre armónicas para lograr una fidelidad más alta para el extracto corto de audio original. La figura más representativa de la invención es la número 14.
Description
SISTEMA Y MÉTODO PARA INCREMENTAR LA EFICIENCIA DEL ANCHO DE BANDA DE TRANSMISIÓN CAMPO TÉCNICO La presente descripción se refiere en general a la transmisión ininterrumpida o de otra manera la transmisión de y más a un sistema y un método para incrementar la eficiencia del ancho de banda de transmisión mediante el análisis y la síntesis de los componentes finales de este ANTECEDENTES DE LA INVENCIÓN Existen varios sistemas para suministrar contenido digital a receptores y otros dispositivos de reproducción de Éstos por en el dominio de servicios de radiocomunicación de audio digital por satélite por sus siglas en sistemas de difusión de audio digital por sus siglas en sistemas de radiocomunicación de alta definición por sus siglas en y sistemas de suministro de contenido de transmisión por nombrar o en el dominio de por video a televisión por cable y Puesto que el ancho de banda disponible en un sistema de difusión digital y otros sistemas de suministro de contenido está limitado es deseable el uso eficiente del ancho de banda de Por los gobiernos asignan a los difusores de radiocomunicación tal como Sirius XM Radio en los Estados un ancho de banda Mientras se utilice más más canales y servicios de difusión se pueden proporcionar a los clientes y En otros el ancho de banda accesible para un usuario se carga frecuentemente en una base según se tal por en el caso de muchos planes de datos ofrecidos por servicios de telefonía De esta si los clientes utilizan más datos para acceder a un servicio de transmisión ininterrumpida de música en sus por pagan Por lo existe la necesidad continua por sistemas de suministro de contenido digital de cada tipo para transmitir contenido de una manera óptima con el fin de optimizar el ancho de banda de transmisión siempre que sea posible Un sistema de suministro de contenido ilustrativo se da a conocer en la Patente de los Estados Unidos bajo asignación común con la En ese los segmentos de contenido tal como copias completas de canciones populares son en diversos receptores en un sistema de difusión digital para mejorar la eficiencia de Por lo la señal de difusión solo necesita incluir una cadena de identificadores de las canciones almacenadas en los receptores como parte de un canal de a diferencia de la transmisión de versiones comprimidas de copias completas de esas ahorrando de ese modo el ancho de banda de Los a su con la recepción de la cadena de identificadores de recuperan selectivamente de la memoria local y luego reproducen esos segmentos de contenido almacenados que corresponden a los identificadores recuperados de la señal de difusión El sistema de suministro de contenido dado a conocer en la Patente de los Estados Unidos sin tiene Por mientras que la eficiencia de difusión se el almacenamiento de copias completas de canciones en los receptores es una solución poco Requiere el uso de grandes cantidades de memoria del receptor y la actualización continuamente de la biblioteca de canciones en cada receptor con copias completas de todas y cada una de las nuevas canciones que se hacen Hacer esto requiere el uso de la corriente de difusión u otro método de tal como una conexión de al receptor sobre una red o la para descargar las canciones en el fondo o en un período de inactividad a cada receptor y de esta manera requiere que estén encendidos para estas actualizaciones De esta existe la necesidad de un método para mejorar la eficiencia de transmisión ininterrumpida o de otra manera la transmisión de contenido a con el fin de optimizar el ancho de banda disponible e incrementar significativamente los canales disponibles la calidad de los utilizando el mismo ancho de ahora sin copiar físicamente una biblioteca en evolución constante de canciones y otro contenido de audio en cada mientras que al mismo tiempo se minimiza el uso de la memoria del receptor y la necesidad de SUMARIO DE LA INVENCIÓN Se presentan sistemas y métodos para incrementar la eficiencia de transmisión del ancho de banda por medio del análisis y la síntesis de los componentes finales de contenidos En modalidades ejemplares de la presente las contraseñas elementales se utilizan como representaciones de bits de paquetes comprimidos de contenido para la transmisión a receptores u otros dispositivos de Estos paquetes pueden ser componentes de datos y cualquier otro tipo de contenido que tenga regularidad y patrones comunes y de esta manera se deben reconstruir a partir de una base de datos de elementos de los componentes para ese tipo o dominio de Las contraseñas elementales pueden ser predeterminadas para representar una variedad de contenido y para ser reutilizables entre diferentes pistas o segmentos de audio o Para implementar este un diccionario o base de datos de contraseñas algunas veces referidos en este documento como se genera a partir de un conjunto por extractos cortos de audio o Utilizando esta base de un segmento o extracto corto de audio o video dado no estaba en el conjunto de entrenamiento se expresa como una serie de estos paquetes donde cada paquete predeterminado dado en la serie es un paquete comprimido que se puede utilizar como está por se debe modificar para coincidir mejor con la porción correspondiente del extracto corto de audio A cada paquete predeterminado en la base de datos se asigna un número de índice o identificador único Se debe observar que para un número relativamente pequeño de bits ejemplo en un muchos cientos de millones de paquetes predeterminados se pueden identificar de manera Al proporcionar de antemano la base de datos de paquetes predeterminados a receptores de un sistema de difusión o suministro de en lugar de difundir o transmitir ininterrumpidamente la señal de audio la serie de identificadores junto con cualquier instrucción de modificación para el paquete se transmite a través de un canal de tal por una difusión satelital de SDARS o una difusión de televisión satelital o por Después de la un receptor u otro dispositivo de utilizando su copia almacenada localmente de la base de reconstruye el extracto corto de audio o video original al tener acceso a los paquetes por vía de sus identificadores únicos y los modifica como es indicado por las instrucciones de modificación y luego puede reproducir la serie de paquetes ya sea con o sin como se para reconstruir el contenido En modalidades ejemplares de la presente para lograr una mejor fidelidad para la señal de contenido esta modificación también puede extenderse dentro de paquetes predeterminados adyacentes o Por en el caso de contenido de esta modificación puede utilizar un alineamiento temporal basado en la correlación cruzada la continuidad de fase entre armónicas para lograr una fidelidad más alta para el extracto corto de audio En el caso de la programación de para crear esta base de datos de paquetes los segmentos de audio digital se codifican primero en paquetes de audio los paquetes de audio comprimidos se procesan para determinar si un paquete almacenado que ya está en la base de datos de paquetes predeterminados representa óptimamente cada uno de los paquetes de audio tomando en consideración que el paquete predeterminado óptimo que se selecciona para representar un paquete de audio comprimido particular puede requerir una modificación para reproducir el paquete de audio comprimido con calidad de sonido De esta cuando un paquete predeterminado que corresponde al paquete seleccionado se almacena en la memoria de un solo los bits necesarios para indicar el ID del paquete predeterminado óptimo y para representar cualquier modificación del mismo se transmiten en lugar del paquete de audio Los paquetes predeterminados se pueden almacenar ejemplo en una base de datos de paquetes en o de otra manera en conjunción con tanto la fuente de transmisión como los diversos receptores u otros dispositivos de reproducción antes de la transmisión del Con la recepción de la corriente de datos transmitida de instrucciones de un receptor realiza operaciones de consulta por vía de su base datos de paquetes predeterminados utilizando los IDs transmitidos para obtener los paquetes predeterminados correspondientes y realiza cualquier modificación necesaria del paquete predeterminado como se indica en los bits de modificación para decodificar la corriente transmitida de bits reducidos secuencia de Único en los paquetes de audio correspondientes de la canción original o el extracto corto de contenido de Los paquetes de audio comprimidos entonces se puede decodificar en el segmento o corriente de contenido fuente y se pueden reproducir para un Una ventaja significativa de la invención dada a conocer se deriva de la reusabilidad de contraseñas Esto es debido a que al nivel elemental en intervalos de tiempo muy muchas señales de estructuras de etcétera utilizan piezas muy similares o las mismas piezas una y otra Por una pieza de 46 milisegundos de un solo de tambor dado es muy si no es que el que aquel encontrado en muchos solos de tambor un intervalo de 46 milisegundos de Taylor Swift tocando el acorde de guitarra D7 es el mismo que en muchas otras canciones donde ella toca un acorde de guitarra De esta las contraseñas que actúan como letras en un alfabeto pueden ser reutilizables entre diferentes pistas de El uso de paquetes configurables e IDs de paquetes de acuerdo con modalidades ilustrativas de la presente invención hace posible una variedad de ventajas sobre la tecnología existente utilizada para incrementar la eficiencia de ancho de banda de Por los canales musicales transmitidos pueden ser transmitidos ininterrumpidamente a 1 kbps o Las difusiones en vivo eficientes respecto al ancho de banda se hacen posible con el uso de codificadores de música en tiempo real que el uso de paquetes predeterminados configurables el uso de canciones fijas u otras tablas de contenido en el receptor se evita mediante el uso de una memoria no volátil del receptor que contiene un conjunto base de paquetes predeterminados reutilizables y configurables Además de hacer uso de la tecnología de compresión de audio existente el análisis de audio utilizado para crear la base de datos de paquetes predeterminados configurables y para codificar el contenido utilizando los paquetes predeterminados de acuerdo con modalidades ilustrativas de la presente invención hace posible una difusión más eficiente de tal como contenido de Mientras que la descripción detallada de la presente invención se presenta en términos de difusión de contenido de audio como la presente invención no está limitada de esta manera y es aplicable a la transmisión y difusión de otros tipos de que incluyen contenido de video como espectáculos televisivos o BREVE DESCRIPCIÓN DE LOS DIBUJOS La invención será entendida más fácilmente con referencia a varias modalidades ejemplares de la mostradas en las figuras en las la Figura 1 ilustra una estructura de corriente de audio la Figura 2 describe la generación de una base de datos de paquetes predeterminados a partir de un conjunto de entrenamiento de ejemplar de acuerdo con una modalidad ejemplar de la presente la Figura 3 describe una representación de bits reducidos instrucciones de ejemplar de un paquete de audio de acuerdo con modalidades ejemplares de la presente la Figura 4 describe un ejemplo para modificar un paquete predeterminado de acuerdo con una modalidad ejemplar de la presente invención con el fin de que sea utilizable en lugar de múltiples la Figura 5 ilustra como la reutilización de paquetes predeterminados se puede utilizar para requerir menos si algún paquete predeterminado adicional se agrega a una base de datos ejemplar una vez que un número suficiente de paquetes predeterminados se ha almacenado de acuerdo con una modalidad ejemplar de la presente la Figura 6 representa una visión general de un proceso de codificación de dos pasos de acuerdo con una modalidad ejemplar de la presente la Figura 7 describe un diagrama de flujo de procesos para construir una base de datos de paquetes de paquetes predeterminados de acuerdo con una modalidad ejemplar de la presente la Figura 8 describe un diagrama de flujo de procesos para codificar audio de transmitirlo y de acuerdo con una modalidad ejemplar de la presente la Figura 9 describe un diagrama de flujo de procesos para decodificar y reproducir una corriente transmitida de acuerdo con una modalidad ejemplar de la presente la Figura 10 describe un diagrama de bloques de un sistema ejemplar para implementar los procesos de las Figuras de acuerdo con una modalidad ejemplar de la presente la Figura 11 describe un sistema de suministro de contenido ejemplar para incrementar el ancho de banda de transmisión utilizando paquetes predeterminados de acuerdo con una modalidad ejemplar de la presente la Figura 12 ilustra una corriente de contenido de audio ejemplar para el uso con el sistema de la Figura La Figura 13 ilustra un receptor ejemplar para el uso con el sistema de la Figura la Figura 14 es un diagrama de flujo de procesos de alto nivel para la generación ejemplar de un diccionario y un codee ejemplar de acuerdo con una modalidad ejemplar de la presente la Figura 15 es un diagrama de flujo de procesos para un codificador ejemplar de acuerdo con una modalidad ejemplar de la presente la Figura 16 es un diagrama de flujo de procesos para un decodificador ejemplar de acuerdo con una modalidad ejemplar de la presente la Figura 17 ilustra ventanas complementarias de energía utilizadas en una técnica de alineamiento temporal basado en la correlación cruzada ejemplar de acuerdo con una modalidad ejemplar de la presente la Figura 18 ilustra una interpolación lineal de fase entre contenedores tonales para calcular una fase en contenedores no tonales de acuerdo con una modalidad ejemplar de la presente la Figura 19 es un diagrama de flujo de procesos para un algoritmo codificador ejemplar de acuerdo con una modalidad ejemplar de la presente la Figura 20 es un diagrama de flujo de procesos para un algoritmo decodificador ejemplar de acuerdo con una modalidad ejemplar de la presente y las Figuras ilustran una técnica de radiocomunicación personalizada que se implementa en un receptor de una difusión de múltiples canales que aprovecha los beneficios de modalidades ejemplares de la presente DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La Figura 1 ilustra una estructura ejemplar de una corriente de audio que es transmitida difundida o transmitida En un una fuente de audio tal como una canción digital de aproximadamente minutos de duración puede ser comprimida utilizando la tecnología de compresión de audio tal por un algoritmo de codificación de habla y audio unificado por sus siglas en Otras técnicas de codificación también se pueden utilizar por En la estructura ejemplar de la Figura la canción puede ser convertida en una corriente de 24 kilobits por segundo que se divide en una variedad de paquetes de audio de una longitud fija o variable que pueden producir cada en aproximadamente 46 milisegundos de audio no En el ejemplo de la Figura aproximadamente paquetes de audio comprimidos se requieren con una longitud de canción de aproximadamente 210 De acuerdo con una modalidad de la presente una base de datos de paquetes predeterminados o contraseñas configurables y sintéticos se pueden por como componentes elementales de extractos cortos o archivos de audio y la base de datos puede estar o por puede ser transmitida a receptores u otros dispositivos de Se debe observar que esta base de datos también se puede denominar un y esta terminología se utiliza de hecho en algunos de los módulos de códigos ejemplares descritos De esta en la presente los términos de y se utilizarán de manera intercambiable para referirse a un conjunto de paquetes o contraseñas los cuales se pueden utilizar para reconstruir un extracto corto o archivo de audio Los paquetes predeterminados pueden estar por para representar una variedad de contenido de audio y pueden ser por como elementos de diferentes pistas o segmentos de audio Los paquetes predeterminados se pueden almacenar en una base de datos de paquetes en o de otra manera en conjunción con tanto la fuente de transmisión para las pistas o segmentos de audio y los receptores u otros dispositivos de antes de la transmisión y del contenido que los paquetes predeterminados se utilizan para La Figura 2 ilustra los contenidos de una base de datos ejemplar 400 que tiene paquetes configurables y reutilizables almacenados en la Como se observa la base de datos 400 puede almacenar paquetes predeterminados sintéticos que se utilizan en la representación de una corriente de audio de la Figura por De una secuencia de los paquetes predeterminados reales a una secuencia de índices para los resulta una corriente mucho más pequeña una corriente de 1 kbps de una corriente de 24 Al proporcionar estos índices de bits reducidos para paquetes de audio reutilizables desarrollados a partir de una pluralidad de corrientes de audio de muestra tales como el audio por no necesita ser transmitido o la secuencia de índices para un diccionario o base de datos conocido previamente se transmite o se Por otra debido a que los paquetes de audio reutilizables son comunes para muchos extractos cortos de audio o canciones la base de datos que los comprende puede ser mucho más pequeña que el tamaño real de las mismas canciones almacenadas en su formato comprimido original Por un conjunto de canciones canciones como se muestra en la Figura que tiene aproximadamente paquetes de audio comprimidos cada constituiría colectivamente una base de datos de canciones real de aproximadamente de paquetes comprimidos y requerirá aproximadamente 8 GB de memoria no Esta base de datos se puede comprimir o compactar sin en vista de que es probable que los paquetes de audio comprimidos de cada una de las canciones compartan paquetes de audio comprimidos iguales o algo similares dentro de la misma canción o con otras De esta la base de datos se puede por así para incluir solo los paquetes sintéticos únicos que son necesarios para reconstituir los paquetes de audio comprimidos de la biblioteca completa de tomando en cuenta el hecho de que un paquete de audio comprimido se puede modificar adicionalmente para la reutilización en la reconstitución de diferentes Este planteamiento es similar a un establecimiento de alquiler de esmoquins que almacena un cierto conjunto de trajes y esmoquins para De esta reserva de el establecimiento puede proveer de manera realista a una ciudad o vecindario completo con ropa formal Aunque la mayoría de los trajes no se ajustan exactamente a un cliente cada traje puede ser adaptado ligeramente antes de ajustarse a un cliente como puede estipular su tamaño y Al operar de esta no es necesario que el establecimiento de renta de esmoquins tenga un sastre de esmoquins para todos y cada uno de los Se puede hacer que la mayoría de los trajes se por vía de una a un gran número de personas en un tamaño general y se ajusten a un contenedor o Al operar de esta los requerimientos de almacenamiento para el establecimiento se reducen en gran Lo mismo ocurre en el caso de la memoria del receptor cuando se implementa la presente A los paquetes sintéticos únicos son referidos como y cada uno puede ser provisto con un identificador único La base de datos o diccionario se organiza para asociar este identificador único con su paquete predeterminado En el ejemplo ilustrado de la Figura un ID de 27 bits se puede utilizar para representar de manera única de paquetes en una base de Al modificar estos paquetes únicos para la reutilización para representar paquetes de audio comprimidos iguales o similares en canciones reales u otros segmentos de la base de datos tiene de esta manera la capacidad para proporcionar paquetes únicos adicionales que pueden ser necesarios para reconstruir paquetes de audio en contenido además de las canciones de muestra iniciales de las cuales se construyó la base de datos De esta en modalidades ejemplares de la presente invención cuando el tal como un segmento de por se comprime y se convierte en paquetes y los paquetes de audio comprimidos se comparan con paquetes predeterminados sintéticos que ya están en la base de datos 400 si la base de datos 400 contiene un paquete predeterminado que coincide con uno de los paquetes de audio el ID de paquete de 27 bits de ese paquete coincidente se puede transmitir en lugar del paquete de audio En muchos sin la base de datos 400 no contiene un paquete coincidente para un paquete de audio En ese se puede utilizar el paquete predeterminado que coincide más o más para representar el paquete de audio Este paquete predeterminado sintético se puede por de una manera seleccionada para reproducir más fielmente el paquete de audio comprimido original dentro de una calidad de sonido Es en términos de la analogía proporcionada el esmoquin en la reserva se puede modificar o adaptar para ajustarse a un cliente Las instrucciones para esta modificación también se pueden representar como un conjunto de bits y se pueden transmitir junto con el ID del paquete De esta el ID de paquete predeterminado y los bits de modificación asociados se pueden transmitir juntos en lugar del paquete de audio comprimido Esto reduce significativamente los bits necesarios para representar el paquete de audio comprimido y por lo tanto incrementa la eficiencia de ancho de banda de La Figura 3 ilustra un paquete de corriente de datos ejemplar 500 que tiene 46 bits por paquete y que representa 46 mS de una corriente de El paquete 500 comprende un identificador de paquete 502 representado por 27 bits esmoquin en en la analogía descrita y un modificador 504 representado por 19 bits las de adaptación para hacer que el esmoquin en reserva se en la analogía descrita Como se observa el ID de paquete 502 identifica un paquete único que está almacenado en la base de datos por y el modificador 504 identifica una transformación para aplicar al paquete predeterminado que corresponde al ID de paquete 502 para hacerlo De esta en el ejemplo un modificador de 19 bits permite que cualquiera de los paquetes predeterminados en la base de datos 400 sea permutado en más de maneras Esto incrementa el grado al cual la base de datos 400 se puede compactar y se describe posteriormente en el contexto de En un formato por el ID de paquete para un paquete predeterminado de 46 milisegundos puede ser representado por 21 bits y la información de modificación puede ser representada por 25 lo aunque reduce los paquetes incrementa las maneras en las cuales cada paquete puede ser Es este ejemplo almacena incluso menos para pero permite alteraciones más complejas a cada sirviendo nuevamente de ese modo a la misma clientela con un esmoquin bien Mientras que la corriente de paquetes 500 mostrada en la Figura 3 representa una velocidad de bits de la corriente de 1 se pueden utilizar otras velocidades de bits de corriente con otras composiciones de la Por el paquete 500 podría ser construido con dos o más IDs de junto con modificadores los cuales contienen instrucciones para combinar los paquetes por uno o más IDs de paquete con uno o más modificadores se pueden configurar dinámicamente de paquete a paquete para reproducir los paquetes de audio Las Figuras 4 y 5 ilustran la reutilización máxima de paquetes predeterminados entre representaciones de canciones u otro contenido digital para compactar la base de datos maximizando de ese modo la variedad de paquetes predeterminados únicos que puede almacenar y la variedad de contenido que puede ser representado en una transmisión de bits Como se ilustra en la Figura un número de paquete de audio 15 de la Canción 2 se puede es decir se puede utilizando varios modificadores en varios paquetes de audio diferentes de diferentes En el ejemplo ilustrado de la Figura el número de paquete de audio 15 de la Canción 2 se puede transformar en cada uno de los paquetes de audio 3243 y 3345 de la Canción así como también los paquetes de audio 1837 y 4875 de la Canción De esta el mismo paquete el paquete 15 de Canción se puede utilizar para por lo menos dos canciones diferentes la Canción 2 y la Canción en varias ubicaciones diferentes dentro de cada De esta la base de datos en lugar de almacenar los paquetes de audio 3243 y 3345 de la Canción así como también los paquetes de audio 1837 y 4875 de la Canción solo necesita almacenar el número de paquete de audio 15 de la Canción Como solo puede ser necesario que la base de datos 400 por paquetes predeterminados únicos en lugar de paquetes para representar una canción debido a la reutilización de ya sea modificados o dentro de esa Conforme se procesan más canciones para construir la base de es necesario que se agreguen menos paquetes nuevos a la base de ya que muchos paquetes existentes se pueden utilizar como están o La Figura 5 ilustra la reducción de nuevos paquetes de audio de canciones que están almacenadas en la base de datos 400 como paquetes predeterminados sintéticos conforme las canciones son procesadas secuencialmente con el tiempo la Canción 1 es la primera canción procesada para paquetes de audio que se colocan en la base de la Canción 2 es la segunda canción procesada y así Cuando la Canción 1 se coloca en la base de un proceso ejemplar para almacenar la canción analiza los paquetes predeterminados en la base de datos y determina si algún paquete de audio en la misma puede reutilizarse Por cuando la Canción 1 se coloca en la base de un proceso ejemplar puede comenzar a almacenar los paquetes de audio en la base de datos y también puede identificar paquetes de audio de la Canción 1 que se pueden De esta la Figura 5 por que para los paquetes totales en la Canción se requiere que nuevos paquetes predeterminados sean almacenados para representar la Canción pero 500 paquetes de audio pueden ser recreados a partir de aquellos paquetes De manera la Canción 2 requiere agregar nuevos paquetes predeterminados que se almacenan en la base de datos pero 500 se pueden obtener mediante la reutilización de paquetes predeterminados existentes sea de la Canción 1 o la Canción o Conforme el número de paquetes de audio almacenados como paquetes predeterminados en la base de datos se lo hacen también las oportunidades para la reutilización de paquetes En el ejemplo de la Figura las Canciones y solo requieren cada una que se almacenen nuevos paquetes predeterminados y para cuando las Canciones y se cada una solo requiere que se almacenen nuevos paquetes predeterminados en la base de Para por ejemplo se agrega la Canción dado el gran número de paquetes predeterminados que ya están almacenados en la base de datos solo se requiere que 50 nuevos paquetes predeterminados se almacenen en la base de datos para reconstruir completamente la Canción De esta conforme el tamaño de la base de datos ejemplar la reutilización de paquetes predeterminados La Figura 6 ilustra una visión general ejemplar de un proceso de codificación de 2 pasos para contenido de audio de acuerdo con una modalidad ejemplar de la presente En la Etapa un codificador recibe una corriente de audio fuente que es ya sea análoga o digital y codifica la corriente de audio en una corriente de paquetes de audio Por un codificador USAC que utiliza un algoritmo de compresión de audio perceptual puede comprimir la corriente de audio fuente en una corriente de 24 kbps en donde cada paquete de audio en la misma comprende aproximadamente 46 de audio no En la etapa una etapa de comparación de por recibe un paquete de audio de la Etapa 1 y lo compara con una base de datos o diccionario que comprende paquetes El resultado de esta comparación puede ser un paquete que Coincide con un Vector de como se Estos por se transmiten utilizando el formato de la Figura como un campo de de y un campo de En modalidades ejemplares de la presente el codificador que se utiliza para generar la base de datos 400 es el mismo tipo que el codificador utilizado en la Etapa 1 los dos codificadores utilizan la misma configuración El codificador USAC utilizado en la Etapa y también utilizado para generar la base de datos 400 se por para mejorar la calidad del Por los codificadores USAC existentes están diseñados para mantener una corriente de salida de paquetes de audio codificados con una velocidad de bits Puesto que los paquetes de audio estándar varían en cuanto a su tamaño con base en la complejidad de este contenido de las porciones sumamente complejas de audio pueden dar por resultado bits insuficientes disponibles para la codificación Estos períodos de escasez de bits dan por resultado frecuentemente una calidad degradada del Puesto que la corriente de audio en el proceso de codificación de la etapa 2 de la Figura 6 se forma con de paquete y modificadores en lugar de los paquetes de el codificador se puede configurar para enviar paquetes de calidad constante sin la limitación de mantener una velocidad de bits de paquete La función de comparación de paquetes mostrada en la Etapa 2 de la Figura 6 identifica un paquete predeterminado en la base de datos 400 que es el que coincide mejor con el paquete de audio proporcionado de la etapa 1 utilizando el análisis de La función de comparación de paquetes también identifica un vector de error u otro modificador asociado con cualquier información adecuada que es necesaria para modificar el paquete predeterminado coincidente para que corresponda más estrechamente con el paquete de audio proporcionado de la etapa Después de determinar el paquete predeterminado que coincide mejor y el vector de los paquetes de transmisión se generan y se transmiten a un dispositivo Los paquetes de transmisión ilustrados en el ejemplo de la Figura 6 comprenden un ID de paquete que corresponde al paquete predeterminado coincidente y los bits que representan el vector de La función de comparación de paquetes de la etapa 2 puede ser un procesamiento intensivo dependiendo del tamaño de la base de datos El procesamiento paralelo se puede utilizar para implementar la etapa de comparación de Por múltiples procesadores de señales digitales paralelos se pueden utilizar para comparar un paquete de audio de la etapa 1 con variedades respectivas de paquetes predeterminados en la base de datos 400 y cada uno puede enviar una coincidencia óptima localizada de entre su variedad correspondiente de paquetes predeterminados Las numerosas coincidencias identificadas por los DSPs respectivos entonces se pueden procesar y comparar para determinar el paquete predeterminado que coincide teniendo en mente que esto puede requerir una modificación para lograr una calidad de sonido La Figura 7 ilustra un proceso ejemplar 900 para desarrollar una base de datos 400 de paquetes configurables reutilizables y En el ejemplo de la Figura el proceso ejemplar 900 inicia al recibir una corriente de audio en el bloque La corriente de audio es cualquier corriente de audio en vivo o grabado previamente y puede ser procesada por un codee o puede ser analizada por una transformada rápida de Fourier para el procesamiento La corriente de audio se divide en una pluralidad de paquetes de audio en el bloque Cada paquete de audio de la corriente de audio entonces se compara secuencialmente con paquetes predeterminados que están almacenados por la base de datos 400 en el bloque En el bloque el método ejemplar 900 entonces determina si existe una coincidencia adecuada del paquete de audio almacenado en la base de datos Si no se identifica un paquete predeterminado adecuado en el bloque un nuevo ID de paquete se genera en el bloque el paquete de audio se transforma como un paquete predeterminado sintético en el bloque 927 y el paquete predeterminado resultante se almacena en la base de datos en el bloque 930 junto con su ID de paquete Es el paquete de audio se almacena como un paquete predeterminado sintético en la base de datos 400 y tiene un ID de paquete Con referencia nuevamente al bloque en caso de que el proceso ejemplar 900 identifique un paquete predeterminado adecuado que coincide con el paquete de audio un paquete predeterminado con o sin un el proceso puede determinar que existen múltiples paquetes predeterminados relacionados en la base de datos 400 los cuales se pueden consolidar en un paquete predeterminado individual que se puede reutilizar en lugar de crear los paquetes respectivos con modificadores Más específicamente y con referencia continua a la Figura en el bloque 935 el proceso ejemplar 900 recibe un ID de paquete del paquete de audio coincidente y determina un tipo de transformación un un para aplicar al paquete de audio coincidente en el bloque El proceso ejemplar 900 entonces determina los parámetros de transformación del tipo de transformación determinado en el bloque En el ejemplo de la Figura la transformación es cualquier transformación no lineal o iterativa que es adecuada para causar que la fidelidad del audio del paquete de audio coincidente represente sustancialmente el paquete de audio de la corriente de audio Como se indica en el bloque el proceso ejemplar 900 determina si existen múltiples paquetes relacionados que se pueden modificar de alguna manera utilizando los parámetros de Si existen estos múltiples paquetes un paquete predeterminado existente se puede seleccionar para que se mantenga en la base de datos 400 y los paquetes restantes se pueden como se indica en el bloque las características de uno o más de los paquetes relacionados se pueden utilizar para crear uno o más nuevos paquetes predeterminados sintéticos con un ID único para reemplazar todos los múltiples paquetes Esto se describe de manera más completa posteriormente en el contexto del de la base de Después de almacenar el nuevo paquete predeterminado y el ID correspondiente en el bloque o de compactar la base de datos como sea necesario como se indica en el bloque el siguiente paquete de audio en la corriente de audio se puede procesar por bloques 945 y 950 hasta que se completa el procesamiento de todos los paquetes en la corriente de El proceso ejemplar 900 entonces se repite para la siguiente corriente de audio siguiente canción u otro segmento de Una vez que los paquetes predeterminados se almacenan en una base de datos están listos para la codificación como se describiera anteriormente en relación con la Figura por la base de datos de paquetes 400 se podría generar al mapear primero todos los paquetes de canciones originales y luego deducir un conjunto óptimo de paquetes sintetizados y modificadores para cubrir el espacio en varios niveles de La Figura 8 ilustra el proceso ejemplar 1000 para incrementar el ancho de banda de transmisión mediante el uso de paquetes predeterminados para generar una corriente en el bloque el proceso ejemplar 1000 recibe una corriente de audio de entrada tal como un archivo de audio una corriente de audio digital o una corriente de audio por En el bloque 1010 el proceso ejemplar 1000 realiza un análisis de la corriente de audio de entrada para caracterizar digitalmente la corriente de Por una transformada rápida de Fourier se realiza para analizar el contenido de frecuencia de la fuente de En otro la corriente de audio se codifica utilizando un códec de audio perceptual tal como un algoritmo El proceso ejemplar 1000 entonces divide la corriente de audio analizada en una pluralidad de paquetes de corriente de audio un paquete de audio representa 46 milisegundos de en el bloque En el bloque el proceso ejemplar 1000 entonces compara cada paquete de corriente de audio analizado con paquetes predeterminados que están almacenados en una base de datos de paquetes predeterminados disponible desde cualquier ubicación adecuada una base de datos una un sistema de En un más de 100 millones de paquetes cada uno con un ID de paquete único se muestra en la Figura se almacenan en una base de datos 400 para representar paquetes de audio cada uno de los a su representa aproximadamente 46 milisegundos de En el bloque el proceso ejemplar 1000 implementa algún algoritmo de comparación adecuado que identifica características similares de los paquetes predeterminados que corresponden a los paquetes de corriente de Por se puede utilizar un algoritmo de coincidencia psicoacústico como se describe posteriormente Por el bloque 1020 puede analizar el contenido de frecuencia de los paquetes predeterminados y el contenido de frecuencia de los paquetes de corriente de audio y puede identificar varios paquetes predeterminados diferentes que coinciden con los paquetes de corriente de El proceso ejemplar 1000 entonces puede identificar 20 frecuencias no armónicas de interés de los paquetes de corriente de audio y puede determinar la amplitud de cada El proceso ejemplar 1000 determina que un paquete predeterminado coincide con el paquete de corriente de audio si contiene cada frecuencia no armónica con amplitudes Sin otros tipos de análisis se pueden utilizar para determinar que los paquetes predeterminados corresponden a los paquetes de corriente de Por la información de armónicas la información de notas musicales se puede utilizar para determinar una coincidencia un paquete predeterminado óptimo representa el paquete de corrientes de audio y lo reproduce con una calidad aceptable de En el bloque el proceso ejemplar 1000 recibe un ID de paquete único para el paquete predeterminado óptimo o seleccionado para cada paquete de corriente de audio El ID de paquete comprende algún número adecuado de bits para identificar cada paquete predeterminado para el uso mediante el proceso ejemplar 1000 27 En el bloque el proceso ejemplar 1000 determina que una transformación lineal o no lineal se aplica como sea necesario a cada paquete predeterminado coincidente distorsión para lograr una calidad adecuada de Por el proceso ejemplar en el bloque puede calcular un vector de error para una transformación lineal de características de frecuencia para aplicar al paquete predeterminado coincidente Alternativamente en el bloque el proceso ejemplar 1000 puede determinar parámetros para la transformación seleccionada de cada paquete predeterminado La transformación seleccionada y los parámetros determinados se seleccionan para que la transformación de los paquetes predeterminados corresponda más estrechamente con los paquetes de corriente de Es la transformación causa que la fidelidad del audio la presentación del dominio del paquete predeterminado coincida más estrechamente con la fidelidad del audio de los paquetes de corriente de En otro en el bloque 1035 el proceso ejemplar puede realizar una coincidencia iterativa de los paquetes de corriente de audio con base en un paquete anterior o un paquete o cualquier combinación de los El proceso ejemplar 1000 entonces transforma cada paquete predeterminado con base en la transformación seleccionada y los parámetros determinados para identificar un paquete predeterminado óptimo o El proceso ejemplar 1000 genera un código modificador con base en la información seleccionada y los parámetros de transformación Por el código modificador puede ser de 19 bits para indicar el tipo de transformación un una etapa de un los parámetros de la transformación o cualquier otra información El código modificador también puede unirse de manera iterativa a códigos modificadores previos o posteriores de diferentes paquetes Por las frecuencias bajas sustancialmente similares pueden estar presentes sobre varios paquetes de corriente de audio secuenciales y una transformación pueden ser representada eficientemente al unirse a una transformación En otro el código modificador también puede indicar numerosas transformaciones o puede ser de longitud variable 5 20 En el bloque el proceso ejemplar 1000 transmite un paquete que comprende el ID de paquete del paquete predeterminado coincidente y el código modificador a un dispositivo En otro el ID de paquete del paquete de audio coincidente y el código modificador se almacenan en un archivo que representa sustancialmente la corriente de audio de La Figura 9 ilustra un proceso ejemplar 1200 para recibir y procesar una corriente transmitida reducida en bits que identifica paquetes predeterminados de acuerdo con una modalidad ejemplar de la presente En el bloque el proceso ejemplar 1200 recibe una corriente transmitida y extrae paquetes de la misma desmodula y decodifica una corriente recibida para lograr una corriente de banda En el bloque el proceso ejemplar 1200 procesa los paquetes recibidos para extraer un identificador de paquete predeterminado y opcionalmente un código En el bloque el proceso ejemplar 1200 recupera un paquete predeterminado almacenado localmente que corresponde al ID de paquete En el ejemplo de la Figura los paquetes predeterminados del proceso ejemplar 1200 son idénticos o sustancialmente idénticos a los paquetes predeterminados que se describen en los procesos ejemplares 900 En el bloque el proceso ejemplar 1200 transforma el paquete predeterminado con base en el código modificador En un el proceso ejemplar 1200 realiza una transformación lineal o no lineal para el paquete predeterminado tal como un filtro selectivo de por En otro el proceso ejemplar 1200 realiza una transformación iterativa para el paquete predeterminado con base en un paquete de audio Por una transformación común puede aplicar a un grupo de frecuencias comunes para una secuencia de IDs de paquetes Después del bloque el proceso ejemplar 1200 procesa los paquetes de audio transformados en una corriente de audio por vía de un decodificador y presenta auricularmente la corriente de audio a un usuario receptor en el bloque 1225 después de operaciones normales almacenamiento en memoria transformación El bloque 1225 puede incluir pasos adicionales para retirar artefactos los cuales puedan resultar de la concatenación conjuntamente de paquetes de audio con discontinuidades tales como pasos que incluyen filtración de frecuencia allanamiento de promedio compensación de ruido y así por el La reproducción continua de una corriente de audio secuencial reproduce la corriente de audio original médiante el uso de los paquetes predeterminados y la corriente de audio resultante y la corriente de audio original tienen una fidelidad de audio sustancialmente similar Los procesos ejemplares 1000 1200 pueden ser realizados por medio de instrucciones legibles por máquina en un medio legible por computadora almacenado en el sistema ejemplar 1100 en la Figura 10 y descrito más El medio legible por computadora también puede solo o en combinación con las instrucciones de archivos de estructuras de y El medio legible por computadora y las instrucciones de programa pueden ser aquellos diseñados y construidos especialmente para los propósitos de la presente invención o pueden ser de la clase bien conocida y disponible para aquellas personas que tienen experiencia en el campo del software para Los ejemplos de medios legibles por computadora incluyen medios magnéticos tales como discos discos flexibles y cinta medios ópticos tales como discos para y medios ópticos tales como discos y dispositivos de hardware que están configurados especialmente para almacenar y realizar instrucciones de tal como una memoria solo de lectura por sus siglas en memoria de acceso aleatorio memoria no volátil y El medio también puede ser un medio de transmisión tal como líneas ópticas o guías de ondas y así por el que incluyen una onda portadora que transmite señales que especifican las instrucciones de estructuras de datos y así por el Los ejemplos de instrucciones de programa incluyen tanto un código de tal como aquel producido por un como archivos que contienen un código de nivel más alto que puede ser ejecutado por la computadora utilizando un Los dispositivos de hardware descritos se pueden configurar para actuar como uno o más módulos de software con el propósito de realizar las operaciones de las modalidades descritas anteriormente de la presente La Figura 10 es un diagrama de bloques del sistema 1100 que puede implementar el proceso ejemplar 900 de la base de o el proceso ejemplar 1000 codifica una corriente de audio utilizando IDs y modificadores de paquetes el sistema 1100 incluye un procesador 1102 que realiza instrucciones lógicas matemáticas generales ejemplo instrucciones de hardware tales como El procesador 1102 incluye dispositivos de memoria interna tales como registradores y memorias caché locales memoria caché para el procesamiento eficiente de instrucciones y El procesador 1102 se comunica dentro del sistema 1100 por de la interfaz de barra colectora 1104 para interconectar con otro hardware tal como la memoria La memoria 1105 puede ser un medio de almacenamiento volátil o un medio de almacenamiento no volátil para almacenar parámetros y otra información relevante para el uso por parte del procesador El procesador 1102 también comunica con un procesador de exhibición 1106 una unidad de procesador de para enviar y recibir información gráfica para permitir que la pantalla 1108 presente información gráfica a un El procesador 1102 también envía y recibe instrucciones y datos para la interfaz del dispositivo 1110 una barra colectora en una barra colectora en que se comunica utilizando un protocolo para dispositivos internos y externos y otros dispositivos electrónicos Por la interfaz del dispositivo ejemplar 1110 se comunica con el disco duro 1112 el sensor de imágenes 1114 que recibe y digitaliza información de imagen externa un sensor de imágenes CCD o y otros dispositivos electrónicos un teléfono un equipo equipo de La interfaz de disco 1116 permite que el procesador 1102 se comunique con otros dispositivos de almacenamiento 1118 tal como unidades de disco unidades de disco duro y un conjunto redundante de discos independientes en el sistema En el ejemplo de la Figura el procesador 1102 también se comunica con la interfaz de red 1120 que intercomunica con otros recursos de red tal como una red de área local por sus siglas en una red de área amplia por sus siglas en la Internet y así por el Por la Figura 11 ilustra la interfaz de red 1120 interconectándose con una base de datos relacional 1122 que almacena información para la recuperación y operación por parte del sistema El sistema ejemplar 1100 también se comunica con otros servicios de comunicación inalámbricos redes inalámbricas por vía del transceptor En otro el transceptor 1124 se comunica con servicios de comunicación inalámbrica por vía de la interfaz de dispositivo Las modalidades ejemplares de la presente invención se describen a continuación con respecto a un servicio de radiocomunicación de audio digital por vía satélite que es transmitido a receptores por uno o más satélites repetidoras Las ventajas de los métodos y sistemas para un ancho de banda de transmisión mejorado descritas en este documento y de acuerdo con modalidades ilustrativas de la presente invención se pueden lograr en otros sistemas de suministro de difusión otros sistemas de difusión de audio digital sistemas de difusión de video digital o sistemas de radiocomunicación de alta definición así como también otros métodos alámbricos o inalámbricos para la transmisión de contenido tal como la transmisión las ventajas de los ejemplos descritos se pueden alcanzar por medio de dispositivo de usuario diferentes de aplicaciones de protocolos de A manera de el proceso ejemplar como se muestra en la Figura y el sistema ejemplar como se muestra en la Figura se pueden proporcionar por ejemplo en el centro de programación 20 en un sistema SDARS como se describe en la Figura Más la Figura 11 describe un sistema de difusión satelital ejemplar 10 el cual comprende por lo menos un satélite geoestacionario 12 para la recepción de señales satelitales de línea visual por sus siglas en por lo menos un receptor indicado generalmente con el número de referencia El sistema de difusión satelital 10 se puede utilizar para transmitir por lo menos una corriente fuente que proporciona a los receptores Otro satélite geoestacionario 16 en una posición orbital diferente se proporciona para diversos Una o más repetidoras terrestres 17 se pueden proporcionar para repetir las señales satelitales de uno de los satélites en áreas geográficas donde la recepción LOS es oscurecida por edificios colinas y otras Cualquier número diferente de satélites se puede utilizar y los satélites de cualquier tipo de órbita se pueden Se debe entender que la corriente de SDARS también se puede suministrar a dispositivos de cómputo por vía de la transmisión entre otros métodos de suministro o Como se ilustra en la Figura el receptor 14 se puede configurar para una combinación de uso estacionario en instalaciones de un uso móvil uso portátil o uso móvil en un El centro de control 18 proporciona rastreo y control de los satélites 12 y El centro de programación 20 genera y transmite una corriente de datos compuesta por vía de los satélites 12 y las repetidoras 17 sistemas de comunicaciones que proporcionan la transmisión ininterrumpida a receptores o dispositivos de cómputo del La corriente de datos compuesta puede comprender una pluralidad de canales de carga útil e información auxiliar como se muestra en la Figura Más específicamente la Figura 12 ilustra diferentes canales de transmisión de servicios del canal 1 hasta el canal que proporcionan el contenido de carga útil y un Canal de Información de Difusión por sus siglas en que proporciona la información auxiliar en el SDARS Estos canales son multiplexados y transmitidos en la corriente de datos compuesta que se transmite al receptor En el ejemplo de la Figura el centro de programación 20 obtiene contenido de diferentes fuentes y proveedores de información y proporciona el contenido a codificadores El contenido puede comprender información tanto análoga como digital tal como información de etiquetas de información Por el centro de programación 20 puede proporcionar SDARS que tiene generalmente por lo menos 100 diferentes canales de programas de audio para transmitir diferentes tipos de programas de música y programas de noticias El SDARS también proporciona información relevante a los usuarios tal como información de información de alertas sobre destinos y programas por En cualquier el contenido para los canales de transmisión de servicios en la corriente de datos compuesta se se comprime y los paquetes de audio resultantes se comparan con la base de datos 400 para determinar los paquetes predeterminados coincidentes y modificadores como sea necesario para transmitir los paquetes de audio en un formato reducido en cuanto a bits como IDs y Modificadores de de acuerdo con modalidades ilustrativas de la presente El formato reducido en cuanto a bits se puede emplear con solo un subconjunto de los canales de transmisión de servicios para permitir que los receptores legados reciban la corriente de mientras que permite que los receptores que implementan el proceso 1200 por desmodulen y decodifiquen los canales recibidos empleando el formato reducido en cuanto a bits descrito en relación con la Figura Los receptores también se pueden por para recibir tanto canales legados como canales de formato reducido en cuanto a bits de Ancho de Banda Eficiente o de modo que no es necesario que la programación se duplique en ambos tipos de canal se debe entender que podrían haber muchos más canales cientos de que los canales pueden ser multidifundidos o unidifundidos al receptor que los canales pueden ser transmitidos a través de un un sistema terrestre inalámbrico Radio a través de una portadora de TV de pueden ser transmitidos ininterrumpidamente a través de una conexión de celular o y que el contenido de los canales podría incluir cualquier clasificación de radio reportes de espectáculos de eventos deportivos en anuncios comerciales y En este documento se entiende que el de se refiere a cualquiera de los métodos descritos anteriormente o métodos similares que se utilizan para transmitir contenido para un canal a un producto o dispositivo La Figura 13 ilustra el receptor ejemplar 14 para SDARS que puede un proceso de recepción y decodificación ejemplar En el ejemplo de la Figura el receptor 14 comprende una un sintonizador y brazos receptores para el procesamiento de la corriente de difusión de SDARS recibida de por lo menos uno de los satélites 12 y la repetidora terrestre 17 y opcionalmente una corriente modulada como es indicado por los Estas corrientes recibidas son combinadas y decodificadas por vía del combinador de señales junto a los SDARS y desmultiplexadas para recuperar canales de la corriente de difusión de como es indicado por el módulo de combinación de señales y el módulo desmultiplexor de El procesamiento de una corriente de difusión de SDARS recibida se describe con mayor detalle en las Patentes de los Estados Unidos de propiedad común y el contenido completo de las cuales se incorpora por este acto en este documento a manera de Un módulo de acceso condicional se puede proporcionar opcionalmente para restringir el acceso a ciertos canales Por cada receptor 14 en un sistema de SDARS puede ser provisto con un identificador único que permite la capacidad de dirigir individualmente cada receptor 14 a través del aire para facilitar el acceso condicional tal como para habilitar o deshabilitar servicios o proporcionar aplicaciones adaptadas tal como servicios de datos individuales o servicios de datos en La corriente de datos de servicio desmultiplexada se proporciona al controlador del El controlador del sistema en el receptor de radiocomunicación 14 se conecta a la memoria memoria no una interfaz del usuario y por lo menos un decodificador de El almacenamiento de las tablas de archivos locales en el receptor por puede ser en una memoria no una una unidad de disco duro o cualquier otra memoria volátil o no volátil En un un dispositivo de memoria no volátil NAND de 8GB puede almacenar la base de datos 400 de paquetes En el ejemplo de la Figura los paquetes predeterminados que están almacenados en el receptor 14 son idénticos o sustancialmente idénticos a los paquetes predeterminados que están almacenados en los procesos ejemplares 900 El controlador del sistema en conjunción con la base de datos 400 puede procesar paquetes en corrientes de canales decodificadas y desmultiplexadas para extraer los IDs y modificadores de paquetes y representar auricularmente los paquetes de audio como se describiera anteriormente en relación con el proceso ejemplar 1200 Más como se describiera los paquetes predeterminados se pueden almacenar localmente en la memoria no Con la recepción de una corriente de paquetes de 1 kbps ejemplar que comprende IDs de paquete para paquetes predeterminados respectivos que están almacenados en la memoria no volátil y cualquier código modificador el receptor 14 recupera los paquetes predeterminados que corresponden a los IDs de paquetes y los transforma en una corriente de USAC de 24 kbps con base en la información que se encuentra en el código El receptor 14 entonces realiza cualquier procesamiento adecuado almacenamiento en memoria y amplifica la corriente de audio y presenta auricularmente la corriente de audio para un usuario del receptor El proceso ejemplar 1200 permite que un dispositivo reciba una corriente de difusión que tiene un ID de paquete e información de El proceso ejemplar 1200 recupera los paquetes predeterminados que están almacenados localmente con base en la información del ID del paquete y transforma los paquetes predeterminados con base en la información de modificación recibida para que correspondan de manera más exacta a la corriente de audio En un el ID de paquete para un paquete predeterminado de 46 milisegundos es representado por 27 bits y la información de modificación es representada por 19 De esta el proceso ejemplar 1200 permite la recombinación de los paquetes predeterminados que están almacenados localmente para reproducir sustancialmente una corriente de audio de USAC de 24 kbps En otro proceso los paquetes de audio pueden ser prorrateados con base en el contenido de frecuencias para enfatizar un audio Por las frecuencias más altas que no son perceptibles fácilmente para un oyente podrían ser retiradas o reducidas sustancialmente en cuanto a la calidad velocidad de muestreo más resolución de muestra más y las frecuencias más bajas de contenido que son más prevalecientes se podrían incrementar velocidad de muestreo más resolución de muestra más Como un una fuente de audio que comprende principalmente habla humana radio difusiones requiere generalmente una velocidad de muestreo de 8 kilohertzios para reproducir sustancialmente el habla el habla humana tiene típicamente una frecuencia fundamental de 85 Hz a 255 En este las frecuencias inferiores a 300 Hz pueden tener una profundidad de bits incrementada 16 para permitir una reproducción más exacta de la frecuencia fundamental para incrementar la fidelidad del audio de la fuente de audio En los ejemplos descritos un receptor del sistema de difusión puede por paquetes predeterminados sintéticos que pueden ser transformados posteriormente para permitir la recepción de corrientes de audio de ancho de banda Por en algunas modalidades una corriente de 1 kbps puede ser suficiente para reproducir una corriente de audio de USAC de 24 kbps con una pérdida mínima en la fidelidad del Esta corriente de audio puede por de ya sea una fuente pregrabada un archivo de o de una fuente grabada en vivo tal como una difusión en vivo de un evento En modalidades ejemplares de la presente con el propósito de implementar los procesos descritos un o de de de audio se pueden crear y un decodificador o se puede el cual puede por el diccionario o base de datos para analizar un archivo de audio arbitrario en sus elementos componentes y luego puede enviar una lista de estos elementos para cada archivo de audio una porción del a un A su el receptor puede jalar los elementos de su diccionario o base de datos de de Este códec ejemplar y su uso se describen a con base en un sistema ejemplar construido por los presentes inventores Códec de EBT Ejemplar En modalidades ejemplares de la presente un códec de Transmisión de Ancho de Banda Eficiente de se puede fijar como objetivo para hacer uso de la disponibilidad de la memoria económica del receptor y algoritmos modernos de procesamiento de señales para lograr una velocidad de bits extremadamente baja y una codificación de música de alta por de GB de memoria del receptor y utilizando plantillas de codificación deducidas a partir de una base de datos grande de se pueden lograr velocidades de codificación de música que se aproximan a kbps La corriente de bits codificada puede incluir una secuencia de contraseñas y pares como se indicara cada uno que corresponde a una trama de audio del extracto corto de audio en La contraseña en el par puede ser un índice en un diccionario o base de datos grande de plantillas almacenado en el receptor y el modificador puede por información específica de tramas adaptable que se utiliza para mejorar una coincidencia perceptual de la plantilla que coincide la contraseña con la trama de audio La Figura 14 describe un diagrama de flujo de procesos de alto nivel para un Codee de EBT ejemplar de acuerdo con una modalidad ejemplar de la presente La Figura 14 ilustra realmente dos construcción de un diccionario de contraseñas y uso de este una vez para codificar y decodificar archivos de audio En primer lugar se describe el aspecto de la creación del diccionario se observara esto se refiere a la creación de una base de datos de paquetes predeterminados o Con referencia a la Figura en el bloque 1410 los archivos de audio se pueden introducir en la etapa de generación del diccionario Se debe observar que los archivos de audio de entrada pueden por una profundidad de 16 bits y una velocidad de muestra de KHz como es el caso de los archivos de audio digital de De la etapa de generación del diccionario el flujo de proceso se traslada a la etapa de coincidencia perceptual en el bloque Desde el diccionario se recorta a contraseñas redundantes retiradas por contraseñas que son suficientemente similares de tal manera que solo una de ellas es dado el uso de como se observara El diccionario recortado entonces puede ser utilizado por el codee para analizar en el extremo de y sintetizar en el extremo del cualquier archivo de El grado de en es un parámetro que será específico del en Obviamente un recortado más grande hace que el número de contraseñas o paquetes predeterminados en la base de datos sea más lo que requiere menos La compensación es que menos paquetes predeterminados en la base de datos requieren una coincidencia perceptual menor de la señal decodificada con la original o que se realicen modificaciones cada vez más complejas en el lado del receptor con el propósito de mantener la coincidencia perceptual incluso cuando se utiliza un paquete predeterminado menos Una vez el diccionario recortado 1450 se hace disponible tanto para el codificador como para el como se Para codificar un extracto corto de audio un archivo del extracto corto se introduce al codificador en el bloque el utilizando el diccionario encuentra entradas de diccionario que coinciden mejor con las tramas del extracto corto de en el sentido de una coincidencia perceptual Existen varias maneras de llevar a cabo esta coincidencia como se explica con mayor detalle Una vez obtenida esta lista de IDs para las contraseñas identificadas se transmite a través de una corriente de difusión al decodificador en el bloque el cual luego ensambla las contraseñas identificadas y las modifica o transforma como pueden ser para crear una secuencia de paquetes de audio comprimidos que coinciden mejor con el archivo de audio dada la fidelidad disponible del diccionario con base en los algoritmos de coincidencia perceptual que se En esta la secuencia de paquetes de audio comprimidos se podría descomprimir y Sin después de la decodificación en el bloque hay otro el cual opera como una verificación más o menos de la fidelidad de la Este es el proceso de Envoltura Temporal en el bloque Este procesamiento modifica la envoltura del archivo de audio generado en el paso previo de acuerdo con la envoltura del archivo de audio original archivo de audio de entrada 1455 al Después del procesamiento de Envoltura Temporal en el bloque un archivo de salida decodificado se genera en el bloque El procesamiento de Envoltura Temporal se puede por medio de las instrucciones de modificación enviadas por el se puede realizar independientemente en el operando en la secuencia de tramas de audio como se crearon Como se puede observar en la Figura 1 en cada cuadro que representa una etapa en el se lista un programa o módulo Éstos se refieren a programas ejemplares creados como una implementación ejemplar de la generación del diccionario y codee de la Figura Los módulos del decodificador EBTD y el codificador EBTE ejemplares se proporcionan a continuación en la Exhibición A se proporciona una breve descripción de cada uno de estos Módulos de Generación del Diccionario EBTGEN del Sintaxis genre Todos los archivos digamos en el diccionario se pueden nombrar con un valor Las nuevas tramas se pueden agregar fácilmente para cualquier archivo de audio nuevo donde el nombre del nuevo archivo se puede iniciar a partir del último archivo de valor numérico que ya está almacenado en la base de Para se puede utilizar un archivo separado por el cual puede por el último valor numérico EBTPQM Sintaxis EBTPQM exe 1 100 1 34567 Trama de referencia de inicio para comparar con todas las otras tramas del Última trama de referencia para comparar con todas las otras tramas del Trama del diccionario de inicio que se compara con una trama de Última trama del diccionario que se compara con una trama de Ruta inicial del Este módulo elige tramas en un archivo de entrada una por una y descubre la trama que mejor coincide dentro del resto de las tramas del El código genera un archivo de texto llamado el cual puede por Nombre de archivo de trama de trama la cual se compara con todas las otras tramas Nombre de archivo de trama que coincide trama encontrada que es la que mejor coincide dentro del índice de del 1 al donde 1 corresponde a la mejor Puesto que puede haber un gran número de archivos en el el código puede realizar operaciones en múltiples Después de la ejecución puede por múltiples archivos los cuales se pueden unir en un archivo nombrado por EBTPRUNE del Sintaxis EBTPRUNE exe Archivo de salida de EBTPQ ejecutable Ruta del Este módulo recorta las tramas que mejor coinciden del Por se puede utilizar para recortar tramas que tienen una trama de contraparte en el diccionario con un índice de calidad muy alto por decir de 1 a por El límite de recorte también se puede establecer de un modo de De esta por asumiendo de el módulo puede clasificar primero todas las tramas en el diccionario de acuerdo con sus índices de calidad de 1 a y luego puede recortar de las tramas de la parte Módulos de Códec EBTENCODER Sintaxis EBTENCODER exe input 1453 0 donde Archivo wav de entrada Ruta del diccionario Número total de archivos en el diccionario Nombre de archivo de salida del codificador Indicador de análisis de armónica Codifica un archivo de audio utilizando el diccionario La trama que mejor coincide del diccionario se obtiene para cada trama del archivo de audio de entrada y los otros parámetros relevantes para construir el audio en el lado de decodificador se La corriente de bits del codificador tiene la siguiente información por índice de de la trama en el diccionario Valor RMS de la trama original Indicador de armónica si se construye la fase a partir de la información de fase de trama Distancia de alineamiento temporal basada en la correlación También genera un archivo de audio el cual se requiere para la operación MBTAC el bloque mostrado en la Figura llamado EBTDECODER EBTDECODER exe Archivo Ruta del diccionario Salida del decodificador EBTD la cual se pasará al codificador de Decodifica la corriente de bits codificada con la ayuda del diccionario recortado y reconstruye la señal de audio EBTMBTAC Temporal Multi 10 2 128 aac aac Archivo de onda de salida de aac Archivo temporal requerido para MBTACDec exe Archivo de onda de salida MBTACEnc exe Salida decodificada final Modifica la envoltura de un archivo de audio generado en el paso previo de acuerdo con la envoltura del archivo de audio original de audio de entrada Envía el archivo de audio decodificado A continuación se describen las Figuras las cuales proporcionan detalles adicionales de un codificador y decodificador ejemplares de acuerdo con modalidades ejemplares de la presente Como se observó el codificador y el decodificador se presentaron cada uno como etapas de procesamiento individuales en la Figura Las Figuras ahora proporcionan los detalles de este Se debe observar que las modalidades ejemplares de la presente invención utilizan un esquema de codificación basado en DFT donde la magnitud de DFT normalizada se puede obtener del diccionario el cual es coincidente perceptualmente con una señal original y la fase de las tramas adyacentes ya sea se puede por o se puede generar analíticamente en una etapa la corrección de envoltura se puede aplicar sobre un plano de La Figura 15 describe un diagrama de flujo de procesos ejemplar para un Con referencia al en el bloque un archivo de audio se puede introducir a la etapa de De la etapa 1510 el flujo de proceso se desplaza al módulo de análisis psicoacústico en el bloque 1515 y de ahí al algoritmo de coincidencia en el bloque el cual busca una mejor coincidencia para una trama dada de un De esta el algoritmo de coincidencia 1520 tiene acceso al diccionario completo Del algoritmo de coincidencia un ID de paquete se Éste identifica un paquete en el diccionario el cual coincide mejor con la trama que es Éste puede ser por a una etapa de formateo de corriente de bits 1525 que envía la corriente de bits codificada Mientras en el fondo de la Figura 15 se muestra un tramo de procesamiento donde la entrada de audio también es alimentada a cada uno del Modificador de Fase 1530 y el Análisis de Por otra la salida del Modificador de Fase así como también la salida de la Corrección de Envoltura 1550 se introducen también al Formateo de Corriente de Bits 1525 como Bits Modificadores Se debe observar que el Análisis de 1540 y la Corrección de Envoltura relacionada 1550 son equivalentes al Procesamiento de Envoltura Temporal banda 1480 de la Figura Las líneas de puntos que corren del Algoritmo de Coincidencia 1520 a cada uno del Modificador de Fase 1530 y MBTAC 1550 indican respectivamente la fase e información de envoltura de la entrada del diccionario coincidente la cual se proporciona a los bloques correspondientes 1530 y De este por la coincidencia se basa en la magnitud espectral pero el diccionario de también almacena la fase y magnitud del de audio la Figura 16 es un diagrama de flujo de procesos detallado para un decodificador Con referencia a la en el bloque 1601 una corriente de bits tal como la corriente de bits 1527 enviada del como se describiera anteriormente con referencia a la Figura se introduce a la decodificación de corriente de bits La decodificación de corriente de bits 1610 tiene además acceso al diccionario creado como se describiera anteriormente en relación con la Figura De la decodificación de corriente de bits tanto las muestras de tiempo 1615 como la magnitud de DFT 1617 se Éstas luego son alimentadas ambas en el modificador de fase cuya salida luego es alimentada en el inverso La salida del DFT 1625 luego es por en el análisis de cuya salida luego puede ser alimentada a la Corrección de Envoltura Al mismo como se observara anteriormente con referencia a la Figura del bloque 1635 el procesamiento se desplaza la Síntesis de de la cual se genera un archivo de salida de audio el cual luego se puede utilizar para activar un altavoz y reproducir fuertemente el audio reconstruido para un A continuación se describen varios detalles adicionales con respecto a algunos de los bloques de construcción de los algoritmos del codificador y decodificador Análisis Como se observara el codificador utiliza el análisis psicoacústico después del procesamiento de DFT de la señal de entrada y antes de intentar encontrar una contraseña que mejor coincide del En modalidades ejemplares de la presente las técnicas psicoacústicas descritas en la Patente de los Estados Unidos se pueden utilizar por otras técnicas Algoritmo de Modificación de El análisis psicoacústico identifica el patrón de frecuencia que mejor coincide de acuerdo con las restricciones de la percepción con base en la Durante la reconstrucción del los segmentos adyacentes deben ser alineados en fase De esta en modalidades ejemplares de la presente se pueden utilizar dos métodos para el alineamiento de fase entre los alineamiento temporal basado en la correlación el cual se puede utilizar en tramas del principio indicativas del inicio de un nuevo patrón y continuidad de fase entre señales las cuales se pueden utilizar en todas las tramas subsecuentes siempre y cuando persista un patrón Alineamiento Temporal Basado en la Correlación En modalidades ejemplares de la presente esta técnica se puede utilizar para el alineamiento temporal de la trama obtenida del diccionario que coincide mejor con la trama original para ese segmento de N muestras Los coeficientes de correlación cruzada se pueden evaluar entre estas dos tramas y el instante que tiene el valor de correlación más alto se puede seleccionar como el mejor alineado De esta n va de a El mejor instante m alineado con el En este el segmento de base de datos ha sido cambiado por m y el resto de las muestras han sido llenadas con Para tener cuidado de esta discontinuidad entre los en modalidades ejemplares de la presente invención se pueden utilizar ventanas complementarias de energía como se muestra en la Figura todos los segmentos son provistos en primer lugar con una ventana sinusoidal complementaria de energía y son solapados con segmentos adyacentes por muestras durante la Las ventanas sinusoidales se muestran en la Figura 17 en líneas negras sólidas Durante el método de alineamiento temporal si un segmento se cambia al lado izquierdo por una cantidad como se muestra en color azul en la Figura las muestras de hasta N se llenan con Para mantener esta durante la reconstrucción los siguientes datos de segmentos para 0 a pueden ser provistos con una ventana sinusoidal como se muestra en la Figura en color Las ventanas azul y roja deben satisfacer el carácter de complementariedad de Del mismo las Figuras 17 y 17 muestran los otros posibles casos durante el método de alineamiento del Continuidad de Fase Entre Señales Armónicas La fase de señales armónicas que continúan durante más de un segmento se puede calcular Por lo la fase del siguiente segmento se puede adivinar de manera muy Por se supone que un tono exponencial complejo en la frecuencia f está continuando durante más de un Todos los segmentos son traslapados con otros segmentos por 1024 De modo que es necesario calcular la relación entre la señal iniciada de la n muestra y la señal en el Una señal en el dominio temporal o continuo puede ser representada y en el dominio discreto exp fs es la frecuencia de Si el ancho de banda de frecuencia completo es representado por puntos representa la frecuencia equivalente digital donde k es un número entero y Af es la parte fraccional de la frecuencia una señal armónica en el instante puede escribir La ecuación anterior muestra que las señales en ambos casos difieren por fase de y lo mismo es aplicable en el dominio de Para una señal mundial real tal por una señal de audio que tiene múltiples tonos que continúan durante más de un la fase puede ser calculada fácilmente en los contenedores tonales utilizando la información El único es la identificación exacta de componentes de frecuencia presentes en cualquier Teniendo la información de fase en contenedores se debe observar que la fase en otros contenedores no tonales también desempeña un papel el cual se ha observado a través de experimentos En un planteamiento la interpolación lineal entre los contenedores tonales se puede realizar para calcular la fase en contenedores no como se muestra en la Figura De esta la Figura 18 muestra la fase de un segmento de N muestras donde la línea de color azul 1810 muestra la fase original y la línea de color rojo 1820 muestra la fase reconstruida que se obtiene mediante el uso de los resultados analíticos y el método de interpolación La señal consiste de dos en las frecuencias 1kHz y o equivalentemente en el dominio digital esos valores de tonos son y Después del análisis de la respuesta de frecuencia de magnitud tiene picos en el 46 contenedor y el 551 contenedor y la respuesta de fase tiene un salto de p radianes en estos contenedores que corresponden a los dos tonos Aunque el cálculo anterior se ha realizado únicamente para una señal de tono se observó que los resultados anteriores se mantienen de manera muy exacta en todas las posiciones tonales en una señal Por lo en el ejemplo teniendo dos la fase en los contenedores tonales se puede predecir una vez que se conocen las frecuencias exactas que están presentes en la es los Una vez que se conocen los dos valores de fase en esos dos la fase en otros contenedores se puede producir utilizando una interpolación lineal entre esos dos como se observa en la línea roja 1820 mostrada en la Figura Se observó además que la interpolación lineal no siempre es un método muy exacto para predecir la fase entre los contenedores De esta en modalidades ejemplares de la presente se pueden utilizar otras variantes para la tales por cuadrático o a través de algunas formas La forma de fase entre los contenedores también dependerá de la intensidad de la magnitud en esos contenedores tonales y también de la separación entre los contenedores La cuestión de la envoltura de fase entre los dos contenedores tonales en la respuesta de fase de segmento original también se puede utilizar para calcular la fase entre contenedores En modalidades ejemplares de la presente un algoritmo de modificación de fase completo puede por ambos métodos descritos anteriormente de acuerdo con la característica de los segmentos de Dondequiera que las señales armónicas sean sostenidas para más de un el método de cálculo de fase analítico se puede utilizar y el resto de los segmentos se pueden alinear en por utilizando el método basado en la correlación Generación del Diccionario de Codee Como se observara el diccionario de contraseñas la de datos de paquetes consiste de segmentos de audio únicos y su información relevante recolectada de un gran número de muestras de audio de diferentes géneros y señales En modalidades ejemplares de la presente los siguientes pasos se pueden por para generar la base de Un extracto corto de audio de longitud completa se puede muestrear a y se puede dividir en segmentos pequeños de 2048 Cada segmento de ese tipo puede ser traslapado con sus segmentos adyacentes por 1024 Una Transformación Discreta de Frecuencia Impar se puede calcular para cada segmento de dominio temporal normalizado con provisto con una ventana Un análisis psicoacústico se puede realizar sobre cada segmento para calcular los umbrales de enmascaramiento que corresponden a 21 índices de calidad que varían de 1 a 5 con un tamaño de paso de cada segmento ha sido analizado con otros segmentos presentes en la base de datos para identificar la singularidad del Considerando el nuevo segmento como una trama de examen y el resto de los segmentos ya presentes en la base de datos como una trama de a la trama de examen se le puede asignar un índice de calidad de acuerdo con los criterios de Un índice de calidad ejemplar puede tener como la mejor coincidencia y después incrementos de con un tamaño de paso de para diferenciar las Los criterios de coincidencia se basan en la relación de señal con respecto a máscara entre la energía de señal de la trama de examen y los umbrales de enmascaramiento de la trama de Un cálculo de SMR se puede iniciar utilizando el umbral de enmascaramiento que corresponde al índice de calidad y luego incrementando subsecuentemente los índices El cálculo anterior que satisface la relación de SMR menor que uno para un índice de calidad se puede considerar como la mejor coincidencia entre la trama de examen y la trama de Después de analizar el nuevo segmento con todas las tramas de solo se mantiene un segmento es ya sea el segmento de examen o los segmentos de referencia si se descubre que ambos segmentos coinciden estrechamente base en los índices de calidad de mejor si se descubre que la trama de examen es única base en los índices de calidad de peor se puede agregar a la base de datos como una nueva entrada de contraseña en el En modalidades ejemplares de la presente un segmento se puede almacenar en el diccionario por la siguiente 2048 muestras de dominio temporal normalizadas con RMS del de los datos de dominio temporal normalizados con RMS provistos con una ventana Objetivos de Umbral de Enmascaramiento que corresponden a 21 índices de Energía de 1024 contenedores de ODFT para el cálculo y Otra información básica como género y velocidad de muestra Dado el planteamiento las Figuras presentan algoritmos de codificador y decodificador Éstos se describen a La Figura 19 es un diagrama de flujo de procesos de un algoritmo codificador ejemplar de acuerdo con modalidades ejemplares de la presente Con referencia al el audio de entrada en el bloque 1910 se alimenta en una etapa de normalización con RMS la cual luego envía un valor de RMS 1917 el cual es alimentado directamente a la etapa de corriente de bits codificada de la etapa de normalización con RMS la salida es alimentada en una etapa de ODFT 1920 y de ahí a una etapa de análisis psicoacústico Los resultados del análisis luego son alimentados en una etapa de Identificar Trama Más Coincidente la como se observara debe tener acceso a un diccionario o una base de datos recortada de paquetes predeterminados Una vez que se encuentra una trama más se puede procesar por ejemplo para la corrección de como se describiera por las dos técnicas descritas anteriormente de análisis de armónicas y correlación cruzada de dominio Una vez que esto se la información de Indicador de Armónica y Cambio de Tiempo se puede enviar por la junto con el índice de Trama 1935 ID del paquete predeterminado m s obtenido de la entrada del se puede enviar para que sea codificada o difundida en la Corriente de Bits del Codificador De esta la Corriente de Bits del Codificador 1950 es lo que se envía a través de un canal de difusión o y como se es significativamente más pequeña al nivel de bits que la secuencia correspondiente de paquetes incluso con el uso de información de modificación para recortar algunos de los paquetes de audio más La Figura 20 describe un algoritmo decodificador ejemplar en un receptor o un dispositivo de usuario Con este decodificador es que la corriente de bits del codificador la cual fue enviada en el bloque 1950 mostrado en la Figura y por a través de un canal de se puede Con referencia al el procesamiento comienza con la Corriente de Bits del Codificador Ésta se por al módulo de Elegir La Trama el cual obtiene la trama correspondiente del diccionario que fue designada por el de 1935 en el como se describiera Este módulo tiene acceso a una copia de Base de Datos Recortada 2015 que está almacenada en el la cual es una copia de la Base de Datos Recortada 1933 de la Figura 19 utilizada por el codificador y como se describiera con referencia a la Figura Una vez que la trama designada ha sido permanece para modificar la con el fin de que coincida aún mejor con la trama codificada originalmente del Audio de Entrada Esto se puede por mediante el uso de los resultados del Análisis de Armónica y Correlación Cruzada de Dominio Temporal como se describiera anteriormente con referencia a la Figura De esta en el bloque se determina si un indicador de armónica ha sido En el supuesto caso de que SI se regrese en el bloque entonces la fase se puede predecir analíticamente en el dominio de frecuencia en el bloque 2030 y una ODFT inversa se realiza en el bloque Si no se establece un indicador de armónica y de esta manera NO se regresa en el bloque entonces el Cambio de Datos de Dominio Temporal puede ocurrir en el bloque En cualquier el procesamiento entonces se desplaza a la Corrección de RMS 2050 y luego al bloque donde las tramas adyacentes se combinan utilizando una ventana como se describiera La salida de esta etapa de procesamiento final 2060 es el audio decodificado el cual luego puede ser reproducido a través del dispositivo del Radiocomunicación Personalizada de la Difusión Utilizando EBT Las Figuras ilustran el uso de una modalidad ejemplar de la presente invención para crear un canal personalizado por el pero solo utilizando canciones o extractos cortos de audio luego en la cola en algún momento dado en un Esto se puede realizar de manera única utilizando las técnicas de la presente las cuales puede minimizar en gran por el ancho de banda necesario para transmitir un canal de modo que múltiples canales se pueden transmitir donde previamente solo se podía transmitir De esta con muchos más canales cuando un receptor almacena en una memoria intermedia un conjunto de canales en una memoria intermedia como es el caso frecuentemente en los receptores utilizando la tecnología de optimización de ancho de banda novedosa que se describiera puede haber muchos más canales de EBT disponibles en una corriente de difusión y de esta manera muchos más canales disponibles para el almacenamiento en una memoria Esto en cualquier momento que muchas más canciones sean almacenadas en estas memorias intermedias A partir de esta gran gama de contenido disponible en una memoria intermedia circular es que un módulo de canal residente y que funciona en el por se puede Utilizando las preferencias del usuario y canciones seleccionadas como un receptor ejemplar puede generar en un canal personalizado para ese Esto es mucho más fácil de implementar que una corriente personalizada tal como es el caso con los servicios de música tales por y y debido a que hace uso de una infraestructura de difusión no existe el requerimiento de que un usuario obtenga un acceso a la red o gaste dinero en minutos de transferencia de La Figura 21 ilustra dos pasos que se pueden por para generar este canal En un primer un usuario selecciona una canción para sembrar el La canción puede venir de cualquier canal disponible que es ofrecido por el servicio de En un segundo utilizando varios atributos de la un módulo ejemplar en el receptor puede ensamblar una corriente personalizada de canciones o extractos cortos de audio de los diversos canales almacenados en memoria intermedia en el en el esquema de la Figura se asume que hay 200 canales basados en EBT transmitidos ininterrumpidamente al receptor y de esta manera 480 canciones en la memoria intermedia circular del Por otra cada minutos 270 nuevas canciones se A partir de esta gran gama de contenido la cual es una función de los muchos canales disponibles debido a que cada uno utiliza las técnicas de la presente invención para optimizar de esta manera el ancho de banda necesario para el módulo personalizador puede generar una corriente adaptada de contenido de audio personalizada para el La Figura 22 ilustra parámetros de radiocomunicación de difusión ejemplares que pueden impactar sobre la calidad de la experiencia de personalización de un Éstos pueden por el número de canciones en una memoria intermedia el número de canales de géneros similares y el número de canciones recibidas por minuto por el Se observa que la por de 200 nuevos canales de EBT adicionales a un ofrecimiento de difusión existente puede mejorar la exactitud de corriente personalizada al incrementar el factor de correlación de atributos promedio en la debe observar que la recepción de los canales de utilizando los sistemas y métodos descritos requiere mejoramientos adicionales a receptores De esta para permanecer compatible con una base existente del cliente y receptores una compañía de difusión podría por el servicio anterior y agregar canales de De esta los nuevos receptores podrían recibir o solo los canales de por Un módulo personalizador ejemplar entonces podría utilizar todos los canales disponibles en la memoria intermedia circular para generar la corriente Se debe observar además por en los servicios SDARS de Sirius XM el mejoramiento más alto puede estar disponible con selecciones de corriente en donde los canales de EBT proporcionan una biblioteca de contenido inicial 10X más grande y una biblioteca de contenido continuo 4X más grande que aquel disponible como se muestra en la Figura De esta en este canal de radiocomunicación un grupo de programación puede por qué se pueden Esto se puede definir en el por El grupo de programación también puede definir atributos de canciones que se utilizan para la personalización y un equipo tecnológico ejemplar puede determinar cómo los atributos de las canciones son suministrados a una radio u otro Con base en el los por pueden ser difundidos por pueden ser almacenados previamente en una memoria no La existencia de muchos más canales de EBT obtenidos por medio de los métodos dados a conocer puede incrementar por el contenido disponible para la radio personal El receptor almacena en memorias intermedias múltiples canciones en cualquier momento y de esta manera puede aplicar algoritmos de coincidencia de géneros y preferencias para personalizar una corriente para algún usuario Aunque varios sistemas y técnicas han sido descritos en este el alcance de la cobertura de esta patente no está limitado a los Por el esta patente cubre todos los sistemas y artículos de manufactura que se encuentran claramente dentro del alcance de las reivindicaciones anexas Exhibición A Extractos Ejemplares de Códigos de los Módulos Ejemplares del Codificador EBTE y el Decodificador EBTD Mostrados en la Figura Decodificador EBTD f r i ß í i f i r i t r i vola I í r v v t i i i 1 b re V í r i b e 1 ? s e o y i v r da i r r i í i r j i i 3 p d i j í i p c r i f j f i i ir dd i ? I Pd d r j i di i r f i P j i i i r d Pdi p d i i i id G i Íüd2i rp 1 di i i i í i x i iddddiT d i i t d d p i i S 1 rea i b r 5 p í i 1 i p i y Al i t i J í o ya i c í d R va ? o i I a r d í 1 r í o o P í i ? oo o j i i i do i r i dP Le f 1 i i G i ? r riC i i 7 i i i i s c i 1 i i c ? i di i J i i d i i i i 1 í f t i i i i í n I i 1 d i i i i i i r r C r i 1 1 i i i f 1 i 1 j í i í i 1 i d r ? í 5 i i d r d i y 11 r i ? 1 f r i 1 j c i i r n í bi 1 1 I í loor I 1 i j i i í f i i i r r ? r 1 f i DECODIFICADOR EBTD r i r t í v i va r 1 n le i o I i oí i o X b i í v í bí b csb i í Fu CS r r n i J i i v r r i iv í i 3 í i i 4 1 ? lío í v i i i t r i r i i G? i i i r r r V 4 0 0 í 0 8 3 da r i ií r goto i íf M í í Error í i d si 3ES 1 t i i FILE Data c i J di no i i f pL a i im FILE r int l i Í cha 1 f c o sh s i p pr f j i j s r í 2 pr r pi r av C J í SIü OÜTPUT cal s callee 204 4 1 3 i i ip t i 3 i i í í i i 5 i í i í c i i i í í i i if i d rd Index I t i d i far i pr í íi i 5 I i 1 a i í i n í Oar f a 1 di C py i i S f a f í i t S ? í f i f s Á f íf t i i i y i 1 ? Inde l i J Index i i 0 i ípr i 1 1 i S ve 1 ? f is ng ín i of th i 1 T i y e i i i í Kac s d d Cor x j i i ij t 5 Í i 1 p r p for j Ií 1 G j i j oda re t Le for i iar for 1 t i prev it 0 r 1 for i i i iC i s i r j f d d di d df T fe i i i I r i í P 1 il íi Í i i i i pr v nL i e t ? ? if t i i id i l j i r i re í 3d 24 sqr d i P rn 1 j J 1 o R i j i j I d t P j i f j df í i í 1 i j r p 3 R p v í i d I j isi3s 1 i 1 1 i i 1 j i r d ? 1 i i i j 1 í 1 ? j í 1 j i í i driza í 1 i i j p i o 0 cas i i í p d i j R Pi j í f tidexR i i j i f c 0 r s for i prfi i l 1 i í i i f a S i ex insufficientOCRQuality
Claims (29)
1. Un método para transmitir una corriente de contenido de audio, caracterizado porque comprende: codificar el contenido de audio utilizando un codificador perceptual para obtener una primera serie de paquetes de audio comprimidos; comparar cada uno de los paquetes de audio comprimidos en la primera serie de paquetes comprimidos con una base de datos de paquetes de audio comprimidos cada uno de los cuales tiene un identificador único e identificar un paquete de base de datos que coincide estrechamente para cada primera serie de paquetes de audio comprimidos; generar una secuencia de los identificadores únicos de paquetes de la base de datos que coinciden estrechamente para representar la primera serie de paquetes de audio comprimidos; y transmitir la secuencia de identificadores únicos a través de un canal de comunicaciones .
2. El método de conformidad con la reivindicación 1, caracterizado porque comprende además generar una instrucción de modificación o un vector de error para cada paquete de la base de datos que coincide estrechamente identificado para cada primera serie de paquetes de audio comprimidos y enviar la instrucción de modificación o vector de error con cada uno de los identificadores únicos en la secuencia de identificadores únicos .
3. El método de conformidad con la reivindicación 2, caracterizado porque los identificadores únicos y las instrucciones de modificación o vectores de error se agrupan y la longitud de bit de cada uno del agrupamiento de identificador único e instrucción de modificación o vector de error es de 46 bits.
4. El método de conformidad con la reivindicación 2, caracterizado porque la base de datos de paquetes de audio comprimidos se genera de la siguiente manera: obtener un contenido de audio original para un conjunto de archivos de audio; codificar un primer archivo de audio del conjunto utilizando un codificador perceptual para obtener una serie de paquetes de audio comprimidos para el primer archivo de audio y almacenar las series de paquetes de audio comprimidos en la base de datos, cada uno con un identificador único; para cada archivo de audio adicional en el conjunto de archivos de audio: codificar el archivo de audio utilizando el codificador perceptual para obtener una serie de paquetes de audio comprimidos para el archivo de audio; comparar cada una de las series de paquetes de audio comprimidos para el archivo de audio adicional con los paquetes de audio comprimidos que están almacenados en la base de datos; retirar cualquiera de los paquetes comprimidos para el archivo de audio adicional que son similares mediante una métrica definida para un paquete de audio comprimido que ya está almacenado en la base de datos; almacenar los paquetes comprimidos no retirados para el archivo de audio adicional en la base de datos, cada uno con un identificador único.
5. El método de conformidad con la reivindicación 4, caracterizado porque el identificador único es un número de identificación único de entre 20-30 bits .
6. El método de conformidad con la reivindicación 4, caracterizado porque comprende además, después del almacenamiento de las series de paquetes de audio comprimidos en la base de datos para el primer archivo de audio, comparar las series de paquetes de audio comprimidos que están almacenadas en la base de datos entre sí y retirar de las series de paquetes de audio comprimidos en la base de datos para el primer archivo de audio aquellos que son similares mediante una métrica definida para otro paquete de audio comprimido del primer archivo de audio.
7. El método de conformidad con la reivindicación 4, caracterizado porque la comparación de cada una de las series de paquetes de audio comprimidos para el archivo de audio adicional con los paquetes de audio comprimidos que están almacenados en la base de datos incluye asignar un registro de similitud que tiene por lo menos 20 graduaciones de similitud a cada uno de los paquetes de audio comprimidos para el archivo de audio adicional con respecto a cada paquete ya almacenado en la base de datos .
8. El método de conformidad con la reivindicación 6, caracterizado porque la comparación de cada una de las series de paquetes de audio comprimidos para el primer archivo de audio entre sí incluye asignar un registro de similitud que tiene por lo menos 20 graduaciones de similitud a cada par de paquetes de audio comprimidos para el primer archivo de audio.
9. El método de conformidad con la reivindicación 7, caracterizado porque el registro de similitud es un número entre 1-5, con incrementos cada 0.1 y en donde 1 es el más similar.
10. El método de conformidad con la reivindicación 8, caracterizado porque el registro de similitud es un número entre 1-5, con incrementos cada 0.1 y en donde 1 es el más similar.
11. El método de conformidad con la reivindicación 9, caracterizado porque cuando se determina que los paquetes son similares se define mediante una métrica la cual incluye tener un registro de similitud entre 1-1.4.
12. El método de conformidad con la reivindicación 10, caracterizado porque cuando se determina que los paquetes son similares se define mediante una métrica la cual incluye tener un registro de similitud entre 1-1.4.
13. Un método para generar una base de datos de paquetes de audio comprimidos para el uso en la codificación y decodificación de extractos cortos de audio arbitrarios, caracterizado porque comprende: obtener un contenido de audio original para un conjunto de archivos de audio; codificar un primer archivo de audio del conjunto utilizando un codificador perceptual para obtener una serie de paquetes comprimidos para el primer archivo de audio y almacenar las series de paquetes comprimidos en la base de datos, cada uno con un identificador único; para cada archivo de audio adicional en el conjunto de archivos de audio: codificar el archivo de audio utilizando el codificador perceptual para obtener una serie de paquetes comprimidos para el archivo de audio; comparar cada una de las series de paquetes comprimidos para el archivo de audio adicional con los paquetes comprimidos que están almacenados en la base de datos; retirar cualquiera de los paquetes comprimidos para el archivo de audio adicional que son similares mediante una métrica definida a un paquete comprimido que ya está almacenado en la base de datos; almacenar los paquetes comprimidos no retirados para el archivo de audio adicional en la base de datos, cada uno con un identificador único.
1 . El método de conformidad con la reivindicación 13, caracterizado porque el identificador único es un número de identificación único entre 20-30 bits .
15. El método de conformidad con la reivindicación 13, caracterizado porque comprende además, después del almacenamiento de las series de paquetes comprimidos en la base de datos para el primer archivo de audio, comparar las series de paquetes comprimidos que están almacenados en la base de datos entre sí y retirar de las series de paquetes comprimidos en la base de datos para el primer archivo de audio aquellos que son similares mediante una métrica definida a otro paquete comprimido del primer archivo de audio.
16. El método de conformidad con la reivindicación 13, caracterizado porque comprende además, después del almacenamiento de las series de paquetes comprimidos en la base de datos para el primer archivo de audio, comparar las series de paquetes comprimidos que están almacenados en la base de datos entre sí y retirar dos o más de las series de paquetes comprimidos en la base de datos para el primer archivo de audio que son similares mediante una métrica definida para otro paquete comprimido del primer archivo de audio y reemplazarlos por un paquete comprimido, sintético que es similar mediante una métrica definida a la totalidad de los dos o más paquetes comprimidos .
17. El método de conformidad con la reivindicación 10, caracterizado porque la comparación de cada una de las series de paquetes comprimidos para el archivo de audio adicional con aquellos paquetes comprimidos que están almacenados en la base de datos incluye asignar un registro de similitud que tiene por lo menos 10 graduaciones de similitud a cada uno de los paquetes comprimidos para el archivo de audio adicional con respecto a cada paquete ya almacenado en la base de datos .
18. El método de conformidad con la reivindicación 17, caracterizado porque el registro de similitud es un número entre 1-5, con incrementos cada 0.1 y en donde 1 es el más similar.
19. El método de conformidad con la reivindicación 18, caracterizado porque cuando se determina que los paquetes son similares se define mediante una métrica la cual incluye tener un registro de similitud entre 1-1.4.
20. Un método para generar una base de datos de paquetes de audio comprimidos para el uso en la codificación y decodificación de extractos cortos de audio arbitrarios, caracterizado porque comprende: tomar muestras de un extracto corto de audio de longitud completa y dividirlo en segmentos de 2048 muestras; calcular una Transformada de Frecuencia Discreta Impar para cada segmento de dominio temporal normalizado con R S; realizar un análisis psicoacústico sobre cada segmento para calcular los umbrales de enmascaramiento que corresponden a N índices de calidad; analizar cada segmento con otros segmentos que están presentes en la base de datos para identificar la singularidad del segmento; retirar cualquier segmento que no sea único mediante una métrica definida; almacenar los segmentos únicos en la base de datos .
21. El método de conformidad con la reivindicación 20, caracterizado porque cada segmento se considera como una trama de examen y cada segmento que ya está presente en la base de datos como una trama de referencia, en donde a cada trama de examen se asigna un índice de similitud de acuerdo con criterios de coincidencia definidos.
22. El método de conformidad con la reivindicación 21, caracterizado porque el índice de similitud "1" es la mejor coincidencia y 5.0 es la peor coincidencia con un tamaño del paso de 0.2 entre 1 y 5.
23. Un método para decodificar una señal de audio representativa que comprende una secuencia de identificadores únicos para paquetes comprimidos en una base de datos, caracterizado porque comprende: recibir una señal de audio que comprende una secuencia de identificadores únicos para paquetes comprimidos con instrucciones de modificación asociadas en una base de datos; en cuanto a cada identificador en la secuencia: obtener el paquete comprimido de la base de datos indicada por el identificador; obtener las instrucciones de modificación asociadas con el identificador en la secuencia y modificar el paquete comprimido de acuerdo con las instrucciones de modificación; generar una secuencia de todos los paquetes comprimidos, indicados como se modificaron; y reproducir la secuencia a través de un altavoz para un usuario.
24. El método de conformidad con la reivindicación 23, caracterizado porque las instrucciones de modificación incluyen resultados del análisis de armónicas y correlación cruzada de dominio temporal.
25. El método de conformidad con la reivindicación 23, caracterizado porque la obtención de instrucciones de modificación incluye determinar si se ha establecido un indicador armónico.
26. El método de conformidad con la reivindicación 25, caracterizado porque: si se ha establecido un indicador armónico, adivinar analíticamente la fase en el dominio de frecuencia y realizar una ODFT inversa; y si no se ha establecido un indicador armónico, realizar el cambio de datos de dominio temporal.
27. El método de conformidad con la reivindicación 26, caracterizado porque comprende además realizar una corrección de RMS seguida por la combinación de tramas adyacentes utilizando una ventana adaptable.
28. El método de conformidad con la reivindicación 23, caracterizado porque las instrucciones de modificación incluyen realizar una transformación lineal o no lineal en el paquete identificado.
29. El método de conformidad con la reivindicación 23, caracterizado porque las instrucciones de modificación incluyen realizar una transformación lineal o no lineal en el paquete identificado y paquetes adyacentes . RESUMEN DE LA INVENCIÓN Se presentan sistemas y métodos para incrementar la eficiencia del ancho de banda de transmisión mediante el análisis y la síntesis de los componentes finales del contenido transmitido. Para implementar este sistema, un diccionario o base de datos de contraseñas elementales se puede generar a partir de un conjunto de extractos cortos de audio. Utilizando esta base de datos, una canción arbitraria dada u otro archivo de audio se puede expresar como una serie de estas contraseñas, donde cada contraseña dada en la serie es un paquete de audio comprimido que se puede utilizar como está, o por ejemplo, se puede etiquetar para ser modificado para coincidir mejor con la porción correspondiente del archivo de audio original . Cada contraseña en la base de datos tiene un número de índice o identificador único. Para un número relativamente pequeño de bits utilizados en un ID único, por ejemplo 27-30, varios cientos de millones de contraseñas se pueden identificar de manera única. Al proporcionar de antemano la base de datos de contraseñas a receptores de un sistema de difusión o suministro de contenido, en lugar de difundir o transmitir ininterrumpidamente la señal de audio comprimida real, todo lo que se necesita transmitir es la serie de identificadores junto con algunas instrucciones de modificación para las contraseñas identificadas. Después de la recepción, la inteligencia en el receptor que tiene acceso a una copia almacenada localmente del diccionario puede reconstruir el extracto corto de audio original al tener acceso a las contraseñas por vía de los IDs recibidos, modificarlos como se indica por las instrucciones de modificación, modificar adicionalmente las contraseñas ya sea individualmente o en grupos utilizando el perfil de audio del archivo de audio original (también enviado por el codificador) y reproducir una secuencia generada de contraseñas corregidas por fase y contraseñas modificadas como se indicó. En modalidades ejemplares de la presente invención, esta modificación puede extenderse en contraseñas adyacentes, y puede utilizar cualquiera o ambos de (i) el alineamiento temporal basado en la correlación cruzada y (ii) la continuidad de fase entre armónicas para lograr una fidelidad más alta para el extracto corto de audio original. La figura más representativa de la invención es la número 14.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201161539136P | 2011-09-26 | 2011-09-26 | |
| PCT/US2012/057396 WO2013049256A1 (en) | 2011-09-26 | 2012-09-26 | System and method for increasing transmission bandwidth efficiency ( " ebt2" ) |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| MX2014003610A true MX2014003610A (es) | 2014-11-26 |
Family
ID=47996379
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| MX2014003610A MX2014003610A (es) | 2011-09-26 | 2012-09-26 | Sistema y metodo para incrementar la eficiencia del ancho de banda de transmision ("ebt2"). |
Country Status (4)
| Country | Link |
|---|---|
| US (2) | US9767812B2 (es) |
| CA (2) | CA3111501C (es) |
| MX (1) | MX2014003610A (es) |
| WO (1) | WO2013049256A1 (es) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9407727B1 (en) * | 2011-06-29 | 2016-08-02 | Riverbed Technology, Inc. | Optimizing communications using client-side reconstruction scripting |
| MX2014003610A (es) * | 2011-09-26 | 2014-11-26 | Sirius Xm Radio Inc | Sistema y metodo para incrementar la eficiencia del ancho de banda de transmision ("ebt2"). |
| FR3039351B1 (fr) * | 2015-07-21 | 2019-03-15 | Institut National Des Sciences Appliquees (Insa) | Procede d'acces opportuniste au spectre |
| US9748915B2 (en) * | 2015-09-23 | 2017-08-29 | Harris Corporation | Electronic device with threshold based compression and related devices and methods |
| US10178144B1 (en) * | 2015-12-14 | 2019-01-08 | Marvell International Ltd. | Scattering audio streams |
Family Cites Families (49)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6668092B1 (en) * | 1999-07-30 | 2003-12-23 | Sun Microsystems, Inc. | Memory efficient variable-length encoding/decoding system |
| JP2003513538A (ja) * | 1999-10-22 | 2003-04-08 | アクティブスカイ,インコーポレイテッド | オブジェクト指向ビデオシステム |
| US7376710B1 (en) * | 1999-10-29 | 2008-05-20 | Nortel Networks Limited | Methods and systems for providing access to stored audio data over a network |
| US7477688B1 (en) * | 2000-01-26 | 2009-01-13 | Cisco Technology, Inc. | Methods for efficient bandwidth scaling of compressed video data |
| US6990453B2 (en) * | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
| US20040243540A1 (en) * | 2000-09-07 | 2004-12-02 | Moskowitz Scott A. | Method and device for monitoring and analyzing signals |
| WO2002023773A2 (en) * | 2000-09-13 | 2002-03-21 | Stratos Audio | System and method for ordering and delivering media content usingsupplementary data which is transmitted with a broadcast signal |
| JP4867076B2 (ja) * | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
| US7085845B2 (en) * | 2001-05-09 | 2006-08-01 | Gene Fein | Method, apparatus and computer program product for identifying a playing media file and tracking associated user preferences |
| US7962482B2 (en) * | 2001-05-16 | 2011-06-14 | Pandora Media, Inc. | Methods and systems for utilizing contextual feedback to generate and modify playlists |
| US6789123B2 (en) * | 2001-12-28 | 2004-09-07 | Microsoft Corporation | System and method for delivery of dynamically scalable audio/video content over a network |
| EP1704558B8 (en) * | 2004-01-16 | 2011-09-21 | Nuance Communications, Inc. | Corpus-based speech synthesis based on segment recombination |
| US8498568B2 (en) * | 2004-04-26 | 2013-07-30 | Sirius Xm Radio Inc. | System and method for providing recording and playback of digital media content |
| US7071770B2 (en) | 2004-05-07 | 2006-07-04 | Micron Technology, Inc. | Low supply voltage bias circuit, semiconductor device, wafer and system including same, and method of generating a bias reference |
| US7649937B2 (en) * | 2004-06-22 | 2010-01-19 | Auction Management Solutions, Inc. | Real-time and bandwidth efficient capture and delivery of live video to multiple destinations |
| US7254383B2 (en) * | 2004-07-30 | 2007-08-07 | At&T Knowledge Ventures, L.P. | Voice over IP based biometric authentication |
| US7567899B2 (en) * | 2004-12-30 | 2009-07-28 | All Media Guide, Llc | Methods and apparatus for audio recognition |
| US20070011699A1 (en) * | 2005-07-08 | 2007-01-11 | Toni Kopra | Providing identification of broadcast transmission pieces |
| US20070011009A1 (en) * | 2005-07-08 | 2007-01-11 | Nokia Corporation | Supporting a concatenative text-to-speech synthesis |
| US8471812B2 (en) * | 2005-09-23 | 2013-06-25 | Jesse C. Bunch | Pointing and identification device |
| US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
| US20070083367A1 (en) * | 2005-10-11 | 2007-04-12 | Motorola, Inc. | Method and system for bandwidth efficient and enhanced concatenative synthesis based communication |
| US7881657B2 (en) * | 2006-10-03 | 2011-02-01 | Shazam Entertainment, Ltd. | Method for high-throughput identification of distributed broadcast content |
| TWI330795B (en) * | 2006-11-17 | 2010-09-21 | Via Tech Inc | Playing systems and methods with integrated music, lyrics and song information |
| WO2008064697A1 (en) * | 2006-11-29 | 2008-06-05 | Loquendo S.P.A. | Multicodebook source -dependent coding and decoding |
| US7949649B2 (en) * | 2007-04-10 | 2011-05-24 | The Echo Nest Corporation | Automatically acquiring acoustic and cultural information about music |
| KR100945245B1 (ko) * | 2007-08-10 | 2010-03-03 | 한국전자통신연구원 | 안전하고 효율적인 음성 패킷 부분 암호화 방법 및 장치 |
| JP5141688B2 (ja) * | 2007-09-06 | 2013-02-13 | 富士通株式会社 | 音信号生成方法、音信号生成装置及びコンピュータプログラム |
| EP2215797A1 (en) * | 2007-12-03 | 2010-08-11 | Nokia Corporation | A packet generator |
| KR20100089772A (ko) * | 2009-02-03 | 2010-08-12 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
| US8886206B2 (en) * | 2009-05-01 | 2014-11-11 | Digimarc Corporation | Methods and systems for content processing |
| US8805854B2 (en) * | 2009-06-23 | 2014-08-12 | Gracenote, Inc. | Methods and apparatus for determining a mood profile associated with media data |
| US20110041154A1 (en) * | 2009-08-14 | 2011-02-17 | All Media Guide, Llc | Content Recognition and Synchronization on a Television or Consumer Electronics Device |
| EP2475116A4 (en) * | 2009-09-01 | 2013-11-06 | Panasonic Corp | DIGITAL BROADCASTING DEVICE, DIGITAL BROADCASTING DEVICE AND DIGITAL BROADCASTING SYSTEM |
| US8831760B2 (en) * | 2009-10-01 | 2014-09-09 | (CRIM) Centre de Recherche Informatique de Montreal | Content based audio copy detection |
| US9123334B2 (en) * | 2009-12-14 | 2015-09-01 | Panasonic Intellectual Property Management Co., Ltd. | Vector quantization of algebraic codebook with high-pass characteristic for polarity selection |
| US20110173185A1 (en) * | 2010-01-13 | 2011-07-14 | Rovi Technologies Corporation | Multi-stage lookup for rolling audio recognition |
| US9047516B2 (en) * | 2010-06-18 | 2015-06-02 | Verizon Patent And Licensing Inc. | Content fingerprinting |
| CA2799343C (en) * | 2011-02-14 | 2016-06-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
| US20120239690A1 (en) * | 2011-03-16 | 2012-09-20 | Rovi Technologies Corporation | Utilizing time-localized metadata |
| US8726357B2 (en) * | 2011-07-01 | 2014-05-13 | Google Inc. | System and method for tracking network traffic of users in a research panel |
| US20130065213A1 (en) * | 2011-09-13 | 2013-03-14 | Harman International Industries, Incorporated | System and method for adapting audio content for karaoke presentations |
| MX2014003610A (es) * | 2011-09-26 | 2014-11-26 | Sirius Xm Radio Inc | Sistema y metodo para incrementar la eficiencia del ancho de banda de transmision ("ebt2"). |
| PL3579228T3 (pl) * | 2012-11-15 | 2025-06-02 | Ntt Docomo, Inc. | Urządzenie kodujące audio |
| US20140188592A1 (en) * | 2012-12-27 | 2014-07-03 | Magix Ag | Content recognition based evaluation system in a mobile environment |
| US9128593B2 (en) * | 2013-04-28 | 2015-09-08 | Tencent Technology (Shenzhen) Company Limited | Enabling an interactive program associated with a live broadcast on a mobile device |
| US20140336797A1 (en) * | 2013-05-12 | 2014-11-13 | Harry E. Emerson, III | Audio content monitoring and identification of broadcast radio stations |
| US9390727B2 (en) * | 2014-01-13 | 2016-07-12 | Facebook, Inc. | Detecting distorted audio signals based on audio fingerprinting |
| US9854439B2 (en) * | 2014-02-07 | 2017-12-26 | First Principles, Inc. | Device and method for authenticating a user of a voice user interface and selectively managing incoming communications |
-
2012
- 2012-09-26 MX MX2014003610A patent/MX2014003610A/es unknown
- 2012-09-26 CA CA3111501A patent/CA3111501C/en active Active
- 2012-09-26 CA CA2849974A patent/CA2849974C/en active Active
- 2012-09-26 WO PCT/US2012/057396 patent/WO2013049256A1/en not_active Ceased
-
2014
- 2014-03-26 US US14/226,788 patent/US9767812B2/en active Active
-
2017
- 2017-09-15 US US15/706,079 patent/US10096326B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CA3111501A1 (en) | 2013-04-04 |
| CA3111501C (en) | 2023-09-19 |
| US10096326B2 (en) | 2018-10-09 |
| US20140297292A1 (en) | 2014-10-02 |
| CA2849974A1 (en) | 2013-04-04 |
| CA2849974C (en) | 2021-04-13 |
| US9767812B2 (en) | 2017-09-19 |
| US20180068665A1 (en) | 2018-03-08 |
| WO2013049256A1 (en) | 2013-04-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101228165B1 (ko) | 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체 | |
| US6108626A (en) | Object oriented audio coding | |
| US10366694B2 (en) | Systems and methods for implementing efficient cross-fading between compressed audio streams | |
| KR101171098B1 (ko) | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 | |
| US8145498B2 (en) | Device and method for generating a coded multi-channel signal and device and method for decoding a coded multi-channel signal | |
| Hwang | Multimedia networking: From theory to practice | |
| US10096326B2 (en) | System and method for increasing transmission bandwidth efficiency (“EBT2”) | |
| EP1446797B1 (en) | Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth | |
| JP4445328B2 (ja) | 音声・楽音復号化装置および音声・楽音復号化方法 | |
| CN101652810A (zh) | 用于处理混合信号的装置及其方法 | |
| KR20070001139A (ko) | 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 | |
| BRPI0611430A2 (pt) | codificador, decodificador e seus métodos | |
| JP5400880B2 (ja) | 符号化方法、復号方法、それらの方法を用いた装置、プログラム、記録媒体 | |
| Standard | Digital radio mondiale (drm); system specification | |
| US11961538B2 (en) | Systems and methods for implementing efficient cross-fading between compressed audio streams | |
| Argenti et al. | Audio decoding with frequency and complexity scalability | |
| KR101383915B1 (ko) | 통합 음원 디코더를 구비한 디지털 오디오 수신기 | |
| Nayebi et al. | Analysis of the self-excited subband coder: a new approach to medium band speech coding | |
| KR101512842B1 (ko) | 디지털 오디오 전송시스템 | |
| Standard | Final draft ETSI ES 201 980 V1. 2.1 (2002-07) | |
| Sandler et al. | Audio coding for mobile multimedia communications | |
| Standard | Final draft ETSI ES 201 980 V2. 1.1 (2004-04) | |
| Standard | Final draft ETSI ES 201 980 V2. 2.1 (2005-08) | |
| Standard | Final draft ETSI ES 201 980 V3. 1.1 (2009-06) |