[go: up one dir, main page]

MX2008016354A - Deteccion de una maquina contestadora utilizando reconocimiento de dialogo. - Google Patents

Deteccion de una maquina contestadora utilizando reconocimiento de dialogo.

Info

Publication number
MX2008016354A
MX2008016354A MX2008016354A MX2008016354A MX2008016354A MX 2008016354 A MX2008016354 A MX 2008016354A MX 2008016354 A MX2008016354 A MX 2008016354A MX 2008016354 A MX2008016354 A MX 2008016354A MX 2008016354 A MX2008016354 A MX 2008016354A
Authority
MX
Mexico
Prior art keywords
answering machine
processing
call receiver
dialogue
indicative
Prior art date
Application number
MX2008016354A
Other languages
English (en)
Inventor
Alejandro Acero
Craig M Fisher
Dong Yu
Ye-Yi Wang
Yu-Cheng Ju
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of MX2008016354A publication Critical patent/MX2008016354A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5158Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with automated outdialling systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/20Aspects of automatic or semi-automatic exchanges related to features of supplementary services
    • H04M2203/2027Live party detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

Se utiliza un módulo de detección de máquina contestadora para determinar si un receptor de llamada es una persona real o una máquina contestadora. El módulo de detección de máquina contestadora incluye un reconocedor de diálogo y un módulo de análisis de llamada. El reconocedor de diálogo recibe una respuesta audible del receptor de llamada para una llamada El reconocedor de diálogo procesa la respuesta audible y proporciona una salida indicativa de diálogo reconocido. El módulo de análisis de llamada procesa la salida del reconocedor de diálogo para generar una salida indicativa de si el receptor de llamada es una persona o una máquina contestadora.

Description

DETECCION DE UNA MAQUINA CONTESTADORA UTILIZANDO RECONOCIMIENTO DE DIALOGO ANTECEDENTES La discusión posterior simplemente se proporciona para información de antecedentes general y no pretende utilizarse como un auxiliar para determinar el alcance del tema reclamado. El uso de los sistemas de llamada de teléfono de salida automatizados es muy común. Además de utilizarse para propósitos de mercadeo, tales sistemas también pueden utilizarse por consultorios o clínicas para contactar a pacientes para confirmar o cambiar citas, por escuelas para informar a los estudiantes de cambios de horario, por beneficencias para obtener contribuciones, y agencias gubernamentales para proporcionar notificación u otra información, por nombrar algunas otras aplicaciones. En muchos casos, puede ser necesario o útil valorar automáticamente si el receptor de la llamada telefónica es una persona real o una máquina contestadora. Dependiendo si una persona real respondió o una máquina contestadora está en uso, pueden tomarse diferentes acciones por el sistema de llamada telefónica de salida. Sin embargo, esta tarea, análisis de llamada, es difícil y actualmente inexacto. El análisis de llamada se realiza comúnmente a nivel de interruptor de hardware. El análisis se implementa utilizando un intervalo corto cuando el receptor ¡nicialmente toma la llamada y antes que la llamada se conecte a la aplicación de telefonía. Durante este intervalo, cuando el receptor comienza a hablar, el sistema procesará las señales audibles recibidas en cuanto a, por ejemplo contenido de energía, fuerza u otros parámetros de señal de las señales audibles, con el fin de hacer una determinación en cuanto a si el receptor es una persona real o máquina contestadora. Es importante entender que la aplicación de telefonía incluso no sabe que la llamada se tomó en este paso, y por lo tanto, no entregó ningún impulso inicial. De esa forma, en el otro extremo de la línea, aunque el receptor respondió a la llamada y se le da una bienvenida tal como "Hola", el receptor sólo escucha silencio a cambio de que el sistema realiza análisis de llamada. En muchos casos, el receptor entonces simplemente colgará.
BREVE DESCRIPCION DE LA INVENCION La breve descripción y resumen se proporcionan para introducir una selección de conceptos en una forma simplificada que además se describe posteriormente en la Descripción detallada. La breve descripción y el Resumen no pretenden identificar características clave o características esenciales del tema reclamado, no pretenden utilizarse como un auxiliar al determinar el alcance del tema reclamado. Además, el tema reclamado no se limita a implementaciones que resuelven cualquiera o todas las ventajas notadas en los antecedentes. Un módulo de detección de máquina contestadora se utiliza para determinar si un receptor de llamada es una persona real o una máquina contestadora. El módulo de detección de máquina contestadora incluye un reconocedor de diálogo y un módulo de análisis. El reconocedor de diálogo recibe una respuesta audible del receptor de llamada a una llamada. El reconocedor de diálogo procesa la respuesta audible y proporciona una salida indicativa de diálogo reconocido. El módulo de análisis de llamada procesa la salida del reconocedor de diálogo para generar una salida indicativa de si el receptor de llamada es una persona o una máquina contestadora. En una modalidad, el módulo de análisis de llamada puede incluir un módulo de clasificador que proporciona análisis estadístico de la salida del reconocedor de diálogo para determinar si el receptor de llamada es una persona real o una máquina contestadora. También se describe una técnica para asegurar que el mensaje completo de la persona que llama se registra por la máquina contestadora. En particular, un reconocedor de diálogo opera para detectar eventos de interferencia por la máquina contestadora, y en donde el mensaje se responde a la máquina contestadora si se detecta un evento de interferencia. Aunque esto puede causar que el mensaje se responda a uno o más artículos, es particularmente ventajoso ya que el evento de interferencia significa que la bienvenida de la máquina contestadora no ha terminado, y de esa forma la máquina contestadora no está lista para grabar un mensaje. Al responder al mensaje después de cada evento de interferencia, al reproducir el mensaje después que se asegura el último evento de interferencia el mensaje completo se grabará cuando la máquina contestadora está lista para grabar el mensaje.
BREVE DESCRIPCION DE LOS DIBUJOS La Figura 1 es una representación de diagrama de bloques esquemática de un sistema de marcación. La Figura 2 es una representación de diagrama de bloques esquemático de componentes del sistema de marcación mostrado en la Figura 1. La Figura 3 es un diagrama de bloques esquemático para procesar una llamada. La Figura 4 es un cuadro de flujo para procesar una llamada. La Figura 5 es un cuadro de flujo más detallado para procesar la llamada. La Figura 6 es un ambiente de cómputo ilustrativo.
DESCRIPCION DETALLADA Las Figuras 1 y 2 son diagramas de bloques esquemáticos de una llamada de salida o sistema de marcación. El sistema 100 se implementa ilustrativamente dentro de uno de los ambientes de cómputo discutidos en asociación con la Figura 6 discutidos posteriormente, o dentro de otros ambientes de cómputo adecuados. Como se ilustra en la Figura 1, el sistema de llamada de salida 100 coloca llamadas a cualquiera de uno o una pluralidad de receptores de llamada 102 (receptores de llamada 102-1 a 102-M se ilustran). Como se utiliza aquí, un "receptor de llamada" puede ser una persona real o una máquina contestadora. Después de colocar una llamada para uno de los receptores de llamada 102-1 a 102-M, el sistema de llamada de salida 100 valora si el receptor de llamada es una persona real o si una máquina contestadora está en uso. La Figura 2 ilustra en mayor detalle componentes o módulos de sistema de llamada de salida 100 de acuerdo con una modalidad ilustrativa. Cómo se ilustra, el sistema de llamada de salida 100 hace llamadas a uno o más receptores de llamadas 102. Un módulo de detección de máquina contestadora 106 se utiliza para determinar si el receptor de llamada 102 es una persona real o una máquina contestadora. En una aplicación típica, el módulo de aplicación 104 inicia la marcación de un número de teléfono de receptor de llamada recuperado de, por ejemplo, una base de datos de números telefónicos 108. El módulo de detección de máquina contestadora 106 entonces se utiliza para valorar si el receptor de llamada 102 es una persona real en la máquina contestadora. Diferentes acciones se tomarán por el sistema de llamada de salida 100 de acuerdo con la salida del módulo de teledetección 106. Por ejemplo, si el receptor de llamada es una persona real, el módulo de aplicación 104 entonces puede transferir la llamada a un operador 110, o acoplar el receptor en una conversación automática. De otra forma, el módulo de aplicación 104 puede utilizarse para dejar un mensaje en la máquina contestadora del receptor de llamada 102. En la Figura 2, los receptores de llamada 102, base de datos de número telefónico 108 y operador 110 se muestran en líneas punteadas para ilustrar que por sí mismas no son parte de, o necesariamente necesarias en el sistema de llamada de salida 100. Además, el diagrama de bloques del sistema de llamada de salida 100 es esquemático para propósitos de detenimiento y con el fin de proporcionar una relación ilustrativa entre el módulo de detección de máquina contestadora 106 y sus componentes, así como otros componentes del sistema de llamada de salida 100. Se debe entender que es sólo una modalidad ilustrativa en donde uno o más componentes del sistema de llamada de salida 100 y el módulo de detección de máquina contestadora 106 puede omitirse y/o combinarse en otras configuraciones incluso en otras modalidades. En la modalidad ilustrada, el módulo de detección de máquina contestadora 106 incluye un reconocedor de diálogo 120 y un módulo de análisis de llamada 122. Las Figuras 3 y 4 son un diagrama esquemático y cuadro de flujo de un método 200, respectivamente, que ilustra operación de estos módulos. En el paso 202, el reconocedor de diálogo 120 recibe la respuesta audible 124 del receptor de llamada 102 hacia la llamada colocada por el sistema de llamada de salida 100. El reconocedor de diálogo 120 procesa la respuesta audible 124 y proporciona una salida 126 indicativa del diálogo reconocido, y en una modalidad frases, comúnmente en la forma de datos textuales. Como se utiliza aquí una frase es una pluralidad de palabras en contexto como se proporcionó por el receptor de llamada. En el paso 204, la salida 126 del reconocedor de diálogo 120 se proporciona como entrada al módulo de análisis de llamada 122. El módulo de análisis de llamada 122 procesa la salida 126 del reconocedor de diálogo 120 para generar una salida 128 indicativa de si el receptor de llamada es una persona o una máquina contestadora. El módulo de análisis de llamada 122 puede incluir un módulo de clasificador 123 que proporciona análisis estadístico del contenido de la frase(s) en la salida 126. El reconocedor de diálogo 120 y el módulo de clasificador 123 son módulos bien conocidos y pueden ¡mplementarse al utilizar una variedad de técnicas bien conocidas. Sin embargo, se debe notar que un módulo de lenguaje 130 (por ejemplo N-gramo, gramática libre contexto, híbrido, etc.) utilizado por el reconocedor de diálogo 120 y un modelo de clasificador 132 ambos se entrenan típicamente sólo en frases o bienvenidas utilizadas por personas reales y máquinas contestadoras cuando responden a una llamada. Por ejemplo, una persona puede responder a una llamada telefónica con la bienvenida "Hola", "¿en qué le puedo ayudar?", "soy Steve" o puede ser sólo su nombre. En contraste, una máquina contestadora puede tener la bienvenida "esta es mi máquina contestadora. No está disponible por el momento.
Favor de dejar un mensaje", o simplemente "favor de dejar un mensaje". Sin embargo, en detección de máquina de respuesta basada en contenido, puede ser necesario reconocer frases importantes tal como "no disponible en este momento" o "deje un mensaje". De forma similar, en el caso de pasar un sistema de pantalla de teléfono en la ubicación de recepción, puede ser necesario reconocer frases como "oprima 2". Para alta exactitud de reconocimiento en frases tal como éstas, el modelo de lenguaje 130 puede entrenarse con las frases importantes y en donde el modelo puede suavizarse con un modelo de relleno de n-gramo capturar las palabras no cubiertas en las frases importantes. Un ejemplo de un modelo de relleno de n-gramo se describe por D. Yu, Y. -C. Ju, Y. Wang y A. Acero en "Modelo de Relleno basado en N-Gramo para creación de gramática voluminosa", publicada en Precedentes de la Conferencia Internacional de Acústica, Diálogo, y Procesamiento de Señal, Mayo 2006. Al utilizar un número suficiente de ejemplos (ya sea ejemplos genéricos o ejemplos específicos de aplicación) tanto el modelo de lenguaje 130 como el modelo de clasificador 132 pueden entrenarse adecuadamente. Con respecto al módulo de análisis de llamada 122 y paso 204, las características sin palabras 136 también pueden utilizarse para análisis además de o en alternativa a la salida 126 del reconocedor de diálogo 120. Ejemplos de características sin palabras 136 incluyen pero no se limitan hacia el receptor de llamada 102 se "interfiere" (es decir, interrumpen un impulso que se presenta cuando la aplicación 104 ejecuta un diálogo), la duración de la respuesta audible hecha por el receptor de llamada 102 en la contestación a la llamada, y si el reconocedor diálogo 120 fue capaz o no de reconocer la respuesta audible 124 como una frase válida. En la Figura 3, las características sin palabras 136 se producen de un generador de características sin palabras 128, que puede recibir y procesar respuesta audible 124 u otra información de entrada 138 que pertenece a la llamada del sistema de llamada de salida 100. En la Figura 4, el receptor de las características sin palabras 136 se indica en el paso 203. En este punto, se debe también notar que no hay requerimiento que el reconocedor de diálogo 120 sea capaz de reconocer la respuesta audible completa 124, en lugar de esto, debido al ambiente ruidoso en el receptor de llamada 102, el ruido en una bienvenida grabada o ruido del sistema telefónico, y la naturaleza de la respuesta, sólo una o más porciones de la respuesta audible 124 puede ser reconocible, y de esa forma, utilizarse para valorar si el receptor de llamada 102 es una persona real o máquina contestadora. La Figura 5 es un cuadro de flujo que ilustra un método ilustrativo 300 realizado por el módulo de análisis de llamada 122 en el paso de ejecución 204 en la Figura 3. El paso 302 representa el inicio del reconocimiento de diálogo después que se hizo la llamada. Una primera característica sin palabras que opcionalmente puede utilizarse para valorar si el receptor es una persona real o máquina contestadora es si el silencio se presenta inicialmente una vez que se tomó la llamada. En particular, se ha encontrado que una persona real puede esperar, por ejemplo, uno o dos segundos, antes de comenzar a hablar. De esa forma, si en el paso 304 se determina silencio significativo que está presente después que se tomó la llamada, por ejemplo como medido por un cronómetro que excede un tiempo seleccionado del paso 302, puede hacerse una determinación que el receptor de llamada 102 es una persona real. Si por otro lado no está presente el silencio significativo después que se tomó la llamada en el paso 302, o el paso 302 no está presente, la duración de la respuesta audible puede utilizarse para determinar si el receptor de llamada es o no una persona real. Los pasos 306 y 308 ilustran el procesamiento de la característica sin palabras que comprende la duración de la respuesta audible. En el paso 306, si la duración de la respuesta audible es muy corta (por ejemplo, aproximadamente menos de 1 segundo), es más probable que una persona real fue quien respondió la llamada. En contraste, si la duración de la respuesta audible es muy larga (por ejemplo, aproximadamente cuatro o más segundos) cómo se ilustró por el paso 308, el receptor de la llamada probablemente es una máquina contestadora. Se debe notar que el orden en el cual se ilustran los pasos 306 y 308 no es necesario en cuanto a que estos pasos pueden invertirse. De forma similar los períodos de tiempo especificados pueden ajustarse. Si no se hizo una determinación si el receptor de llamada es una persona real o máquina contestadora previo al paso 308, el flujo de proceso continúa al paso 310 por lo cual de nuevo puede utilizarse la duración de la respuesta audible. En particular, en el paso 310 la duración de la respuesta audible se mide para determinar si es relativamente corta, por ejemplo, dos o tres segundos. El resultado de este paso se combina con información relacionada con el contexto de la respuesta audible como se reconoció por el reconocedor de diálogo 120 tal como se obtuvo del módulo de clasificador 123. En otras palabras, el módulo de clasificador 123 analiza la salida 126 del reconocedor de diálogo 120 para determinar si una o más frases son estadísticamente consistentes con frases utilizadas por una persona real o frases utilizadas por una máquina contestadora. En la Figura 5, la información del módulo clasificador 123 se representa en los pasos 312 y 314. En particular, si en el paso 312 la información de módulo clasificador 123 indica que las frases en la respuesta audible son muy probables (alta confianza) de una persona real, la salida 128 dei módulo de análisis de llamada 122 indicará que el receptor de llamada 102 es una persona real. En contraste, si en el paso 312 no hay alta confianza del receptor de llamada para ser una persona real, la salida del módulo de análisis de llamada 122 puede indicar que el receptor de llamada 102 es una máquina contestadora. Similarmente, en el paso 314, si la información del módulo de clasificador 123 indica que las frases en la respuesta audible son muy probablemente de una máquina contestadora, la salida del módulo de análisis de llamada 122 puede indicar que el receptor de llamada es una máquina contestadora, mientras si la alta confianza que el receptor de llamada está en una máquina contestadora no está presente, la salida del módulo de análisis de llamada 122 indicará que el receptor de llamada 102 es una persona real. Se debe notar que en este ejemplo existe una tendencia a error en el lado de clasificar mal un receptor de llamada como una persona real en lugar de cómo una máquina contestadora. Si se desea, la tendencia puede dirigir la clasificación del receptor de llamada como una máquina contestadora, o no tener tendencia del todo de acuerdo con los costos asociados con diferentes errores. Favor de notar que el clasificador estadístico descrito anteriormente sólo es un ejemplo ilustrativo. El módulo de análisis de llamada 122 puede utilizar muchos otros clasificadores, tal como clasificadores de entropía máxima. Además, el módulo de análisis de llamada 122 también puede utilizar máquinas de vector de soporte, componentes que utilizan árboles de decisión, y redes neurales artificíales para lograr exactitud comparable. En el ejemplo de la Figura 5, características sin palabras tal como presencia de silencio después que se tomó la llamada por el receptor y la duración de la respuesta audible en donde se utilizó previo a la clasificación real del contenido de la respuesta audible con el fin de valorar si el receptor de llamada es una persona real o máquina contestadora. De nuevo, otras características sin palabras tal como si la interferencia de receptor o si el reconocedor de diálogo 120 fue capaz de reconocer la respuesta audible también puede utilizarse. Además, un clasificador puede entrenarse basándose en la característica(s) sin palabras y utilizarse con el clasificador 123 proporcionando una salida basándose en frases reconocidas de la respuesta audible para proporcionar una indicación si el receptor de llamada es una persona real o máquina contestadora. De forma similar, un clasificador individual puede entrenarse basándose en la característica(s) sin palabras y las frases de reconocimiento de la respuesta audible para proporcionar una indicación si el receptor de llamada es una persona real o máquina contestadora. En algunas aplicaciones, puede ser necesario reproducir un mensaje para el receptor de llamada, por ejemplo, si se determinó que el receptor de llamada es una máquina contestadora. Aunque las máquinas contestadoras proporcionan un tono o silencio que significa que la bienvenida terminó y que ahora debe dejarse un mensaje, el reconocimiento de este tono es difícil. En muchos casos ya que el tono o silencio puede no reconocerse de forma exacta, al menos parte del mensaje puede reproducirse durante la bienvenida, de esa forma, la porción de inicio del mensaje puede no grabarse. Un paso opcional 206 ilustrado en la Figura 4 que comprende también otro aspecto aquí descrito proporciona medios y una técnica para asegurar que el mensaje completo se grabó por la máquina contestadora o, si se desea, se escuchó por la persona real. En particular, el mensaje se vuelve a reproducir con el reconocedor de diálogo 120 encendido y "interferencia" habilitada (para detectar el término de la bienvenida) hasta que se completó el mensaje. Por ejemplo, se asume que una máquina contestadora proporciona la bienvenida "Está en contacto con... Eric Moe... Favor de dejar un mensaje", en donde representa silencio durante la bienvenida.
En muchos sistemas actuales, el mensaje puede reproducirse con la eliminación de uno de estos periodos de silencio, con lo cual el mensaje entonces puede reproducirse pero no grabarse ya que la máquina contestadora no alcanzó el fin de la bienvenida. Al utilizar la técnica aquí descrita, el reconocedor de diálogo 120 con interferencia habilitada detectará cada porción de la bienvenida y causará que el mensaje inicié de nuevo. Una vez que la bienvenida alcanzó definitivamente su fin, el mensaje se reproduce pero ahora esta vez hasta su término para asegurar que mensaje se escuchó o grabó en su totalidad. La Figura 6 ilustra un ejemplo de un ambiente de sistema de computo adecuado 400 en el cual los conceptos aquí descritos pueden implementarse un en particular, una forma del ambiente de sistema de cómputo 400 puede utilizarse por el sistema de llamada de salida 100 ó porciones del mismo. Sin embargo, el ambiente sistema de cómputo 400 de nuevo solamente es un ejemplo de un ambiente de cómputo adecuado para cada uno de estos componentes y no pretende sugerir ninguna limitación al alcance de uso o funcionalidad de la descripción posterior. El ambiente de cómputo 400 tampoco debe interpretarse como teniendo ninguna dependencia o requerimiento que se relaciona con cualquier o combinaciones de los componentes ilustrados en el ambiente operativo ilustrativo 400.
Además de los ejemplos aquí proporcionados, otros sistemas de cómputo bien conocidos, ambientes, y/o configuraciones pueden ser adecuados para uso con conceptos aquí descritos. Tales sistemas incluyen, pero no se limitan a, computadoras personales, computadoras de servidor, dispositivos móviles o portátiles, sistemas de multiprocesador, sistemas a base de microprocesador, caja de tv por cable, electrónica de consumidor programable, PCs de red, minicomputadoras, macrocomputadoras, ambientes de cómputo distribuidos que incluyen cualquiera de los sistemas o dispositivos anteriores, y similares. Los conceptos aquí descritos pueden representarse en el contexto general de instrucciones ejecutables por computadora, tal como módulos de programa, que se ejecutan por una computadora. Generalmente, los módulos de programa incluyen rutinas, programas, objetos, componentes, estructuras de datos, etc. que realizan tareas particulares o implementan tipos de datos abstractos particulares. Aquellos expertos en la técnica pueden implementar la descripción y/o figuras aquí como instrucciones ejecutables por computadora, que pueden representarse en cualquier forma de medios legibles por computadora discutido anteriormente. Los conceptos aquí descritos también pueden practicarse en ambientes de cómputo distribuidos en donde las tareas se realizan por dispositivos de procesamiento remoto que se enlazan a través de una red de comunicaciones. En un ambiente de cómputo distribuido, los módulos de programa pueden localizarse tantos medios de almacenamiento por computadora locales como remotos que incluyen dispositi os de almacenamiento de memoria. Con referencia a la Figura 6, un sistema ilustrativo incluye un dispositivo de cómputo de propósito general en la forma de una computadora 410. Los componentes de la computadora 410 pueden incluir, pero no se limitan a, una unidad de procesamiento 420, una memoria de sistema 430, y un conductor común de sistema 421 que acopla varios componentes de sistema que incluye una memoria de sistema a la unidad de procesamiento 420. El conductor común de sistema 421 puede ser cualquiera de varios tipos de estructuras de conductor común que incluyen un conductor común de memoria o controlador de memoria, conductor común periférico, y un conductor común local que utiliza cualquiera de una variedad de arquitecturas de conductor común. A manera de ejemplo, y no de limitación, tales arquitecturas incluyen conductor común de Arquitecturas de Estándar de Industria (ISA), conductor común de Arquitectura de Microcanal (MCA), conductor común de IESA Mejorado (EISA), conductor común local de Asociación de Estándares Electrónicos de Video (VESA), y conductor común de Interconexión de Componente Periférico (PCI) también conocido como conductor común de Mezzanine. La computadora 410 típicamente incluye una variedad de medios legibles por computadora. Los medios legibles por computadora puede ser cualquier medio disponible que puede accederse por la computadora 410 e incluyen tanto medios volátiles como no volátiles, medios removible y no removibles. A manera de ejemplo, y no de limitación, los medios legibles por computadora pueden comprender medios de almacenamiento por computadora. Los medios de almacenamiento por computadora incluyen medios volátiles y no volátiles, removibles y no removibles implementados en cualquier método o tecnología para almacenamiento de información tal como instrucciones legibles por computadora, estructuras de datos, módulos de programa u otros datos. Los medios de almacenamiento por computadora incluyen, pero no se limitan a, RAM, RAM, EEPROM, memoria flash u otra tecnología de memoria, CD-ROM, discos versátiles digitales (DVD) u otro almacenamiento de disco óptico, casetes magnéticos, cinta magnética, almacenamiento de disco magnético u otros dispositivos de almacenamiento magnético, o cualquier otro medio que puede utilizarse para almacenar la información deseada y que puede accederse por la computadora 400. La memoria del sistema 430 incluye medios de almacenamiento por computadora en la forma de memoria volátil y/o no volátil tal como memoria de sólo lectura (ROM) 431 y memoria de acceso aleatorio (RAM) 432. Un sistema de entrada/salida básico 433 (BIOS), que contiene las rutinas básicas que ayudan a transferir información entre elementos dentro de la computadora 410, tal como durante el arranque, típicamente se almacena en ROM 431. La RAM 432 típicamente contiene datos y/o módulos de programa que son inmediatamente accesibles y/o actualmente están siendo operados por la unidad de procesamiento 420. A manera de ejemplo, y no de limitación. La Figura 6 ilustra el sistema operativo 434, programas de aplicación 435, otros módulos de programa 436, y datos de programa 437. Aquí, los programas de aplicación 435, módulos de programa 436 y datos de programa 437 implementan uno o más de los conceptos descritos anteriormente. La computadora 410 también puede incluir otros medios de almacenamiento por computadora removibles/no removibles volátiles/no volátiles. A manera de ejemplo solamente, la Figura 6 ilustra una unidad de disco duro 441 que lee de o escribe a medios magnéticos no removibles, no volátiles, una unidad de disco magnético 451 que lee de o escribe a un disco magnético removible, no volátil 452, y una unidad de disco óptico 455 que lee de o escribe a un disco óptico removible, no volátil 456 tal como un CD-ROM u otros medios ópticos. Otros medios de almacenamiento por computadora removible/no removibles, volátiles/no volátiles que pueden utilizarse en el ambiente operativo ilustrativo incluyen, pero no se limitan a, casetes de cinta magnética, tarjetas de memoria flash, discos versátiles digitales, cinta de video digital, RAM de estado sólido, ROM de estado sólido, y similares. La unidad de disco duro 441 típicamente se conecta al conductor común de sistema 421 a través de una interfase de memoria no removible tal como interfase 440, y unidad de disco magnético 451 y unidad de disco óptico 455 típicamente se conectan al conductor común de sistema 421 por una interfase de memoria removible, tal como interfase 450. Las unidades y sus medios almacenamiento por computadora asociados discutidos anteriormente e ilustrados en la Figura 6, proporcionan almacenamiento de instrucciones legibles por computadora, estructuras de datos, módulos de programa y otros datos para la computadora 410. En la Figura 6, por ejemplo, la unidad de disco duro 441 se ilustra como almacenando el sistema operativo 444, programas de aplicación 445, otros módulos de programa 446, y datos de programa 447. Se debe notar que estos componentes pueden ser los mismos que o diferentes al sistema operativo 434, programas de aplicación 435, otros módulos de programa 436, y datos de programa 437. El sistema operativo 444, programas de aplicación 445, otros módulos de programa 446, y datos de programa 447 aquí se les proporcionan números diferentes para ilustrar que, en un mínimo, son copias diferentes. Un usuario puede ingresar comandos e información en la computadora 410 a través de los dispositivos de entrada tal como un teclado 462, un micrófono 463, y un dispositivo de señalamiento 461, tal como un ratón, seguibola o almohadilla sensible al tacto. Estos y otros dispositivos de entrada frecuentemente se conectan a la unidad de procesamiento 420 a través de una interfase de entrada de usuario 460 que se acopla al conductor común de sistema, pero puede conectarse por otra interfase y estructuras de conductor común, tal como un puerto paralelo o un conductor común en serie universal (USB). Un monitor 491 u otro tipo de dispositivo de presentación también se conecta al conductor común de sistema 421 a través de una interfase, tal como una interfase de video 490. La computadora 410 puede operar en un ambiente en red que utiliza conexiones lógicas a una o más computadoras remotas, tal como computadora remota 480. La computadora remota 480 puede ser una computadora personal, un dispositivo móvil, un servidor, un educador, una PC de red, un dispositivo par u otro nodo de red común, y típicamente incluye muchos o todos los elementos descritos anteriormente relativos a la computadora 410. Las conexiones lógicas ilustradas en la Figura 6 incluyen una red de área local (LAN) 471 y una red de área ancha (WAN) 473, pero también pueden incluir otras redes. Tales ambientes en red comúnmente están ubicados en oficinas, pares de computadora extendidas en empresa, Intranets e Internet. Cuando se utiliza en un ambiente en red de LAN, la computadora 410 se conecta a la LAN 471 a través de una interfase de red o adaptador 470. Cuando se utiliza en un ambiente en red de WAN, la computadora 410 típicamente incluye un módem 472 u otros medios para establecer comunicaciones en la WAN 473, tal como Internet. El módem 472, que puede ser interno o externo, puede conectarse al conductor común de sistema 421 a través de la interfase de entrada de usuario 460, u otro mecanismo apropiado. En un ambiente en red, los módulos de programa ilustrados relativos a la computadora 410, o porciones de la misma, pueden almacenarse en el dispositivo de almacenamiento de memoria remota. A manera de ejemplo, y no de limitación, la Figura 6 ilustra programas de aplicación remota 485 como residentes en la computadora remota 480. Se apreciará que las conexiones en red mostradas son ilustrativas y pueden utilizarse otros medios para establecer un enlace de comunicaciones entre las computadoras. Se debe también notar que los conceptos aquí descritos pueden llevarse a cabo en un sistema de computadora tal como el descrito con respecto a la Figura 6. Sin embargo, otros sistemas adecuados incluyen un servidor, una computadora cierra el control de mensaje, o en un sistema distribuido en el cual diferentes porciones de los conceptos se llevan a cabo en diferentes partes del sistema de cómputo distribuido. Aunque el tema se describió en lenguaje específico a características estructurales y/o actos metodológicos, se debe entender que el tema definido en las reivindicaciones anexas no se limita a las características o actos específicos descritos anteriormente como puede sostenerse por la corte. Además, las características y actos específicos descritos anteriormente se describen como formas ilustrativas de implementar las reivindicaciones.

Claims (9)

REIVINDICACIONES
1. - Un método implementado por computadora (200) para valorar si un receptor de llamada es una persona real o una máquina contestadora, el método comprende: recibir (202) una respuesta audible de un receptor de llamada y procesar la respuesta audible con un reconocedor de diálogo para proporcionar una salida indicativa de diálogo reconocido; y procesar (204) la salida indicativa de diálogo reconocido con un clasificador para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora, el procesamiento basándose en un análisis estadístico de la salida indicativa del diálogo reconocido.
2. - El método implementado por computadora (200) de acuerdo con la reivindicación 1, en donde el procesamiento (204) incluye procesar la respuesta audible para valorar características sin palabras asociadas con la respuesta audible (304, 306, 308) y utilizar las características sin palabras como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora.
3. - El método implementado por computadora (200) de acuerdo con la reivindicación 2, en donde el procesamiento (204) incluye valorar una duración de la respuesta audible (306, 308) y utilizar la duración de la respuesta audible como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora.
4. - El método implementado por computadora (200) de acuerdo con la reivindicación 2, en donde el procesamiento (204) incluye valorar si el silencio está presente inicialmente en la respuesta audible (304) y utilizar la presencia de silencio como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora.
5. - El método implementado por computadora (200) de acuerdo con la reivindicación 4, en donde el procesamiento (204) incluye valorar si el silencio de un período relativo a una longitud seleccionada está presente inicialmente en la respuesta audible (304) y utilizar la presencia de silencio como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora. 6.- El método implementado por computadora (200) de acuerdo con la reivindicación 2, en donde el procesamiento (204) incluye utilizar una indicación sobre si el reconocedor de diálogo fue capaz de reconocer cualquier diálogo en la respuesta audible como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora. 7.- El método implementado por computadora (200) de acuerdo con la reivindicación 3, en donde el procesamiento (204) incluye utilizar análisis estadístico (312, 314) cuando la duración de la expresión está dentro de una escala seleccionada. 8.- El método implementado por la computadora (200) de acuerdo con la reivindicación 1, en donde el procesamiento (204) incluye utilizar análisis estadístico (312, 314) cuando una duración de la expresión está dentro de una escala seleccionada. 9. - Un medio legible por computadora que tiene instrucciones que cuándo se implementan por una computadora valoran si un receptor de llamada es una persona real o una máquina contestadora, las instrucciones comprenden: recibir (202) una respuesta audible de un receptor de llamada y procesar la respuesta audible con un reconocedor del diálogo para proporcionar una salida indicativa del diálogo reconocido; y procesar (204) la salida indicativa del diálogo reconocido para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora, el procesamiento basándose en análisis de frases de palabras en la salida indicativa del diálogo reconocido. 10. - El medio legible por computadora de acuerdo con la reivindicación 9, en donde el procesamiento (204) comprende procesar (312, 314) las frases de palabra con un clasificador estadístico y utilizar una salida del clasificador estadístico como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora. 11. - El medio legible por computadora de acuerdo con la reivindicación 9, en donde el procesamiento (204) incluye procesar la respuesta audible para valorar características sin palabras asociadas con la respuesta audible (304, 306, 308) y utilizar las características no presentes como una base para proporcionar una salida indicativa de si el receptor de Mamada es una persona real o una máquina contestadora. 12.- El medio legible por computadora de acuerdo con la reivindicación 9, en donde el procesamiento incluye valorar una duración de la respuesta audible (306, 308) y utilizar la duración de la respuesta audible como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora. 13.- El medio legible por computadora de acuerdo con la reivindicación 9, en donde el procesamiento incluye valorar si el silencio está presente inicialmente en la respuesta audible (304) y utilizar la presencia de silencio como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora. 14. - El medio legible por computadora de acuerdo con la reivindicación 13, en donde el procesamiento (204) incluye valorar si el silencio de un periodo relativo a la longitud seleccionada está presente inicialmente en la respuesta audible (304) y utilizar la presencia de silencio inicialmente como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora. 15. - El medio legible por computadora de acuerdo con la reivindicación 9, en donde el procesamiento (204) incluye utilizar una indicación sobre si el reconocedor de diálogo fue capaz de reconocer cualquier diálogo en la respuesta audible como una base para proporcionar una salida indicativa de si el receptor de llamada es una persona real o una máquina contestadora. 1
6. - El medio legible por computadora de acuerdo con la reivindicación 10, en donde el procesamiento (204) incluye utilizar análisis estadístico cuando la duración de la expresión está dentro de una escala seleccionada. 1
7. - El medio legible por computadora de acuerdo con la reivindicación 10 y que además comprende operar (206) el reconocedor de diálogo para detectar eventos de interferencia por el receptor de llamada y reproducir un mensaje para el receptor de llamada si se detecta un evento de interferencia hasta que el mensaje se reproduce en su totalidad. 1
8. - El medio legible por computadora de acuerdo con la reivindicación 17, en donde reproducir el mensaje al receptor de llamada (206) comprende reproducir el mensaje al receptor de llamada si el receptor de llamada es la máquina contestadora. 1
9. - Un método implementado por computadora para dejar un mensaje en una máquina contestadora, el método comprende: operar (206) un reconocedor de diálogo para detectar eventos de interferencia por la máquina contestadora; y reiniciar (406) un mensaje para la máquina contestadora si se detecta un evento de interferencia hasta que se reproduce el mensaje en su totalidad. 20.- El método implementado por computadora de acuerdo con la reivindicación 19 y que además comprende, previo al paso de reproducir el mensaje, detectar si un receptor de llamada es una persona real o la máquina contestadora en donde la detección comprende: recibir (202) una respuesta audible del receptor de llamada y procesar la respuesta audible con el reconocedor de diálogo para proporcionar una respuesta indicativa de diálogo reconocido; y procesar (204) la salida indicativa del diálogo reconocido para proporcionar una salida indicativa de si el receptor de llamada es una persona real o la máquina contestadora, el procesamiento basándose en análisis de frases de palabra en la salida indicativa del diálogo reconocido.
MX2008016354A 2006-07-12 2007-05-15 Deteccion de una maquina contestadora utilizando reconocimiento de dialogo. MX2008016354A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/485,011 US8065146B2 (en) 2006-07-12 2006-07-12 Detecting an answering machine using speech recognition
PCT/US2007/011567 WO2008008117A1 (en) 2006-07-12 2007-05-15 Detecting an answering machine using speech recognition

Publications (1)

Publication Number Publication Date
MX2008016354A true MX2008016354A (es) 2009-01-16

Family

ID=38923532

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2008016354A MX2008016354A (es) 2006-07-12 2007-05-15 Deteccion de una maquina contestadora utilizando reconocimiento de dialogo.

Country Status (12)

Country Link
US (1) US8065146B2 (es)
EP (1) EP2038877A4 (es)
JP (1) JP5124573B2 (es)
KR (1) KR20090033437A (es)
CN (1) CN101490741B (es)
BR (1) BRPI0714140A2 (es)
CA (1) CA2653536A1 (es)
MX (1) MX2008016354A (es)
NO (1) NO20085203L (es)
RU (1) RU2439716C2 (es)
TW (1) TW200810504A (es)
WO (1) WO2008008117A1 (es)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396713B2 (en) * 2007-04-30 2013-03-12 Nuance Communications, Inc. Method and system for using a statistical language model and an action classifier in parallel with grammar for better handling of out-of-grammar utterances
US8370148B2 (en) * 2008-04-14 2013-02-05 At&T Intellectual Property I, L.P. System and method for answering a communication notification
CN101662544B (zh) * 2008-08-26 2012-01-25 华为技术有限公司 一种外呼处理的方法、装置和系统
US8624875B2 (en) * 2009-08-24 2014-01-07 Semiconductor Energy Laboratory Co., Ltd. Method for driving touch panel
US8990071B2 (en) * 2010-03-29 2015-03-24 Microsoft Technology Licensing, Llc Telephony service interaction management
US20110313762A1 (en) * 2010-06-20 2011-12-22 International Business Machines Corporation Speech output with confidence indication
US8417223B1 (en) * 2010-08-24 2013-04-09 Google Inc. Advanced voicemail features without carrier voicemail support
US20120209590A1 (en) * 2011-02-16 2012-08-16 International Business Machines Corporation Translated sentence quality estimation
WO2012122568A1 (en) * 2011-03-10 2012-09-13 Ahmed Tewfik Bouzid Answering machine detection
CN103295585A (zh) * 2012-02-24 2013-09-11 北京英立讯科技有限公司 识别电话自动外呼是否真人应答的处理系统及方法
KR101909141B1 (ko) * 2012-07-27 2018-10-17 엘지전자 주식회사 전자기기 및 전자기기의 제어방법
CN103973872B (zh) * 2013-01-31 2016-12-28 联想(北京)有限公司 一种信息处理的方法及电子设备
GB2513924A (en) * 2013-05-10 2014-11-12 Noetica Ltd Live person detection in an automated calling system
US9495959B2 (en) * 2014-02-27 2016-11-15 Ford Global Technologies, Llc Disambiguation of dynamic commands
WO2015134954A1 (en) * 2014-03-07 2015-09-11 Dialogtech Inc. Phone fraud deterrence system for use with toll free and other fee generating numbers
US9953646B2 (en) 2014-09-02 2018-04-24 Belleau Technologies Method and system for dynamic speech recognition and tracking of prewritten script
RU2583150C1 (ru) * 2014-11-28 2016-05-10 Самсунг Электроникс Ко., Лтд. Голосовая связь на естественном языке между человеком и устройством
GB2533139A (en) * 2014-12-11 2016-06-15 Ultra Communications Ltd Telephone call processing
CN104601834B (zh) * 2014-12-19 2017-03-22 国家电网公司 多语种自动语音呼叫应答装置及其使用方法
US10277745B1 (en) 2017-05-30 2019-04-30 Noble Systems Corporation Answering machine detection for a contact center
US10530928B1 (en) 2017-03-15 2020-01-07 Noble Systems Corporation Answering machine detection (“AMD”) for a contact center by using AMD meta-data
US10148818B1 (en) 2017-03-15 2018-12-04 Noble Systems Corporation Using enhanced answering machine detection (“AMD”) to detect reassigned numbers
US10910105B2 (en) * 2017-05-31 2021-02-02 International Business Machines Corporation Monitoring the use of language of a patient for identifying potential speech and related neurological disorders
WO2019138651A1 (ja) * 2018-01-10 2019-07-18 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
KR102142338B1 (ko) * 2018-12-26 2020-08-07 주식회사 어플라이 인공지능 통신 장치 및 그 동작 방법
KR102636409B1 (ko) 2018-12-28 2024-02-15 삼성전자주식회사 전자 장치 및 그 제어 방법
EP3757991B1 (en) 2019-06-26 2025-01-08 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
JP7304627B2 (ja) * 2019-11-08 2023-07-07 株式会社ハロー 留守番電話判定装置、方法及びプログラム
US11501067B1 (en) * 2020-04-23 2022-11-15 Wells Fargo Bank, N.A. Systems and methods for screening data instances based on a target text of a target corpus
KR102494422B1 (ko) 2022-06-24 2023-02-06 주식회사 액션파워 Ars 음성이 포함된 오디오 데이터에서 발화 음성을 검출하는 방법

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4941168A (en) 1988-09-21 1990-07-10 U.S. Telecom International Inc. System for the recognition of automated telephone answering devices and delivery of prerecorded messages to such devices
US5581602A (en) * 1992-06-19 1996-12-03 Inventions, Inc. Non-offensive termination of a call detection of an answering machine
US5371787A (en) 1993-03-01 1994-12-06 Dialogic Corporation Machine answer detection
US5644624A (en) 1994-05-23 1997-07-01 Caldwell Communications Development, Inc. Automatic telephone call origination and retry system and method of operation
GB2293723B (en) 1994-09-28 1999-04-14 Rockwell International Corp Automatic call distributor with answer machine detection apparatus and method
US6233319B1 (en) 1997-12-30 2001-05-15 At&T Corp. Method and system for delivering messages to both live recipients and recording systems
US6324262B1 (en) 1998-03-26 2001-11-27 Market Ability, Inc. Method and system for automated delivery of nontruncated messages
US6161087A (en) * 1998-10-05 2000-12-12 Lernout & Hauspie Speech Products N.V. Speech-recognition-assisted selective suppression of silent and filled speech pauses during playback of an audio recording
US6574601B1 (en) * 1999-01-13 2003-06-03 Lucent Technologies Inc. Acoustic speech recognizer system and method
GB9930731D0 (en) * 1999-12-22 2000-02-16 Ibm Voice processing apparatus
US6999565B1 (en) * 2000-02-01 2006-02-14 Envoyworldwide, Inc. Multi-mode message routing and management
JP4167057B2 (ja) * 2000-09-01 2008-10-15 エリザ コーポレーション 発信電話呼出しの状況を決定するスピーチ認識方法およびシステム
US7054419B2 (en) 2001-01-02 2006-05-30 Soundbite Communications, Inc. Answering machine detection for voice message delivery method and system
US20030086541A1 (en) 2001-10-23 2003-05-08 Brown Michael Kenneth Call classifier using automatic speech recognition to separately process speech and tones
US7069221B2 (en) * 2001-10-26 2006-06-27 Speechworks International, Inc. Non-target barge-in detection
KR20030068693A (ko) * 2002-02-15 2003-08-25 남기식 음성인식을 이용한 자동응답 대응전화기
US6850602B1 (en) 2002-03-27 2005-02-01 Avaya Technology Corp. Method and apparatus for answering machine detection in automatic dialing
US7162421B1 (en) * 2002-05-06 2007-01-09 Nuance Communications Dynamic barge-in in a speech-responsive system
US7389230B1 (en) * 2003-04-22 2008-06-17 International Business Machines Corporation System and method for classification of voice signals
US20050013418A1 (en) * 2003-07-15 2005-01-20 Shye-Bin Chang Emergency notification systems
US7392188B2 (en) 2003-07-31 2008-06-24 Telefonaktiebolaget Lm Ericsson (Publ) System and method enabling acoustic barge-in
US7852993B2 (en) * 2003-08-11 2010-12-14 Microsoft Corporation Speech recognition enhanced caller identification
DE60303278T2 (de) 2003-11-27 2006-07-20 Alcatel Vorrichtung zur Verbesserung der Spracherkennung
US9117460B2 (en) 2004-05-12 2015-08-25 Core Wireless Licensing S.A.R.L. Detection of end of utterance in speech recognition system
US7184521B2 (en) 2004-06-10 2007-02-27 Par3 Communications, Inc. Method and system for identifying a party answering a telephone call based on simultaneous activity
JP3874196B2 (ja) 2004-08-16 2007-01-31 船井電機株式会社 インターホン装置
KR20060077505A (ko) 2004-12-30 2006-07-05 주식회사 한맥소프트웨어 이단계 예측 전화 연결 시스템
US20060235694A1 (en) * 2005-04-14 2006-10-19 International Business Machines Corporation Integrating conversational speech into Web browsers

Also Published As

Publication number Publication date
EP2038877A1 (en) 2009-03-25
CN101490741A (zh) 2009-07-22
JP2009543158A (ja) 2009-12-03
RU2009100152A (ru) 2010-07-20
US20080015846A1 (en) 2008-01-17
TW200810504A (en) 2008-02-16
BRPI0714140A2 (pt) 2012-12-25
WO2008008117A1 (en) 2008-01-17
US8065146B2 (en) 2011-11-22
JP5124573B2 (ja) 2013-01-23
KR20090033437A (ko) 2009-04-03
CA2653536A1 (en) 2008-01-17
EP2038877A4 (en) 2010-08-11
RU2439716C2 (ru) 2012-01-10
CN101490741B (zh) 2012-01-11
NO20085203L (no) 2008-12-12

Similar Documents

Publication Publication Date Title
MX2008016354A (es) Deteccion de una maquina contestadora utilizando reconocimiento de dialogo.
CN107910014B (zh) 回声消除的测试方法、装置及测试设备
US7437286B2 (en) Voice barge-in in telephony speech recognition
US9583108B2 (en) Voice detection for automated communication system
US9293133B2 (en) Improving voice communication over a network
CA2706046C (en) Method for determining the on-hold status in a call
US7716057B2 (en) Controlling the listening horizon of an automatic speech recognition system for use in handsfree conversational dialogue
CN101460995B (zh) 监测设备、评估数据选择设备、代理评估设备、代理评估系统
US8417524B2 (en) Analysis of the temporal evolution of emotions in an audio interaction in a service delivery environment
JP2004502985A (ja) 以後のオフライン音声認識のための音声情報を記録する記録装置
KR102535790B1 (ko) 보류 상태를 관리하기 위한 방법 및 장치
US20230317096A1 (en) Audio signal processing method and apparatus, electronic device, and storage medium
CN114999457A (zh) 语音系统的测试方法、装置、存储介质及电子设备
CN111326159A (zh) 一种语音识别方法、装置、系统
CN107680592A (zh) 一种移动终端语音识别方法、及移动终端及存储介质
US20130151248A1 (en) Apparatus, System, and Method For Distinguishing Voice in a Communication Stream
JPWO2017085815A1 (ja) 困惑状態判定装置、困惑状態判定方法、及びプログラム
JP4408665B2 (ja) 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム
CN113438440A (zh) 视频会议语音转换文字纪要方法和系统
WO2014152542A2 (en) Voice detection for automated communication system

Legal Events

Date Code Title Description
FA Abandonment or withdrawal