[go: up one dir, main page]

HK1262781B - Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program - Google Patents

Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program Download PDF

Info

Publication number
HK1262781B
HK1262781B HK19122912.9A HK19122912A HK1262781B HK 1262781 B HK1262781 B HK 1262781B HK 19122912 A HK19122912 A HK 19122912A HK 1262781 B HK1262781 B HK 1262781B
Authority
HK
Hong Kong
Prior art keywords
zero crossing
signal
information
value sequence
crossing value
Prior art date
Application number
HK19122912.9A
Other languages
German (de)
English (en)
Chinese (zh)
Other versions
HK1262781A1 (en
Inventor
Michael Kratz
Christian Uhle
Paul Klose
Timothy Leonard
Peter Prokein
Sebastian Scharrer
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Publication of HK1262781A1 publication Critical patent/HK1262781A1/en
Publication of HK1262781B publication Critical patent/HK1262781B/en

Links

Claims (19)

  1. Appareil (100; 200; 300) permettant de déterminer une information de similitude (122; 222; 332) sur base d'un ou plusieurs signaux d'entrée (112; 212; 312, 314) qui sont des signaux audio ou des signaux vidéo,
    dans lequel l'appareil est configuré pour déterminer une information de passage à zéro (114; 214; 322, 324) décrivant un nombre de passages à zéro dans une partie respective (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) pour une pluralité de parties de l'au moins un des un ou plusieurs signaux d'entrée, et
    dans lequel l'appareil est configuré pour effectuer une comparaison sur base de l'information de passage à zéro, pour déterminer l'information de similitude décrivant une similitude entre différents segments de signal d'un signal d'entrée unique ou entre différents segments de signal de deux signaux à comparer, où chacun des différents segments de signal comprend une pluralité de blocs de signaux;
    dans lequel l'appareil est configuré pour déterminer deux ou plusieurs valeurs représentatives par bloc de signaux pour la pluralité de blocs de signaux,
    dans lequel les deux ou plusieurs valeurs représentatives décrivent les caractéristiques des blocs de signaux;
    dans lequel l'appareil est configuré pour effectuer la comparaison sur base des deux ou plusieurs valeurs représentatives, pour déterminer les informations de similitude,
    dans lequel l'appareil est par ailleurs configuré pour effectuer la comparaison sur base des deux ou plusieurs valeurs représentatives sur base d'une première comparaison sur base d'une séquence de valeurs représentatives d'un premier type pour la pluralité de blocs de signaux, et sur base d'une deuxième comparaison sur base d'une séquence de valeurs représentatives d'un deuxième type pour la pluralité de blocs de signaux,
    dans lequel la première comparaison sur base d'une séquence de valeurs représentatives d'un premier type pour une pluralité de blocs de signaux comprend le fait de comparer une première séquence de valeurs de passage à zéro (322; 450), qui comprend une pluralité de valeurs de passage à zéro, et une deuxième séquence de valeurs de passage à zéro (324; 456), qui comprend une pluralité de valeurs de passage à zéro,
    dans lequel les valeurs représentatives du deuxième type comprennent une mesure de planéité spectrale ou des valeurs de flux spectral, où les valeurs de flux spectral décrivent, sous forme d'une seule valeur quantitative, un changement entre les spectres de deux blocs de signaux successifs respectifs;
    dans lequel la première séquence de valeurs de passage à zéro correspond à un premier segment de signal parmi les différents segments de signal, et
    dans lequel la deuxième séquence de valeurs de passage à zéro correspond à un deuxième segment de signal parmi les différents segments de signal, et
    dans lequel les valeurs de passage à zéro constituent les informations de passage à zéro;
    dans lequel l'appareil est configuré pour comparer un résultat de la première comparaison et un résultat de la deuxième comparaison, pour obtenir une information de fiabilité,
    dans lequel, si une différence entre les résultats excède une certaine valeur de seuil, une alerte est générée indiquant que la comparaison n'est pas fiable;
    dans lequel l'appareil est configuré pour recevoir un ou plusieurs signaux audio ou un ou plusieurs signaux vidéo comme les un ou plusieurs signaux d'entrée (112; 212; 312, 314) et pour déterminer les informations de passage à zéro (114; 214; 322, 324) sur base des un ou plusieurs signaux audio ou sur base des un ou plusieurs signaux vidéo.
  2. Appareil (100; 200; 300) selon la revendication 1, dans lequel l'appareil est configuré pour déterminer, comme informations de passage à zéro (114; 214; 322, 324), un nombre total de passages à zéro, ou un nombre de passages à zéro ascendant, ou un nombre de passages à zéro descendant pour une pluralité de parties (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) de l'au moins un des un ou plusieurs signaux d'entrée.
  3. Appareil (100; 200; 300) selon la revendication 1, dans lequel l'appareil est configuré pour déterminer, comme informations de passage à zéro (114; 214; 322, 324), un taux de passage à zéro pour une pluralité de parties (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) de l'au moins un parmi les un ou plusieurs signaux d'entrée.
  4. Appareil selon l'une des revendications 1 à 3, dans lequel l'appareil (100; 200; 300) est configuré pour déterminer les informations de passage à zéro (114; 214; 322, 324) de sorte qu'au moins une valeur de passage à zéro soit associée à chaque partie (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) parmi une pluralité de parties de l'au moins un parmi les un ou plusieurs signaux d'entrée.
  5. Appareil (100; 200; 300) selon l'une des revendications 1 à 4,
    dans lequel l'appareil est configuré pour déterminer une première séquence de valeurs de passage à zéro (114, 214, 322, 450) pour le premier segment de signal (420; 520), dans lequel le premier segment de signal comprend une pluralité de blocs de signaux (422, 424, 426; 522, 524, 526), et dans lequel la première séquence de valeurs de passage à zéro comprend une ou plusieurs valeurs de passage à zéro associées à chacun des blocs de signaux du premier segment de signal; et
    dans lequel l'appareil est configuré pour déterminer une deuxième séquence de valeurs de passage à zéro (114, 214, 324, 456) pour le deuxième segment de signal (430: 540), dans lequel le deuxième segment de signal comprend une pluralité de blocs de signaux (432, 434, 436; 542, 544, 546), et dans lequel la deuxième séquence de valeurs de passage à zéro comprend une ou plusieurs valeurs de passage à zéro associées à chacun des blocs de signaux du deuxième segment de signal.
  6. Appareil (100; 200; 300) selon l'une des revendications 1 à 5, dans lequel l'appareil est configuré pour calculer une valeur de corrélation à l'aide de la première séquence de valeurs de passage à zéro (322; 450) et de la deuxième séquence de valeurs de passage à zéro (324; 456), pour obtenir les informations de similitude (122; 222; 332); ou
    dans lequel l'appareil est configuré pour calculer une valeur de différence d'amplitude moyenne à l'aide de la première séquence de valeurs de passage à zéro et de la deuxième séquence de valeurs de passage à zéro, pour obtenir les informations de similitude; ou
    dans lequel l'appareil est configuré pour calculer une norme d'unedifférence entre la première séquence de valeurs de passage à zéro et la deuxième séquence de valeurs de passage à zéro, pour obtenir les informations de similitude; ou
    dans lequel l'appareil est configuré pour calculer une distance euclidienne entre la première séquence de valeurs de passage à zéro et la deuxième séquence de valeurs de passage à zéro, pour obtenir les informations de similitude.
  7. Appareil (100; 200; 300) selon l'une des revendications 1 à 5, dans lequel l'appareil est configuré pour calculer une pluralité de valeurs de mesure de différence entre la première séquence de valeurs de passage à zéro, ou une partie de cette dernière, et une pluralité de versions décalées dans le temps de la deuxième séquence de valeurs de passage à zéro, ou de parties décalées dans le temps de cette dernière, pour obtenir une information (232; 342) sur un décalage dans le temps qui crée une similitude maximale entre la première séquence de valeurs de passage à zéro, ou une partie de cette dernière, et une version décalée dans le temps de la deuxième séquence de valeurs de passage à zéro, ou une partie de cette dernière.
  8. Appareil (100; 200; 300) selon l'une des revendications 1 à 6, dans lequel l'appareil est configuré pour calculer une fonction de corrélation à l'aide de la première séquence de valeurs de passage à zéro (322; 450) et de la deuxième séquence de valeurs de passage à zéro (324; 456), pour obtenir une information (232; 342) sur un décalage dans le temps qui crée une similitude maximale entre la première séquence de valeurs de passage à zéro, ou une partie de cette dernière, et une version décalée dans le temps de la deuxième séquence de valeurs de passage à zéro, ou une partie de cette dernière; ou dans lequel l'appareil est configuré pour calculer une fonction de différence d'amplitude moyenne à l'aide de la première séquence de valeurs de passage à zéro et de la deuxième séquence de valeurs de passage à zéro, pour comparer une partie de la première séquence de valeurs de passage à zéro et des parties décalées dans le temps de la deuxième séquence de valeurs de passage à zéro, et pour obtenir une information sur un décalage dans le temps (d) qui crée une similitude maximale entre la première séquence de valeurs de passage à zéro (x1(t); 322; 450)), ou une partie de cette dernière, et une version décalée dans le temps (x2(t+d)) de la deuxième séquence de valeurs de passage à zéro (x2(t); 32; 456), ou une partie de cette dernière.
  9. Appareil (100; 200; 300) selon l'une des revendications 1 à 8, dans lequel l'appareil est configuré pour éliminer une composante constante de la première séquence de valeurs de passage à zéro (114; 214; 322) et/ou de la deuxième séquence de valeurs de passage à zéro (324) avant de comparer la première séquence de valeurs de passage à zéro et la deuxième séquence de valeurs de passage à zéro.
  10. Appareil (100; 200; 300) selon l'une des revendications 1 à 9, dans lequel l'appareil est configuré pour éliminer une composante constante des un ou plusieurs signaux d'entrée (112; 212; 312, 314), et/ou pour appliquer un filtrage passe-haut aux un ou plusieurs signaux d'entrée avant de déterminer les informations de passage à zéro.
  11. Appareil (100; 200; 300) selon l'une des revendications 1 à 10, dans lequel les valeurs représentatives comprennent, par bloc de signaux, une valeur de passage à zéro positive décrivant un nombre de passages à zéro ascendant dans un bloc de signaux respectif, et une valeur de passage à zéro négative décrivant un nombre de passages à zéro descendant dans un bloc de signaux respectif.
  12. Appareil (100; 200; 300) selon l'une des revendications 1 à 11, dans lequel l'appareil est configuré pour déterminer l'une des deux valeurs représentatives qui sont déterminées par bloc de signaux à l'aide d'une représentation dans le domaine de la fréquence d'un bloc de signaux respectif.
  13. Appareil (100; 200; 300) selon l'une des revendications 1 à 12, dans lequel l'appareil est configuré pour déterminer les valeurs de planéité spectrale décrivant une planéité d'un spectre d'un bloc de signaux respectif comme l'une des deux valeurs représentatives qui sont déterminées par bloc de signaux.
  14. Appareil (100; 200; 300) selon l'une des revendications 1 à 13, dans lequel l'appareil est configuré pour déterminer les coefficients de prédiction linéaire (LPC) pour un bloc de signaux respectif comme autres valeurs représentatives qui sont déterminées par bloc de signaux.
  15. Appareil (100; 200; 300) selon l'une des revendications 1 à 14, dans lequel l'appareil est configuré pour recevoir un ou plusieurs signaux audio ou un ou plusieurs signaux vidéo comme les un ou plusieurs signaux d'entrée (112; 212; 312, 314) et pour déterminer les informations de passage à zéro (114; 214; 322, 324) sur base des un ou plusieurs signaux audio ou sur base des un ou plusieurs signaux vidéo.
  16. Appareil (100; 200; 300) selon l'une des revendications 1 à 15, dans lequel l'appareil est configuré pour utiliser les informations de similitude (122; 222; 332) pour obtenir les informations d'autocorrélation relatifs à un signal audio ou à un signal vidéo; ou
    dans lequel l'appareil est configuré pour utiliser les informations de similitude pour obtenir les informations de corrélation croisée en ce qui concerne deux signaux audio ou en ce qui concerne deux signaux vidéo; ou
    dans lequel l'appareil est configuré pour utiliser les informations de similitude pour déterminer un décalage dans le temps (232; 342) pour obtenir le meilleur alignement possible entre deux signaux audio, ou pour déterminer un décalage dans le temps (232; 342) pour obtenir le meilleur alignement possible entre deux signaux vidéo.
  17. Appareil selon l'une des revendications 1 à 16, dans lequel l'appareil est configuré pour déterminer une première information de passage à zéro à l'aide d'une première grandeur de bloc dans une première étape et pour effectuer la comparaison sur base de la première information de passage à zéro, pour obtenir une information représentant un décalage dans le temps entre régions similaires des un ou plusieurs signaux d'entrée, et
    dans lequel l'appareil est configuré pour déterminer une deuxième information de passage à zéro à l'aide d'une deuxième grandeur de bloc dans une deuxième étape, pour obtenir une information raffinée représentant un décalage dans le temps entre régions similaires des unou plusieurs signaux d'entrée,
    dans lequel une plage pour laquelle est déterminée la deuxième information de passage à zéro dépend des informations représentant un décalage dans le temps entre régions similaires des un ou plusieurs signaux d'entrée obtenus à la première étape, et dans lequel la deuxième grandeur de bloc est inférieure à la première grandeur de bloc.
  18. Procédé (700) permettant de déterminer une information de similitude sur base d'un ou plusieurs signaux d'entrée qui sont des signaux audio ou des signaux vidéo,
    dans lequel le procédé comprend le fait de déterminer (710) une information de passage à zéro décrivant un nombre de passages à zéro dans une partie respective pour une pluralité de parties de l'au moins un des un ou plusieurs signaux d'entrée, et
    dans lequel le procédé comprend le fait d'effectuer (720) une comparaison sur base de l'information de passage à zéro, pour déterminer l'information de similitude décrivant une similitude entre différents segments de signal d'un signal d'entrée unique ou entre les segments de signal de deux signaux à comparer, dans lequel chacun des différents segments de signal comprend une pluralité de blocs de signaux;
    dans lequel le procédé comprend le fait de déterminer deux ou plusieurs valeurs représentatives par bloc de signaux pour la pluralité de blocs de signaux,
    dans lequel les deux ou plusieurs valeurs représentatives décrivent les caractéristiques des blocs de signaux;
    dans lequel le procédé comprend le fait d'effectuer la comparaison sur base des deux ou plusieurs valeurs représentatives, pour déterminer les informations de similitude,
    dans lequel la comparaison sur base des deux ou plusieurs valeurs représentatives est effectuée sur base d'une première comparaison sur base d'une séquence de valeurs représentatives d'un premier type pour la pluralité de blocs de signaux, et sur base d'une deuxième comparaison sur base d'une séquence de valeurs représentatives d'un deuxième type pour la pluralité de blocs de signaux,
    dans lequel la première comparaison sur base d'une séquence de valeurs représentatives d'un premier type pour une pluralité de blocs designaux comprend le fait de comparer une première séquence de valeurs de passage à zéro (322; 450), qui comprend une pluralité de valeurs de passage à zéro, et une deuxième séquence de valeurs de passage à zéro (324; 456), qui comprend une pluralité de valeurs de passage à zéro,
    dans lequel les valeurs représentatives du deuxième type comprennent une mesure de planéité spectrale ou des valeurs de flux spectral, où les valeurs de flux spectral décrivent, sous forme d'une seule valeur quantitative, un changement entre les spectres de deux blocs de signaux successifs respectifs;
    dans lequel la première séquence de valeurs de passage à zéro correspond à un premier segment de signal parmi les différentes segments de signal, et
    dans lequel la deuxième séquence de valeurs de passage à zéro correspond à un deuxième segment de signal parmi les différentes segments de signal, et
    dans lequel les valeurs de passage à zéro constituent les informations de passage à zéro,
    dans lequel sont comparés un résultat de la première comparaison et un résultat de la deuxième comparaison, pour obtenir une information de fiabilité;
    dans lequel, si une différence entre les résultats excède une certaine valeur de seuil, une alerte est générée indiquant que la comparaison n'est pas fiable;
    dans lequel le procédé comprend le fait de recevoir un ou plusieurs signaux audio ou un ou plusieurs signaux vidéo comme les un ou plusieurs signaux d'entrée (112; 212; 312, 314) et de déterminer les informations de passage à zéro (114; 214; 322, 324) sur base des un ou plusieurs signaux audio ou sur base des un ou plusieurs signaux vidéo.
  19. Programme d'ordinateur permettant de réaliser le procédé selon la revendication 18 lorsque le programme d'ordinateur est exécuté sur un ordinateur.
HK19122912.9A 2016-05-20 2017-05-18 Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program HK1262781B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP16170744.3 2016-05-20
EP16199181.5 2016-11-16

Publications (2)

Publication Number Publication Date
HK1262781A1 HK1262781A1 (en) 2020-01-17
HK1262781B true HK1262781B (en) 2025-05-09

Family

ID=

Similar Documents

Publication Publication Date Title
JP7317888B2 (ja) 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム
CN110136744B (zh) 一种音频指纹生成方法、设备及存储介质
US9679579B1 (en) Systems and methods facilitating selective removal of content from a mixed audio recording
JP5826291B2 (ja) 音声信号からの特徴フィンガープリントの抽出及びマッチング方法
US20090177466A1 (en) Detection of speech spectral peaks and speech recognition method and system
CN112446329A (zh) 一种时变结构瞬时频率确定方法、系统、装置及存储介质
KR20190069198A (ko) 다채널 오디오 신호에서 음원을 추출하는 장치 및 그 방법
US20150304705A1 (en) Synchronization of different versions of a multimedia content
HK1262781B (en) Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program
HK1262781A1 (en) Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program
EP2835799A1 (fr) Procédé et appareil permettant de détecter un symbole de filigrane dans une section d'une version reçue d'un signal audio filigrané
Chae et al. Small-Footprint Convolutional Neural Network with Reduced Feature Map for Voice Activity Detection
EP4227942B1 (fr) Détection de signal de synchronisation (synchronisation mark) à l'aide d'un filtrage basé sur un signal sinusoïdal multifréquence (mfs)
US20250069618A1 (en) Method and System for Identifying Similarity Between Two Audio Tracks
US20080275710A1 (en) Scale Searching for Watermark Detection
Tao et al. Audio Tampering Detection Based on Quantization Artifacts
CN116092521A (zh) 特征频点识别模型训练和音频指纹识别方法、设备及产品
CN116582396A (zh) 使用基于倍频正弦(mfs)信号的滤波的同步信号(同步标记)检测
CN103811011A (zh) 音频弦波检测方法和装置
Shiv Improved frequency estimation in sinusoidal models through iterative linear programming schemes
Miranda et al. Finding audio fingerprinter using GPU