HK1262781B - Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program - Google Patents
Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program Download PDFInfo
- Publication number
- HK1262781B HK1262781B HK19122912.9A HK19122912A HK1262781B HK 1262781 B HK1262781 B HK 1262781B HK 19122912 A HK19122912 A HK 19122912A HK 1262781 B HK1262781 B HK 1262781B
- Authority
- HK
- Hong Kong
- Prior art keywords
- zero crossing
- signal
- information
- value sequence
- crossing value
- Prior art date
Links
Claims (19)
- Appareil (100; 200; 300) permettant de déterminer une information de similitude (122; 222; 332) sur base d'un ou plusieurs signaux d'entrée (112; 212; 312, 314) qui sont des signaux audio ou des signaux vidéo,dans lequel l'appareil est configuré pour déterminer une information de passage à zéro (114; 214; 322, 324) décrivant un nombre de passages à zéro dans une partie respective (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) pour une pluralité de parties de l'au moins un des un ou plusieurs signaux d'entrée, etdans lequel l'appareil est configuré pour effectuer une comparaison sur base de l'information de passage à zéro, pour déterminer l'information de similitude décrivant une similitude entre différents segments de signal d'un signal d'entrée unique ou entre différents segments de signal de deux signaux à comparer, où chacun des différents segments de signal comprend une pluralité de blocs de signaux;dans lequel l'appareil est configuré pour déterminer deux ou plusieurs valeurs représentatives par bloc de signaux pour la pluralité de blocs de signaux,dans lequel les deux ou plusieurs valeurs représentatives décrivent les caractéristiques des blocs de signaux;dans lequel l'appareil est configuré pour effectuer la comparaison sur base des deux ou plusieurs valeurs représentatives, pour déterminer les informations de similitude,dans lequel l'appareil est par ailleurs configuré pour effectuer la comparaison sur base des deux ou plusieurs valeurs représentatives sur base d'une première comparaison sur base d'une séquence de valeurs représentatives d'un premier type pour la pluralité de blocs de signaux, et sur base d'une deuxième comparaison sur base d'une séquence de valeurs représentatives d'un deuxième type pour la pluralité de blocs de signaux,dans lequel la première comparaison sur base d'une séquence de valeurs représentatives d'un premier type pour une pluralité de blocs de signaux comprend le fait de comparer une première séquence de valeurs de passage à zéro (322; 450), qui comprend une pluralité de valeurs de passage à zéro, et une deuxième séquence de valeurs de passage à zéro (324; 456), qui comprend une pluralité de valeurs de passage à zéro,dans lequel les valeurs représentatives du deuxième type comprennent une mesure de planéité spectrale ou des valeurs de flux spectral, où les valeurs de flux spectral décrivent, sous forme d'une seule valeur quantitative, un changement entre les spectres de deux blocs de signaux successifs respectifs;dans lequel la première séquence de valeurs de passage à zéro correspond à un premier segment de signal parmi les différents segments de signal, etdans lequel la deuxième séquence de valeurs de passage à zéro correspond à un deuxième segment de signal parmi les différents segments de signal, etdans lequel les valeurs de passage à zéro constituent les informations de passage à zéro;dans lequel l'appareil est configuré pour comparer un résultat de la première comparaison et un résultat de la deuxième comparaison, pour obtenir une information de fiabilité,dans lequel, si une différence entre les résultats excède une certaine valeur de seuil, une alerte est générée indiquant que la comparaison n'est pas fiable;dans lequel l'appareil est configuré pour recevoir un ou plusieurs signaux audio ou un ou plusieurs signaux vidéo comme les un ou plusieurs signaux d'entrée (112; 212; 312, 314) et pour déterminer les informations de passage à zéro (114; 214; 322, 324) sur base des un ou plusieurs signaux audio ou sur base des un ou plusieurs signaux vidéo.
- Appareil (100; 200; 300) selon la revendication 1, dans lequel l'appareil est configuré pour déterminer, comme informations de passage à zéro (114; 214; 322, 324), un nombre total de passages à zéro, ou un nombre de passages à zéro ascendant, ou un nombre de passages à zéro descendant pour une pluralité de parties (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) de l'au moins un des un ou plusieurs signaux d'entrée.
- Appareil (100; 200; 300) selon la revendication 1, dans lequel l'appareil est configuré pour déterminer, comme informations de passage à zéro (114; 214; 322, 324), un taux de passage à zéro pour une pluralité de parties (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) de l'au moins un parmi les un ou plusieurs signaux d'entrée.
- Appareil selon l'une des revendications 1 à 3, dans lequel l'appareil (100; 200; 300) est configuré pour déterminer les informations de passage à zéro (114; 214; 322, 324) de sorte qu'au moins une valeur de passage à zéro soit associée à chaque partie (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) parmi une pluralité de parties de l'au moins un parmi les un ou plusieurs signaux d'entrée.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 4,dans lequel l'appareil est configuré pour déterminer une première séquence de valeurs de passage à zéro (114, 214, 322, 450) pour le premier segment de signal (420; 520), dans lequel le premier segment de signal comprend une pluralité de blocs de signaux (422, 424, 426; 522, 524, 526), et dans lequel la première séquence de valeurs de passage à zéro comprend une ou plusieurs valeurs de passage à zéro associées à chacun des blocs de signaux du premier segment de signal; etdans lequel l'appareil est configuré pour déterminer une deuxième séquence de valeurs de passage à zéro (114, 214, 324, 456) pour le deuxième segment de signal (430: 540), dans lequel le deuxième segment de signal comprend une pluralité de blocs de signaux (432, 434, 436; 542, 544, 546), et dans lequel la deuxième séquence de valeurs de passage à zéro comprend une ou plusieurs valeurs de passage à zéro associées à chacun des blocs de signaux du deuxième segment de signal.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 5, dans lequel l'appareil est configuré pour calculer une valeur de corrélation à l'aide de la première séquence de valeurs de passage à zéro (322; 450) et de la deuxième séquence de valeurs de passage à zéro (324; 456), pour obtenir les informations de similitude (122; 222; 332); oudans lequel l'appareil est configuré pour calculer une valeur de différence d'amplitude moyenne à l'aide de la première séquence de valeurs de passage à zéro et de la deuxième séquence de valeurs de passage à zéro, pour obtenir les informations de similitude; oudans lequel l'appareil est configuré pour calculer une norme d'unedifférence entre la première séquence de valeurs de passage à zéro et la deuxième séquence de valeurs de passage à zéro, pour obtenir les informations de similitude; oudans lequel l'appareil est configuré pour calculer une distance euclidienne entre la première séquence de valeurs de passage à zéro et la deuxième séquence de valeurs de passage à zéro, pour obtenir les informations de similitude.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 5, dans lequel l'appareil est configuré pour calculer une pluralité de valeurs de mesure de différence entre la première séquence de valeurs de passage à zéro, ou une partie de cette dernière, et une pluralité de versions décalées dans le temps de la deuxième séquence de valeurs de passage à zéro, ou de parties décalées dans le temps de cette dernière, pour obtenir une information (232; 342) sur un décalage dans le temps qui crée une similitude maximale entre la première séquence de valeurs de passage à zéro, ou une partie de cette dernière, et une version décalée dans le temps de la deuxième séquence de valeurs de passage à zéro, ou une partie de cette dernière.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 6, dans lequel l'appareil est configuré pour calculer une fonction de corrélation à l'aide de la première séquence de valeurs de passage à zéro (322; 450) et de la deuxième séquence de valeurs de passage à zéro (324; 456), pour obtenir une information (232; 342) sur un décalage dans le temps qui crée une similitude maximale entre la première séquence de valeurs de passage à zéro, ou une partie de cette dernière, et une version décalée dans le temps de la deuxième séquence de valeurs de passage à zéro, ou une partie de cette dernière; ou dans lequel l'appareil est configuré pour calculer une fonction de différence d'amplitude moyenne à l'aide de la première séquence de valeurs de passage à zéro et de la deuxième séquence de valeurs de passage à zéro, pour comparer une partie de la première séquence de valeurs de passage à zéro et des parties décalées dans le temps de la deuxième séquence de valeurs de passage à zéro, et pour obtenir une information sur un décalage dans le temps (d) qui crée une similitude maximale entre la première séquence de valeurs de passage à zéro (x1(t); 322; 450)), ou une partie de cette dernière, et une version décalée dans le temps (x2(t+d)) de la deuxième séquence de valeurs de passage à zéro (x2(t); 32; 456), ou une partie de cette dernière.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 8, dans lequel l'appareil est configuré pour éliminer une composante constante de la première séquence de valeurs de passage à zéro (114; 214; 322) et/ou de la deuxième séquence de valeurs de passage à zéro (324) avant de comparer la première séquence de valeurs de passage à zéro et la deuxième séquence de valeurs de passage à zéro.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 9, dans lequel l'appareil est configuré pour éliminer une composante constante des un ou plusieurs signaux d'entrée (112; 212; 312, 314), et/ou pour appliquer un filtrage passe-haut aux un ou plusieurs signaux d'entrée avant de déterminer les informations de passage à zéro.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 10, dans lequel les valeurs représentatives comprennent, par bloc de signaux, une valeur de passage à zéro positive décrivant un nombre de passages à zéro ascendant dans un bloc de signaux respectif, et une valeur de passage à zéro négative décrivant un nombre de passages à zéro descendant dans un bloc de signaux respectif.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 11, dans lequel l'appareil est configuré pour déterminer l'une des deux valeurs représentatives qui sont déterminées par bloc de signaux à l'aide d'une représentation dans le domaine de la fréquence d'un bloc de signaux respectif.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 12, dans lequel l'appareil est configuré pour déterminer les valeurs de planéité spectrale décrivant une planéité d'un spectre d'un bloc de signaux respectif comme l'une des deux valeurs représentatives qui sont déterminées par bloc de signaux.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 13, dans lequel l'appareil est configuré pour déterminer les coefficients de prédiction linéaire (LPC) pour un bloc de signaux respectif comme autres valeurs représentatives qui sont déterminées par bloc de signaux.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 14, dans lequel l'appareil est configuré pour recevoir un ou plusieurs signaux audio ou un ou plusieurs signaux vidéo comme les un ou plusieurs signaux d'entrée (112; 212; 312, 314) et pour déterminer les informations de passage à zéro (114; 214; 322, 324) sur base des un ou plusieurs signaux audio ou sur base des un ou plusieurs signaux vidéo.
- Appareil (100; 200; 300) selon l'une des revendications 1 à 15, dans lequel l'appareil est configuré pour utiliser les informations de similitude (122; 222; 332) pour obtenir les informations d'autocorrélation relatifs à un signal audio ou à un signal vidéo; oudans lequel l'appareil est configuré pour utiliser les informations de similitude pour obtenir les informations de corrélation croisée en ce qui concerne deux signaux audio ou en ce qui concerne deux signaux vidéo; oudans lequel l'appareil est configuré pour utiliser les informations de similitude pour déterminer un décalage dans le temps (232; 342) pour obtenir le meilleur alignement possible entre deux signaux audio, ou pour déterminer un décalage dans le temps (232; 342) pour obtenir le meilleur alignement possible entre deux signaux vidéo.
- Appareil selon l'une des revendications 1 à 16, dans lequel l'appareil est configuré pour déterminer une première information de passage à zéro à l'aide d'une première grandeur de bloc dans une première étape et pour effectuer la comparaison sur base de la première information de passage à zéro, pour obtenir une information représentant un décalage dans le temps entre régions similaires des un ou plusieurs signaux d'entrée, etdans lequel l'appareil est configuré pour déterminer une deuxième information de passage à zéro à l'aide d'une deuxième grandeur de bloc dans une deuxième étape, pour obtenir une information raffinée représentant un décalage dans le temps entre régions similaires des unou plusieurs signaux d'entrée,dans lequel une plage pour laquelle est déterminée la deuxième information de passage à zéro dépend des informations représentant un décalage dans le temps entre régions similaires des un ou plusieurs signaux d'entrée obtenus à la première étape, et dans lequel la deuxième grandeur de bloc est inférieure à la première grandeur de bloc.
- Procédé (700) permettant de déterminer une information de similitude sur base d'un ou plusieurs signaux d'entrée qui sont des signaux audio ou des signaux vidéo,dans lequel le procédé comprend le fait de déterminer (710) une information de passage à zéro décrivant un nombre de passages à zéro dans une partie respective pour une pluralité de parties de l'au moins un des un ou plusieurs signaux d'entrée, etdans lequel le procédé comprend le fait d'effectuer (720) une comparaison sur base de l'information de passage à zéro, pour déterminer l'information de similitude décrivant une similitude entre différents segments de signal d'un signal d'entrée unique ou entre les segments de signal de deux signaux à comparer, dans lequel chacun des différents segments de signal comprend une pluralité de blocs de signaux;dans lequel le procédé comprend le fait de déterminer deux ou plusieurs valeurs représentatives par bloc de signaux pour la pluralité de blocs de signaux,dans lequel les deux ou plusieurs valeurs représentatives décrivent les caractéristiques des blocs de signaux;dans lequel le procédé comprend le fait d'effectuer la comparaison sur base des deux ou plusieurs valeurs représentatives, pour déterminer les informations de similitude,dans lequel la comparaison sur base des deux ou plusieurs valeurs représentatives est effectuée sur base d'une première comparaison sur base d'une séquence de valeurs représentatives d'un premier type pour la pluralité de blocs de signaux, et sur base d'une deuxième comparaison sur base d'une séquence de valeurs représentatives d'un deuxième type pour la pluralité de blocs de signaux,dans lequel la première comparaison sur base d'une séquence de valeurs représentatives d'un premier type pour une pluralité de blocs designaux comprend le fait de comparer une première séquence de valeurs de passage à zéro (322; 450), qui comprend une pluralité de valeurs de passage à zéro, et une deuxième séquence de valeurs de passage à zéro (324; 456), qui comprend une pluralité de valeurs de passage à zéro,dans lequel les valeurs représentatives du deuxième type comprennent une mesure de planéité spectrale ou des valeurs de flux spectral, où les valeurs de flux spectral décrivent, sous forme d'une seule valeur quantitative, un changement entre les spectres de deux blocs de signaux successifs respectifs;dans lequel la première séquence de valeurs de passage à zéro correspond à un premier segment de signal parmi les différentes segments de signal, etdans lequel la deuxième séquence de valeurs de passage à zéro correspond à un deuxième segment de signal parmi les différentes segments de signal, etdans lequel les valeurs de passage à zéro constituent les informations de passage à zéro,dans lequel sont comparés un résultat de la première comparaison et un résultat de la deuxième comparaison, pour obtenir une information de fiabilité;dans lequel, si une différence entre les résultats excède une certaine valeur de seuil, une alerte est générée indiquant que la comparaison n'est pas fiable;dans lequel le procédé comprend le fait de recevoir un ou plusieurs signaux audio ou un ou plusieurs signaux vidéo comme les un ou plusieurs signaux d'entrée (112; 212; 312, 314) et de déterminer les informations de passage à zéro (114; 214; 322, 324) sur base des un ou plusieurs signaux audio ou sur base des un ou plusieurs signaux vidéo.
- Programme d'ordinateur permettant de réaliser le procédé selon la revendication 18 lorsque le programme d'ordinateur est exécuté sur un ordinateur.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP16170744.3 | 2016-05-20 | ||
| EP16199181.5 | 2016-11-16 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1262781A1 HK1262781A1 (en) | 2020-01-17 |
| HK1262781B true HK1262781B (en) | 2025-05-09 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7317888B2 (ja) | 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム | |
| CN110136744B (zh) | 一种音频指纹生成方法、设备及存储介质 | |
| US9679579B1 (en) | Systems and methods facilitating selective removal of content from a mixed audio recording | |
| JP5826291B2 (ja) | 音声信号からの特徴フィンガープリントの抽出及びマッチング方法 | |
| US20090177466A1 (en) | Detection of speech spectral peaks and speech recognition method and system | |
| CN112446329A (zh) | 一种时变结构瞬时频率确定方法、系统、装置及存储介质 | |
| KR20190069198A (ko) | 다채널 오디오 신호에서 음원을 추출하는 장치 및 그 방법 | |
| US20150304705A1 (en) | Synchronization of different versions of a multimedia content | |
| HK1262781B (en) | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program | |
| HK1262781A1 (en) | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program | |
| EP2835799A1 (fr) | Procédé et appareil permettant de détecter un symbole de filigrane dans une section d'une version reçue d'un signal audio filigrané | |
| Chae et al. | Small-Footprint Convolutional Neural Network with Reduced Feature Map for Voice Activity Detection | |
| EP4227942B1 (fr) | Détection de signal de synchronisation (synchronisation mark) à l'aide d'un filtrage basé sur un signal sinusoïdal multifréquence (mfs) | |
| US20250069618A1 (en) | Method and System for Identifying Similarity Between Two Audio Tracks | |
| US20080275710A1 (en) | Scale Searching for Watermark Detection | |
| Tao et al. | Audio Tampering Detection Based on Quantization Artifacts | |
| CN116092521A (zh) | 特征频点识别模型训练和音频指纹识别方法、设备及产品 | |
| CN116582396A (zh) | 使用基于倍频正弦(mfs)信号的滤波的同步信号(同步标记)检测 | |
| CN103811011A (zh) | 音频弦波检测方法和装置 | |
| Shiv | Improved frequency estimation in sinusoidal models through iterative linear programming schemes | |
| Miranda et al. | Finding audio fingerprinter using GPU |