HK1262781B - Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program - Google Patents
Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program Download PDFInfo
- Publication number
- HK1262781B HK1262781B HK19122912.9A HK19122912A HK1262781B HK 1262781 B HK1262781 B HK 1262781B HK 19122912 A HK19122912 A HK 19122912A HK 1262781 B HK1262781 B HK 1262781B
- Authority
- HK
- Hong Kong
- Prior art keywords
- zero crossing
- signal
- information
- value sequence
- crossing value
- Prior art date
Links
Claims (19)
- Eine Vorrichtung (100; 200; 300) zum Bestimmen einer Ähnlichkeitsinformation (122; 222; 332) auf der Basis eines oder mehrerer Eingangssignale (112; 212; 312, 314), die Audiosignale oder Videosignale sind,wobei die Vorrichtung dazu konfiguriert ist, eine Nulldurchgangsinformation (114; 214; 322, 324) zu bestimmen, die eine Anzahl von Nulldurchgängen in einem jeweiligen Abschnitt (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) für eine Mehrzahl von Abschnitten des zumindest einen des einen oder der mehreren Eingangssignale beschreibt, undwobei die Vorrichtung dazu konfiguriert ist, einen Vergleich auf der Basis der Nulldurchgangsinformation durchzuführen, um die Ähnlichkeitsinformation zu bestimmen, die eine Ähnlichkeit zwischen verschiedenen Signalabschnitten eines einzelnen Eingangssignals oder zwischen verschiedenen Signalabschnitten von zwei zu vergleichenden Signalen beschreibt, wobei jeder der verschiedenen Signalabschnitte eine Mehrzahl von Signalblöcken aufweist;wobei die Vorrichtung dazu konfiguriert ist, zwei oder mehr repräsentative Werte pro Signalblock für die Mehrzahl von Signalblöcken zu bestimmen, wobei die zwei oder mehr repräsentativen Werte Merkmale der Signalblöcke beschreiben;wobei die Vorrichtung dazu konfiguriert ist, den Vergleich auf der Basis der zwei oder mehr repräsentativen Werte durchzuführen, um die Ähnlichkeitsinformation zu bestimmen,wobei die Vorrichtung ferner dazu konfiguriert ist, den Vergleich auf der Basis der zwei oder mehr repräsentativen Werte basierend auf einem ersten Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines ersten Typs für die Mehrzahl von Signalblöcken und basierend auf einem zweiten Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines zweiten Typs für die Mehrzahl von Signalblöcken durchzuführen,wobei der erste Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines ersten Typs für eine Mehrzahl von Signalblöcken ein Vergleichen einer ersten Nulldurchgangswertsequenz (322; 450), die eine Mehrzahl von Nulldurchgangswerten aufweist, und einer zweiten Nulldurchgangswertsequenz (324; 456) aufweist, die eine Mehrzahl von Nulldurchgangswerten aufweist,wobei die repräsentativen Werte des zweiten Typs ein spektrales Flachheitsmaß oder spektrale Flusswerte aufweisen, wobei die spektralen Flusswerte in der Form eines einzelnen quantitativen Wertes eine Änderung zwischen Spektren von jeweils zwei aufeinanderfolgenden Signalblöcken beschreiben;wobei die erste Nulldurchgangswertsequenz einem ersten Signalabschnitt der verschiedenen Signalabschnitte entspricht, und wobei die zweite Nulldurchgangswertsequenz einem zweiten Signalabschnitt der verschiedenen Signalabschnitte entspricht, undwobei die Nulldurchgangswerte die Nulldurchgangsinformation bilden;wobei die Vorrichtung dazu konfiguriert ist, ein Ergebnis des ersten Vergleichs und ein Ergebnis des zweiten Vergleichs zu vergleichen, um eine Zuverlässigkeitsinformation zu erhalten,wobei, wenn eine Diskrepanz zwischen den Ergebnissen einen bestimmten Schwellenwert überschreitet, ein Alarm erzeugt wird, der anzeigt, dass der Vergleich unzuverlässig ist;wobei die Vorrichtung dazu konfiguriert ist, ein oder mehrere Audiosignale oder ein oder mehrere Videosignale als das eine oder die mehreren Eingangssignale (112; 212; 312, 314) zu empfangen und die Nulldurchgangsinformation (114; 214; 322, 324) auf der Basis des einen oder der mehreren Audiosignale oder auf der Basis des einen oder der mehreren Videosignale zu bestimmen.
- Die Vorrichtung (100; 200; 300) gemäß Anspruch 1, wobei die Vorrichtung dazu konfiguriert ist, als die Nulldurchgangsinformation (114; 214; 322, 324) eine Gesamtanzahl von Nulldurchgängen oder eine Anzahl von ansteigenden Nulldurchgängen oder eine Anzahl von abfallenden Nulldurchgängen für eine Mehrzahl von Abschnitten (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) des zumindest einen des einen oder der mehreren Eingangssignale zu bestimmen.
- Die Vorrichtung (100; 200; 300) gemäß Anspruch 1, wobei die Vorrichtung dazu konfiguriert ist, als die Nulldurchgangsinformation (114; 214; 322, 324) eine Nulldurchgangsrate für eine Mehrzahl von Abschnitten (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) des zumindest einen des einen oder der mehreren Eingangssignale zu bestimmen.
- Die Vorrichtung gemäß einem der Ansprüche 1 bis 3, wobei die Vorrichtung (100; 200; 300) dazu konfiguriert ist, die Nulldurchgangsinformation (114; 214; 322, 324) derart zu bestimmen, dass zumindest ein Nulldurchgangswert jedem Abschnitt (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) einer Mehrzahl von Abschnitten des zumindest einen des einen oder der mehreren Eingangssignale zugeordnet ist.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 4,wobei die Vorrichtung dazu konfiguriert ist, eine erste Nulldurchgangswertsequenz (114, 214, 322, 450) für den ersten Signalabschnitt (420; 520) zu bestimmen, wobei der erste Signalabschnitt eine Mehrzahl von Signalblöcken (422, 424, 426; 522, 524, 526) aufweist, und wobei die erste Nulldurchgangswertsequenz einen oder mehrere Nulldurchgangswerte aufweist, die jedem der Signalblöcke des ersten Signalabschnitts zugeordnet sind; undwobei die Vorrichtung dazu konfiguriert ist, eine zweite Nulldurchgangswertsequenz (114, 214, 324, 456) für den zweiten Signalabschnitt (430; 540) zu bestimmen, wobei der zweite Signalabschnitt eine Mehrzahl von Signalblöcken (432, 434, 436; 542, 544, 546) aufweist, und wobei die zweite Nulldurchgangswertsequenz einen oder mehrere Nulldurchgangswerte aufweist, die jedem der Signalblöcke des zweiten Signalabschnitts zugeordnet sind.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 5, wobei die Vorrichtung dazu konfiguriert ist, unter Verwendung der ersten Nulldurchgangswertsequenz (322; 450) und der zweiten Nulldurchgangswertsequenz (324; 456) einen Korrelationswert zu berechnen, um die Ähnlichkeitsinformation (122; 222; 332) zu erhalten; oderwobei die Vorrichtung dazu konfiguriert ist, unter Verwendung der ersten Nulldurchgangswertsequenz und der zweiten Nulldurchgangswertsequenz einen Durchschnittsbetragsdifferenzwert zu berechnen, um die Ähnlichkeitsinformation zu erhalten; oderwobei die Vorrichtung dazu konfiguriert ist, eine Norm einer Differenz zwischen der ersten Nulldurchgangswertsequenz und der zweiten Nulldurchgangswertsequenz zu berechnen, um die Ähnlichkeitsinformation zu erhalten; oderwobei die Vorrichtung dazu konfiguriert ist, einen euklidischen Abstand zwischen der ersten Nulldurchgangswertsequenz und der zweiten Nulldurchgangswertsequenz zu berechnen, um die Ähnlichkeitsinformation zu erhalten.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 5, wobei die Vorrichtung dazu konfiguriert ist, eine Mehrzahl von Differenzmaßwerten zwischen der ersten Nulldurchgangswertsequenz oder einem Abschnitt derselben und einer Mehrzahl von zeitverschobenen Versionen der zweiten Nulldurchgangswertsequenz oder zeitverschobenen Abschnitten derselben zu berechnen, um eine Information (232; 342) über eine Zeitverschiebung zu erhalten, die eine maximale Ähnlichkeit zwischen der ersten Nulldurchgangswertsequenz oder einem Abschnitt derselben und einer zeitverschobenen Version der zweiten Nulldurchgangswertsequenz oder einem Abschnitt derselben bereitstellt.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 6, wobei die Vorrichtung dazu konfiguriert ist, unter Verwendung der ersten Nulldurchgangswertsequenz (322; 450) und der zweiten Nulldurchgangswertsequenz (324; 456) eine Korrelationsfunktion zu berechnen, um eine Information (232; 342) über eine Zeitverschiebung zu erhalten, die eine maximale Ähnlichkeit zwischen der ersten Nulldurchgangswertsequenz oder einem Abschnitt derselben und einer zeitverschobenen Version der zweiten Nulldurchgangswertsequenz oder einem Abschnitt derselben bereitstellt; oder wobei die Vorrichtung dazu konfiguriert ist, unter Verwendung der ersten Nulldurchgangswertsequenz und der zweiten Nulldurchgangswertsequenz eine Durchschnittsbetragsdifferenzfunktion zu berechnen, um einen Abschnitt der ersten Nulldurchgangswertsequenz und zeitverschobene Abschnitte der zweiten Nulldurchgangswertsequenz zu vergleichen, und um eine Information über eine Zeitverschiebung (d) zu erhalten, die eine maximale Ähnlichkeit zwischen der ersten Nulldurchgangswertsequenz (x1(t); 322; 450)) oder einem Abschnitt derselben und einer zeitverschobenen Version (x2(t+d)) der zweiten Nulldurchgangswertsequenz (x2(t); 322; 456) oder einem Abschnitt derselben bereitstellt.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 8, wobei die Vorrichtung dazu konfiguriert ist, eine konstante Komponente aus der ersten Nulldurchgangswertsequenz (114; 214; 322) und/oder aus der zweiten Nulldurchgangswertsequenz (324) zu entfernen, bevor die erste Nulldurchgangswertsequenz und die zweite Nulldurchgangswertsequenz verglichen werden.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 9, wobei die Vorrichtung dazu konfiguriert ist, eine konstante Komponente aus dem einen oder den mehreren Eingangssignalen (112; 212; 312, 314) zu entfernen und/oder ein Hochpassfiltern an das eine oder die mehreren Eingangssignale anzulegen, bevor die Nulldurchgangsinformation bestimmt wird.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 10, wobei die repräsentativen Werte pro Signalblock einen positiven Nulldurchgangswert, der eine Anzahl von ansteigenden Nulldurchgängen in einem jeweiligen Signalblock beschreibt, und einen negativen Nulldurchgangswert aufweisen, der eine Anzahl von abfallenden Nulldurchgängen in einem jeweiligen Signalblock beschreibt.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 11, wobei die Vorrichtung dazu konfiguriert ist, einen der zwei repräsentativen Werte, die pro Signalblock bestimmt werden, unter Verwendung einer Frequenzbereichsdarstellung eines jeweiligen Signalblocks zu bestimmen.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 12, wobei die Vorrichtung dazu konfiguriert ist, spektrale Flachheitswerte, die eine Flachheit eines Spektrums eines jeweiligen Signalblocks beschreiben, als einen der zwei repräsentativen Werte zu bestimmen, die pro Signalblock bestimmt werden.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 13, wobei die Vorrichtung dazu konfiguriert ist, lineare Prädiktionskoeffizienten (LPC) für einen jeweiligen Signalblock als weitere repräsentative Werte zu bestimmen, die pro Signalblock bestimmt werden.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 14, wobei die Vorrichtung dazu konfiguriert ist, ein oder mehrere Audiosignale oder ein oder mehrere Videosignale als das eine oder die mehreren Eingangssignale (112; 212; 312, 314) zu empfangen und die Nulldurchgangsinformation (114; 214; 322, 324) auf der Basis des einen oder der mehreren Audiosignale oder auf der Basis des einen oder der mehreren Videosignale zu bestimmen.
- Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 15, wobei die Vorrichtung dazu konfiguriert ist, die Ähnlichkeitsinformation (122; 222; 332) zu verwenden, um eine Autokorrelationsinformation bezüglich eines Audiosignals oder eines Videosignals zu erhalten; oderwobei die Vorrichtung dazu konfiguriert ist, die Ähnlichkeitsinformation zu verwenden, um eine Kreuzkorrelationsinformation in Bezug auf zwei Audiosignale oder in Bezug auf zwei Videosignale zu erhalten; oderwobei die Vorrichtung dazu konfiguriert ist, die Ähnlichkeitsinformation zu verwenden, um eine Zeitverschiebung (232; 342) zu bestimmen, um eine bestmögliche Ausrichtung zwischen zwei Audiosignalen zu erhalten, oder um eine Zeitverschiebung (232; 342) zu bestimmen, um eine bestmögliche Ausrichtung zwischen zwei Videosignalen zu erhalten.
- Die Vorrichtung gemäß einem der Ansprüche 1 bis 16, wobei die Vorrichtung dazu konfiguriert ist, eine erste Nulldurchgangsinformation unter Verwendung einer ersten Blockgröße in einem ersten Schritt zu bestimmen und den Vergleich auf der Basis der ersten Nulldurchgangsinformation durchzuführen, um eine Information zu erhalten, die eine Zeitverschiebung zwischen ähnlichen Regionen des einen oder der mehreren Eingangssignale darstellt, undwobei die Vorrichtung dazu konfiguriert ist, eine zweite Nulldurchgangsinformation unter Verwendung einer zweiten Blockgröße in einem zweiten Schritt zu bestimmen, um eine verfeinerte Information zu erhalten, die eine Zeitverschiebung zwischen ähnlichen Regionen des einen oder der mehreren Eingangssignale darstellt,wobei ein Bereich, für den die zweite Nulldurchgangsinformation bestimmt wird, von der Information abhängt, die eine Zeitverschiebung zwischen ähnlichen Regionen des einen oder der mehreren Eingangssignale darstellt, die in dem ersten Schritt erhalten werden, und wobei die zweite Blockgröße kleiner als die erste Blockgröße ist.
- Ein Verfahren (700) zum Bestimmen einer Ähnlichkeitsinformation auf der Basis eines oder mehrerer Eingangssignale, die Audiosignale oder Videosignale sind,wobei das Verfahren ein Bestimmen (710) einer Nulldurchgangsinformation aufweist, die eine Anzahl von Nulldurchgängen in einem jeweiligen Abschnitt für eine Mehrzahl von Abschnitten des zumindest einen des einen oder der mehreren Eingangssignale beschreibt, undwobei das Verfahren ein Durchführen (720) eines Vergleichs auf der Basis der Nulldurchgangsinformation aufweist, um die Ähnlichkeitsinformation zu bestimmen, die eine Ähnlichkeit zwischen verschiedenen Signalabschnitten eines einzelnen Eingangssignals oder zwischen Signalabschnitten von zwei zu vergleichenden Signalen beschreibt, wobei jeder der verschiedenen Signalabschnitte eine Mehrzahl von Signalblöcken aufweist;wobei das Verfahren ein Bestimmen von zwei oder mehr repräsentativen Werten pro Signalblock für die Mehrzahl von Signalblöcken aufweist, wobei die zwei oder mehr repräsentativen Werte Merkmale der Signalblöcke beschreiben;wobei das Verfahren ein Durchführen des Vergleichs auf der Basis der zwei oder mehr repräsentativen Werte aufweist, um die Ähnlichkeitsinformation zu bestimmen,wobei der Vergleich auf der Basis der zwei oder mehr repräsentativen Werte basierend auf einem ersten Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines ersten Typs für die Mehrzahl von Signalblöcken und basierend auf einem zweiten Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines zweiten Typs für die Mehrzahl von Signalblöcken durchgeführt wird,wobei der erste Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines ersten Typs für eine Mehrzahl von Signalblöcken ein Vergleichen einer ersten Nulldurchgangswertsequenz (322; 450), die eine Mehrzahl von Nulldurchgangswerten aufweist, und einer zweiten Nulldurchgangswertsequenz (324; 456) aufweist, die eine Mehrzahl von Nulldurchgangswerten aufweist,wobei die repräsentativen Werte des zweiten Typs ein spektrales Flachheitsmaß oder spektrale Flusswerte aufweisen, wobei die spektralen Flusswerte in der Form eines einzelnen quantitativen Wertes eine Änderung zwischen Spektren von jeweils zwei aufeinanderfolgenden Signalblöcken beschreiben;wobei die erste Nulldurchgangswertsequenz einem ersten Signalabschnitt der verschiedenen Signalabschnitte entspricht, und wobei die zweite Nulldurchgangswertsequenz einem zweiten Signalabschnitt der verschiedenen Signalabschnitte entspricht, undwobei die Nulldurchgangswerte die Nulldurchgangsinformation bilden,wobei ein Ergebnis des ersten Vergleichs und ein Ergebnis des zweiten Vergleichs verglichen werden, um eine Zuverlässigkeitsinformation zu erhalten;wobei, wenn eine Diskrepanz zwischen den Ergebnissen einen bestimmten Schwellenwert überschreitet, ein Alarm erzeugt wird, der anzeigt, dass der Vergleich unzuverlässig ist;wobei das Verfahren ein Empfangen eines oder mehrerer Audiosignale oder eines oder mehrerer Videosignale als das eine oder die mehreren Eingangssignale (112; 212; 312, 314) und ein Bestimmen der Nulldurchgangsinformation (114; 214; 322, 324) auf der Basis des einen oder der mehreren Audiosignale oder auf der Basis des einen oder der mehreren Videosignale aufweist.
- Ein Computerprogramm zum Durchführen des Verfahrens gemäß Anspruch 18, wenn das Computerprogramm auf einem Computer läuft.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP16170744.3 | 2016-05-20 | ||
| EP16199181.5 | 2016-11-16 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1262781A1 HK1262781A1 (en) | 2020-01-17 |
| HK1262781B true HK1262781B (en) | 2025-05-09 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7317888B2 (ja) | 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム | |
| CN110136744B (zh) | 一种音频指纹生成方法、设备及存储介质 | |
| US9679579B1 (en) | Systems and methods facilitating selective removal of content from a mixed audio recording | |
| JP5826291B2 (ja) | 音声信号からの特徴フィンガープリントの抽出及びマッチング方法 | |
| US20090177466A1 (en) | Detection of speech spectral peaks and speech recognition method and system | |
| CN112446329A (zh) | 一种时变结构瞬时频率确定方法、系统、装置及存储介质 | |
| KR20190069198A (ko) | 다채널 오디오 신호에서 음원을 추출하는 장치 및 그 방법 | |
| US20150304705A1 (en) | Synchronization of different versions of a multimedia content | |
| HK1262781B (en) | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program | |
| HK1262781A1 (en) | Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program | |
| EP2835799A1 (de) | Verfahren und Vorrichtung zur Detektion eines Wasserzeichensymbols in einem Abschnitt einer empfangenen Version eines Audiosignals mit Wasserzeichen | |
| Chae et al. | Small-Footprint Convolutional Neural Network with Reduced Feature Map for Voice Activity Detection | |
| EP4227942B1 (de) | Detektion von synchronisationssignalen (syncmark) unter verwendung von multifrequenzsinusoidaler (mfs)-signalbasierter filterung | |
| US20250069618A1 (en) | Method and System for Identifying Similarity Between Two Audio Tracks | |
| US20080275710A1 (en) | Scale Searching for Watermark Detection | |
| Tao et al. | Audio Tampering Detection Based on Quantization Artifacts | |
| CN116092521A (zh) | 特征频点识别模型训练和音频指纹识别方法、设备及产品 | |
| CN116582396A (zh) | 使用基于倍频正弦(mfs)信号的滤波的同步信号(同步标记)检测 | |
| CN103811011A (zh) | 音频弦波检测方法和装置 | |
| Shiv | Improved frequency estimation in sinusoidal models through iterative linear programming schemes | |
| Miranda et al. | Finding audio fingerprinter using GPU |