[go: up one dir, main page]

HK1262781B - Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program - Google Patents

Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program Download PDF

Info

Publication number
HK1262781B
HK1262781B HK19122912.9A HK19122912A HK1262781B HK 1262781 B HK1262781 B HK 1262781B HK 19122912 A HK19122912 A HK 19122912A HK 1262781 B HK1262781 B HK 1262781B
Authority
HK
Hong Kong
Prior art keywords
zero crossing
signal
information
value sequence
crossing value
Prior art date
Application number
HK19122912.9A
Other languages
English (en)
French (fr)
Chinese (zh)
Other versions
HK1262781A1 (en
Inventor
Michael Kratz
Christian Uhle
Paul Klose
Timothy Leonard
Peter Prokein
Sebastian Scharrer
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Publication of HK1262781A1 publication Critical patent/HK1262781A1/en
Publication of HK1262781B publication Critical patent/HK1262781B/en

Links

Claims (19)

  1. Eine Vorrichtung (100; 200; 300) zum Bestimmen einer Ähnlichkeitsinformation (122; 222; 332) auf der Basis eines oder mehrerer Eingangssignale (112; 212; 312, 314), die Audiosignale oder Videosignale sind,
    wobei die Vorrichtung dazu konfiguriert ist, eine Nulldurchgangsinformation (114; 214; 322, 324) zu bestimmen, die eine Anzahl von Nulldurchgängen in einem jeweiligen Abschnitt (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) für eine Mehrzahl von Abschnitten des zumindest einen des einen oder der mehreren Eingangssignale beschreibt, und
    wobei die Vorrichtung dazu konfiguriert ist, einen Vergleich auf der Basis der Nulldurchgangsinformation durchzuführen, um die Ähnlichkeitsinformation zu bestimmen, die eine Ähnlichkeit zwischen verschiedenen Signalabschnitten eines einzelnen Eingangssignals oder zwischen verschiedenen Signalabschnitten von zwei zu vergleichenden Signalen beschreibt, wobei jeder der verschiedenen Signalabschnitte eine Mehrzahl von Signalblöcken aufweist;
    wobei die Vorrichtung dazu konfiguriert ist, zwei oder mehr repräsentative Werte pro Signalblock für die Mehrzahl von Signalblöcken zu bestimmen, wobei die zwei oder mehr repräsentativen Werte Merkmale der Signalblöcke beschreiben;
    wobei die Vorrichtung dazu konfiguriert ist, den Vergleich auf der Basis der zwei oder mehr repräsentativen Werte durchzuführen, um die Ähnlichkeitsinformation zu bestimmen,
    wobei die Vorrichtung ferner dazu konfiguriert ist, den Vergleich auf der Basis der zwei oder mehr repräsentativen Werte basierend auf einem ersten Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines ersten Typs für die Mehrzahl von Signalblöcken und basierend auf einem zweiten Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines zweiten Typs für die Mehrzahl von Signalblöcken durchzuführen,
    wobei der erste Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines ersten Typs für eine Mehrzahl von Signalblöcken ein Vergleichen einer ersten Nulldurchgangswertsequenz (322; 450), die eine Mehrzahl von Nulldurchgangswerten aufweist, und einer zweiten Nulldurchgangswertsequenz (324; 456) aufweist, die eine Mehrzahl von Nulldurchgangswerten aufweist,
    wobei die repräsentativen Werte des zweiten Typs ein spektrales Flachheitsmaß oder spektrale Flusswerte aufweisen, wobei die spektralen Flusswerte in der Form eines einzelnen quantitativen Wertes eine Änderung zwischen Spektren von jeweils zwei aufeinanderfolgenden Signalblöcken beschreiben;
    wobei die erste Nulldurchgangswertsequenz einem ersten Signalabschnitt der verschiedenen Signalabschnitte entspricht, und wobei die zweite Nulldurchgangswertsequenz einem zweiten Signalabschnitt der verschiedenen Signalabschnitte entspricht, und
    wobei die Nulldurchgangswerte die Nulldurchgangsinformation bilden;
    wobei die Vorrichtung dazu konfiguriert ist, ein Ergebnis des ersten Vergleichs und ein Ergebnis des zweiten Vergleichs zu vergleichen, um eine Zuverlässigkeitsinformation zu erhalten,
    wobei, wenn eine Diskrepanz zwischen den Ergebnissen einen bestimmten Schwellenwert überschreitet, ein Alarm erzeugt wird, der anzeigt, dass der Vergleich unzuverlässig ist;
    wobei die Vorrichtung dazu konfiguriert ist, ein oder mehrere Audiosignale oder ein oder mehrere Videosignale als das eine oder die mehreren Eingangssignale (112; 212; 312, 314) zu empfangen und die Nulldurchgangsinformation (114; 214; 322, 324) auf der Basis des einen oder der mehreren Audiosignale oder auf der Basis des einen oder der mehreren Videosignale zu bestimmen.
  2. Die Vorrichtung (100; 200; 300) gemäß Anspruch 1, wobei die Vorrichtung dazu konfiguriert ist, als die Nulldurchgangsinformation (114; 214; 322, 324) eine Gesamtanzahl von Nulldurchgängen oder eine Anzahl von ansteigenden Nulldurchgängen oder eine Anzahl von abfallenden Nulldurchgängen für eine Mehrzahl von Abschnitten (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) des zumindest einen des einen oder der mehreren Eingangssignale zu bestimmen.
  3. Die Vorrichtung (100; 200; 300) gemäß Anspruch 1, wobei die Vorrichtung dazu konfiguriert ist, als die Nulldurchgangsinformation (114; 214; 322, 324) eine Nulldurchgangsrate für eine Mehrzahl von Abschnitten (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) des zumindest einen des einen oder der mehreren Eingangssignale zu bestimmen.
  4. Die Vorrichtung gemäß einem der Ansprüche 1 bis 3, wobei die Vorrichtung (100; 200; 300) dazu konfiguriert ist, die Nulldurchgangsinformation (114; 214; 322, 324) derart zu bestimmen, dass zumindest ein Nulldurchgangswert jedem Abschnitt (422, 424, 426, 432, 434, 436; 522, 524, 526, 542, 544, 546) einer Mehrzahl von Abschnitten des zumindest einen des einen oder der mehreren Eingangssignale zugeordnet ist.
  5. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 4,
    wobei die Vorrichtung dazu konfiguriert ist, eine erste Nulldurchgangswertsequenz (114, 214, 322, 450) für den ersten Signalabschnitt (420; 520) zu bestimmen, wobei der erste Signalabschnitt eine Mehrzahl von Signalblöcken (422, 424, 426; 522, 524, 526) aufweist, und wobei die erste Nulldurchgangswertsequenz einen oder mehrere Nulldurchgangswerte aufweist, die jedem der Signalblöcke des ersten Signalabschnitts zugeordnet sind; und
    wobei die Vorrichtung dazu konfiguriert ist, eine zweite Nulldurchgangswertsequenz (114, 214, 324, 456) für den zweiten Signalabschnitt (430; 540) zu bestimmen, wobei der zweite Signalabschnitt eine Mehrzahl von Signalblöcken (432, 434, 436; 542, 544, 546) aufweist, und wobei die zweite Nulldurchgangswertsequenz einen oder mehrere Nulldurchgangswerte aufweist, die jedem der Signalblöcke des zweiten Signalabschnitts zugeordnet sind.
  6. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 5, wobei die Vorrichtung dazu konfiguriert ist, unter Verwendung der ersten Nulldurchgangswertsequenz (322; 450) und der zweiten Nulldurchgangswertsequenz (324; 456) einen Korrelationswert zu berechnen, um die Ähnlichkeitsinformation (122; 222; 332) zu erhalten; oder
    wobei die Vorrichtung dazu konfiguriert ist, unter Verwendung der ersten Nulldurchgangswertsequenz und der zweiten Nulldurchgangswertsequenz einen Durchschnittsbetragsdifferenzwert zu berechnen, um die Ähnlichkeitsinformation zu erhalten; oder
    wobei die Vorrichtung dazu konfiguriert ist, eine Norm einer Differenz zwischen der ersten Nulldurchgangswertsequenz und der zweiten Nulldurchgangswertsequenz zu berechnen, um die Ähnlichkeitsinformation zu erhalten; oder
    wobei die Vorrichtung dazu konfiguriert ist, einen euklidischen Abstand zwischen der ersten Nulldurchgangswertsequenz und der zweiten Nulldurchgangswertsequenz zu berechnen, um die Ähnlichkeitsinformation zu erhalten.
  7. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 5, wobei die Vorrichtung dazu konfiguriert ist, eine Mehrzahl von Differenzmaßwerten zwischen der ersten Nulldurchgangswertsequenz oder einem Abschnitt derselben und einer Mehrzahl von zeitverschobenen Versionen der zweiten Nulldurchgangswertsequenz oder zeitverschobenen Abschnitten derselben zu berechnen, um eine Information (232; 342) über eine Zeitverschiebung zu erhalten, die eine maximale Ähnlichkeit zwischen der ersten Nulldurchgangswertsequenz oder einem Abschnitt derselben und einer zeitverschobenen Version der zweiten Nulldurchgangswertsequenz oder einem Abschnitt derselben bereitstellt.
  8. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 6, wobei die Vorrichtung dazu konfiguriert ist, unter Verwendung der ersten Nulldurchgangswertsequenz (322; 450) und der zweiten Nulldurchgangswertsequenz (324; 456) eine Korrelationsfunktion zu berechnen, um eine Information (232; 342) über eine Zeitverschiebung zu erhalten, die eine maximale Ähnlichkeit zwischen der ersten Nulldurchgangswertsequenz oder einem Abschnitt derselben und einer zeitverschobenen Version der zweiten Nulldurchgangswertsequenz oder einem Abschnitt derselben bereitstellt; oder wobei die Vorrichtung dazu konfiguriert ist, unter Verwendung der ersten Nulldurchgangswertsequenz und der zweiten Nulldurchgangswertsequenz eine Durchschnittsbetragsdifferenzfunktion zu berechnen, um einen Abschnitt der ersten Nulldurchgangswertsequenz und zeitverschobene Abschnitte der zweiten Nulldurchgangswertsequenz zu vergleichen, und um eine Information über eine Zeitverschiebung (d) zu erhalten, die eine maximale Ähnlichkeit zwischen der ersten Nulldurchgangswertsequenz (x1(t); 322; 450)) oder einem Abschnitt derselben und einer zeitverschobenen Version (x2(t+d)) der zweiten Nulldurchgangswertsequenz (x2(t); 322; 456) oder einem Abschnitt derselben bereitstellt.
  9. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 8, wobei die Vorrichtung dazu konfiguriert ist, eine konstante Komponente aus der ersten Nulldurchgangswertsequenz (114; 214; 322) und/oder aus der zweiten Nulldurchgangswertsequenz (324) zu entfernen, bevor die erste Nulldurchgangswertsequenz und die zweite Nulldurchgangswertsequenz verglichen werden.
  10. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 9, wobei die Vorrichtung dazu konfiguriert ist, eine konstante Komponente aus dem einen oder den mehreren Eingangssignalen (112; 212; 312, 314) zu entfernen und/oder ein Hochpassfiltern an das eine oder die mehreren Eingangssignale anzulegen, bevor die Nulldurchgangsinformation bestimmt wird.
  11. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 10, wobei die repräsentativen Werte pro Signalblock einen positiven Nulldurchgangswert, der eine Anzahl von ansteigenden Nulldurchgängen in einem jeweiligen Signalblock beschreibt, und einen negativen Nulldurchgangswert aufweisen, der eine Anzahl von abfallenden Nulldurchgängen in einem jeweiligen Signalblock beschreibt.
  12. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 11, wobei die Vorrichtung dazu konfiguriert ist, einen der zwei repräsentativen Werte, die pro Signalblock bestimmt werden, unter Verwendung einer Frequenzbereichsdarstellung eines jeweiligen Signalblocks zu bestimmen.
  13. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 12, wobei die Vorrichtung dazu konfiguriert ist, spektrale Flachheitswerte, die eine Flachheit eines Spektrums eines jeweiligen Signalblocks beschreiben, als einen der zwei repräsentativen Werte zu bestimmen, die pro Signalblock bestimmt werden.
  14. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 13, wobei die Vorrichtung dazu konfiguriert ist, lineare Prädiktionskoeffizienten (LPC) für einen jeweiligen Signalblock als weitere repräsentative Werte zu bestimmen, die pro Signalblock bestimmt werden.
  15. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 14, wobei die Vorrichtung dazu konfiguriert ist, ein oder mehrere Audiosignale oder ein oder mehrere Videosignale als das eine oder die mehreren Eingangssignale (112; 212; 312, 314) zu empfangen und die Nulldurchgangsinformation (114; 214; 322, 324) auf der Basis des einen oder der mehreren Audiosignale oder auf der Basis des einen oder der mehreren Videosignale zu bestimmen.
  16. Die Vorrichtung (100; 200; 300) gemäß einem der Ansprüche 1 bis 15, wobei die Vorrichtung dazu konfiguriert ist, die Ähnlichkeitsinformation (122; 222; 332) zu verwenden, um eine Autokorrelationsinformation bezüglich eines Audiosignals oder eines Videosignals zu erhalten; oder
    wobei die Vorrichtung dazu konfiguriert ist, die Ähnlichkeitsinformation zu verwenden, um eine Kreuzkorrelationsinformation in Bezug auf zwei Audiosignale oder in Bezug auf zwei Videosignale zu erhalten; oder
    wobei die Vorrichtung dazu konfiguriert ist, die Ähnlichkeitsinformation zu verwenden, um eine Zeitverschiebung (232; 342) zu bestimmen, um eine bestmögliche Ausrichtung zwischen zwei Audiosignalen zu erhalten, oder um eine Zeitverschiebung (232; 342) zu bestimmen, um eine bestmögliche Ausrichtung zwischen zwei Videosignalen zu erhalten.
  17. Die Vorrichtung gemäß einem der Ansprüche 1 bis 16, wobei die Vorrichtung dazu konfiguriert ist, eine erste Nulldurchgangsinformation unter Verwendung einer ersten Blockgröße in einem ersten Schritt zu bestimmen und den Vergleich auf der Basis der ersten Nulldurchgangsinformation durchzuführen, um eine Information zu erhalten, die eine Zeitverschiebung zwischen ähnlichen Regionen des einen oder der mehreren Eingangssignale darstellt, und
    wobei die Vorrichtung dazu konfiguriert ist, eine zweite Nulldurchgangsinformation unter Verwendung einer zweiten Blockgröße in einem zweiten Schritt zu bestimmen, um eine verfeinerte Information zu erhalten, die eine Zeitverschiebung zwischen ähnlichen Regionen des einen oder der mehreren Eingangssignale darstellt,
    wobei ein Bereich, für den die zweite Nulldurchgangsinformation bestimmt wird, von der Information abhängt, die eine Zeitverschiebung zwischen ähnlichen Regionen des einen oder der mehreren Eingangssignale darstellt, die in dem ersten Schritt erhalten werden, und wobei die zweite Blockgröße kleiner als die erste Blockgröße ist.
  18. Ein Verfahren (700) zum Bestimmen einer Ähnlichkeitsinformation auf der Basis eines oder mehrerer Eingangssignale, die Audiosignale oder Videosignale sind,
    wobei das Verfahren ein Bestimmen (710) einer Nulldurchgangsinformation aufweist, die eine Anzahl von Nulldurchgängen in einem jeweiligen Abschnitt für eine Mehrzahl von Abschnitten des zumindest einen des einen oder der mehreren Eingangssignale beschreibt, und
    wobei das Verfahren ein Durchführen (720) eines Vergleichs auf der Basis der Nulldurchgangsinformation aufweist, um die Ähnlichkeitsinformation zu bestimmen, die eine Ähnlichkeit zwischen verschiedenen Signalabschnitten eines einzelnen Eingangssignals oder zwischen Signalabschnitten von zwei zu vergleichenden Signalen beschreibt, wobei jeder der verschiedenen Signalabschnitte eine Mehrzahl von Signalblöcken aufweist;
    wobei das Verfahren ein Bestimmen von zwei oder mehr repräsentativen Werten pro Signalblock für die Mehrzahl von Signalblöcken aufweist, wobei die zwei oder mehr repräsentativen Werte Merkmale der Signalblöcke beschreiben;
    wobei das Verfahren ein Durchführen des Vergleichs auf der Basis der zwei oder mehr repräsentativen Werte aufweist, um die Ähnlichkeitsinformation zu bestimmen,
    wobei der Vergleich auf der Basis der zwei oder mehr repräsentativen Werte basierend auf einem ersten Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines ersten Typs für die Mehrzahl von Signalblöcken und basierend auf einem zweiten Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines zweiten Typs für die Mehrzahl von Signalblöcken durchgeführt wird,
    wobei der erste Vergleich auf der Basis einer Sequenz von repräsentativen Werten eines ersten Typs für eine Mehrzahl von Signalblöcken ein Vergleichen einer ersten Nulldurchgangswertsequenz (322; 450), die eine Mehrzahl von Nulldurchgangswerten aufweist, und einer zweiten Nulldurchgangswertsequenz (324; 456) aufweist, die eine Mehrzahl von Nulldurchgangswerten aufweist,
    wobei die repräsentativen Werte des zweiten Typs ein spektrales Flachheitsmaß oder spektrale Flusswerte aufweisen, wobei die spektralen Flusswerte in der Form eines einzelnen quantitativen Wertes eine Änderung zwischen Spektren von jeweils zwei aufeinanderfolgenden Signalblöcken beschreiben;
    wobei die erste Nulldurchgangswertsequenz einem ersten Signalabschnitt der verschiedenen Signalabschnitte entspricht, und wobei die zweite Nulldurchgangswertsequenz einem zweiten Signalabschnitt der verschiedenen Signalabschnitte entspricht, und
    wobei die Nulldurchgangswerte die Nulldurchgangsinformation bilden,
    wobei ein Ergebnis des ersten Vergleichs und ein Ergebnis des zweiten Vergleichs verglichen werden, um eine Zuverlässigkeitsinformation zu erhalten;
    wobei, wenn eine Diskrepanz zwischen den Ergebnissen einen bestimmten Schwellenwert überschreitet, ein Alarm erzeugt wird, der anzeigt, dass der Vergleich unzuverlässig ist;
    wobei das Verfahren ein Empfangen eines oder mehrerer Audiosignale oder eines oder mehrerer Videosignale als das eine oder die mehreren Eingangssignale (112; 212; 312, 314) und ein Bestimmen der Nulldurchgangsinformation (114; 214; 322, 324) auf der Basis des einen oder der mehreren Audiosignale oder auf der Basis des einen oder der mehreren Videosignale aufweist.
  19. Ein Computerprogramm zum Durchführen des Verfahrens gemäß Anspruch 18, wenn das Computerprogramm auf einem Computer läuft.
HK19122912.9A 2016-05-20 2017-05-18 Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program HK1262781B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP16170744.3 2016-05-20
EP16199181.5 2016-11-16

Publications (2)

Publication Number Publication Date
HK1262781A1 HK1262781A1 (en) 2020-01-17
HK1262781B true HK1262781B (en) 2025-05-09

Family

ID=

Similar Documents

Publication Publication Date Title
JP7317888B2 (ja) 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム
CN110136744B (zh) 一种音频指纹生成方法、设备及存储介质
US9679579B1 (en) Systems and methods facilitating selective removal of content from a mixed audio recording
JP5826291B2 (ja) 音声信号からの特徴フィンガープリントの抽出及びマッチング方法
US20090177466A1 (en) Detection of speech spectral peaks and speech recognition method and system
CN112446329A (zh) 一种时变结构瞬时频率确定方法、系统、装置及存储介质
KR20190069198A (ko) 다채널 오디오 신호에서 음원을 추출하는 장치 및 그 방법
US20150304705A1 (en) Synchronization of different versions of a multimedia content
HK1262781B (en) Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program
HK1262781A1 (en) Apparatus for determining a similarity information, method for determining a similarity information, apparatus for determining an autocorrelation information, apparatus for determining a cross-correlation information and computer program
EP2835799A1 (de) Verfahren und Vorrichtung zur Detektion eines Wasserzeichensymbols in einem Abschnitt einer empfangenen Version eines Audiosignals mit Wasserzeichen
Chae et al. Small-Footprint Convolutional Neural Network with Reduced Feature Map for Voice Activity Detection
EP4227942B1 (de) Detektion von synchronisationssignalen (syncmark) unter verwendung von multifrequenzsinusoidaler (mfs)-signalbasierter filterung
US20250069618A1 (en) Method and System for Identifying Similarity Between Two Audio Tracks
US20080275710A1 (en) Scale Searching for Watermark Detection
Tao et al. Audio Tampering Detection Based on Quantization Artifacts
CN116092521A (zh) 特征频点识别模型训练和音频指纹识别方法、设备及产品
CN116582396A (zh) 使用基于倍频正弦(mfs)信号的滤波的同步信号(同步标记)检测
CN103811011A (zh) 音频弦波检测方法和装置
Shiv Improved frequency estimation in sinusoidal models through iterative linear programming schemes
Miranda et al. Finding audio fingerprinter using GPU