[go: up one dir, main page]

WO2015118262A1 - Method for synchronization of a musical score with an audio signal - Google Patents

Method for synchronization of a musical score with an audio signal Download PDF

Info

Publication number
WO2015118262A1
WO2015118262A1 PCT/FR2015/050260 FR2015050260W WO2015118262A1 WO 2015118262 A1 WO2015118262 A1 WO 2015118262A1 FR 2015050260 W FR2015050260 W FR 2015050260W WO 2015118262 A1 WO2015118262 A1 WO 2015118262A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio signal
score
musical score
representation
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/FR2015/050260
Other languages
French (fr)
Inventor
Michaël BROUARD
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of WO2015118262A1 publication Critical patent/WO2015118262A1/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results

Definitions

  • the present invention relates to the field of synchronization of a graphic or sound representation of a musical score with an audio signal acquired in real time and the display of this synchronization on the graphical display of the score.
  • US Patent 8431809 describing a method for displaying music files, including an electronic music display system for receiving, storing and displaying music files, and display programming.
  • electronic music in accordance with the order and tempo specified by the user.
  • a starting point indicator is configured to display a position in the score that will be played by a user, and a page change indicator is configured to display a change on a subsequent page.
  • US Patent US 2008196575 describes a method and a system for displaying a digital partition that allows the user to follow the note that he currently plays by the synchronized movement of an indicator on the display. of the digital partition.
  • Each note, chord, or time slice of constant duration in the music score data file is adapted to the note, chord, or time slice in the audio data file.
  • a single media file is generated, which contains the synchronized content composed of the audio data file and the data file of the digital music score, so that when the media is played, the indicator is moved to the display of the music file.
  • digital partition corresponding to the transmitted audio signal.
  • US Patent 2011230987 discloses a method of synchronizing an audio file and a video file in real time in a multimedia device.
  • the chromatic characteristics are calculated from the audio signal of the audio file and the audio signal signal of the reference video file, in order to determine an optimal alignment path between the audio signal of the audio file and the signal of the audio track of the audio file. video file.
  • US Pat. No. 2,010,276,333 describes a method of media synchronization comprising a step of determining a ratio of time differences.
  • a media stream is broadcast by a media source.
  • a client device is used to capture an extract of the media stream broadcast by the media source.
  • a time difference ratio which is associated with a rate at which the media stream is broadcast by the media source, is determined.
  • a spectrogram of the captured media extract is presented with a plurality of pairs of spectral peaks of the fingerprint, while a spectrogram of a previously recorded reference medium is also presented with a plurality of pairs of spectral peaks of the fingerprint.
  • a ratio is calculated by comparing the time difference between a pair of spectral peaks of the spectrogram of the captured media extract, at the time difference between a pair of spectral peaks of the previously recorded reference media spectrogram. Then the ratios of the other pairs of peaks are calculated in the same way and the series of ratios thus calculated generates a ratio histogram. Finally, the highest ratio of the histogram is referred to as the ratio of time differences for synchronization between the extract and the reference. This ratio of time differences characterizes the ratio of the relative speeds between the two media.
  • the chromatographic algorithm does not synchronize accurately in real time.
  • a chromatogram is synthesized by running a sequence of chroma vectors across the time axis with a time window. Synchronization is achieved by connecting the spatial positions in the chromatogram of the audio signal played by the user with the audio signal, or reference video. Due to the approximate character of the chroma vectors, they lack precision. In order to achieve a certain accuracy, synchronization requires matching a larger range of spatial positions in the chromatogram, which leads to a delay. Moreover, it does not detect the error effectively.
  • the invention relates, according to its most general meaning, to a new method intended to precisely qualify the acquired audio signal and to perform the transformation of the musical score into different tempos, which allows to synchronize both precisely in real time.
  • the invention relates to a synchronization method of a graphic or sound representation of a musical score with an audio signal acquired in real time and corresponding to the interpretation of said musical score.
  • the method includes generating a digital signature of a time sequence of said acquired audio signal, comparing said digital signature with the digital signatures of said musical score, for a plurality of tempo, for calculating a correlation score for each of said digital signatures, determining an estimated time corresponding to the best correlation, at least periodically determining the position of the time sequence of said audio signal with respect to said representation of said musical score, controlling the displacement of said position with respect to said representation of said score according to said estimated tempo corresponding to the best correlation score, periodically recalculating said correlation score.
  • the digital signature is the spectral signature and not the chromatic one.
  • the acquired audio signal is processed by the Fourier transform, and then processed by a logarithmic function to better weight the low energy notes (treble, bass).
  • the standardized cross correlation algorithm JP Lewis is used to calculate a correlation score.
  • a sound cancellation procedure is performed by anticipating the synthetic audio signal produced from the estimated tempo, and subtracting it to compare the remaining portion of the signal spectral. audio to that of the score.
  • the identification and display of the musical score are made by recognizing the attachment of the notes by analyzing the dashed graph; by the connection of the connecting arcs on the result of the computation of the barycenter and the direction of curvature, by the reconstruction in M systems of the partition originally organized in N systems.
  • a dynamic display is achieved by the immediate replacement of the system, which is detected as already played, to that which will be played by a user.
  • a cursor indicating the position is moved relative to the representation of the musical score according to said estimated tempo corresponding to the best correlation score, and the cursor on the graphical display of the score indicates the displacement of the position, the change of a page, or a recovery.
  • Electronic equipment comprising a display, an input for an audio signal and a computer characterized in that said computer is controlled to execute a synchronization program of a graphic or sound representation of a musical score with an audio signal acquired in real time and corresponding to the interpretation of said musical score, this synchronization program consisting in: producing a digital signature of a temporal sequence of said acquired audio signal,
  • the position of the temporal sequence of said audio signal is determined periodically with respect to the representation of the musical score by periodically recalculating the correlation score. So the tempo is checked regularly.
  • the invention proceeds to a logarithmic processing of the acquired signal to better weight the low energy grades (treble, bass).
  • the invention is implemented using a calculation by a fast algorithm that allows for increased reactivity in real time, such as the standardized cross-correlation algorithm.
  • Figure 1 is a diagram of the principle of the synchronization method according to the invention.
  • FIGS. 2a, 2b and 2c are the representations of the processing steps of the audio signal acquired according to the invention.
  • Figures 3a, 3b and 3c are the spectral signatures of a musical score at different tempos according to the invention.
  • FIGS. 4a, 4b, 4c and 4d represent the correlation scores as a function of the position and of the different tempos according to the invention
  • Figure 5 illustrates the displacement of a cursor on the graphical display of the score
  • FIG. 6 is a diagram of the principle of the synchronization method with the procedure for canceling the sound emitted by a loudspeaker
  • FIGS. 7a, 7b, 7c and 7d represent the method of a dynamic display
  • Figures 8a and 8b illustrate the attachment of the signs remaining outside the five main lines of the scope.
  • FIG. 1 represents the synchronization method, which comprises the following steps: the sampling of the audio signal, the creations of the digital signatures of the audio signal and the musical score, the comparison of the two digital signatures and the display of the result of the synchronization on the screen.
  • an audio signal is recorded by a microphone.
  • the processing of each sound window is done with an overlap at 75% from one window to the other.
  • the audio signal is picked up by the microphone and is amplified, digitized and stored in a RAM, for temporary storage.
  • the spectral signature for each note and instrument is also pre-recorded in RAM for quick access.
  • the spectral analysis of the sampling window of the audio signal is performed by the processor.
  • a digital signature of a temporal sequence of this acquired audio signal is produced.
  • the reconstruction of the digital signatures of the musical score is performed with a plurality of different tempos.
  • a correlation method is performed by comparing the digital signature of the audio signal and that of the musical score of each different tempo respectively. A correlation score for each comparison is calculated.
  • the location position in the score and the tempo of the user of the instrument (or player) are determined, which makes it possible to move the cursor on the display of the score corresponding to the tempo from the game position in the screen.
  • the display of the dynamic partition is adjusted by replacing the system played and switching to a new page.
  • the hard disk is used to pre-record the information of the score: notes, rhythms, information pages and covers and geometric positions of the notes. This information is processed by the processor to reconstruct the digital signature of the partition.
  • the acquired audio signal is processed in several steps. First, it is necessary to apply windowing, which consists in multiplying the window by a predetermined function, in order to reduce the effects of noise.
  • FIG. 1 shows the result of the raw energy transform for a given window size.
  • the X axis represents the frequency while the Y axis represents the energy.
  • a fast Fourier transform is a technical operation performed on a value window. It gives a result whose size is half that of the analyzed window.
  • the amplitude of the fast Fourier transform is proportional to the size of the window, while the energy is the amplitude squared of the fast Fourier transform.
  • the total energy of a window is calculated, and then divided by the number of points in that window to determine a value of the average energy. Therefore, the average energy is different for each window size of the fast Fourier transform corresponding respectively to the low frequencies, the medium frequencies and the high frequencies. Then a logarithmic function is applied to each window with their respective average energy. Each point of the window is then passed to the log according to the formula:
  • V log10 (Point Value / Average Energy)
  • Figure 2b shows the result of the calculation of the fast energy Fourier transform at the logarithmic scale. The high frequency component is more prominent.
  • the final stack represents only a selected part of the calculation of the fast Fourier transform of each window, which is the condensed frequency bands interesting to analyze.
  • a wider time analysis window - in 2 seconds - is selected.
  • the X axis represents the sequence of 2 seconds
  • the Y axis represents the frequency
  • the 2D contours represent the value of the energy.
  • the presentation of the discrete energy contour as a function of time and frequency is called spectral.
  • the reconstruction of the digital signature of the partition is performed from prerecorded raw spectral signatures for each note and each instrument, then stored in RAM for quick access.
  • the log is applied in the same way to the sums of the spectral representations of the notes according to the rhythm and the tempo.
  • the rhythm designates notions of ebony, black, and white type temporality, while the tempo defines the general appearance of a piece.
  • FIG. 3a is a spectral of a slow tempo signature.
  • the X axis represents the course of time
  • the Y axis represents the frequencies
  • contours represent logarithmic energy.
  • the two spectrals are compared using the standardized cross correlation algorithm. In order to quantify the result of this comparison, a correlation score is calculated. In the ideal situation with two identical spectrals, the score is 1, which means a perfect correlation.
  • a large window is chosen by calculating the scores at different tempos to locate the playing position of the musician and the corresponding tempo. The higher the score, the closer the musician's game approaches what should be heard. If the peak score is high enough, the position is retained and the tempo too. This gives a good evaluation of the tempo and the initial position.
  • Figures 4a, 4b and 4c illustrate comparison scores as a function of position for the slow, normal and fast tempo.
  • Figure 4d illustrates the overlap of the comparison scores at the three tempos. As soon as the prior similarity threshold is exceeded, the normal tempo and the corresponding position are retained.
  • FIG. 5 illustrates the displacement of the cursor on the display of the score corresponding to the tempo and the position determined by the correlation score which exceeds the similarity threshold.
  • FIG. 6 illustrates the method of synchronization with a procedure during which different parts of the score are distinguished (for example the part played by the left hand and the part played by the right hand) and the sound emitted by a top is canceled.
  • the synthetic creation of the synchronized output sound signal is performed in the processor.
  • the speaker gives the sound signal in the output.
  • the sound signals emitted by the instrument and the loudspeaker are recorded in the microphone during the sampling process.
  • the synthetic spectral is subtracted, the remaining part of the spectral is compared to the spectral of the partition.
  • this invention is also suitable for applications such as the identification and display of the musical score. In this case, it proceeds to a processing of the partition organized in N systems of staves (or single range) on a support such as a page, to reconstruct M scope systems on the display screen.
  • the following example illustrates the display in 3 systems of scope per page on the screen music score, which was organized in 4 systems per page scope according to the traditional edition.
  • FIG. 7a illustrates the traditional two-page musical score with eight litter systems, in which they contain covers at different locations.
  • Figure 7b shows the reading order of the litter systems with times.
  • Figure 7c shows an example of the display of three scope systems per page.
  • the progress of the system display is in positions 1, 2 and 3 successively.
  • Figure 4 illustrates the dynamic system replacement sequence for each position.
  • Figure 8a illustrates the recognition of very serious notes by the graphical analysis of the dashes.
  • a sixteenth note linked to it is determined by the attachment of the system at the top.
  • FIG. 8b illustrates the recognition of connecting arcs, by the calculation of the center of gravity and the direction of curvature.
  • the connecting arc in gray, whose direction of curvature is upward, is attached to the upper system. While the black connecting arc of the direction of curvature downward is attached to the lower system.
  • the invention relates to a method for synchronizing a graphic representation, in particular of a musical score, with an audio signal acquired in real time, and corresponding to the interpretation of the aforementioned musical score. It is not a question of looking for the identification of a captured media extract in a database of a partition collection, but of providing assistance to an interpreter to facilitate automating the tracking of a known partition, for example to allow an instrumentalist to interpret his part synchronously with the reproduction of an orchestral recording.
  • the invention is based on a technical solution ensuring high robustness of the treatment. It consists in constructing, for each partition, a plurality of signatures each corresponding to a given speed of interpretation of this partition.
  • the method consists in calculating the signature corresponding to this execution speed by the user, and in the collection of speed signatures, which has the best correlation rate. with the signature of the partition executed by the user.
  • This solution associates a single signature with the same score and starts from a questionable postulate according to which there is a homothetic relationship between the tempo and the signature.
  • the invention in the present application provides a solution for abstaining from this postulate. It provides a plurality of signatures for the same partition at different speeds. And it allows to select the right speed for synchronization, even in cases where the variation of the signature is not directly representative of the variation of the speed.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

The present invention relates to a method for synchronization of a graphical or audible representation of a musical score with an audio signal acquired in real-time and corresponding to the performance of said musical score. This method consists of producing a spectral signature of a temporal sequence of said acquired audio signal, comparing said spectral signature with the spectral signatures of said musical score for a plurality of tempos, in order to calculate a correlation rating for each of said spectral signatures, and determining an estimated tempo corresponding to the best correlation.

Description

Procédé de synchronisation d'une partition musicale avec un signal audio Domaine de 1 ' invention Method of synchronizing a musical score with an audio signal Field of the invention

[0001] La présente invention concerne le domaine de la synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio acquis en temps réel et l'affichage de cette synchronisation sur l'affichage graphique de la partition . The present invention relates to the field of synchronization of a graphic or sound representation of a musical score with an audio signal acquired in real time and the display of this synchronization on the graphical display of the score.

Etat de la technique State of the art

[0002] On connaît dans l'art antérieur le brevet EP2387029 décrivant un système qui affiche la partie de la partition musicale qui va être jouée par un utilisateur, dite partie active, en permettant le repositionnement de la partie qui est déjà affichée sur un support, selon un code de temps/ métronome interne ou externe. Dans ce système, une application logicielle déplace la partie affichée afin de correspondre à la partie active de la partition musicale. A cet effet, ce système utilise un fichier de données décrivant les positions relatives de chaque portée musicale et les indications musicales telles que des répétitions ou des codas, et des données de temps correspondant au début et à la fin des portées respectives dans la partition de musique. It is known in the prior art patent EP2387029 describing a system that displays the part of the musical score that will be played by a user, said active part, allowing the repositioning of the part that is already displayed on a support , according to an internal or external time code / metronome. In this system, a software application moves the displayed part to match the active part of the music score. For this purpose, this system uses a data file describing the relative positions of each musical staff and the musical indications such as repetitions or codas, and time data corresponding to the beginning and the end of the respective staves in the score of music.

[0003] On connaît également le brevet américain US 8431809 décrivant un procédé pour afficher des fichiers musicaux, comprenant un système d'affichage de la musique électronique pour recevoir, stocker et afficher les fichiers de musique, et une programmation de l'affichage de la musique électronique conformément à l'ordre et au tempo spécifiés par l'utilisateur. Un indicateur d'un point de départ est configuré pour afficher une position dans la partition qui va être jouée par un utilisateur, et un indicateur de changement de page est configuré pour afficher un changement à une page suivante. Also known is US Patent 8431809 describing a method for displaying music files, including an electronic music display system for receiving, storing and displaying music files, and display programming. electronic music in accordance with the order and tempo specified by the user. A starting point indicator is configured to display a position in the score that will be played by a user, and a page change indicator is configured to display a change on a subsequent page.

[0004] Le brevet américain US 2008196575 décrit un procédé et un système pour l'affichage d'une partition numérique qui permet à l'utilisateur de suivre la note qu'il joue actuellement par le déplacement synchronisé d'un indicateur sur l'affichage de la partition numérique. Chaque note, accord, ou tranche de temps de durée constante dans le fichier de données de la partition musicale est adaptée à la note, la corde ou la tranche de temps dans le fichier de donnée audio. Ensuite un seul fichier multimédia est généré, qui contient le contenu synchronisé composé du fichier de données audio et du fichier de données de la partition musicale numérique, de sorte que lorsque le média est joué, l'indicateur est déplacé sur l'affichage de la partition numérique correspondant au signal audio émis.  [0004] US Patent US 2008196575 describes a method and a system for displaying a digital partition that allows the user to follow the note that he currently plays by the synchronized movement of an indicator on the display. of the digital partition. Each note, chord, or time slice of constant duration in the music score data file is adapted to the note, chord, or time slice in the audio data file. Then a single media file is generated, which contains the synchronized content composed of the audio data file and the data file of the digital music score, so that when the media is played, the indicator is moved to the display of the music file. digital partition corresponding to the transmitted audio signal.

[0005] Le brevet américain US 2011230987 décrit un procédé de la synchronisation d'un fichier audio et d'un fichier vidéo en temps réel dans un appareil multimédia. Les caractéristiques chromas sont calculées à partir du signal audio du fichier audio et du signal de la piste audio du fichier vidéo de référence, afin de déterminer un trajet d'alignement optimal entre le signal audio du fichier audio et le signal de la piste audio du fichier vidéo.  US Patent 2011230987 discloses a method of synchronizing an audio file and a video file in real time in a multimedia device. The chromatic characteristics are calculated from the audio signal of the audio file and the audio signal signal of the reference video file, in order to determine an optimal alignment path between the audio signal of the audio file and the signal of the audio track of the audio file. video file.

[0006] Le brevet américain US 20110276333 décrit un procédé de synchronisation de média comprenant une étape de détermination d'un ratio de différences de temps. Un flux de média est diffusé par une source de média. Un dispositif client est utilisé afin de capturer un extrait du flux de média diffusé par la source de média. Un ratio de différences de temps, qui est associé à une vitesse à laquelle le flux de média est diffusé par la source de média, est déterminé. [0006] US Pat. No. 2,010,276,333 describes a method of media synchronization comprising a step of determining a ratio of time differences. A media stream is broadcast by a media source. A client device is used to capture an extract of the media stream broadcast by the media source. A time difference ratio, which is associated with a rate at which the media stream is broadcast by the media source, is determined.

[ 0007 ] Dans le paragraphe 56 du brevet américain In paragraph 56 of the US patent

US 20110276333 , le calcul du ratio de différences relatives de tempo est illustré par un exemple concret. Dans un premier temps, un spectrogramme de l'extrait de média capturé est présenté avec une pluralité de paires de pics spectraux de l'empreinte digitale, tandis qu'un spectrogramme d'un média de référence préalablement enregistré est présenté également avec une pluralité de paires de pics spectraux de l'empreinte digitale. Dans un deuxième temps, un ratio est calculé en comparant la différence de temps entre une paire des pics spectraux du spectrogramme de l'extrait de média capturé, à la différence de temps entre une paire des pics spectraux du spectrogramme du média référence préalablement enregistré. Puis on calcule de la même façon les ratios des autres paires de pics et la série des ratios ainsi calculés génère un histogramme de ratio. Enfin, le ratio le plus élevé de l'histogramme est désigné comme étant le ratio de différences de temps pour la synchronisation entre l'extrait et la référence. Ce ratio de différences de temps caractérise le rapport des vitesses relatives entre les deux médias. US 20110276333, the calculation of the ratio of relative differences in tempo is illustrated by a concrete example. Firstly, a spectrogram of the captured media extract is presented with a plurality of pairs of spectral peaks of the fingerprint, while a spectrogram of a previously recorded reference medium is also presented with a plurality of pairs of spectral peaks of the fingerprint. In a second step, a ratio is calculated by comparing the time difference between a pair of spectral peaks of the spectrogram of the captured media extract, at the time difference between a pair of spectral peaks of the previously recorded reference media spectrogram. Then the ratios of the other pairs of peaks are calculated in the same way and the series of ratios thus calculated generates a ratio histogram. Finally, the highest ratio of the histogram is referred to as the ratio of time differences for synchronization between the extract and the reference. This ratio of time differences characterizes the ratio of the relative speeds between the two media.

Inconvénients de l'art antérieur [ 0008 ] Les solutions de l'art antérieur présentent des difficultés d'interaction avec l'utilisateur et des problèmes de synchronisation. Lorsque la partition musicale est affichée, l'indicateur est déplacé à partir d'une fiche de données audio préenregistrée. Or, l'utilisateur d'un instrument a besoin de déterminer en temps réel la position de sa performance sur l'affichage de la partition musicale, de choisir de jouer les reprises de manière autonome, de répéter certaines parties volontairement, et de faire évaluer son niveau de performance. Aucune technique de l'art antérieur ne donne de solution satisfaisante. Disadvantages of the Prior Art [0008] The solutions of the prior art present difficulties of interaction with the user and synchronization problems. When the music score is displayed, the indicator is moved from a prerecorded audio data sheet. However, the user of an instrument needs to determine in real time the position of his performance on the display of the musical score, to choose to play the covers autonomously, to repeat certain parts voluntarily, and to evaluate his level of performance. No technique of the prior art gives a satisfactory solution.

[ 0009 ] De plus, pour satisfaire les besoins précités de l'utilisateur, il est nécessaire de résoudre des problèmes liés à la qualité et à la vitesse du procédé de synchronisation. Or, les algorithmes de synchronisation existants possèdent en général quelques problèmes .  In addition, to satisfy the aforementioned needs of the user, it is necessary to solve problems related to the quality and speed of the synchronization process. However, the existing synchronization algorithms generally have some problems.

[ 00010 ] Pour certains algorithmes, il est nécessaire de connaître le point de départ et/ou le point de fin pour les signaux audio et visuels, points où les deux signaux audio et visuel sont synchronisés. Puis il est nécessaire d'établir la correspondance entre les deux signaux audio et visuels entre les points de départ et de fin. Or, il est obligatoire d'avoir les points de références en avance. Il n'est donc ainsi pas possible de faire la synchronisation en ligne et en temps réel.  For some algorithms, it is necessary to know the starting point and / or the end point for the audio and visual signals, points where the two audio and visual signals are synchronized. Then it is necessary to establish the correspondence between the two audio and visual signals between the starting and ending points. However, it is mandatory to have reference points in advance. It is thus not possible to synchronize online and in real time.

[ 00011 ] L'algorithme chromatographique ne permet pas de synchroniser précisément en temps réel. En général, un chromatogramme est synthétisé par le déroulement d'une séquence de vecteurs de chroma à travers l'axe du temps avec une fenêtre temporelle. Une synchronisation est réalisée en reliant les positions spatiales dans le chromatogramme du signal audio joué par l'utilisateur avec le signal audio, ou vidéo de référence. En raison du caractère approximatif des vecteurs de chroma, ils manquent de précision. Afin d'atteindre une certain précision, la synchronisation impose de mettre en correspondance une plage plus grande des positions spatiales dans le chromatogramme, ce qui conduit à un retard. Du plus, il ne détecte pas l'erreur de manière efficace. The chromatographic algorithm does not synchronize accurately in real time. In general, a chromatogram is synthesized by running a sequence of chroma vectors across the time axis with a time window. Synchronization is achieved by connecting the spatial positions in the chromatogram of the audio signal played by the user with the audio signal, or reference video. Due to the approximate character of the chroma vectors, they lack precision. In order to achieve a certain accuracy, synchronization requires matching a larger range of spatial positions in the chromatogram, which leads to a delay. Moreover, it does not detect the error effectively.

Solution apportée par l'invention Solution provided by the invention

[00012] Afin de remédier aux inconvénients de l'art antérieur, l'invention concerne selon son acception la plus générale un procédé nouveau destiné à qualifier précisément le signal audio acquis et pour réaliser la transformation de la partition musicale en tempos différents, qui permet de synchroniser les deux précisément en temps réel. In order to overcome the drawbacks of the prior art, the invention relates, according to its most general meaning, to a new method intended to precisely qualify the acquired audio signal and to perform the transformation of the musical score into different tempos, which allows to synchronize both precisely in real time.

[00013] Conformément à la revendication principale, l'invention concerne un procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio acquis en temps réel et correspondant à l'interprétation de ladite partition musicale. Ce procédé consiste à produire une signature numérique d'une séquence temporelle dudit signal audio acquis, à comparer ladite signature numérique avec les signatures numériques de ladite partition musicale, pour une pluralité de tempo, pour calculer un score de corrélation pour chacune desdites signatures numériques, à déterminer un tempo estimé correspondant à la meilleure corrélation, à déterminer au moins périodiquement la position de la séquence temporelle dudit signal audio par rapport à ladite représentation de ladite partition musicale, à commander le déplacement de ladite position par rapport à ladite représentation de ladite partition musicale en fonction dudit tempo estimé correspondant au meilleur score de corrélation, à recalculer périodiquement ledit score de corrélation.  According to the main claim, the invention relates to a synchronization method of a graphic or sound representation of a musical score with an audio signal acquired in real time and corresponding to the interpretation of said musical score. The method includes generating a digital signature of a time sequence of said acquired audio signal, comparing said digital signature with the digital signatures of said musical score, for a plurality of tempo, for calculating a correlation score for each of said digital signatures, determining an estimated time corresponding to the best correlation, at least periodically determining the position of the time sequence of said audio signal with respect to said representation of said musical score, controlling the displacement of said position with respect to said representation of said score according to said estimated tempo corresponding to the best correlation score, periodically recalculating said correlation score.

[00014] De préférence, la signature numérique est la signature spectrale et non pas chromatique. [00015] Selon les caractéristiques de l'invention, le signal audio acquis est traité par le transformée de Fourier, et ensuite traité par une fonction logarithmique pour mieux pondérer les notes de faible énergie (aigus, graves ) . [00014] Preferably, the digital signature is the spectral signature and not the chromatic one. According to the characteristics of the invention, the acquired audio signal is processed by the Fourier transform, and then processed by a logarithmic function to better weight the low energy notes (treble, bass).

[00016] De préférence, l'algorithme corrélation croisé normé JP Lewis est utilisé pour calculer un score de corrélation. [00016] Preferably, the standardized cross correlation algorithm JP Lewis is used to calculate a correlation score.

[00017] Selon les caractéristiques de l'invention, deux modes de synchronisation existent : According to the features of the invention, two modes of synchronization exist:

- Mode global pour déterminer la position initiale absolue de l'utilisateur de l'instrument avec des fenêtres temporelles longues et un seuil de similitude élevé ; - Mode local suivi de partition en temps réel et plus tolérant aux erreurs, avec des fenêtres temporelles courtes et un seuil de similitude moins important. - Global mode to determine the absolute initial position of the user of the instrument with long time windows and a high similarity threshold; - Local mode followed by partition in real time and more tolerant to errors, with short time windows and a similar threshold of similarity.

[00018] Selon un mode de réalisation préféré de l'invention , une procédure de l'annulation de son est réalisé par anticiper le signal audio synthétique produit à partir du tempo estimé, et le soustraite pour comparer la partie restante de la spectrale du signal audio à celle de la partition. According to a preferred embodiment of the invention, a sound cancellation procedure is performed by anticipating the synthetic audio signal produced from the estimated tempo, and subtracting it to compare the remaining portion of the signal spectral. audio to that of the score.

[00019] Selon un mode de mise en œuvre particulièrement avantageux, l'identification et l'affichage de la partition musicale sont réalisés, par la reconnaissance du rattachement des notes en analysant le graphique des tirets; par la rattachement des arcs de liaison sur le résulta du calcul du barycentre et du sens de courbure, par la reconstruction en M systèmes de la partition originalement organisée en N systèmes. [00020] Dans un mode de réalisation, un affichage dynamique est réalisé par le remplacement immédiate du système, qui est détecté comme déjà joué, au celui qui va être joué par un utilisateur. [00021] Un curseur indiquant la position est déplacé par rapport à la représentation de la partition musicale en fonction dudit tempo estimé correspondant au meilleur score de corrélation, et le curseur sur l'affichage graphique de la partition indique le déplacement de la position, le changement d'une page, ou une reprise. According to a particularly advantageous embodiment, the identification and display of the musical score are made by recognizing the attachment of the notes by analyzing the dashed graph; by the connection of the connecting arcs on the result of the computation of the barycenter and the direction of curvature, by the reconstruction in M systems of the partition originally organized in N systems. In one embodiment, a dynamic display is achieved by the immediate replacement of the system, which is detected as already played, to that which will be played by a user. A cursor indicating the position is moved relative to the representation of the musical score according to said estimated tempo corresponding to the best correlation score, and the cursor on the graphical display of the score indicates the displacement of the position, the change of a page, or a recovery.

[00022] Equipement électronique comportant un afficheur, une entrée pour un signal audio et un calculateur caractérisé en ce que ledit calculateur est commandé pour exécuter un programme de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio acquis en temps réel et correspondant à l'interprétation de ladite partition musicale, ce programme de synchronisation consistant : - à produire une signature numérique d'une séquence temporelle dudit signal audio acquis, [00022] Electronic equipment comprising a display, an input for an audio signal and a computer characterized in that said computer is controlled to execute a synchronization program of a graphic or sound representation of a musical score with an audio signal acquired in real time and corresponding to the interpretation of said musical score, this synchronization program consisting in: producing a digital signature of a temporal sequence of said acquired audio signal,

- à comparer ladite signature numérique avec les signatures numériques de ladite partition musicale, pour une pluralité de tempo, pour calculer un score de corrélation pour chacune desdites signatures, comparing said digital signature with the digital signatures of said musical score, for a plurality of tempo, for calculating a correlation score for each of said signatures,

- à déterminer un tempo estimé correspondant à la meilleure corrélation, determining an estimated time corresponding to the best correlation,

- à déterminer au moins périodiquement la position de la séquence temporelle dudit signal audio par rapport à ladite représentation de ladite partition musicale, at least periodically determining the position of the temporal sequence of said audio signal with respect to said representation of said musical score,

- à commander le déplacement de ladite position par rapport à ladite représentation de ladite partition musicale en fonction dudit tempo estimé correspondant au meilleur score de corrélation, to control the displacement of said position with respect to said representation of said partition according to said estimated tempo corresponding to the best correlation score,

- à recalculer périodiquement ledit score de corrélation .  - periodically recalculating said correlation score.

[00023] Programme d'ordinateur pour commander la synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio acquis en temps réel et correspondant à l'interprétation de ladite partition musicale, selon les étapes consistant : - à produire une signature numérique d'une séquence temporelle dudit signal audio acquis,  [00023] Computer program for controlling the synchronization of a graphic or sound representation of a musical score with an audio signal acquired in real time and corresponding to the interpretation of said musical score, according to the steps of: - producing a digital signature of a temporal sequence of said acquired audio signal,

- à comparer ladite signature numérique avec les signatures numériques de ladite partition musicale, pour une pluralité de tempo, pour calculer un score de corrélation pour chacune desdites signatures, comparing said digital signature with the digital signatures of said musical score, for a plurality of tempo, for calculating a correlation score for each of said signatures,

- à déterminer un tempo estimé correspondant à la meilleure corrélation, determining an estimated time corresponding to the best correlation,

- à déterminer au moins périodiquement la position de la séquence temporelle dudit signal audio par rapport à ladite représentation de ladite partition musicale, at least periodically determining the position of the temporal sequence of said audio signal with respect to said representation of said musical score,

- à commander le déplacement de ladite position par rapport à ladite représentation de ladite partition musicale en fonction dudit tempo estimé correspondant au meilleur score de corrélation, controlling the displacement of said position with respect to said representation of said musical score according to said estimated tempo corresponding to the best correlation score,

- à recalculer périodiquement ledit score de corrélation .  - periodically recalculating said correlation score.

[00024] La position de la séquence temporelle dudit signal audio est déterminée périodiquement par rapport à la représentation de la partition musicale en recalculant périodiquement le score de corrélation. Ainsi le tempo est contrôlé régulièrement.  The position of the temporal sequence of said audio signal is determined periodically with respect to the representation of the musical score by periodically recalculating the correlation score. So the tempo is checked regularly.

[00025] Avantageusement, on procède à un traitement logarithmique du signal acquis pour mieux pondérer les notes de faible énergie (aigus, graves). [00026] L'invention est mise en œuvre à l'aide d'un calcul par un algorithme rapide qui permet d'une réactivité accrue en temps réel, tel que l'algorithme de corrélation croisé normé. Advantageously, it proceeds to a logarithmic processing of the acquired signal to better weight the low energy grades (treble, bass). The invention is implemented using a calculation by a fast algorithm that allows for increased reactivity in real time, such as the standardized cross-correlation algorithm.

Description détaillée d'un exemple non limitatif de Detailed description of a non-limiting example of

réalisation  production

[00027] D'autre particularités et avantages de l'invention ressortiront à la lecture de la description faite ci-après de modes de réalisation particuliers de l'invention, donnés à titre indicatif mais non limitatif. Other features and advantages of the invention will become apparent on reading the description given below of particular embodiments of the invention, given for information but not limited to.

[00028] L'invention sera mieux comprise et d'autres caractéristiques et avantages apparaîtront plus clairement à la lecture de la description qui suit, se référant aux dessins annexés où :  The invention will be better understood and other features and advantages will appear more clearly on reading the description which follows, with reference to the accompanying drawings in which:

la figure 1 est un schéma du principe du procédé de synchronisation selon l'invention ;  Figure 1 is a diagram of the principle of the synchronization method according to the invention;

les figures 2a, 2b et 2c sont les représentations des étapes de traitement du signal audio acquis selon l'invention ;  FIGS. 2a, 2b and 2c are the representations of the processing steps of the audio signal acquired according to the invention;

les figures 3a, 3b et 3c sont les signatures spectrales d'une partition musicale à des tempos différents selon l'invention;  Figures 3a, 3b and 3c are the spectral signatures of a musical score at different tempos according to the invention;

- les figures 4a, 4b, 4c et 4d représentent les scores de corrélation en fonction de la position et des tempos différents selon l'invention ;  FIGS. 4a, 4b, 4c and 4d represent the correlation scores as a function of the position and of the different tempos according to the invention;

la figure 5 illustre le déplacement d'un curseur sur l'affichage graphique de la partition ;  Figure 5 illustrates the displacement of a cursor on the graphical display of the score;

- la figure 6 est un schéma du principe du procédé de synchronisation avec la procédure d'annulation du son émis par un haut-parleur,  FIG. 6 is a diagram of the principle of the synchronization method with the procedure for canceling the sound emitted by a loudspeaker,

les figures 7a, 7b, 7c et 7d représentent le procédé d'un affichage dynamique, les figures 8a et 8b illustrent le rattachement des signes restant en dehors des cinq lignes principaux de la portée. Description non limitative d'exemples de réalisation FIGS. 7a, 7b, 7c and 7d represent the method of a dynamic display, Figures 8a and 8b illustrate the attachment of the signs remaining outside the five main lines of the scope. Non-limiting description of exemplary embodiments

[00029] La figure 1 représente le procédé de synchronisation, qui comprend les étapes suivantes : l'échantillonnage du signal audio, les créations des signatures numériques du signal audio et de la partition musicale, la comparaison des deux signatures numériques et l'affichage du résultat de la synchronisation sur 1 ' écran . FIG. 1 represents the synchronization method, which comprises the following steps: the sampling of the audio signal, the creations of the digital signatures of the audio signal and the musical score, the comparison of the two digital signatures and the display of the result of the synchronization on the screen.

[00030] Comme indiqué dans la figure 1, à gauche, un signal audio est enregistré par un microphone. On procède à l'analyse successive de fenêtres sonores de durée de 200ms. Le traitement de chaque fenêtre sonore est effectué avec un chevauchement à 75% d'une fenêtre sur l'autre. Après chaque intervalle temporel de 50 ms, soit ¾ d'une durée entière d'une fenêtre, une nouvelle fenêtre est analysée.  As shown in Figure 1, on the left, an audio signal is recorded by a microphone. We proceed to the successive analysis of windows of sound duration of 200ms. The processing of each sound window is done with an overlap at 75% from one window to the other. After each time interval of 50 ms, ie ¾ of an entire duration of a window, a new window is analyzed.

[00031] Le signal audio est capté par le microphone puis est amplifié, numérisé et enregistré dans une mémoire vive, pour un stockage temporaire. La signature spectrale pour chaque note et chaque instrument est également préenregistrée dans la mémoire vive pour un accès rapide.  The audio signal is picked up by the microphone and is amplified, digitized and stored in a RAM, for temporary storage. The spectral signature for each note and instrument is also pre-recorded in RAM for quick access.

[00032] L'analyse spectrale de la fenêtre d'échantillonnage du signal audio est effectuée par le processeur. Une signature numérique d'une séquence temporelle de ce signal audio acquis est produite. Aussi la reconstitution des signatures numériques de la partition musicale est réalisée avec une pluralité de tempos différents. [ 00033 ] Un procédé de corrélation est effectué en comparant la signature numérique du signal audio et celle de la partition musicale de chaque tempo différent respectivement. Un score de corrélation pour chaque comparaison est calculé. The spectral analysis of the sampling window of the audio signal is performed by the processor. A digital signature of a temporal sequence of this acquired audio signal is produced. Also the reconstruction of the digital signatures of the musical score is performed with a plurality of different tempos. [00033] A correlation method is performed by comparing the digital signature of the audio signal and that of the musical score of each different tempo respectively. A correlation score for each comparison is calculated.

[ 00034 ] Si la corrélation est suffisante, la position de localisation dans la partition et le tempo de l'utilisateur de l'instrument (ou joueur) sont déterminés, ce qui permet de déplacer le curseur sur l'affichage de la partition correspondant au tempo depuis la position de jeu dans l'écran. Du plus, l'affichage de la partition dynamique est ajusté par le remplacement du système joué et le passage à une nouvelle page.  If the correlation is sufficient, the location position in the score and the tempo of the user of the instrument (or player) are determined, which makes it possible to move the cursor on the display of the score corresponding to the tempo from the game position in the screen. In addition, the display of the dynamic partition is adjusted by replacing the system played and switching to a new page.

[ 00035 ] Le disque dur sert à préenregistrer les informations de la partition : les notes, les rythmes, les informations de pages et de reprises et les positions géométriques des notes. Ces informations sont traitées par le processeur pour reconstituer la signature numérique de la partition.  The hard disk is used to pre-record the information of the score: notes, rhythms, information pages and covers and geometric positions of the notes. This information is processed by the processor to reconstruct the digital signature of the partition.

[ 00036 ] Le signal audio acquis est traité en plusieurs étapes. D'abord, il est nécessaire d'appliquer le fenêtrage, qui consiste à multiplier la fenêtre par une fonction prédéterminée, afin de réduire les effets de bruit .  The acquired audio signal is processed in several steps. First, it is necessary to apply windowing, which consists in multiplying the window by a predetermined function, in order to reduce the effects of noise.

[ 00037 ] Ensuite la transformée de Fourier est appliquée pour analyser la caractéristique de fréquence. Centrées sur la fenêtre d'échantillonnage, sont appliquées plusieurs transformées de Fourier (Fast Fourier Transform / FFT), avec des tailles de fenêtres différentes mais centrées sur le même point. Une bande de fréquences caractéristiques de chacune de ces transformées est sélectionnée. Ces bandes ainsi prélevées sont ensuite réunies à la suite des une des autres pour représenter ensemble la signature numérique complète comportant les fréquences basses, les fréquences moyennes et les fréquences hautes. La figure 2a représente le résultat de la transformée énergétique brute pour une taille de fenêtre donnée. L'axe X représente la fréquence tandis que l'axe Y représente l'énergie. Then the Fourier transform is applied to analyze the frequency characteristic. Centered on the sampling window, several Fourier transforms (FFTs) are applied, with different window sizes but centered on the same point. A characteristic frequency band of each of these transforms is selected. These strips thus collected are then combined following one of the others to represent together the complete digital signature comprising the low frequencies, the average frequencies and high frequencies. Figure 2a shows the result of the raw energy transform for a given window size. The X axis represents the frequency while the Y axis represents the energy.

[00038] Une transformée de Fourier rapide est une opération technique effectuée sur une fenêtre de valeur. Elle donne un résultat dont la taille est la moitié de celle de la fenêtre analysée. L'amplitude de la transformée de Fourier rapide est proportionnelle à la taille de la fenêtre, tandis que l'énergie est l'amplitude au carré de la transformée de Fourier rapide. L'énergie totale d'une fenêtre est calculée, et ensuite divisée par le nombre de points de cette fenêtre pour déterminer une valeur de l'énergie moyenne. Donc l'énergie moyenne est différente pour chaque taille de fenêtre de la transformée de Fourier rapide correspondant respectivement aux fréquences basses, aux fréquences moyennes et aux fréquences hautes. Ensuite une fonction logarithmique est appliquée à chaque fenêtre avec leur énergie moyenne respective. Chaque point de la fenêtre est ensuite passé au log selon la formule :  [00038] A fast Fourier transform is a technical operation performed on a value window. It gives a result whose size is half that of the analyzed window. The amplitude of the fast Fourier transform is proportional to the size of the window, while the energy is the amplitude squared of the fast Fourier transform. The total energy of a window is calculated, and then divided by the number of points in that window to determine a value of the average energy. Therefore, the average energy is different for each window size of the fast Fourier transform corresponding respectively to the low frequencies, the medium frequencies and the high frequencies. Then a logarithmic function is applied to each window with their respective average energy. Each point of the window is then passed to the log according to the formula:

V=logl0 (Valeur Point/Energie Moyenne)  V = log10 (Point Value / Average Energy)

Toutes les valeurs négatives sont ensuite passées à zéro. La figure 2b représente le résultat du calcul de la transformée de Fourier rapide énergétique à l'échelle logarithmique. La composante en hautes fréquences est plus proéminente.  All negative values are then passed to zero. Figure 2b shows the result of the calculation of the fast energy Fourier transform at the logarithmic scale. The high frequency component is more prominent.

[00039] L'empilement final ne représente qu'une partie choisie du calcul de la transformée de Fourier rapide de chaque fenêtre, qui est le condensé des bandes fréquentielles intéressante à l'analyser.  The final stack represents only a selected part of the calculation of the fast Fourier transform of each window, which is the condensed frequency bands interesting to analyze.

[00040] Afin de présenter l'empilement final normalisé à l'échelle de l'énergie, une fenêtre d'analyse temporelle plus large — en 2 secondes - est sélectionnée. Dans la figure 2C, l'axe X représente le déroulement de 2 secondes, l'axe Y représente la fréquence, tandis que les contours en 2D représentent la valeur de l'énergie. La présentation du contour d'énergie discrète en fonction de temps et de la fréquence est appelée spectrale. In order to present the final standardized stack at the energy scale, a wider time analysis window - in 2 seconds - is selected. In Figure 2C, the X axis represents the sequence of 2 seconds, the Y axis represents the frequency, while the 2D contours represent the value of the energy. The presentation of the discrete energy contour as a function of time and frequency is called spectral.

[00041] Les avantages de ce passage au logarithme sont, d'une part, d'éliminer le bruit de l'analyse spectrale, d'autre part, de ramener les valeurs des harmoniques et des fréquences dans des échelles pertinentes, qui permettent de distribuer le poids sur les bandes de fréquences caractéristiques de chacune des transformées pour la corrélation.  The advantages of this transition to logarithm are, on the one hand, to eliminate the noise of the spectral analysis, on the other hand, to reduce the values of harmonics and frequencies in relevant scales, which make it possible to distribute the weight on the characteristic frequency bands of each of the transforms for the correlation.

[00042] Le même procédé est appliqué pour la reconstitution de la signature numérique de la partition musicale .  The same method is applied for the reconstruction of the digital signature of the musical score.

[00043] Bien que le rythme soit fixé dans la partition, les différents utilisateurs de l'instrument jouent à des tempos différents selon l'interprétation de chacun. Plusieurs tempos sont utilisés pour la reconstitution de la signature numérique de la partition, dont trois sont choisis dans les représentations des figures 3a, 3b et 3c.  Although the rhythm is fixed in the score, the different users of the instrument play at different tempos according to the interpretation of each. Several tempos are used for the reconstruction of the digital signature of the score, of which three are chosen in the representations of Figures 3a, 3b and 3c.

[00044] La reconstitution de la signature numérique de la partition est effectuée à partir de signatures spectrales brutes préenregistrées pour chaque note et chaque instrument, puis stockée en mémoire vive pour un accès rapide. Le log est appliqué de la même façon auprès des sommes des représentations spectrales des notes en fonction du rythme et du tempo.  The reconstruction of the digital signature of the partition is performed from prerecorded raw spectral signatures for each note and each instrument, then stored in RAM for quick access. The log is applied in the same way to the sums of the spectral representations of the notes according to the rhythm and the tempo.

[00045] Le rythme désigne des notions de temporalité de type croches, noires, et blanches, alors que le tempo définit l'allure générale d'un morceau.  The rhythm designates notions of ebony, black, and white type temporality, while the tempo defines the general appearance of a piece.

[00046] La figure 3a est une spectrale d'une signature au tempo lent. L'axe X représente le déroulement du temps, l'axe Y représente les fréquences, tandis que les contours représentent l'énergie à l'échelle logarithmique. [00046] FIG. 3a is a spectral of a slow tempo signature. The X axis represents the course of time, the Y axis represents the frequencies, while contours represent logarithmic energy.

[00047] Comme le tempo s'accélère dans les figures 3b et 3c, les spectrales deviennent de plus en plus dense suivant l'axe X.  As the tempo accelerates in FIGS. 3b and 3c, the spectrals become more and more dense along the X axis.

[00048] Si le musicien jouait parfaitement avec un piano parfaitement accordé, une représentation spectrale «idéale» de la partition serait très proche de ou égale à la spectrale audio acquise.  [00048] If the musician played perfectly with a perfectly tuned piano, an "ideal" spectral representation of the score would be very close to or equal to the audio spectral acquired.

[00049] Les deux spectrales sont comparées grâce à l'algorithme corrélation croisé normé. Afin de quantifier le résultat de cette comparaison, un score de corrélation est calculé. Dans la situation idéale avec deux spectrales identiques, le score est égal à 1, qui signifie une corrélation parfaite.  The two spectrals are compared using the standardized cross correlation algorithm. In order to quantify the result of this comparison, a correlation score is calculated. In the ideal situation with two identical spectrals, the score is 1, which means a perfect correlation.

[00050] Une grande fenêtre est choisie en calculant les scores aux tempos différents pour localiser la position de jeu du musicien et le tempo correspondant. Plus le score est élevé, plus le jeu du musicien s'approche de ce qui devrait être entendu. Si le score du pic est suffisamment élevé, la position est retenue et le tempo également. Cela donne une bonne évaluation du tempo et de la position initiale.  [00050] A large window is chosen by calculating the scores at different tempos to locate the playing position of the musician and the corresponding tempo. The higher the score, the closer the musician's game approaches what should be heard. If the peak score is high enough, the position is retained and the tempo too. This gives a good evaluation of the tempo and the initial position.

[00051] Les figures 4a, 4b et 4c illustrent les scores de comparaison en fonction de la position pour le tempo lent, normal et rapide. La figure 4d illustre le chevauchement des scores de comparaison aux trois tempos . Dès que seuil de similitude fixé au préalable est dépassé, le tempo normal et la position correspondante sont retenus.  Figures 4a, 4b and 4c illustrate comparison scores as a function of position for the slow, normal and fast tempo. Figure 4d illustrates the overlap of the comparison scores at the three tempos. As soon as the prior similarity threshold is exceeded, the normal tempo and the corresponding position are retained.

[00052] La figure 5 illustre le déplacement du curseur sur l'affichage de la partition correspondant au tempo et à la position déterminés par le score de corrélation qui dépasse le seuil de similitude. [ 00053 ] Deux modes de synchronisation existent pour les situations différentes : en premier lieu, mode global pour déterminer la position initiale absolue. L'exécution du joueur est qualifiée avec des fenêtres temporelles longues et un score absolu élevé pour localiser ce qu'il joue. En deuxième lieu, mode local pour qualifier le joueur, la partition est suivie en temps réel, avec des fenêtres temporelles courtes et un score absolu moins important pour être moins sensible aux erreurs. [00052] FIG. 5 illustrates the displacement of the cursor on the display of the score corresponding to the tempo and the position determined by the correlation score which exceeds the similarity threshold. [00053] Two synchronization modes exist for the different situations: firstly, global mode for determining the absolute initial position. The player's performance is qualified with long time windows and a high absolute score to locate what he is playing. Secondly, local mode to qualify the player, the score is followed in real time, with short time windows and a lower absolute score to be less sensitive to errors.

[ 00054 ] La figure 6 illustre le procédé de synchronisation avec une procédure durant laquelle on distingue différentes parties de partition (par exemple la partie jouée par la main gauche et la partie jouée par la main droite) et on annule le son émis par un haut- parleur jouant l'une des ces parties afin de suivre les performances d'un utilisateur jouant cette partie de partition. Similaire au procédé présenté pour la figure 1 , ce son émis par l'haut-parleur est annulé dans l'analyse spectrale.  [00054] FIG. 6 illustrates the method of synchronization with a procedure during which different parts of the score are distinguished (for example the part played by the left hand and the part played by the right hand) and the sound emitted by a top is canceled. - speaker playing one of these parts to track the performance of a user playing that part of the score. Similar to the method presented for FIG. 1, this sound emitted by the loudspeaker is canceled in the spectral analysis.

[ 00055 ] Avec les informations préenregistrées (les notes, les rythmes, les informations de pages et de reprises, etc.), et la banque de sons synthétiques, la création synthétique du signal sonore de sortie synchronisé est réalisée dans le processeur.  With the pre-recorded information (notes, rhythms, page and repeat information, etc.), and the synthetic sound bank, the synthetic creation of the synchronized output sound signal is performed in the processor.

[ 00056 ] Après le stockage temporaire dans le mémoire vive, le haut-parleur donne le signal sonore dans la sortie.  After temporary storage in the RAM, the speaker gives the sound signal in the output.

[ 00057 ] Les signaux sonores émis par l'instrument et le haut-parleur sont enregistrés dans le microphone lors du procédé de l'échantillonnage.  The sound signals emitted by the instrument and the loudspeaker are recorded in the microphone during the sampling process.

[ 00058 ] Dans le procédé de l'analyse spectrale, la spectrale synthétique est soustraite, la partie restante de la spectrale est comparée à la spectrale de la partition . [ 00059 ] Outre les applications de synchronisation, cette invention est également adaptée à des applications telles que l'identification et l'affichage de la partition musicale. Dans ce cas, on procède à un traitement de la partition organisée en N systèmes de portées (ou de portée unique) sur un support tel qu'une page, pour reconstruire en M systèmes de portées sur l'écran d'affichage. In the spectral analysis method, the synthetic spectral is subtracted, the remaining part of the spectral is compared to the spectral of the partition. In addition to the synchronization applications, this invention is also suitable for applications such as the identification and display of the musical score. In this case, it proceeds to a processing of the partition organized in N systems of staves (or single range) on a support such as a page, to reconstruct M scope systems on the display screen.

[ 00060 ] Dans une situation, une partition n'est écrite que pour un instrument avec une seule portée. In a situation, a score is only written for an instrument with a single staff.

C'est le cas de la plus grande majorité des instruments classique (flûte, violon, etc..) . Dans une autre situation, plusieurs portées sont réunies pour être jouée ensembles, par exemple le piano solo, qui dispose d'une portée pour la main droite et une portée pour la main gauche. Un « system » inclue toutes les portées jouées ensemble . This is the case of the vast majority of classical instruments (flute, violin, etc.). In another situation, several staves are brought together to be played together, for example the solo piano, which has a right-hand reach and a left-handed reach. A "system" includes all staves played together.

[ 00061 ] Il est possible qu'une partition comporte un grand nombre d'instrument et donc de portées qui sont jouées en même temps, telle qu'une partition d'orchestre. It is possible that a score has a large number of instruments and therefore staves that are played at the same time, such as an orchestral score.

Dans ce cas, il arrive couramment qu'il ne soit possible de ne représenter qu'un système de portée musicale par page, surtout si la taille de l'écran d'affichage est réduit par rapport à une représentation papier normale. In this case, it usually happens that it is possible to represent only one system of musical range per page, especially if the size of the display screen is reduced compared to a normal paper representation.

[ 00062 ] L'exemple suivant illustre l'affichage en 3 systèmes de portée par page sur l'écran la partition musicale, qui était organisée en 4 systèmes de portée par page selon l'édition traditionnelle.  The following example illustrates the display in 3 systems of scope per page on the screen music score, which was organized in 4 systems per page scope according to the traditional edition.

[ 00063 ] Un affichage dynamique est réalisée sur ce nouveau mode de l'affichage, par le remplacement graphique immédiat du système qui est détecté comme déjà joué et dont l'affichage est devenu inutile, par le prochain système de portée à être lu et encore non visible dans l'ordre d'affichage. [00064] La figure 7a illustre la partition musicale traditionnelle en deux pages avec huit systèmes de portées, dans lesquels ils contiennent des reprises aux endroits différents. La figure 7b montre l'ordre de lecture des systèmes de portées avec les reprises. A dynamic display is performed on this new mode of display, by the immediate graphic replacement of the system which is detected as already played and whose display has become useless, by the next system of scope to be read and still not visible in the display order. [00064] FIG. 7a illustrates the traditional two-page musical score with eight litter systems, in which they contain covers at different locations. Figure 7b shows the reading order of the litter systems with times.

[00065] Dans le nouveau mode de l'affichage dynamique, le nombre de systèmes de portées par page est adapté à la taille de l'écran. La figure 7c représente un exemple de l'affichage de trois systèmes de portées par page. Le déroulement de l'affichage de système est en positions 1, 2 et 3 successivement. La figure 4 illustre la séquence de remplacement dynamique de système pour chaque position.  In the new mode of the dynamic display, the number of systems per page is adapted to the size of the screen. Figure 7c shows an example of the display of three scope systems per page. The progress of the system display is in positions 1, 2 and 3 successively. Figure 4 illustrates the dynamic system replacement sequence for each position.

[00066] Afin de conformer au nouveau système de l'affichage, les techniques sont développées pour reconnaître les signes restant en dehors des cinq lignes principales de la portée de la partition traditionnelle.  [00066] In order to conform to the new system of the display, the techniques are developed to recognize the signs remaining outside the five main lines of the scope of the traditional partition.

[00067] La figure 8a illustre la reconnaissance des notes très graves par l'analyse graphique des tirets. Une double croche liée entre elle est déterminée au rattachement du système en haut.  Figure 8a illustrates the recognition of very serious notes by the graphical analysis of the dashes. A sixteenth note linked to it is determined by the attachment of the system at the top.

[00068] La figure 8b illustre la reconnaissance des arcs de liaison, par le calcul du barycentre et du sens de courbure. L'arc de liaison en gris, dont le sens de courbure est vers le haut, est attaché au système supérieur. Tandis que l'arc de liaison en noire du sens de courbure vers le bas est attaché au système inférieur.  FIG. 8b illustrates the recognition of connecting arcs, by the calculation of the center of gravity and the direction of curvature. The connecting arc in gray, whose direction of curvature is upward, is attached to the upper system. While the black connecting arc of the direction of curvature downward is attached to the lower system.

[00069] L'invention porte sur un procédé de synchronisation d'une représentation graphique, notamment d'une partition musicale, avec un signal audio acquis en temps réel, et correspondant à l'interprétation de la partition musicale précitée. Il ne s'agit pas de rechercher l'identification d'un extrait de média capturé dans une base de données d'une collection de partitions, mais de fournir une aide à un interprète pour faciliter l'automatisation du suivi d'une partition connu, par exemple pour permettre à un instrumentiste d'interpréter sa partie de manière synchrone avec la reproduction d'un enregistrement orchestral. The invention relates to a method for synchronizing a graphic representation, in particular of a musical score, with an audio signal acquired in real time, and corresponding to the interpretation of the aforementioned musical score. It is not a question of looking for the identification of a captured media extract in a database of a partition collection, but of providing assistance to an interpreter to facilitate automating the tracking of a known partition, for example to allow an instrumentalist to interpret his part synchronously with the reproduction of an orchestral recording.

[ 00070 ] En général, l'invention est basée sur une solution technique assurant une grande robustesse du traitement. Elle consiste à construire, pour chaque partition, une pluralité de signature correspondant chacune à une vitesse donnée d'interprétation de cette partition. Lors de l'exécution de la partition par un utilisateur, le procédé consiste à calculer la signature correspondant à cette vitesse d'exécution par l'utilisateur, et à rechercher dans la collection de signatures de vitesse, celle qui présente le meilleur taux de corrélation avec la signature de la partition exécuté par l'utilisateur.  In general, the invention is based on a technical solution ensuring high robustness of the treatment. It consists in constructing, for each partition, a plurality of signatures each corresponding to a given speed of interpretation of this partition. When the partition is executed by a user, the method consists in calculating the signature corresponding to this execution speed by the user, and in the collection of speed signatures, which has the best correlation rate. with the signature of the partition executed by the user.

[ 00071 ] La solution donnée dans le brevet américain US 20110276333 est toutefois fondamentalement différente de l'invention. Elle consiste à :  The solution given in US patent US 20110276333 is however fundamentally different from the invention. It consists of :

- Générer une signature correspondant à la partition identifiée,  - Generate a signature corresponding to the identified partition,

calculer la signature d'une séquence audio exécutée par l'utilisateur,  calculate the signature of an audio sequence executed by the user,

déterminer le ratio de différence de temps entre la signature de la séquencé audio exécutée et la signature de la partition identifié,  determining the time difference ratio between the signature of the audio sequence executed and the signature of the identified partition,

utiliser ce ratio pour piloter le suivi de la synchronisation  use this ratio to control the synchronization tracking

Cette solution associe ainsi une unique signature à une même partition et part d'un postulat discutable selon lequel il existerait une relation homothétique entre le tempo et la signature. This solution associates a single signature with the same score and starts from a questionable postulate according to which there is a homothetic relationship between the tempo and the signature.

[ 00072 ] Cependant, l'invention dans la présente application propose une solution permettant de s'absoudre de ce postulat. Elle fournit une pluralité de signatures numériques pour une même partition à des pluralités de vitesses différentes. Et elle permet de sélectionner la bonne vitesse pour la synchronisation, même dans les cas où la variation de la signature n'est pas directement représentative de la variation de la vitesse. However, the invention in the present application provides a solution for abstaining from this postulate. It provides a plurality of signatures for the same partition at different speeds. And it allows to select the right speed for synchronization, even in cases where the variation of the signature is not directly representative of the variation of the speed.

[00073] Il est ainsi possible de suivre en temps réel avec une grande précision l'exécution d'une partition musicale par un utilisateur même lorsqu'il modifie la vitesse à laquelle il exécute cette partition. Par conséquent, la présent invention surpasse largement l'état de l'art.  It is thus possible to follow in real time with great precision the execution of a musical score by a user even when he changes the speed at which he executes this partition. Therefore, the present invention far surpasses the state of the art.

Claims

Revendications claims 1 - Procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio acquis en temps réel et correspondant à l'interprétation de ladite partition musicale, consistant : 1 - A method of synchronizing a graphic or sound representation of a musical score with an audio signal acquired in real time and corresponding to the interpretation of said musical score, consisting of: - à produire une signature numérique d'une séquence temporelle dudit signal audio acquis,  to produce a digital signature of a temporal sequence of said acquired audio signal, - à comparer ladite signature numérique avec les signatures numériques de ladite partition musicale, pour une pluralité de tempo, pour calculer un score de corrélation pour chacune desdites signatures,  comparing said digital signature with the digital signatures of said musical score, for a plurality of tempo, for calculating a correlation score for each of said signatures, - à déterminer un tempo estimé correspondant à la meilleure corrélation,  determining an estimated time corresponding to the best correlation, - à déterminer au moins périodiquement la position de la séquence temporelle dudit signal audio par rapport à ladite représentation de ladite partition musicale,  at least periodically determining the position of the temporal sequence of said audio signal with respect to said representation of said musical score, - à commander le déplacement de ladite position par rapport à ladite représentation de ladite partition musicale en fonction dudit tempo estimé correspondant au meilleur score de corrélation,  controlling the displacement of said position with respect to said representation of said musical score according to said estimated tempo corresponding to the best correlation score, - à recalculer périodiquement ledit score de corrélation . 2 — Procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio selon la revendication 1 caractérisé en ce que la signature numérique est la signature spectrale et non pas chromatique .  - periodically recalculating said correlation score. 2 - A method of synchronizing a graphic or sound representation of a musical score with an audio signal according to claim 1 characterized in that the digital signature is the spectral signature and not chromatic. 3 - Procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio selon la revendication 2 caractérisé en ce que le signal audio acquis est traité par transformée de Fourier, et ensuite traité par une fonction logarithmique pour mieux pondérer les notes de faible énergie (aigus, graves). 3 - A method of synchronizing a graphic or sound representation of a musical score with an audio signal according to claim 2 characterized in that the acquired audio signal is processed by Fourier transform, and then processed by a logarithmic function to better weight the low energy notes (treble, bass). 4 — Procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio selon la revendication 1 caractérisé en ce que l'algorithme corrélation croisé normé est utilisé pour calculer un score de corrélation. 5 — Procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio selon la revendication 1 caractérisé en ce que deux modes de synchronisation existent : 4 - A method of synchronizing a graphic or sound representation of a musical score with an audio signal according to claim 1 characterized in that the standardized cross correlation algorithm is used to calculate a correlation score. 5 - Method for synchronizing a graphic or sound representation of a musical score with an audio signal according to claim 1 characterized in that two synchronization modes exist: - Mode global pour déterminer la position initiale absolue de l'utilisateur de l'instrument avec des fenêtres temporelles longues et un seuil de similitude élevé;  - Global mode to determine the absolute initial position of the user of the instrument with long time windows and a high similarity threshold; - Mode local suivi de partition en temps réel et plus tolérant aux erreurs, avec des fenêtres temporelles courtes et un seuil de similitude moins important.  - Local mode followed by partition in real time and more tolerant to errors, with short time windows and a similar threshold of similarity. 6 — Procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio selon la revendication 1 caractérisé en ce qu'une procédure de l'annulation de son est réalisée par l'anticipation du signal audio synthétique produit à partir du tempo estimé, et soustrait afin de comparer la partie restante de la spectrale du signal audio à celle de la partition. 7 — Procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio selon la revendication 1 caractérisé en ce que l'identification et l'affichage de la partition musicale sont réalisés, par la reconnaissance du rattachement des notes en analysant le graphique des tirets; par le rattachement des arcs de liaison sur le résultat du calcul du barycentre et du sens de courbure, par la reconstruction en M systèmes de la partition originalement organisée en N systèmes. 8 — Procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio selon la revendication 1 caractérisé en ce qu'un affichage dynamique est réalisé par le remplacement immédiat du système, qui est détecté comme déjà joué, par celui qui va être joué à la suite par un utilisateur. 6 - A method of synchronizing a graphic or sound representation of a musical score with an audio signal according to claim 1 characterized in that a sound cancellation procedure is performed by the anticipation of the synthetic audio signal produced at from the estimated tempo, and subtracted to compare the remaining part of the spectral of the audio signal to that of the score. 7 - A method of synchronizing a graphic or sound representation of a musical score with an audio signal according to claim 1 characterized in that the identification and display of the musical score are made, by recognizing the attachment of the notes. analyzing the graph of dashes; by attaching connecting arcs on the result of the calculation of the center of gravity and the direction of curvature, by the reconstruction in M systems of the partition originally organized into N systems. 8 - A method of synchronizing a graphic or sound representation of a musical score with an audio signal according to claim 1 characterized in that a dynamic display is achieved by the immediate replacement of the system, which is detected as already played, by the one that will be played as a result by a user. 9 — Procédé de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio selon la revendication 1 caractérisé en ce qu'un curseur sur l'affichage graphique de la partition indique le déplacement de la position, le changement d'une page, ou une reprise . 9 - A method of synchronizing a graphic or sound representation of a musical score with an audio signal according to claim 1, characterized in that a cursor on the graphical display of the score indicates the displacement of the position, the change of position. a page, or a recovery. 10 — Equipement électronique comportant un afficheur, une entrée pour un signal audio et un calculateur caractérisé en ce que ledit calculateur est commandé pour exécuter un programme de synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio acquis en temps réel et correspondant à l'interprétation de ladite partition musicale, ce programme de synchronisation consistant : 10 - Electronic equipment comprising a display, an input for an audio signal and a computer characterized in that said computer is controlled to execute a synchronization program of a graphic or sound representation of a musical score with a time-acquired audio signal real and corresponding to the interpretation of said musical score, this synchronization program consisting of: - à produire une signature numérique d'une séquence temporelle dudit signal audio acquis,  to produce a digital signature of a temporal sequence of said acquired audio signal, - à comparer ladite signature numérique avec les signatures numériques de ladite partition musicale, pour une pluralité de tempo, pour calculer un score de corrélation pour chacune desdites signatures,  comparing said digital signature with the digital signatures of said musical score, for a plurality of tempo, for calculating a correlation score for each of said signatures, - à déterminer un tempo estimé correspondant à la meilleure corrélation, - à déterminer au moins périodiquement la position de la séquence temporelle dudit signal audio par rapport à ladite représentation de ladite partition musicale, determining an estimated time corresponding to the best correlation, at least periodically determining the position of the temporal sequence of said audio signal with respect to said representation of said musical score, - à commander le déplacement de ladite position par rapport à ladite représentation de ladite partition musicale en fonction dudit tempo estimé correspondant au meilleur score de corrélation,  controlling the displacement of said position with respect to said representation of said musical score according to said estimated tempo corresponding to the best correlation score, - à recalculer périodiquement ledit score de corrélation .  - periodically recalculating said correlation score. 11 — Programme d'ordinateur pour commander la synchronisation d'une représentation graphique ou sonore d'une partition musicale avec un signal audio acquis en temps réel et correspondant à l'interprétation de ladite partition musicale, selon les étapes consistant : 11 - Computer program for controlling the synchronization of a graphic or sound representation of a musical score with an audio signal acquired in real time and corresponding to the interpretation of said musical score, according to the steps of: - à produire une signature numérique d'une séquence temporelle dudit signal audio acquis,  to produce a digital signature of a temporal sequence of said acquired audio signal, - à comparer ladite signature numérique avec les signatures numériques de ladite partition musicale, pour une pluralité de tempo, pour calculer un score de corrélation pour chacune desdites signatures,  comparing said digital signature with the digital signatures of said musical score, for a plurality of tempo, for calculating a correlation score for each of said signatures, - à déterminer un tempo estimé correspondant à la meilleure corrélation,  determining an estimated time corresponding to the best correlation, - à déterminer au moins périodiquement la position de la séquence temporelle dudit signal audio par rapport à ladite représentation de ladite partition musicale,  at least periodically determining the position of the temporal sequence of said audio signal with respect to said representation of said musical score, - à commander le déplacement de ladite position par rapport à ladite représentation de ladite partition musicale en fonction dudit tempo estimé correspondant au meilleur score de corrélation,  controlling the displacement of said position with respect to said representation of said musical score according to said estimated tempo corresponding to the best correlation score, - à recalculer périodiquement ledit score de corrélation .  - periodically recalculating said correlation score.
PCT/FR2015/050260 2014-02-04 2015-02-04 Method for synchronization of a musical score with an audio signal Ceased WO2015118262A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1450845 2014-02-04
FR1450845A FR3017224B1 (en) 2014-02-04 2014-02-04 METHOD FOR SYNCHRONIZING A MUSICAL PARTITION WITH AN AUDIO SIGNAL

Publications (1)

Publication Number Publication Date
WO2015118262A1 true WO2015118262A1 (en) 2015-08-13

Family

ID=51564722

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2015/050260 Ceased WO2015118262A1 (en) 2014-02-04 2015-02-04 Method for synchronization of a musical score with an audio signal

Country Status (2)

Country Link
FR (1) FR3017224B1 (en)
WO (1) WO2015118262A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670074A (en) * 2018-12-12 2019-04-23 北京字节跳动网络技术有限公司 A kind of rhythm point recognition methods, device, electronic equipment and storage medium
CN113870820A (en) * 2021-10-28 2021-12-31 福建星网视易信息系统有限公司 A kind of spectrum tone synchronization method and terminal

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080196575A1 (en) 2007-02-16 2008-08-21 Recordare Llc Process for creating and viewing digital sheet music on a media device
US20110230987A1 (en) 2010-03-11 2011-09-22 Telefonica, S.A. Real-Time Music to Music-Video Synchronization Method and System
US20110276333A1 (en) 2010-05-04 2011-11-10 Avery Li-Chun Wang Methods and Systems for Synchronizing Media
EP2387029A1 (en) 2010-05-12 2011-11-16 KnowledgeRocks Limited Automatic positioning of music notation
US8431809B1 (en) 2009-10-01 2013-04-30 Thomas Chan Electronic music display

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080196575A1 (en) 2007-02-16 2008-08-21 Recordare Llc Process for creating and viewing digital sheet music on a media device
US8431809B1 (en) 2009-10-01 2013-04-30 Thomas Chan Electronic music display
US20110230987A1 (en) 2010-03-11 2011-09-22 Telefonica, S.A. Real-Time Music to Music-Video Synchronization Method and System
US20110276333A1 (en) 2010-05-04 2011-11-10 Avery Li-Chun Wang Methods and Systems for Synchronizing Media
EP2387029A1 (en) 2010-05-12 2011-11-16 KnowledgeRocks Limited Automatic positioning of music notation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FRANK KURTH ET AL: "The Cyclic Beat Spectrum: Tempo-Related Audio Features for Time-Scale Invariant Audio Identification", PROC. OF THE 7TH INTERNATIONAL CONFERENCE ON MUSIC INFORMATION RETRIEVAL (ISMIR 2006), VICTORIA, BC, CANADA, 8-12 OCTOBER 2006, 8 October 2006 (2006-10-08), pages 1 - 6, XP055158811, ISBN: 978-1-55-058349-6 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670074A (en) * 2018-12-12 2019-04-23 北京字节跳动网络技术有限公司 A kind of rhythm point recognition methods, device, electronic equipment and storage medium
CN113870820A (en) * 2021-10-28 2021-12-31 福建星网视易信息系统有限公司 A kind of spectrum tone synchronization method and terminal

Also Published As

Publication number Publication date
FR3017224B1 (en) 2017-07-21
FR3017224A1 (en) 2015-08-07

Similar Documents

Publication Publication Date Title
JP5362178B2 (en) Extracting and matching characteristic fingerprints from audio signals
US20190373311A1 (en) Media Content Identification on Mobile Devices
US9093120B2 (en) Audio fingerprint extraction by scaling in time and resampling
US11736762B2 (en) Media content identification on mobile devices
KR102212225B1 (en) Apparatus and Method for correcting Audio data
CN109922268B (en) Video shooting method, device, equipment and storage medium
US10657175B2 (en) Audio fingerprint extraction and audio recognition using said fingerprints
EP3899701B1 (en) High-precision temporal measurement of vibro-acoustic events in synchronisation with a sound signal on a touch-screen device
WO2022105221A1 (en) Method and apparatus for aligning human voice with accompaniment
Goldstein et al. Guitar Music Transcription from Silent Video.
JP2005292207A (en) Method of music analysis
Su et al. Power-scaled spectral flux and peak-valley group-delay methods for robust musical onset detection
WO2015118262A1 (en) Method for synchronization of a musical score with an audio signal
CA2595349C (en) Method of generating a footprint for an audio signal
EP3096242A1 (en) Media content selection
WO2014098498A1 (en) Audio correction apparatus, and audio correction method thereof
WO2003028005A2 (en) Method for characterizing the timbre of a sound signal in accordance with at least a descriptor
Pätynen et al. Temporal differences in string bowing of symphony orchestra players
Avci et al. Automatic transcription of open string notes from violin recordings
Lagrange et al. Robust similarity metrics between audio signals based on asymmetrical spectral envelope matching
Roma et al. Loop-aware Audio Recording for the Web
Plumbley Multi-target pitch tracking of vibrato sources in noise using the GM-PHD filter
NIKOLAOS ‘COVER SONG’IDENTIFICATION
Moussallam et al. Listening to features

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15705690

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15705690

Country of ref document: EP

Kind code of ref document: A1