[go: up one dir, main page]

JP2010521021A - 楽曲ベースの検索エンジン - Google Patents

楽曲ベースの検索エンジン Download PDF

Info

Publication number
JP2010521021A
JP2010521021A JP2009550141A JP2009550141A JP2010521021A JP 2010521021 A JP2010521021 A JP 2010521021A JP 2009550141 A JP2009550141 A JP 2009550141A JP 2009550141 A JP2009550141 A JP 2009550141A JP 2010521021 A JP2010521021 A JP 2010521021A
Authority
JP
Japan
Prior art keywords
music
song
search
query
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009550141A
Other languages
English (en)
Inventor
ロバート ディー. タウブ,
ジェイ. アレキサンダー キャバニラ,
ジョージ トゥアテロット,
Original Assignee
ミューズアミ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ミューズアミ, インコーポレイテッド filed Critical ミューズアミ, インコーポレイテッド
Publication of JP2010521021A publication Critical patent/JP2010521021A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • G10H1/0041Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
    • G10H1/0058Transmission between separate instruments or between individual components of a musical system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/076Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/086Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for transcription of raw audio or music data to a displayed or printed staff representation or to displayable MIDI-like note-oriented data, e.g. in pianoroll format
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/155User input interfaces for electrophonic musical instruments
    • G10H2220/441Image sensing, i.e. capturing images or optical patterns for musical purposes or musical control purposes
    • G10H2220/451Scanner input, e.g. scanning a paper document such as a musical score for automated conversion into a musical file format
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/171Transmission of musical instrument data, control or status information; Transmission, remote access or control of music data for electrophonic musical instruments
    • G10H2240/175Transmission of musical instrument data, control or status information; Transmission, remote access or control of music data for electrophonic musical instruments for jam sessions or musical collaboration through a network, e.g. for composition, ensemble playing or repeating; Compensation of network or internet delays therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/171Transmission of musical instrument data, control or status information; Transmission, remote access or control of music data for electrophonic musical instruments
    • G10H2240/281Protocol or standard connector for transmission of analog or digital data to or from an electrophonic musical instrument
    • G10H2240/295Packet switched network, e.g. token ring
    • G10H2240/305Internet or TCP/IP protocol use for any electrophonic musical instrument data or musical parameter transmission purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/171Transmission of musical instrument data, control or status information; Transmission, remote access or control of music data for electrophonic musical instruments
    • G10H2240/281Protocol or standard connector for transmission of analog or digital data to or from an electrophonic musical instrument
    • G10H2240/311MIDI transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/215Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
    • G10H2250/235Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

楽曲ベースの検索の方法、システムおよびデバイスについて記載する。本発明の実施形態は、楽曲構成要素を指定する楽曲クエリを受信する。このクエリは、文字、オーディオおよび/または楽譜データを使用する。楽曲クエリは、指定された楽曲構成要素に基づいて検索パラメータを生成するために使用されるとよく、これは、場合によっては重み付けされてもよい。次に、検索パラメータは、データ記録を含むデータベースに対して送るとよく、各データ記録は、楽曲作品と、この楽曲作品に関する楽曲構成要素の組とに関連する。続いて、検索パラメータと、関連の楽曲作品との間の共通の楽曲構成要素に基づいて、データベース内の一致するデータ記録が同定されてもよい。次に、検索出力が様々な方法で順位付け、表示、および出力されてもよい。

Description

(相互参照)
本願は、同時係属中の米国仮特許出願第60/889,816号(名称「COLLABORATIVE MUSIC SHARING」、2007年2月14日出願、代理人整理番号026287−000300US)および同時係属中の米国仮特許出願第60/889,821号(名称「MUSIC−BASED SEARCH ENGINE」、2007年2月14日出願、代理人整理番号026287−000400US)の優先権の利益を主張し、これらの出願は、全ての目的のために、その全体が本明細書に記載されているように参考として援用される。本願は、Robert D.Taubらに対する米国仮特許出願第61/028,490号(名称「MUSIC SCORE DECONSTRUCTION」、2008年2月13日出願、代理人整理番号026287−000500US)の優先権の利益を主張する。仮出願日の優先権が主張され、仮出願の開示は、全ての目的のために本明細書に参考として援用される。
本願は、さらに同時係属中の米国特許出願第_______号(名称「COLLABORATIVE MUSIC CREATION」、2008年2月14日出願、代理人整理番号026287−000310US)と関連し、この出願は本願とともに出願され、全ての目的のために、その全体が、本明細書に記載されているように参考として援用される。
本発明は、全般的にオーディオアプリケーションに関し、特に楽曲ベースの検索に関する。
オーディオについての文字情報(例えばアーティスト、タイトルなど)が不明のときに、オーディオサンプル、アルバムトラック、またはその他のオーディオ情報を見つけることが望まれることがしばしばある。例えば、ある人が、ラジオで曲を聴いた後、その曲をインターネットで見つけたいこともある。その人が、メロディは思いだすものの、曲の名前、曲の歌詞、またはアーティストさえも分からなければ、従来の(例えばテキストベースの)検索エンジンを使用してその曲を見つけるのは非常に困難であると考えられる。
既存のいくつかの検索エンジンは、オーディオ作品を、そのオーディオ作品についてデータベースに手動で供給されたメタデータに基づき整理する能力を提供することができる。例えば、データベースに、曲のジャンル、テンポ、ピッチの並び、ピッチ間隔の並び、発売日、アーティストなどに関する情報を提供することが可能なこともある。その場合、この情報は、従来の検索エンジンによって、特定の曲を探し出す助けとなるよう使用されてもよい。しかし、この能力を提供するには、オーディオ作品についての情報を手動で(さらに多くの場合主観的に)決定して、その情報をデータベースに格納する必要がある。これは、効率の悪さ、誤り、および利用可能な情報の種類に関する制限をもたらす傾向にあると考えられる。
既存のいくつかの検索エンジンはさらに、特定の種類のオーディオファイルからメタデータを抽出する能力を提供することもある。例えば、MPEG−7ファイル形式および他のファイル形式は、オーディオコンテンツについて特定の種類の情報を格納するよう構成されていることもある。その結果、検索エンジンは、例えばファイルのヘッダ情報から、その情報を抽出することができると考えられる。
さらに他の既存の検索エンジンは、1つの特定の上位パターンによって曲をグループ化する能力を提供することもある。例えば、上位のリズム記号が、オーディオ信号の包絡線から抽出されるとよく、その上位記号が曲のグループ化に使用されてもよい。これは、特定の種類の情報を手動で入力する必要をなくすが、依然として検索には制限があると考えられる。1つの制限は、検索が、文字でない単一の次元に制限される可能性があるということである。例えば、ユーザは、リズム記号についてのみ検索することができると考えられるが、無数の曲が同じようなリズム記号を共有している可能性がある。もう1つの制限は、その単一の次元が、有用な結果を提供するのに十分に基本的なものでない可能性もあるということである。例えば、ユーザは、コーラスのメロディをハミングしたいことも、またはリズムの一部をドラムで演奏したいこともあるが、これらはどちらも、上位パターンに対して検索可能ではない。
少なくともこのような理由から、改善された機能を楽曲検索に提供することが望ましいと考えられる。
特に、楽曲ベースの検索の方法、システムおよびデバイスについて記載する。
本発明の実施形態は、様々な特徴および機能を提供する。いくつかの実施形態は、様々な種類の検索入力(例えば、テキスト、オーディオ、楽譜画像など)を受け取り、様々な種類の検索出力(例えば、文字のリスト、オーディオ出力、楽譜出力など)を生成する。本発明の他の実施形態は、文字情報のインテリジェント構文解析、楽曲構成要素を生成するためのオーディオおよび楽譜画像データの分解、直交および重み付き検索能力、ならびにその他多数の機能をサポートする。他の実施形態は、ローカルで(例えば、パーソナルコンピュータまたはローカルエリアネットワーク)動作するよう構成され、その他の実施形態では、本発明はリモートで(例えば、インターネット経由で、またはリモートサーバを使用して)動作するよう構成される。他の実施形態は、検索結果のテキスト、楽譜、オーディオ出力の生成を含む出力機能をサポートする。
一実施形態では、楽曲検索を実行するコンピュータ方法が提供される。本方法は、楽曲構成要素を指定する楽曲クエリを受信することと、受信された楽曲クエリによって指定された楽曲構成要素に基づいて検索パラメータの組を生成することと、いくつかのデータ記録を含むデータベースに対して検索パラメータの組を送る(direct)ことであって、各データ記録は、楽曲作品と、この楽曲作品に関係する楽曲構成要素の組とにそれぞれ関連しており、少なくとも1つのデータ記録と関連する楽曲構成要素のこの組は、少なくとも1つの楽曲作品から分解されたデータを含む、送ることと、検索パラメータの組に一致するデータ記録を含む、一致するデータ記録の組をデータベースにおいて同定することと、一致するデータ記録の組に関連する楽曲作品を含む、一致した楽曲作品の組をデータベース内で同定することと、順位付けリストに並べられている、一致した楽曲作品を含む検索出力を生成することとを含む。
本発明のその他の特徴および利点が、以下の、本発明の原理を一例として示す好適な実施形態の説明から明らかとなるはずである。
以下の図面を参照することによって、本発明の性質および利点のさらなる理解が実現されると考えられる。添付の図面では、同様のコンポーネントまたは特徴が、同じ参照ラベルを有することもある。さらに、類似したコンポーネント間を区別するダッシュと第2のラベルとが参照ラベルに続くことによって、同じ種類の様々なコンポーネントが区別されることもある。本明細書内で、第1の参照ラベルのみが使用されていれば、その説明は、第2の参照ラベルに関係なく、同じ第1参照ラベルを有する類似コンポーネントのうち任意のものに適用できる。
図1は、本発明に従い構成された、楽曲ベースの検索用のシステムの簡略化した上位ブロック図である。 図2は、本発明による楽曲ベースの検索の例示的方法のフロー図である。 図3は、本発明による、オーディオ検索文字列を生成する、実例となる様々な種類の楽曲入力である。 図4Aは、本発明による、楽曲入力データを分解する方法のフロー図である。 図4Bは、本発明による、楽曲の小さな構成要素を分解する方法の実施形態である。 図4Cは、本発明による、楽曲の大きな構成要素を分解する方法の実施形態である。 図5Aは、本発明による、楽曲構成要素の生成のためにオーディオ信号入力を分解する例示的システムの簡略化したブロック図である。 図5Bは、本発明によるオーディオ分解ユニットの一実施形態の下位ブロック図である。 図6Aは、光学式文字認識(OCR)機能を提供するために、本発明に従って楽曲画像データを処理する例示的システムである。 図6Bは、OCRプロセッサへの入力として提供される、図6Aに示されているキャプチャデバイスからつくり出された例示的画像データである。 図7は、本発明による楽曲ベースの検索エンジンのGUIの実施形態である。 図8は、本発明の特定の実施形態を実装する計算システムのブロック図である。 図9は、本発明による製品の実例となる実施形態を、ハンドヘルドコンシューマ電子デバイスとして示す。 図10は、図9に示されているものに類似したデバイスの実施形態の動作を示す簡略化したプロセスフロー図である。
この説明は、実施例としての実施形態のみを提供するものであり、本発明の範囲、適用性、または構成を限定しようとするものではない。それどころか、続く実施形態の説明は、本発明の実施形態を実装できるようにする説明を当業者に提供する。本発明の意図および範囲から逸脱することなく、構成要素の機能および配置に様々な変更が加えられてよい。
したがって、様々な実施形態が、必要に応じて、様々な手順またはコンポーネントを省略、置換、または追加してもよい。例えば、当然のことながら、代替の実施形態では、記載されたものとは異なる順序で方法が実行されてもよく、様々なステップが追加、省略されても、または組み合わされてもよい。さらに、特定の実施形態に関して記載される特徴が、他の様々な実施形態に組み合わされてもよい。実施形態の種々の側面および構成要素が、同様の形で組み合わされてもよい。
さらに、当然のことながら、以下のシステム、方法およびソフトウェアは、個別に、または集合的に、より大きなシステムのコンポーネントであってもよく、その利用により他の手順が優先しても、またはそうでなければ他の手順がその利用に変更を加えてもよい。さらに、いくつかのステップが、以下の実施形態の前、後、またはそれと同時に必要な場合もある。
(概説)
本発明の実施形態は、楽曲ベースの検索に関する新規な機能を提供する。一側面において、本発明の技術は、ウェブポータルまたはイントラネット(LAN)サイトなどのネットワークサイトとして実装可能である。他の側面では、本発明は、クライアント側のソフトウェアとして、既存の検索環境に対するアドオン機能として、または専用デバイスおよびシステムとして提供されてもよい。
本発明の実施形態は、様々な特徴および機能を提供する。いくつかの実施形態は、様々な種類の検索入力(例えば、テキスト、オーディオ、楽譜画像など)を受け取り、様々な種類の検索出力(例えば、文字のリスト、オーディオ出力、楽譜出力など)を生成する。特定の実施形態では、本発明は、文字情報のインテリジェント構文解析、楽曲構成要素を生成するためのオーディオおよび楽譜画像データの分解、直交および重み付き検索能力、ならびにその他多数の機能をサポートする。本発明のいくつかの実施形態は、ローカルで(例えば、パーソナルコンピュータまたはローカルエリアネットワーク)動作するよう構成され、他の実施形態は、リモートで(例えば、インターネット経由で、またはリモートサーバを使用して)動作するよう構成される。さらに他の実施形態は、検索結果のテキスト、楽譜、オーディオ出力の生成を含む出力機能をサポートする。
図1は、本発明に従い構成された、楽曲ベースの検索用のシステム100の簡略化した上位ブロック図を示す。システム100は、ネットワーク110を介していくつかのワークステーション104に接続された検索エンジン160を含む。ワークステーション104は、ユーザインターフェースを介して検索エンジンにアクセスしてもよい。ネットワーク110は、このいくつかのワークステーション104間の通信を促す任意のものであってもよい。例えば、ネットワーク110は、インターネットまたはローカルエリアネットワーク(LAN)としてもよい。特定の実施形態では、検索エンジン160は、ワークステーション104上にあってもよく[(図示せず)]、ワークステーション104にあるかまたはワークステーション104に対してリモートのデータを検索するよう構成されていてもよい。
ワークステーション104は、ネットワーク110との通信と、検索入力102の受信とを行うよう構成されている任意のデバイスまたはシステムであってもよい。いくつかの実施形態では、ワークステーション104は多目的デバイスである。例えば、ワークステーション104は、コンピュータ(例えばラップトップ、デスクトップなど)またはハンドヘルドデバイス(例えば携帯情報端末、セルラー電話など)であってもよい。他の実施形態では、ワークステーション104は専用デバイスである。例えば、ワークステーション104は、検索入力102の受信、ネットワーク110との通信、および検索出力106の生成を含む、楽曲ベースの検索エンジンの提供専用に開発された専用の携帯用デバイスであってもよい。特定の実施形態では、ワークステーション104は、オーディオ、楽譜情報、テキスト、またはその他の情報を検索入力として入力するためのインターフェースであるか、またはそれを提供する。例えば、ワークステーション104は、エレキギター、デジタルオーディオコンポーネント、または楽曲楽譜の画像を記録するためのウェブカメラの直接ネットワークインターフェースであってもよい。
当然のことながら、本発明によれば、ワークステーション104が検索入力102を受信する方法は数多くある。例えば、検索入力102は、内蔵マイクロホンまたは外付けマイクロホン、ラインレベルオーディオポート、ファイル転送(例えば固定または取り外し可能データストアから、またはネットワーク経由で)、楽譜画像キャプチャデバイス、テキストフィールドなどによって受信されてもよい。楽曲入力の実施形態については、下記により詳しく記載する。検索入力は、検索エンジン出力を含む一致を探し出すために、データベースに対して送られるクエリを含んでもよい。
いくつかの実施形態では、ワークステーション104は、検索出力106を生成するよう構成されている。一実施形態では、検索出力106は、スピーカを通じてプレイされるよう構成されたオーディオ出力を含む。別の実施形態では、検索出力106は、ネットワーク経由で格納、プレイおよび/または共有されるよう構成されたオーディオファイルを含む。さらに別の実施形態では、検索出力106は、互換性のある他のシステムが使用するための楽曲構成要素データ(例えばピッチ、音程、テンポ、調、振幅など)を含む。さらに別の実施形態では、検索出力106は、楽譜表現データを含み、これは、楽譜編集ソフトウェアにより使用されるよう、文書編集もしくは公開システムに送信されるよう、または印刷されるよう構成されている。さらに別の実施形態では、検索出力106は、検索結果の一次元または多次元のリストを含む。
検索入力102の種類によっては、検索入力102から楽曲構成要素を分解することが望ましいこともある。一例では、検索入力102はオーディオ信号として受信される(例えば、検索者がギターを使用してマイクロホンに向けてメロディラインをプレイする)。別の例では、検索入力102は、楽曲楽譜の走査画像として受信される。どちらの例でも、検索入力102から楽曲構成要素を分解して、検索パラメータの生成に使用することが望ましいと考えられる。楽曲(例えば、オーディオおよび楽譜)分解については、下記により詳しく記載する。
いくつかの実施形態では、システム100は、楽曲分解機能を提供する1つ以上の楽曲分解ユニット120を含む。特定の実施形態では、楽曲分解ユニット120はワークステーション104上にある。例えば、楽曲分解ユニット120は、クライアントレベルのソフトウェアとして実装されてもよい。こうした実施形態では、検索入力102は、ネットワーク110経由で検索エンジン160へ送信される前に楽曲構成要素に分解されてもよい。他の実施形態では、楽曲分解ユニット120は、検索エンジン160の一部として提供されてもよい(例えば構成要素120−2)。検索入力102が、ワークステーション104にて受信され、ネットワーク110経由で検索エンジン160へ送信され、次に検索エンジン160にて楽曲構成要素へ分解されてもよい。
特定の実施形態では、検索エンジン160は、1つ以上のデータストア115と動作的に通信(operative communication)していてもよい。いくつかの実施形態では、検索エンジン160は、データストア115とネットワーク110経由で通信する。他の実施形態では、検索エンジン160はデータストア115と直接通信する。データストア115は、検索入力102または検索出力106に関する1種類以上の情報を格納するよう構成されてもよい。例えば、データストア115は、生のオーディオファイル(例えば、デジタル化オーディオ信号データを含んだファイル)、符号化オーディオファイル(例えば、ファイルコンテンツデータまたはオーディオ信号データに関するメタデータを含んだファイル)、楽曲構成要素情報(例えば、楽曲構成要素の各楽曲投稿に関連付けされて、多次元リレーショナルデータベースに格納される、分解済みの楽曲構成要素)などを格納するよう構成されてもよい。
当然のことながら、特定の種類のデータ保護が、本発明の実施形態において望まれる場合もある。いくつかの実施形態では、データストア115は、特定の種類のデータ保護(例えば、暗号化、パスワード保護など)を使用してデータを格納するよう構成されている。他の実施形態では、システム100の様々なコンポーネント間の物理および仮想通信リンクが安全である(例えば、セキュアソケットレイヤ暗号化による)。例えば、検索エンジン160とワークステーション104との間、または検索エンジン160とデータストア115との間のネットワーク通信が安全であってもよい。さらに他の実施形態では、検索出力106が保護され、コピー、削除などが防止されてもよい。例えば、特定のデジタル著作権管理(DRM:digital rights management)技術が用いられて、検索出力106ファイルの不正コピーまたは共有が制限されてもよい。
いくつかの実施形態では、検索エンジン160は、ネットワークインターフェースユニット150を通じてネットワーク110と通信する。ネットワークインターフェースユニット150の特定の実施形態は、特定の種類のネットワーク機能を提供することによって、検索エンジン160とネットワーク110との間の通信を促す。例えば、ネットワークインターフェースユニット150は、効果的な共同制作、ファイル転送および検索エンジン160のその他の能力を可能にするために、ネットワークトラフィックのルーティングおよび/または解釈を行う。
ネットワークインターフェースユニット150の様々な実施形態が、強化された能力を提供する。いくつかの実施形態では、ネットワークインターフェースユニット150は、ネットワーク110を介してワークステーション104からログイン情報を受信して処理するよう構成されている。一実施形態では、ログイン情報は、ワークステーション104のユーザを検証して、検索エンジン160に対するユーザのアクセス権を判断するために使用される。アクセス権は、例えば、そのユーザが検索エンジン160に入ることができるかどうか、どのファイルにそのユーザがアクセスしてよいか、検索エンジン160のどの機能をユーザが使用してよいかなどを決定してもよい。
当然のことながら、本発明によれば、検索エンジン160の多数の実施形態が可能である。いくつかの実施形態では、検索エンジン160は、ウェブブラウザを通じて使用されるよう構成されており、ネットワークアドレスに配置可能である。こうした実施形態のうちのいくつかでは、検索エンジン160は、異なる多数のブラウジング環境に拡張できるよう構成されている(例えば、XML、HTML、または別の拡張可能マークアップ言語で書かれることによる)。他の実施形態では、検索エンジン160は、ワークステーション104上にあるクライアント側アプリケーションとして実装される。こうした実施形態では、特定の機能がサーバ上に実装され(例えばファイル管理)、その一方で、検索処理の大部分がクライアントワークステーション104上で行われてもよい。さらに他の実施形態では、検索エンジン160は、ローカルエリアネットワーク用の別個のネットワークサーバ上にあってもよく、または、ワークステーション104が、ネットワークにアプリケーションを供給するために使用されてもよい。
検索エンジン160の実施形態は、検索インターフェースユニット130を含む。様々な実施形態において、検索インターフェースユニット130は、入力およびクエリの操作、検索のパラメータ化、結果の読み出しおよび順位付け、結果の表示などを含む、検索エンジン160の中心的機能を実行するよう構成されている。検索インターフェースユニット130の実施形態および機能については、下記により詳しく記載する。
検索エンジン160の実施形態は、出力生成ユニット140をさらに含む。いくつかの実施形態では、出力生成ユニット140は、検索インターフェースユニット130から出力を受信して出力データを生成するよう構成されてもよい。出力生成ユニット140によって生成されたデータは、データストア115(例えば、直接もしくはネットワーク110経由で)、またはワークステーション104に伝達されてもよい。いくつかの実施形態では、出力生成ユニット140によって生成される出力データは、検索出力106であってもよい。他の実施形態では、出力生成ユニット140によって生成される出力データは、検索出力106を生成するためにワークステーション104によって使用可能であってもよい。
図2は、本発明による、楽曲ベースの検索の例示的方法200のフロー図を示す。方法200のいくつかの実施形態は、図1に示されているシステム100のようなシステムを使用して実行されてもよい。方法200は、ブロック202で楽曲クエリ入力を受信することによって開始する。様々な実施形態において、ブロック202にて受信される楽曲クエリ入力は、テキスト入力102−1、オーディオ入力102−2(例えば、オ−ディオ信号またはオーディオファイル)および/または楽譜入力102−1(例えば、楽曲構成要素データの楽譜画像または楽譜エントリ)を含んでもよい。
ブロック204で、方法200は、クエリ入力を処理し、楽曲ベースの検索用のデータを生成する。いくつかの実施形態では、同定可能な楽曲構成要素の組を生成するために、オーディオ入力102−2または楽譜入力102−3が分解される。他の実施形態では、クエリを同定可能な楽曲構成要素に変換するために、テキスト入力102−1が構文解析され、さらに別の方法で処理されてもよい。その他多数の種類の処理が、ブロック204において可能である。それには、例えば、オーディオ信号の正規化または雑音除去を行って分解を助けること、提供された情報に、他の提供情報と矛盾したものまたは一貫性がないものがないかを評価することなどが含まれる。
いくつかの実施形態では、方法200はさらに、ブロック206で、クエリプリファレンスの組を受信する。特定の実施形態では、クエリプリファレンスは、様々な検索構成要素の重み付けのプリファレンスの組を含む。例えば、検索者は、約100ビート毎分(bpm:beats per minute)のテンポであって好適にはトランペットラインを備えた、ジャズソングすべてを要求してもよい。この検索者は、そうした構成要素すべてを検索し、ただしトランペット構成要素にはより低い重み付けを与えてもよい。よって、テンポが好ましい範囲の外にあるジャズトランペットパフォーマンスは、トランペットラインのない100bpmのジャズパフォーマンスよりも低く順位付けされてもよい。
当然のことながら、本発明によれば、多数の種類の重み付けおよびプリファレンスが可能である。例えば、検索者は、パフォーマンスの最初の1分間のうちに生じる情報を検索してもよい。別の例として、検索者は、オーディオ入力およびテキスト入力の両方を提供して(例えば、検索者が、キーボードを使用して検索エンジンへメロディラインをプレイし、テキストエントリフィールドを使用してクラシック楽曲のみを探すよう検索エンジンに命じる)、テキスト入力をオーディオ入力よりも大きく重み付けしてもよい。
ブロック208において、方法200は、ブロック202で受信された入力と、ブロック206で受信されたプリファレンスとを使用して、検索パラメータの組を生成してもよい。いくつかの実施形態では、ブロック208での検索パラメータの生成は、単にブロック202および206から受信されたデータを変換することを含む。例えば、分解された楽曲構成要素、構文解析されたテキストデータ、およびその他の情報が、データベースに対して実行されるクエリ言語に変換されてもよい。他の実施形態では、ブロック208での検索パラメータの生成は、ブロック202および206から受信されたデータを解釈することを含む。例えば、検索者が検索エンジンへメロディを笛で吹くと、検索エンジンは、検索者がメロディを伝えようとしたのか、テンポもしくはリズムを伝えようとしたのか、その曲が笛を吹いて演奏されたことを伝えようとしたのか、またはその他何らかの情報もしくは情報の組み合わせを伝えようとしたのかを判断してもよい。さらに他の実施形態では、ブロック208での検索パラメータの生成は、例えば、ブール演算を評価すること、通常語(plain language)入力をクエリに対応した入力に変換することなどを含んでもよい。
ブロック208において検索パラメータが生成されると、方法200は、ブロック210において検索を実行して、検索結果を読み出す。ブロック210の実施形態は、検索を、1つ以上の所定のデータベースに対して実行しても、データ(例えば、インターネットを介してアクセス可能なデータ)のネットワークに対して実行しても、ローカルのデータストアに対して実行しても、またはその他任意の、検索可能な楽曲データ用のコンピュータアクセス可能な場所に対して実行してもよい。特定の実施形態は、実際のオーディオファイルを返すことによって結果を返し、他の実施形態は、オーディオファイルへのポインタ、オーディオファイルに関する文字もしくは楽譜表現情報、またはその他任意の有用な情報を返す。
ブロック212において、方法200は、結果を順位付けして表示する。当然のことながら、本発明によれば、結果の順位付けは、いくつかの方法で実行されてもよい。例えば、結果の順位付けは、楽曲構成要素(例えば格納データまたは検索入力データ内の)の判断における信頼値、一致したパラメータの数および一致した程度、ユーザによって供給されたかまたは検索エンジンによって推測された重み付けおよび他のプリファレンスなどに関係してもよい。
場合によっては、ブロック212は、検索者にとって望ましくない、または必要条件の何らかの組に適合しない結果リストを生成することもある。例えば、ユーザの観点から、リストが興味をそそらない、数が多すぎる、短すぎる、不適切な順序であるなどの可能性がある。よって、ブロック214において、方法200は、検索を修正するかどうかを決定する。いくつかの実施形態では、検索者は、検索の修正(例えば、追加すること、または既存の検索パラメータを変更することによる)を決定し、他の実施形態では、検索エンジンが結果パラメータに基づいて自動的に検索を修正する。例えば、検索者が検索エンジンに、ギターでプレイされた特定の種類の曲に関してクエリを行うが、検索結果が返されないと仮定する。検索エンジンは、バンジョー、ベースまたはシタールなどの他の楽器でプレイされた曲を含めるよう自動的に検索を修正してもよい。修正後の検索で結果を見つけた後、検索エンジンは、「「ギター」の検索で0件の結果が返りました。「バンジョー」を含めるよう検索を広げると、12件の結果が生じました。「バンジョー」の結果を表示するには[ここ]をクリックしてください。」というようなことを示す通知を検索者に返してもよい。他の自動検索修正が、検索エンジンによってもたらされてもよい。
方法200が、ブロック214において、検索の修正が必要であると判断すると、新たな入力または変更された入力がブロック216で受信されてもよい。こうした新たな入力または変更された入力は、ブロック208から212まで、新たな結果を伴う修正された検索を生成するために使用されてもよい。したがって、ユーザは、新たな入力または変更された入力を含む追加のクエリを出すことを求めてもよい。その結果、検索が反復する形で実施されてもよい。
方法200が、ブロック214にて、検索が修正されるべきではないと判断すると(例えば、検索者が受信された結果で次に進む、または結果が結果パラメータを満たす)、ブロック218にて、検索結果が出力または分解されてもよい。いくつかの実施形態では、受信される結果は、オーディオファイル、楽譜画像、またはその他の情報を含む。こうした実施形態のいつくかでは、結果を分解して、特定の出力(例えば、特定の楽曲構成要素に関する文字出力106−1、特定のパラメータを備えたオーディオ出力106−2、楽譜表現出力106−3など)を生成することが望ましい場合もある。
当然のことながら、図1および2に関して記載された実施形態は、本発明の例示的構造および例示的機能の概要を提供することを目的としている。よって、上記で与えられた説明は、本発明の範囲を制限するものと解釈されるべきではない。さらに明瞭にするために、特定の機能のさらなる説明が、以下でさらに論じられる。
(検索入力)
楽曲寄与を生成するために、多数の異なる種類の検索入力が考えられる。図3は、本発明による、検索寄与を生成するための、実例となる様々な種類の検索入力を示す。当然のことながら、図3に示されている検索入力装置は、考えられる多数の検索入力装置のうちのいくつかのみを提供するものであり、本発明の可能性を制限するものと解釈されるべきではない。
検索入力の一実施形態には、生のオーディオファイル302が含まれる。生のオーディオファイル302は、デジタル信号表現へとデジタル化されたオーディオ信号データを含んでもよい。例えば、デジタル信号情報は、タイムスタンプおよび電圧レベルをそれぞれ有する複数のサンプルを含んでもよく、このサンプルは、オーディオ信号のアナログバージョンを表すものである。他の例では、デジタル信号情報が、オーディオ信号を計算手順で表すために符号化されてもよい(例えば、誤り訂正情報、コーデック情報などを含む)。
検索入力の別の実施形態には、強化されたオーディオファイル304が含まれる。強化されたオーディオファイル304は、生のオーディオファイル302に存在するデータを補完する、またはそれに取って代わる情報を含んでもよい。特定の実施形態では、強化されたオーディオファイル304は、ファイルのコンテンツについてのメタデータ、その形式、またはその他有用な情報を含んでもよい。例えば、メタデータは、トラック名、アルバム名、アーティスト名、ジャンルなどを含めて、オーディオファイルについて手動で入力された情報を含んでもよい。別の例では、メタデータは、他のシステムに対応してもよい(例えば、曲のアルバム製造番号およびトラック番号がメタデータ内に提供され、特定のデータベース検索が、曲のタイトルのような、その曲についての他の情報を返せるようにしてもよい)。
強化されたオーディオファイル304のいくつかの実施形態は、生のオーディオファイル302を、エンコーダ330に通すことによってつくられる。例えば、強化されたオーディオファイル304は、MPEG−7エンコーダによって生成されてもよい。MPEG−7エンコーダは、メタデータを格納し、メタデータを、強化されたオーディオファイル304内の特定のタイムスタンプに結びつけるために、XMLを使用することができる。他の実施形態では、強化されたオーディオファイル304は、生のオーディオファイル302を、オーディオ分解器320に通すことによって生成されてもよい。オーディオ分解器320は、生のオーディオファイル302から検索構成要素を分解し(下記により詳しく記載するように)、それを強化されたオーディオファイル304に格納してもよい。
検索入力のさらに別の実施形態には、互換性のある楽器306からのデジタル化された出力を含む。一実施形態では、楽器デジタル・インターフェース(MIDI:Musical Instrumental Digital Interface)楽器(例えばキーボード)が、MIDIデータ生成に使用される。MIDIデータは、楽曲構成要素を含んでもよい。場合によっては、含まれる楽曲構成要素が、他の楽曲構成要素の生成に使用されてもよい。例えば、MIDIデータは、音符のピッチを複数含むと考えられ、これを分析して調を判断することができる。他の実施形態では、互換性のある楽器306は、使用可能な形式でデータを出力するよう動作可能であってもよい。例えば、キーボードは、デジタル同軸、光学または他の種類の出力を有してもよく、この出力は、他のコンポーネントに対応してもよい。
検索入力のさらに別の実施形態には、センサ308からのアナログ出力が含まれる。一実施形態では、1つ以上の楽器により生成される圧力波を検出して、それをアナログオーディオ信号に変換するために、1つ以上のマイクロホンが使用される。別の実施形態では、エレキギターのスチール弦の動きをアナログオーディオ信号に変換するために電磁ピックアップが使用される。
検索入力のさらに別の実施形態には、編集可能楽譜ファイル310が含まれる。編集可能楽譜ファイル310は、編集可能な楽譜データを含む任意の種類のファイルであってもよい。例えば、編集可能楽譜ファイル310は、楽譜編集ソフトウェア340を使用して生成されたものでもよい。検索入力のいくつかの実施形態には、楽譜画像312が含まれる。楽譜画像312の実施形態は、任意の種類の使用可能なデジタル画像を含んでもよい。一実施形態では、楽譜画像312は、印刷されている楽譜を画像キャプチャ装置(例えばスキャナ、デジタルスチルまたはビデオカメラなど)によってデジタル画像に変換してつくられる、楽譜の物理的なプリントアウト(例えばシートミュージック)のデジタル化表現である。他の実施形態では、楽譜画像312は、楽譜画像312を楽譜分解器350に通すことによって編集可能楽譜ファイル310へと変換される。下記により詳しく記載するように、楽譜分解器350は、楽譜画像312から楽曲構成要素を分解するよう動作可能であってもよい。
検索入力の他の実施形態は、1つ以上のテキストクエリ314を含む。テキストクエリ314は、楽曲ベースの検索の検索クエリとして解釈可能な任意の種類のテキストデータを含んでもよい。一実施形態では、テキストクエリ314は、検索パラメータへと復号されるよう構成された、クエリ言語に形式を合わせたテキストを含む。別の実施形態では、テキストクエリ314は通常語データを含む。さらに別の実施形態では、テキストクエリ314は、ブール演算子、フィールド名、特殊文字などの他のパラメータを含む。特定の実施形態では、テキストクエリ314は、検索入力を生成するよう、テキストパーサ360またはその他のテキスト処理ユニットを通る。
特定の実施形態では、エンコーダ330、オーディオ分解器320、楽譜分解器350、楽譜エディタ340、テキストパーサ360、またはその他のアプリケーションは、ワークステーション104、サーバコンピュータ、またはネットワーク110上にあっても良い。他の実施形態では、検索入力102は、楽曲ベースの検索用の検索可能な構成要素であってもよく、または、それを生成するために使用されてもよい。特定の実施形態では、検索可能な構成要素は、楽曲ベースの検索のためのデータとして検索データベース115内に格納されてもよい。他の実施形態では、検索可能な構成要素は、楽曲ベースの検索用に、ネットワーク110に渡されてもよい。
(オーディオ分離)
本発明のいくつかの実施形態では、オーディオ信号データおよび楽譜画像データのような楽曲入力データからの楽曲構成要素の分解を実現することが望ましいと考えられる。当然のことながら、様々な種類の楽曲入力データから楽曲構成要素を分解する方法が多数ある。場合によっては、データが、分解しやすい形でオーディオファイルに格納されることもある。例えば、楽曲構成要素データは、強化されたオーディオファイルにヘッダ情報として格納されることもある。しかし、他の場合には、特定の種類の楽曲構成要素を楽曲入力データから抽出するのが簡単でないこともある。
図4Aは、本発明による、楽曲入力データを分解する方法400のフロー図を示す。方法400は、ブロック402において楽曲入力データを受信することによって開始する。いくつかの実施形態では、ブロック402において受信された楽曲入力は、
検索入力、検索データベースに格納された楽曲若しくは楽曲構成要素、または楽曲ベースの検索と置換可能な別の楽曲データを含んでもよい。
ブロック410において、楽曲の小さな構成要素が楽曲入力から分解される。一例として、楽曲の小さな構成要素は、音符のピッチおよび音価(note value)、タイムスタンプ、音符の包絡線および音色、調、テンポ、ならびにその他同様の構成要素を含み得る。特定の実施形態では、楽曲の小さな構成要素は、楽曲の他の小さな構成要素のグループを複数含んでもよい(例えば、タイで連結された音符、3連符、トラックまたは楽器によってグループ分けされた音符、小節によってグループ分けされた音符、寄与者によってグループ分けされた音符など)。他の実施形態では、楽曲の小さな構成要素は、楽曲の他の小さな構成要素のコンポーネントを含んでもよい(例えば符幹(stem)、符尾(flag)、付点など)。
ブロック450において、楽曲の大きな構成要素が分解される。一例として、楽曲の大きな構成要素は、楽曲の小さな構成要素のグループおよびパターンの分析から生成される情報を含んでもよい。いくつかの実施形態では、楽曲の大きな構成要素は、楽曲の小さな構成要素の複数のグループに関する部分的または全体的なパターン情報を含む(例えば、
リズム記号、反復モチーフ、コード/調の変更、形式(例えばA−B−A、またはコーラス−ヴァース−ヴァース−コーラス)など)。その他の実施形態では、楽曲の大きな構成要素は、楽曲の小さな構成要素の複数組から算出される統計情報を含む(例えば音符またはリズムパータンのヒストグラムなど)。続いて、楽曲の小さな構成要素および大きな構成要素が、ブロック490において出力されてもよい。
図4Bは、本発明による、楽曲の小さな構成要素を分解する方法410の実施形態を示す。方法410は、ブロック402において楽曲入力信号を受信することによって開始する。いくつかの実施形態では、楽曲入力信号の前処理が行われてもよい。例えば、オーディオ信号のアナログからデジタルへの変換、より低いサンプルレートへのダウンコンバート、特定のエンコーダまたはデコーダとの互換性のためのトランスコード、モノフォニックオーディオトラックへの解析、またはその他任意の有用な前処理が行われてもよい。
いくつかの実施形態では、ブロック412においてピッチ情報が抽出され、音符開始(note onset)イベントがブロック414において抽出される。方法410のいくつかの実施形態では、ブロック412において抽出されたピッチ情報およびブロック414において抽出された音符開始イベントが、ブロック402において受信されたオーディオ信号から他の情報を抽出して処理するために使用される。
特定の実施形態では、この情報は、ブロック416において音符の持続時間を判断するため、ブロック418において休符を判断するため、ブロック420において複数の時間ウィンドウ(time window)にわたるテンポを判断するため、ブロック424において複数のウィンドウにわたる調を判断するため、さらにブロック428において楽器編成を判断するために使用される。他の実施形態では、ブロック416において判断された音符の持続時間、ブロック418において判断された休符、ブロック420において判断されたテンポが、ブロック422において、音価を判断するために使用される。ブロック424において判断された調は、ブロック426において調のピッチ指示(pitch designation)を判断するために使用される。ブロック428において判断された楽器編成は、ブロック430においてトラックを判断するために使用される。様々な実施形態において、ブロック412〜430の出力は、ブロック490−1において、楽曲の小さな構成要素としての出力を生成するために使用されるよう構成されている。
図4Cは、本発明による、楽曲の大きな構成要素を分解する方法450の実施形態を示す。方法450は、ブロック452において楽曲の小さな構成要素を受信することによって開始する(例えば、図4Bの方法410から)。楽曲の小さな構成要素は、いくつかの種類の、楽曲の大きな構成要素を生成するために使用されてもよい。
いくつかの実施形態では、楽曲の小さな構成要素は、ブロック454において曲の形式を判断し(例えば、イントロ−ヴァース−コーラス−ヴァース−ブリッジ−コーラス−コーラス−アウトロ)、ブロック456においてジャンルを判断し(例えば、ロック、クラシック、ジャズ、インドの古典楽曲など)、ブロック458においてリズム記号を判断し(例えば、第1楽章は4/4拍子で90ビート毎秒(bpm:beats per minute)のテンポ、第2楽章は3/4拍子で120bpmのテンポ、さらに第3楽章は4/4拍子に戻るが120bpmのテンポのまま)、ブロック460において音調曲線を判断し(例えば、曲が比較的低音量かつ速いテンポでドラムおよびベースのみで開始し、1分後、その曲が、中音量かつより遅いテンポでクリーンなギターラインを追加する)、ブロック462において、調の変更を判断し(例えば、その曲がハ長調という調で始まり、ヘ長調に転調してすぐにニ短調、ト長調と転調し、ハ長調に戻る)、ブロック464においてコード変更を判断するため(例えば、その曲の一部がAmからDmへ、Gmへ、Cへ、Fへと変化する、またはその曲がiiiからviへ、iiへ、Vへ、Iへと変化する)に使用される。様々な実施形態において、ブロック454〜464の出力は、ブロック490−2において、楽曲の大きな構成要素として出力を生成するために使用されるよう構成されている。
当然のことながら、本発明によれば、その他多数の種類の、楽曲の小さな構成要素および楽曲の大きな構成要素が可能である。さらに、検索に必要な楽曲構成要素の種類に応じて、楽曲入力信号は、多数の異なるレベルで分解されてもよい。例えば、仮のドラムトラックが、リズム情報を提供するためだけに使用されてもよい。その場合、ピッチ、音色、調などに関係する楽曲構成要素を分解または保存しても、リソースの無駄であると考えられる。別の例では、ボーカルラインが、曲のセクション全体にわたるピッチ変化の音調曲線の大まかな方向付けを提供するために使用されてもよい。その場合、正確なピッチ、音符の持続時間などを分解することは重要でないと考えられる。むしろ、ピッチ変動の大まかな指示のみを、近似のピッチ値および持続時間を用いて抽出するほうがより効率的であると考えられる。
さらに、当然のことながら、利用可能な楽曲データの種類および様々な用途のニーズに応じて、楽曲入力から楽曲構成要素を分解する多数の方法があると考えられる。図5Aは、本発明の実施形態による楽曲構成要素を生成するためにオーディオ信号入力を分解する例示的システムの簡略化したブロック図を示す。図のように、入力102が、楽曲分解ユニット120によって受信され、楽曲分解ユニット120は、入力102を分解して分解済み出力570を生成する。
いくつかの実施形態では、入力102は、オーディオ受信器ユニット506にある楽曲分解ユニット120により受信される。一実施形態では、作品が、マイクロホンまたはマイクロホン配列によってリアルタイムで受信され、さらに、オーディオ受信器ユニット506によって受信されるよう、アナログ電気入力102に変換される。他の実施形態では、入力102は、再生に適した記録済み楽曲ファイルなどのデジタルデータを含んでもよい。入力102がアナログ信号であれば、信号処理装置ユニット510、音符処理装置ユニット530、および楽譜処理装置ユニット550によるデジタル信号処理に備えて、オーディオ受信器ユニット506によってデジタル表現に変換されてもよい。入力102がリアルタイムで受信される場合、入力102の全長をあらかじめ判断する方法はないと考えられる。よって、入力102は、所定間隔(例えば、経過時間、デジタルサンプルの数、メモリ使用量など)で受信および格納され、それに合わせて処理されてもよい。別の実施形態では、記録済みのサウンドクリップが、オーディオ受信器506により受信されてデジタル化され、それによって固定の時間間隔を有するものになる。
楽曲分解ユニット120の一実施形態の下位ブロック図が、図5Bに示されている。1つ以上のオーディオソース502が、楽曲入力信号102を生成するために使用されてもよい。オーディオソース502は、楽曲入力信号102をオーディオ受信器506に提供することができる任意のものであってもよい。いくつかの実施形態では、1つ以上のマイクロホン、トランスデューサ、および/またはその他のセンサが、オーディオソース502として使用される。マイクロホンが、生のパフォーマンス(または記録されたパフォーマンスの再生)からの圧力波または電磁波を、楽曲入力信号102として使用される電気信号へと変換してもよい。例えば、生のオーディオパフォーマンスでは、歌い手からのオーディオの検知および変換を行うためにマイクロホンが使用されてもよく、その一方で、ギターおよびベースからのオーディオの検知および変換を行うために電磁「ピックアップ」が使用されてもよい。他の実施形態では、オーディオソース502は、楽曲入力信号102、または楽曲入力信号102を読み取ることができるオーディオファイルを提供するよう構成されたアナログまたはデジタル装置を含んでもよい。例えば、デジタル化オーディオファイルは、オーディオ形式でストレージ媒体上に格納され、そのストレージ媒体によって、楽曲入力信号102としてオーディオ受信器506に提供されてもよい。
当然のことながら、オーディオソース502次第で、楽曲入力信号102は異なる特性を有してもよい。楽曲入力信号102は、モノフォニックであってもポリフォニックであってもよく、複数のトラックのオーディオデータを含んでもよく、多数の種類の楽器からのオーディを含んでもよく、特定のファイルフォーマットなどを含んでもよい。同じく、当然のことながら、オーディオ受信器506は楽曲入力信号102を受信することができる任意のものであってもよい。さらに、オーディオ受信器506は、オーディオソース502と接続し、音楽入力信号102を受信または解釈するために必要な1つ以上のポート、デコーダ、またはその他のコンポーネントを含んでもよい。
オーディオ受信器506は、さらなる機能を提供してもよい。一実施形態では、オーディオ受信器506は、アナログ楽曲入力信号102をデジタル楽曲入力信号102に変換する。別の実施形態では、オーディオ受信器506は、楽曲入力信号102を、より低いサンプルレートにダウンコンバートして、システム500に対する計算負荷を軽減するよう構成されている。一実施形態では、楽曲入力信号102は約8〜9kHzにダウンサンプリングされる。これは、楽曲入力信号102のより高い周波数分解能を提供することができ、システム500の設計に対するいくらかの制約(例えばフィルタの規格)を軽減することができる。
さらに別の実施形態では、オーディオ受信器506は、オーディオレベルが一定の閾値を超えたことの検出に基づき、楽曲入力信号102の受信を開始する(例えば記録を開始する)よう設定された、閾値検出コンポーネントを含む。例えば、閾値検出コンポーネントは、特定の期間にわたってオーディオを分析して、楽曲入力信号102の振幅が或る一定時間、所定の閾値より上にとどまるかどうかを検出してもよい。閾値検出コンポーネントは、楽曲入力信号102の振幅が一定時間、所定の閾値未満に下がると、楽曲入力信号102の受信を中断する(例えば記録を中断する)ようさらに設定されてもよい。さらに別の実施形態では、閾値検出コンポーネントは、楽曲入力信号102の受信を実際に開始または終了するのではなく、楽曲入力信号102の振幅が、或る時間の間、閾値を超えた状態かまたは閾値未満に下がった状態を表す、システム500のフラグを生成するために使用されてもよい。
図5Bによれば、オーディオ受信器506は、楽曲入力信号102を信号処理装置ユニット510に渡す。信号処理装置ユニット510は、振幅抽出ユニット512および周波数抽出ユニット514を含む。振幅抽出ユニット512は、楽曲入力信号102から振幅関連情報を抽出するよう構成されている。周波数抽出ユニット514は、楽曲入力信号102から周波数関連情報を抽出するよう構成されている。
一実施形態では、周波数抽出ユニット514は、変換アルゴリズムを使用して時間領域からの信号を周波数領域に変換する。例えば、時間領域では、楽曲入力信号102は経時的な振幅の変化として表されてもよい。一方、高速フーリエ変換(FFT)アルゴリズムを適用した後、同じ楽曲入力信号102は、その周波数成分それぞれの振幅のグラフとして表されてもよい(例えば、倍音系列のような、信号が処理される周波数範囲内の各周波数帯の相対的強度または相対的寄与率)。処理を効率化するには、このアルゴリズムを一定の周波数範囲に限定することが望ましいこともある。例えば、周波数範囲は可聴スペクトル(例えば約20Hz〜20kHz)のみにわたってもよい。
様々な実施形態において、信号処理装置ユニット510は、周波数関連情報を他の方法で抽出してもよい。例えば、多数の変換アルゴリズムは、固定幅の線形周波数「バケット(buckets)」において信号を出力する。これは、特にオーディオ信号が事実上本質的に(線形ではなく)対数的かもしれないということを考えると、可能な周波数分解能または変換の効果を制限する可能性がある。当該技術分野では、楽曲入力信号102から周波数関連情報を抽出するための多数のアルゴリズムが既知となっている。
続いて、振幅抽出ユニット512により抽出された振幅関連情報と、周波数抽出ユニット514により抽出された周波数関連情報とが、音符処理ユニット530の様々なコンポーネントによって使用されてもよい。いくつかの実施形態では、音符処理ユニット530は、音符開始検出器ユニット532、音符持続時間検出器ユニット534、ピッチ検出器ユニット536、休符検出器ユニット544、包絡線検出器ユニット538、音色検出器ユニット540、および音符強弱検出器ユニット542のうちの全部または一部を含む。
音符開始検出器ユニット532は、音符開始を検出するよう構成されている。音符の開始(すなわち始まり)は、典型的には、楽曲の中でピッチの変化として(例えばスラー)、振幅の変化として(例えば包絡線の、アタッチ部(attach portion))、またはピッチおよび振幅の変化の何らかの組み合わせとして現れる。よって、音符開始検出器ユニット532は、周波数(すなわちピッチ)および/または振幅に特定の種類の変化があるときは常に音符開始イベントを生成するよう設定されてもよい。
音符は、その持続時間(例えば、秒またはサンプル数での、音符が続く時間)によって特徴づけられてもよい。いくつかの実施形態では、音符処理ユニット530は、音符開始イベントによりマークされた音符の持続時間を検出するよう構成されている音符持続時間検出器ユニット534を含む。
なお、楽曲の一部の特性は、単に信号の物理的特質ではなく、心理音響的なものである。例えば、周波数は信号の物理的特性である(例えば、正弦波が伝わるサイクル数/秒を表す)が、ピッチはより複雑な心理音響的現象である。1つの理由は、楽器から出る単一のピッチの音符は、通常、振幅のそれぞれ異なるいくつかの周波数で構成されているということであり、これは音色として知られる。脳は、それらの周波数のうち1つ(例えば、典型的には基本周波数)を「ピッチ」として感知し、他の周波数は、単にその音符に対して「調和した音色」を加えるものとして感知すると考えられる。場合によっては、聴き手が体験する音符のピッチは、ほとんどまたは完全に、信号にない周波数であることもある。
いくつかの実施形態では、音符処理ユニット530は、音符開始イベントによりマークされた音符のピッチを検出するよう構成されているピッチ検出器ユニット536を含む。他の実施形態では、ピッチ検出器ユニット536は、個々の音符のピッチを追跡する代わりに(またはそれに加えて)、楽曲入力信号102のピッチを追跡するよう設定されている。当然のことながら、場合によって、ピッチ検出器ユニット536は、閾値を超える楽曲入力信号102のピッチの変化を判断するために音符開始検出器ユニット532により使用されてもよい。
音符処理ユニット530のいくつかの実施形態は、楽曲入力信号102中の休符の存在を検出するよう構成されている休符検出器ユニット544を含む。休符検出器ユニット544の一実施形態は、振幅抽出ユニット512によって抽出された振幅関連情報と、ピッチ検出器ユニット536によって生成された信頼情報とを使用する。例えば、振幅関連情報は、楽曲入力信号102の振幅が、或る時間ウィンドウにわたって相対的に低い(例えば、ノイズフロアにあるか、またはそれに近い)ことを明らかにしてもよい。ピッチ検出器ユニット536は、同じ時間ウィンドウにわたって、特定ピッチの存在の信頼度が非常に低いと判断してもよい。この情報および他の情報を使用して、休符検出器ユニット544は、休符の存在と、休符が開始したと思われる時間位置とを検出する。
いくつかの実施形態では、音符処理ユニット530は、音色検出器ユニット540を含む。振幅抽出ユニット512によって抽出された振幅関連情報と、周波数抽出ユニット514によって抽出された周波数関連情報とが、音色検出器ユニット540によって、楽曲入力信号102の一部の音色情報を検出するために使用されてもよい。オーディオ信号102のこの部分の倍音構成(harmonic composition)を、音色情報が明らかにしてもよい。いくつかの実施形態では、音色検出器ユニット540は、音符開始イベントから開始する特定の音符に関する音色情報を検出してもよい。
音色検出器ユニット540の一実施形態では、ガウシアンフィルタを用いて振幅関連情報および周波数関連情報の畳み込みが行われ、フィルタ処理されたスペクトルが生成される。続いて、フィルタ処理されたスペクトルは、ピッチ検出器ユニット536によって検出されたピッチの周りに包絡線を生成するために使用されてもよい。この包絡線は、当該ピッチの音符の音色に対応してもよい。
いくつかの実施形態では、音符処理ユニット530は、包絡線検出器ユニット538を含む。振幅抽出ユニット512によって抽出された振幅関連情報が、包絡線検出器ユニット538によって、楽曲入力信号102の一部の包絡線情報を検出するために使用されてもよい。例えば、ピアノを打鍵すると、ハンマーに弦の組をたたかせることができ、アタック振幅の大きなオーディオ信号をもたらす。この振幅は、急速なディケイを経て、弦が共振する若干の定常状態振幅でのサステイン状態に至る(当然、弦のエネルギーが消耗されるにつれ、包絡線のこの部分にわたって振幅は徐々に小さくなると考えられる)。最後に、ピアノの鍵がリリースされると、ダンパーが弦の上に降り振幅が急速にゼロに落ちる。この種類の包絡線は、典型的には、ADSR(attack,decay,sustain,release:アタック、ディケイ、サステイン、リリース)包絡線と呼ばれる。包絡線検出器ユニット538は、ADSR包絡線の各部分の一部もしくは全部、またはその他任意の種類の有用な包絡線情報を検出するよう設定されてもよい。
様々な実施形態において、音符処理ユニット530は、音符強弱検出器ユニット542も含む。特定の実施形態では、音符強弱検出器ユニット542は、特定の音符開始イベントから開始する特定の音符に対して、包絡線検出器ユニット538に似た機能を提供する。他の実施形態では、音符強弱検出器ユニット542は、包絡線検出器ユニット538によって検出されている包絡線のパターンに関して、基準からはずれているか、または或る所定のパターンに適合する音符包絡線を検出するよう構成されている。例えば、スタッカートの音符は、そのADSR包絡線の鋭いアタック部分と、短いサステイン部分とを特徴とすると考えられる。別の例では、アクセントのある音符は、周囲の音符のアタック振幅よりも著しく大きいアタック振幅を特徴とすると考えられる。
当然のことながら、音符強弱検出器ユニット542および他の音符処理ユニットは、分解済み出力570の一部として望ましいと思われる、音符の他の特質を複数特定するために使用されてもよい。例えば、音符は、スラー、アクセント、スタッカート、装飾音符などとして記号を付けられることもある。その他多数の音符の特性が、本発明により抽出されてもよい。
複数の音符または音符開始イベント(休符を含む)に関する情報が、他の情報の生成に使用されてもよい。図5Bの実施形態によれば、音符処理ユニット530の様々なコンポーネントが、楽譜処理ユニット550の様々なコンポーネントと動作的に通信してもよい。楽譜処理ユニット550は、テンポ検出ユニット552、拍子検出ユニット554、調検出ユニット556、楽器同定ユニット558、トラック検出ユニット562、および全体的強弱検出ユニット564のうちの全部または一部を含んでもよい。
いくつかの実施形態では、楽譜処理ユニット550は、時間ウィンドウにわたる楽曲入力信号102のテンポを検出するよう構成されているテンポ検出ユニット552を含む。典型的には、楽曲の一部分のテンポ(例えば、音響心理学的に楽曲が進むように思われる速度)は、ある程度、音符および休符の存在および持続時間による影響を受けると思われる。よって、テンポ検出ユニット552の特定の実施形態は、音符開始検出器ユニット532、音符持続時間検出器ユニット534、および休符検出器ユニット544からの情報を使用して、テンポを判断する。テンポ検出ユニット552の他の実施形態は、判断されたテンポをさらに使用して、音価(例えば、4分音符、8分音符など)を音符および休符に割り当てる。
拍子は、楽曲の各小節にいくつの拍があり、どの音価を1拍と見なすかを規定する。例えば、4/4という拍子は、各小節が4拍(分子)を有し、1拍が4分音符(分母)で表されるということを表す。このため、拍子は、音符および縦線の場所、さらに有用な分解済み出力570を提供するために必要となり得る他の情報を判断する助けとなると考えられる。いくつかの実施形態では、楽譜処理ユニット550は、楽曲入力信号102の拍子を検出するよう構成されている拍子検出ユニット554を含む。
いくつかの実施形態では、単純拍子は、テンポ情報、およびテンポ検出ユニット552により抽出された音価、ならびにその他の情報(例えば、音符強弱検出器ユニット542により抽出された音符強弱情報)から推測される。しかし通常、拍子の判断は、複雑なパターン認識を伴う複雑なタスクである。
例えば、楽曲入力信号102から、4分音符、4分音符、8分音符、8分音符、8分音符、8分音符という音価の並びが抽出されると仮定する。この単純な並びは、4/4の1小節、2/4の2小節、1/4の4小節、8/8の1小節、またはその他多数の拍子として表すことができるであろう。最初の4分音符および最初の8分音符にアクセント(例えば増大したアタック振幅)があったと仮定すれば、これによって、この並びは、2/4の2小節、4/8の2小節、または4/4の1小節である可能性がより高くなる。さらに、4/8が非常にまれな拍子であるということを前提とすると、推測として4/8を除外するのに十分であると思われる。さらに、楽曲入力信号102のジャンルがフォークソングであるという認識によって、4/4が最も適当な拍子候補である可能性がより高くなることもある。
上記の例は、非常に単純な音価の並びによってさえ含まれる複雑性を明らかにするものである。多くの音符の並びはより一層複雑であり、音価の異なる多数の音符、複数の小節にわたる複数の音符、付点音符および装飾音符、シンコペーション、ならびに拍子の解釈における他の難点を伴う。このため、従来の計算アルゴリズムでは、正確に拍子を判断するのが困難なこともある。よって、拍子検出ユニット554の様々な実施形態は、そうした複雑なパターンを検出するよう訓練された人工ニューラルネットワーク(ANN)560を使用する。ANN560は、異なる拍子の多数のサンプルと、サンプル毎に精緻化されるコスト関数とを、ANN560に提供することによって訓練されてもよい。いくつかの実施形態では、ANN560は、学習パラダイムを使用して訓練される。この学習パラダイムは、例えば、教師あり学習、教師なし学習、または強化学習アルゴリズムを含んでもよい。
当然のことながら、テンポと拍子情報とのいずれかまたは両方を使用することによって、楽曲構成要素または分解済み出力570として使用される多数の有用な種類の情報が生成されてもよい。例えば、その情報は、符尾で音符を個々に指定するのではなく複数の音符を棒でまとめるべきところ(例えば、8分音符の組として)の判断、音符を2小節にわたって分割するべきときと、タイで連結するべきときとの判断、または複数音符の組を3連符(またはさらに高次の組)、装飾音符、トリルもしくはモルデント、グリッサンドとして指定するべきときの判断などを可能にしてもよい。
楽曲構成要素または分解済み出力570を生成するのに有用となり得る情報のもう1つの組は、楽曲入力信号102の或るセクションの調に関係する。調情報は、例えば、特定された根音のピッチおよび関連するモダリティを含んでもよい。例えば、「イ短調」は、調の根音のピッチが「A音」であり、モダリティが短調であることを表す。それぞれの調は、調号によって特徴づけられる。調号は、「調内の」音符(例えば調に関連する全音階の一部)および「調外の」音符(例えば調の枠組みにおける変化音)を特定する。例えば、「イ短調」は、シャープもフラットも含まないが、「ニ長調」は、2つのシャープを含み、フラットは含まない。
いくつかの実施形態では、楽譜処理ユニット550は、楽曲入力信号102の調を検出するよう構成されている調検出ユニット556を含む。調検出ユニット556のいくつかの実施形態は、ピッチの並びとコスト関数の組との比較に基づいて調を判断する。例えば、コスト関数は、規定の時間ウィンドウにわたる楽曲の一部分において、変化音の数を最小限にしようとしてもよい。他の実施形態では、調検出ユニット556は、複雑な調判断を行うため、または精緻化するために、人工ニューラルネットワークを使用してもよい。さらに他の実施形態では、調判断を精緻化するために、一連の調変更がコスト関数に対して評価されてもよい。さらに他の実施形態では、調検出ユニット556によって得られた調情報が、特定の調のピッチ指示により音符(または音符開始イベント)に属性を与えるために使用されてもよい。例えば、ヘ長調の「B音」は、「Bナチュラル」と表されてもよい。当然、調情報は、調号または楽曲楽譜表現についての他の情報を生成するために使用されてもよい。いくつかの実施形態では、調情報はさらに、コードまたはその他の倍音情報を生成するために使用されてもよい。例えば、ギターのコードがタブラチュア形式で生成されてもよく、またはジャズコードが提供されてもよい。
他の実施形態では、楽譜処理ユニット550は、楽曲入力信号102でプレイされている楽器を特定するよう構成された、楽器同定ユニット558も含む。楽器は、特定の音色を有するといわれることが多い。しかし、プレイされている音符または音符のプレイの仕方次第で、単一の楽器に関しても音色の違いがあると考えられる。例として、例えばバイオリンを構成するのに使用されている素材、演奏者の弾き方、プレイされている音符(例えば、開放弦でプレイされる音符は、指で押さえた弦でプレイされる同じ音符とは音色が異なり、バイオリンの音域において低い音符は、高音域の音符とは音色が異なる)、音符が弓で弾かれるかはじかれるかなどに基づき、あらゆるバイオリンの音色が異なる。しかしそれでも、バイオリンの音符間には、ほかの楽器とは別ものとしてそれをバイオリンであると特定するのに十分な類似点があると考えられる。
楽器同定ユニット558の実施形態は、単一または複数の音符の特性を比較して、楽曲入力信号102の、或る楽器でプレイされているように考えられるピッチの範囲、そうしたピッチそれぞれにおいてその楽器からつくり出される音色、および/またはその楽器でプレイされている音符の振幅包絡線を判断するよう構成されている。一実施形態では、音色の違いを使用し、複数の楽器サンプルの典型的な音色の特徴と、楽曲入力信号102から検出された音色とを比較することによって種々の楽器を検出する。例えば、同じ音符を同じ音量で同じ持続時間プレイしても、サックスとピアノとは、それらの異なる音色が理由で、全く異なって聞こえると考えられる。当然、上記のように、音色のみに基づく同定は、正確さが限られる可能性がある。
別の実施形態では、種々の楽器を検出するためにピッチ範囲が使用される。例えば、チェロは、典型的には、中央Cより約2オクターブ下から、中央Cの約1オクターブ上の範囲の音符が出ると考えられる。一方、バイオリンは、中央Cのすぐ下から、中央Cの約4オクターブ上の範囲の音符が出ると考えられる。したがって、バイオリンとチェロとは似た音色を持つとはいえ(どちらも擦弦楽器である)、それらのピッチ範囲は、同定に使用するには十分異なる。当然、ある程度は範囲が重複することから、誤りは起こり得ると考えられる。さらに、他の楽器(例えば、ピアノ)はより広い範囲を有し、その範囲は多数の楽器と重複し得る。
さらに別の実施形態では、包絡線検出が、種々の楽器を特定するために使用される。例えば、打楽器(例えば、ピアノ)でプレイされる音符は、木管(例えば、フルート)、リード(例えば、オーボエ)、金管(例えば、トランペット)、または弦(例えば、バイオリン)楽器でプレイされる同じ音符とは異なって聞こえると考えられる。しかし、各楽器は、どのように音符がプレイされるかによって、多数の異なる種類の包絡線を作り出せることもある。例えば、バイオリンは、はじかれること、もしくは弓で弾かれることもあり、または、音符がレガートでプレイされることも、スタッカートでプレイされることもある。
少なくとも上記の問題が理由で、正確な楽器同定には、場合によっては複数の音符にわたる楽曲入力信号102の複数の特性を含む、複雑なパターンの検出が必要なこともある。よって、楽器同定ユニット558のいくつかの実施形態は、こういった複雑なパターンの組み合わせを検出するよう訓練された人工ニューラルネットワーク560を利用する。
楽譜処理ユニット550のいくつかの実施形態は、楽曲入力信号102の中からオーディオトラックを特定するよう構成されているトラック検出ユニット562を含む。場合によっては、楽曲入力信号102は、既にトラックを単位として分かれた形式となっていることもある。例えば、いくつかのデジタルオーディオテープ(DAT:Digital Audio Tape)上のオーディオは、8つの別々のデジタルオーディオトラックとして格納されることもある。こうした場合には、トラック検出ユニット562は、単に個々のオーディオトラックを同定するように構成されていればよい。
一方、他の場合には、複数のトラックが、単一の楽曲入力信号102に格納されており、その楽曲入力信号から特定のデータを抽出することによって特定する必要があることもある。よって、トラック検出ユニット562のいくつかの実施形態は、楽曲入力ファイル102から抽出された情報を使用して、別々のオーディオトラックを同定するよう構成されている。例えば、パフォーマンスが、同時に鳴っている5つの楽器を含むもある(例えばジャズ五重奏)。その別々の楽器を、別々のトラックとして同定することが望ましいこともある。
トラック検出は、いくつかの異なる方法で実現することができる。一実施形態では、トラック検出ユニット562は、ピッチ検出を使用して、種々の音符の並びが特定のピッチ範囲に限定されているようであるかどうかを判断する。別の実施形態では、トラック検出ユニット562は、楽器同定ユニット558からの楽器同定情報を使用して、異なるトラックを判断する。
多くの楽譜は、作品またはパフォーマンスの全体的な強弱に関する情報も含む。全体的な強弱は、上述の音符強弱とは対照的に、2つ以上の音符にわたる強弱を指す。例えば、作品全体または作品の中のセクションに、フォルテ(強音で)またはピアノ(弱音で)として記号を付けられていることもある。別の例では、音符の並びが、クレッシェンドで徐々に大きくなることもある。この種類の情報を生成するために、楽譜処理ユニット550のいくつかの実施形態は、全体的強弱検出ユニット564を含む。全体的強弱検出ユニット564の実施形態は、場合によっては音符強弱情報および/または包絡線情報を含む振幅情報を使用して、全体的な強弱を検出する。
特定の実施形態では、強弱の判断を助けるために、閾値があらかじめ定められるか、または楽曲入力信号102から適応的に生成される。例えば、ロックのパフォーマンスの平均音量はフォルテと見なされてもよい。その平均をいくらかの量上回る(例えば、閾値、標準偏差などに基づいて)振幅は、フォルティシモと見なされてもよく、その一方で、その平均未満にいくらかの量下がる振幅は、ピアノと見なされてもよい。
特定の実施形態はさらに、強弱の変化が生じる期間を考慮してもよい。例えば、2分間の静かな音符で開始し、突然2分間の、より大きい音符のセクションに切り替わる作品は、ピアノのセクションに続いてフォルテのセクションを有すると見なされてもよい。一方、数個の音符にわたって大きくなっていき、さらに数個の音符の間、その大きい音量のままであり、続いて元の振幅に戻る静かな作品は、クレッシェンドに続いてデクレッシェンドがあると見なされてもよい。
上述の様々な種類の情報すべて、およびその他任意の有用な情報が、楽曲構成要素または分解済み出力570として使用されるよう生成されてもよい。システムの様々なコンポーネントに関連して記載された楽曲構成要素または分解済み出力570に加えて、任意の数の他の楽曲構成要素または分解済み出力570が、同じ情報または他の情報から生成されてもよい。一例において、音符がスタッカートの点の付いた8分音符であると判断されると仮定する。他の楽曲570構成要素は、音符の符頭、符幹、符尾、付点、スタッカートの点、およびその他の音符の特性を含んでもよい。さらに他の楽曲構成要素570は、ディスプレイまたはプリントアウト上での音符表現のスタイルまたは色、符幹の方向(例えば、方向は、デフォルトにされても、または譜表上の音符の位置に基づいて決定されてもよく、または音符が特定の音符の並びの一部であることを示すよう変更されてもよい)、音符の符頭のサイズ(例えば、他の音符と区別するために、または他の何らかの理由で、読みやすいようにサイズ調整されてもよい)、符頭の形(例えば、衝撃音に関しては違う形であってもよい)、またはその他任意の有用な情報を含んでもよい。他の例では、楽曲構成要素または分解済み出力570は、五線、音部記号、小節番号、歌詞、歌詞の位置合わせ、ページタイトル、譜表のタイトル、余白、楽器編成データ、再生データなどを含んでもよい。さらに他の例では、楽曲構成要素または分解済み出力570は、楽曲ベースの検索の有効性を向上させることに役立つ別の情報を含んでもよい。楽曲構成要素または分解済み出力570は、保存または出力されてもよい。
当然のことながら、上述の様々なユニットおよびコンポーネントが、本発明から逸脱せずに様々な方法で実装されてもよい。例えば、特定のユニットが、他のユニットのコンポーネントであってもよく、または別のユニットの追加機能として実装されてもよい。さらに、本発明によれば、ユニットは多数の方法で接続可能であり、データはそれらの間を多数の方法で流れることができる。さらに、オーディオ分解に関する様々な実施形態が、2008年2月1日に出願された、Robert D. Taubらの、「MUSIC TRANSCRIPTION」という題の米国特許出願第12/024981号明細書にさらに深く記載されており、これは、あらゆる目的において、参照によって本願明細書に引用したものとする。
(楽譜分解)
場合によっては、オーディオ信号から楽曲構成要素を分解するのに加えて、またはその代わりに、楽譜画像から楽曲構成要素を分解することが望ましいこともある。本発明の各実施形態は、楽譜画像を入力として受け取るよう構成される。当然のことながら、楽譜画像から楽曲構成要素を分解するため、すなわち楽譜分解を実行するための、多数の方法が考えられる。
図6Aは、本発明に従って楽曲画像データを処理し、光学式文字認識(OCR)機能を提供するシステムを示す。OCR処理装置602は、カメラまたはスキャナなどの楽譜キャプチャ装置606を用いて取り込まれる楽曲楽譜604の画像データを受信する。OCR処理装置602は、楽曲楽譜入力に対応するデータを含む楽曲楽譜出力を作り出すが、この出力は様々な用途に用いることができるデジタル形式である。楽曲楽譜のデジタル表現は、次に限定されるものではないが、プリント出力、検索メカニズムによる使用のため、配布および複数ユーザとの共同制作のため、ならびにMIDIコンポーネントなどを用いたオーディオ出力の生成のためを含め、他のシステムによって容易に処理することができる。例えば、図6Aは、楽曲楽譜出力が、印刷機能608、検索機能610、配布機能612、およびオーディオ/MIDI出力614に提供可能であることを示す。
この取り込まれた楽曲楽譜画像は、ウェブカメラ、電話のカメラ、簡単処理のカメラ、ならびにその他より高性能なカメラを含む、任意の画像キャプチャ装置を用いて作り出すことが可能である。楽曲楽譜の画像は、取り込まれると、調節およびさらなる処理のためにOCR処理装置に渡される。
図6Bは、OCR処理装置602への入力として提供される、キャプチャ装置606(図6A)からつくり出された画像データ652を示す。図6Bは、OCR処理装置602が、画像データを受信する画像前処理コンポーネント654を含むことを示す。画像データは、例えば、ビットマップ画像(.bmp)、JPEGデータ、TIFFデータの形式、およびデジタルカメラによって一般に使用される他のファイル形式などとしてもよい。画像前処理コンポーネントは、2値化、画像のスキュー補正、および不適切なバックグラウンド成分の除去を実行する。2値化の動作は、取り込み画像内の明るさおよびコントラストの調節に関係する。スキュー補正の動作は、楽譜の五線が画像の下側の縁に平行にそろう方向から回転している画像を補正することに関係する。不適切なバックグラウンド成分の除去は、ノイズアーチファクトおよびその他不要なバックグラウンド成分を除去することによって、画像をクリーンにする。必要に応じて、前処理動作は、外部の画像処理ルーチンまたはモジュールによって実行することができる。
前処理コンポーネント654は、結果として生じるデータを、ニューラルネットワーク(NN)処理コンポーネント656に提供する。NN処理コンポーネント656は、取り込み画像内の音楽記号体系を特定し、光学画像の認知処理を実行する。すなわち、ニューラルネットワークは、取り込み楽曲画像内の楽曲記号を認識するコンピュータプロセスを実行し、必要に応じて、特定されたシンボルの認知的解釈を入力データから行って推定を行い、取り込み画像内のアーチファクトまたは記号体系に対する適切なラベルを判断する。
NN処理コンポーネント656は、調節された楽曲楽譜画像を受信する訓練されたニューラルネットワークを含む。必要に応じて、訓練されたニューラルネットワークは、その出力をフィードバックの提供に利用して、その動作を調節することができる。そのようなフィードバックは、バックプロパゲーション技術を利用するために、または既に訓練されているニューラルネットワークのネットワークノードの重みを調節するために、因子グラフ演算を伴うこともある。出力をフィードバックとして使用するための他の技術は、当業者には既知である。
NN処理コンポーネント656の出力は、後処理コンポーネント658に提供され、後処理コンポーネント658は、NNの出力を作り出す。次に、後処理コンポーネントの出力は、図6Aに示されている印刷、検索、配布、およびオーディオ機能など、様々な機能に提供することができる。後処理コンポーネントは、NN出力に対して解釈機能を実行して、NNによって特定されたどのアーチファクトの種類が正確である可能性があるか否かを判断する。後処理コンポーネント658による解釈は、NNによりつくり出される信頼値に基づく。当業者であれば、NN信頼値出力データの解釈技術を熟知しているであろう。次に、後処理は、音符情報または特定された楽譜のアーチファクトに対応する他の情報などのOCR処理装置出力を適切な形式で作り出す。例えば、楽曲情報は、MIDI形式などの電子楽器表現の形式、またはその他のデータ形式、またはその他の情報の組み合わせという形式をとってもよい。
当然のことながら、上述の様々なユニットおよびコンポーネントが、本発明から逸脱せずに様々な方法で実装されてもよい。例えば、特定のユニットは、他のユニットのコンポーネントであってもよく、または、別のユニットの追加機能として実装されてもよい。さらに、本発明によれば、ユニットは多数の方法で接続されてよく、データはそれらの間を多数の方法で流れてもよい。さらに、楽譜分解に関する様々な実施形態が、2008年2月13日に出願されたRobert D. Taubらの、「MUSIC SCORE DECONSTRUCTION」という題の米国特許仮出願第61/028,490号明細書にさらに深く記載されており、これは、あらゆる目的において、参照によって本願明細書に引用したものとする。楽曲楽譜キャプチャ技術の他の側面は、2005年12月15日に出願されたRobert D.Taubらの、「SYSTEM AND METHOD FOR MUSIC SCORE CAPTURE AND SYNCHRONIZED AUDIO PERFORMANCE WITH SYNCHRONIZED PRESENTATION」という題の米国特許出願第11/303,812号明細書から入手でき、これは、あらゆる目的において、参照によって本願明細書に引用したものとする。
(検索エンジン)
本発明の多数の側面は、検索エンジンの機能および/または構造に関連する。いくつかの実施形態では、検索エンジンは、図1の検索エンジン160として実装されてもよい。共同制作ポータルの様々な実施形態は、検索入力および出力の操作、検索実行、および結果の処理、ならびにファイル管理、楽曲ビューイング、楽曲およびテキスト編集、および楽曲ベースの検索の、他の側面に関する機能を提供してもよい。当然のことながら、グラフィカルユーザインターフェース(「GUI」)の設計および実装、共同制作ポータルが可能にするユーザインタラクションのレベル、GUIコントロールの種類、モジュールとコンポーネントとの間の機能上の重複部分および依存関係、ネットワーク設計およびインターフェース、ならびに検索エンジンの他の側面に関して、多数の可能性がある。よって、以下の説明は、本発明のいくつかの例示的実施形態のみの記載を目的としており、当業者には当然のことながら、本発明の範囲は、開示される具体的な実施形態によって制限されることはない。
図7は、本発明による楽曲ベースの検索エンジンの実施形態で使用されるグラフィカルユーザインターフェース(GUI)の例示的な一構成を示す。GUI700は、検索入力セクション702および検索結果セクション750という、少なくとも2つの主要セクション(図7ではフレームとして示されている)を含む。検索入力セクション702は、特に、様々な種類の検索入力の受信および処理、ならびにそれらを使用しての検索パラメータの生成を取り扱う。検索結果セクション750は、特に、検索結果の受信、検索結果の表示、および検索出力の生成を取り扱う。
検索入力セクション702は、入力の受信、入力の表示、および入力セクションの制御に関係するいくつかのGUI構成要素を含む。本発明によれば、キーワード入力704、オーディオ入力706、および楽譜入力708を含む、いくつかの種類の入力受信が可能である(図7に示されているように)。キーワード入力、オーディオ入力、および楽譜入力は、同じクエリの一部として受信されてもよく、または、反復する形で連続的に、もしくは任意の順序で受信されてもよい。キーワード入力704は、任意の種類の英数字、文字またはテキスト関連の入力の受信を含む。一実施形態では、キーワード入力704は、通常語テキストを含み、これは、キーワードの組を生成するために解釈される。別の実施形態では、キーワード入力704は、キーワードに変換されるよう機能可能な特殊テキストを含む。例えば、特殊テキストは、フィールドエントリ、ブール演算子などを含んでもよい。次に、テキストは、任意の有用な方法で処理されてもよい(例えば、XMLのようなマークアップ言語における文書型定義を使用して)。
さらに別の実施形態では、キーワード入力704は、オーディオ信号処理を使用して受信される。例えば、ユーザは、記録ボタン710をクリックするとよく、これによって音声記録が開始する。次に、音声記録は、スピーチトゥテキストプロセッサによって処理されてもよい。続いて、処理されたテキストは、上記で説明された方法を含む任意の有用な方法で、クエリ入力用のキーワードへとさらに処理されてもよい。
一実施形態では、受信されたキーワード入力704は、「TEMPO(‘90−100’)& GENRE(‘jazz or blues’)& STARTKEY(‘D−minor’)& AUDIO_INPUT(DECONSTRUCT(‘rhythm’))」である。当然のことながら、この受信されたキーワード入力704は、実例を示すことのみを目的としており、入力は、他の多数の内容および種類のキーワード入力を含むことができるであろう。この例示的なキーワード入力704は、検索者が、90から100bpmのテンポで、ジャズまたはブルースのジャンルで、ニ短調という開始調で、受信されるオーディオ入力から分解されるリズムに似たリズムである曲を見つけたいということを表すと考えられる。なお、「&」はブールの「and」演算を示す。なお、さらに、キーワード入力の受信および処理のための多数の方法が当技術分野で既知であり、その多くは、ユーザが、特殊な記号論を学ばずにキーワードを入力できるようにする。
オーディオ入力706は、異なるいくつかの方法で受信および処理可能である。考えられる様々な受信および処理の機能を盛り込むために、GUIコントロールの組が提供されてもよい。例えば、図のように、オーディオ入力信号を受信(例えば、マイクロホンまたは他のオーディオ入力ソースから)するため、オーディオ入力ファイルをロードするため、または受信したオーディオ信号またはファイルを楽曲構成要素へ分解するためのボタンが提供されてもよい。オーディオ入力は、2種類以上の入力を含んでもよい。例えば、旋律の部分は、ハミングされた、または歌われた曲を含んでもよいと考えられ、話し言葉の部分は話し言葉を含んでもよい。各部分を自動検出するよう、オーディオ入力には、各種類の間に部分セパレータが提供されるとよく、これは、例えば所定の言葉を含んでもよい。
楽譜入力708も同じく、異なるいくつかの方法で受信および処理可能である。考えられる様々な受信および処理の機能を盛り込むために、GUIコントロールの組が提供されてもよい。例えば、図のように、楽譜画像を受信するため(例えば、カメラ、スキャナ、またはその他のデジタル撮像デバイスから)、楽譜画像ファイルをロードするため、または受信した楽譜画像を楽曲構成要素へ分解するためのボタンが提供されてもよい。
いくつかの実施形態では、入力表示フレーム720が、受信および/または処理された入力に関する情報の表示用に提供される。入力表示フレーム720の特定の実施形態は、オーディオおよび/または楽譜の分解結果情報722、生および/または分解済みの楽曲構成要素表現ディスプレイ724、ならびに再生/視覚化/記録コントロール726を含む。
一実施形態では、オーディオ入力706が、検索者によってマイクロホンに向けて手で叩かれた、またはハミングされたリズムを記録することによって受信される。次に、オーディオ入力706は、リズムに関係する楽曲構成要素(例えば、音符開始(note onset)および持続時間、休符、テンポなど)を抽出するために分解される。オーディオおよび/または楽譜の分解結果情報722領域に情報が提供され、オーディオ入力信号からのリズムの分解が成功したことを示す。生および/または分解済みの楽曲構成要素表現表示724領域において、分解された楽曲構成要素の説明図が、検索者に表示される。オーディオおよび/または楽譜の分解によってつくり出される楽曲構成要素の種類は、上に記載した。検索者は、オーディオおよび/または楽譜の分解結果情報722領域ならびに生および/または分解済みの楽曲構成要素表現表示724領域内の情報を使用して、検索エンジン700が、ユーザの要望通りに記録および分解を行ったたかどうかを判断してもよい。
再生/視覚化/記録コントロール726は、再生、視覚化、記録、または、入力表示フレーム720に影響を与え得る他の側面を操作するための任意の有用なコントロールを含んでもよい。例えば、再生/視覚化/記録コントロール726は、再生/記録ボタン(例えば、記録、プレイ、一時停止、停止、早送り、挿入、重ね記録、トリミングなど)、再生/記録ボタンプログレスインジケータ(例えば、メモリインジケータ、経過時間インジケータ、位置インジケータなど)、視覚化コントロール(例えば、拡大表示およびパンニングコントロール、モード切り替えコントロール(例えば、楽譜表現モード、オーディオ信号/包絡線表現モード、ピアノロール表現モードなど)など)、および/またはその他任意の有用なコントロールを含んでもよい。
検索入力セクション702の実施形態は、入力セクションコントロールを含む。当然のことながら、多数の種類のコントロール(例えばスライダー、ノブ、スイッチ、ボタンなど)が、検索入力セクション702の多数の機能を制御するために提供されてもよい。いくつかの実施形態では、入力セクションコントロールは、設定ボタン730−1、リセットボタン730−2、修正ボタン730−3、および検索ボタン730−4などの入力コントロールボタン730の組を含む。
設定ボタン730−1は、検索入力セクション702の任意の数の設定を制御してもよい。いくつかの実施形態では、設定ボタンをクリックすると、設定メニューが現れて任意の数の設定へのアクセスを提供する。いくつかの設定は、ファイル管理(例えば、特定のファイルの種類を受け入れるよう、または特定のポートまたはコンポーネントからオーディオまたはビデオを受信するよう、検索エンジン700を設定すること)、言語(例えば、特定のセマンティック形式(semantic format)のテキストを受け入れるよう検索エンジン700を設定すること)などを含め、検索入力の受信に関係してもよい。その他の設定は、重み付けを設定すること(例えば、異なる検索入力を異なる形で重み付けするよう検索エンジン700を設定することなど)、オーディオおよび楽譜分解を設定すること(例えば、最小クオンタイズ値を設定すること(例えば、音符の持続時間、ピッチの変動など)、特定の種類または組の楽曲構成要素のみを検出するよう検索エンジン700を設定することなど)などを含め、受信した入力の処理に関係してもよい。
例えば、図7に示されている実例となる実施形態では、この設定は、検索エンジン700をいくつかの形で設定してもよい。検索エンジン700は、ワークステーションにおいてサウンドカードを介してオーディオ入力を受け取るよう設定されても、リズム楽曲構成要素のみを探すよう設定されても、特定の閾値音量(またはアタックレベル)を超えるオーディオのみを探すよう設定されても、さらにすべての音符および休符の音価すべてを最も近い8分音符にクオンタイズするよう設定されてもよい。検索エンジン700はさらに、分解されたリズムをテキスト入力よりも大きく重み付けするよう設定されても(例えば、分解されたリズムがより重要な検索語として扱われるように)、さらにテンポキーワード入力を2番目に重要な検索語として重み付けするよう設定されてもよい。
リセットボタン730−2は、検索パラメータをリセットするよう構成されてもよい(例えば、デフォルト設定に戻るように、キーワードフィールドをクリアするように、重み付けをクリアするようになど)。修正ボタン730−3は、結果が返された後に検索を修正するよう設定されてもよい。例えば、より限定された結果を求めて結果の中を検索すること、他の検索入力に基づいて結果をフィルタにかけること、検索入力の全部または一部を変更すること、重み付けを修正することなどが望まれることもある。このように、検索結果のフィールドを次第に具体的に、または狭くしながら、ユーザは検索基準を連続または反復して入力することができる。検索ボタン730−4は、検索入力に基づいて検索パラメータを生成し、その検索パラメータを使用して、1つ以上のデータベースに対する検索を実行するよう設定されてもよい。
検索入力が受信され、キーワード、重みなどへと処理されると、それらは、検索パラメータの組を生成するために使用されてもよい。例えば、フラットファイルデータベースを検索するためのSQLクエリに変換されてもよい。検索パラメータの組は、場合によっては検索されるデータベースの種類および/またはデータベースに格納されているデータの種類に応じて、有用な任意の方法で形式を合わせ、または生成されてもよい。
いくつかの実施形態では、データベースは、生のオーディオおよび/または楽譜ファイル(または生のオーディオファイルへのポインタ)を格納し、そのファイルは「オンザフライ」で分解されてもよい(例えば、検索のとき、またはその前後に)。他の実施形態では、データベースはオーディオファイルに関するメタデータ(例えば、オーディオファイルから分解されたもの、オーディオファイル内のメタデータから抽出されたもの、手動で入力されたもの、他の何らかのシステムにより生成されたものなど)を格納する。さらに他の実施形態では、データベースは、楽曲ベースの検索のために複数の方法で使用され得る複数の種類のファイルを格納する。
様々な実施形態において、データは、その、データベース上での格納されている状態において、事前フィルタ処理にかけられているか、または他の方法で前処理されている。一実施形態では、ある所定種類の楽曲構成要素が、可能性の高い検索候補であると判断されて事前分解されてもよい。例えば、検索者が、特定のテンポの曲を検索する傾向にあると仮定する。テンポは、一種の事前分類または事前フィルタリングプロセスとして、ファイルから事前分解されてもよい。特定の実施形態では、事前分解は、最終的な分解とは異なるレベル(例えば分解能)で実行されてもよい。例えば、特定のメロディラインを有する曲を検索するには、まず、曲のピッチ輪郭の粗い分解を行い、考えられる一致候補リストの範囲を狭めることが可能なこともある。その結果、さらに徹底的な分解は、その限られた候補リストのみに対して、より正確に一致を判断するために実行されてもよい。他の実施形態では、ファイルに関するメタデータまたは他の情報(例えば、ジャンル、作者、楽器のリストなど)が、データを事前フィルタ処理にかけるため、または事前分類するために使用されてもよい。例えば、特定のジャンルの曲すべてが事前分類されてもよい。すなわち、曲は「速い」または「遅い」と事前分類されてもよい。こうした方法、またはこの他の方法では、システムリソースの保護、検索時間の短縮、結果の改善のため、および他の理由で、多層の前処理が使用されてもよい。
検索結果は、読み出されると、本発明によるいくつかの異なる形で扱うことができる。いくつかの実施形態では、検索結果が順位付けされる。当然のことながら、多様な結果の順位付けがあり、そのための処理も多数あり得る。いくつかの順位付けは、特定の候補が、検索入力にどの程度厳密に一致するかに関係する。他の順位付けはさらに、検索者によって提供される様々な重み付けおよびその他のプリファレンスを考慮に入れる。さらに他の順位付けは、1つ以上の信頼値(例えば、様々なコスト関数によって生じるエラー値)を考慮に入れる。信頼値の1つの種類は、楽曲構成要素の分解に関係して、分解が正しい結果をもたらした可能性を表してもよい(例えば、外れ値またはわずかな表現の変動を含む様々な理由によって、テンポは96%の信頼度で90bpmと判断されることもある)。当然、分解は、検索入力の分解および/または読み出されたデータ(例えば、データベースに格納されているデータ)の分解に関係すればよい。別の種類の信頼値は、検索の信頼度に関係してもよい。例えば、検索入力として使用されるメロディラインは、データベースから読み出されたメロディラインに、99%の信頼度で一致することもある(例えば、読み出されたメロディの少数の音符が、入力されたメロディと正確に一致しない)。
次に、結果(例えば順位付けされた結果)が、GUI700の検索結果セクション750に表示されてもよい。検索結果セクション750は、結果表示および結果セクションの制御に関するいくつかのGUI構成要素を含む。多数の種類の結果表示が考えられるが、図7は、結果リスト表示領域760および結果詳細表示領域770を示す。
結果リスト表示領域760は、1つ以上のデータベースから読み出された結果のリストを表示するよう構成されている。いくつかの実施形態では、結果リスト表示領域は、ウィンドウコントロールを含む。例えば、結果リスト表示領域は、検索者がより簡単に結果をスクロールできるようにするスクロールバー762を、下部および側方に含んでもよい。
図に示すように、結果リスト表示領域は、「‘TEMPO(90−100)& GENRE(jazz or blues)& STARTKEY(D−minor)& AUDIO_INPUT(DECONSTRUCT(rhythm))’の検索結果(238中)1〜20を表示」のように、検索結果全体に関する情報を含んでもよい。この種類の情報は、現在のリストが、検索入力セクション702に提供された実例となる検索入力に応答して、データベースから読み出された合計238の結果の中から最初の20の結果を表示していることを検索者に示してもよい。結果リスト領域はさらに、順位付けリストの表示を含んでもよい(例えば、チャートとして)。そのチャートは、例えば、曲のタイトル、アーティスト、信頼値などを含む、結果についての上位情報(high−level information)を含んでもよい。
示されている例では、読み出された第2の結果764は、Ed Washingtonによる「Walking in Darkness」という題の曲である。なお、示されている結果は、つくりもののデータで構成されており、決して実在する楽曲作品を指すことも、アーティストを指すことも目的としてはいない。信頼値は、「97%(99%/99%/97%/92%)」と表示されている。これは、重み付けされた97%という総信頼値に対して、オーディオ検索入力から分解されたテンポに関しては99%の信頼度、ジャンルに関しては99%の信頼度、開始調に関しては97%の信頼度、およびリズムに関しては92%の信頼度が検索により返されたということを表すと考えられる。場合によっては、様々な理由から、検索者に、検索に含まれている一部または全部の信頼値を提示することが望ましいと考えられる。例えば、検索者は、1つの結果が全体では比較的高い信頼値を有するかもしれないが、1つのパラメータが検索入力から大幅に逸脱したということを知りたいこともある。これによって、検索者は、さらに調整された結果が読み出されるよう、後からの検索をより効果的に修正することができると考えられる。
結果詳細表示領域770は、特定の結果の詳細に関係する、任意の数の異なる種類のデータを決定するよう構成されてもよい。一実施形態では、選択された結果に関連するオーディオの様々な表現が表示される。例えば、楽譜表現、オーディオ信号表現、ピアノロール表現、またはその他任意の有用な表現が表示されてもよい。別の実施形態では、結果リスト表示領域760に提供されるものと同じテキスト情報または他のテキスト情報が提供されてもよい(例えば、より大きなフォントを使用する、さらなる詳細を提供する、その曲のアルバムカバーからのカバーアートの画像を提供する、その曲を購入するための、またはそのバンドのウェブサイトを訪問するためのハイパーリンクを提供するなど)。いくつかの実施形態では、結果詳細表示領域770は、再生/視覚化/記録コントロール774(例えば、入力表示フレーム720の実施形態で提供される再生/視覚化/記録コントロール726に類似している)を含む。
検索結果セクション750の実施形態は、結果セクションコントロールを含む。当然のことながら、多数の種類のコントロール(例えば、スライダー、ノブ、スイッチ、ボタンなど)が、検索結果セクション750の多数の機能を制御するために提供されてもよい。いくつかの実施形態では、結果セクションコントロールは、設定ボタン780−1、前ボタン780−2、次ボタン780−3、および出力ボタン780−4などの結果コントロールボタン780の組を含む。
設定ボタン780−1は、検索結果セクション702の任意の数の設定を制御してもよい。いくつかの実施形態では、設定ボタンをクリックすると、設定メニューが現れて任意の数の設定へのアクセスを提供する。いくつかの設定は、結果の受け取り方(例えば、結果の最大数、順位付けの種類など)、結果の表示法(例えば、結果リスト表示領域760に何の欄が表示されるか、結果詳細表示領域770にどの表現またはテキストが示されるかなど)に関係してもよい。
前ボタン780−2および次ボタン780−3は、それぞれ、結果リスト内の前の結果または次の結果へジャンプするよう設定されてもよい。当然、他のナビゲーションコントロールも可能であると考えられる(例えば、次のページ、分類、フィルタなど)。出力ボタン780−4は、1つ以上の方法で検索結果データを出力するよう構成されてもよい。いくつかの実施形態では、出力は、図1の出力生成ユニット140によって生成されてもよい。当然のことながら、異なる多数の種類のデータの、多数の種類の出力が考えられる。例えば、結果データは、生のオーディオデータ(例えば、スピーカ、メディア再生デバイス、サウンドカードなどを介してプレイされるよう構成された信号)、符号化オーディオデータ(例えば、ストレージ媒体(例えば、コンパクトディスク)上での格納用、メディア再生ソフトウェアによる再生用、ネットワーク経由での共有用など)、楽譜表現データ(例えば、楽譜画像、楽譜作成および/または編集ソフトウェアに対応した楽曲構成要素など)、テキストデータ(例えば、ファイル、プリントアウトなどとして格納される、結果リストもしくは結果詳細に関係するテキスト)、またはその他任意の有用な情報として出力されてもよい。さらに、出力は、検索入力、検索履歴、検索統計、データベース統計、設定などのログまたは記録を含んでもよい。
いくつかの実施形態では、検索エンジン700は共同環境へ統合される(例えば、インターネット経由で)。その結果、この検索エンジンは、共同環境を生かす多数の方法で使用されればよく、または逆も同様である。例えば、検索入力および/または結果は、ネットワーク上で他者と共有されてもよい。一実施形態では、ユーザは、検索パターンが似ている他のユーザを検索してもよく、またはユーザは、自らの経験に基づいて特定の検索結果を勧めてもよい。例えば、「X」の検索を実行した後に、検索エンジン700は、「‘X’を検索したユーザは‘Y’にも関心があるかもしれない」と通知してもよい。この種類および同様の種類の結果は、他のユーザ、検索傾向およびパターンを判断するインテリジェントアルゴリズム、広告主、またはその他任意のデバイス、個人もしくは団体によって生成されてもよい。
(例示的実装)
上述のシステムおよび方法は、いくつかの形で実装することができる。そのような実装の1つは、様々な電子コンポーネントを含む。例えば、様々なシステムのユニットが、個別または集合的に、ハードウェアに適用可能な機能の一部または全部を実行するようになっている1つ以上の特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)を用いて実装されてもよい。あるいは、各機能は、1つ以上の集積回路上の、他の1つ以上の処理ユニット(またはコア)によって実行されてもよい。他の実施形態では、他の種類の集積回路が使用されてもよく(例えば、構造化/プラットフォームASIC、フィールドプログラマブルゲートアレイ(FPGA:Field Programmable Gate Array)、およびその他のセミカスタムIC)、これは、当技術分野で既知の任意の方法でプログラムされてもよい。各ユニットの機能はさらに、全体的または部分的に、1つ以上の汎用または特定用途向け処理装置によって実行されるよう形式を合わせた、メモリに記録された命令を用いて実装されてもよい。
図8は、本発明の特定の実施形態を実装する計算システム800のブロック図を示す。一実施形態では、計算システム800は、図1に示されているポータル160としての機能を果たしてもよい。なお、図8は、様々なコンポーネントの一般化した説明を提供することのみを意図しており、このコンポーネントのいずれかまたはすべてが、必要に応じて利用されてもよい。したがって、図8は、個々のシステム構成要素が、相対的に別々となった形、または相対的により統合された形で、どのように実装され得るかを、広く示す。
バス826を介して電気的に結合可能な(または、必要に応じて別の方法で通信してもよい)複数のハードウェア構成要素を含む計算システム800が示されている。ハードウェア構成要素は、1つ以上の汎用処理装置および/または1つ以上の専用処理装置(デジタル信号処理チップ、グラフィックス加速チップ、および/または同様のものなど)を含むがこれに限定されるものではない、1つ以上の処理装置802と、マウス、キーボードおよび/または同様のものを含むことができるがこれに限定されるものではない、1つ以上の入力装置804と、ディスプレイ装置、プリンタおよび/または同様のものを含むことができるがこれに限定されるものではない、1つ以上の出力装置806とを含むことができる。
計算システム800はさらに、1つ以上のストレージ装置808を含む(および/またはそれと通信している)とよく、これは、ローカルのおよび/またはネットワークアクセス可能なストレージを含むことができるがこれに限定はされず、および/または、ディスクドライブ、ドライブアレイ、光学式ストレージ装置、ランダムアクセスメモリ(「RAM(random access memory)」)などのソリッドステートストレージ装置、および/または読み取り専用メモリ(「ROM(read−only memory)」)を含むことができるがこれに限定されず、これは、プログラマブル、フラッシュアップデート可能、および/または同様のものとすることができる。計算システム800はさらに、通信サブシステム814を含んでもよく、通信サブシステム1014は、モデム、ネットワークカード(無線または有線)、赤外線通信装置、無線通信装置および/またはチップ組(Bluetooth装置、802.11装置、WiFi装置、WiMax装置、セルラー通信機器など)および/または同様のものを含むことができるが、限定されるものではない。通信サブシステム814は、ネットワーク(一例を挙げると、以下に記載されているネットワークなど)および/または本願明細書に記載される他の任意の装置とのデータ交換を可能にしてもよい。多数の実施形態において、計算システム800はさらに、ワーキングメモリ818を含み、これは、上記のようにRAMまたはROM装置を含むことができる。
計算システム800は、さらに、オペレーティングシステム824および/または1つ以上のアプリケーションプログラム822などの他のコードを含めて、現在ワーキングメモリ818内にあるものとして示されているソフトウェア構成要素を含んでもよく、これは、本発明のコンピュータプログラムを含んでもよく、および/または本願明細書に記載されているように本発明の方法の実装、および/または本発明のシステムの構成を行うよう設計されてもよい。単なる一例として、上記で説明された方法(単数または複数)に関して記載された1つ以上の手順は、コンピュータ(および/またはコンピュータ内の処理装置)によって実行可能なコードおよび/または命令として実装することもできるであろう。一実施形態では、図1のオーディオおよび/または楽譜分解ユニット120、ならびにその他の様々なクライアント側の方法は、計算システム800によって読み取り可能なアプリケーションプログラム822として実装される。
こうした命令および/またはコードの組は、コンピュータ読み取り可能ストレージ媒体810b上に格納されてもよいであろう。いくつかの実施形態では、コンピュータ読み取り可能ストレージ媒体810bは、上述のストレージ装置(単数または複数)808である。他の実施形態では、コンピュータ読み取り可能ストレージ媒体810bは、コンピュータシステム内に組み込まれていてもよいであろう。さらに他の実施形態では、コンピュータ読み取り可能ストレージ媒体810bは、コンピュータシステムから分離していても(すなわち、コンパクトディスクなどの取り外し可能媒体など)、およびまたは、ストレージ媒体に格納されている命令/コードを用いて汎用コンピュータをプログラムするためにストレージ媒体を使用できるよう、インストールパッケージにおいて提供されてもよいであろう。こうした命令は、計算システム800によって実行可能な実行コードという形をとっても、および/または、ソースおよび/またはインストール可能コードという形をとてもよいであろう。ソースおよび/またはインストール可能コードは、計算システム800上でコンパイルおよび/またはインストールされると(例えば、一般に利用可能な様々なコンパイラ、インストールプログラム、圧縮/解凍ユーティリティなどのうちのいずれかを使用して)、その結果実行コードという形をとる。こうした実施形態では、コンピュータ読み取り可能ストレージ媒体810bは、コンピュータ読み取り可能ストレージ媒体読み取り機810aによって読み取られてもよい。
当業者には当然のことながら、特有の要件に従って、多くの変形物がつくられてもよい。例えば、カスタマイズされたハードウェアがさらに使用されること、および/または特定の構成要素がハードウェア、ソフトウェア(アプレイットなどの高移植性ソフトウェアなどを含む)もしくは両方に実装されることが可能であろう。さらに、ネットワーク入力/出力装置などの他のコンピューティング・デイバスへの接続が用いられてもよい。
いくつかの実施形態では、入力装置804のうちの1つ以上は、オーディオインターフェース830−1と結合してもよい。オーディオインターフェース830−1は、マイクロホン、楽器、デジタルオーディオ装置、または他のオーディオ信号もしくはファイルのソースと、例えば物理的、光学的、電磁的などの形で、インターフェースで接続することによって、楽曲寄与102−1を受信するよう構成されてもよい。他の実施形態では、入力装置804のうちの1つ以上は、楽譜インターフェース830−2と結合してもよい。楽譜インターフェース830−2は、カメラ、スキャナ、デジタル撮像装置、またはその他のデジタル画像ソースとインターフェースで接続することによって、楽譜寄与102−2を受信するよう構成されてもよい。
さらに、いくつかの実施形態では、出力装置806のうちの1つ以上は、オーディオ出力装置106−1と結合してもよい。オーディオ出力装置106−1は、本発明の実施形態によって生成されたオーディオ信号データを、例えばスピーカ、オーディオコンポーネント、デジタル−アナログ変換器、コンパクトディスクライターなど、そのデータを処理する能力がある1つ以上のシステムまたは装置に出力するよう構成されてもよい。他の実施形態では、出力装置806のうちの1つ以上は、楽譜出力装置106−2と結合してもよい。楽譜出力装置106−2は、本発明の実施形態によって生成された楽譜表現データを、例えば楽譜書き起こしソフトウェア、楽譜公開システム、ファイルストレージ装置など、そのデータを処理する能力がある1つ以上のシステムまたは装置に出力するよう構成されてもよい。
一実施形態では、本発明は、本発明の方法を実行するためにコンピュータシステム(計算システム800など)を用いる。実施形態の組によれば、処理装置802が、ワーキングメモリ818に含まれている1つ以上の命令の1つ以上のシーケンス(オペレーティングシステム824および/またはアプリケーションプログラム822などのその他のコードに組み込まれることも可能と考えられる)を実行するのに応答して、当該方法の手順の一部または全部が計算システム800によって実行される。当該の命令は、ストレージ装置(単数または複数)808(または810)のうちの1つ以上など、別の機械読み取り可能媒体からワーキングメモリ818に読み込まれてもよい。単なる一例として、ワーキングメモリ818に含まれている命令のシーケンスの実行は、処理装置(単数または複数)802に、本願明細書に記載されている方法の1つ以上の手順を実行させてもよいであろう。
本願明細書で使用される「機械読み取り可能媒体」および「コンピュータ読み取り可能媒体」という用語は、機械を特定の形で動作させるデータの提供に関与する任意の媒体を指す。計算システム800を使用して実装される実施形態では、様々な機械読み取り可能媒体が、命令/コードを実行用に処理装置(単数または複数)802に提供するのに関与すること、および/またはそのような命令/コードを(例えば信号として)格納および/または搬送するために使用されることが可能であろう。多数の実装において、コンピュータ読み取り可能媒体は、物理的および/または有形のストレージ媒体である。そのような媒体は、次に限定されるものではないが、不揮発性媒体、揮発性媒体および伝送媒体を含む多数の形態をとり得る。不揮発性媒体は、例えば、ストレージ装置(単数または複数)(1608または810)などの光ディスクまたは磁気ディスクを含む。揮発性媒体は、ワーキングメモリ818などのダイナミックメモリを含むがこれに限定されるものではない。伝送媒体は、バス826を構成するワイヤーを含めて、同軸ケーブル、銅線、光ファイバ、ならびに、通信サブシステム814の様々なコンポーネント(および/または通信サブシステム814が他の装置との通信を提供するのに用いる媒体)を含む。したがって、伝送媒体はさらに、波(電波通信および赤外線データ通信中に生成されるものなど、電波、音波、および/または光波を含むがこれに限定されるものではない)という形態をとることができる。
物理的および/または有形のコンピュータ読み取り可能媒体の一般的形態には、例えば、floppy disk(登録商標)、フレキシブルディスク、ハードディスク、磁気テープもしくはその他任意の磁気媒体、CD−ROM、その他任意の光学媒体、パンチカード、紙テープ、穴のパターンを有するその他任意の物理的媒体、RAM、PROM、EPROM、FLASH−EPROM、その他任意のメモリチップもしくはメモリカートリッジ、以下に記載される搬送波、またはコンピュータが命令および/またはコードを読み取ることができるその他任意の媒体が含まれる。
様々な形式の機械読み取り可能媒体が、1つ以上の命令の1つ以上のシーケンスを、実行用に処理装置(単数または複数)802へ搬送するのに関与してよい。単なる一例として、この命令は、最初にリモートコンピュータの磁気ディスクおよび/または光ディスク上で搬送されてもよい。リモートコンピュータは、命令をダイナミックメモリにロードして、その命令を信号として、計算システム800によって受信および/または実行される伝送媒体上で送信することもできるであろう。こうした信号は、電磁信号、音響信号、光信号および/または同様のものという形態であってもよいと考えられ、すべて、本発明の様々な実施形態に従って、命令が符号化されることが可能な搬送波の例である。
通信サブシステム814(および/またはそのコンポーネント)は、通常、この信号を受信することになり、続いてバス826がこの信号(および/またはこの信号により搬送されるデータ、命令など)を、ワーキングメモリ818へ搬送してもよいであろう。処理装置(単数または複数)802は、このワーキングメモリ818から命令を読み出して実行する。ワーキングメモリ818によって受信された命令は、任意選択で、処理装置(単数または複数)802による実行の前または後に、ストレージ装置808上に格納されてもよい。
当然のことながら、本発明によれば、システムの多数の実装が可能であり、それは、図8に関して記載されるコンポーネントまたは機能を組み込んでも組み込まなくてもよい。いくつかの実施形態では、システムは専用装置として実装される。この装置は、音圧を検知してそれをシステムが使用する検索入力へ変換するよう構成された、1つ以上の内蔵マイクロホンを含んでもよい。代わりに、この装置は、外付けマイクロホン、媒体装置、データ記憶装置、またはその他のオーディオソースとインターフェースで接続するための1つ以上の楽曲入力ポートを含んでもよい。こうした実施形態のうちのいくつかでは、装置は、ハンドヘルドまたは携帯用装置であってもよい。他の実施形態では、このシステムは、多目的または汎用の装置において実装されてもよい(例えば、コンピュータによって実行されるようコンピュータ読み取り可能媒体上に格納されたソフトウェアモジュールとして)。こうした実施形態のいくつかでは、オーディオソースは、サウンドカード、外付けマイクロホン、または格納済みのオーディオファイルであってもよい。その結果、入力が生成されシステムに提供される。
このシステムの他の実施形態は、聴音装置として動作する簡略化バージョンまたはモノラルバージョンとして実装されてもよく、これは、1つのマイクロホンに向かって楽器をプレイするユーザ、または特定の曲またはメロディまたはその一部を歌うユーザから、オーディオを受信する。単一マイクロホンの構成では、このシステムは続いて、1つのマイクロホンから記録された楽曲を対応する楽曲楽譜に変換する。これは、話し言葉および文章をコンピュータ読み取り可能テキストに変換するテキストトゥスピーチソフトウェアの音楽的な等価物を提供してもよい。サウンド−音符変換として、曲またはメロディが、1つの楽器がプレイしているかのように登録されることになる。
当然のことながら、このシステムの他の実装はさらに、ユーザおよび他のシステムとの相性に関係して、他の種類のインターフェースおよび機能を含んでよい。例えば、入力ポートが、回線レベル入力(例えば、ステレオシステムまたはギターアンプから)、マイクロホン入力、ネットワーク入力(例えばインターネットから)、またはその他のデジタルオーディオコンポーネント用に提供されてもよい。同じく、出力ポートも、スピーカ、オーディオコンポーネント、コンピュータおよびネットワークなどへの出力のために提供されてもよい。さらに、いくつかの実装では、システムは、ユーザ入力(例えば、物理的または仮想のキーパッド、スライダー、ノブ、スイッチなど)および/またはユーザ出力(例えば、ディスプレイ、スピーカなど)を提供してもよい。例えば、インターフェース能力が提供されて、記録、またはシステムによってその記録から抽出されたデータを、ユーザが聴くことができるようにしてもよい。
一実施形態では、本発明の機能は、デジタルコンピュータにインストール可能なアプリケーションを含むソフトウェアにおいて実装される。このソフトウェア実装は、演奏者に入力および出力インターフェースを提供することが好ましい。すなわち、このソフトウェアがインストールされているホストコンピュータは、典型的には、演奏者が、歌うため、または演奏者の楽器をプレイするために読むことができる楽曲楽譜の視覚的表現をもたらすディスプレイを含む。このコンピュータはさらに、典型的には、演奏者のセッションを記録するためのマイクロホンなどの入力インターフェースを含み、記録済みのパフォーマンスを演奏者が聴けるように、スピーカなどの出力インターフェースを含む。このコンピュータ実装は、画像キャプチャを含むことができ、譜表上の音符を含む楽曲楽譜が、光学入力手段によってデジタル化され、続いてこのコンピュータに入力されることが可能である。デジタル化された楽曲楽譜は、OCR技術によって解釈することができ、結果として生じる解釈後のデータは、楽譜の合成オーディオ演奏をもたらすよう処理される。これには、適切な場合は、言葉と適切なピッチとを一致させる合成ボーカル演奏が含まれ、その結果オーディオ演奏は、楽譜の視覚的表現と同期される。以下に提供されるさらなる詳細な説明では、コンピュータソフトウェア実装は、「レベルX」実装と呼ばれるか、または「eMuse X」製品と呼ばれる(「eMuse」という名前は、本発明のあらゆる権利の譲受人、Princeton,New Jersey,USAのMuseAmi,Inc.の製品実施形態を指す)。
別の実施形態では、本発明の機能は、ディスプレイ、入力インターフェース、オーディオおよび視覚出力インターフェース、ならびにOCR画像解釈インターフェースを含むことができるハンドヘルド装置において記録される。このハンドヘルド装置実装は、各種の便利なユーザコントロールノブと、装置機能の便利なナビゲーションのための機構とを含む。ディスプレイは、ユーザによる機能選択のためのメニューオプションの視覚的表現をサポートする。
以下でさらに記載されるように、コンピューティング装置は、外部ソースから楽曲楽譜データを受信し、続いてその楽曲楽譜データの合成オーディオ演奏と、楽曲楽譜の同期された視覚的表現とをもたらすことによって、楽曲楽譜データを解釈および処理する。
外部ソースは、楽曲楽譜データをネットワーク接続経由でコンピューティング装置に提供する、ネットワークデータソースで構成されることが可能である。ネットワーク接続は、コンピューティング装置と、ネットワークとの間の、無線接続による通信で構成されることが可能である。
楽曲楽譜データは、記録済み媒体を取り込んでその記録済み媒体から楽曲楽譜データを取得するコンピューティング装置の読み取り機に、記録済み媒体を取り込むことによって、記録済み媒体から読み取られることが可能である。記録済み媒体は、合成楽曲制作のMIDI規格に従った合成オーディオ演奏向けの、十分なデータを含む。すなわち、コンピューティング装置は、楽曲楽譜を特定するデータを受信することができ、選択されたテンポ、音色、音部記号、調号、拍子記号および同様のもので、対応する楽音を生成または合成することができる。記録済み媒体は、フラッシュメモリ装置を含むことができる。
コンピューティング装置には、楽曲楽譜のユーザパフォーマンスを記録して、その記録されたユーザパフォーマンスの再生を提供する能力を提供することができる。ユーザパフォーマンスの再生は、合成楽曲楽譜演奏とは独立して生じること、または同時に生じることが可能である。さらに、ユーザパフォーマンスの再生は、記録済みのユーザパフォーマンスに対応する音符の視覚表現と共に提供されることが可能である。このようにして、「聴音」機能が提供される。
1つの代案では、合成オーディオ演奏と、楽曲楽譜の同期された視覚的表現との両方を生成するために装置によって使用される楽曲楽譜データは、楽曲楽譜のデジタル画像を光学的に取り込み、続いてそのデジタル情報を解釈および処理して、適切な音符を表すデータの集合をつくり出し、そうして楽曲楽譜に対応するデータを生成する装置によって取得されてもよい。
さらに、楽曲楽譜データの合成オーディオ演奏の特性を決定する楽曲文脈情報が提供されることが可能であり、そのすべてがユーザによって調節されてもよい。当該の楽曲文脈情報は、複数の調号、拍子記号音色、テンポ、および、レガート、クレッシェンド、リタルダンドなどの表現用語を含むことができる。
別の代案では、楽曲楽譜データのオーディオ再生と、音符の視覚的表現とを作り出すことは、ネットワークデータソースと通信することで達成される。必要に応じて、ネットワークデータソースは、楽曲楽譜データをコンピューティング装置に提供する。さらに別の代案では、ネットワークデータソースは、コンピューティング装置に、楽曲楽譜データの合成オーディオ演奏の楽曲特性を決定する楽曲文脈情報を提供することができる。さらに、ネットワークデータソースは、楽曲文脈情報を無線接続によって提供することができる。
1つの代案では、楽曲楽譜データの合成オーディオ演奏と、楽曲楽譜の同期された視覚的表現とを作り出すことは、コンピューティング装置の読み取り機に記録済み媒体を挿入することによって達成される。必要に応じて、コンピューティング装置は、記録済み媒体から楽曲楽譜データを取得する。さらに、記録済み媒体は、楽曲楽譜データの合成オーディオ演奏の楽曲特性を決定する楽曲文脈情報も、コンピューティング装置に提供することができる。
1つのオプション機能は、楽曲楽譜の、ユーザの楽器および/またはボーカルパフォーマンスの記録を提供することである。別の代案は、MIDI規格に従って合成オーディオ演奏を作り出すことである。さらに、視覚的表現を作り出すことは、対応する合成オーディオ演奏と同期された楽曲楽譜を表示することから成ってもよい。別のオプションは、楽曲楽譜データの視覚的表現と、オーディオ演奏との両方、および、記録済みユーザパフォーマンスのオーディオコンポーネントと、ユーザパフォーマンスによって生成された楽曲楽譜の同期された対応する視覚表示との両方の再生という、同期化された同時再生を提供することである。
本発明に従って、コンピューティング装置は、楽曲楽譜を光学的にデジタル方式で取り込み、デジタル画像を解釈して、このデジタル方式で取り込まれた楽曲楽譜に対応する楽曲楽譜データをコンピューティング装置用に生成し、楽曲楽譜データの合成オーディオ演奏と、楽曲楽譜の同期された視覚的表現とを作り出すことができる。コンピューティング装置は、楽曲楽譜データの合成オーディオ演奏の楽曲特性を決定するためにこのコンピューティング装置によって使用される、楽曲文脈情報を受信することができる。上述の代わりの実施形態と同様に、楽曲文脈情報は、複数の調号、拍子記号音色、テンポ、および、レガート、クレッシェンド、リタルダンドなどの表現用語などを含むことができる。これらは、ユーザによって、楽曲楽譜データの合成オーディオ演奏の楽曲特性を決定するために選択されることが可能である。オプションとして、コンピューティング装置は、光学的にデジタル方式で取り込まれた楽曲楽譜から楽曲文脈情報を特定し、さらに任意選択で、ネットワークデータソースから楽曲文脈情報を取得することができる。必要に応じて、ネットワークデータソースは、このコンピューティング装置との無線接続によって楽曲文脈情報を提供する。
コンピューティング装置には、合成演奏および/またはユーザによって記録されたパフォーマンスのオーディオ再生用に、この装置所有のラウドスピーカが提供されることが可能である。さらに、この装置は、ヘッドホンまたは外付けラウドスピーカまたは同様のものに接続するための出力ジャックを含むことができ、さらに、装置がオーディオパフォーマンスを無線サウンド再生システム(無線コンポーネント対応となっているホームステレオシステムなど)に伝送できるようにする無線伝送能力が提供されることも可能である。装置は、所定の長さの楽曲楽節を格納可能にするのに十分なコンピューティングメモリを有する。
以下のさらなる詳細な説明は、ハンドヘルド装置実装における機能の様々な実装を参照するが、それぞれ、「レベル1」および「レベル2」または「eMuse1」および「eMuse2」と呼ばれる。
以下の説明では、一連のデジタルコンピューティング装置にインストール可能な楽曲再生ソフトウェアについて記載し、さらに、ハンドヘルドシートミュージック読み取り装置の実施形態についても記載する。本願明細書において、これらは集合的にeMuse製品と呼ばれる。
図9は、ハンドヘルドの電池式「簡単処理」コンシューマ電子装置900として、製品の実例となる実施形態を示す。この装置は、シートミュージックから、選択された楽曲楽節の画像を、数小節またはページ全体でさえも取り込み、その楽節をデジタル方式で形式設定して符号化し、続いてその選択された楽節をプレイするが、これはすべてリアルタイムで事実上瞬時に行われる。再生サウンドは楽器特有であり、ユーザによって選択された音色(例えば、ピアノ、バイオリン、フルートなどのサウンド)でプレイする。複数の音色を同時にプレイ可能である。装置900は、調号、拍子、音量およびテンポなどの楽曲の変化を認識し、フォルテ、ピアノ、クレス(cress.)、レガートおよび同様のものなど、音楽の平凡な用語を考慮するよう設計されている。LCD画面902は、楽曲楽節904を、それを装置が再生しているときに表示し、プレイされる音符はそれぞれ、残りの楽曲楽譜のからその音符を区別するよう、他と異なる色で強調表示される。
図9の装置900は、デジタル「音楽カード」機能を組み入れており、これは、1つ以上の記録済みまたはダウンロード済みの楽曲作品を用いて符号化されたデータカード(図示せず)の挿入をサポートし、特定の小節を迅速に参照できるようにする。データカードは、典型的にセルラー電話およびデジタルカメラによって使用されるものなどの記録可能媒体を含むことができる。データカードは、装置900のカードスロット906に収容される。装置900はさらに、符号化された楽曲作品を表すデジタルデータを処理する。ダウンロード済みのファイルは、装置のメモリ内に保存することもできる。符号化された楽曲作品は、豊かなリスニング体験を提供し、楽曲楽譜の特定の小節を迅速に参照できるようにする。
装置900の記録/再生機能は、ユーザが、記録されたパフォーマンスを、楽曲楽譜を基準として直ちに評価できるようにする。すなわち、装置900は、楽曲作品のユーザのパフォーマンスを記録して、そのユーザのパフォーマンスを、受信済みの楽曲作品の再生と共に(すなわち同時に)再生することができる。ユーザパフォーマンスの再生は、「聴音」機能を提供する、対応する視覚的表現と共に提供されことが可能である。メトロノームおよび楽曲の音程チューナーの両方の能力も、この装置に組み込まれ、さらに装置は、「ミュージックマイナスワン」機能向けに調節されることが可能である。「ミュージックマイナスワン」機能は、複数譜表または複数パートの楽曲作品で、ユーザが、その作品のどのパート(単数または複数)をMIDIインターフェースによって再生するかを決定できるようにする。これによって、ユーザは、装置に合わせて特定のパートをプレイすること/歌うことができるようになる。
図9は、蓋または上部908の下面に組み込まれたLCD画面902を有する押し上げ式の蓋908を備えた、ハンドヘルド装置としての装置900を示す。装置はさらに、楽曲再生用のスピーカ910(図9にはステレオペアが示されている)と、ユーザパフォーマンスを記録するためのマイクロホン912とを内蔵している。画像キャプチャ能力は、図9に示されているように実装可能である。押し上げ式の蓋908がカメラシステムを含み、カメラシステムは、押し上げ式の蓋908の外側表面に取り付けられた光学レンズを含み、画像キャプチャを目的としてレンズシャッターボタン914によってトリガされる。音量916、再生テンポ918、メニューナビゲーション920、および位置922の調節用サムホイールとして示されている、様々なユーザインターフェースコントロールが提供される。装置900には、ネットワークまたは他の装置とより容易に接続できるよう、USBポート924が提供されることが可能である。オン/オフスイッチ925は、装置900をオン・オフする。
図9に示されているように、楽曲楽譜の演奏(合成パフォーマンス)およびユーザのパフォーマンスの再生を含む機能の制御用に複数のコントロールボタンも提供されている。図9は、プレイ/一時停止926、停止928、次/リセット930、および記録932という機能用の例示的コントロールボタンを示す。図9は、タイミングインジケータを示し再生テンポ918と関連があるメトロノーム表示ディスプレイ934も示す。メトロノーム機能、および装置900のその他の機能の選択は、メニューサムホイール920および/または位置サムホイール922の処理と併せて、LCD画面902のメニューナビゲーションを用いて遂行される。選択は、次/リセットコントロールボタン930の処理によって実現される。キーボードまたはキーパッド935は、キーパッド935の専用ファンクションキーを介した入力、またはキーパッド935からの英数字入力に使用することができる。LCD画面902には、楽曲楽節904からの音符のグラフィック画像が提供され、これは画面中を横断し、各音符がプレイされるときにディスプレイ内に個々の音符が画面上に現れるか、または強調表示される。ディスプレイは、楽曲楽節904がプレイされるときに、楽曲の所定数の音符または小節が表示されるよう、再生中、引き延ばされた楽曲譜表画像を提供することが好ましい。
装置900の一実施形態では、デジタルカメラシステム914が、楽曲楽譜内の楽節の画像(単一の音符、いくつかの小節、またはページ全体さえも)を取り込む。デジタルカメラは、装置900に内蔵可能であり、当業者には周知であろうレンズと像変換器との組み合わせを含んでもよい。LCD画面902は、取り込まれる小節をユーザが正確に決定できるようにする。装置は、単一譜表の楽曲ライン、二重奏、三重奏、四重層、または指揮者の総譜でさえ読み取ることができる。装置900は、同時に数の音色を提供する。
OCRモジュールは、デジタル化画像データを含む、楽曲の抜粋の「写真」を受信してもよい。調号および拍子などの追加の重要な楽曲文脈情報も、楽曲楽譜のデジタル画像を介して、または有効な調号および拍子記号すべてを一覧にした「チートシート」(例えば、ウェブサイトからダウンロードされ、次に無線で、またはUSBポートを介して装置に伝送される――下記参照)を介して、OCRモジュールへ送信される。この「チートシート」はさらに、ユーザがセクションから所望の音色(単数または複数)を選択することができる、またはユーザが所望の音色(単数または複数)を手動で指定(入力)することができるセクションを含んでもよい。
別の実施形態では、装置900は、MIDIシンセサイザーの機能を提供してもよい。OCRモジュールは、合成サウンドを作り出すMIDIモジュールにサウンド情報を送信してもよい。これは、調節可能な音色を提供する。ユーザは、楽曲の特定の楽節または一部分の、楽器の種類(ピアノ、バイオリン、フルートなど)を指定する。このモジュールはさらに、ユーザが、ピッチの変化なしで、楽譜に示されているメトロノーム(あれば)よりもゆっくりと(または速く)その楽節を聴くことができるように、調節可能なテンポを提供する。装置は、それ自体の小型ラウドスピーカを介して再生するが、さらにヘッドホンおよび/または外付けスピーカ用のヘッドホンジャック934および無線能力も有する。
様々な実施形態において、装置900は、特定の視覚表示能力を提供してもよい。例えば、LCD画面902は、取り込まれている(撮影されている)小節が、聴こうとしている小節であることをユーザが確認する助けになってもよい。カーソル936を備えたLCD画面902は、楽節が再生されるとき、ユーザによって撮影された楽節から、または格納済みデータを備える音楽カードから、楽曲楽節904を表示する。カーソルは、リアルタイムで楽曲楽節904がプレイされているときに、指定されているテンポには関係なく、プレイされている現在の音符(単数または複数)の楽譜内での正確な楽曲位置を示す。従来の種類の移動するカーソルではなく、代わりに、カーソル936はプレイされている音符を、その音符を強調表示すること(例えば、その音符をより明るくすること)、またはその音符がプレイされるときに他の音符とは異なる表示色を与えることによって示すことができる。別のオプションは、特に単一ラインの楽曲楽節904に関して、LCD画面902が音符938の名前を示すことである(英語とソルフェージュとの両方で)。楽曲楽節904が、同時に存在する複数の楽曲ラインから成る場合、ユーザは、音符938の名前が表示されるラインを指定することができる。
LCD画面902はさらに、プレイされるよう選択された楽曲楽節904のインジケータを示してもよい。このインジケータは、楽節マーカー939と呼ばれる。図9では、楽節マーカー939が、丸で囲まれた数字「1」として示されている。この数字「1」は、楽曲楽節904の第1小節が現在表示されていることを示し、丸は、再生が第1小節で開始されたことを示す。再生が次の小節に続くと、「2」が「1」の代わりに表示されるが、この「2」には丸が付かないことになる。
別の実施形態では、装置900は、記録センサ機能を提供してもよい。例えば、マイクロホン912は、問題になっている楽曲楽節904をユーザ自身がプレイする(および/または歌う)のをユーザが記録して、直ちにその記録を再生し、ユーザのパフォーマンスと、装置900の(すなわち、前もって記録されたか、または合成された演奏の)パフォーマンスとを比較できるように構成されてもよい。この機能は、生徒が音符、調律、リズムおよび強弱を調節する助けとなると考えられる。上述の通り、ユーザのパフォーマンスがマイクロホン912を介して記録され、「聴音」機能を提供することが可能である。
装置900のいくつかの実施形態は、無線能力を提供する。例えば、装置900は、ネットワークおよび他の無線対応装置との無線通信を可能にし、文脈情報を備えた符号化楽曲ファイルのダウンロードを可能にするよう動作可能であってもよい。本願明細書に記載される機能は、例えば、携帯用の音楽インタラクションのために、PDAまたはスマートフォンなどの無線プラットフォームにインストールされたeMuseソフトウェアによって提供されることが可能である。さらに、装置900は、ホームPCおよび/またはステレオシステム、または別のコンポーネントの計算およびメモリ(およびオーディオ再生)を使用してもよい。
別の実施形態では、ユーザのパフォーマンスが装置900によって記録され、そのユーザのパフォーマンスが音符解釈処理を受け、ユーザの記録済みパフォーマンスに対応する音符の表示を作り出すもとのデータが生成されてもよい。このようにして、装置は、「聴音」を行うことができ、ユーザによる生のオーディオパフォーマンスを、そのパフォーマンスに対応する楽曲楽譜の視覚表示に変換することができる。したがって、装置の楽曲解釈機能は、光または電子ネットワーク通信によって受信される両方の楽曲楽譜データを処理することができ、マイクロホンによって取り込まれたユーザの生のパフォーマンスによってつくり出される楽曲楽譜データを処理することができる。
本願明細書に記載されているソフトウェアは、様々なプラットフォームで使用可能である。一実施形態では、eMuseの複数の側面が、ハイエンドの携帯電話に組み込まれ、携帯電話のカメラが楽曲楽譜内の特定の楽節を撮影する。次に、取り込み画像は、圧縮されてリモートサーバへ送信され、リモートサーバは、その画像データに対してOCR動作を実行して、画像を対応する音符情報へと解釈する。次に、サーバは、midiファイルおよびグラフィックファイルの両方を送り返し、このバージョンのeMuseが、撮影された楽曲をプレイして、音符がプレイされるときに音符をLCDに表示することができるようにする。
図10は、図9の装置900の実施形態の動作を示すプロセスフロー図の簡略化した例を提供する。最初の動作で、楽曲楽譜のデジタル表現が装置に提供される。デジタル表現は、装置と共に動作するデジタルカメラなどのデジタル画像キャプチャ装置1004を使用してデジタル方式で取り込まれる印刷されたページなど、装置への視覚的表現1002によって受信されることが可能である。次に、光学入力1006から生じるデジタルデータが、音符データ解釈プロセス1008に提供される。あるいは、楽曲楽譜のデジタル表現は、楽曲楽譜に対応するデジタルデータの無線伝送もしくはネットワーク上でのデータの有線伝送、またはメモリカードもしくは他の媒体などのストレージ媒体を介した入力などによって、電子的に1010提供されることが可能である。次に、楽曲楽譜1010の電子的に受信されたバージョンが、音符データ解釈プロセス1008に提供される。
音符データ解釈プロセス1008は、楽曲楽譜に対応するデジタルデータを受信し、それを処理して、楽曲楽譜を特定して適切なハードウェアによる楽譜の再現を可能にするのに十分な、音符と、付随する情報との組を作り出す。プロセス1008は、楽曲楽譜デジタルデータ1006、1010を認識して適切な変換データを作り出すよう機械学習技術で訓練された処理装置を含む。プロセス1008は、例えば、解釈プロセスの精度を実質的に100%の精度まで上げるために、ニューラルネットワークソフトウェア工学技術を使用して訓練可能である。本発明に従って、入力楽曲楽譜データは、ユーザに対するリアルタイムのオーディオおよび視覚的表現用に作り出す必要がある。したがって、入力楽曲楽譜データの解釈は、リアルタイムでなければならず、100%の精度の解釈(変換)に近づかなくてはならない。プロセス1008は、光学式文字認識(OCR)技術を利用するが、音符の認識およびデジタルデータ(電子または光学スキャンから得られる)を適切な表現に解釈するよう適応している。
解釈プロセス出力1012は、装置のディスプレイ画面1014に提供される楽曲楽譜の視覚的表現、およびさらに、装置のスピーカまたは同様のものを介したオーディオ表現のために適切な装置システムおよびハードウェア1016に提供される楽曲楽譜の合成オーディオ演奏を含む。
(他の能力)
当然のことながら、上述の能力に加えて、他に多数の能力が考えられる。さらなる処理能力の1つの組は、ユーザに提供されるカスタマイズ性を高めることを含む。例えば、実施形態は、本発明の様々なコンポーネントおよび方法の、強化されたカスタマイズ性を可能にしてもよい。
いくつかの実施形態では、様々な理由から、様々な閾値、ウィンドウ、ならびにコンポーネントおよび方法に対するその他の入力はそれぞれ、調節可能とされてもよい。例えば、ユーザは、調判断が頻繁に行われすぎているように思われる場合に、調抽出ウィンドウを調整できてもよい(例えばユーザは、調からの短時間の離脱には、調の変更として楽譜上に現れてほしくないこともある)。別の例として、記録は、記録時のパフォーマンス中に使用される60Hzの電力から生じる背景雑音を含むこともある。ユーザは、この60Hzピッチを楽譜上に低音として表さないよう、様々なフィルタアルゴリズムを調節して、この60Hzピッチを無視することを希望するかもしれない。さらに別の例では、ユーザは、音符のピッチ分解能を調節するために、ピッチが量子化されるミュージックビン(music bins)の分解能を調節してもよい。
他の実施形態では、より低いカスタマイズ性がユーザに提供されてもよい。一実施形態では、ユーザは、表現精度レベルを調節することができてもよい。ユーザは、テンポおよびピッチの様な個々の楽譜表現構成要素の精度の選択を含む1つ以上のパラメータに基づき、システムが精度のより高い楽譜表現を生成するべきか、またはより低い楽譜表現を生成するべきかを入力してもよい(例えば、物理的または仮想スライダー、ノブ、スイッチなどを介して)。
例えば、最小の音価が16分音符となるように、いくつかの内部設定が連携してもよい。表現精度を調節することによって、より長いまたはより短い持続時間が検出され、最小値として表されてもよい。これは、演奏者が厳密に一定の拍で演奏していない場合(例えば、打楽器のセクションがない、メトロノームがないなど)に有用となり得、システムの精度が高すぎると、望ましくない表現(例えば複々付点音符)を生じることもある。別の例として、最小のピッチ変化が半音となる(すなわち、半音階での音符)よう、いくつかの内部設定が連携してもよい。
さらに他の実施形態では、さらに低いカスタマイズ性がユーザに提供されてもよい。一実施形態では、ユーザは、自らが初心者ユーザであるかまたは上級ユーザであるかを入力してもよい。別の実施形態では、ユーザは、システムの感度が高くあるべきかまたは低くあるべきかを入力してもよい。どちらの実施形態でも、多数のコンポーネントまたは方法において、多数の異なるパラメータが、所望のレベルに合うよう共に調節されてもよい。例えば、或る場合には、歌い手が、ピッチと持続時間のあらゆる揺れを正確に書き起こしたいこともある(例えば、間違いを発見するため、または特定のパフォーマンスを、そのすべての、感覚の微妙な違いとともに、忠実に再現するための練習の助けとして)。その一方で、別の場合には、歌い手は、システムに小さなずれを無視させることで、公開用の読みやすい楽譜を生成したいこともある。
特定の実施形態では、カスタマイズ性のレベル、機能の種類、およびシステムまたは方法のその他の側面は、種々の方法で決定されてよい。一実施形態では、ユーザは、そうした側面を決定するために、特定のプリファレンスを選択しても、特定の物理的または仮想コントロールを処理しても、または別の方法でシステムと能動的に対話してもよい。別の実施形態では、システムが、様々な側面を自動的に選択してもよい(例えば、ユーザに関するログインおよび/またはプロフィール情報から、またはユーザのシステムの使用パターンからなど)。
さらなる能力のもう1つの組は、様々な種類の入力を使用して、入力オーディオ信号の処理を精緻化するか、または別の形でこの処理に影響を及ぼすことを含む。一実施形態は、訓練された1つ以上の人工ニューラルネットワーク(ANN)を使用して、特定の判断を精緻化する。例えば、心理音響学的判断(例えば、拍子、調、楽器編成など)は、訓練されたANNを使用するのに適している。
別の実施形態は、ユーザに、複数トラックをレイヤ状にする能力を提供する(例えば、ワンマンバンド)。ユーザが、ドラムトラックを演奏することによって開始してもよく、このトラックは、本発明のシステムを使用してリアルタイムで処理される。次に、ユーザは連続してギタートラック、キーボードトラック、およびボーカルトラックを演奏し、このそれぞれが処理される。場合によっては、ユーザは一緒に処理する複数のトラックを選択してもよく、他の場合には、ユーザは各トラックが別々に処理されるよう選んでもよい。続いて、いくつかのトラックからの情報が、他のトラックの処理を精緻化または指示するために使用されてもよい。例えば、ドラムトラックが独立して処理され、高信頼度のテンポおよび拍子情報が生成されてもよい。次に、テンポおよび拍子情報が、音符の持続時間および音価をより正確に判断するために他のトラックと共に使用されることも可能である。別の例として、ギタートラックは、小さな時間ウィンドウの間に多数のピッチを提供することもあり、これによって、調の判断が容易になることもある。次に、調の判断は、調のピッチの決定をキーボードトラックの各音符に割り当てるために使用されてもよい。さらに別の例として、複数トラックが、1つ以上の次元において位置合わせ、量子化、または正規化されてもよい(例えば、複数トラックが、同じテンポ、平均音量、ピッチの範囲、ピッチ分解能、最小音符持続時間などを有するように正規化されてもよい)。さらに、「ワンマンバンド」のいくつかの実施形態では、ユーザが、1つの楽器を使用してオーディオ信号を生成し、次に、システムまたは方法を使用して、単数または複数の異なる楽器に変換する(例えば、四重奏曲の4つのトラックすべてを、キーボードを使用してプレイして、そのキーボード入力を、システムを使用して弦楽四重奏に変換する)。場合によっては、これには、音色の調節、楽曲ラインの移調、および他の処理が必要となり得る。
さらに別の実施形態は、楽曲入力信号に付帯的な入力を使用して、処理を精緻化または指示する。一実施形態では、ジャンル情報がユーザ、別のシステム(例えばコンピュータシステムもしくはインターネット)、またはデジタルオーディオファイル内のヘッダ情報から受信され、様々なコスト関数を精緻化する。例えば、調のコスト関数は、ブルース、インドの古典音楽、フォークなどによって異なってもよい。または、異なる楽器編成の可能性は異なるジャンルで高くなると考えられる(例えば、「オルガンの様な」サウンドは、讃美歌音楽ではオルガンである可能性が高く、ポルカ音楽ではアコーディオンである可能性がより高いと考えられる)。
さらなる能力のもう1つの組は、複数のコンポーネントまたは方法にわたって情報を使用して、複雑な判断を精緻化することを含む。一実施形態では、楽器同定方法の出力が、特定されている楽器の既知の能力または限界に基づいて判断を精緻化するよう使用される。例えば、楽器同定方法が、楽曲ラインはピアノでプレイされている可能性が高いと判断すると仮定する。一方、ピッチ同定方法は、その楽曲ラインが、速くて浅いビブラート(例えば、検出された調のピッチ指示の1または2半音のみの範囲内でのピッチの震え)を含むと判断する。これは典型的にはピアノで作り出すことができる効果ではないため、システムは、このラインが別の楽器によりプレイされていると判断してもよい(例えば、電子キーボードまたはオルガン)。
さらなる能力のさらにもう1つの組は、システムおよび方法の様々な機能を使用して、着信音(例えば、携帯電話、ボイスオーバーインターネットプロトコル電話、およびその他の装置の)を処理することを含む。一実施形態では、分解された楽曲構成要素が着信音の規格に適合するように処理される。例えば、いくつかの装置は、着信音の帯域幅、ポリフォニーの深さ、および長さに制限があるかもしれない。したがって、場合によっては、システムが、着信音の規格に適合するよう検索入力または格納された検索データを自動的に調節してもよく、または、そうした規格に従ってユーザを導くのに望ましい情報または必要な情報を用いて、ユーザにプロンプトで指示を求めてもよい。その結果、ユーザは、例えば着信音を聴くこと、着信音を携帯電話または他の装置(またはストレージ場所)にダウンロードすること、ネットワーク経由で他者と着信音を共有すること、着信音をオークションにかけることまたは販売することなどができると考えられる。
さらなる能力のさらにもう1つの組は、オーディオまたは楽譜出力を、販売またはオークション用の製品として構成することを含む。例えば、検索ポータルは、楽曲オークション機能または楽曲ストア機能を含んでもよい。買い物機能は、著作権使用料および価格設定、投票(例えば、所定の期間中で最も人気の高いものを特集する、または勝者がポータル上で特別な特集を得る)、装置または規格での検索、異なる支払い処理、安全な電子商取引、著作権保護およびデジタル著作権管理などに関する能力を含んでもよい。
さらに、さらなる能力のもう1つの組は、分解または受信された楽曲構成要素を使用して、類似の作品を検索し、著作権侵害を回避(または検出)することを含む。この能力は、この特定の結果を求めて検索を調整するために、システムに追加モジュールが組み込まれること、または方法に追加ステップが組み込まれることを必要とすることもある。例えば、いくつかの実施形態では、著作権法およびポリシーに関する情報が提供され、システムおよび方法が、潜在的な侵害があるかどうかを判断する助けになってもよい。
当然のことながら、本発明によれば、このようなさらなる処理能力が多数考えられる。なお、さらに、上記で説明された方法、システムおよび装置は、単に例であるものとする。様々な実施形態は、必要に応じて様々な手順またはコンポーネントを省略、置換、または追加してよいということを強調しなければならない。例えば、当然のことながら、代わりの実施形態では、本方法が説明とは異なる順序で実行されてもよく、様々なステップが追加、省略されても、または組み合わされてもよい。さらに、特定の実施形態に関して説明された特徴が、他の様々な実施形態に組み合わされてもよい。実施形態の種々の側面および構成要素が、同様の形で組み合わされてもよい。さらに、技術は進化するものであり、したがって、構成要素の多くは例であり、本発明の範囲を制限すると解釈されてはならないということを強調しなくてはならない。
説明の中では、実施形態が完全に理解されるよう具体的な詳細事項が与えられた。しかし、当業者には当然のことながら、実施形態はこれらの具体的な詳細事項を用いずに実践されてもよい。例えば、実施形態を分かりにくくすることを避けるために、周知の回路、プロセス、アルゴリズム、構造および技術を、不必要な詳細事項なしで示してきた。さらに、本願明細書で与えられた見出しは、単に様々な実施形態の説明を明快にするのを助けることを目的としており、本発明の範囲または本発明のいかなる部分の機能も制限するものと解釈されてはならない。例えば、特定の方法またはコンポーネントは、たとえそれらが異なる見出しの下で説明されていても、他の方法またはコンポーネントの一部として実装されてもよい。
なお、さらに、実施形態は、フロー図またはブロック図として示されるプロセスとして記載されていることもある。それぞれ、動作を逐次プロセスとして記載しているかもしれないが、動作の多くは、並行して、または同時に実行可能である。さらに、各動作の順序は配列し直されてもよい。プロセスは、図に含まれていない追加のステップを有してもよい。

Claims (41)

  1. 楽曲検索を実行するコンピュータ方法であって、
    楽曲構成要素を指定する楽曲クエリを受信することと、
    該受信された楽曲クエリによって指定された該楽曲構成要素に基づいて検索パラメータの組を生成することと、
    複数のデータ記録を含むデータベースに対して該検索パラメータの組を送ることであって、各データ記録は、楽曲作品と、該楽曲作品に関係する楽曲構成要素の組とに関連し、
    少なくとも1つのデータ記録に関連する該楽曲構成要素の組は、少なくとも1つの該楽曲作品から分解されたデータを含む、ことと、
    該データベースにおいて一致するデータ記録の組を同定することであって、該一致するデータ記録の組は、該検索パラメータの組と一致するデータ記録を含む、ことと、
    該データベースにおいて一致した楽曲作品の組を同定することであって、該一致した楽曲作品の組は該一致するデータ記録の組に関連する楽曲作品を含む、ことと、
    順位付けリストに並べられている該一致した楽曲作品を含む検索出力を生成することと
    を含む、方法。
  2. 少なくとも1つの追加の楽曲クエリを受信することと、
    分解された追加の楽曲クエリを生成することと、
    分解された楽曲作品を含む選択されたデータベースに対して、該分解された追加の楽曲クエリを送ることと、
    該分解された追加の楽曲クエリに一致する、分解された楽曲作品を同定することと、
    順位付けリストに並べられている該同定された楽曲作品を含む検索出力を生成することと
    をさらに含む、請求項1に記載の方法。
  3. 送ることは、前記分解された追加の楽曲クエリを、前の楽曲クエリの出力として同定された楽曲作品の組に対して送ることを含む、請求項2に記載の方法。
  4. 前記順位付けリストは、重み付けされた値に従って並べられている、請求項2に記載の方法。
  5. クエリを受信することは、オーディオ入力を受信することを含む、請求項1に記載の方法。
  6. 前記オーディオ入力は、話し言葉の部分および旋律の部分を含む、請求項5に記載の方法。
  7. 前記オーディオ入力において、前記話し言葉の部分と、前記旋律の部分との間に部分セパレータが存在する、請求項6に記載の方法。
  8. 前記部分セパレータは、所定の話し言葉を含む、請求項7に記載の方法。
  9. 前記オーディオ入力は、コンピュータ入力ポートを介して受信されたオーディオセグメントを含む、請求項5に記載の方法。
  10. 前記オーディオ入力は、MIDIシーケンスを含む、請求項5に記載の方法。
  11. クエリを受信するステップは、楽曲楽譜画像を受信することを含む、請求項1に記載の方法。
  12. 前記楽曲楽譜画像は、楽曲構成要素を有するOCR出力を含む、請求項11に記載の方法。
  13. クエリを受信することは、前記楽曲構成要素に対するユーザ指定の入力パラメータを受信することを含む、請求項1に記載の方法。
  14. 前記ユーザ指定の入力パラメータは、話し言葉として受信される、請求項13に記載の方法。
  15. 前記ユーザ指定の入力パラメータは、英数字入力として受信される、請求項13に記載の方法。
  16. クエリを受信することは、楽曲作品のメタデータに対して送るユーザ指定の入力パラメータを受信することを含む、請求項1に記載の方法。
  17. 前記ユーザ指定の入力パラメータは、話し言葉として受信される、請求項16に記載の方法。
  18. 前記ユーザ指定の入力パラメータは、英数字入力として受信される、請求項16に記載の方法。
  19. 前記分解された楽曲クエリを送ることは、前記検索が送られるユーザ指定のデータベースを受信することを含む、請求項1に記載の方法。
  20. 前記ユーザ指定のデータベースは、前記コンピュータのデータベースを含む、請求項19に記載の方法。
  21. 楽曲検索を実行するコンピュータシステムであって、
    楽曲セグメントを指定する楽曲クエリを受信するよう適合される入力インターフェースと、
    該受信された楽曲クエリの楽曲構成要素を含む分解された楽曲クエリを生成するよう適合されるクエリ入力プロセッサと、
    分解された楽曲作品を含む選択されたデータベースに対して、該分解された楽曲クエリを送り、該分解された楽曲クエリに一致する該データベースの分解された楽曲作品を同定し、順位付けリストに並べられている該同定された楽曲作品を含む検索出力を同定して生成するよう適合されるクエリエンジンと
    を含む、システム。
  22. 前記入力インターフェースは、少なくとも1つの追加の楽曲クエリを受信し、
    前記クエリ入力プロセッサは、分解された追加の楽曲クエリを生成し、
    前記クエリエンジンは、該分解された追加の楽曲クエリを分解された楽曲作品を含む選択されたデータベースに対して送り、該分解された追加の楽曲クエリに一致する分解された楽曲作品を同定し、順位付けリストに並べられている該同定された楽曲作品を含む検索出力を生成する、請求項21に記載のシステム。
  23. 前記システムは、前記追加の楽曲クエリを、前の楽曲クエリの出力として同定された楽曲作品の組に対して送る、請求項22に記載のシステム。
  24. 前記順位付けリストは、重み付けされた値に従って並べられている、請求項22に記載のシステム。
  25. クエリを受信することは、オーディオ入力を受信することを含む、請求項21に記載のシステム。
  26. 前記オーディオ入力は、話し言葉の部分および旋律の部分を含む、請求項25に記載のシステム。
  27. 前記オーディオ入力において、前記話し言葉の部分と、前記旋律の部分との間に部分セパレータが存在する、請求項26に記載のシステム。
  28. 前記部分セパレータは、所定の話し言葉を含む、請求項27に記載のシステム。
  29. 前記オーディオ入力は、コンピュータ入力ポートを介して受信されたオーディオセグメントを含む、請求項25に記載のシステム。
  30. 前記オーディオ入力は、MIDIシーケンスを含む、請求項25に記載のシステム。
  31. クエリを受信することは、楽曲楽譜画像を受信することを含む、請求項21に記載のシステム。
  32. 前記楽曲楽譜画像は、楽曲構成要素を有するOCR出力を含む、請求項31に記載のシステム。
  33. 前記受信されたクエリは、前記楽曲構成要素に対して送られるユーザ指定の入力パラメータを含む、請求項21に記載のシステム。
  34. 前記ユーザ指定の入力パラメータは、話し言葉として受信される、請求項33に記載のシステム。
  35. 前記ユーザ指定の入力パラメータは、英数字入力として受信される、請求項33に記載のシステム。
  36. 前記受信されたクエリは、楽曲作品のメタデータに対して送られるユーザ指定の入力パラメータを含む、請求項21に記載のシステム。
  37. 前記ユーザ指定の入力パラメータは、話し言葉として受信される、請求項36に記載のシステム。
  38. 前記ユーザ指定の入力パラメータは、英数字入力として受信される、請求項36に記載のシステム。
  39. 前記分解された楽曲クエリは、前記検索が送られるユーザ指定のデータベースを含む、請求項21に記載のシステム。
  40. 前記ユーザ指定のデータベースは、前記コンピュータのデータベースを含む、請求項39に記載のシステム。
  41. 楽曲ベースの検索エンジンの動作を指示するコンピュータ読み取り可能プログラムが具現化されているコンピュータ読み取り可能ストレージ媒体であって、該コンピュータ読み取り可能プログラムは、以下の:
    楽曲構成要素を指定する楽曲クエリを受信することと、
    該受信された楽曲クエリによって指定された該楽曲構成要素に基づいて検索パラメータの組を生成することと、
    複数のデータ記録を含むデータベースに対して該検索パラメータの組を送ることであって、各データ記録は、楽曲作品と、該楽曲作品に関係する楽曲構成要素の組とに関連し、
    少なくとも1つのデータ記録に関連する該楽曲構成要素の組は、少なくとも1つの該楽曲作品から分解されたデータを含む、ことと、
    該データベースにおいて一致するデータ記録の組を同定することであって、該一致するデータ記録は該検索パラメータの組に一致するデータ記録を含む、ことと、
    該データベースにおいて一致した楽曲作品の組を同定することであって、該一致した楽曲作品は該一致するデータ記録の組と関連する楽曲作品を含む、ことと、
    順位付けリストに並べられている該一致した楽曲作品を含む検索出力を生成することと
    に従う、楽曲ベースの検索に関する命令を含む、コンピュータ読み取り可能ストレージ媒体。
JP2009550141A 2007-02-14 2008-02-14 楽曲ベースの検索エンジン Withdrawn JP2010521021A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US88982107P 2007-02-14 2007-02-14
US88981607P 2007-02-14 2007-02-14
US2849008P 2008-02-13 2008-02-13
PCT/US2008/054030 WO2008101130A2 (en) 2007-02-14 2008-02-14 Music-based search engine

Publications (1)

Publication Number Publication Date
JP2010521021A true JP2010521021A (ja) 2010-06-17

Family

ID=39684357

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009549729A Withdrawn JP2010518459A (ja) 2007-02-14 2008-02-14 配布オーディオファイル編集用ウェブポータル
JP2009550141A Withdrawn JP2010521021A (ja) 2007-02-14 2008-02-14 楽曲ベースの検索エンジン

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2009549729A Withdrawn JP2010518459A (ja) 2007-02-14 2008-02-14 配布オーディオファイル編集用ウェブポータル

Country Status (5)

Country Link
US (3) US7714222B2 (ja)
EP (2) EP2122510A2 (ja)
JP (2) JP2010518459A (ja)
CN (1) CN102867526A (ja)
WO (2) WO2008101130A2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150244A (ja) * 2011-01-19 2012-08-09 Yahoo Japan Corp 楽曲レコメンド装置、方法及びプログラム
JP2016136251A (ja) * 2015-01-20 2016-07-28 ハーマン インターナショナル インダストリーズ インコーポレイテッド 音楽コンテンツ及びリアルタイム音楽伴奏の自動採譜
JP2020109918A (ja) * 2019-01-07 2020-07-16 ヤマハ株式会社 映像制御システム、及び映像制御方法
WO2025033250A1 (ja) * 2023-08-08 2025-02-13 ソニーグループ株式会社 情報処理システム、情報処理方法および端末装置

Families Citing this family (322)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050120870A1 (en) * 1998-05-15 2005-06-09 Ludwig Lester F. Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications
AU2003275089A1 (en) * 2002-09-19 2004-04-08 William B. Hudak Systems and methods for creation and playback performance
IL165817A0 (en) * 2004-12-16 2006-01-15 Samsung Electronics U K Ltd Electronic music on hand portable and communication enabled devices
US20070005699A1 (en) * 2005-06-29 2007-01-04 Eric Yuan Methods and apparatuses for recording a collaboration session
US7945621B2 (en) * 2005-06-29 2011-05-17 Webex Communications, Inc. Methods and apparatuses for recording and viewing a collaboration session
WO2007010637A1 (ja) * 2005-07-19 2007-01-25 Kabushiki Kaisha Kawai Gakki Seisakusho テンポ検出装置、コード名検出装置及びプログラム
WO2007053917A2 (fr) * 2005-11-14 2007-05-18 Continental Structures Sprl Procede de composition d’une œuvre musicale par un non-musicien
KR20080109775A (ko) 2006-02-23 2008-12-17 노보셀, 인크 분화가능한 세포를 배양하는데 유용한 조성물 및 방법
US20090320669A1 (en) * 2008-04-14 2009-12-31 Piccionelli Gregory A Composition production with audience participation
US7459624B2 (en) 2006-03-29 2008-12-02 Harmonix Music Systems, Inc. Game controller simulating a musical instrument
US7538265B2 (en) * 2006-07-12 2009-05-26 Master Key, Llc Apparatus and method for visualizing music and other sounds
US8843377B2 (en) * 2006-07-12 2014-09-23 Master Key, Llc System and method for foreign language processing
WO2008095190A2 (en) * 2007-02-01 2008-08-07 Museami, Inc. Music transcription
KR100842733B1 (ko) * 2007-02-05 2008-07-01 삼성전자주식회사 터치스크린을 구비한 멀티미디어 재생장치의 사용자인터페이스 방법
WO2008101130A2 (en) * 2007-02-14 2008-08-21 Museami, Inc. Music-based search engine
US20080216638A1 (en) * 2007-03-05 2008-09-11 Hustig Charles H System and method for implementing a high speed digital musical interface
US20080250431A1 (en) * 2007-04-04 2008-10-09 Research In Motion Limited System and method for displaying media files in a media application for a portable media device
WO2008130611A1 (en) * 2007-04-18 2008-10-30 Master Key, Llc System and method for musical instruction
US7994409B2 (en) * 2007-04-19 2011-08-09 Master Key, Llc Method and apparatus for editing and mixing sound recordings
WO2008130665A1 (en) 2007-04-19 2008-10-30 Master Key, Llc System and method for audio equalization
WO2008130666A2 (en) * 2007-04-20 2008-10-30 Master Key, Llc System and method for music composition
WO2008130657A1 (en) * 2007-04-20 2008-10-30 Master Key, Llc Method and apparatus for computer-generated music
WO2008130660A1 (en) 2007-04-20 2008-10-30 Master Key, Llc Archiving of environmental sounds using visualization components
WO2008130661A1 (en) * 2007-04-20 2008-10-30 Master Key, Llc Method and apparatus for comparing musical works
WO2008130696A1 (en) * 2007-04-20 2008-10-30 Master Key, Llc Calibration of transmission system using tonal visualization components
WO2008130659A1 (en) * 2007-04-20 2008-10-30 Master Key, Llc Method and apparatus for identity verification
US7964783B2 (en) * 2007-05-31 2011-06-21 University Of Central Florida Research Foundation, Inc. System and method for evolving music tracks
US7625284B2 (en) 2007-06-14 2009-12-01 Harmonix Music Systems, Inc. Systems and methods for indicating input actions in a rhythm-action game
US8678896B2 (en) 2007-06-14 2014-03-25 Harmonix Music Systems, Inc. Systems and methods for asynchronous band interaction in a rhythm action game
JP5130809B2 (ja) * 2007-07-13 2013-01-30 ヤマハ株式会社 楽曲を制作するための装置およびプログラム
GB0713649D0 (en) * 2007-07-13 2007-08-22 Anglia Ruskin University Tuning device
US8422999B1 (en) * 2007-08-06 2013-04-16 Harris Technology, Llc Portable camera enabled device applications
US20090106429A1 (en) * 2007-10-22 2009-04-23 Matthew L Siegal Collaborative music network
JP4404130B2 (ja) 2007-10-22 2010-01-27 ソニー株式会社 情報処理端末装置、情報処理装置、情報処理方法、プログラム
JP4424410B2 (ja) 2007-11-07 2010-03-03 ソニー株式会社 情報処理システム、情報処理方法
US7941399B2 (en) * 2007-11-09 2011-05-10 Microsoft Corporation Collaborative authoring
US8028229B2 (en) * 2007-12-06 2011-09-27 Microsoft Corporation Document merge
US8825758B2 (en) * 2007-12-14 2014-09-02 Microsoft Corporation Collaborative authoring modes
JP2009153067A (ja) * 2007-12-21 2009-07-09 Canon Inc 画像処理方法及び画像処理装置
US7875787B2 (en) * 2008-02-01 2011-01-25 Master Key, Llc Apparatus and method for visualization of music using note extraction
US20090193959A1 (en) * 2008-02-06 2009-08-06 Jordi Janer Mestres Audio recording analysis and rating
WO2009103023A2 (en) 2008-02-13 2009-08-20 Museami, Inc. Music score deconstruction
US8797377B2 (en) 2008-02-14 2014-08-05 Cisco Technology, Inc. Method and system for videoconference configuration
US20110000359A1 (en) * 2008-02-15 2011-01-06 Pioneer Corporation Music composition data analyzing device, musical instrument type detection device, music composition data analyzing method, musical instrument type detection device, music composition data analyzing program, and musical instrument type detection program
JP2011516907A (ja) * 2008-02-20 2011-05-26 オーイーエム インコーポレーティッド 音楽の学習及びミキシングシステム
US8301588B2 (en) * 2008-03-07 2012-10-30 Microsoft Corporation Data storage for file updates
US20090235809A1 (en) * 2008-03-24 2009-09-24 University Of Central Florida Research Foundation, Inc. System and Method for Evolving Music Tracks
IL190660A0 (en) * 2008-04-07 2008-12-29 Amir Ziv Av A method for making a musical creation
US8352870B2 (en) * 2008-04-28 2013-01-08 Microsoft Corporation Conflict resolution
US8825594B2 (en) 2008-05-08 2014-09-02 Microsoft Corporation Caching infrastructure
US8429753B2 (en) 2008-05-08 2013-04-23 Microsoft Corporation Controlling access to documents using file locks
JP4600521B2 (ja) * 2008-06-03 2010-12-15 ソニー株式会社 情報処理装置、情報処理方法、プログラム
JP4596043B2 (ja) * 2008-06-03 2010-12-08 ソニー株式会社 情報処理装置、情報処理方法、プログラム
JP4596044B2 (ja) * 2008-06-03 2010-12-08 ソニー株式会社 情報処理システム、情報処理方法
US8417666B2 (en) 2008-06-25 2013-04-09 Microsoft Corporation Structured coauthoring
US8487173B2 (en) * 2009-06-30 2013-07-16 Parker M. D. Emmerson Methods for online collaborative music composition
US8962964B2 (en) * 2009-06-30 2015-02-24 Parker M. D. Emmerson Methods for online collaborative composition
US10007893B2 (en) * 2008-06-30 2018-06-26 Blog Band, Llc Methods for online collaboration
US20100064219A1 (en) * 2008-08-06 2010-03-11 Ron Gabrisko Network Hosted Media Production Systems and Methods
WO2010024929A1 (en) * 2008-08-30 2010-03-04 All About Choice, Inc. System, apparatus, and method for decision support
US8694658B2 (en) 2008-09-19 2014-04-08 Cisco Technology, Inc. System and method for enabling communication sessions in a network environment
JP5334515B2 (ja) * 2008-09-29 2013-11-06 ローランド株式会社 電子楽器
JP5203114B2 (ja) * 2008-09-29 2013-06-05 ローランド株式会社 電子楽器
US20100131836A1 (en) * 2008-11-24 2010-05-27 Microsoft Corporation User-authored notes on shared documents
US8902272B1 (en) 2008-11-24 2014-12-02 Shindig, Inc. Multiparty communications systems and methods that employ composite communications
US9401937B1 (en) 2008-11-24 2016-07-26 Shindig, Inc. Systems and methods for facilitating communications amongst multiple users
JP5495572B2 (ja) * 2009-01-07 2014-05-21 キヤノン株式会社 プロジェクタ・システム及びこれを含むビデオ会議システム
US8219386B2 (en) * 2009-01-21 2012-07-10 King Fahd University Of Petroleum And Minerals Arabic poetry meter identification system and method
US20130124242A1 (en) 2009-01-28 2013-05-16 Adobe Systems Incorporated Video review workflow process
US8659637B2 (en) 2009-03-09 2014-02-25 Cisco Technology, Inc. System and method for providing three dimensional video conferencing in a network environment
JP5335501B2 (ja) * 2009-03-18 2013-11-06 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
US9712579B2 (en) 2009-04-01 2017-07-18 Shindig. Inc. Systems and methods for creating and publishing customizable images from within online events
US8779265B1 (en) * 2009-04-24 2014-07-15 Shindig, Inc. Networks of portable electronic devices that collectively generate sound
TWI486871B (zh) 2009-04-27 2015-06-01 Mstar Semiconductor Inc 音樂資料處理方法與應用其之電子裝置
US8346768B2 (en) 2009-04-30 2013-01-01 Microsoft Corporation Fast merge support for legacy documents
US8826355B2 (en) * 2009-04-30 2014-09-02 At&T Intellectual Property I, Lp System and method for recording a multi-part performance on an internet protocol television network
US8076564B2 (en) * 2009-05-29 2011-12-13 Harmonix Music Systems, Inc. Scoring a musical performance after a period of ambiguity
US8449360B2 (en) 2009-05-29 2013-05-28 Harmonix Music Systems, Inc. Displaying song lyrics and vocal cues
US8465366B2 (en) 2009-05-29 2013-06-18 Harmonix Music Systems, Inc. Biasing a musical performance input to a part
US7982114B2 (en) * 2009-05-29 2011-07-19 Harmonix Music Systems, Inc. Displaying an input at multiple octaves
US8017854B2 (en) * 2009-05-29 2011-09-13 Harmonix Music Systems, Inc. Dynamic musical part determination
US8080722B2 (en) * 2009-05-29 2011-12-20 Harmonix Music Systems, Inc. Preventing an unintentional deploy of a bonus in a video game
US8659639B2 (en) 2009-05-29 2014-02-25 Cisco Technology, Inc. System and method for extending communications between participants in a conferencing environment
US8026435B2 (en) * 2009-05-29 2011-09-27 Harmonix Music Systems, Inc. Selectively displaying song lyrics
EP2438589A4 (en) * 2009-06-01 2016-06-01 Music Mastermind Inc SYSTEM AND METHOD FOR RECEIVING, ANALYZING AND EDITING AUDIO FOR GENERATING MUSIC COMPOSITIONS
WO2010140166A2 (en) * 2009-06-02 2010-12-09 Indian Institute Of Technology, Bombay A system and method for scoring a singing voice
US20100319518A1 (en) * 2009-06-23 2010-12-23 Virendra Kumar Mehta Systems and methods for collaborative music generation
US9213466B2 (en) * 2009-07-20 2015-12-15 Apple Inc. Displaying recently used functions in context sensitive menu
US9082297B2 (en) 2009-08-11 2015-07-14 Cisco Technology, Inc. System and method for verifying parameters in an audiovisual environment
US8889976B2 (en) * 2009-08-14 2014-11-18 Honda Motor Co., Ltd. Musical score position estimating device, musical score position estimating method, and musical score position estimating robot
JP2011043710A (ja) * 2009-08-21 2011-03-03 Sony Corp 音声処理装置、音声処理方法及びプログラム
WO2011030225A2 (en) * 2009-09-14 2011-03-17 Joytunes, Ltd. System and method for improving musical education
US9031243B2 (en) * 2009-09-28 2015-05-12 iZotope, Inc. Automatic labeling and control of audio algorithms by audio recognition
US8363796B2 (en) * 2009-10-15 2013-01-29 Avaya Inc. Selection and initiation of IVR scripts by contact center agents
US8358746B2 (en) * 2009-10-15 2013-01-22 Avaya Inc. Method and apparatus for unified interface for heterogeneous session management
EP2491560B1 (en) 2009-10-19 2016-12-21 Dolby International AB Metadata time marking information for indicating a section of an audio object
US10357714B2 (en) 2009-10-27 2019-07-23 Harmonix Music Systems, Inc. Gesture-based user interface for navigating a menu
US8702485B2 (en) 2010-06-11 2014-04-22 Harmonix Music Systems, Inc. Dance game and tutorial
US9981193B2 (en) 2009-10-27 2018-05-29 Harmonix Music Systems, Inc. Movement based recognition and evaluation
CN102074233A (zh) * 2009-11-20 2011-05-25 鸿富锦精密工业(深圳)有限公司 乐曲辨识系统及方法
TWI467567B (zh) * 2009-11-26 2015-01-01 Hon Hai Prec Ind Co Ltd 樂曲辨識系統及方法
US9058797B2 (en) 2009-12-15 2015-06-16 Smule, Inc. Continuous pitch-corrected vocal capture device cooperative with content server for backing track mix
US9047286B2 (en) 2009-12-17 2015-06-02 Iheartmedia Management Services, Inc. Program and syndicated content detection
WO2011076960A1 (es) * 2009-12-23 2011-06-30 Peran Estepa Cristobal Método, sistema y plug-in para la gestión colaborativa de creación de contenido
US8049093B2 (en) * 2009-12-30 2011-11-01 Motorola Solutions, Inc. Method and apparatus for best matching an audible query to a set of audible targets
US8731943B2 (en) * 2010-02-05 2014-05-20 Little Wing World LLC Systems, methods and automated technologies for translating words into music and creating music pieces
JP2011164171A (ja) * 2010-02-05 2011-08-25 Yamaha Corp データ検索装置
US8653349B1 (en) * 2010-02-22 2014-02-18 Podscape Holdings Limited System and method for musical collaboration in virtual space
US8735709B2 (en) * 2010-02-25 2014-05-27 Yamaha Corporation Generation of harmony tone
US8636572B2 (en) 2010-03-16 2014-01-28 Harmonix Music Systems, Inc. Simulating musical instruments
US9225916B2 (en) 2010-03-18 2015-12-29 Cisco Technology, Inc. System and method for enhancing video images in a conferencing environment
US8309834B2 (en) * 2010-04-12 2012-11-13 Apple Inc. Polyphonic note detection
US8868411B2 (en) 2010-04-12 2014-10-21 Smule, Inc. Pitch-correction of vocal performance in accord with score-coded harmonies
US10930256B2 (en) 2010-04-12 2021-02-23 Smule, Inc. Social music system and method with continuous, real-time pitch correction of vocal performance and dry vocal capture for subsequent re-rendering based on selectively applicable vocal effect(s) schedule(s)
US9601127B2 (en) 2010-04-12 2017-03-21 Smule, Inc. Social music system and method with continuous, real-time pitch correction of vocal performance and dry vocal capture for subsequent re-rendering based on selectively applicable vocal effect(s) schedule(s)
US9313452B2 (en) 2010-05-17 2016-04-12 Cisco Technology, Inc. System and method for providing retracting optics in a video conferencing environment
JP2011242560A (ja) * 2010-05-18 2011-12-01 Yamaha Corp セッション端末及びネットワークセッションシステム
US8884146B2 (en) * 2010-06-01 2014-11-11 Life Empowerment, Inc. Internet system for monitoring progress of a music student
US8633370B1 (en) * 2011-06-04 2014-01-21 PRA Audio Systems, LLC Circuits to process music digitally with high fidelity
US9358456B1 (en) 2010-06-11 2016-06-07 Harmonix Music Systems, Inc. Dance competition game
US8562403B2 (en) 2010-06-11 2013-10-22 Harmonix Music Systems, Inc. Prompting a player of a dance game
GB2497027A (en) * 2010-08-02 2013-05-29 Be In Inc System and method for online interactive recording studio
JP5569228B2 (ja) * 2010-08-02 2014-08-13 ソニー株式会社 テンポ検出装置、テンポ検出方法およびプログラム
US8664503B2 (en) 2010-08-13 2014-03-04 Antakamatics, Inc. Musical notation and method of teaching same
WO2012026920A1 (en) * 2010-08-23 2012-03-01 The Public Record, Inc, A virtual studio for identifying and developing public talent
US20120050456A1 (en) * 2010-08-27 2012-03-01 Cisco Technology, Inc. System and method for producing a performance via video conferencing in a network environment
US8896655B2 (en) 2010-08-31 2014-11-25 Cisco Technology, Inc. System and method for providing depth adaptive video conferencing
US8599934B2 (en) 2010-09-08 2013-12-03 Cisco Technology, Inc. System and method for skip coding during video conferencing in a network environment
US9024166B2 (en) 2010-09-09 2015-05-05 Harmonix Music Systems, Inc. Preventing subtractive track separation
US8793005B2 (en) * 2010-09-10 2014-07-29 Avid Technology, Inc. Embedding audio device settings within audio files
US8626236B2 (en) * 2010-10-08 2014-01-07 Blackberry Limited System and method for displaying text in augmented reality
US8847053B2 (en) 2010-10-15 2014-09-30 Jammit, Inc. Dynamic point referencing of an audiovisual performance for an accurate and precise selection and controlled cycling of portions of the performance
US8599865B2 (en) 2010-10-26 2013-12-03 Cisco Technology, Inc. System and method for provisioning flows in a mobile network environment
JP2012098320A (ja) * 2010-10-29 2012-05-24 Astra:Kk マルチトラックデータ編集システム
US8699457B2 (en) 2010-11-03 2014-04-15 Cisco Technology, Inc. System and method for managing flows in a mobile network environment
US9338394B2 (en) 2010-11-15 2016-05-10 Cisco Technology, Inc. System and method for providing enhanced audio in a video environment
US9143725B2 (en) 2010-11-15 2015-09-22 Cisco Technology, Inc. System and method for providing enhanced graphics in a video environment
US8902244B2 (en) 2010-11-15 2014-12-02 Cisco Technology, Inc. System and method for providing enhanced graphics in a video environment
US8730297B2 (en) 2010-11-15 2014-05-20 Cisco Technology, Inc. System and method for providing camera functions in a video environment
US8723914B2 (en) 2010-11-19 2014-05-13 Cisco Technology, Inc. System and method for providing enhanced video processing in a network environment
US20120125180A1 (en) * 2010-11-24 2012-05-24 ION Audio, LLC Digital piano with dock for a handheld computing device
TWI426501B (zh) * 2010-11-29 2014-02-11 Inst Information Industry 旋律辨識方法與其裝置
JP5614262B2 (ja) * 2010-11-29 2014-10-29 ヤマハ株式会社 音楽情報表示装置
US9111138B2 (en) 2010-11-30 2015-08-18 Cisco Technology, Inc. System and method for gesture interface control
WO2012084008A1 (en) * 2010-12-20 2012-06-28 Telefonaktiebolaget L M Ericsson (Publ) Method of selecting a composite service from a plurality of composite services
JP5742217B2 (ja) * 2010-12-28 2015-07-01 ヤマハ株式会社 電子端末を制御する制御方法を実現するためのプログラムおよび電子音楽装置
US20120169835A1 (en) * 2011-01-05 2012-07-05 Thomas Woo Multi-party audio/video conference systems and methods supporting heterogeneous endpoints and progressive personalization
US8692862B2 (en) 2011-02-28 2014-04-08 Cisco Technology, Inc. System and method for selection of video data in a video conference environment
WO2012123824A2 (en) * 2011-03-17 2012-09-20 Moncavage, Charles System and method for recording and sharing music
US8676728B1 (en) * 2011-03-30 2014-03-18 Rawles Llc Sound localization with artificial neural network
JP5765848B2 (ja) * 2011-03-31 2015-08-19 株式会社河合楽器製作所 音再生プログラム及び音再生装置
US9866731B2 (en) * 2011-04-12 2018-01-09 Smule, Inc. Coordinating and mixing audiovisual content captured from geographically distributed performers
US8670019B2 (en) 2011-04-28 2014-03-11 Cisco Technology, Inc. System and method for providing enhanced eye gaze in a video conferencing environment
US8786631B1 (en) 2011-04-30 2014-07-22 Cisco Technology, Inc. System and method for transferring transparency information in a video environment
US9035163B1 (en) 2011-05-10 2015-05-19 Soundbound, Inc. System and method for targeting content based on identified audio and multimedia
US8934026B2 (en) 2011-05-12 2015-01-13 Cisco Technology, Inc. System and method for video coding in a dynamic environment
US20120294457A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function
JP5333517B2 (ja) * 2011-05-26 2013-11-06 ヤマハ株式会社 データ処理装置およびプログラム
US8710343B2 (en) 2011-06-09 2014-04-29 Ujam Inc. Music composition automation including song structure
US8768139B2 (en) * 2011-06-27 2014-07-01 First Principles, Inc. System for videotaping and recording a musical group
JP5877973B2 (ja) * 2011-08-08 2016-03-08 アイキューブド研究所株式会社 情報システム、情報再現装置、情報生成方法、およびプログラム
JP2013050530A (ja) 2011-08-30 2013-03-14 Casio Comput Co Ltd 録音再生装置およびプログラム
FR2979465B1 (fr) * 2011-08-31 2013-08-23 Alcatel Lucent Procede et dispositif de ralentissement d'un signal audionumerique
US8962967B2 (en) * 2011-09-21 2015-02-24 Miselu Inc. Musical instrument with networking capability
US9166976B2 (en) * 2011-10-17 2015-10-20 Stephen Villoria Creation and management of digital content and workflow automation via a portable identification key
US9848236B2 (en) * 2011-10-17 2017-12-19 Mediapointe, Inc. System and method for digital media content creation and distribution
US12118594B2 (en) * 2011-10-19 2024-10-15 Yourknow Inc. System and method for managing electronic files and data in a centralized collaborative workspace
US8863014B2 (en) * 2011-10-19 2014-10-14 New Commerce Solutions Inc. User interface for product comparison
US8614388B2 (en) * 2011-10-31 2013-12-24 Apple Inc. System and method for generating customized chords
US8947493B2 (en) 2011-11-16 2015-02-03 Cisco Technology, Inc. System and method for alerting a participant in a video conference
US20130164727A1 (en) * 2011-11-30 2013-06-27 Zeljko Dzakula Device and method for reinforced programmed learning
JP2013117688A (ja) * 2011-12-05 2013-06-13 Sony Corp 音響処理装置、音響処理方法、プログラム、記録媒体、サーバ装置、音響再生装置および音響処理システム
US10389766B2 (en) 2011-12-16 2019-08-20 Techexcel Inc. Method and system for information sharing
US10496250B2 (en) * 2011-12-19 2019-12-03 Bellevue Investments Gmbh & Co, Kgaa System and method for implementing an intelligent automatic music jam session
US8682087B2 (en) 2011-12-19 2014-03-25 Cisco Technology, Inc. System and method for depth-guided image filtering in a video conference environment
US20150347971A1 (en) * 2011-12-29 2015-12-03 Brandon E. D'Amore Systems and methods of creative work collaborative systems
US10007405B2 (en) 2011-12-29 2018-06-26 Brandon E. D'Amore Systems and methods of creative work collaborative systems
US9100444B2 (en) 2011-12-29 2015-08-04 Brandon E. D'Amore Systems and methods of creative work collaborative systems
JP5610235B2 (ja) * 2012-01-17 2014-10-22 カシオ計算機株式会社 録音再生装置およびプログラム
DE112013001340T5 (de) * 2012-03-06 2014-11-20 Apple Inc. Gemeinsame Netzwerk-Musik-Jam-Session und Aufzeichnung davon
WO2013134443A1 (en) * 2012-03-06 2013-09-12 Apple Inc. Systems and methods of note event adjustment
US10262644B2 (en) * 2012-03-29 2019-04-16 Smule, Inc. Computationally-assisted musical sequencing and/or composition techniques for social music challenge or competition
US8669456B2 (en) * 2012-04-26 2014-03-11 Avid Technology, Inc. Video export of a digital musical score
US9196242B1 (en) * 2012-05-29 2015-11-24 Soundhound, Inc. System and methods for offline audio recognition
US9020923B2 (en) * 2012-06-18 2015-04-28 Score Revolution, Llc Systems and methods to facilitate media search
US20130339853A1 (en) * 2012-06-18 2013-12-19 Ian Paul Hierons Systems and Method to Facilitate Media Search Based on Acoustic Attributes
CN103514182B (zh) 2012-06-19 2017-05-17 国际商业机器公司 音乐搜索方法与装置
US8997008B2 (en) 2012-07-17 2015-03-31 Pelicans Networks Ltd. System and method for searching through a graphic user interface
US9596386B2 (en) * 2012-07-24 2017-03-14 Oladas, Inc. Media synchronization
US10403252B2 (en) * 2012-07-31 2019-09-03 Fender Musical Instruments Corporation System and method for connecting and controlling musical related instruments over communication network
ES2948685T3 (es) * 2012-08-01 2023-09-15 Caldecott Music Group Colaboración de música distribuida
JP5783206B2 (ja) * 2012-08-14 2015-09-24 ヤマハ株式会社 音楽情報表示制御装置およびプログラム
WO2014028891A1 (en) * 2012-08-17 2014-02-20 Be Labs, Llc Music generator
JP5672280B2 (ja) * 2012-08-31 2015-02-18 カシオ計算機株式会社 演奏情報処理装置、演奏情報処理方法及びプログラム
US20140075306A1 (en) * 2012-09-12 2014-03-13 Randy Rega Music search and retrieval system
US9479887B2 (en) * 2012-09-19 2016-10-25 Nokia Technologies Oy Method and apparatus for pruning audio based on multi-sensor analysis
US9681154B2 (en) 2012-12-06 2017-06-13 Patent Capital Group System and method for depth-guided filtering in a video conference environment
US8921677B1 (en) 2012-12-10 2014-12-30 Frank Michael Severino Technologies for aiding in music composition
CN103885949B (zh) * 2012-12-19 2017-07-07 中国科学院声学研究所 一种基于歌词的歌曲检索系统及其检索方法
KR102212225B1 (ko) * 2012-12-20 2021-02-05 삼성전자주식회사 오디오 보정 장치 및 이의 오디오 보정 방법
US9158760B2 (en) 2012-12-21 2015-10-13 The Nielsen Company (Us), Llc Audio decoding with supplemental semantic audio recognition and report generation
WO2014100531A1 (en) * 2012-12-21 2014-06-26 Jamhub Corporation Track trapping and transfer
US9183849B2 (en) 2012-12-21 2015-11-10 The Nielsen Company (Us), Llc Audio matching with semantic audio recognition and report generation
US9195649B2 (en) 2012-12-21 2015-11-24 The Nielsen Company (Us), Llc Audio processing techniques for semantic audio recognition and report generation
CN104036227A (zh) * 2013-03-05 2014-09-10 联想移动通信科技有限公司 一种生成电子乐谱的方法和移动终端
US9728225B2 (en) * 2013-03-12 2017-08-08 Cyberlink Corp. Systems and methods for viewing instant updates of an audio waveform with an applied effect
US8927846B2 (en) * 2013-03-15 2015-01-06 Exomens System and method for analysis and creation of music
ITTO20130376A1 (it) * 2013-05-10 2014-11-11 Recwon S R L Metodo per la registrazione di una pluralità di file audio
WO2014183196A1 (en) * 2013-05-13 2014-11-20 David Robert Smith System for facilitating the collaborative creation of music
US9843621B2 (en) 2013-05-17 2017-12-12 Cisco Technology, Inc. Calendaring activities based on communication processing
JP2014228628A (ja) * 2013-05-21 2014-12-08 ヤマハ株式会社 演奏記録装置
US9224374B2 (en) * 2013-05-30 2015-12-29 Xiaomi Inc. Methods and devices for audio processing
US9857934B2 (en) 2013-06-16 2018-01-02 Jammit, Inc. Synchronized display and performance mapping of musical performances submitted from remote locations
EP2816549B1 (en) * 2013-06-17 2016-08-03 Yamaha Corporation User bookmarks by touching the display of a music score while recording ambient audio
GB201311240D0 (en) * 2013-06-25 2013-08-14 Godleywood Ltd System for providing an enviroment in which performers generate corresponding performances
US9251773B2 (en) * 2013-07-13 2016-02-02 Apple Inc. System and method for determining an accent pattern for a musical performance
US9620169B1 (en) * 2013-07-26 2017-04-11 Dreamtek, Inc. Systems and methods for creating a processed video output
US9798974B2 (en) 2013-09-19 2017-10-24 Microsoft Technology Licensing, Llc Recommending audio sample combinations
US9257954B2 (en) 2013-09-19 2016-02-09 Microsoft Technology Licensing, Llc Automatic audio harmonization based on pitch distributions
US9372925B2 (en) 2013-09-19 2016-06-21 Microsoft Technology Licensing, Llc Combining audio samples by automatically adjusting sample characteristics
US9280313B2 (en) * 2013-09-19 2016-03-08 Microsoft Technology Licensing, Llc Automatically expanding sets of audio samples
CN106233245B (zh) * 2013-10-30 2019-08-27 音乐策划公司 用于增强音频、使音频输入相符于音乐音调以及创作用于音频输入的和声音轨的系统和方法
US10271010B2 (en) 2013-10-31 2019-04-23 Shindig, Inc. Systems and methods for controlling the display of content
US9519792B1 (en) 2013-11-15 2016-12-13 Google Inc. Copyright protection
US9584567B2 (en) * 2014-03-04 2017-02-28 Victor Janeiro Skinner Method, system and program product for collaboration of video files
US9661043B2 (en) * 2014-03-10 2017-05-23 JamKazam, Inc. Packet rate control and related systems for interactive music systems
US9047854B1 (en) * 2014-03-14 2015-06-02 Topline Concepts, LLC Apparatus and method for the continuous operation of musical instruments
US9711181B2 (en) 2014-07-25 2017-07-18 Shindig. Inc. Systems and methods for creating, editing and publishing recorded videos
US9852216B2 (en) * 2014-10-10 2017-12-26 Harman International Industries, Incorporated Multiple distant musician audio loop recording apparatus and listening method
US10019987B2 (en) * 2014-12-30 2018-07-10 Paypal, Inc. Audible proximity messaging
US9752949B2 (en) * 2014-12-31 2017-09-05 General Electric Company System and method for locating engine noise
US20160187219A1 (en) * 2014-12-31 2016-06-30 General Electric Company Methods and systems to characterize noises sensed by a knock sensor
US9734410B2 (en) 2015-01-23 2017-08-15 Shindig, Inc. Systems and methods for analyzing facial expressions within an online classroom to gauge participant attentiveness
AU2015200410A1 (en) * 2015-01-28 2016-08-11 Context Systems Llp Online collaboration systems and methods
US11120816B2 (en) * 2015-02-01 2021-09-14 Board Of Regents, The University Of Texas System Natural ear
WO2016128795A1 (en) * 2015-02-11 2016-08-18 Isler Oscar System and method for simulating the conduction of a musical group
US20160290884A1 (en) * 2015-04-01 2016-10-06 General Electric Company Knock sensor network systems and methods for characterizing noises
US20160314509A1 (en) * 2015-04-24 2016-10-27 Minty Networks, LLC Audio uploading and sharing service
US11488569B2 (en) 2015-06-03 2022-11-01 Smule, Inc. Audio-visual effects system for augmentation of captured performance based on content thereof
US11032602B2 (en) 2017-04-03 2021-06-08 Smule, Inc. Audiovisual collaboration method with latency management for wide-area broadcast
CN106547797B (zh) * 2015-09-23 2019-07-05 腾讯科技(深圳)有限公司 音频生成方法和装置
US10854180B2 (en) 2015-09-29 2020-12-01 Amper Music, Inc. Method of and system for controlling the qualities of musical energy embodied in and expressed by digital music to be automatically composed and generated by an automated music composition and generation engine
US9721551B2 (en) 2015-09-29 2017-08-01 Amper Music, Inc. Machines, systems, processes for automated music composition and generation employing linguistic and/or graphical icon based musical experience descriptions
US9715870B2 (en) 2015-10-12 2017-07-25 International Business Machines Corporation Cognitive music engine using unsupervised learning
US9651921B1 (en) * 2016-03-04 2017-05-16 Google Inc. Metronome embedded in search results page and unaffected by lock screen transition
US9646587B1 (en) * 2016-03-09 2017-05-09 Disney Enterprises, Inc. Rhythm-based musical game for generative group composition
US11042927B2 (en) * 2016-04-21 2021-06-22 Skye Peters Electronic marketplace for creative works
US10607586B2 (en) 2016-05-05 2020-03-31 Jose Mario Fernandez Collaborative synchronized audio interface
US9959851B1 (en) 2016-05-05 2018-05-01 Jose Mario Fernandez Collaborative synchronized audio interface
US10133916B2 (en) 2016-09-07 2018-11-20 Steven M. Gottlieb Image and identity validation in video chat events
CN106446952B (zh) * 2016-09-28 2019-08-16 北京邮电大学 一种乐谱图像识别方法及装置
US10008190B1 (en) 2016-12-15 2018-06-26 Michael John Elson Network musical instrument
US10380983B2 (en) 2016-12-30 2019-08-13 Google Llc Machine learning to generate music from text
US10008188B1 (en) * 2017-01-31 2018-06-26 Kyocera Document Solutions Inc. Musical score generator
US11310538B2 (en) 2017-04-03 2022-04-19 Smule, Inc. Audiovisual collaboration system and method with latency management for wide-area broadcast and social media-type user interface mechanics
US10199070B2 (en) * 2017-04-03 2019-02-05 Adobe Inc. Digital audio data user interface customization based on user expertise, content type, or testing
EP3389028A1 (en) * 2017-04-10 2018-10-17 Sugarmusic S.p.A. Automatic music production from voice recording.
NL2018758B1 (en) 2017-04-20 2018-11-05 Univ Amsterdam Optical music recognition (OMR) assembly for converting sheet music
US9947304B1 (en) * 2017-05-09 2018-04-17 Francis Begue Spatial harmonic system and method
WO2018218034A1 (en) * 2017-05-25 2018-11-29 J. W. Pepper & Son, Inc. Sheet music search and discovery system
US10043502B1 (en) * 2017-07-18 2018-08-07 Vertical Craft, LLC Music composition tools on a single pane-of-glass
US10311843B2 (en) * 2017-07-18 2019-06-04 Vertical Craft Music composition tools on a single pane-of-glass
US10854181B2 (en) * 2017-07-18 2020-12-01 Vertical Craft, LLC Music composition tools on a single pane-of-glass
US10957297B2 (en) * 2017-07-25 2021-03-23 Louis Yoelin Self-produced music apparatus and method
KR101931087B1 (ko) * 2017-09-07 2018-12-20 주식회사 쿨잼컴퍼니 사용자 허밍 멜로디 기반 멜로디 녹음을 제공하기 위한 방법 및 이를 위한 장치
US10235898B1 (en) * 2017-09-12 2019-03-19 Yousician Oy Computer implemented method for providing feedback of harmonic content relating to music track
US10182093B1 (en) * 2017-09-12 2019-01-15 Yousician Oy Computer implemented method for providing real-time interaction between first player and second player to collaborate for musical performance over network
US20200402536A1 (en) * 2017-11-12 2020-12-24 Musico Ltd. Collaborative audio editing tools
US10504498B2 (en) * 2017-11-22 2019-12-10 Yousician Oy Real-time jamming assistance for groups of musicians
US11610568B2 (en) * 2017-12-18 2023-03-21 Bytedance Inc. Modular automated music production server
WO2019147492A2 (en) * 2018-01-23 2019-08-01 Synesthesia Corporation Audio sample playback unit
CN108319696A (zh) * 2018-02-02 2018-07-24 北京网梯科技发展有限公司 基于琴谱智能识别的音乐播放方法和系统
US10291670B1 (en) 2018-02-25 2019-05-14 CypherLive LLC Virtual cypher enterprise
US10218747B1 (en) * 2018-03-07 2019-02-26 Microsoft Technology Licensing, Llc Leveraging geographically proximate devices to reduce network traffic generated by digital collaboration
CN108805000B (zh) * 2018-04-09 2019-12-17 平安科技(深圳)有限公司 电子装置、基于深度学习的乐谱识别方法及存储介质
US10714065B2 (en) * 2018-06-08 2020-07-14 Mixed In Key Llc Apparatus, method, and computer-readable medium for generating musical pieces
US10911013B2 (en) 2018-07-05 2021-02-02 Comcast Cable Communications, Llc Dynamic audio normalization process
US10991349B2 (en) * 2018-07-16 2021-04-27 Samsung Electronics Co., Ltd. Method and system for musical synthesis using hand-drawn patterns/text on digital and non-digital surfaces
EP3833010A4 (en) 2018-08-01 2022-05-04 Beijing Microlive Vision Technology Co., Ltd VIDEO RECORDING METHOD AND APPARATUS
CN109600562B (zh) * 2018-08-01 2020-04-28 北京微播视界科技有限公司 用于录制视频的方法和装置
US10403251B1 (en) * 2018-08-08 2019-09-03 Joseph Robert Escamilla System and method of collectively producing music
US11258834B2 (en) * 2018-10-05 2022-02-22 Explain Everything, Inc. System and method for recording online collaboration
US20220256118A1 (en) 2018-10-05 2022-08-11 Explain Everything, Inc. System and method for recording online collaboration
CN109727590B (zh) * 2018-12-24 2020-09-22 成都嗨翻屋科技有限公司 基于循环神经网络的音乐生成方法及装置
US20210357445A1 (en) * 2018-12-31 2021-11-18 Audiobyte Llc Multimedia asset matching systems and methods
US10929092B1 (en) 2019-01-28 2021-02-23 Collabra LLC Music network for collaborative sequential musical production
CN110309349A (zh) * 2019-04-08 2019-10-08 浙江工业大学 一种基于面部表情识别和循环神经网络的音乐生成方法
CN110085263B (zh) * 2019-04-28 2021-08-06 东华大学 一种音乐情感分类和机器作曲方法
US10929684B2 (en) * 2019-05-17 2021-02-23 Adobe Inc. Intelligently generating digital note compilations from digital video
US10607500B1 (en) * 2019-05-21 2020-03-31 International Business Machines Corporation Providing background music tempo to accompany procedural instructions
US10891872B1 (en) 2019-06-18 2021-01-12 School of Rock, LLC Method and apparatus of music education
US12165535B2 (en) 2019-06-18 2024-12-10 School of Rock, LLC System and method of facilitating live jam session with song recommendation engine to recommend a song to be played
US10629176B1 (en) * 2019-06-21 2020-04-21 Obeebo Labs Ltd. Systems, devices, and methods for digital representations of music
CN110517227A (zh) * 2019-07-29 2019-11-29 数字广东网络建设有限公司 图像隐藏信息检测的方法、装置、计算机设备和存储介质
WO2021050902A1 (en) * 2019-09-11 2021-03-18 John Nader System and method for distributed musician synchronized performances
CN110795593A (zh) * 2019-10-12 2020-02-14 百度在线网络技术(北京)有限公司 语音包的推荐方法、装置、电子设备和存储介质
US10964299B1 (en) 2019-10-15 2021-03-30 Shutterstock, Inc. Method of and system for automatically generating digital performances of music compositions using notes selected from virtual musical instruments based on the music-theoretic states of the music compositions
US11037538B2 (en) 2019-10-15 2021-06-15 Shutterstock, Inc. Method of and system for automated musical arrangement and musical instrument performance style transformation supported within an automated music performance system
US11024275B2 (en) 2019-10-15 2021-06-01 Shutterstock, Inc. Method of digitally performing a music composition using virtual musical instruments having performance logic executing within a virtual musical instrument (VMI) library management system
WO2021108505A1 (en) * 2019-11-26 2021-06-03 Complete Cue Sheets Llc System and method for generating cue sheets
CN111309961B (zh) * 2020-02-12 2024-04-02 深圳市腾讯计算机系统有限公司 歌曲封面生成方法、装置、计算机可读存储介质和设备
EP4115628A1 (en) * 2020-03-06 2023-01-11 algoriddim GmbH Playback transition from first to second audio track with transition functions of decomposed signals
EP4115630A1 (en) * 2020-03-06 2023-01-11 algoriddim GmbH Method, device and software for controlling timing of audio data
US11086586B1 (en) * 2020-03-13 2021-08-10 Auryn, LLC Apparatuses and methodologies relating to the generation and selective synchronized display of musical and graphic information on one or more devices capable of displaying musical and graphic information
US20210321648A1 (en) * 2020-04-16 2021-10-21 John Martin Acoustic treatment of fermented food products
EP4145439A4 (en) * 2020-05-01 2023-10-11 Sony Group Corporation INFORMATION PROCESSING METHOD, INFORMATION PROCESSING APPARATUS AND PROGRAM
CN111787353A (zh) * 2020-05-13 2020-10-16 北京达佳互联信息技术有限公司 多方音频的处理方法、装置、电子设备及存储介质
US11546393B2 (en) 2020-07-10 2023-01-03 Mark Goldstein Synchronized performances for remotely located performers
CN112465679B (zh) * 2020-09-28 2023-10-31 青岛大学 一种钢琴学习与创作系统及方法
US11893898B2 (en) 2020-12-02 2024-02-06 Joytunes Ltd. Method and apparatus for an adaptive and interactive teaching of playing a musical instrument
US11900825B2 (en) 2020-12-02 2024-02-13 Joytunes Ltd. Method and apparatus for an adaptive and interactive teaching of playing a musical instrument
US12243437B2 (en) * 2020-12-02 2025-03-04 Simply Ltd. Crowd-based device configuration selection of a music teaching system
US11972693B2 (en) 2020-12-02 2024-04-30 Joytunes Ltd. Method, device, system and apparatus for creating and/or selecting exercises for learning playing a music instrument
CN112529106A (zh) * 2020-12-28 2021-03-19 平安普惠企业管理有限公司 视觉设计原稿的生成方法、装置、设备及存储介质
US12266331B2 (en) * 2021-01-03 2025-04-01 Mark Lawrence Palmer Methods, systems, apparatuses, and devices for facilitating the interactive creation of live music by multiple users
US20220237541A1 (en) * 2021-01-17 2022-07-28 Mary Elizabeth Morkoski System for automating a collaborative network of musicians in the field of original composition and recording
CN113593502B (zh) * 2021-07-26 2024-04-30 深圳市芒果未来科技有限公司 一种基于音视频演奏示范的交互式乐谱展示方法及系统
US12314331B2 (en) * 2021-09-14 2025-05-27 Muso.Ai Inc. Obtaining details regarding an image based on search intent and determining royalty distributions and credits for projects
US12293746B2 (en) * 2021-10-29 2025-05-06 Soundtrap Ab Systems and methods for generating a mixed audio file in a digital audio workstation
US11740862B1 (en) * 2022-11-22 2023-08-29 Algoriddim Gmbh Method and system for accelerated decomposing of audio data using intermediate data
US12477158B2 (en) * 2022-12-08 2025-11-18 LightTwist Inc. System for cloud-based shared virtual studio
WO2025260183A1 (en) * 2024-06-17 2025-12-26 Collsong Inc. A system for creation of collaborative music and method thereof

Family Cites Families (152)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4014237A (en) * 1972-03-01 1977-03-29 Milde Karl F Jr Musical note detecting apparatus
US4028985A (en) * 1976-02-17 1977-06-14 Merritt Lauren V Pitch determination and display system
US4399732A (en) * 1981-08-28 1983-08-23 Stanley Rothschild Pitch identification device
US4999773A (en) * 1983-11-15 1991-03-12 Manfred Clynes Technique for contouring amplitude of musical notes based on their relationship to the succeeding note
US4665790A (en) * 1985-10-09 1987-05-19 Stanley Rothschild Pitch identification device
US4926737A (en) * 1987-04-08 1990-05-22 Casio Computer Co., Ltd. Automatic composer using input motif information
JPH0196700A (ja) 1987-10-08 1989-04-14 Casio Comput Co Ltd 電子楽器の入力制御装置
JP2712346B2 (ja) * 1987-10-14 1998-02-10 カシオ計算機株式会社 周波数制御装置
US4945804A (en) * 1988-01-14 1990-08-07 Wenger Corporation Method and system for transcribing musical information including method and system for entering rhythmic information
US5038658A (en) * 1988-02-29 1991-08-13 Nec Home Electronics Ltd. Method for automatically transcribing music and apparatus therefore
US4960031A (en) * 1988-09-19 1990-10-02 Wenger Corporation Method and apparatus for representing musical information
US5020101A (en) * 1989-04-10 1991-05-28 Gregory R. Brotz Musicians telephone interface
JPH03249799A (ja) 1990-02-28 1991-11-07 Yamaha Corp 楽譜認識装置
US5036658A (en) 1990-03-05 1991-08-06 The United States Of America As Represented By The Secretary Of The Army Pressure relief device for solid propellant motors subjected to high external temperatures
JP2890831B2 (ja) 1990-11-28 1999-05-17 ヤマハ株式会社 Midiコード作成装置
US5270475A (en) 1991-03-04 1993-12-14 Lyrrus, Inc. Electronic music system
US5292125A (en) * 1991-05-31 1994-03-08 Hochstein Peter A Apparatus and method for electrically connecting remotely located video games
US5864631A (en) * 1992-08-03 1999-01-26 Yamaha Corporation Method and apparatus for musical score recognition with quick processing of image data
US5325423A (en) * 1992-11-13 1994-06-28 Multimedia Systems Corporation Interactive multimedia communication system
JP3507090B2 (ja) * 1992-12-25 2004-03-15 キヤノン株式会社 音声処理装置及びその方法
US5544228A (en) * 1993-09-27 1996-08-06 The Walt Disney Company Method and apparatus for transmission of full frequency digital audio
TW250558B (en) * 1993-10-20 1995-07-01 Yamaha Corp Sheet music recognition device
US5569038A (en) * 1993-11-08 1996-10-29 Tubman; Louis Acoustical prompt recording system and method
DE4343411C2 (de) * 1993-12-18 2001-05-17 Blue Chip Music Gmbh Gitarren-Signalanalyseeinrichtung
US5488196A (en) * 1994-01-19 1996-01-30 Zimmerman; Thomas G. Electronic musical re-performance and editing system
US5704007A (en) 1994-03-11 1997-12-30 Apple Computer, Inc. Utilization of multiple voice sources in a speech synthesizer
JP3430630B2 (ja) * 1994-05-02 2003-07-28 ヤマハ株式会社 カラオケ演奏用双方向ディジタル通信システム
US5768350A (en) * 1994-09-19 1998-06-16 Phylon Communications, Inc. Real-time and non-real-time data multplexing over telephone lines
US5685775A (en) * 1994-10-28 1997-11-11 International Business Machines Corporation Networking video games over telephone network
US5646361A (en) * 1995-08-04 1997-07-08 Morrow; Michael Laser emitting visual display for a music system
US5792971A (en) * 1995-09-29 1998-08-11 Opcode Systems, Inc. Method and system for editing digital audio information with music-like parameters
TW333644B (en) 1995-10-30 1998-06-11 Victor Company Of Japan The method for recording musical data and its reproducing apparatus
US5695400A (en) * 1996-01-30 1997-12-09 Boxer Jam Productions Method of managing multi-player game playing over a network
US5820463A (en) * 1996-02-06 1998-10-13 Bell Atlantic Network Services, Inc. Method and apparatus for multi-player gaming over a network
JP3424787B2 (ja) 1996-03-12 2003-07-07 ヤマハ株式会社 演奏情報検出装置
US5983280A (en) 1996-03-29 1999-11-09 Light & Sound Design, Ltd. System using standard ethernet frame format for communicating MIDI information over an ethernet network
US7098392B2 (en) 1996-07-10 2006-08-29 Sitrick David H Electronic image visualization system and communication methodologies
US7423213B2 (en) 1996-07-10 2008-09-09 David Sitrick Multi-dimensional transformation systems and display communication architecture for compositions and derivations thereof
US7297856B2 (en) * 1996-07-10 2007-11-20 Sitrick David H System and methodology for coordinating musical communication and display
US7074999B2 (en) 1996-07-10 2006-07-11 Sitrick David H Electronic image visualization system and management and communication methodologies
US5728960A (en) * 1996-07-10 1998-03-17 Sitrick; David H. Multi-dimensional transformation systems and display communication architecture for musical compositions
US6084168A (en) 1996-07-10 2000-07-04 Sitrick; David H. Musical compositions communication system, architecture and methodology
US6067566A (en) * 1996-09-20 2000-05-23 Laboratory Technologies Corporation Methods and apparatus for distributing live performances on MIDI devices via a non-real-time network protocol
DE19649296C2 (de) * 1996-11-28 2002-01-17 Blue Chip Music Gmbh Verfahren zur Tonhöhenerkennung bei zupf- oder schlagerregten Saiteninstrumenten
EP1533785A3 (en) 1996-12-27 2007-05-16 Yamaha Corporation Real time communication of musical tone information
US5808225A (en) * 1996-12-31 1998-09-15 Intel Corporation Compressing music into a digital format
US6036658A (en) * 1997-07-10 2000-03-14 Leet; Richard A. Cervical tissue sampling device and method
US5886274A (en) * 1997-07-11 1999-03-23 Seer Systems, Inc. System and method for generating, distributing, storing and performing musical work files
US6140568A (en) * 1997-11-06 2000-10-31 Innovative Music Systems, Inc. System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal
US6175872B1 (en) * 1997-12-12 2001-01-16 Gte Internetworking Incorporated Collaborative environment for syncronizing audio from remote devices
TW352206U (en) * 1997-12-30 1999-02-01 First Int Computer Inc Structure for hidden type image picking apparatus of notebook computer
US6121530A (en) * 1998-03-19 2000-09-19 Sonoda; Tomonari World Wide Web-based melody retrieval system with thresholds determined by using distribution of pitch and span of notes
US6201176B1 (en) * 1998-05-07 2001-03-13 Canon Kabushiki Kaisha System and method for querying a music database
US7003120B1 (en) 1998-10-29 2006-02-21 Paul Reed Smith Guitars, Inc. Method of modifying harmonic content of a complex waveform
US6766288B1 (en) * 1998-10-29 2004-07-20 Paul Reed Smith Guitars Fast find fundamental method
US6316712B1 (en) 1999-01-25 2001-11-13 Creative Technology Ltd. Method and apparatus for tempo and downbeat detection and alteration of rhythm in a musical segment
JP3582396B2 (ja) * 1999-03-17 2004-10-27 ヤマハ株式会社 楽譜編集装置および記録媒体
US6212534B1 (en) * 1999-05-13 2001-04-03 X-Collaboration Software Corp. System and method for facilitating collaboration in connection with generating documents among a plurality of operators using networked computer systems
US6156964A (en) 1999-06-03 2000-12-05 Sahai; Anil Apparatus and method of displaying music
JP3675287B2 (ja) * 1999-08-09 2005-07-27 ヤマハ株式会社 演奏データ作成装置
US6598074B1 (en) 1999-09-23 2003-07-22 Rocket Network, Inc. System and method for enabling multimedia production collaboration over a network
US6423893B1 (en) 1999-10-15 2002-07-23 Etonal Media, Inc. Method and system for electronically creating and publishing music instrument instructional material using a computer network
US6188010B1 (en) * 1999-10-29 2001-02-13 Sony Corporation Music search by melody input
US6353174B1 (en) * 1999-12-10 2002-03-05 Harmonix Music Systems, Inc. Method and apparatus for facilitating group musical interaction over a network
US6678680B1 (en) * 2000-01-06 2004-01-13 Mark Woo Music search engine
JP3758450B2 (ja) * 2000-01-10 2006-03-22 ヤマハ株式会社 曲データ作成のためのサーバ装置、クライアント装置及び記録媒体
JP3496620B2 (ja) * 2000-03-22 2004-02-16 ヤマハ株式会社 楽譜データ表示装置、方法及び記録媒体
US6545209B1 (en) 2000-07-05 2003-04-08 Microsoft Corporation Music content characteristic identification and matching
JP3707364B2 (ja) 2000-07-18 2005-10-19 ヤマハ株式会社 自動作曲装置、方法及び記録媒体
US6323412B1 (en) 2000-08-03 2001-11-27 Mediadome, Inc. Method and apparatus for real time tempo detection
KR100516403B1 (ko) * 2000-10-23 2005-09-23 에누티티 코뮤니케-숀즈 가부시키가이샤 악곡인식방법 및 시스템 및 악곡인식 프로그램을 저장한기억매체 및 커머셜 인식방법 및 시스템 및 커머셜 인식프로그램을 저장한 기억매체
JP3552667B2 (ja) * 2000-12-19 2004-08-11 ヤマハ株式会社 通信システム及び通信プログラムを記録した記録媒体
US6898637B2 (en) * 2001-01-10 2005-05-24 Agere Systems, Inc. Distributed audio collaboration method and apparatus
DE10164686B4 (de) 2001-01-13 2007-05-31 Native Instruments Software Synthesis Gmbh Automatische Erkennung und Anpassung von Tempo und Phase von Musikstücken und darauf aufbauender interaktiver Musik-Abspieler
WO2003005242A1 (en) * 2001-03-23 2003-01-16 Kent Ridge Digital Labs Method and system of representing musical information in a digital representation for use in content-based multimedia information retrieval
DE10117870B4 (de) 2001-04-10 2005-06-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Überführen eines Musiksignals in eine Noten-basierte Beschreibung und Verfahren und Vorrichtung zum Referenzieren eines Musiksignals in einer Datenbank
US6482087B1 (en) * 2001-05-14 2002-11-19 Harmonix Music Systems, Inc. Method and apparatus for facilitating group musical interaction over a network
US7223913B2 (en) * 2001-07-18 2007-05-29 Vmusicsystems, Inc. Method and apparatus for sensing and displaying tablature associated with a stringed musical instrument
US7295977B2 (en) * 2001-08-27 2007-11-13 Nec Laboratories America, Inc. Extracting classifying data in music from an audio bitstream
US6747201B2 (en) * 2001-09-26 2004-06-08 The Regents Of The University Of Michigan Method and system for extracting melodic patterns in a musical piece and computer-readable storage medium having a program for executing the method
US6798866B1 (en) * 2001-12-12 2004-09-28 Bellsouth Intellectual Property Corp. System and method for verifying central office wiring associated with line sharing
US20050190199A1 (en) * 2001-12-21 2005-09-01 Hartwell Brown Apparatus and method for identifying and simultaneously displaying images of musical notes in music and producing the music
US20030140769A1 (en) * 2002-01-30 2003-07-31 Muzik Works Technologies Inc. Method and system for creating and performing music electronically via a communications network
US6653545B2 (en) * 2002-03-01 2003-11-25 Ejamming, Inc. Method and apparatus for remote real time collaborative music performance
US6768046B2 (en) * 2002-04-09 2004-07-27 International Business Machines Corporation Method of generating a link between a note of a digital score and a realization of the score
US7053291B1 (en) * 2002-05-06 2006-05-30 Joseph Louis Villa Computerized system and method for building musical licks and melodies
US7589271B2 (en) 2002-06-11 2009-09-15 Virtuosoworks, Inc. Musical notation system
US6809246B2 (en) * 2002-08-30 2004-10-26 Michael J. Errico Electronic music display device
AU2003275089A1 (en) * 2002-09-19 2004-04-08 William B. Hudak Systems and methods for creation and playback performance
WO2004034375A1 (en) * 2002-10-11 2004-04-22 Matsushita Electric Industrial Co. Ltd. Method and apparatus for determining musical notes from sounds
JP4313563B2 (ja) * 2002-12-04 2009-08-12 パイオニア株式会社 楽曲検索装置及び方法
GB0229940D0 (en) * 2002-12-20 2003-01-29 Koninkl Philips Electronics Nv Audio signal analysing method and apparatus
WO2004057495A1 (en) 2002-12-20 2004-07-08 Koninklijke Philips Electronics N.V. Query by indefinite expressions
US6747291B1 (en) 2003-01-10 2004-06-08 The United States Of America As Represented By The Secretary Of The Air Force Ohmic contacts on p-type silicon carbide using carbon films
JP3709991B2 (ja) 2003-01-17 2005-10-26 株式会社河合楽器製作所 楽譜認識装置
US7272551B2 (en) * 2003-02-24 2007-09-18 International Business Machines Corporation Computational effectiveness enhancement of frequency domain pitch estimators
US7227072B1 (en) * 2003-05-16 2007-06-05 Microsoft Corporation System and method for determining the similarity of musical recordings
US7323629B2 (en) * 2003-07-16 2008-01-29 Univ Iowa State Res Found Inc Real time music recognition and display system
US7723602B2 (en) * 2003-08-20 2010-05-25 David Joseph Beckford System, computer program and method for quantifying and analyzing musical intellectual property
JP4089582B2 (ja) * 2003-09-30 2008-05-28 ヤマハ株式会社 電子音楽装置の設定情報編集システム、編集装置用プログラム、および、電子音楽装置
US20050086052A1 (en) * 2003-10-16 2005-04-21 Hsuan-Huei Shih Humming transcription system and methodology
JP4305153B2 (ja) * 2003-12-04 2009-07-29 ヤマハ株式会社 音楽セッション支援方法、音楽セッション用楽器
US8535236B2 (en) 2004-03-19 2013-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for analyzing a sound signal using a physiological ear model
DE102004033867B4 (de) 2004-07-13 2010-11-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zur rhythmischen Aufbereitung von Audiosignalen
DE102004033829B4 (de) 2004-07-13 2010-12-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zur Erzeugung einer Polyphonen Melodie
US7371954B2 (en) * 2004-08-02 2008-05-13 Yamaha Corporation Tuner apparatus for aiding a tuning of musical instrument
JP4594681B2 (ja) * 2004-09-08 2010-12-08 ソニー株式会社 音声信号処理装置および音声信号処理方法
US7230176B2 (en) * 2004-09-24 2007-06-12 Nokia Corporation Method and apparatus to modify pitch estimation function in acoustic signal musical note pitch extraction
JP2006106818A (ja) * 2004-09-30 2006-04-20 Toshiba Corp 音楽検索装置、音楽検索方法及び音楽検索プログラム
US7193148B2 (en) * 2004-10-08 2007-03-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an encoded rhythmic pattern
US7598447B2 (en) * 2004-10-29 2009-10-06 Zenph Studios, Inc. Methods, systems and computer program products for detecting musical notes in an audio signal
US7297858B2 (en) 2004-11-30 2007-11-20 Andreas Paepcke MIDIWan: a system to enable geographically remote musicians to collaborate
CA2489256A1 (en) * 2004-12-06 2006-06-06 Christoph Both System and method for video assisted music instrument collaboration over distance
CN101103386A (zh) * 2004-12-15 2008-01-09 缪斯艾米股份有限公司 用于乐谱捕捉和带同步呈现的合成音频演奏的系统与方法
KR100659884B1 (ko) * 2005-01-07 2006-12-20 엘지전자 주식회사 음악에서의 비브라토 자동 검출방법
JP4670423B2 (ja) 2005-03-24 2011-04-13 ヤマハ株式会社 音楽情報分析及び表示装置及びプログラム
WO2006132599A1 (en) 2005-06-07 2006-12-14 Matsushita Electric Industrial Co., Ltd. Segmenting a humming signal into musical notes
US20060293089A1 (en) 2005-06-22 2006-12-28 Magix Ag System and method for automatic creation of digitally enhanced ringtones for cellphones
US20070044639A1 (en) * 2005-07-11 2007-03-01 Farbood Morwaread M System and Method for Music Creation and Distribution Over Communications Network
KR100735444B1 (ko) * 2005-07-18 2007-07-04 삼성전자주식회사 오디오데이터 및 악보이미지 추출방법
WO2007010637A1 (ja) * 2005-07-19 2007-01-25 Kabushiki Kaisha Kawai Gakki Seisakusho テンポ検出装置、コード名検出装置及びプログラム
JP4672474B2 (ja) * 2005-07-22 2011-04-20 株式会社河合楽器製作所 自動採譜装置及びプログラム
JP4940588B2 (ja) 2005-07-27 2012-05-30 ソニー株式会社 ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法
US7518051B2 (en) * 2005-08-19 2009-04-14 William Gibbens Redmann Method and apparatus for remote real time collaborative music performance and recording thereof
JP3913772B2 (ja) * 2005-08-24 2007-05-09 松下電器産業株式会社 音識別装置
US7518053B1 (en) 2005-09-01 2009-04-14 Texas Instruments Incorporated Beat matching for portable audio
US7774078B2 (en) * 2005-09-16 2010-08-10 Sony Corporation Method and apparatus for audio data analysis in an audio player
US7912232B2 (en) * 2005-09-30 2011-03-22 Aaron Master Method and apparatus for removing or isolating voice or instruments on stereo recordings
CN100370437C (zh) * 2005-09-30 2008-02-20 迈世亚(北京)科技有限公司 音乐数据转录的方法
US7853342B2 (en) * 2005-10-11 2010-12-14 Ejamming, Inc. Method and apparatus for remote real time collaborative acoustic performance and recording thereof
JP4622808B2 (ja) * 2005-10-28 2011-02-02 日本ビクター株式会社 楽曲分類装置、楽曲分類方法、楽曲分類プログラム
EP1785891A1 (en) * 2005-11-09 2007-05-16 Sony Deutschland GmbH Music information retrieval using a 3D search algorithm
KR100715949B1 (ko) * 2005-11-11 2007-05-08 삼성전자주식회사 고속 음악 무드 분류 방법 및 그 장치
US7834260B2 (en) * 2005-12-14 2010-11-16 Jay William Hardesty Computer analysis and manipulation of musical structure, methods of production and uses thereof
US20070163428A1 (en) * 2006-01-13 2007-07-19 Salter Hal C System and method for network communication of music data
KR100822376B1 (ko) * 2006-02-23 2008-04-17 삼성전자주식회사 곡명을 이용한 음악 주제 분류 방법 및 시스템
US7518052B2 (en) * 2006-03-17 2009-04-14 Microsoft Corporation Musical theme searching
US20070245881A1 (en) * 2006-04-04 2007-10-25 Eran Egozy Method and apparatus for providing a simulated band experience including online interaction
US7790975B2 (en) 2006-06-30 2010-09-07 Avid Technologies Europe Limited Synchronizing a musical score with a source of time-based information
JP4672613B2 (ja) 2006-08-09 2011-04-20 株式会社河合楽器製作所 テンポ検出装置及びテンポ検出用コンピュータプログラム
US7645929B2 (en) 2006-09-11 2010-01-12 Hewlett-Packard Development Company, L.P. Computational music-tempo estimation
US8079907B2 (en) * 2006-11-15 2011-12-20 Harmonix Music Systems, Inc. Method and apparatus for facilitating group musical interaction over a network
CN101558441A (zh) * 2006-12-12 2009-10-14 皇家飞利浦电子股份有限公司 乐曲系统和控制乐曲的生成的方法
US7579541B2 (en) 2006-12-28 2009-08-25 Texas Instruments Incorporated Automatic page sequencing and other feedback action based on analysis of audio performance data
WO2008095190A2 (en) * 2007-02-01 2008-08-07 Museami, Inc. Music transcription
US7732703B2 (en) 2007-02-05 2010-06-08 Ediface Digital, Llc. Music processing system including device for converting guitar sounds to MIDI commands
WO2008101130A2 (en) * 2007-02-14 2008-08-21 Museami, Inc. Music-based search engine
US7649136B2 (en) * 2007-02-26 2010-01-19 Yamaha Corporation Music reproducing system for collaboration, program reproducer, music data distributor and program producer
WO2008113120A1 (en) * 2007-03-18 2008-09-25 Igruuv Pty Ltd File creation process, file format and file playback apparatus enabling advanced audio interaction and collaboration capabilities
US7674970B2 (en) 2007-05-17 2010-03-09 Brian Siu-Fung Ma Multifunctional digital music display device
US8058544B2 (en) * 2007-09-21 2011-11-15 The University Of Western Ontario Flexible music composition engine
US20090171465A1 (en) * 2007-12-28 2009-07-02 Boston Scientific Scimed, Inc. Polymeric Regions For Implantable Or Insertable Medical Devices

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150244A (ja) * 2011-01-19 2012-08-09 Yahoo Japan Corp 楽曲レコメンド装置、方法及びプログラム
JP2016136251A (ja) * 2015-01-20 2016-07-28 ハーマン インターナショナル インダストリーズ インコーポレイテッド 音楽コンテンツ及びリアルタイム音楽伴奏の自動採譜
JP2020109918A (ja) * 2019-01-07 2020-07-16 ヤマハ株式会社 映像制御システム、及び映像制御方法
WO2020145209A1 (ja) * 2019-01-07 2020-07-16 ヤマハ株式会社 映像制御システム、及び映像制御方法
US20210335331A1 (en) * 2019-01-07 2021-10-28 Yamaha Corporation Image control system and method for controlling image
JP7226709B2 (ja) 2019-01-07 2023-02-21 ヤマハ株式会社 映像制御システム、及び映像制御方法
US12142250B2 (en) * 2019-01-07 2024-11-12 Yamaha Corporation Image control system and method for controlling image
WO2025033250A1 (ja) * 2023-08-08 2025-02-13 ソニーグループ株式会社 情報処理システム、情報処理方法および端末装置

Also Published As

Publication number Publication date
US20080190271A1 (en) 2008-08-14
EP2122510A2 (en) 2009-11-25
US20080190272A1 (en) 2008-08-14
CN102867526A (zh) 2013-01-09
JP2010518459A (ja) 2010-05-27
WO2008101130A2 (en) 2008-08-21
EP2122509A1 (en) 2009-11-25
WO2008101130A3 (en) 2008-10-02
US8035020B2 (en) 2011-10-11
US7838755B2 (en) 2010-11-23
US7714222B2 (en) 2010-05-11
US20100212478A1 (en) 2010-08-26
WO2008101126A1 (en) 2008-08-21

Similar Documents

Publication Publication Date Title
US7838755B2 (en) Music-based search engine
US6528715B1 (en) Music search by interactive graphical specification with audio feedback
CN101657817A (zh) 基于音乐的搜索引擎
Orio Music retrieval: A tutorial and review
Schedl et al. Music information retrieval: Recent developments and applications
CN102610222B (zh) 音乐转录的方法,系统和装置
Lidy et al. On the suitability of state-of-the-art music information retrieval methods for analyzing, categorizing and accessing non-western and ethnic music collections
US10600397B2 (en) Musical score generator
WO2002047064A1 (en) Method for analyzing music using sounds of instruments
KR100512143B1 (ko) 멜로디 기반 음악 검색방법과 장치
Duggan Machine annotation of traditional Irish dance music
Lu et al. A Novel Piano Arrangement Timbre Intelligent Recognition System Using Multilabel Classification Technology and KNN Algorithm
JPH06202621A (ja) 楽曲演奏情報を利用した楽曲検索装置
Fremerey SyncPlayer–a Framework for Content-Based Music Navigation
Wang Automatic Classification of Playing Techniques in Guitar Pro Songs
KR102907945B1 (ko) Ai 기반 미디데이터 추출 솔루션 제공 시스템
Godøy et al. Classifying music-related actions
JP6424907B2 (ja) 演奏情報検索方法を実現するためのプログラム、当該演奏情報検索方法および演奏情報検索装置
Brené et al. How musical instrumentation affects perceptual identification of musical genres
JP2007240552A (ja) 楽器音認識方法、楽器アノテーション方法、及び楽曲検索方法
CN115132154A (zh) 信息处理方法、信息处理装置、演奏数据显示系统及记录介质
JP2011158516A (ja) 自動編曲システム、および、自動編曲方法
Rauhala Advanced techniques for management of personal digital music libraries
Poel et al. A machine learning approach for generating expressive musical transcriptions
McDonagh et al. Multimedia Information Retrieval: MIDI as a format for Content Based Retrieval of Audio

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110510