JPH11184887A - Device for storing and retrieving digital information - Google Patents
Device for storing and retrieving digital informationInfo
- Publication number
- JPH11184887A JPH11184887A JP9357106A JP35710697A JPH11184887A JP H11184887 A JPH11184887 A JP H11184887A JP 9357106 A JP9357106 A JP 9357106A JP 35710697 A JP35710697 A JP 35710697A JP H11184887 A JPH11184887 A JP H11184887A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- identification code
- storage
- digital information
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 abstract description 20
- 238000000034 method Methods 0.000 description 21
- 238000001514 detection method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- DZRJLJPPUJADOO-UHFFFAOYSA-N chaetomin Natural products CN1C(=O)C2(Cc3cn(C)c4ccccc34)SSC1(CO)C(=O)N2C56CC78SSC(CO)(N(C)C7=O)C(=O)N8C5Nc9ccccc69 DZRJLJPPUJADOO-UHFFFAOYSA-N 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は,例えば音楽や画像
などのディジタル情報を記憶・再生すると共に,上記デ
ィジタル情報に音声によるインデックス(識別符号)を
付加することにより,音声による指示に基づいてディジ
タル情報の検索を行う機能を有するディジタル情報記憶
検索装置に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for storing and reproducing digital information such as music and images, and adding a voice index (identification code) to the digital information so as to generate a digital signal based on a voice instruction. The present invention relates to a digital information storage and retrieval device having a function of retrieving information.
【0002】[0002]
【従来の技術】近年,メモリの小型・大容量化,データ
圧縮技術の高能率化などのハード・ソフト両面での技術
の飛躍的な進歩により,音声,オーディオ,静止画,動
画などの情報をディジタルデータとして大量に記憶し,
再生できる記憶再生装置を,極めて小型に構成すること
が可能となっている。例えば,電話帯域程度の音声品質
であれば,CELP方式にて効率的に圧縮でき,「ITU-
T Recommendation G.729」で規格化されているCS−A
CELPでは,8Kbpsという低いビットレートにで
きる。また,「日系エレクトロニクス1997年4月2
1日号」には,CDクオリティーのオーディオデータで
も80Kbps程度に圧縮できるTwinVQ規格が紹
介されており,例えば64Mbitのメモリであれば数
個でCD1枚分程度の音楽データが記憶できてしまう。
このように,例えばPCMCIA規格のカードのような
小型サイズでの記憶再生装置の構成が可能となってき
た。しかしながら,装置本体の小型化により,装置の携
帯性が向上する反面,スペースの関係で操作ボタンや表
示部も小型化され,操作性が悪くなるという問題点があ
る。特に,所望のデータ位置の検索,頭出しなど,複雑
な操作を必要とする場合にこの問題は深刻である。この
ような問題を解決する一つの手段として,複雑なボタン
操作を必要としない音声認識の技術を用いることが有効
である。そこで,上記音声認識の技術を利用した記憶再
生装置が,例えば特許第2639387号,特開昭59
−38987号公報に提案されている。これらの記憶再
生装置は,楽曲,音声データ等の先頭に音声によるイン
デックスを付加しておき,再生時に上記所望のインデッ
クスに対応する音声を入力することにより,その音声と
一致するインデックス位置の検索を行い,その位置から
の再生を自動的に行うというものである。2. Description of the Related Art In recent years, rapid development of technology in both hardware and software, such as downsizing and increasing the capacity of memory and increasing the efficiency of data compression technology, has enabled information such as voice, audio, still images, and moving images. It is stored in large quantities as digital data,
It is possible to make the storage / playback device capable of playback extremely small. For example, if the voice quality is equivalent to that of the telephone band, it can be efficiently compressed by the CELP method.
CS-A standardized by "T Recommendation G.729"
With CELP, the bit rate can be as low as 8 Kbps. Also, "Japanese Electronics April 2, 1997
The 1st issue introduces the TwinVQ standard which can compress even CD-quality audio data to about 80 Kbps. For example, if a 64 Mbit memory is used, several pieces of music data for one CD can be stored.
In this way, it has become possible to configure a storage / playback apparatus in a small size such as a PCMCIA standard card. However, while the portability of the device is improved due to the miniaturization of the device main body, the operation buttons and the display unit are also reduced in size due to the space, and there is a problem that the operability is deteriorated. This problem is particularly serious when complicated operations such as searching for a desired data position and cueing are required. As one means for solving such a problem, it is effective to use a voice recognition technique that does not require complicated button operations. Therefore, a storage / reproducing apparatus using the above-described voice recognition technology is disclosed in, for example, Japanese Patent No. 2639387,
No. 3,389,872. These storage / playback apparatuses add a voice index to the beginning of music, voice data, etc., and input a voice corresponding to the desired index during playback, thereby searching for an index position that matches the voice. Then, playback from that position is performed automatically.
【0003】[0003]
【発明が解決しようとする課題】しかしながら,現在の
音声認識技術では,通常の使用環境のもとで背景雑音な
どの影響を受けずに100%正確な認識を行うことは不
可能である。従って,周囲の環境によっては音声の認識
精度が低下し,上記のような頭出し動作においても実使
用時には誤動作が多く,その度に音声を入力して操作を
やり直さなければならなかった。また,やり直しても正
確に認識されるという保証はない。尚,上記特許第26
39387号に係る発明では,同じ音声で5回登録を行
うなどして認識率を高めるようにしているが,利用者に
とってはその登録操作が煩わしい上に,周囲の環境変化
による誤認識には対応できない。また,異なる楽曲や音
声データに全く同じ音声インデックスを登録した場合に
は,それらを区別できないため,思うように動作させる
ことができなかった。従って,例えば上記特許第263
9387号に係る発明では,音声インデックスの最後に
数字を発音するなどして各音声インデックスを必ず差別
化するようにしているが,利用者にとっては非常に煩わ
しい。更に,上記従来の記憶再生装置では,上記音声イ
ンデックスの登録や入力,検索の操作に用いる操作ボタ
ンを専用に設けているが,基本的な再生,録音などのボ
タンの他に更にそれらの操作ボタンを設けることは,上
述したようなカード型などの小型の装置ではスペースの
制約上非常に難しい。本発明は上記事情に鑑みてなされ
たものであり,その目的とするところは,音声によるデ
ータ検索等が行えるものであって,背景雑音がある場合
など音声認識精度が低下するような環境の下でも,或い
は複数の位置に同じ音声インデックスを登録したような
場合でも,所望のデータ位置を容易に検出することが可
能であり,また,それらの音声による操作に関係する操
作ボタンを専用に設ける必要のないディジタル情報記憶
検索装置を提供することである。However, with the current speech recognition technology, it is impossible to perform 100% accurate recognition under the normal use environment without being affected by background noise or the like. Therefore, the recognition accuracy of the voice is reduced depending on the surrounding environment. Even in the cueing operation as described above, there are many malfunctions in actual use, and the user has to input the voice each time and repeat the operation. Also, there is no guarantee that recognition will be accurate even if the process is repeated. In addition, the above-mentioned patent No. 26
In the invention according to 39387, the recognition rate is increased by, for example, performing registration five times with the same voice. However, the registration operation is troublesome for the user, and erroneous recognition due to a change in the surrounding environment is required. Can not. In addition, when exactly the same audio index is registered for different music or audio data, they cannot be distinguished, so that they cannot be operated as desired. Therefore, for example, the above-mentioned Patent No. 263
In the invention according to No. 9387, each voice index is always differentiated by, for example, pronouncing a number at the end of the voice index, but this is very troublesome for the user. Further, in the above-mentioned conventional storage / reproduction device, operation buttons used for registering, inputting, and retrieving the audio index are provided exclusively. However, in addition to the basic reproduction and recording buttons, these operation buttons are further provided. It is very difficult to provide such a small device such as a card type as described above due to space restrictions. SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and has as its object to perform a data search or the like by voice, and to be performed in an environment where voice recognition accuracy is reduced such as when there is background noise. However, even when the same voice index is registered at a plurality of positions, it is possible to easily detect a desired data position, and it is necessary to provide a dedicated operation button related to the operation by the voice. The object of the present invention is to provide a digital information storage / retrieval apparatus without any problem.
【0004】[0004]
【課題を解決するための手段】上記目的を達成するため
に本発明は,ディジタル情報を記憶する記憶手段と,音
声を入力する音声入力手段と,上記音声入力手段により
入力された音声を,上記記憶手段に記憶されたディジタ
ル情報の上記記憶手段上での位置を示す識別符号として
記憶する識別符号記憶手段と,上記音声入力手段により
入力された音声と上記識別符号記憶手段に記憶された識
別符号とに基づいて上記ディジタル情報の上記記憶手段
上での位置を検索する検索手段とを具備するディジタル
情報記憶検索装置において,上記識別符号記憶手段に記
憶された上記識別符号の中から,上記音声入力手段によ
り入力された音声に類似するものを1又は複数抽出し,
所定の順序付けを行う類似識別符号順序付け手段と,上
記類似識別符号順序付け手段による順序付けに従って所
望の識別符号を選択する識別符号選択手段とを具備して
なることを特徴とするディジタル情報記憶検索装置とし
て構成されている。To achieve the above object, the present invention provides a storage means for storing digital information, a voice input means for inputting voice, and a voice input by the voice input means. Identification code storage means for storing the digital information stored in the storage means as an identification code indicating the position on the storage means; voice input by the voice input means and identification code stored in the identification code storage means; And a search means for searching for the position of the digital information on the storage means on the basis of the above, wherein the voice input is selected from the identification codes stored in the identification code storage means. Extracting one or a plurality of sounds similar to the voice input by the means,
A digital information storage and retrieval device comprising: similar identification code ordering means for performing a predetermined ordering; and identification code selection means for selecting a desired identification code in accordance with the ordering performed by the similarity identification code ordering means. Have been.
【0005】更に,上記検索手段により検索された上記
ディジタル情報を再生する再生手段を具備するように構
成することもできる。上記所定の順序付けの方法として
は,例えば各識別符号と上記音声入力手段から入力され
た音声との類似度に基づいて行う方法や,各識別符号の
示す上記記憶手段上での記憶位置に基づいて行う方法な
どが考えられる。更に,上記音声入力手段に基づく上記
識別符号記憶手段の上記識別符号の記憶動作,及び上記
音声入力手段に基づく上記類似識別符号順序付け手段に
よる順序付け動作の指示,更には上記識別符号選択手段
への動作の指示などを,上記ディジタル情報の記憶・再
生に関する指示を入力する記憶・再生入力手段に対する
所定の操作により実現できるように構成すれば,音声入
力による処理のために専用のボタンなどの入力手段を設
ける必要がないため,小型の装置においてもスペースを
有効に活用することが可能となる。尚,例えば上記記憶
・再生入力手段を一定時間以上継続操作することにより
上記音声入力による処理を行うように構成すれば,上記
記憶・再生入力手段に複数の機能を持たせることが容易
である。[0005] Further, it is possible to comprise a reproducing means for reproducing the digital information searched by the searching means. Examples of the predetermined ordering method include, for example, a method performed based on the degree of similarity between each identification code and the voice input from the voice input means, and a method based on the storage position indicated by each identification code on the storage means. There is a method to do so. Further, the operation of storing the identification code of the identification code storage means based on the voice input means, the instruction of the ordering operation by the similar identification code ordering means based on the voice input means, and the operation of the identification code selection means Of the digital information can be realized by a predetermined operation on the storage / reproduction input means for inputting the instruction relating to the storage / reproduction of the digital information, input means such as dedicated buttons for processing by voice input can be provided. Since there is no need to provide them, it is possible to effectively utilize space even in a small device. If the processing by the voice input is performed by, for example, continuously operating the storage / reproduction input means for a certain period of time or more, it is easy to provide the storage / reproduction input means with a plurality of functions.
【0006】[0006]
【作用】本発明に係るディジタル情報記憶検索装置によ
れば,音声入力手段により入力された音声と識別符号記
憶手段に記憶された識別符号とに基づいてディジタル情
報の上記記憶手段上での位置を検索する際に,類似識別
符号順序付け手段により上記識別符号記憶手段に記憶さ
れた上記識別符号の中から,上記音声入力手段により入
力された音声に類似するものが1又は複数抽出され,例
えば類似度の順に順序付けされる。そして,識別符号選
択手段により,上記類似識別符号順序付け手段による順
序付けに従って所望の識別符号が選択され,該識別符号
に基づいてディジタル情報の検索が行われる。従って,
例えば背景雑音などによって音声認識精度が低下するよ
うな環境の下でも,或いは複数の位置に同じ音声インデ
ックスを登録したような場合でも,所望のデータ位置を
容易に検出することが可能となる。また,識別符号の記
憶動作,上記類似識別符号順序付け手段による順序付け
動作など,音声入力による検索処理に関連する動作の指
示が,上記ディジタル情報の記憶・再生に関する指示を
入力する記憶・再生入力手段を例えば所定時間以上継続
動作させることにより行われる。従って,音声による処
理専用の入力手段を別に設ける必要がないため,小型の
装置でもスペースを有効に活用できる。According to the digital information storage and retrieval device of the present invention, the position of digital information on the storage means is determined based on the voice input by the voice input means and the identification code stored in the identification code storage means. At the time of retrieval, one or a plurality of speeches similar to the speech input by the speech input means are extracted from the identification codes stored in the identification code storage means by the similar identification code ordering means. In order. Then, a desired identification code is selected by the identification code selection means in accordance with the ordering by the similar identification code ordering means, and digital information is searched based on the identification code. Therefore,
For example, a desired data position can be easily detected even in an environment where the voice recognition accuracy is reduced due to background noise or the like, or when the same voice index is registered at a plurality of positions. In addition, an instruction of an operation related to a search process by voice input, such as an operation of storing an identification code and an ordering operation by the similar identification code ordering means, is performed by a storage / reproduction input means for inputting an instruction relating to storage / reproduction of the digital information. For example, it is performed by performing continuous operation for a predetermined time or more. Therefore, it is not necessary to separately provide an input means dedicated to processing by voice, so that space can be effectively used even with a small device.
【0007】[0007]
【発明の実施の形態】以下,添付図面を参照して本発明
の実施の形態及び実施例につき説明し,本発明の理解に
供する。尚,以下の実施の形態及び実施例は,本発明を
具体化した一例であって,本発明の技術的範囲を限定す
る性格のものではない。ここに,図1は本発明の実施の
形態に係る情報記憶再生装置A1の概略構成を示すブロ
ック図,図2は上記情報記憶再生装置A1の操作ボタン
を示す模式図,図3は上記情報記憶再生装置A1におけ
る情報アドレス管理メモリ,音声インデックス記憶メモ
リ,情報本体記憶メモリ,及び音声インデックス検索履
歴メモリ内にそれぞれ記憶される情報の構成例を示す説
明図,図4は「再生開始ボタン」を用いた,情報再生時
における音声インデックスの登録動作の処理手順を示す
フローチャート,図5は「一時停止ボタン」を用いた,
情報途中への音声インデックスの登録動作の処理手順を
示すフローチャート,図6は「前方スキップボタン」を
用いた,情報検索動作の処理手順を示すフローチャー
ト,図7は「後方スキップボタン」を用いた,情報検索
動作の処理手順を示すフローチャートである。本実施の
形態に係る情報記憶再生装置A1は,音楽などの音声情
報(ディジタル情報の一例)の記憶・再生を行う装置で
あり,図1に示すような概略構成を有する。Embodiments and examples of the present invention will be described below with reference to the accompanying drawings to provide an understanding of the present invention. The following embodiments and examples are mere examples embodying the present invention, and do not limit the technical scope of the present invention. Here, FIG. 1 is a block diagram showing a schematic configuration of an information storage / reproduction device A1 according to an embodiment of the present invention, FIG. 2 is a schematic diagram showing operation buttons of the information storage / reproduction device A1, and FIG. FIG. 4 is an explanatory diagram showing a configuration example of information stored in an information address management memory, a voice index storage memory, an information body storage memory, and a voice index search history memory in the playback device A1, and FIG. FIG. 5 is a flowchart showing a processing procedure of a voice index registration operation at the time of information reproduction, and FIG. 5 uses a “pause button”.
FIG. 6 is a flowchart showing a procedure for registering an audio index in the middle of information, FIG. 6 is a flowchart showing a procedure for an information search operation using a “forward skip button”, and FIG. It is a flowchart which shows the processing procedure of an information search operation. The information storage / reproduction device A1 according to the present embodiment is a device for storing / reproducing audio information (an example of digital information) such as music, and has a schematic configuration as shown in FIG.
【0008】情報記憶再生装置A1は,図1に示すよう
に,後述する各部の動作を集中的に制御する制御部14
を中心として構成されている。情報記憶再生装置A1内
に記憶される音声情報は,情報書込みインターフェイス
13を介して入力され,データ圧縮されたビットストリ
ームとして半導体メモリよりなる情報本体記憶メモリ1
0内に記憶(録音)される(図3の左下図参照)。図3
には簡単のため,一つの曲のデータがメモリ内の連続し
た領域につながって記憶されている例を示している。上
記情報書込みインターフェイス13としては,例えばカ
ード型の装置であればPCMCIAインターフェイスな
どが適当であるが,これ以外にもシリアル通信,パラレ
ルI/Oなどのケーブル通信,IrDAなどの赤外線通
信,無線通信など,様々なインターフェイスが利用可能
である。また,上記情報本体記憶メモリ10内の各情報
の格納アドレスなどの管理情報は,情報アドレス管理メ
モリ9内に記憶される。上記情報アドレス管理メモリ9
内に記憶される管理情報は,図3の左上図に示すよう
に,各情報の曲名,アーティスト名などの付随情報や,
各情報(曲)が上記情報本体記憶メモリ10上のどの位
置に記憶されているかを示す開始アドレス(S1,S2
等)及び終了アドレス(E1,E2等)などの属性を持
たせた形で整理されている。As shown in FIG. 1, the information storage / reproduction device A1 includes a control unit 14 for centrally controlling the operation of each unit described later.
It is composed mainly of. The audio information stored in the information storage / reproduction device A1 is input via the information writing interface 13 and is converted into a data-compressed bit stream as an information body storage memory 1 comprising a semiconductor memory.
It is stored (recorded) in 0 (see the lower left diagram in FIG. 3). FIG.
1 shows an example in which data of one music piece is connected to a continuous area in the memory and stored for simplicity. As the information writing interface 13, for example, a PCMCIA interface or the like is suitable for a card type device, but other than this, serial communication, cable communication such as parallel I / O, infrared communication such as IrDA, wireless communication, etc. , Various interfaces are available. Management information such as the storage address of each piece of information in the information body storage memory 10 is stored in the information address management memory 9. The information address management memory 9
As shown in the upper left part of FIG. 3, the management information stored in the storage unit includes accompanying information such as a song name and an artist name of each information,
A start address (S1, S2) indicating where each piece of information (song) is stored in the information body storage memory 10.
) And end addresses (E1, E2, etc.).
【0009】上記情報本体記憶メモリ10内の音声情報
を再生する際には,まず圧縮符号化されている上記音声
情報が情報再生部11にて復号され,例えば16bit
ステレオでサンプリングされたディジタルデータに復元
される。このディジタルデータはD/A変換部12でア
ナログ変換された後,ヘッドフォンやスピーカなどの外
部出力装置22より出力される。上記情報本体記憶メモ
リ10内に記憶される音声情報の任意の位置を示す音声
インデックス(識別符号)として登録する音声や,上記
音声インデックスを検索するための入力音声は,マイク
21(音声入力手段)を介して取り込まれ,A/D変換
部1でディジタル化され,音声検出部2においてそのデ
ィジタル化された信号の中に音声が含まれるかどうかが
判断される。この判断は,音量変動のパターンに基づい
て行う簡単なものから,信号のゼロクロッシングや周期
性など,信号から抽出されるパラメータに基づいて行う
方法など,種々の公知技術が適用可能である。上記音声
検出部2で検出された音声は,音声パラメータ変換部3
においていくつかの音声パラメータP11,P12,P
21,…に変換される。ここで用いるパラメータとして
は,音声認識で一般に用いられているLPCケプストラ
ムやメル・ケプストラムなどが有効である。また,上記
パラメータはメモリ量を削減するために量子化されるの
が通常であり,またHMM(隠れマルコフモデル)にて
モデル化することも有効であることが既に知られてい
る。When reproducing the audio information in the information body storage memory 10, first, the audio information that has been compression-encoded is decoded by the information reproducing unit 11, and is, for example, 16 bits.
It is restored to digital data sampled in stereo. The digital data is converted from an analog signal by the D / A converter 12 and then output from an external output device 22 such as a headphone or a speaker. A voice registered as a voice index (identification code) indicating an arbitrary position of voice information stored in the information main body storage memory 10 and an input voice for searching the voice index are a microphone 21 (voice input means). , And digitized by the A / D converter 1, and the voice detector 2 determines whether or not voice is included in the digitized signal. Various known techniques can be applied, such as a simple determination based on a pattern of volume fluctuation, a method based on parameters extracted from the signal such as zero crossing and periodicity of the signal, and the like. The voice detected by the voice detection unit 2 is converted to a voice parameter conversion unit 3
Some speech parameters P11, P12, P
21, are converted. As the parameters used here, LPC cepstrum, mel cepstrum, and the like generally used in speech recognition are effective. The parameters are usually quantized in order to reduce the amount of memory, and it is already known that modeling with an HMM (Hidden Markov Model) is also effective.
【0010】続いて,上記入力音声が音声インデックス
として登録するものである場合には,その時録音中(或
いは再生中)の音声情報の番号,その時点の録音ポイン
タ(或いは再生ポインタ)の位置アドレス,及び上記音
声パラメータ(P11,P12など)が,音声インデッ
クスとして音声インデックス記憶メモリ5(識別符号記
憶手段)内に記憶される(図3の右上図参照)。一方,
上記入力音声が音声インデックスの検索のためのもので
ある場合には,音声マッチング類似度計算部4(類似識
別符号順序付け手段)において,上記音声パラメータ変
換部3で変換された音声パラメータ(入力音声パラメー
タという)と上記音声インデックス記憶メモリ5内に記
憶されている各音声パラメータ(登録音声パラメータと
いう)とのマッチング計算が行われる。その結果,上記
入力音声パラメータとの類似度が所定の閾値よりも高い
登録音声パラメータが登録されている音声インデックス
の番号が1又は複数抽出され,例えば上記類似度の順に
順序付けが行われ,音声インデックス検索履歴メモリ8
内に記憶される(図3の音声インデックス検索履歴メモ
リ参照)。上記音声情報の録音,再生や,上述した音声
インデックスの登録,検索などは,情報記憶再生装置A
1本体に設けられた操作ボタン15を押すことにより開
始される。上記操作ボタン15は,図2に示すように,
録音,再生,一時停止,スキップなど,音声情報の録音
・再生に最低限必要な基本的なボタン(記憶・再生入力
手段)のみで構成される。音声インデックスの登録,検
索などの操作は,上記基本操作ボタンを所定時間以上継
続して押すことにより実現される。ボタン操作検出部6
は,上記操作ボタン15の状態を検出し,例えば割り込
みやI/Oによって制御部14に通知する。タイマー7
は,上記操作ボタン15が押し続けられている時間を計
測する。上記制御部14は,上記タイマー7による計測
時間により,そのボタン操作がその操作ボタンに定義さ
れているいずれの操作(上記基本操作,若しくは音声イ
ンデックスに関する操作)であるかを判断する。Subsequently, when the input voice is to be registered as a voice index, the number of the voice information being recorded (or being reproduced) at that time, the position address of the recording pointer (or reproduction pointer) at that time, The voice parameters (P11, P12, etc.) are stored as voice indexes in the voice index storage memory 5 (identification code storage means) (see the upper right diagram in FIG. 3). on the other hand,
If the input speech is for searching for a speech index, the speech matching similarity calculation unit 4 (similar identification code ordering means) converts the speech parameters converted by the speech parameter conversion unit 3 (input speech parameters). ) And each voice parameter (referred to as a registered voice parameter) stored in the voice index storage memory 5. As a result, one or more voice index numbers in which registered voice parameters whose similarity with the input voice parameter is higher than a predetermined threshold are registered are extracted. For example, ordering is performed in the order of the similarity, and voice index is performed. Search history memory 8
(See voice index search history memory in FIG. 3). The recording and reproduction of the audio information and the registration and search of the audio index described above are performed by the information storage / reproduction device A.
The operation is started by pressing an operation button 15 provided on one main body. The operation button 15 is, as shown in FIG.
It is composed of only basic buttons (storage / playback input means) necessary for recording / playback of audio information, such as recording, playback, pause, and skip. Operations such as registration and search of a voice index are realized by continuously pressing the basic operation button for a predetermined time or more. Button operation detector 6
Detects the state of the operation button 15 and notifies the control unit 14 by interrupt or I / O, for example. Timer 7
Measures the time that the operation button 15 is kept pressed. The control unit 14 determines which operation (the basic operation or the operation related to the voice index) the button operation is defined by the operation button based on the time measured by the timer 7.
【0011】続いて,上記情報記憶再生装置A1の動作
を,上記音声インデックスの登録,検索などに関する動
作を中心に,図4〜図7に示すフローチャートに従って
具体的に説明する。 [情報再生時における音声インデックスの登録動作]情
報の再生時における音声インデックスの登録動作の開始
ボタンは,図2に示す「再生開始ボタン」が兼用され
る。図4に示すように,「再生開始ボタン」が押される
と(ステップS1),ボタン操作検出部6によりその動
作が検出され,制御部14により情報再生部11に対し
て情報本体記憶メモリ10内の音声情報(音楽)の再生
が指示され,音楽の再生が始まる(ステップS2)。こ
こまでは「再生開始ボタン」を押した場合の通常の再生
動作である。上記制御部14は,同時に上記音声検出部
2を起動して上記マイク21からの入力信号中の音声の
検出を開始すると共に(ステップS3),タイマー7を
起動させて上記「再生開始ボタン」が押されている時間
の計測を開始する(ステップS4)。押されていた上記
「再生開始ボタン」が放されると(ステップS5),そ
の時点での上記タイマー7による計測時間が所定の閾値
(例えば0.5秒)以上であるかどうかが判断される
(ステップS6)。ここで,上記計測時間が閾値未満の
場合には特別な動作はなされず,上記再生動作が継続さ
れる。即ち,上記「再生開始ボタン」が短時間だけ押さ
れた場合には通常の再生動作のみが行われる。Next, the operation of the information storage / reproducing apparatus A1 will be described in detail with reference to the flowcharts shown in FIGS. [Registration operation of audio index at the time of information reproduction] The "reproduction start button" shown in FIG. 2 is also used as the start button of the audio index registration operation at the time of information reproduction. As shown in FIG. 4, when the "reproduction start button" is pressed (step S1), the operation is detected by the button operation detection unit 6, and the control unit 14 instructs the information reproduction unit 11 to store the information in the information body storage memory 10. The reproduction of the audio information (music) is instructed, and the reproduction of the music starts (step S2). Up to here, the normal reproduction operation when the “reproduction start button” is pressed. The control unit 14 simultaneously activates the audio detection unit 2 to start detection of audio in the input signal from the microphone 21 (step S3), and activates the timer 7 so that the "playback start button" is activated. The measurement of the pressed time is started (step S4). When the "playback start button" which has been pressed is released (step S5), it is determined whether or not the time measured by the timer 7 at that time is equal to or longer than a predetermined threshold (for example, 0.5 seconds). (Step S6). Here, if the measurement time is less than the threshold, no special operation is performed, and the reproduction operation is continued. That is, when the "reproduction start button" is pressed for a short time, only a normal reproduction operation is performed.
【0012】一方,上記計測時間が閾値以上の場合,即
ち上記「再生開始ボタン」が所定時間以上継続して押さ
れていた場合には,制御部14は,要求されている動作
が音声インデックスの登録動作であると判断し,以下の
処理を行う。即ち,上記音声検出部2によって音声が検
出されたかどうかが判断され(ステップS7),音声が
検出された場合には,その音声は音声パラメータ変換部
3で幾つかのパラメータに変換され,現在再生中の曲の
先頭を示す音声インデックスとして音声インデックス記
憶メモリ5内に登録される(ステップS8)。この場合
に登録される音声インデックスは曲の先頭を頭出しする
ために曲の先頭を示すように登録されるため,例えば図
3の右上図の音声インデックスNo.2に示すように,
その曲の番号と音声パラメータP21,P22,P2
3,…のみが登録され,曲の途中のアドレスを示す途中
アドレスは設定されない。一方,上記ステップS7にお
いて音声が検出されなかった場合,即ち音声が入力され
ることなく上記「再生開始ボタン」が所定時間継続して
押されていた場合には,現在再生中の曲の先頭を示す登
録済みの音声インデックスが削除される(ステップS
9)。例えば,図3の右上図の音声インデックスNo.
2が削除される。以上のように,「再生開始ボタン」に
より,通常の再生動作だけでなく,音声インデックスの
登録/削除動作についての指示も行うことができ,特別
に専用のボタンを設ける必要がないので,スペース効率
が向上する。On the other hand, if the measured time is equal to or longer than the threshold, that is, if the "playback start button" is continuously pressed for a predetermined time or longer, the control unit 14 determines that the requested operation is performed in accordance with the audio index. It is determined that the operation is a registration operation, and the following processing is performed. That is, it is determined whether or not the voice is detected by the voice detection unit 2 (step S7). If the voice is detected, the voice is converted into some parameters by the voice parameter conversion unit 3 and the current playback is performed. It is registered in the voice index storage memory 5 as a voice index indicating the beginning of the middle tune (step S8). The audio index registered in this case is registered so as to indicate the beginning of the music in order to find the beginning of the music. As shown in 2,
The song number and voice parameters P21, P22, P2
.. Are registered, and an intermediate address indicating an intermediate address of the music is not set. On the other hand, if no sound is detected in step S7, that is, if the "playback start button" is continuously pressed for a predetermined time without inputting a sound, the beginning of the currently played back music is displayed. The registered voice index shown is deleted (step S
9). For example, the voice index No. in the upper right diagram of FIG.
2 is deleted. As described above, the "playback start button" allows not only normal playback operation but also instructions for voice index registration / deletion operation, and there is no need to provide a special dedicated button. Is improved.
【0013】[情報の録音時における音声インデックス
の登録動作]情報の録音時における音声インデックスの
登録動作の開始ボタンは,図2に示す「録音ボタン」が
兼用される。尚,この「録音ボタン」による音声インデ
ックスの登録動作は,情報の録音時に行われるという点
以外は,上記「再生開始ボタン」による音声インデック
スの登録動作と全く同様である。従って,処理手順は図
4のフローチャート中の「再生」を「録音」と読みかえ
たものとなる。ここでの詳細説明は省略する。 [情報途中への音声インデックスの登録動作]曲の先頭
ではなく,曲の途中への音声インデックスの登録動作に
は,図2に示す「一時停止ボタン」が兼用される。図5
に示すように,「一時停止ボタン」が押されると(ステ
ップS11),ボタン操作検出部6によりその動作が検
出され,制御部14により現在曲の再生中であるかどう
かが判断される(ステップS12)。この時,再生中で
なければ何の動作も行われないが,再生中である場合に
は,制御部14は情報再生部11に対して再生動作の一
時停止が指示される(ステップS13)。ここまでは
「一時停止ボタン」を押した場合の通常の動作である。
上記制御部14は,同時に上記音声検出部2を起動して
上記マイク21からの入力信号中の音声の検出を開始す
ると共に(ステップS14),タイマー7を起動させて
上記「一時停止ボタン」が押されている時間の計測を開
始する(ステップS15)。押されていた上記「一時停
止ボタン」が放されると(ステップS16),その時点
での上記タイマー7による計測時間が所定の閾値(例え
ば0.5秒)以上であるかどうかが判断される(ステッ
プS17)。ここで,上記計測時間が閾値未満の場合に
は特別な動作はなされない。即ち,上記「一時停止ボタ
ン」が短時間だけ押された場合には通常の一時停止動作
のみが行われる。[Sound index registration operation at the time of recording information] The "record button" shown in FIG. 2 is also used as a start button of the audio index registration operation at the time of recording information. Note that the operation of registering the voice index using the “record button” is exactly the same as the operation of registering the voice index using the “reproduction start button” except that the operation is performed when information is recorded. Accordingly, the processing procedure is such that "reproduction" in the flowchart of FIG. 4 is replaced with "recording". The detailed description here is omitted. [Operation of Registering Audio Index in the Middle of Information] The “pause button” shown in FIG. 2 is also used for the operation of registering the audio index in the middle of a song, not at the beginning of the song. FIG.
As shown in (1), when the "pause button" is pressed (step S11), the operation is detected by the button operation detecting section 6, and the control section 14 determines whether or not the music is currently being reproduced (step S11). S12). At this time, no operation is performed unless the reproduction is being performed. However, if the reproduction is being performed, the control unit 14 instructs the information reproduction unit 11 to temporarily stop the reproduction operation (step S13). This is the normal operation when the “pause button” is pressed.
The control unit 14 simultaneously activates the audio detection unit 2 to start detection of audio in the input signal from the microphone 21 (step S14), and activates the timer 7 to activate the "pause button". The measurement of the pressed time is started (step S15). When the "pause button" that has been pressed is released (step S16), it is determined whether the time measured by the timer 7 at that time is equal to or longer than a predetermined threshold (for example, 0.5 seconds). (Step S17). Here, if the measurement time is less than the threshold value, no special operation is performed. That is, when the “pause button” is pressed for a short time, only a normal pause operation is performed.
【0014】一方,上記計測時間が閾値以上の場合,即
ち上記「一時停止ボタン」が所定時間以上継続して押さ
れていた場合には,制御部14は,要求されている動作
が音声インデックスの登録動作であると判断し,以下の
処理を行う。即ち,上記音声検出部2によって音声が検
出されたかどうかが判断され(ステップS18),音声
が検出された場合には,その音声は音声パラメータ変換
部3で幾つかのパラメータに変換され,再生中であった
曲の現在の再生位置(一時停止位置)を示す音声インデ
ックスとして音声インデックス記憶メモリ5内に登録さ
れる(ステップS19)。この場合に登録される音声イ
ンデックスは曲の途中を示すように登録されるため,例
えば図3の右上図の音声インデックスNo.1に示すよ
うに,その曲の番号,途中アドレス,及び音声パラメー
タP11,P12,P13,…が登録される。一方,上
記ステップS18において音声が検出されなかった場
合,即ち音声が入力されることなく上記「一時停止ボタ
ン」が所定時間継続して押されていた場合には,現在の
再生位置の近傍のアドレスで登録されている登録済みの
音声インデックスが削除される(ステップS20)。例
えば,図3の右上図の音声インデックスNo.1が削除
される。On the other hand, if the measurement time is equal to or greater than the threshold, that is, if the “pause button” is continuously pressed for a predetermined time or more, the control unit 14 determines that the requested operation It is determined that the operation is a registration operation, and the following processing is performed. That is, it is determined whether or not the voice is detected by the voice detection unit 2 (step S18). If the voice is detected, the voice is converted into some parameters by the voice parameter conversion unit 3, and the voice is being reproduced. Is registered in the voice index storage memory 5 as a voice index indicating the current playback position (pause position) of the music piece (step S19). Since the voice index registered in this case is registered so as to indicate the middle of the music, for example, the voice index No. in the upper right diagram of FIG. As shown in FIG. 1, the song number, the midway address, and audio parameters P11, P12, P13,... Are registered. On the other hand, if no sound is detected in step S18, that is, if the "pause button" is continuously pressed for a predetermined time without inputting a sound, an address near the current reproduction position is determined. The registered voice index registered in is deleted (step S20). For example, the voice index No. in the upper right diagram of FIG. 1 is deleted.
【0015】[情報検索動作 その1]情報の検索動作
の開始ボタンは,図2に示す「前方スキップボタン」が
兼用される。図6に示すように,「前方スキップボタ
ン」が押されると(ステップS21),ボタン操作検出
部6によりその動作が検出され,制御部14により上記
音声検出部2が起動されて上記マイク21からの入力信
号中の音声の検出が開始されると共に(ステップS2
2),タイマー7が起動されて上記「前方スキップボタ
ン」が押されている時間の計測が開始される(ステップ
S23)。押されていた上記「前方スキップボタン」が
放されると(ステップS24),その時点での上記タイ
マー7による計測時間が所定の閾値(例えば0.5秒)
以上であるかどうかが判断される(ステップS25)。
ここで,上記計測時間が閾値以上の場合,即ち上記「前
方スキップボタン」が所定時間以上継続して押されてい
た場合には,上記音声検出部2によって音声が検出され
たかどうかが判断され(ステップS26),音声が検出
された場合には,その音声は音声パラメータ変換部3で
幾つかのパラメータに変換され,該入力音声パラメータ
と上記音声インデックス記憶メモリ5内に登録された登
録音声パラメータとのマッチングによる類似度計算が上
記音声マッチング類似度計算部4において行われる。類
似度計算の方法としては,音声認識における一般的な手
法であるDPマッチングなどを用いることができる。そ
して,上記登録音声パラメータの中から,上記入力音声
パラメータと所定の閾値以上の類似度を持つものが1又
は複数抽出され,それらの音声パラメータに対応する音
声インデックスの番号が,例えば類似度の高い順に音声
インデックス検索履歴メモリ8内に記憶される(図3右
下図参照)(ステップS30)。次に,上記音声インデ
ックス検索履歴メモリ8内に記憶された音声インデック
スの中から,第1順位の音声インデックスが選択され
(ステップS31),選択された音声インデックスの位
置に再生ポインタが移動され,その位置から再生が開始
される(ステップS32)。[Information Search Operation 1] The "forward skip button" shown in FIG. 2 is also used as the start button for the information search operation. As shown in FIG. 6, when the "forward skip button" is pressed (step S21), the operation is detected by the button operation detection unit 6, and the voice detection unit 2 is activated by the control unit 14 and the microphone 21 Of the input signal is started (step S2).
2), the timer 7 is activated and the measurement of the time during which the “forward skip button” is pressed is started (step S23). When the "forward skip button" that has been pressed is released (step S24), the time measured by the timer 7 at that time is a predetermined threshold (for example, 0.5 seconds).
It is determined whether this is the case (step S25).
Here, when the measurement time is equal to or longer than the threshold, that is, when the “forward skip button” is continuously pressed for a predetermined time or longer, it is determined whether or not a sound is detected by the sound detection unit 2 ( Step S26) If a voice is detected, the voice is converted into several parameters by the voice parameter conversion unit 3, and the input voice parameter and the registered voice parameter registered in the voice index storage memory 5 are used. Is calculated by the above-described speech matching similarity calculation unit 4. As a similarity calculation method, DP matching or the like, which is a general technique in speech recognition, can be used. Then, from the registered voice parameters, one or a plurality of voice parameters having a similarity to the input voice parameter or more than a predetermined threshold are extracted, and the number of the voice index corresponding to the voice parameter is, for example, a high similarity. These are sequentially stored in the voice index search history memory 8 (see the lower right diagram in FIG. 3) (step S30). Next, a first-ranked voice index is selected from the voice indexes stored in the voice-index search history memory 8 (step S31), and the reproduction pointer is moved to the position of the selected voice index. Reproduction is started from the position (step S32).
【0016】一方,上記ステップS25においてタイマ
ー7の計測時間が閾値未満であった場合,或いは上記ス
テップS26において音声が検出されなかった場合に
は,上記音声インデックス検索履歴メモリ8内に検索履
歴が記憶されているか否かが判断され(ステップS2
7),記憶されていない場合には再生ポインタが次の曲
の先頭に移動される。即ち,「前方スキップボタン」を
押した際の通常の動作が行われる。一方,上記ステップ
S27において上記音声インデックス検索履歴メモリ8
内に検索履歴が記憶されていると判断された場合には,
上記音声インデックス検索履歴メモリ8内に記憶されて
いる次順位の音声インデックスが選択され(ステップS
29),選択された音声インデックスの位置に再生ポイ
ンタが移動され,その位置から再生が開始される(ステ
ップS32)。 [情報検索動作 その2]図2に示す「後方スキップボ
タン」は,上記音声インデックス検索履歴メモリ8内に
記憶された前順位の音声インデックスを選択するために
用いられる。図7に示すように,「後方スキップボタ
ン」が押されると(ステップS41),ボタン操作検出
部6によりその動作が検出され,制御部14により上記
音声インデックス検索履歴メモリ8内に検索履歴が記憶
されているか否かが判断される(ステップS42)。こ
こで,記憶されていない場合には再生ポインタが前の曲
の先頭に移動される。即ち,「後方スキップボタン」を
押した際の通常の動作が行われる。一方,上記ステップ
S42において上記音声インデックス検索履歴メモリ8
内に検索履歴が記憶されていると判断された場合には,
上記音声インデックス検索履歴メモリ8内に記憶されて
いる前順位の音声インデックスが選択され(ステップS
44),選択された音声インデックスの位置に再生ポイ
ンタが移動され,その位置から再生が開始される(ステ
ップS45)。On the other hand, if the time measured by the timer 7 is less than the threshold value in step S25, or if no voice is detected in step S26, the search history is stored in the voice index search history memory 8. Is determined (step S2).
7) If not stored, the playback pointer is moved to the beginning of the next song. That is, a normal operation when the “forward skip button” is pressed is performed. On the other hand, in step S27, the voice index search history memory 8
If it is determined that the search history is stored in the
The next-ranked voice index stored in the voice index search history memory 8 is selected (step S).
29) The reproduction pointer is moved to the position of the selected voice index, and reproduction is started from that position (step S32). [Information Retrieval Operation 2] The “backward skip button” shown in FIG. 2 is used to select the previous-ranked voice index stored in the voice index search history memory 8. As shown in FIG. 7, when the “backward skip button” is pressed (step S 41), the operation is detected by the button operation detection unit 6, and the search history is stored in the voice index search history memory 8 by the control unit 14. It is determined whether or not it has been performed (step S42). At this time, if the music is not stored, the reproduction pointer is moved to the head of the previous music piece. That is, a normal operation when the “backward skip button” is pressed is performed. On the other hand, in step S42, the voice index search history memory 8
If it is determined that the search history is stored in the
The previous voice index stored in the voice index search history memory 8 is selected (step S).
44), the reproduction pointer is moved to the position of the selected voice index, and reproduction is started from that position (step S45).
【0017】以上説明したように,本実施の形態に係る
情報記憶再生装置A1では,音声マッチング類似度計算
部4により,入力音声パラメータとの類似度が所定の閾
値以上である登録音声パラメータに対応する音声インデ
ックスが1又は複数抽出されて上記類似度の順に順序付
けが行われると共に,それらの順序付けに基づいて所望
の音声インデックスが選択できるように構成されている
ため,例えば背景雑音などによって音声認識精度が低下
するような環境の下でも,或いは複数の位置に同じ音声
インデックスを登録したような場合でも,所望のデータ
位置を容易に検出することが可能である。また,上記音
声による音声インデックスの登録,削除,検索などの処
理動作が,情報の再生,録音などの通常動作のための操
作ボタンを所定時間以上継続して押すことにより実現さ
れる,即ち,音声による処理専用の操作ボタンを別に設
ける必要がないため,小型の装置でもスペースを有効に
活用できる。As described above, in the information storage / reproducing apparatus A1 according to the present embodiment, the speech matching similarity calculation unit 4 corresponds to the registered speech parameter whose similarity with the input speech parameter is equal to or greater than a predetermined threshold. One or more speech indexes to be extracted are extracted and ordered in the order of similarity, and a desired speech index can be selected based on the ordering. It is possible to easily detect a desired data position even in an environment in which the voice index decreases, or in a case where the same voice index is registered at a plurality of positions. Further, processing operations such as registration, deletion, and search of a voice index by voice are realized by continuously pressing operation buttons for normal operations such as reproduction and recording of information for a predetermined time or more. It is not necessary to provide an operation button dedicated to the processing by the above, so that the space can be effectively used even with a small device.
【0018】[0018]
【実施例】上記実施の形態では,音声マッチング類似度
計算部4で抽出された音声インデックスを,音声パラメ
ータの類似度の順に順序付けを行っているが,例えば音
声パラメータによって示される記憶位置の順に順序付け
を行うようにしてもよい。また,図4〜図7に示したフ
ローチャートは一例であり,各操作ボタンに割り当てら
れる処理内容は任意に設定できる。また,上記実施の形
態では音声情報の記憶・再生を行う情報記憶再生装置を
例にあげて説明を行ったが,取り扱うディジタル情報と
しては音声情報に限らず,静止画,動画,活字情報など
様々なものを対象とする事が可能である。また,必ずし
も情報の再生を行うものでなくても,例えば情報の検索
のみを行うような装置にも本発明は適用可能である。In the above embodiment, the speech indexes extracted by the speech matching similarity calculator 4 are ordered in the order of the similarity of the speech parameters. For example, the speech indexes are ordered in the order of the storage positions indicated by the speech parameters. May be performed. The flowcharts shown in FIGS. 4 to 7 are examples, and the processing content assigned to each operation button can be set arbitrarily. Further, in the above embodiment, the information storage / reproducing apparatus for storing / reproducing audio information has been described as an example. However, the digital information to be handled is not limited to audio information, and various types of information such as still images, moving images, type information, etc. It is possible to target something. Further, the present invention is applicable to an apparatus that does not necessarily reproduce information but performs only information retrieval, for example.
【0019】[0019]
【発明の効果】以上説明したように,本発明は,ディジ
タル情報を記憶する記憶手段と,音声を入力する音声入
力手段と,上記音声入力手段により入力された音声を,
上記記憶手段に記憶されたディジタル情報の上記記憶手
段上での位置を示す識別符号として記憶する識別符号記
憶手段と,上記音声入力手段により入力された音声と上
記識別符号記憶手段に記憶された識別符号とに基づいて
上記ディジタル情報の上記記憶手段上での位置を検索す
る検索手段とを具備するディジタル情報記憶検索装置に
おいて,上記識別符号記憶手段に記憶された上記識別符
号の中から,上記音声入力手段により入力された音声に
類似するものを1又は複数抽出し,所定の順序付けを行
う類似識別符号順序付け手段と,上記類似識別符号順序
付け手段による順序付けに従って所望の識別符号を選択
する識別符号選択手段とを具備してなることを特徴とす
るディジタル情報記憶検索装置として構成されているた
め,例えば背景雑音などによって音声認識精度が低下す
るような環境の下でも,或いは複数の位置に同じ音声イ
ンデックスを登録したような場合でも,認識エラーによ
る繰り返し処理を防止でき,所望のデータ位置を容易に
検出することが可能となる。更に,上記音声入力手段に
基づく上記識別符号記憶手段の上記識別符号の記憶動
作,及び上記音声入力手段に基づく上記類似識別符号順
序付け手段による順序付け動作の指示,更には上記識別
符号選択手段への動作の指示などを,上記ディジタル情
報の記憶・再生に関する指示を入力する記憶・再生入力
手段に対する所定の操作により実現できるように構成す
ることにより,音声入力による処理のために専用のボタ
ンなどの入力手段を設ける必要がないため,小型の装置
においてもスペースを有効に活用することが可能とな
る。尚,例えば上記記憶・再生入力手段を一定時間以上
継続操作することにより上記音声入力による処理を行う
ように構成すれば,上記記憶・再生入力手段に複数の機
能を持たせることが容易である。As described above, the present invention provides storage means for storing digital information, voice input means for inputting voice, and voice input by the voice input means.
An identification code storage means for storing the digital information stored in the storage means as an identification code indicating the position on the storage means; a voice input by the voice input means and an identification code stored in the identification code storage means; A search means for searching for the position of the digital information on the storage means on the basis of the code, the digital information storage and search device comprising: Similarity identification code ordering means for extracting one or more sounds similar to the voice inputted by the input means and performing a predetermined ordering, and identification code selection means for selecting a desired identification code in accordance with the ordering by the similarity identification code ordering means Since it is configured as a digital information storage and retrieval device characterized by having Even in an environment where the voice recognition accuracy is reduced due to such factors, or when the same voice index is registered at multiple positions, repetitive processing due to recognition errors can be prevented, and the desired data position can be easily detected. Becomes possible. Further, the operation of storing the identification code of the identification code storage means based on the voice input means, the instruction of the ordering operation by the similar identification code ordering means based on the voice input means, and the operation of the identification code selection means And the like can be realized by a predetermined operation on the storage / reproduction input means for inputting the instruction relating to the storage / reproduction of the digital information, so that input means such as dedicated buttons for processing by voice input are provided. Since there is no need to provide a space, it is possible to effectively utilize space even in a small device. If the processing by the voice input is performed by, for example, continuously operating the storage / reproduction input means for a certain period of time or more, it is easy to provide the storage / reproduction input means with a plurality of functions.
【図1】 本発明の実施の形態に係る情報記憶再生装置
A1の概略構成を示すブロック図。FIG. 1 is a block diagram showing a schematic configuration of an information storage / reproduction device A1 according to an embodiment of the present invention.
【図2】 上記情報記憶再生装置A1の操作ボタンを示
す模式図。FIG. 2 is a schematic diagram showing operation buttons of the information storage / reproduction device A1.
【図3】 上記情報記憶再生装置A1における情報アド
レス管理メモリ,音声インデックス記憶メモリ,情報本
体記憶メモリ,及び音声インデックス検索履歴メモリ内
にそれぞれ記憶される情報の構成例を示す説明図。FIG. 3 is an explanatory diagram showing a configuration example of information respectively stored in an information address management memory, a voice index storage memory, an information body storage memory, and a voice index search history memory in the information storage / reproduction device A1.
【図4】 「再生開始ボタン」を用いた,情報再生時に
おける音声インデックスの登録動作の処理手順を示すフ
ローチャート。FIG. 4 is a flowchart showing a processing procedure of a voice index registration operation at the time of information reproduction using a “reproduction start button”.
【図5】 「一時停止ボタン」を用いた,情報途中への
音声インデックスの登録動作の処理手順を示すフローチ
ャート。FIG. 5 is a flowchart showing a processing procedure of an operation of registering a voice index in the middle of information using a “pause button”.
【図6】 「前方スキップボタン」を用いた,情報検索
動作の処理手順を示すフローチャート。FIG. 6 is a flowchart showing a processing procedure of an information search operation using a “forward skip button”.
【図7】 「後方スキップボタン」を用いた,情報検索
動作の処理手順を示すフローチャート。FIG. 7 is a flowchart illustrating a processing procedure of an information search operation using a “backward skip button”.
1…A/D変換部 2…音声検出部 3…音声パラメータ変換部 4…音声マッチング類似度計算部(類似識別符号順序付
け手段) 5…音声インデックス記憶メモリ(識別符号記憶手段) 6…ボタン操作検出部 7…タイマ 8…音声インデックス検索履歴メモリ 9…情報アドレス管理メモリ 10…情報本体記憶メモリ(記憶手段) 11…情報再生部(再生手段) 12…D/A変換部 13…情報書き込みインターフェイス 14…制御部(識別番号選択手段) 15…操作ボタン(記憶・再生入力手段) 21…マイク(音声入力手段)DESCRIPTION OF SYMBOLS 1 ... A / D conversion part 2 ... Speech detection part 3 ... Speech parameter conversion part 4 ... Speech matching similarity calculation part (similar identification code ordering means) 5 ... Speech index storage memory (identification code storage means) 6 ... Button operation detection Unit 7: Timer 8: Voice index search history memory 9: Information address management memory 10: Information body storage memory (storage unit) 11: Information reproduction unit (reproduction unit) 12: D / A conversion unit 13: Information writing interface 14 ... Control unit (identification number selection means) 15 ... operation buttons (storage / playback input means) 21 ... microphone (voice input means)
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G11B 27/10 C (72)発明者 下田 敏章 兵庫県神戸市西区高塚台1丁目5番5号 株式会社神戸製鋼所神戸総合技術研究所内 (72)発明者 西元 善郎 兵庫県神戸市西区高塚台1丁目5番5号 株式会社神戸製鋼所神戸総合技術研究所内 (72)発明者 原田 和茂 東京都千代田区丸の内1丁目8番2号 株 式会社神戸製鋼所東京本社内──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 6 Identification code FIG11B 27/10 C (72) Inventor Toshiaki Shimoda 1-5-5 Takatsukadai, Nishi-ku, Kobe-shi, Hyogo Kobe Steel, Ltd. Kobe General Co., Ltd. Within the Technical Research Institute (72) Inventor Yoshiro Nishimoto 1-5-5 Takatsukadai, Nishi-ku, Kobe City, Hyogo Prefecture Inside the Kobe Steel Research Institute, Kobe Steel Co., Ltd. No.2 Kobe Steel Ltd. Tokyo head office
Claims (7)
音声を入力する音声入力手段と,上記音声入力手段によ
り入力された音声を,上記記憶手段に記憶されたディジ
タル情報の上記記憶手段上での位置を示す識別符号とし
て記憶する識別符号記憶手段と,上記音声入力手段によ
り入力された音声と上記識別符号記憶手段に記憶された
識別符号とに基づいて上記ディジタル情報の上記記憶手
段上での位置を検索する検索手段とを具備するディジタ
ル情報記憶検索装置において,上記識別符号記憶手段に
記憶された上記識別符号の中から,上記音声入力手段に
より入力された音声に類似するものを1又は複数抽出
し,所定の順序付けを行う類似識別符号順序付け手段
と,上記類似識別符号順序付け手段による順序付けに従
って所望の識別符号を選択する識別符号選択手段とを具
備してなることを特徴とするディジタル情報記憶検索装
置。1. A storage means for storing digital information,
Voice input means for inputting voice, identification code storage means for storing the voice input by the voice input means as an identification code indicating the position of the digital information stored in the storage means on the storage means, A digital information storage and retrieval device comprising: retrieval means for retrieving the position of the digital information on the storage means based on the voice inputted by the voice input means and the identification code stored in the identification code storage means. A similar identification code ordering means for extracting one or a plurality of sounds similar to the voice input by the voice input means from the identification codes stored in the identification code storage means and performing a predetermined ordering; Identification code selecting means for selecting a desired identification code in accordance with the ordering by the similar identification code ordering means. Digital information storage and retrieval device for.
ジタル情報を再生する再生手段を具備する請求項1記載
のディジタル情報記憶検索装置。2. The digital information storage and retrieval device according to claim 1, further comprising a reproducing unit that reproduces the digital information retrieved by the retrieval unit.
記音声入力手段から入力された音声との類似度に基づい
て行われる請求項1又は2記載のディジタル情報記憶検
索装置。3. The digital information storage and retrieval device according to claim 1, wherein the predetermined ordering is performed based on the similarity between each identification code and the voice input from the voice input means.
す上記記憶手段上での記憶位置に基づいて行われる請求
項1又は2記載のディジタル情報記憶検索装置。4. The digital information storage and retrieval apparatus according to claim 1, wherein the predetermined ordering is performed based on a storage position on the storage means indicated by each identification code.
記憶手段の上記識別符号の記憶動作,及び上記音声入力
手段に基づく上記類似識別符号順序付け手段による順序
付け動作の指示が,上記ディジタル情報の記憶・再生に
関する指示を入力する記憶・再生入力手段に対する所定
の操作により実現される請求項2〜4のいずれかに記載
のディジタル情報記憶検索装置。5. An operation of storing said identification code in said identification code storage means based on said voice input means and an instruction of an ordering operation by said similar identification code ordering means based on said voice input means are stored in said digital information. 5. The digital information storage and retrieval device according to claim 2, wherein the digital information storage and retrieval device is realized by a predetermined operation on a storage / reproduction input means for inputting an instruction relating to reproduction.
指示が,上記記憶・再生入力手段に対する所定の操作に
より実現される請求項5記載のディジタル情報記憶検索
装置。6. The digital information storage / retrieval apparatus according to claim 5, wherein the instruction of the operation to the identification code selection means is realized by a predetermined operation on the storage / reproduction input means.
操作である請求項5又は6記載のディジタル情報記憶検
索装置。7. The digital information storage and retrieval device according to claim 5, wherein the predetermined operation is a continuous operation for a predetermined time or more.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9357106A JPH11184887A (en) | 1997-12-25 | 1997-12-25 | Device for storing and retrieving digital information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9357106A JPH11184887A (en) | 1997-12-25 | 1997-12-25 | Device for storing and retrieving digital information |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11184887A true JPH11184887A (en) | 1999-07-09 |
Family
ID=18452418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9357106A Pending JPH11184887A (en) | 1997-12-25 | 1997-12-25 | Device for storing and retrieving digital information |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11184887A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009516268A (en) * | 2005-11-10 | 2009-04-16 | メロディス コーポレイション | System and method for storing and retrieving non-text based information |
-
1997
- 1997-12-25 JP JP9357106A patent/JPH11184887A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009516268A (en) * | 2005-11-10 | 2009-04-16 | メロディス コーポレイション | System and method for storing and retrieving non-text based information |
US9053183B2 (en) | 2005-11-10 | 2015-06-09 | Soundhound, Inc. | System and method for storing and retrieving non-text-based information |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0887788B1 (en) | Voice recognition apparatus for converting voice data present on a recording medium into text data | |
KR100913843B1 (en) | Method and apparatus for lapse play timekeeping of variable bit rate digitally encoded audio data files | |
JP3163119B2 (en) | Recording and playback device | |
US20030158737A1 (en) | Method and apparatus for incorporating additional audio information into audio data file identifying information | |
JP2005266198A (en) | Acoustic information reproducing apparatus and music data keyword creation method | |
US20040064306A1 (en) | Voice activated music playback system | |
JPH11184887A (en) | Device for storing and retrieving digital information | |
JPS58102378A (en) | Information retrieving device | |
JPH11242496A (en) | Information reproducing device | |
US20070260590A1 (en) | Method to Query Large Compressed Audio Databases | |
JPH0962296A (en) | Speech recording device and speech reproducing device | |
KR20010099450A (en) | Replayer for music files | |
JP2006323857A (en) | Voice recognition processor, and recording medium recorded with voice recognition processing program | |
KR0176638B1 (en) | Method and device for automatic generation of time codes in audio memory recording/reproducing equipment | |
JP2009204872A (en) | Creation system of dictionary for speech recognition | |
JPH10124099A (en) | Speech recording device | |
JP3905181B2 (en) | Voice recognition processing device and recording medium recording voice recognition processing program | |
KR20050106246A (en) | Method for searching data in mpeg player | |
JPH06139289A (en) | Information reproducing device | |
JPH01114898A (en) | Data searcher | |
JP2000089784A (en) | Voice recognition system | |
JP2000206992A (en) | Voice recorder, voice reproducing device and voice processing device | |
JPH10283162A (en) | Audio information file search method | |
JP2007171772A (en) | Music information processing device, music information processing method, and control program | |
JPH11212590A (en) | Voice processor, recording medium with voice recognition program recorded, and recording medium with processing program recorded |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040420 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040817 |