JP2007140063A - 音声記録再生装置 - Google Patents
音声記録再生装置 Download PDFInfo
- Publication number
- JP2007140063A JP2007140063A JP2005333036A JP2005333036A JP2007140063A JP 2007140063 A JP2007140063 A JP 2007140063A JP 2005333036 A JP2005333036 A JP 2005333036A JP 2005333036 A JP2005333036 A JP 2005333036A JP 2007140063 A JP2007140063 A JP 2007140063A
- Authority
- JP
- Japan
- Prior art keywords
- recording
- sampling frequency
- bit rate
- audio
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 71
- 238000001514 detection method Methods 0.000 claims abstract description 46
- 238000005070 sampling Methods 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 description 33
- 230000008569 process Effects 0.000 description 32
- 238000012545 processing Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000000470 constituent Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【課題】録音対象に応じて録音品質を最適化することができ、かつ使い易く誤操作のない音声記録再生装置を提供すること。
【解決手段】入力された音声信号と所定の判定基準値とを大小比較して、判定基準値以上の音声信号を検出する音声信号レベル検出部1と、所定時間内に、音声信号レベル検出部1により検出された判定基準値以上の音声信号の入力回数に基づいて録音対象を判定する録音対象判定部2と、録音対象判定部2による判定結果に基づいて録音品質が最適になるようにサンプリング周波数を選択するサンプリング周波数選択部3と、サンプリング周波数選択部3で選択されたサンプリング周波数に応じたビットレートの音声データに、入力された音声信号を符号化する符号化部4とから構成される。
【選択図】図1
【解決手段】入力された音声信号と所定の判定基準値とを大小比較して、判定基準値以上の音声信号を検出する音声信号レベル検出部1と、所定時間内に、音声信号レベル検出部1により検出された判定基準値以上の音声信号の入力回数に基づいて録音対象を判定する録音対象判定部2と、録音対象判定部2による判定結果に基づいて録音品質が最適になるようにサンプリング周波数を選択するサンプリング周波数選択部3と、サンプリング周波数選択部3で選択されたサンプリング周波数に応じたビットレートの音声データに、入力された音声信号を符号化する符号化部4とから構成される。
【選択図】図1
Description
本発明は、録音対象の判別機能を備えた音声記録再生装置に関する。
アナログの音声信号をデジタルの音声データに変換した後、この音声データを書換え可能な記録媒体としてのフラッシュメモリに記録する機能と、フラッシュメモリに記録された音声データをアナログ化して再生する機能とを有する携帯型の音声記録再生装置(以下、ICレコーダと称する)が1990年代後半から本格的に実用化されている。更に、近年では、上記の機能に加えて、WMA(Windows(登録商標) Media Audio)形式やMP3(MPEG-1 audio layer3)形式等の音声ファイルを高音質で再生することができるミュージックプレーヤとしてのICレコーダも製品化されている。
このようなICレコーダは、所定の操作部を操作することにより、録音、再生、早送り、及び早戻しなどの各種動作を選択的に実行させることができる。例えば、録音動作のときは、予めフラッシュメモリに設けられた音声データ記録領域に、デジタル信号に変換された音声データが記録され、インデックス情報記録領域に、該音声データに関するインデックス情報(音声データの記録アドレス、録音日時等の音声データに関する各種情報)が記録される。
ここで、フラッシュメモリに記録される音声データは、インデックス情報と共に音声ファイルを構成している。音声ファイルは、その後のファイル検索や再生が容易となるように、記録時に、ファイルナンバー(ファイル名)とフォルダ記号とが割り当てられる。また、フォルダは、録音毎に増え続ける音声ファイルを効率良く区分管理できるように、例えばA、B、Cフォルダのように複数設けられることが多い。更に、これら複数設けられたフォルダのうちで選択中のフォルダを操作者が認識し易いように、フォルダの選択時には、ICレコーダ本体に設けられたLCDなどの表示器に、フォルダマークをポップ表示するなどの工夫もなされている。
このように、機能、性能、及び操作性においては十分に進化してきたICレコーダであるが、口述と会議(複数話者の会話、講演等)に代表されるような、録音対象に応じて録音品質を最適化する技術については、未だに操作者自身の経験と勘に頼らざるを得ない。
このような問題を解決するための手法として、例えば特許文献1において提案されている記録装置では、録音対象に応じた録音時間や録音品質の切り換え選択が行われている。具体的には、操作者が指定した録音時間又は音質に応じて、最高音質で録音できる組み合わせのサンプリング周波数と圧縮率とを録音対象毎に選択することが述べられている。
特開平8−185671号公報
ここで、上記特許文献1の提案の場合、録音開始前に操作者自身の状況判断で録音時間や音質をその都度指定しなければならない。したがって、咄嗟の録音時には、指定操作が間に合わない可能性がある。また、録音経験の浅い未熟な操作者は、録音対象と期待する録音品質(録音時間や音質等)との関連付けがイメージできないことが多く、この意味においても操作者自身に煩雑な操作を要求するのは現実的ではない。
本発明は、上記の事情に鑑みてなされたものであり、録音対象に応じて録音品質を最適化することができ、かつ使い易く誤操作のない音声記録再生装置を提供することを目的とする。
上記の目的を達成するために、本発明の第1の態様による音声記録再生装置は、入力された音声信号と所定の判定基準値とを大小比較する音声信号レベル検出手段と、所定時間内に上記音声信号レベル検出手段により検出された上記判定基準値以上の音声信号の入力回数に基づいて録音対象を判定する録音対象判定手段と、上記録音対象判定手段による判定結果に基づいて録音品質が最適になるようにサンプリング周波数を選択するサンプリング周波数選択手段と、上記サンプリング周波数選択手段で選択されたサンプリング周波数に応じたビットレートの音声データに上記入力された音声信号を符号化する符号化手段とを具備することを特徴とする。
本発明によれば、録音対象に応じて録音品質を最適化することができ、かつ使い易く誤操作のない音声記録再生装置を提供することができる。
以下、図面を参照して本発明の実施形態を説明する。
図1は、本発明の一実施形態に係る音声記録再生装置の主要な構成を示したブロック図である。図1に示すように、本一実施形態の音声記録再生装置は、音声信号レベル検出部1と、録音対象判定部2と、サンプリング周波数選択部3と、符号化部4とから構成されている。
図1は、本発明の一実施形態に係る音声記録再生装置の主要な構成を示したブロック図である。図1に示すように、本一実施形態の音声記録再生装置は、音声信号レベル検出部1と、録音対象判定部2と、サンプリング周波数選択部3と、符号化部4とから構成されている。
音声信号レベル検出部1は、図示しないマイクロフォンを介して入力され、図示しないマイクアンプにより増幅された音声信号と所定の判定基準値とを大小比較し、この比較の結果、所定の判定基準値以上の音声信号を、録音対象判定部2に出力する。録音対象判定部2は、所定時間内に、音声信号レベル検出部1から入力された判定基準値以上の音声信号の入力回数を計数し、その回数に基づいて録音対象を判定する。そして、その判定結果をサンプリング周波数選択部3に出力する。サンプリング周波数選択部3は、録音対象判定部2による録音対象の判定結果に基づいて録音品質が最適になるようにサンプリング周波数を選択し、選択したサンプリング周波数を符号化部4に供給する。符号化部4は、サンプリング周波数選択部3から供給されるサンプリング周波数に応じたビットレートの音声データに音声信号を符号化する。
図2は、本発明の一実施形態に係る音声記録再生装置の一例としてのICレコーダの内部構成を示すブロック図である。図2に示すICレコーダは、音声を電気信号に変換するマイクロフォン(MIC)20を備えている。音声の録音時においては、マイクロフォン(MIC)20は、音声を電気信号(アナログの音声信号)に変換し、変換して得られた音声信号を後段のマイクアンプ(AMP)21に出力する。マイクアンプ(AMP)21は、マイクロフォン(MIC)20を介して入力された音声信号を増幅して、ローパスフィルタ(LPF)22に出力する。ローパスフィルタ(LPF)22は、入力された音声信号のうち、不要な周波数帯域をカットして、A/D変換器(ADC)23に出力する。A/D変換器(ADC)23は、入力された音声信号をデジタル信号に変換し、これによって得られたデジタルの音声信号を、デジタル信号処理部(DSP)24に出力する。デジタル信号処理部(DSP)24は、録音時には、システム制御部25の制御の下、A/D変換器(ADC)23で得られたデジタルの音声信号を、フレーム単位で読み出して所定の符号化フォーマットの音声データに符号化(圧縮)する。この符号化された音声データは、システム制御部25に設けられた図示しないバッファメモリに一時的に記憶される。
一方、デジタル信号処理部(DSP)24は、音声の再生時には、システム制御部25の制御の下、システム制御部25の図示しないバッファメモリから、符号化された音声データをフレーム単位で読み出して復号化(伸長)し、D/A変換器(DAC)26に出力する。D/A変換器(DAC)26は、符号化された音声データをアナログ信号に変換して、ローパスフィルタ(LPF)27に出力する。ローパスフィルタ(LPF)27は、入力された音声信号のうち、不要な周波数帯域をカットして、パワーアンプ(AMP)28に出力する。パワーアンプ(AMP)28は、入力された音声信号を増幅して、スピーカ(SP)29に出力する。スピーカ(SP)29は、入力された音声信号を音声として出力する。
システム制御部25は、例えばCPUで構成されており、デジタル信号処理部(DSP)24以外に、記録部(メモリ)30と、操作部31と、表示部32とが接続されている。
記録部(メモリ)30は、例えば、フラッシュメモリ等の不揮発性の半導体メモリで構成されている。録音時においては、記録部(メモリ)30には、デジタル信号処理部(DSP)24で符号化された音声データが、システム制御部25の制御の下、図示しないバッファメモリを介して記録される。このとき、音声データに関するインデックス情報も記録される。
操作部31は、録音スイッチ(REC)、再生スイッチ(PLAY)、停止スイッチ(STOP)、早送りスイッチ(FF)、早戻しスイッチ(REW)、メニュースイッチ(MENU)、消去スイッチ(ERASE)、ホールドスイッチ(HOLD)等の各種操作部材が機能別に設けられている。このような操作部31の操作を受けてシステム制御部25は各種動作処理を実行する。
表示部32は、操作部31に含まれる何れかの操作を受けて所定の処理が開始されたときに、本ICレコーダの動作モード、又はそれら動作モードにおけるその後の動作状況を表示する。例えば、操作者により録音スイッチ(REC)が押された場合に、表示部32は、録音の経過時間、録音可能な残り時間、及びファイルナンバー等を表示する。また、操作者によりメニュースイッチ(MENU)が押された場合に、表示部32は、マイク感度の選択(高/低)、録音モードの選択(自動/標準/ロング)、及びアラームの選択(オン/オフ)等の本ICレコーダの機能選択に関連した表示を行う。更に、システム制御部25が時計機能を有しているときは、表示部32は、現在日時のカレンダー表示も行う。
次に、図2に示す構成を有するICレコーダのメイン動作について図3を参照しながら説明する。図3は、図2のICレコーダのメイン動作を示すフローチャートである。
図示しないパワースイッチの操作等により、本ICレコーダがパワーオンされると、図3に示すように、システム制御部25は、所定の初期設定を行う(S1)。初期設定の終了後に、システム制御部25は、図示しないタイマの計時をスタートさせる(S2)。このタイマは、所定時間経過後に、本ICレコーダが通常の動作モードから待機モード(低消費電流モード)に入るための時間を計時するためのタイマである。
S2のタイマスタートの後、システム制御部25は、S3〜S9に示すスイッチ検出処理を行う。即ち、システム制御部25は、録音スイッチ(REC)がオンされたか否か(S3)、再生スイッチがオンされたか否か(S4)、早送りスイッチ(FF)がオンされたか否か(S5)、早戻しスイッチ(REW)がオンされたか否か(S6)、停止スイッチ(STOP)がオンされたか否か(S7)、メニュースイッチ(MENU)がオンされたか否か(S8)、及び消去スイッチ(ERASE)がオンされたか否か(S9)を順次判定する。
S3〜S9の判定において、全てのスイッチがオフである場合には、S10に進み、システム制御部25は、タイマの計時時間が所定時間をオーバしたか否かを判定する(S10)。S10の判定において、タイマの計時時間が所定時間をオーバしていない場合には、S3に戻り、S3〜S9のスイッチ検出処理を継続する。一方、S10の判定において、タイマの計時時間が所定時間をオーバしている場合には、S10をS11に分岐して、システム制御部25は、待機モードのサブルーチン処理を行う(S11)。待機モードに入ると本ICレコーダが低電流動作になる。具体的には、図2のマイクロフォン(MIC)20、マイクアンプ(AMP)21、ローパスフィルタ(LPF)22、A/D変換器(ADC)23、デジタル信号処理部(DSP)24、D/A変換器(DAC)26、ローパスフィルタ(LPF)27、パワーアンプ(AMP)28、記録部(メモリ)30、表示部32への電源供給を遮断する、或いは図2の各ブロックを構成する図示しないICに設けられているチップイネーブル端子に、システム制御部25から非選択信号を出力することにより、低消費電流状態とする。このとき、システム制御部25のCPUは、自らも動作クロックを最も消費電流の少ない低速クロックに切り換えて低消費電流状態になる。場合によっては、動作クロックをメインクロック(例えば、16.384MHz)からサブクロック(例えば、32.768kHz)に切り換えて、その後スイッチ入力が検出されるまで、メインクロックを完全に停止させても良い。
ここで、待機モード中に、ユーザによって何らかのスイッチ操作がなされた場合には、S2に戻り、メイン動作の処理が再開される。
また、S3の判定において、録音スイッチがオンされた場合には、S3をS12に分岐して、システム制御部25は、録音処理のサブルーチンを実行する(S12)。この録音処理については後述する。また、S4の判定において、再生スイッチがオンされた場合には、S4をS13に分岐して、システム制御部25は、再生処理のサブルーチンを実行する(S13)。また、S5の判定において、早送りスイッチがオンされた場合には、S5をS14に分岐して、システム制御部25は、早送り処理のサブルーチンを実行する(S14)。また、S6の判定において、早戻しスイッチがオンされた場合には、S6をS15に分岐して、システム制御部25は、早戻し処理のサブルーチンを実行する(S15)。また、S7の判定において、停止スイッチがオンされた場合には、S7をS16に分岐して、システム制御部25は、停止処理のサブルーチンを実行する(S16)。また、S8の判定において、メニュースイッチがオンされた場合には、S8をS17に分岐して、システム制御部25は、メニュー変更処理のサブルーチンを実行する(S17)。また、S9の判定において、消去スイッチがオンされた場合には、S9をS18に分岐して、システム制御部25は、消去処理のサブルーチンを実行する(S18)。これら何れかのサブルーチンの実行後、システム制御部25は、上記タイマを再スタートさせて(S19)、S3に戻る。
ここで、S13の再生処理、S14の早送り処理、S15の早戻し処理、S16の停止処理、S17のメニュー変更処理、及びS18の消去処理の各処理は、周知の技術手段を用いて実施できるものであり、また、本一実施形態の内容に直接関係しないので、ここでの詳しい説明は省略する。
次に、本一実施形態の音声記録再生装置の録音処理について更に説明する。図4は、図2の構成のうちで、特に録音処理に係る詳細な構成について示す図である。
図2のマイクロフォン(MIC)20から出力される音声信号(VIN)は、オペアンプ40、コンデンサC1及びC2、抵抗R1及びR2で構成された増幅回路(上記マイクアンプ(AMP)21に対応している)21に入力される。この図4の増幅回路21では、入力された音声信号(VIN)がおよそR2/R1倍に増幅され、これによって得られた音声信号(VLO)がローパスフィルタ(LPF)22に出力される。
ここで、増幅によって得られた音声信号(VLO)の振幅が後述するA/D変換器23の入力ダイナミックレンジを超えないように、増幅回路21の入出力間には、負帰還回路で構成されたオートゲインコントローラ(AGC)42が付加されている。このオートゲインコントローラ(AGC)42によって、A/D変換器23への音声信号の過入力が自動的に抑制される。
ローパスフィルタ(LPF)22は、サンプリング周波数の半分以下、例えばサンプリング周波数のおよそ0.45倍、のカットオフ周波数で動作するアンチエイリアス用のフィルタである。増幅回路21から出力される音声信号(VLO)は、ローパスフィルタ(LPF)22を通過することにより、量子化に不必要な高い周波数帯域の音声信号が減衰除去される。このローパスフィルタ(LPF)22を通過した、カットオフ周波数よりも低い周波数帯域の音声信号は、後段のA/D変換器(ADC)23において、サンプリング周期(サンプリング周波数の逆数である)毎に量子化(A/D変換)される。このときの量子化ビット数は少なくとも14ビット以上である。A/D変換器(ADC)23で得られたデジタル音声信号はデジタル信号処理部(DSP)24とマグニチュードコンパレータ45とに出力される。
ところで、ローパスフィルタ(LPF)22、A/D変換器(ADC)23、及びデジタル信号処理部(DSP)24には、サンプリング周波数として高ビットレート用fs、または低ビットレート用fsの何れか1波のみが供給される。即ち、システム制御部25を構成するCPU47からセレクタ46に入力されるfs選択信号により、ビットレートに応じたサンプリング周波数が択一的に、ローパスフィルタ(LPF)22、A/D変換器(ADC)23、及びデジタル信号処理部(DSP)24に供給される。つまり、CPU47とセレクタ46とで図1のサンプリング周波数選択部3を構成している。ここで、高ビットレート用fsは、低ビットレート用fsよりも高い周波数であるとする。
図1の符号化部4に対応するデジタル信号処理部(DSP)24においては、CPU47によって予め指定された音声データの圧縮率とセレクタ46において選択されたサンプリング周波数の組み合わせとに従って、デジタル音声信号が所定ビットレートの音声データに符号化される。
もちろん言うまでもなく、セレクタ46において選択できるサンプリング周波数は2波に限るものではなく、例えば、3波以上の固定周波数の中から選択できるようにしても良い。また、セレクタ46の代わりにPLLを用いて任意の周波数を供給できるようにしても良い。このように供給できるサンプリング周波数の数を増やすことにより、幅広いビットレートの選択に対応させることができる。
また、図1の音声信号レベル検出部1に対応するマグニチュードコンパレータ45では、A/D変換器(ADC)23から出力されるデジタル音声信号が所定の上側閾値(+VTH)及び下側閾値(−VTH)に対してどれだけ大きいか又は小さいかの大小比較が、サンプリング周期毎に行われる。マグニチュードコンパレータ45での検出結果は、CPU47に音声信号レベル検出信号として出力される。
具体的には、図5に示す、A/D変換器23のダイナミックレンジ内(VCC>ADIN(MAX)、ADIN(MIN)>GND)で、オペアンプ40の動作基準電圧(AVREF)を基準として対称に振動している部分の音声信号(VLO)の大小比較を行う。この大小比較において、図2のマイクロフォン(MIC)20に入力される音声が大きいときには、音声信号(VLO)が上側閾値(+VTH)及び下側閾値(−VTH)をそれぞれ超えた振幅で振動するので、マグニチュードコンパレータ45からは、ADIN(MAX)>VLO≧+VTH、及び−VTH≧VLO>ADIN(MIN)であることを示す音声信号レベル検出信号が出力される。逆に、図2のマイクロフォン(MIC)20に入力される音声が比較的小さいときには、音声信号(VLO)が上側閾値(+VTH)と下側閾値(−VTH)の範囲内の振幅で振動するので、マグニチュードコンパレータ45からは、+VTH>VLO>−VTHであることを示す音声信号レベル検出信号が出力される。
以下、図6を参照して録音処理について説明する。図6は録音処理について示すフローチャートである。図6の処理は、システム制御部25内のCPU47によって行われるが、ここではシステム制御部25が行うとして以下の説明を続ける。
録音処理が開始すると、システム制御部25は、最初にマイク感度(高/低)、録音モード(自動/標準/ロング)、ファイルナンバー、及び音声データを記録する音声データ記録領域における記録開始アドレス等の各種情報をインデックス情報記録領域に記録する(S30)。ここで、録音モードは、操作者が意図的に「標準」又は「ロング」を選択していない限りは「自動」が選択されるものである。
次に、システム制御部25は、LBRフラグを0にクリアし(S31)、更にRJFフラグを0にクリアする(S32)。ここで、LBRフラグは、後述する録音対象判定処理において、高ビットレート用fsから低ビットレート用fsへの切り換えが行われたときにセットされるサインフラグである。また、RJFフラグは、録音対象判定処理が完了したときにセットされるサインフラグである。
S32の後に、システム制御部25は、サンプリング周波数として高ビットレート用fsが選択されるように、fs選択信号を出力する(S33)。つまり、録音モードが「自動」である場合には録音動作開始時に必ず高ビットレート用fsが選択される。なお、本一実施形態では録音モード「標準」の場合が高ビットレート用fsに対応し、「ロング」の場合が低ビットレート用fsに対応している。
以上の処理の後、マイクロフォン(MIC)20から出力されたアナログの音声信号がサンプリング周期毎に量子化(A/D変換)される(S34)。この後、システム制御部25は、RJFフラグの状態判定を行う(S35)。S35の判定において、RJFフラグ=0のときは、S41以後の録音対象判定のシーケンスに移行する。録音対象判定のシーケンスにおいては、まず図4のマグニチュードコンパレータ45により、量子化された音声信号のレベル検出がサンプリング周期毎に行われる(S41)。ここで、S41の音声信号のレベル検出は、録音開始からごく僅かな所定時間、例えば録音開始から30秒間程度行えば良い。次に、システム制御部25は、録音開始から上記所定時間が経過したか否かを判定する(S42)。S42の判定において、所定時間が経過していない場合には、S34に戻る。
一方、S42の判定において、所定時間が経過した場合には、S42をS43に分岐して、システム制御部25は、S42の所定時間内に採集した音声信号レベル検出信号を基にして録音対象を判定する(S43)。具体的には、S42の所定時間内に採集された音声信号レベル検出信号のうちで所定レベル以上(例えば、ADIN(MAX)>VLO≧+VTH、及び−VTH≧VLO>ADIN(MIN))の音声信号レベル検出信号の検出回数により録音対象を判定する。
ここで、録音対象は、少なくとも「会議録音」と「口述録音」とに大別できれば良い。一般に、「会議録音」の場合は、マイクロフォン(MIC)20に入感する音声が弱く小さいので、所定レベル以上の音声信号レベル検出信号の検出回数が少なくなる。逆に、「口述録音」の場合は、マイクロフォン(MIC)20に入感する音声が強く大きいので、所定レベル以上の音声信号レベル検出信号の検出回数が「会議録音」に比べて多くなる。そこで、S43においては、説明を簡単にするために、所定レベル以上の音声信号レベル検出信号の検出回数が所定回数以上である場合には、録音対象が「口述録音」であり、そうでない場合には録音対象が「会議録音」であると判定する。
なお、S42の所定時間内に採集した所定レベル以上の音声信号レベル検出信号の検出回数と録音対象毎に実測された所定レベル以上の音声信号レベル検出信号の検出回数の平均値とを比較することにより録音対象を判定しても良い。この場合には、システム制御部25は、所定時間内に採集された所定レベル以上の音声信号レベル検出信号の検出回数に最も近い検出回数平均値を検出し、この検出回数平均値に対応する録音対象を現在の録音対象と判定する。ここで、録音対象毎に実測された所定レベル以上の音声信号レベル検出信号の検出回数平均値は、フィールドテスト等の実測によって求めれば良く、システム制御部25内のCPU47に設けられた図示しないプログラムメモリに既定値として記憶させておけば良い。
更に録音対象の判定精度の向上を狙うなら、音声信号の検出レベルの閾値を複数設けたり、音声信号の検出間隔及び検出回数等を統計的に算術処理して、モデル的な録音対象との相関性から録音対象を類推しても良い。
S43の判定において、所定レベル以上の音声信号レベル検出信号の検出回数が所定回数以上でない場合には、S43をS44に分岐して、システム制御部25は、録音対象が「会議録音」であると判定する。「会議録音」の場合は、マイクロフォン(MIC)20に入感する音声が弱く小さいので、録音環境下の雰囲気や複数話者の声の重畳がクリアに録音できるように、サンプリング周波数として高ビットレート用fsが選択されるように、fs選択信号を出力する(S44)。その後、S47に移行する。一方、S43の判定において、所定レベル以上の音声信号レベル検出信号の検出回数が所定回数以上である場合には、S43をS45に分岐して、システム制御部25は、録音対象が「口述録音」であると判定する。「口述録音」の場合は、マイクロフォン(MIC)20に入感する音声が強く大きいので、サンプリング周波数として低ビットレート用fsが選択されるように、fs選択信号を出力する(S45)。低ビットレート用fs選択時には、LBRフラグを1にセットする(S46)。
以上の処理の後、システム制御部25は、RJFフラグを1にセットして(S47)、S34に戻る。
一方、S35の判定において、RJFフラグが1の場合には、S35をS36に分岐して、デジタル信号処理部(DSP)24による符号化が行われ、これによって得られた音声データが記録部(メモリ)30に記録される(S36)。ここで、符号化そのものはフレーム単位で、音声データ所定フレーム数に達するまで連続的に行われる。つまり、CPU47の図示しないバッファメモリに記憶された音声データが所定フレーム数に達した場合に、これら所定フレーム数の音声データが記録部(メモリ)30の音声データ記録領域に記録される。例えば、14ビット/フレームの音声信号を4ビット/フレームまで符号化した音声データを記録部(メモリ)30へ512バイト単位で書き込む場合、所定フレーム数は1024になる。
次に、システム制御部25は、停止スイッチがオンされたか否かを判定する(S37)。S37の判定において、停止スイッチがオンされるまで、S34からS36の処理が繰り返される。一方、S37の判定において、停止スイッチがオンされた場合には、S37をS38に分岐して、システム制御部25は、LBRフラグの状態判定を行う(S38)。S38の判定において、LBRフラグ=0のときは、システム制御部25は、そのまま録音終了処理を実行して(S40)、録音を終了する。
一方、S38の判定において、LBRフラグ=1のときは、高ビットレート用fsでの録音がなされた録音開始からS42の所定時間経過までの間の音声データを、所定時間経過後に録音した音声データと等価な低ビットレート用fsの音声データに変換する(S39)。その後にシステム制御部25は、録音終了処理を実行して(S40)、録音を終了する。ここで、例えば、サンプリング周波数が、高ビットレート用fs=16kHz、低ビットレート用fs=8kHzのとき、もしワークエリアとして利用できるメモリ容量に余裕があるならば、録音開始から所定時間経過までの量子化後のデジタル音声信号を、図4のCPU47に設けられたバッファメモリ、または図2の記録部(メモリ)30に一時的に記憶しても良い。例えば、上記所定時間を30秒とすると、30秒間の14ビットのデジタル音声信号の書き込みに必要なメモリ容量は、僅かに(14ビット×16kHz×30秒)÷8ビット=840kバイトである。仮に記録部(メモリ)30の容量が1Gバイトもあれば、840kバイトの消費は0.1%以下であり、音声データの記録(即ち録音時間)を著しく圧迫することはない。
また、低ビットレートの音声データへの変換は、例えば記録部(メモリ)30のワークエリアに一時的に書き込まれたデジタル音声信号を先頭アドレスから順次読み出し、デジタル信号処理部(DSP)24で低ビットレート用fs=8kHzに対応した符号化を行ってから、記録部(メモリ)30において対応するファイルナンバーの音声データ記録領域に、変換後の音声データを順次再記録すれば良い。もちろん、デジタル信号処理部(DSP)24の処理能力が高ければ、記録部(メモリ)30の音声データ記録領域から直接的に変換対象の音声データを読み出し、デジタル信号処理部(DSP)24で低ビットレート用fsに対応した音声データに変換して記録部(メモリ)30に再記録しても良い。例えば、MP3形式で録音した録音時間が30秒、ビットレートが64kbpsの音声データを、低ビットレートの32kbpsの音声データに再符号化する場合も、数秒以内に上記一連の処理が完了すれば、操作者がストレスを感じることはない。
ここで、音声データに関する録音モード(標準/ロング)、音声データ記録領域における記録開始アドレス等の各種インデックス情報の更新は、S39の低ビットレートへの変換終了後に行う。
以上の説明のように、本一実施形態によれば、録音時に、録音対象に最適なビットレートが自動的に選択されるので、操作者は録音行為に集中することができる。また、録音対象毎に、録音品質が一定に保たれるので、メモリ使用に無駄が生じない。
以上実施形態に基づいて本発明を説明したが、本発明は上記した実施形態に限定されるものではなく、本発明の要旨の範囲内で種々の変形や応用が可能なことは勿論である。
さらに、上記した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件の適当な組合せにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成も発明として抽出され得る。
1…音声信号レベル検出部、2…録音対象判定部、3…サンプリング周波数選択部、4…符号化部、20…マイクロフォン(MIC)、21…マイクアンプ(AMP)、22,27…ローパスフィルタ(LPF)、22…デジタル信号処理部、23…A/D変換器(ADC)、24…デジタル信号処理部(DSP)、25…システム制御部、26…D/A変換器(DAC)、28…パワーアンプ(AMP)、29…スピーカ、30…記録部(メモリ)、31…操作部、32…表示部、40…オペアンプ、42…オートゲインコントローラ(AGC)、45…マグニチュードコンパレータ、46…セレクタ、47…CPU
Claims (4)
- 入力された音声信号と所定の判定基準値とを大小比較して、上記判定基準値以上の音声信号を検出する音声信号レベル検出手段と、
所定時間内に上記音声信号レベル検出手段により検出された上記判定基準値以上の音声信号の入力回数に基づいて録音対象を判定する録音対象判定手段と、
上記録音対象判定手段による判定結果に基づいて録音品質が最適になるようにサンプリング周波数を選択するサンプリング周波数選択手段と、
上記サンプリング周波数選択手段で選択されたサンプリング周波数に応じたビットレートの音声データに上記入力された音声信号を符号化する符号化手段と、
を具備することを特徴とする音声記録再生装置。 - 上記サンプリング周波数選択手段は、録音動作の開始時には、高音質のビットレートに対応するサンプリング周波数を選択し、上記録音対象判定手段によって録音対象が判定された後は、上記録音対象判定手段による判定結果に基づいたサンプリング周波数を選択することを特徴とする請求項1に記載の音声記録再生装置。
- 上記符号化手段は、録音動作の開始時には高音質のビットレートで上記入力された音声信号を符号化し、上記録音対象判定手段によって録音対象が判定された後、上記録音動作の開始時のビットレートと録音対象が判定された後のビットレートとが異なる場合には、上記録音動作の開始時のビットレートで符号化された音声データを、録音対象が判定された後のビットレートで符号化し直すことを特徴とする請求項1に記載の音声記録再生装置。
- 上記録音対象は、少なくとも口述録音と会議録音の何れかを含み、
上記サンプリング周波数選択手段は、上記録音対象判定手段によって上記録音対象が口述録音であることが判定された場合に低音質のビットレートに対応するサンプリング周波数を選択し、上記録音対象判定手段によって上記録音対象が会議録音であることが判定された場合に高音質のビットレートに対応するサンプリング周波数を選択することを特徴とする請求項1に記載の音声記録再生装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005333036A JP2007140063A (ja) | 2005-11-17 | 2005-11-17 | 音声記録再生装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005333036A JP2007140063A (ja) | 2005-11-17 | 2005-11-17 | 音声記録再生装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2007140063A true JP2007140063A (ja) | 2007-06-07 |
Family
ID=38203009
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005333036A Pending JP2007140063A (ja) | 2005-11-17 | 2005-11-17 | 音声記録再生装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2007140063A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010164735A (ja) * | 2009-01-15 | 2010-07-29 | Kyocera Corp | 音声記録装置及び通信端末 |
| JP2013527490A (ja) * | 2010-04-08 | 2013-06-27 | クゥアルコム・インコーポレイテッド | モバイルデバイスのためのスマートオーディオロギングのシステムおよび方法 |
-
2005
- 2005-11-17 JP JP2005333036A patent/JP2007140063A/ja active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010164735A (ja) * | 2009-01-15 | 2010-07-29 | Kyocera Corp | 音声記録装置及び通信端末 |
| JP2013527490A (ja) * | 2010-04-08 | 2013-06-27 | クゥアルコム・インコーポレイテッド | モバイルデバイスのためのスマートオーディオロギングのシステムおよび方法 |
| JP2014195275A (ja) * | 2010-04-08 | 2014-10-09 | Qualcomm Incorporated | モバイルデバイスのためのスマートオーディオロギングのシステムおよび方法 |
| US9112989B2 (en) | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
| JP2016180988A (ja) * | 2010-04-08 | 2016-10-13 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | モバイルデバイスのためのスマートオーディオロギングのシステムおよび方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6769603B2 (en) | Data recording and reproducing apparatus and data reproducing apparatus | |
| JP2011198348A (ja) | 録音装置 | |
| JP3569266B2 (ja) | 再生装置及び省電力方法 | |
| JP2011150060A (ja) | 録音装置 | |
| JP2007140063A (ja) | 音声記録再生装置 | |
| JP2008241850A (ja) | 録音または再生装置 | |
| JP2005221565A (ja) | 音声データファイル格納方法および録音処理装置 | |
| JP3963701B2 (ja) | 音声記録再生装置 | |
| JP3727689B2 (ja) | ディジタル音声記録再生装置 | |
| JP4187444B2 (ja) | 音声記録再生装置 | |
| US20040028384A1 (en) | Digital recording/reproducing apparatus | |
| US20040018004A1 (en) | Audio recording and playback device | |
| JP2001235566A (ja) | 半導体レコーダ | |
| JP4747697B2 (ja) | 再生装置及び再生方法並びにリムーバブルメモリ用電子機器 | |
| JP2006303672A (ja) | 音声再生装置及び音声再生システム | |
| JP2008292684A (ja) | 音声記録再生装置 | |
| JP2002315087A (ja) | データ処理装置 | |
| JP2006221755A (ja) | 記録再生装置 | |
| JPH103300A (ja) | ディジタル音声記録再生装置 | |
| JPH06332500A (ja) | 可変速再生機能付音声再生装置 | |
| JP2001188562A (ja) | 音声記録再生装置、周辺装置、これら装置を備える音声記録再生システムおよび音声データ処理プログラムを記録した記録媒体 | |
| JP2007072202A (ja) | データ記録装置および音声記録再生装置 | |
| JP2000206993A (ja) | 音声記録装置、音声再生装置、音声処理装置 | |
| JP2000227485A (ja) | 時計装置 | |
| JP2003032622A (ja) | データ記録再生装置 |