JPH11175096A

JPH11175096A - 音声信号処理装置

Info

Publication number: JPH11175096A
Application number: JP9340256A
Authority: JP
Inventors: Terunori Shimokawa; 輝典下川
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1997-12-10
Filing date: 1997-12-10
Publication date: 1999-07-02

Abstract

(57)【要約】【課題】自動的かつ定量的に文章了解度を評価する音
声信号処理装置を実現する。【解決手段】ＤＡＴ１から出力される音声信号は音声
認識装置１２に入力され、この装置１２からアナログ出
力される評価用文章（音声信号）はスピーカ１１から放
音される一方、Ａ／Ｄ変換器５を介して評価用文章デー
タに変換された後、ＩＤ付加器６にてＩＤ付加されてか
ら文章データ比較器７に供給され、上述した構成要素２
〜４を介して入力される基準文章データと１文づつ比較
される。そして、文章データ比較器７では各文毎の比較
結果を記憶して行き、その記憶内容に基づき表示器１０
に比較結果を１００分率表示させる。これにより、自動
的かつ定量的に文章了解度を評価することが可能にな
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認識技術に関
し、特に、文章了解度を自動的に評価し得る音声信号処
理装置に関する。

【０００２】

【従来の技術】従来より、音声認識技術を用いた音声編
集装置や音声入力式文章処理装置が知られており、この
種の技術については、例えば、特開昭６１−２３８０９
８号公報や特開昭６２−１９１８９６号公報に開示され
ている。これら公報に開示される音声編集装置では、評
価用音声信号源から抽出した単語間の無音区間を低レベ
ル雑音信号によって補間し、音声検出しきい値を低レベ
ル雑音に保つようにして本来の音声信号区間を正常に検
出して音声認識率を向上させるようにしている。一方、
音声入力式文章処理装置では、予め複数人の音声パター
ンを登録しておき、入力音声パターンとこれら登録パタ
ーンとをマッチングし、最もマッチング率が高い登録音
声パターンを自動的に抽出して音声認識するようになっ
ている。

【０００３】さて、上述した各装置で実現される音声認
識技術を用いて文章了解度を評価するには、例えば、図
４に図示するように、ＤＡＴあるいはテープレコーダに
記録された文章（音声）を再生し、これを音声認識技術
が適用される音声信号処理装置に入力して音声認識を施
し、その結果を再び音声としてスピーカより出力するこ
とで、人間の聴覚に基づき文章了解度を判定する。

【０００４】

【発明が解決しようとする課題】ところで、上述した音
声信号処理装置では、最終的には人間の聴覚に頼って文
章了解度を評価する為、定性的な評価しか行えず、自動
的かつ定量的評価を行うことができない、という問題が
ある。

【０００５】そこで本発明は、このような事情に鑑みて
なされたもので、自動的かつ定量的に文章了解度を評価
することができる音声信号処理装置を提供することを目
的としている。

【０００６】

【課題を解決するための手段】上記目的を達成するた
め、請求項１に記載の発明では、再生される音声信号を
基準となる第１の文章データに変換する変換手段と、こ
の変換手段の出力に対して識別符号を付加する第１の符
号付加手段と、前記音声信号から評価用の第２の文章デ
ータを生成する生成手段と、この生成手段の出力に対し
て識別符号を付加する第２の符号付加手段と、前記第１
および第２の符号付加手段を介して識別符号が付加され
た第１および第２の文章データについて、対応する識別
符号毎に文章比較して文章了解度を決定する文章比較手
段とを具備することを特徴とする。

【０００７】上記請求項１に従属する請求項２に記載の
発明によれば、前記第１および第２の符号付加手段は、
無音区間中に識別符号を付加することを特徴としてい
る。また、上記請求項１に従属する請求項３に記載の発
明によれば、前記文章比較手段は、１つの文に対応した
文章データを形成する全ビット中に所定の比率で比較結
果が一致しない時に文章了解度を「良」と判定し、それ
以上の時には「否」と判定することを特徴とする。

【０００８】本発明では、基準文章データと評価用文章
データとに比較対象となる１文毎にＩＤを付加して比較
判定を容易に行えるようにしたので、自動的かつ定量的
に文章了解度を評価することができる。

【０００９】

【発明の実施の形態】本発明による音声信号処理装置
は、音声認識する各種システムに適用され得る。以下で
は、本発明の実施の形態である音声信号処理装置を実施
例とし、図面を参照して説明する。（１）構成図１は、本発明による一実施例の構成を示すブロック図
である。この図において、１は基準となる文章（音声信
号）が記録されるＤＡＴである。２はＤＡＴ１から入力
されるアナログ信号形式の音声信号を予め決められた符
号化方式にてデジタル信号形式の音声データ（以下、こ
れを基準文章データという）に変換する一方、この基準
文章データを予め決められた復号化方式にて基準文章信
号に復号して出力する基準音声符号化器である。なお、
ここで使用する基準音声符号化器２は、供試器となる音
声認識装置１２（後述する）にて使用する音声符号化器
と同等の性能を有していることを前提とする。

【００１０】３はＡ／Ｄ変換器であり、上記基準音声符
号化器２にて符号化／復号化された基準文章信号を再び
基準文章データに変換して出力する。また、このＡ／Ｄ
変換器３では、有音／無音の判別を図２（イ）、（ロ）
に図示する条件で行うように構成されている。すなわ
ち、入力されるアナログ信号が図２（イ）のＡ点で示す
レベル内にある場合には、Ａ／Ｄ変換器３はそれを無音
区間と判断し、Ａ／Ｄ変換の際に無音区間を表わすべく
ＬＯＷレベルを出力する。４はＩＤ付加器である。この
ＩＤ付加器４は、図２（ハ）に示すように、Ａ／Ｄ変換
器３の出力が、３秒以上の無音区間が続いてから次の基
準文章データが入力された時に、その基準文章データの
先頭にＩＤを付加する。こうしてＩＤ付加された基準文
章データは後述する文章データ比較器７に供給され、基
準文章データとして記憶される。

【００１１】８はスイッチ制御器であり、試験文章数を
選択するスイッチＳ４、Ｓ５と開始スイッチＳ２，Ｓ３
とから構成される。本実施例の場合、試験文章数を２０
文に選択する際にはスイッチＳ４を、５０文を選択する
にはスイッチＳ５を操作する。文章データ比較器７は、
予め記憶してある基準文章データとＩＤ付加器６から入
力される評価用文章データとを比較してその結果を比較
結果記憶器９に出力する。なお、ここで言う評価用文章
データとは、前述のＤＡＴ１から出力される音声信号を
音声認識装置１２から出力させたものである。

【００１２】文章データ比較器７では、図３（イ）、
（ロ）に図示する手法で文章データを比較する。ここ
で、図３（ロ）のａ部は、図３（イ）と比較した場合、
誤りがあるが、人間の聴覚では１ビット程度の誤りを識
別できないので、比較の基準としては１文章データ（１
文）の全ビット中に０．１％以内の誤りであれば
「良」、それ以上の誤りがあれば「否」とする判定基準
を設定しておき、これに基づき１文毎を比較する。文章
データ比較器７より１文毎の比較結果を受ける比較結果
記憶部９では、各文毎の比較結果を記憶して行き、その
記憶内容に基づき表示器１０に比較結果を１００分率表
示させる。

【００１３】このような構成によれば、まずスイッチ制
御器８にて試験文章数を選択してからスイッチＳ１を試
験側にセットした後、スイッチ制御器８のスイッチＳ
２、Ｓ３のいずれかを操作すると、文章了解度を評価す
る試験が開始される。ＤＡＴ１から出力される音声信号
は音声認識装置１２に入力され、この装置１２からアナ
ログ出力される評価用文章（音声信号）はスピーカ１１
から放音される一方、Ａ／Ｄ変換器５を介して評価用文
章データに変換された後、ＩＤ付加器６にてＩＤ付加さ
れてから文章データ比較器７に供給され、上述した構成
要素２〜４を介して入力される基準文章データと１文づ
つ比較される。そして、上述したように、文章データ比
較器７では各文毎の比較結果を記憶して行き、その記憶
内容に基づき表示器１０に比較結果を１００分率表示さ
せる。これにより、自動的かつ定量的に文章了解度を評
価することが可能になっている。

【００１４】以上のように、本発明によれば、基準文章
データと評価用文章データとに比較対象となる１文毎に
ＩＤを付加して比較判定を容易に行えるようにしたの
で、自動的かつ定量的に文章了解度を評価することがで
きる訳である。

【００１５】

【発明の効果】本発明によれば、基準文章データと評価
用文章データとに比較対象となる１文毎にＩＤを付加し
て比較判定を容易に行えるようにしたので、自動的かつ
定量的に文章了解度を評価することができる。

【図面の簡単な説明】

【図１】本発明による一実施例の構成を示すブロック図
である。

【図２】基準文章データのデータ構成を説明するための
図である。

【図３】基準文章データと評価用文章データとの比較動
作を説明するための図である。

【図４】従来例を説明するための図である。

【符号の説明】

１ＤＡＴ２基準音声符号化器３Ａ／Ｄ変換器４ＩＤ付加器５Ａ／Ｄ変換器６ＩＤ付加器７文章データ比較器８スイッチ制御器９比較結果記憶器１０表示器１１スピーカ１２音声認識装置

Claims

【特許請求の範囲】

【請求項１】再生される音声信号を基準となる第１の
文章データに変換する変換手段と、この変換手段の出力に対して識別符号を付加する第１の
符号付加手段と、前記音声信号から評価用の第２の文章データを生成する
生成手段と、この生成手段の出力に対して識別符号を付加する第２の
符号付加手段と、前記第１および第２の符号付加手段を介して識別符号が
付加された第１および第２の文章データについて、対応
する識別符号毎に文章比較して文章了解度を決定する文
章比較手段と、を具備することを特徴とする音声信号処理装置。
【請求項２】前記第１および第２の符号付加手段は、
無音区間中に識別符号を付加することを特徴とする請求
項１記載の音声信号処理装置。
【請求項３】前記文章比較手段は、１つの文に対応し
た文章データを形成する全ビット中に所定の比率で比較
結果が一致しない時に文章了解度を「良」と判定し、そ
れ以上の時には「否」と判定することを特徴とする音声
信号処理装置。