[go: up one dir, main page]

JPH11175096A - 音声信号処理装置 - Google Patents

音声信号処理装置

Info

Publication number
JPH11175096A
JPH11175096A JP9340256A JP34025697A JPH11175096A JP H11175096 A JPH11175096 A JP H11175096A JP 9340256 A JP9340256 A JP 9340256A JP 34025697 A JP34025697 A JP 34025697A JP H11175096 A JPH11175096 A JP H11175096A
Authority
JP
Japan
Prior art keywords
sentence
data
audio signal
identification code
converter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9340256A
Other languages
English (en)
Inventor
Terunori Shimokawa
輝典 下川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9340256A priority Critical patent/JPH11175096A/ja
Publication of JPH11175096A publication Critical patent/JPH11175096A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 自動的かつ定量的に文章了解度を評価する音
声信号処理装置を実現する。 【解決手段】 DAT1から出力される音声信号は音声
認識装置12に入力され、この装置12からアナログ出
力される評価用文章(音声信号)はスピーカ11から放
音される一方、A/D変換器5を介して評価用文章デー
タに変換された後、ID付加器6にてID付加されてか
ら文章データ比較器7に供給され、上述した構成要素2
〜4を介して入力される基準文章データと1文づつ比較
される。そして、文章データ比較器7では各文毎の比較
結果を記憶して行き、その記憶内容に基づき表示器10
に比較結果を100分率表示させる。これにより、自動
的かつ定量的に文章了解度を評価することが可能にな
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識技術に関
し、特に、文章了解度を自動的に評価し得る音声信号処
理装置に関する。
【0002】
【従来の技術】従来より、音声認識技術を用いた音声編
集装置や音声入力式文章処理装置が知られており、この
種の技術については、例えば、特開昭61−23809
8号公報や特開昭62−191896号公報に開示され
ている。これら公報に開示される音声編集装置では、評
価用音声信号源から抽出した単語間の無音区間を低レベ
ル雑音信号によって補間し、音声検出しきい値を低レベ
ル雑音に保つようにして本来の音声信号区間を正常に検
出して音声認識率を向上させるようにしている。一方、
音声入力式文章処理装置では、予め複数人の音声パター
ンを登録しておき、入力音声パターンとこれら登録パタ
ーンとをマッチングし、最もマッチング率が高い登録音
声パターンを自動的に抽出して音声認識するようになっ
ている。
【0003】さて、上述した各装置で実現される音声認
識技術を用いて文章了解度を評価するには、例えば、図
4に図示するように、DATあるいはテープレコーダに
記録された文章(音声)を再生し、これを音声認識技術
が適用される音声信号処理装置に入力して音声認識を施
し、その結果を再び音声としてスピーカより出力するこ
とで、人間の聴覚に基づき文章了解度を判定する。
【0004】
【発明が解決しようとする課題】ところで、上述した音
声信号処理装置では、最終的には人間の聴覚に頼って文
章了解度を評価する為、定性的な評価しか行えず、自動
的かつ定量的評価を行うことができない、という問題が
ある。
【0005】そこで本発明は、このような事情に鑑みて
なされたもので、自動的かつ定量的に文章了解度を評価
することができる音声信号処理装置を提供することを目
的としている。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に記載の発明では、再生される音声信号を
基準となる第1の文章データに変換する変換手段と、こ
の変換手段の出力に対して識別符号を付加する第1の符
号付加手段と、前記音声信号から評価用の第2の文章デ
ータを生成する生成手段と、この生成手段の出力に対し
て識別符号を付加する第2の符号付加手段と、前記第1
および第2の符号付加手段を介して識別符号が付加され
た第1および第2の文章データについて、対応する識別
符号毎に文章比較して文章了解度を決定する文章比較手
段とを具備することを特徴とする。
【0007】上記請求項1に従属する請求項2に記載の
発明によれば、前記第1および第2の符号付加手段は、
無音区間中に識別符号を付加することを特徴としてい
る。また、上記請求項1に従属する請求項3に記載の発
明によれば、前記文章比較手段は、1つの文に対応した
文章データを形成する全ビット中に所定の比率で比較結
果が一致しない時に文章了解度を「良」と判定し、それ
以上の時には「否」と判定することを特徴とする。
【0008】本発明では、基準文章データと評価用文章
データとに比較対象となる1文毎にIDを付加して比較
判定を容易に行えるようにしたので、自動的かつ定量的
に文章了解度を評価することができる。
【0009】
【発明の実施の形態】本発明による音声信号処理装置
は、音声認識する各種システムに適用され得る。以下で
は、本発明の実施の形態である音声信号処理装置を実施
例とし、図面を参照して説明する。 (1)構成 図1は、本発明による一実施例の構成を示すブロック図
である。この図において、1は基準となる文章(音声信
号)が記録されるDATである。2はDAT1から入力
されるアナログ信号形式の音声信号を予め決められた符
号化方式にてデジタル信号形式の音声データ(以下、こ
れを基準文章データという)に変換する一方、この基準
文章データを予め決められた復号化方式にて基準文章信
号に復号して出力する基準音声符号化器である。なお、
ここで使用する基準音声符号化器2は、供試器となる音
声認識装置12(後述する)にて使用する音声符号化器
と同等の性能を有していることを前提とする。
【0010】3はA/D変換器であり、上記基準音声符
号化器2にて符号化/復号化された基準文章信号を再び
基準文章データに変換して出力する。また、このA/D
変換器3では、有音/無音の判別を図2(イ)、(ロ)
に図示する条件で行うように構成されている。すなわ
ち、入力されるアナログ信号が図2(イ)のA点で示す
レベル内にある場合には、A/D変換器3はそれを無音
区間と判断し、A/D変換の際に無音区間を表わすべく
LOWレベルを出力する。4はID付加器である。この
ID付加器4は、図2(ハ)に示すように、A/D変換
器3の出力が、3秒以上の無音区間が続いてから次の基
準文章データが入力された時に、その基準文章データの
先頭にIDを付加する。こうしてID付加された基準文
章データは後述する文章データ比較器7に供給され、基
準文章データとして記憶される。
【0011】8はスイッチ制御器であり、試験文章数を
選択するスイッチS4、S5と開始スイッチS2,S3
とから構成される。本実施例の場合、試験文章数を20
文に選択する際にはスイッチS4を、50文を選択する
にはスイッチS5を操作する。文章データ比較器7は、
予め記憶してある基準文章データとID付加器6から入
力される評価用文章データとを比較してその結果を比較
結果記憶器9に出力する。なお、ここで言う評価用文章
データとは、前述のDAT1から出力される音声信号を
音声認識装置12から出力させたものである。
【0012】文章データ比較器7では、図3(イ)、
(ロ)に図示する手法で文章データを比較する。ここ
で、図3(ロ)のa部は、図3(イ)と比較した場合、
誤りがあるが、人間の聴覚では1ビット程度の誤りを識
別できないので、比較の基準としては1文章データ(1
文)の全ビット中に0.1%以内の誤りであれば
「良」、それ以上の誤りがあれば「否」とする判定基準
を設定しておき、これに基づき1文毎を比較する。文章
データ比較器7より1文毎の比較結果を受ける比較結果
記憶部9では、各文毎の比較結果を記憶して行き、その
記憶内容に基づき表示器10に比較結果を100分率表
示させる。
【0013】このような構成によれば、まずスイッチ制
御器8にて試験文章数を選択してからスイッチS1を試
験側にセットした後、スイッチ制御器8のスイッチS
2、S3のいずれかを操作すると、文章了解度を評価す
る試験が開始される。DAT1から出力される音声信号
は音声認識装置12に入力され、この装置12からアナ
ログ出力される評価用文章(音声信号)はスピーカ11
から放音される一方、A/D変換器5を介して評価用文
章データに変換された後、ID付加器6にてID付加さ
れてから文章データ比較器7に供給され、上述した構成
要素2〜4を介して入力される基準文章データと1文づ
つ比較される。そして、上述したように、文章データ比
較器7では各文毎の比較結果を記憶して行き、その記憶
内容に基づき表示器10に比較結果を100分率表示さ
せる。これにより、自動的かつ定量的に文章了解度を評
価することが可能になっている。
【0014】以上のように、本発明によれば、基準文章
データと評価用文章データとに比較対象となる1文毎に
IDを付加して比較判定を容易に行えるようにしたの
で、自動的かつ定量的に文章了解度を評価することがで
きる訳である。
【0015】
【発明の効果】本発明によれば、基準文章データと評価
用文章データとに比較対象となる1文毎にIDを付加し
て比較判定を容易に行えるようにしたので、自動的かつ
定量的に文章了解度を評価することができる。
【図面の簡単な説明】
【図1】本発明による一実施例の構成を示すブロック図
である。
【図2】基準文章データのデータ構成を説明するための
図である。
【図3】基準文章データと評価用文章データとの比較動
作を説明するための図である。
【図4】従来例を説明するための図である。
【符号の説明】
1 DAT 2 基準音声符号化器 3 A/D変換器 4 ID付加器 5 A/D変換器 6 ID付加器 7 文章データ比較器 8 スイッチ制御器 9 比較結果記憶器 10 表示器 11 スピーカ 12 音声認識装置

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 再生される音声信号を基準となる第1の
    文章データに変換する変換手段と、 この変換手段の出力に対して識別符号を付加する第1の
    符号付加手段と、 前記音声信号から評価用の第2の文章データを生成する
    生成手段と、 この生成手段の出力に対して識別符号を付加する第2の
    符号付加手段と、 前記第1および第2の符号付加手段を介して識別符号が
    付加された第1および第2の文章データについて、対応
    する識別符号毎に文章比較して文章了解度を決定する文
    章比較手段と、 を具備することを特徴とする音声信号処理装置。
  2. 【請求項2】 前記第1および第2の符号付加手段は、
    無音区間中に識別符号を付加することを特徴とする請求
    項1記載の音声信号処理装置。
  3. 【請求項3】 前記文章比較手段は、1つの文に対応し
    た文章データを形成する全ビット中に所定の比率で比較
    結果が一致しない時に文章了解度を「良」と判定し、そ
    れ以上の時には「否」と判定することを特徴とする音声
    信号処理装置。
JP9340256A 1997-12-10 1997-12-10 音声信号処理装置 Pending JPH11175096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9340256A JPH11175096A (ja) 1997-12-10 1997-12-10 音声信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9340256A JPH11175096A (ja) 1997-12-10 1997-12-10 音声信号処理装置

Publications (1)

Publication Number Publication Date
JPH11175096A true JPH11175096A (ja) 1999-07-02

Family

ID=18335202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9340256A Pending JPH11175096A (ja) 1997-12-10 1997-12-10 音声信号処理装置

Country Status (1)

Country Link
JP (1) JPH11175096A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009532742A (ja) * 2006-04-03 2009-09-10 ヴォコレクト・インコーポレーテッド 音声認識システムのパフォーマンスを評価および改善するための方法およびシステム
US8374870B2 (en) 2005-02-04 2013-02-12 Vocollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US8868421B2 (en) 2005-02-04 2014-10-21 Vocollect, Inc. Methods and systems for identifying errors in a speech recognition system
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
US10068566B2 (en) 2005-02-04 2018-09-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
JP2023514938A (ja) * 2019-12-23 2023-04-12 ディーティーエス・インコーポレイテッド ダイアログの了解度を評価する方法及び装置
US11837253B2 (en) 2016-07-27 2023-12-05 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9928829B2 (en) 2005-02-04 2018-03-27 Vocollect, Inc. Methods and systems for identifying errors in a speech recognition system
US8374870B2 (en) 2005-02-04 2013-02-12 Vocollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US8868421B2 (en) 2005-02-04 2014-10-21 Vocollect, Inc. Methods and systems for identifying errors in a speech recognition system
US9202458B2 (en) 2005-02-04 2015-12-01 Vocollect, Inc. Methods and systems for adapting a model for a speech recognition system
US10068566B2 (en) 2005-02-04 2018-09-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
JP2013232017A (ja) * 2006-04-03 2013-11-14 Vocollect Inc 音声認識システムのパフォーマンスを評価および改善するための方法およびシステム
JP2009532742A (ja) * 2006-04-03 2009-09-10 ヴォコレクト・インコーポレーテッド 音声認識システムのパフォーマンスを評価および改善するための方法およびシステム
US11810545B2 (en) 2011-05-20 2023-11-07 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US9697818B2 (en) 2011-05-20 2017-07-04 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US10685643B2 (en) 2011-05-20 2020-06-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US11817078B2 (en) 2011-05-20 2023-11-14 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
US11837253B2 (en) 2016-07-27 2023-12-05 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments
US12400678B2 (en) 2016-07-27 2025-08-26 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments
JP2023514938A (ja) * 2019-12-23 2023-04-12 ディーティーエス・インコーポレイテッド ダイアログの了解度を評価する方法及び装置

Similar Documents

Publication Publication Date Title
US7627471B2 (en) Providing translations encoded within embedded digital information
KR100852613B1 (ko) 오디오 신호들의 편집
JPH11175096A (ja) 音声信号処理装置
JP3092652B2 (ja) 音声再生装置
JP5223843B2 (ja) 情報処理装置およびプログラム
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JP2003157100A (ja) 音声通信方法及び装置、並びに音声通信プログラム
US6240383B1 (en) Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
JP2000206987A (ja) 音声認識装置
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
US6134519A (en) Voice encoder for generating natural background noise
JP2003259311A (ja) 映像再生方法、映像再生装置、映像再生プログラム
JP4793539B2 (ja) 符号変換方法及び装置とプログラム並びにその記憶媒体
JP3954288B2 (ja) 音声符号化信号変換装置
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JPH10133678A (ja) 音声再生装置
JPH1188549A (ja) 音声符号化/復号化装置
JP2002073093A (ja) オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体
JP4146949B2 (ja) 音声処理装置
JP3201327B2 (ja) 録音再生装置
JPH07334197A (ja) 音声符号化装置
JP2602641B2 (ja) 音声符号化方式
JPH02282299A (ja) 音声復号化装置
JPH08328598A (ja) 音声符号化・復号化装置
HK40065833A (zh) 用於检测待编解码的声音信号中的起音以及对检测到的起音进行编解码的方法和设备

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000613