JP2005309065A - Speech recognition result output device - Google Patents
Speech recognition result output device Download PDFInfo
- Publication number
- JP2005309065A JP2005309065A JP2004125407A JP2004125407A JP2005309065A JP 2005309065 A JP2005309065 A JP 2005309065A JP 2004125407 A JP2004125407 A JP 2004125407A JP 2004125407 A JP2004125407 A JP 2004125407A JP 2005309065 A JP2005309065 A JP 2005309065A
- Authority
- JP
- Japan
- Prior art keywords
- recognized
- word
- output
- list
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】 音声認識機能により音声認識された所定の文言がそのまま視認可能に出力されることを防止することができる。
【解決手段】 音声認識された認識文言が、文言リストにおいて出力文字に対応付けられて登録されている場合にのみ(S4のY)、文言リストから当該認識文言に対応付けられている出力文字を抽出して(S5)、視認可能に出力(印字または表示)する(S6)。これにより、音声認識機能により音声認識された文言をそのまま視認可能に出力(印字または表示)せずに、例えば多岐の認識文言に対して同一の出力文字を文言リストにおいて対応付けることで、多岐の認識文言を同一の文言として視認可能に出力(印字または表示)することができるので、視認可能に出力(印字または表示)された文言に統一感があり、見た目も整然とし、整理/管理を容易にすることができる。
【選択図】 図7
PROBLEM TO BE SOLVED: To prevent a predetermined word recognized by a voice recognition function from being output as it is visible.
Only when a recognized word recognized by speech is registered in association with an output character in a word list (Y in S4), an output character associated with the recognized word from the word list is displayed. Extracted (S5) and output (printed or displayed) so as to be visible (S6). As a result, various recognitions can be made by associating the same output characters with various recognition words in the word list, for example, without directly outputting (printing or displaying) the words recognized by the voice recognition function. Since the text can be output (printed or displayed) in a visible manner as the same text, the text that has been output (printed or displayed) in a visible manner has a sense of unity, looks neat, and is easy to organize / manage can do.
[Selection] Figure 7
Description
本発明は、音声認識機能を搭載し、音声認識された認識文言を視認可能に出力する音声認識結果出力装置に関する。 The present invention relates to a speech recognition result output device that is equipped with a speech recognition function and outputs a speech recognition-recognized wording so as to be visible.
入力された音声に基づいて生成された音声デジタルデータを解析し、人間の声をテキストに変換する音声認識技術(例えば、特許文献1参照)はパーソナルコンピュータ等で活用されている。この音声認識技術によりテキストに変換された音声、すなわち音声認識された文言は、画面表示され、または印字されて活用される。 A speech recognition technology (for example, see Patent Document 1) that analyzes speech digital data generated based on input speech and converts human voice into text is used in personal computers and the like. The voice converted into text by this voice recognition technology, that is, the words that have been voice-recognized, are displayed on the screen or printed and utilized.
ところが、音声認識技術により音声認識された文言を画面表示または印字するにあたり、そのまま画面表示または印字しないほうが良い場合がある。 However, there are cases where it is better not to display or print the words recognized by the voice recognition technology as they are.
例えば、弁当店においては「北海道産 鮭弁当」と印字したい場合がある。しかしながら、「ホッカイサケ」「ホッカイシャケ」「ホッカイドウサケベン」等、人により入力語句はまちまちとなることが想定される。入力語句を統一した場合であっても、「サケ」「シャケ」の発音まで正しく発声できるとは限らない。また、練習することで正しく発声できていても、忙しい局面に立たされれば、語句を省いたり語句が戻ってしまったりする。このような場合、画面表示または印字された文言に統一感がなく、見た目も雑然とし、整理/管理がしにくくなる。 For example, in a bento restaurant, you may want to print “Hokkaido salmon lunch”. However, it is assumed that the input phrase varies from person to person, such as “hokkaisake”, “hokkaishake”, and “hokkaido usakeben”. Even when the input words are unified, it is not always possible to correctly speak up to the pronunciation of “salmon” and “salmon”. Also, even if you can speak correctly by practicing, if you are in a busy situation, you may omit words or return words. In such a case, there is no sense of unity in the words displayed on the screen or printed, the appearance is cluttered, and it becomes difficult to organize / manage.
また、弁当店において予約を受けた弁当の予約メモに客の名前が、呼び捨てになっていたり「さいとうちゃん」等になってしまっては、いつお客様の目に止まるとも限らないことから、好ましくない。しかしながら、店員が親しくなった客ほど、このようになってしまうことが多々ある。 Also, if the customer's name is abandoned or becomes “Saito-chan” in the reservation memo of the lunch box that has been reserved at the lunch box store, it will not always be noticeable by the customer, which is not preferable. . However, this is often the case for customers who are familiar with the store clerk.
このように、音声認識技術により音声認識された文言をそのまま画面表示または印字してしまった場合には、問題になってしまうことがある。 As described above, if the words recognized by the voice recognition technology are displayed or printed on the screen as they are, there may be a problem.
本発明は、音声認識機能により音声認識された所定の文言がそのまま視認可能に出力されることを防止することを目的とする。 An object of the present invention is to prevent a predetermined word recognized by a voice recognition function from being output as it is visible.
本発明は、視認可能に出力された文言を、統一感があり、見た目も整然とし、整理/管理が容易にすることを目的とする。 An object of the present invention is to make it easy to organize / manage words that are output in a visually recognizable manner with a sense of unity.
本発明は、敬語を使用するべき箇所に失礼な文言が視認可能に出力されることを防止することを目的とする。 An object of the present invention is to prevent a rude wording from being output in a visible manner at a location where honorifics should be used.
本発明は、音声認識機能を搭載し、音声認識された認識文言を視認可能に出力する音声認識結果出力装置において、予測した音声認識される認識文言に出力文字を対応付ける文言リストと、音声認識された認識文言に基づいて、前記文言リストを検索するリスト検索手段と、このリスト検索手段により前記文言リストに音声認識された認識文言が登録されていると判断した場合には、前記文言リストから当該認識文言に対応付けられている出力文字を抽出して視認可能に出力する出力手段と、を備える。 The present invention provides a speech recognition result output device that is equipped with a speech recognition function and outputs a speech recognition-recognized recognition word so as to be visible, a word list that associates output characters with a recognized recognition word that is recognized by speech, and a speech recognition If it is determined that a list search means for searching the word list based on the recognized word words and a recognized word word recognized by the list search means in the word list is registered, Output means for extracting an output character associated with the recognized wording and outputting it in a visually recognizable manner.
したがって、音声認識された認識文言が、文言リストにおいて出力文字に対応付けられて登録されている場合にのみ、文言リストから当該認識文言に対応付けられている出力文字が抽出されて視認可能に出力される。これにより、音声認識機能により音声認識された文言をそのまま視認可能に出力せずに、例えば多岐の認識文言に対して同一の出力文字を文言リストにおいて対応付けることで、多岐の認識文言を同一の文言として視認可能に出力することが可能になるので、視認可能に出力された文言に統一感があり、見た目も整然とし、整理/管理が容易になる。 Therefore, only when the recognized word recognized by speech is registered in association with the output character in the word list, the output character associated with the recognized word is extracted from the word list and output so as to be visible. Is done. As a result, without recognizing the speech recognized by the speech recognition function as it is, the same output characters are associated with the various recognized words in the word list, for example, so that the various recognized words can be matched. Can be output in a visually recognizable manner, so that the words output in a visually recognizable manner have a sense of unity, the appearance is orderly, and the organization / management becomes easy.
本発明は、音声認識機能を搭載し、音声認識された認識文言を視認可能に出力する音声認識結果出力装置において、予測した音声認識される認識文言に出力文字を対応付ける文言リストと、音声認識された認識文言に基づいて、前記文言リストを検索するリスト検索手段と、このリスト検索手段により前記文言リストに音声認識された認識文言が登録されていると判断した場合には、前記文言リストから当該認識文言に対応付けられている出力文字を抽出して視認可能に出力し、前記文言リストに音声認識された認識文言が登録されていないと判断した場合には、当該認識文言をそのまま出力文字として視認可能に出力する出力手段と、を備える。 The present invention provides a speech recognition result output device that is equipped with a speech recognition function and outputs a speech recognition-recognized recognition word so as to be visible, a word list that associates output characters with a recognized recognition word that is recognized by speech, and a speech recognition If it is determined that a list search means for searching the word list based on the recognized word words and a recognized word word recognized by the list search means in the word list is registered, When an output character associated with the recognized word is extracted and output so as to be visible, and when it is determined that no recognized word recognized in the word list is registered, the recognized word is used as an output character as it is. Output means for outputting in a visually recognizable manner.
したがって、音声認識された認識文言が、文言リストにおいて出力文字に対応付けられて登録されている場合には、文言リストから当該認識文言に対応付けられている出力文字が抽出されて視認可能に出力され、文言リストにおいて出力文字に対応付けられて登録されていない場合には、当該認識文言がそのまま出力文字として視認可能に出力される。これにより、音声認識機能により音声認識された文言をそのまま視認可能に出力せずに、例えば一定の意味を有する認識文言群(「サン」、「クン」、「チャン」等)についてはその意味の標準的な出力文字(「様」等の敬称)を文言リストにおいて対応付けることで、敬語を使用するべき箇所に失礼な文言が視認可能に出力されることを防止することが可能になる。 Therefore, when a recognized speech word recognized in association with an output character is registered in the word list, the output character associated with the recognized word is extracted from the word list and output in a visible manner. If the word list is not registered in association with the output character, the recognized word is output as an output character so as to be visible. As a result, the words recognized by the voice recognition function are not output so as to be visible as they are, but for example, a recognized word group having a certain meaning (“San”, “Kun”, “Chan”, etc.) By associating a standard output character (a title such as “sama”) in the word list, it is possible to prevent a rude word from being output in a visible manner at a location where the honorific should be used.
本発明は、音声認識機能を搭載し、音声認識された認識文言を視認可能に出力する音声認識結果出力装置において、予測した音声認識される認識文言を格納する文言リストと、音声認識された認識文言に基づいて、前記文言リストを検索するリスト検索手段と、このリスト検索手段により前記文言リストに音声認識された認識文言が登録されていると判断した場合には、当該認識文言の出力を禁止し、前記文言リストに音声認識された認識文言が登録されていないと判断した場合には、当該認識文言をそのまま出力文字として視認可能に出力する出力手段と、を備える。 The present invention relates to a speech recognition result output device that is equipped with a speech recognition function and outputs a speech recognition-recognized recognition word so that it can be visually recognized. Based on the wording, when it is judged that the list searching means for searching the word list and the recognized word recognition recognized in the word list by the list searching means is registered, the output of the recognized wording is prohibited. And an output unit that outputs the recognized word as it is as an output character when it is determined that the recognized word recognized by voice recognition is not registered in the word list.
したがって、音声認識された認識文言が、文言リストにおいて出力文字に対応付けられて登録されている場合には、当該認識文言の出力が禁止され、文言リストにおいて出力文字に対応付けられて登録されていない場合には、当該認識文言がそのまま出力文字として視認可能に出力される。これにより、音声認識機能により音声認識された文言をそのまま視認可能に出力せずに、例えば一定の意味を有する認識文言群(「サン」、「クン」、「チャン」等)が実際には「様」等の敬称として出力すべきである場合には、当該認識文言の出力が禁止されるので、敬語を使用するべき箇所に失礼な文言が視認可能に出力されることを防止することが可能になる。 Therefore, when a recognized word recognized by speech is registered in association with an output character in the word list, output of the recognized word is prohibited and registered in association with the output character in the word list. If not, the recognized word is output as an output character so as to be visible. As a result, the words recognized by the voice recognition function are not output so as to be visible as they are, and for example, a recognized word group having a certain meaning (“San”, “Kun”, “Chan”, etc.) is actually “ When it should be output as a title such as “Sama”, the output of the recognized wording is prohibited, so it is possible to prevent the rude wording from being output in a place where the honorific should be used. become.
本発明によれば、音声認識機能により音声認識された所定の文言がそのまま視認可能に出力されることを防止することができる。 According to the present invention, it is possible to prevent a predetermined word recognized by the voice recognition function from being output as it is.
本発明によれば、視認可能に出力された文言を、統一感があり、見た目も整然とし、整理/管理が容易にすることができる。 According to the present invention, it is possible to easily arrange / manage the words that are output in a visually recognizable manner with a sense of unity and an orderly appearance.
本発明によれば、敬語を使用するべき箇所に失礼な文言が視認可能に出力されることを防止することができる。 According to the present invention, it is possible to prevent a rude wording from being output in a visible manner at a location where honorifics should be used.
[第一の実施の形態]
本発明の第一の実施の形態を図1ないし図8に基づいて説明する。本実施の形態は、音声認識結果出力装置として携帯可能なポータブルプリンタを適用したものである。
[First embodiment]
A first embodiment of the present invention will be described with reference to FIGS. In the present embodiment, a portable printer is applied as a voice recognition result output device.
ここで、図1は音声メモプリンタ1をラベル排出側から示す外観斜視図、図2は音声メモプリンタ1をオペレータ装着側から示す外観斜視図、図3は音声メモプリンタ1の内部構造を示す水平断面図である。 1 is an external perspective view showing the voice memo printer 1 from the label discharge side, FIG. 2 is an external perspective view showing the voice memo printer 1 from the operator mounting side, and FIG. 3 is a horizontal view showing the internal structure of the voice memo printer 1. It is sectional drawing.
図1ないし図3に示すように、携帯可能なポータブルプリンタである音声メモプリンタ1のプリンタ本体1aは、一面が開放されたケース2と、このケース2の開放された面を開閉するカバー3とより構成されている。カバー3は、ケース2に設けられた支点軸4により回動自在に支持されている。そして、ケース2には、カバー3を閉じた状態で、ロール状に巻回された長尺状の記録紙5を転動自在に収納するホッパ6が形成されている。なお、本実施の形態においては、記録紙5として台紙5aに多数のラベル5bを等間隔で貼付したものを用いているが、他の記録紙を用いても良い。ラベル5bには粘着力の弱い糊が塗布されており、印字発行後には、付箋紙P(図8,図11,図14参照)としても利用可能である。
As shown in FIGS. 1 to 3, a printer main body 1a of a voice memo printer 1 which is a portable portable printer includes a
このようなケース2には、ホッパ6の底部からカバー3側に向けて延出する用紙ガイド7が設けられており、この用紙ガイド7のカバー3に近い部分には、回転自在のプラテン8と、このプラテン8の長手方向に沿うラベル剥離体9とが配設されている。
In such a
図3に示すように、カバー3の内面(ホッパ6側)には、サーマルヘッド12を備えたヘッド支持体11が支軸11aを中心に回動自在に設けられている。このヘッド支持体11は板ばね13により一方向に付勢されており、サーマルヘッド12はカバー3を閉じた状態でプラテン8に当接することになる。すなわち、プラテン8とサーマルヘッド12とにより印字部14が形成されている。
As shown in FIG. 3, a
また、カバー3の自由端側の両側には、スプリング15の付勢力によりプラテン8に圧接されたピンチローラ16が回転自在に設けられている。さらに、カバー3には、サーマルヘッド12とピンチローラ16との間に配置されてラベル5bを排出させるラベル排出口17と、ホッパ6内の記録紙5の浮きを押える紙押え18とが形成されている。ケース2にはカバー3の自由端との間で台紙5aを排出させる台紙排出口19が形成されている。
Further, on both sides of the free end side of the
ケース2の上面には、バッテリ10(図3参照)からの電力供給のON/OFFを宣言する電源スイッチ20、ラベル5bに印字を行わせるフィードスイッチ21、蓋部22、赤外線を受光する受光窓23が設けられている。蓋部22は、ケース2の一つの面である上面に開口して設けられたバッテリ収納部30(図3参照)に対してバッテリ10を着脱する場合に開閉するものである。さらに、カバー3の両側には係止爪24がスライド自在に設けられている(図1参照)。これらの係止爪24は外側に向けて付勢されてケース2に係止され、カバー3を開放するときに係止爪24を矢印マークで示すように内方スライドさせてケース2との係止状態を解除する。
On the upper surface of the
また、ケース2のラベル排出口17と同一面には、内蔵マイク52が設けられている。本実施の形態の音声メモプリンタ1には、音声認識機能が搭載されており、この内蔵マイク52は、この音声認識機能を実行する際に用いられるものである。
A built-in
加えて、ケース2の上面には、LED56が配設されている。本実施の形態の音声メモプリンタ1は、このLED56を点灯させたり点滅させることにより、音声メモプリンタ1の動作状態をオペレータに対して報知することができるようになっている。
In addition, an
さらに、図2に示すように、プリンタ本体1aのカバー3とは反対側の一面には、オペレータの腰のあたりに密着される弧面25が形成され、この弧面25にはオペレータの衣服に対して滑りを少なくするための滑り止め26と、この滑り止め26に対向してオペレータのベルトに引っ掛けられるベルト掛け27とが形成されている。
Further, as shown in FIG. 2, an
このような構成により、バッテリ10がバッテリ収納部30へと正しく収納された場合には、電源スイッチ20がONしている状態でバッテリ収納部30の端子とバッテリ10の端子とが接触して電気的に接続された状態となり、バッテリ10から電力供給を必要とするサーマルヘッド12等の各部へと電力が供給されることになる。
With such a configuration, when the battery 10 is correctly stored in the battery storage unit 30, the terminal of the battery storage unit 30 and the terminal of the battery 10 come into contact with each other while the
このような音声メモプリンタ1は、記録紙5をセットする場合にカバー3を開放し、ロール状に巻回された記録紙5をプリンタ本体1aのホッパ6に収納し、カバー3が開放されている状態で記録紙5の先端をプラテン8及びラベル剥離体9を覆う位置まで引き出し、カバー3を閉塞する。これにより、図3に示すように、記録紙5の台紙5aの先端部分が、サーマルヘッド12とピンチローラ16とによりプラテン8上に圧接され、また、ラベル剥離体9により台紙5aの引き出し経路が鋭角に折曲され、ホッパ6の底面からの記録紙5の浮きが紙押え18により阻止される。記録紙5をセットしたプリンタ本体1aは、机上に置いて使用することも可能であるが、通常はオペレータの腰に装着した状態でも使用可能である。
In such a voice memo printer 1, when the recording paper 5 is set, the
次に、音声メモプリンタ1の各部の制御系の接続について図4を参照しつつ説明する。音声メモプリンタ1は、各部を集中的に制御するCPU(Central Processing Unit)41を備えており、このCPU41には、CPU41が実行するプログラム等の固定データが書き込まれているROM(Read Only Memory)42と、ワークデータ等の可変データを更新自在に書き込むRAM(Random Access Memory)43と、各種情報を登録するフラッシュメモリ44とがバスライン45を介して接続されている。そして、サーマルヘッド12を駆動するサーマルヘッドドライバ46、プラテン8が連結されたモータ47を駆動するモータドライバ48、各種センサ49が接続されたセンサ回路50、カバー3の開閉によりオン、オフするカバーオープンスイッチ51と電源スイッチ20とフィードスイッチ21とが接続されたスイッチ回路54、赤外線インタフェース55、LED56が接続された点灯制御回路57が、CPU41に接続されている。このように、図4に示す回路はプリンタ本体1aの内部に設けられた基板(図示せず)上に形成されている。なお、赤外線インタフェース55は、前述した受光窓23の内方に配置されている。インタフェースは図ではI/Fと記す。
Next, the connection of the control system of each part of the voice memo printer 1 will be described with reference to FIG. The voice memo printer 1 includes a CPU (Central Processing Unit) 41 that centrally controls each unit. The
また、CPU41には、音声入力用CODEC53が接続されている。この音声入力用CODEC53には、内蔵マイク52が接続されている。音声入力用CODEC53は、内蔵マイク52から入力された音声アナログデータを音声デジタルデータに変換してCPU41に出力する。
The
さらに、CPU41には、音声認識エンジン58が接続されている。この音声認識エンジン58は、内蔵マイク52から入力されて音声入力用CODEC53で生成された音声デジタルデータを解析し、人間の声をテキストに変換するものである。このような音声認識エンジン58は、例えば、人間の発声の小さな単位(音素)の音響特徴(音韻)が登録される音響辞書59や音声認識させる単語の言語特徴が登録されている言語パターン辞書60を用いて音声認識を行う。
Further, a
本実施の形態の言語パターン辞書60に登録されている音声認識させる単語は、特定用途に絞られている。特定用途では決まった言葉が発せられることが多いため、このように特定用途に絞った単語のみを言語パターン辞書60に登録するようにすることで、言語パターン辞書60を安価に構成することができる。具体的には、使用される用途において使用されるであろう会話や発声言語を一覧に纏め、用途別使用言語表(図示せず)とする。この用途別使用言語表に登録された各言語毎に、その言語の周波数を解析し、音声特徴(音韻情報)と言語特徴(音韻の系列情報)に分離する。このようにして分離された言語特徴が、言語パターン辞書60に登録される。
The words to be recognized by speech registered in the
音響辞書59は、用途別でなく、音声認識全般に係わる辞書として使用される。声を発する原理は、
(1)『喉が震える』
(2)『口腔/鼻腔を通過』
と考えられることから、音響辞書59には、声の周波数から(1)(2)の形状を特定する情報を格納する。
The
(1) “My throat trembles”
(2) “Passing through oral cavity / nasal cavity”
Therefore, the
このような構成の音声認識エンジン58は、図5に示すように、内蔵マイク52から入力されて音声入力用CODEC53で生成された音声デジタルデータを周波数解析部58aにより周波数変換して解析し、比較部58bにおいて音響辞書59に基づいて音響特徴を算出する(音声特徴抽出手段)。この段階では、前述した(1)(2)の形状が特定できただけで、50音のどれかは、未だ特定できない。そこで、言語パターン辞書60に登録されている単語の中から、単語の言語特徴が入力音声の音響特徴に最も近い単語を探して音声認識結果として出力する(言語特徴抽出手段)。このように言語パターン辞書60と比較することで、初めて「あいうえお」等を特定することができる。不特定多数の言葉が発せられると特定は困難だが、特定の用途で発せられる言葉に絞り込むようにし、前述した(1)(2)の関係と音韻系列波形の特徴を単語全体で比較すれば、誤認識の可能性を極力抑える事ができ、このような簡便な機構で音声認識が可能となる。
As shown in FIG. 5, the
また、言語パターン辞書60は、音声メモプリンタ1に図示しない外部機器(パーソナルコンピュータ等)を赤外線インタフェース55を介して接続することで、当該外部機器から更新可能である。さらに、言語パターン辞書60を格納する言語パターン格納チップ(辞書)の交換や言語パターン辞書60の図示しない外部機器(パーソナルコンピュータ等)からのダウンロードによる登録内容の書き換えにより、言語パターン辞書60の内容を特定用途毎に変えることも可能である。新たな言語パターン辞書60が赤外線インタフェース55を介してダウンロードされた場合には、旧言語パターン辞書60は、抹消される。
The
加えて、本実施の形態の音声メモプリンタ1においては、フラッシュメモリ44に図6に示すような印字文言リスト70を格納している。印字文言リスト70は、印字する文字を予め特定するためのものであり、この文字を印字するために入力されるであろう音声認識エンジン58により音声認識される文言を予測した認識文言に印字文字(出力文字)を対応付ける印字辞書である。図6に示す例によれば、「ホッカイサケ」、「ホッカイシャケ」、「ホッカイドウサケベン」等の認識文言に対して、「北海道産 鮭弁当」という印字文字が対応付けられている。
In addition, in the voice memo printer 1 of the present embodiment, a
次に、音声メモプリンタ1に内蔵されたROM42に格納された制御プログラムがCPU41に実行させる機能のうち、本実施の形態の音声メモプリンタ1が備える特長的な機能について説明する。
Next, of the functions that the control program stored in the
ここで、音声メモプリンタ1のCPU41が実行する音声印字処理について説明する。図7は、音声印字処理の流れを示すフローチャートである。図7に示すように、デジタル化された音声が入力されると(ステップS1のY)、ステップS2に進み、音声認識エンジン58による音声認識処理を実行する。
Here, the voice printing process executed by the
次いで、音声認識処理において言語パターン辞書60に登録されている単語であると判断し、単語の言語特徴が入力音声の音響特徴に最も近い単語を探して音声認識した認識文言に基づいて、印字文言リスト70を検索する(ステップS3:リスト検索手段)。
Next, it is determined that the word is registered in the
印字文言リスト70に音声認識した認識文言が登録されている場合には(ステップS4のY)、印字文言リスト70から当該認識文言に対応付けられている印字文字を抽出し(ステップS5)、印字部14に出力して印字する(ステップS6:出力手段)。ここで、図8は発行された付箋紙Pの一例を示す平面図である。図8に示すように、付箋紙Pには、「ホッカイサケ」と発声した場合のテキスト「北海道産 鮭弁当」が印字されている。 If a recognized word recognized by voice is registered in the printed word list 70 (Y in step S4), a print character associated with the recognized word is extracted from the printed word list 70 (step S5) and printed. It outputs to the part 14 and prints (step S6: output means). Here, FIG. 8 is a plan view showing an example of the issued sticky note P. FIG. As shown in FIG. 8, on the sticky note P, the text “Hokkaido Salmon Bento” in the case of saying “Hokkai salmon” is printed.
一方、印字文言リスト70に音声認識した認識文言が登録されていない場合には(ステップS4のN)、処理を中止してステップS1に戻り、次のデジタル化された音声の入力に待機する。 On the other hand, when the recognized word recognized by the voice is not registered in the printed word list 70 (N in step S4), the process is stopped and the process returns to step S1 to wait for the next digitized voice input.
例えば、弁当店においては、「北海道産 鮭弁当」と印字したいが、人により入力語句はまちまちとなることが想定される。入力語句を統一した場合であっても、「サケ」「シャケ」の発音まで正しく発声できるとは限らない。また、練習することで正しく発声できていても、忙しい局面に立たされれば、語句を省いたり語句が戻ってしまったりする。しかしながら、本実施の形態の音声メモプリンタ1によれば、「ホッカイサケ」、「ホッカイシャケ」、「ホッカイドウサケベン」等の多岐の発生音声(認識文言)に対して「北海道産 鮭弁当」の印字文言を指定することで、付箋紙Pに印字されたメモに統一感があり、見た目も整然とし、整理/管理が容易になる。 For example, in a bento restaurant, you may want to print “Hokkaido bowl lunch”, but it is assumed that the input phrase varies from person to person. Even when the input words are unified, it is not always possible to correctly speak up to the pronunciation of “salmon” and “salmon”. Also, even if you can speak correctly by practicing, if you are in a busy situation, you may omit words or return words. However, according to the voice memo printer 1 of the present embodiment, “Hokkaido salmon lunch” is printed on various generated voices (recognition words) such as “hokkaisake”, “hokkaishake”, “hokkaido salmon ben”, etc. By specifying the wording, the memos printed on the sticky note P have a sense of unity, the appearance is orderly, and the organization / management becomes easy.
なお、「サケ」「シャケ」が発音されただけでは選択が行われないよう、これらは発声音声(認識文言)として印字文言リスト70から除外されている。理由は、「お酒」「叫んだら」「避ける」など、発声に「サケ」の発音が混じる場合、全て「北海道産 鮭弁当」として受理することになることによる。もっとも、運用で、弁当屋の会話として、事例のような音声の入力が無いと決めれば、「サケ」「シャケ」を発声音声(認識文言)として印字文言リスト70に加えても良い。
Note that these are excluded from the printed
このように本実施の形態によれば、音声認識された認識文言が、印字文言リスト70において出力文字に対応付けられて登録されている場合にのみ、印字文言リスト70から当該認識文言に対応付けられている出力文字が抽出されて視認可能に出力(印字)される。これにより、音声認識機能により音声認識された文言をそのまま視認可能に出力(印字)せずに、例えば多岐の認識文言に対して同一の出力文字を文言リストにおいて対応付けることで、多岐の認識文言を同一の文言として視認可能に出力(印字)することが可能になるので、視認可能に出力(印字)された文言に統一感があり、見た目も整然とし、整理/管理が容易になる。
As described above, according to the present embodiment, only when the recognized word recognized by voice is registered in association with the output character in the printed
[第二の実施の形態]
本発明の第二の実施の形態を図9ないし図11に基づいて説明する。なお、前述した第一の実施の形態と同一部分は同一符号で示し説明も省略する。本実施の形態は、前述した第一の実施の形態とは、フラッシュメモリ44に格納されている印字文言リスト及び音声認識処理の流れが異なるものである。
[Second Embodiment]
A second embodiment of the present invention will be described with reference to FIGS. In addition, the same part as 1st Embodiment mentioned above is shown with the same code | symbol, and description is also omitted. This embodiment is different from the first embodiment described above in the print word list stored in the
図9は、本実施の形態の音声メモプリンタ1における音声印字処理の流れを示すフローチャートである。図9に示すように、デジタル化された音声が入力されると(ステップS11のY)、ステップS12に進み、音声認識エンジン58による音声認識処理を実行する。
FIG. 9 is a flowchart showing the flow of voice printing processing in the voice memo printer 1 of the present embodiment. As shown in FIG. 9, when digitized voice is input (Y in step S11), the process proceeds to step S12, and voice recognition processing by the
次いで、音声認識処理において言語パターン辞書60に登録されている単語であると判断し、単語の言語特徴が入力音声の音響特徴に最も近い単語を探して音声認識した認識文言に基づいて、図10に示す印字文言リスト71を検索する(ステップS13:リスト検索手段)。印字文言リスト71は、印字する文字を予め特定するためのものであり、この文字を印字するために入力されるであろう音声認識エンジン58により音声認識される文言を予測した認識文言に印字文字を対応付ける印字辞書である。図10に示す例によれば、「サン」、「クン」、「チャン」等の認識文言に対して、「様」という印字文字が対応付けられている。
Next, it is determined that the word is registered in the
印字文言リスト71に音声認識した認識文言が登録されている場合には(ステップS14のY)、登録されている認識文言の印字文字を印字文言リスト71から抽出し(ステップS15)、印字部14に出力して印字する(ステップS16)。ここで、図11は発行された付箋紙Pの一例を示す平面図である。図11に示すように、付箋紙Pには、「サイトウチャン」と発声した場合のテキスト「さいとう様」が印字されている。 If a recognized word recognized by speech is registered in the printed word list 71 (Y in step S14), the print characters of the registered recognized word are extracted from the printed word list 71 (step S15), and the printing unit 14 Is output and printed (step S16). Here, FIG. 11 is a plan view showing an example of the issued sticky note P. FIG. As shown in FIG. 11, the sticky note P is printed with the text “Saito-sama” when “Saito Chan” is uttered.
一方、印字文言リスト71に音声認識した認識文言が登録されていない場合には(ステップS14のN)、そのまま認識文言を印字文字とし、印字部14に出力して印字する(ステップS16:出力手段)。 On the other hand, if the recognition word recognized by voice recognition is not registered in the print word list 71 (N in step S14), the recognition word is directly used as a print character, and is output to the printing unit 14 for printing (step S16: output means). ).
例えば、弁当店において予約を受けた弁当の予約メモに客の名前が、呼び捨てになっていたり「さいとうちゃん」等になってしまっては、いつお客様の目に止まるとも限らないことから、好ましくない。しかしながら、店員が親しくなった客ほど、このようになってしまうことが多々ある。このため、発声した音声をそのままメモにする特徴をもった便利なプリンタであっても、音声をそのまま印字してしまっては逆に欠点になってしまう。しかしながら、本実施の形態の音声メモプリンタ1によれば、「サン」、「クン」、「チャン」等の発生音声(認識文言)に対して「様」の印字文言を指定することで、敬語を使用するべき箇所に、失礼な文言が印字されることを防止することができる。 For example, if a customer's name is abandoned or becomes “Saito-chan” in a reservation memo for a bento that has been reserved at a bento store, it will not always be noticeable by the customer. . However, this is often the case for customers who are familiar with the store clerk. For this reason, even if it is a convenient printer having the feature of making a voice as a memo as it is, if the voice is printed as it is, it becomes a disadvantage. However, according to the voice memo printer 1 of the present embodiment, by specifying the print word “sama” for the generated voice (recognition word) such as “san”, “kun”, “chang”, etc., the honorific It is possible to prevent a rude wording from being printed at a place where the character is to be used.
このように本実施の形態によれば、音声認識された認識文言が、印字文言リスト71において出力文字に対応付けられて登録されている場合には、印字文言リスト71から当該認識文言に対応付けられている出力文字が抽出されて視認可能に出力(印字)され、印字文言リスト71において出力文字に対応付けられて登録されていない場合には、当該認識文言がそのまま出力文字として視認可能に出力(印字)される。これにより、音声認識機能により音声認識された文言をそのまま視認可能に出力(印字)せずに、例えば一定の意味を有する認識文言群(「サン」、「クン」、「チャン」等)についてはその意味の標準的な出力文字(「様」等の敬称)を印字文言リスト71において対応付けることで、敬語を使用するべき箇所に失礼な文言が視認可能に出力(印字)されることを防止することが可能になる。
As described above, according to the present embodiment, when a recognized word recognized by voice is registered in association with an output character in the printed
[第三の実施の形態]
本発明の第二の実施の形態を図12ないし図14に基づいて説明する。なお、前述した第一の実施の形態と同一部分は同一符号で示し説明も省略する。本実施の形態は、前述した第一の実施の形態とは、フラッシュメモリ44に格納されている印字文言リストに代えて印字禁止文言リストを備えている点及び音声認識処理の流れが異なるものである。
[Third embodiment]
A second embodiment of the present invention will be described with reference to FIGS. In addition, the same part as 1st Embodiment mentioned above is shown with the same code | symbol, and description is also omitted. This embodiment is different from the first embodiment described above in that a print prohibition word list is provided instead of the print word list stored in the
図12は、本実施の形態の音声メモプリンタ1における音声印字処理の流れを示すフローチャートである。図12に示すように、デジタル化された音声が入力されると(ステップS21のY)、ステップS22に進み、音声認識エンジン58による音声認識処理を実行する。
FIG. 12 is a flowchart showing the flow of the voice printing process in the voice memo printer 1 of the present embodiment. As shown in FIG. 12, when digitized voice is input (Y in step S21), the process proceeds to step S22, and voice recognition processing by the
次いで、音声認識処理において言語パターン辞書60に登録されている単語であると判断し、単語の言語特徴が入力音声の音響特徴に最も近い単語を探して音声認識した認識文言に基づいて、図13に示す印字禁止文言リスト72を検索する(ステップS23:リスト検索手段)。印字禁止文言リスト72は、音声認識エンジン58により音声認識される文言を予測した認識文言中、印字禁止文言を登録する印字辞書である。図13に示す例によれば、「サン」、「クン」、「チャン」等の認識文言が印字禁止文言として登録されている。
Next, it is determined that the word is registered in the
印字禁止文言リスト72に音声認識した認識文言が印字禁止文言として登録されている場合には(ステップS24のY)、当該認識文言を削除し(ステップS25)、印字部14に出力して印字する(ステップS26:出力手段)。ここで、図14は発行された付箋紙Pの一例を示す平面図である。図11に示すように、付箋紙Pには、「サイトウチャン」と発声した場合のテキスト「さいとう」が印字されている。
If the recognized word recognized by voice in the print
一方、印字禁止文言リスト72に音声認識した認識文言が登録されていない場合には(ステップS24のN)、そのまま認識文言を印字文字とし、印字部14に出力して印字する(ステップS26)。 On the other hand, if a recognized word recognized by voice recognition is not registered in the print prohibition word list 72 (N in step S24), the recognized word is directly used as a print character, and is output to the printing unit 14 for printing (step S26).
このように本実施の形態によれば、音声認識された認識文言が、印字禁止文言リスト72において出力文字に対応付けられて登録されている場合には、当該認識文言の出力(印字)が禁止され、印字禁止文言リスト72において出力文字に対応付けられて登録されていない場合には、当該認識文言がそのまま出力文字として視認可能に出力される。これにより、音声認識機能により音声認識された文言をそのまま視認可能に出力(印字)せずに、例えば一定の意味を有する認識文言群(「サン」、「クン」、「チャン」等)が実際には「様」等の敬称として出力すべきである場合には、当該認識文言の出力(印字)が禁止されるので、敬語を使用するべき箇所に失礼な文言が視認可能に出力(印字)されることを防止することが可能になる。
As described above, according to the present embodiment, when a recognized recognition word is registered in association with an output character in the print
なお、各実施の形態においては、出力手段は、印字文字(出力文字)を印字部14に出力して印字するようにしたが、これに限るものではない。例えば、音声認識結果出力装置として表示装置を適用した場合には、出力手段は、表示文字(出力文字)を表示装置に出力して画面表示するようにしても良い。 In each embodiment, the output means outputs a print character (output character) to the printing unit 14 for printing, but the present invention is not limited to this. For example, when a display device is applied as the speech recognition result output device, the output means may output display characters (output characters) to the display device and display them on the screen.
1…音声認識結果出力装置、14…印字部、70,71,72…文言リスト
DESCRIPTION OF SYMBOLS 1 ... Voice recognition result output apparatus, 14 ... Printing part, 70, 71, 72 ... Word list
Claims (5)
予測した音声認識される認識文言に出力文字を対応付ける文言リストと、
音声認識された認識文言に基づいて、前記文言リストを検索するリスト検索手段と、
このリスト検索手段により前記文言リストに音声認識された認識文言が登録されていると判断した場合には、前記文言リストから当該認識文言に対応付けられている出力文字を抽出して視認可能に出力する出力手段と、
を備えることを特徴とする音声認識結果出力装置。 In the speech recognition result output device that is equipped with a speech recognition function and outputs the speech recognition recognition wording so as to be visible,
A word list that associates output characters with the recognized recognition words that are recognized by voice,
A list search means for searching the word list based on a recognized word recognized by voice;
When it is determined that a recognized word recognized in the word list is registered in the word list by the list search means, an output character associated with the recognized word is extracted from the word list and output so as to be visible Output means for
A speech recognition result output device comprising:
予測した音声認識される認識文言に出力文字を対応付ける文言リストと、
音声認識された認識文言に基づいて、前記文言リストを検索するリスト検索手段と、
このリスト検索手段により前記文言リストに音声認識された認識文言が登録されていると判断した場合には、前記文言リストから当該認識文言に対応付けられている出力文字を抽出して視認可能に出力し、前記文言リストに音声認識された認識文言が登録されていないと判断した場合には、当該認識文言をそのまま出力文字として視認可能に出力する出力手段と、
を備えることを特徴とする音声認識結果出力装置。 In the speech recognition result output device that is equipped with a speech recognition function and outputs the speech recognition recognition wording so as to be visible,
A word list that associates output characters with the recognized word recognition that is recognized by voice,
A list search means for searching the word list based on a recognized word recognized by voice;
When it is determined that a recognized word recognized in the word list is registered in the word list by the list search means, an output character associated with the recognized word is extracted from the word list and output so as to be visible And, if it is determined that the recognized speech recognized in the word list is not registered, an output means for outputting the recognized word as it is as an output character so as to be visible,
A speech recognition result output device comprising:
予測した音声認識される認識文言を格納する文言リストと、
音声認識された認識文言に基づいて、前記文言リストを検索するリスト検索手段と、
このリスト検索手段により前記文言リストに音声認識された認識文言が登録されていると判断した場合には、当該認識文言の出力を禁止し、前記文言リストに音声認識された認識文言が登録されていないと判断した場合には、当該認識文言をそのまま出力文字として視認可能に出力する出力手段と、
を備えることを特徴とする音声認識結果出力装置。 In the speech recognition result output device that is equipped with a speech recognition function and outputs the speech recognition recognition wording so as to be visible,
A word list for storing the recognized word words to be recognized,
A list search means for searching the word list based on a recognized word recognized by voice;
When it is determined by the list search means that a recognized word recognized in the word list is registered in the word list, output of the recognized word is prohibited, and a recognized word recognized in the word list is registered. When it is determined that there is no output means for outputting the recognition word as it is as an output character so as to be visible,
A speech recognition result output device comprising:
ことを特徴とする請求項1ないし3のいずれか一記載の音声認識結果出力装置。 The output means outputs an output character to a printing unit and prints it.
The speech recognition result output device according to any one of claims 1 to 3.
ことを特徴とする請求項1ないし3のいずれか一記載の音声認識結果出力装置。 The output means outputs an output character to a display device and displays the screen.
The speech recognition result output device according to any one of claims 1 to 3.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004125407A JP2005309065A (en) | 2004-04-21 | 2004-04-21 | Speech recognition result output device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004125407A JP2005309065A (en) | 2004-04-21 | 2004-04-21 | Speech recognition result output device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2005309065A true JP2005309065A (en) | 2005-11-04 |
Family
ID=35437930
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004125407A Pending JP2005309065A (en) | 2004-04-21 | 2004-04-21 | Speech recognition result output device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2005309065A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10600422B2 (en) | 2016-09-15 | 2020-03-24 | Toshiba Tec Kabushiki Kaisha | Voice recognition device configured to start voice recognition in response to user instruction |
| US11176943B2 (en) | 2017-09-21 | 2021-11-16 | Kabushiki Kaisha Toshiba | Voice recognition device, voice recognition method, and computer program product |
| EP3910466A1 (en) | 2020-04-27 | 2021-11-17 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, method for processing information, and carrier means |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01147325A (en) * | 1987-12-03 | 1989-06-09 | Tokyo Electric Co Ltd | Electronic charge scale |
| JPH10301927A (en) * | 1997-04-23 | 1998-11-13 | Nec Software Ltd | Electronic conference speech arrangement device |
| JP2000148179A (en) * | 1998-11-12 | 2000-05-26 | Internatl Business Mach Corp <Ibm> | Method for designating sub-vocabulary and program memory system |
| JP2001221680A (en) * | 2000-02-08 | 2001-08-17 | Ishida Co Ltd | Commodity processor |
| JP2004029315A (en) * | 2002-06-25 | 2004-01-29 | Casio Comput Co Ltd | Portable information terminal |
-
2004
- 2004-04-21 JP JP2004125407A patent/JP2005309065A/en active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01147325A (en) * | 1987-12-03 | 1989-06-09 | Tokyo Electric Co Ltd | Electronic charge scale |
| JPH10301927A (en) * | 1997-04-23 | 1998-11-13 | Nec Software Ltd | Electronic conference speech arrangement device |
| JP2000148179A (en) * | 1998-11-12 | 2000-05-26 | Internatl Business Mach Corp <Ibm> | Method for designating sub-vocabulary and program memory system |
| JP2001221680A (en) * | 2000-02-08 | 2001-08-17 | Ishida Co Ltd | Commodity processor |
| JP2004029315A (en) * | 2002-06-25 | 2004-01-29 | Casio Comput Co Ltd | Portable information terminal |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10600422B2 (en) | 2016-09-15 | 2020-03-24 | Toshiba Tec Kabushiki Kaisha | Voice recognition device configured to start voice recognition in response to user instruction |
| US11468902B2 (en) | 2016-09-15 | 2022-10-11 | Toshiba Tec Kabushiki Kaisha | Voice recognition device and voice recognition method |
| US11176943B2 (en) | 2017-09-21 | 2021-11-16 | Kabushiki Kaisha Toshiba | Voice recognition device, voice recognition method, and computer program product |
| EP3910466A1 (en) | 2020-04-27 | 2021-11-17 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, method for processing information, and carrier means |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3142803B2 (en) | A text-to-speech synthesizer | |
| US20050131673A1 (en) | Speech translation device and computer readable medium | |
| CN102165437A (en) | Information processing device and information processing method | |
| KR930022267A (en) | Automatic speech recognizer | |
| EP1455268A3 (en) | Presentation of data based on user input | |
| EP2453436A3 (en) | Automatic language model update | |
| JP2003058540A5 (en) | ||
| CN107003823A (en) | Wear-type display system and head-mounted display apparatus | |
| US10930283B2 (en) | Sound recognition device and sound recognition method applied therein | |
| JP4236597B2 (en) | Speech recognition apparatus, speech recognition program, and recording medium. | |
| JP2005309065A (en) | Speech recognition result output device | |
| US20070225970A1 (en) | Multi-context voice recognition system for long item list searches | |
| Warren et al. | Maori English: Phonology | |
| JP4544933B2 (en) | Voice memo printer | |
| JP4584615B2 (en) | Voice recognition result printing device | |
| DE10344062A1 (en) | Head-mounted display device e.g. for image and textural information, includes translation unit for detecting speech recorded by voice recording device | |
| Lyu et al. | Toward constructing a multilingual speech corpus for Taiwanese (Min-nan), Hakka, and Mandarin | |
| JP2005326677A (en) | Voice memo printer | |
| US20080120110A1 (en) | Handheld voice activated spelling device | |
| Compernolle | Speech recognition in the car from phone dialing to car navigation | |
| JP2008201066A (en) | Image printer | |
| US20250258524A1 (en) | Electronic Bookmark Device | |
| JP3804188B2 (en) | Sentence reading device | |
| KR20020048357A (en) | Method and apparatus for providing text-to-speech and auto speech recognition on audio player | |
| JP2002041277A (en) | Information processing apparatus and recording medium recording Web browser control program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060919 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090911 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090915 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091116 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20091030 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100129 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100323 |