JP6322125B2 - 音声認識装置、音声認識方法および音声認識プログラム - Google Patents
音声認識装置、音声認識方法および音声認識プログラム Download PDFInfo
- Publication number
- JP6322125B2 JP6322125B2 JP2014241123A JP2014241123A JP6322125B2 JP 6322125 B2 JP6322125 B2 JP 6322125B2 JP 2014241123 A JP2014241123 A JP 2014241123A JP 2014241123 A JP2014241123 A JP 2014241123A JP 6322125 B2 JP6322125 B2 JP 6322125B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- information
- speech recognition
- user
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
上記実施形態では、利用者が利用しているコンテンツを考慮し、音声認識の精度を向上させる方法について、コンテンツが放送番組である場合を中心に説明した。この音声認識システムを適用して、利用者に関連する情報配信を行う変形例も考えられる。
11:音声取得部
12:位置取得部
13:通信部
14:結果表示部
2 :サーバ
21:通信部
22:コンテンツ特定部
23:音声認識部
24:音声特徴DB
25:関連情報DB
26:情報構築部
Claims (5)
- 音声認識装置であって、
音声データを、位相差の情報を用いて音源までの距離を特定することで、ユーザが発話した発話音声データと背景音声データとに分離し、分離した前記背景音声データから、音声の特徴情報を抽出し、複数のコンテンツの音声の特徴情報が記憶された音声特徴記憶部を用いてユーザが利用しているコンテンツを特定する特定部と、
前記発話音声データを音声認識して、少なくとも1つのテキスト候補データに変換し、前記特定したコンテンツに関する関連情報を用いて、前記テキスト候補データの中からユーザに提示するテキストデータを決定する音声認識部と、を備えること
を特徴とする音声認識装置。 - 請求項1記載の音声認識装置であって、
前記コンテンツは、放送番組であること
を特徴とする音声認識装置。 - 請求項2記載の音声認識装置であって、
前記特定部は、ユーザの位置情報を取得し、前記音声特徴記憶部に記憶されたコンテンツの中から前記位置情報に応じた放送番組を絞込み、絞込んだ各放送番組の特徴情報と、前記背景音声データの特徴情報とを照合することでユーザが視聴している放送番組を特定すること
を特徴とする音声認識装置。 - 音声認識装置が行う音声認識方法であって、
音声データを、位相差の情報を用いて音源までの距離を特定することで、ユーザが発話した発話音声データと背景音声データとに分離する分離ステップと、
前記分離した背景音声データから、音声の特徴情報を抽出し、複数のコンテンツの音声の特徴情報が記憶された音声特徴記憶部を用いてユーザが利用しているコンテンツを特定する特定ステップと、
前記発話音声データを音声認識して、少なくとも1つのテキスト候補データに変換する変換ステップと、
前記特定したコンテンツに関する関連情報を用いて、前記テキスト候補データの中からユーザに提示するテキストデータを決定する決定ステップと、を行うこと
を特徴とする音声認識方法。 - 請求項1から請求項3のいずれか1項に記載の音声認識装置として、コンピュータを機能させることを特徴とする音声認識プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014241123A JP6322125B2 (ja) | 2014-11-28 | 2014-11-28 | 音声認識装置、音声認識方法および音声認識プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014241123A JP6322125B2 (ja) | 2014-11-28 | 2014-11-28 | 音声認識装置、音声認識方法および音声認識プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2016102899A JP2016102899A (ja) | 2016-06-02 |
| JP6322125B2 true JP6322125B2 (ja) | 2018-05-09 |
Family
ID=56089408
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014241123A Active JP6322125B2 (ja) | 2014-11-28 | 2014-11-28 | 音声認識装置、音声認識方法および音声認識プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6322125B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11758204B2 (en) | 2018-11-28 | 2023-09-12 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109994110A (zh) * | 2018-12-06 | 2019-07-09 | 平安科技(深圳)有限公司 | 基于人工智能的语音识别方法、装置、计算机设备 |
| JP2021135412A (ja) * | 2020-02-27 | 2021-09-13 | ソニーグループ株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FI107129B (fi) * | 1998-10-01 | 2001-06-15 | Bki Holding Corp | Menetelmä monikerroksisen suodatinmateriaalin valmistamiseksi ja monikerroksinen suodatinmateriaali |
| JP2001249686A (ja) * | 2000-03-08 | 2001-09-14 | Matsushita Electric Ind Co Ltd | 音声認識方法、音声認識装置、およびナビゲーション装置 |
| JP4581290B2 (ja) * | 2001-05-16 | 2010-11-17 | パナソニック株式会社 | 音声認識装置および音声認識方法 |
| JP4601306B2 (ja) * | 2003-03-13 | 2010-12-22 | パナソニック株式会社 | 情報検索装置、情報検索方法、およびプログラム |
| JP2007025076A (ja) * | 2005-07-13 | 2007-02-01 | Xanavi Informatics Corp | 車載用音声認識装置 |
| JP2007178927A (ja) * | 2005-12-28 | 2007-07-12 | Canon Inc | 情報検索装置および方法 |
| JP5491372B2 (ja) * | 2010-12-03 | 2014-05-14 | 日本電信電話株式会社 | 情報検索システム、情報検索方法、情報検索プログラム |
| JP6221202B2 (ja) * | 2012-02-03 | 2017-11-01 | ヤマハ株式会社 | 通信システム |
| US9275625B2 (en) * | 2013-03-06 | 2016-03-01 | Qualcomm Incorporated | Content based noise suppression |
-
2014
- 2014-11-28 JP JP2014241123A patent/JP6322125B2/ja active Active
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11758204B2 (en) | 2018-11-28 | 2023-09-12 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2016102899A (ja) | 2016-06-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20260011320A1 (en) | Systems and methods for providing notifications within a media asset without breaking immersion | |
| US12136417B2 (en) | Domain and intent name feature identification and processing | |
| US9123330B1 (en) | Large-scale speaker identification | |
| US11189277B2 (en) | Dynamic gazetteers for personalized entity recognition | |
| US10860639B2 (en) | Query response using media consumption history | |
| EP2863300B1 (en) | Function execution instruction system, function execution instruction method, and function execution instruction program | |
| US10917758B1 (en) | Voice-based messaging | |
| US12455877B1 (en) | Identifying user content | |
| US8972260B2 (en) | Speech recognition using multiple language models | |
| JP6139598B2 (ja) | オンライン音声認識を処理する音声認識クライアントシステム、音声認識サーバシステム及び音声認識方法 | |
| CN109791761B (zh) | 使用校正的术语的声学模型训练 | |
| US20180047387A1 (en) | System and method for generating accurate speech transcription from natural speech audio signals | |
| US12148430B2 (en) | Method, system, and computer-readable recording medium for managing text transcript and memo for audio file | |
| JP7230806B2 (ja) | 情報処理装置、及び情報処理方法 | |
| WO2018021237A1 (ja) | 音声対話装置、音声対話方法、および記録媒体 | |
| US9922650B1 (en) | Intent-specific automatic speech recognition result generation | |
| US12164562B1 (en) | Background audio identification for query disambiguation | |
| US20120041947A1 (en) | Search apparatus, search method, and program | |
| JP2012194245A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
| WO2018047421A1 (ja) | 音声処理装置、情報処理装置、音声処理方法および情報処理方法 | |
| US8688447B1 (en) | Method and system for domain-specific noisy channel natural language processing (NLP) | |
| JP6322125B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
| JP7107228B2 (ja) | 情報処理装置および情報処理方法、並びにプログラム | |
| CN102970618A (zh) | 基于音节识别的视频点播方法 | |
| US10847158B2 (en) | Multi-modality presentation and execution engine |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170105 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171218 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180109 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180301 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180403 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180406 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6322125 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |