JP5710581B2 - 質問応答装置、方法、及びプログラム - Google Patents
質問応答装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5710581B2 JP5710581B2 JP2012275924A JP2012275924A JP5710581B2 JP 5710581 B2 JP5710581 B2 JP 5710581B2 JP 2012275924 A JP2012275924 A JP 2012275924A JP 2012275924 A JP2012275924 A JP 2012275924A JP 5710581 B2 JP5710581 B2 JP 5710581B2
- Authority
- JP
- Japan
- Prior art keywords
- answer
- learning
- question
- extracted
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
第1の実施の形態に係る質問応答装置10は、CPUと、RAMと、後述する信頼度算出式構築処理ルーチン、及び質問応答処理ルーチンを実行するためのプログラム及び各種データを記憶したROMとを備えたコンピュータで構成されている。また、記憶手段としてHDDを設けてもよい。
・文書の検索順位(rank)・・・回答候補が出現する文書の検索時における順位を値として持つ特徴量である。
・検索結果における回答候補の頻度(cand_count)・・・文書の検索結果から抽出された全ての回答候補における対象の回答候補の出現回数を値として持つ特徴量である。文書の検索結果における出現頻度が高い場合に、対象の回答候補が回答らしい(信頼度が高い)としたい場合に有効な特徴量である。
・検索結果における回答候補の割合(cand_ratio)・・・文書の検索結果から抽出された全ての回答候補に対して、対象の回答候補が占める割合を値として持つ特徴量である。例えば、対象の回答候補が「A」であり、文書の検索結果中から10個の回答候補が抽出されており、そのうち5個が「A」という回答候補だったとすると、回答候補「A」についての本特徴量は0.5となる。
次に、第2の実施の形態について説明する。なお、第2の実施の形態に係る質問応答装置について、第1の実施の形態に係る質問応答装置10と同様の構成については、同一符号を付して詳細な説明を省略する。
1 エベレスト 0.969366(22)
2 富士山 0.246514(3)
3 チョモランマ 0.226562(1)
4 K2 0.151517(2)
5 ハワイ島 0.13605(1)
6 エベレスト/チョモランマ 0.0898824(1)
7 ダウラギリ 0.0621022(3)
8 カンチェンジュンガ 0.0353058(5)
9 カメルーン山 0.0261512(2)
10 マナスル 0.0173765(1)
11 ローツェ 0.0152677(1)
12 チョ・オユー 0.0152677(1)
13 マカルー 0.00845766(1)
14 アルプス 0.00446622(1)
enetype_Mountain-cand_ratio 3.812258026357529
enetype_Mountain-score_dist 0.02188293329420078
enetype_Mountain-cand_count 0.006644647005094824
enetype_Mountain-rank -0.02508300268047375
比較として、回答タイプ「Lake」に関する各特徴量の回帰係数を以下に示す。
enetype_Lake-cand_ratio 3.260375594203147
enetype_Lake-cand_count 0.01467459091733951
enetype_Lake-rank -0.03125393707655315
enetype_Lake-score_dist -0.09606970225518727
11 質問解析部
12 文書検索部
13 回答候補抽出部
14、214 回答評価部
21 特徴量抽出部
22、222 学習部
31 文書DB
32、232 信頼度算出式
Claims (7)
- 自然言語による質問文を拡張固有表現の体系に従って分類することにより、前記質問文に対する回答の種類を示す回答タイプを解析する解析手段と、
前記質問文に含まれる単語を検索条件として複数の文書から検索された文書に含まれる拡張固有表現から、前記解析手段により解析された回答タイプに対応した拡張固有表現を回答候補として抽出する抽出手段と、
前記回答候補の前記質問文に対する回答としての信頼度を算出する信頼度算出式であって、前記解析手段により解析された回答タイプに応じた信頼度算出式に基づいて得られた信頼度の高い回答候補を、前記質問文に対する回答として出力する出力手段と、
を含む質問応答装置。 - 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして、前記回答タイプ毎に学習することにより得られた前記回答タイプ毎の信頼度算出式のうち、前記解析手段により解析された回答タイプの信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量を入力して、前記回答候補の信頼度を算出する請求項1記載の質問応答装置。
- 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量に、前記学習用質問文の回答タイプを示す情報を含めた特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして学習することにより得られた前記信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量に、前記解析手段により解析された回答タイプを示す情報を含めた特徴量を入力して、前記回答候補の信頼度を算出する請求項1記載の質問応答装置。
- 解析手段と、抽出手段と、出力手段とを含む質問応答装置における質問応答方法であって、
前記解析手段が、自然言語による質問文を拡張固有表現の体系に従って分類することにより、前記質問文に対する回答の種類を示す回答タイプを解析し、
前記抽出手段が、前記質問文に含まれる単語を検索条件として複数の文書から検索された文書に含まれる拡張固有表現から、前記解析手段により解析された回答タイプに対応した拡張固有表現を回答候補として抽出し、
前記出力手段が、前記回答候補の前記質問文に対する回答としての信頼度を算出する信頼度算出式であって、前記解析手段により解析された回答タイプに応じた信頼度算出式に基づいて得られた信頼度の高い回答候補を、前記質問文に対する回答として出力する
質問応答方法。 - 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして、前記回答タイプ毎に学習することにより得られた前記回答タイプ毎の信頼度算出式のうち、前記解析手段により解析された回答タイプの信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量を入力して、前記回答候補の信頼度を算出する請求項4記載の質問応答方法。
- 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量に、前記学習用質問文の回答タイプを示す情報を含めた特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして学習することにより得られた前記信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量に、前記解析手段により解析された回答タイプを示す情報を含めた特徴量を入力して、前記回答候補の信頼度を算出する請求項4記載の質問応答方法。
- コンピュータを、請求項1〜請求項3のいずれか1項記載の質問応答装置を構成する各手段として機能させるための質問応答プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012275924A JP5710581B2 (ja) | 2012-12-18 | 2012-12-18 | 質問応答装置、方法、及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012275924A JP5710581B2 (ja) | 2012-12-18 | 2012-12-18 | 質問応答装置、方法、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2014120053A JP2014120053A (ja) | 2014-06-30 |
| JP5710581B2 true JP5710581B2 (ja) | 2015-04-30 |
Family
ID=51174822
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012275924A Active JP5710581B2 (ja) | 2012-12-18 | 2012-12-18 | 質問応答装置、方法、及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5710581B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11157829B2 (en) | 2017-07-18 | 2021-10-26 | International Business Machines Corporation | Method to leverage similarity and hierarchy of documents in NN training |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10769155B2 (en) | 2016-05-17 | 2020-09-08 | Google Llc | Automatically augmenting message exchange threads based on tone of message |
| JP6048997B1 (ja) * | 2016-06-16 | 2016-12-21 | 株式会社FiNC | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
| JP6165306B1 (ja) * | 2016-09-20 | 2017-07-19 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
| JP6739361B2 (ja) * | 2017-01-18 | 2020-08-12 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
| US11144718B2 (en) * | 2017-02-28 | 2021-10-12 | International Business Machines Corporation | Adaptable processing components |
| JP6630701B2 (ja) * | 2017-04-13 | 2020-01-15 | 日本電信電話株式会社 | 回答候補生成装置、方法、及びプログラム |
| JP6449378B2 (ja) * | 2017-06-20 | 2019-01-09 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
| WO2019244803A1 (ja) * | 2018-06-18 | 2019-12-26 | 日本電信電話株式会社 | 回答学習装置、回答学習方法、回答生成装置、回答生成方法、及びプログラム |
| CN109829041B (zh) * | 2018-12-25 | 2021-06-29 | 出门问问信息科技有限公司 | 问题处理方法、装置、计算机设备及计算机可读存储介质 |
| JP7614738B2 (ja) * | 2020-05-14 | 2025-01-16 | エヌ・ティ・ティ・コムウェア株式会社 | 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム |
| CN113449117B (zh) * | 2021-06-24 | 2023-09-26 | 武汉工程大学 | 一种基于Bi-LSTM和中文知识图谱的复合问答方法 |
| CN114495130B (zh) * | 2021-12-27 | 2023-03-24 | 北京百度网讯科技有限公司 | 基于跨模态信息的文档阅读理解模型训练方法及装置 |
| CN114416953B (zh) * | 2022-01-20 | 2023-10-31 | 北京百度网讯科技有限公司 | 问答处理方法、问答模型的训练方法和装置 |
-
2012
- 2012-12-18 JP JP2012275924A patent/JP5710581B2/ja active Active
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11157829B2 (en) | 2017-07-18 | 2021-10-26 | International Business Machines Corporation | Method to leverage similarity and hierarchy of documents in NN training |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2014120053A (ja) | 2014-06-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
| Bennani-Smires et al. | Simple unsupervised keyphrase extraction using sentence embeddings | |
| Tellez et al. | A case study of Spanish text transformations for twitter sentiment analysis | |
| JP5078173B2 (ja) | 多義性解消方法とそのシステム | |
| Eisa et al. | Existing plagiarism detection techniques: A systematic mapping of the scholarly literature | |
| US8812504B2 (en) | Keyword presentation apparatus and method | |
| Atia et al. | Increasing the accuracy of opinion mining in Arabic | |
| JP2011118872A (ja) | 未登録語のカテゴリを決定する方法と装置 | |
| JP2011118689A (ja) | 検索方法及びシステム | |
| Grütze et al. | CohEEL: Coherent and efficient named entity linking through random walks | |
| Yadav et al. | Feature based automatic text summarization methods: a comprehensive state-of-the-art survey | |
| CN115718791A (zh) | 文本元素的特定性排序及其应用 | |
| Kwon | Reading customers’ minds through textual big data: Challenges, practical guidelines, and proposals | |
| JP5427694B2 (ja) | 関連コンテンツ提示装置及びプログラム | |
| Corrada-Emmanuel et al. | Answer passage retrieval for question answering | |
| Bouhoun et al. | Information retrieval using domain adapted language models: application to resume documents for HR recruitment assistance | |
| Garrido et al. | Improving the generation of infoboxes from data silos through machine learning and the use of semantic repositories | |
| Gupta et al. | Natural language processing algorithms for domain-specific data extraction in material science: Reseractor | |
| Malkawi et al. | Arabic questions classification machine learning algoritims | |
| Kalaimagal et al. | COVID-19 Fake News Detection in Malaysia–A Supervised Approach | |
| Guo et al. | Deep natural language processing for linkedin search | |
| Oguntunde et al. | Towards an automatic text analysis and summarization in yoruba language using transfer learning approach in natural language processing | |
| Berenguer et al. | Evaluating the impact of content deletion on tabular data similarity and retrieval using contextual word embeddings | |
| Nikolić et al. | Modelling the System of Receiving Quick Answers for e-Government Services: Study for the Crime Domain in the Republic of Serbia | |
| Dawodi et al. | Enhancing Pashto Text Classification using Language Processing Techniques for Single and Multi-Label Analysis |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141023 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141104 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141226 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150203 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150304 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5710581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |