JP2018190030A - 情報処理サーバ、その制御方法、及びプログラム、並びに、情報処理システム、その制御方法、及びプログラム - Google Patents
情報処理サーバ、その制御方法、及びプログラム、並びに、情報処理システム、その制御方法、及びプログラム Download PDFInfo
- Publication number
- JP2018190030A JP2018190030A JP2017089575A JP2017089575A JP2018190030A JP 2018190030 A JP2018190030 A JP 2018190030A JP 2017089575 A JP2017089575 A JP 2017089575A JP 2017089575 A JP2017089575 A JP 2017089575A JP 2018190030 A JP2018190030 A JP 2018190030A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- document data
- correction
- corrected
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
特許文献1においては、あらかじめ電子的に記憶された辞書を用意し、音声認識で受け付けた文字列のうち、誤認識されている部分を特定し、さらに辞書の中から誤認識した文字列に対して、訂正候補の文字列および誤認識した文字列と訂正候補の文字列の類似度を計算する技術が記載されている。
文書検索部102は、前述の手順で取得された入力文字列に基づき、文書記憶部121に格納されたテキスト文書を検索する。検索は、テキスト文書自体ではなく、テキスト文書から予め生成された索引に対して実行するものであってもよい。テキスト文書の検索および索引を生成することに関する技術は、周知の技術であるため詳細は割愛する。
図3は、本発明の実施形態に係る検索処理のフローチャートの一例を示す図である。図3のフローチャートの各ステップは、情報処理装置100上のCPU201で実行される。
101 入力文字列受付部
102 文書検索部
103 単語抽出部
104 辞書検索部
105 類似度判定部
106 修正候補格納部
107 修正候補提示部
108 修正結果受付部
121 文書記憶部
122 単語辞書記憶部
311 抽出単語記憶部
312 修正候補記憶部
600 共起情報記憶部
Claims (9)
- 複数の文書データから適切な文書データを、ユーザから受け付けた文字列をもとに検索することのできる情報処理サーバであって、
複数の前記文書データを記憶する記憶手段と、
前記文書データを検索するための複数の文字列であって、修正対象の修正文字列を少なくとも含む文字列を受け付ける受付手段と、
前記受付手段で受け付けた前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索する検索手段と、
前記検索手段で検索された前記文書データに含まれる文字列に基づいて、前記修正文字列を修正する修正手段と
を備え、
前記検索手段は、前記修正手段で修正された前記修正文字列を含む前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索すること
を特徴とする情報処理サーバ。 - 前記修正文字列を修正するための修正データを管理する管理手段をさらに備え、
前記修正手段は、前記修正文字列を前記修正データに基づいて修正すること
を特徴とする請求項1に記載の情報処理サーバ。 - 前記検索手段で検索された前記文書データに含まれる文字列から、前記修正文字列の修正候補を特定する特定手段と、
前記修正手段は、前記特定手段で特定された前記修正候補のいずれかで前記修正文字列を修正すること
を特徴とする請求項1または2に記載の情報処理サーバ。 - 前記特定手段で特定された前記修正候補について、前記修正文字列と前記文書データで共起する回数を示す共起度を求める算出手段を更に備え、
前記修正手段は、前記算出手段で算出された前記共起度に基づいて決まる前記修正候補により、前記修正文字列を修正すること
を特徴とする請求項3に記載の情報処理サーバ。 - 複数の文書データを記憶する記憶手段を備える情報処理サーバであり、複数の文書データから適切な文書データを、ユーザから受け付けた文字列をもとに検索することのできる情報処理サーバの制御方法であって、
前記文書データを検索するための複数の文字列であって、修正対象の修正文字列を少なくとも含む文字列を受け付ける受付ステップと、
前記受付ステップで受け付けた前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索する検索ステップと、
前記検索ステップで検索された前記文書データに含まれる文字列に基づいて、前記修正文字列を修正する修正ステップと
を含み、
前記検索ステップは、前記修正ステップで修正された前記修正文字列を含む前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索すること
を特徴とする情報処理サーバの制御方法。 - 複数の文書データを記憶する記憶手段を備える情報処理サーバであり、複数の文書データから適切な文書データを、ユーザから受け付けた文字列をもとに検索することのできる情報処理サーバで実行可能なプログラムであって、
情報処理サーバを、
前記文書データを検索するための複数の文字列であって、修正対象の修正文字列を少なくとも含む文字列を受け付ける受付手段と、
前記受付手段で受け付けた前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索する検索手段と、
前記検索手段で検索された前記文書データに含まれる文字列に基づいて、前記修正文字列を修正する修正手段
として機能させ、
前記検索手段を、前記修正手段で修正された前記修正文字列を含む前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索するよう機能させること
を特徴とするプログラム。 - 複数の文書データから適切な文書データを、ユーザから受け付けた文字列をもとに検索することのできる情報処理サーバを含む情報処理システムであって、
複数の前記文書データを記憶する記憶手段と、
前記文書データを検索するための複数の文字列であって、修正対象の修正文字列を少なくとも含む文字列を受け付ける受付手段と、
前記受付手段で受け付けた前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索する検索手段と、
前記検索手段で検索された前記文書データに含まれる文字列に基づいて、前記修正文字列を修正する修正手段と
を備え、
前記検索手段は、前記修正手段で修正された前記修正文字列を含む前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索すること
を特徴とする情報処理システム。 - 複数の文書データを記憶する記憶手段を備える情報処理システムであり、複数の文書データから適切な文書データを、ユーザから受け付けた文字列をもとに検索することのできる情報処理サーバを含む情報処理システムの制御方法であって、
前記文書データを検索するための複数の文字列であって、修正対象の修正文字列を少なくとも含む文字列を受け付ける受付ステップと、
前記受付ステップで受け付けた前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索する検索ステップと、
前記検索ステップで検索された前記文書データに含まれる文字列に基づいて、前記修正文字列を修正する修正ステップと
を含み、
前記検索ステップは、前記修正ステップで修正された前記修正文字列を含む前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索すること
を特徴とする情報処理システムの制御方法。 - 複数の文書データを記憶する記憶手段を備える情報処理システムであり、複数の文書データから適切な文書データを、ユーザから受け付けた文字列をもとに検索することのできる情報処理サーバを含む情報処理システムで実行可能なプログラムであって、
情報処理システムを、
前記文書データを検索するための複数の文字列であって、修正対象の修正文字列を少なくとも含む文字列を受け付ける受付手段と、
前記受付手段で受け付けた前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索する検索手段と、
前記検索手段で検索された前記文書データに含まれる文字列に基づいて、前記修正文字列を修正する修正手段
として機能させ、
前記検索手段を、前記修正手段で修正された前記修正文字列を含む前記文字列を用いて、前記記憶手段で記憶される複数の前記文書データを検索させること
を特徴とするプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017089575A JP6916437B2 (ja) | 2017-04-28 | 2017-04-28 | 情報処理装置、その制御方法、及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017089575A JP6916437B2 (ja) | 2017-04-28 | 2017-04-28 | 情報処理装置、その制御方法、及びプログラム |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2018190030A true JP2018190030A (ja) | 2018-11-29 |
| JP2018190030A5 JP2018190030A5 (ja) | 2020-07-30 |
| JP6916437B2 JP6916437B2 (ja) | 2021-08-11 |
Family
ID=64479799
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017089575A Active JP6916437B2 (ja) | 2017-04-28 | 2017-04-28 | 情報処理装置、その制御方法、及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6916437B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20200081562A (ko) * | 2018-12-27 | 2020-07-08 | 현대엠엔소프트 주식회사 | 주소데이터 보정 장치 및 방법 |
| JP2021179860A (ja) * | 2020-05-14 | 2021-11-18 | ヤフー株式会社 | 情報処理装置、情報処理方法及びプログラム |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2014041607A1 (ja) * | 2012-09-11 | 2014-03-20 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
-
2017
- 2017-04-28 JP JP2017089575A patent/JP6916437B2/ja active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2014041607A1 (ja) * | 2012-09-11 | 2014-03-20 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
Non-Patent Citations (1)
| Title |
|---|
| 伊藤 友裕、外3名: "音声文書インデキシングのためのWEB文書を利用した自動誤り訂正", FIT2004 第3回情報科学技術フォーラム 一般講演論文集 第2分冊, JPN6020047835, 20 August 2004 (2004-08-20), JP, pages 343 - 344, ISSN: 0004406236 * |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20200081562A (ko) * | 2018-12-27 | 2020-07-08 | 현대엠엔소프트 주식회사 | 주소데이터 보정 장치 및 방법 |
| KR102622577B1 (ko) * | 2018-12-27 | 2024-01-09 | 현대오토에버 주식회사 | 주소데이터 보정 장치 및 방법 |
| JP2021179860A (ja) * | 2020-05-14 | 2021-11-18 | ヤフー株式会社 | 情報処理装置、情報処理方法及びプログラム |
| JP7128229B2 (ja) | 2020-05-14 | 2022-08-30 | ヤフー株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6916437B2 (ja) | 2021-08-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7028858B2 (ja) | 電子記録の文脈検索のためのシステム及び方法 | |
| US7769771B2 (en) | Searching a document using relevance feedback | |
| US20190205391A1 (en) | Automated Document Cluster Merging for Topic-Based Digital Assistant Interpretation | |
| CN111191105B (zh) | 政务信息的搜索方法、装置、系统、设备及存储介质 | |
| JP2004062893A (ja) | 重み付き編集距離に基づく例文の自動検索用システムおよび方法 | |
| US20130124194A1 (en) | Systems and methods for manipulating data using natural language commands | |
| US20180267953A1 (en) | Context-based text auto completion | |
| KR20200014047A (ko) | 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램 | |
| CN109960721B (zh) | 基于源内容的多重压缩构造内容 | |
| US20210149900A1 (en) | Method, system and computer program for semantic triple-based knowledge extension | |
| US20200278971A1 (en) | Document retrieval apparatus and document retrieval method | |
| JP4160548B2 (ja) | 文書要約作成システム、方法、及びプログラム | |
| US8583415B2 (en) | Phonetic search using normalized string | |
| US10120843B2 (en) | Generation of parsable data for deep parsing | |
| US20250181620A1 (en) | Fine-grained attribution for document question answering | |
| JP7295463B2 (ja) | 業務フロー作成支援装置、業務フロー作成支援方法、および、業務フロー作成支援プログラム | |
| JP2011133928A (ja) | 記憶装置に記憶してある文書ファイルを検索する検索装置、検索システム、検索方法及びコンピュータプログラム | |
| JP6916437B2 (ja) | 情報処理装置、その制御方法、及びプログラム | |
| EP3822817A1 (en) | Method, system and computer program for semantic triple-based knowledge extension | |
| US10942934B2 (en) | Non-transitory computer-readable recording medium, encoded data searching method, and encoded data searching apparatus | |
| JP2009104475A (ja) | 類似文書検索装置、類似文書検索方法およびプログラム | |
| JP4935243B2 (ja) | 検索プログラム、情報検索装置及び情報検索方法 | |
| JP7485986B2 (ja) | 情報処理方法、情報処理装置、及びプログラム | |
| JP2010250389A (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
| US20140181065A1 (en) | Creating Meaningful Selectable Strings From Media Titles |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20180703 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20181031 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190115 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191218 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200622 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201105 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201215 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210210 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210615 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210628 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6916437 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |