JP2018194881A - 文書分類システムおよび文書分類方法 - Google Patents
文書分類システムおよび文書分類方法 Download PDFInfo
- Publication number
- JP2018194881A JP2018194881A JP2017095341A JP2017095341A JP2018194881A JP 2018194881 A JP2018194881 A JP 2018194881A JP 2017095341 A JP2017095341 A JP 2017095341A JP 2017095341 A JP2017095341 A JP 2017095341A JP 2018194881 A JP2018194881 A JP 2018194881A
- Authority
- JP
- Japan
- Prior art keywords
- classification
- document
- word
- basis
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1は、文書分類システムの全体の機能構成を示したものであり、本実施形態の文書分類システムは、図1に示されるように、利用者端末10、AP(Application)サーバ100、DBサーバ200、文書分類サーバ300がネットワーク5で接続された形態である。
次に、単語の埋込み表現として、各単語にワードベクトルを設定する(S12、PH2)。
先ず、文書分類サーバ300は、DBサーバ200を介して、分類をおこなう文献(文献ファイル226)を読み込む(S21)。
なお、本実施形態では、文書の分類を付与し、その分類過程で出力された情報を用いて関連特許文献の表示を行っているが、分類付与を行わずに関連特許文献の表示のみを行ってもよい。特許情報を利用する企業、研究所においては、特許庁等が付与した分類を用いることができるため、新たに分類を付与する必要はないからである。
この場合においても、システム構成は図1と同様となる。付与した分類以外の分類根拠などは、公開されない情報が多いからである。まずは、特許庁が分類付与した特許文献(すなわち、教師データ)を用いて、学習モデル情報321を作成する。その後、モデル情報321を用いて、分類付与済みの特許文献について、分類付与処理を行う。これによってDBサーバ200の記憶部220に記憶される各情報が形成され、関連特許の表示が可能になる。
Claims (15)
- 文書に分類を付与する文書分類システムであって、
分類付与済み文書を教師データとして読み込んで作成したモデル情報を備え、
分類付与対象の文書を読み込み、前記モデル情報を用いて、分類対象の文書に複数の分類を付与する分類部を有し、
当該分類を付与する根拠となった前記分類付与対象の単語または文を出力することを特徴とする文書分類システム。 - 請求項1において、
文書中で根拠となった単語または文が強調された文書を出力することを特徴とする文書分類システム。 - 請求項1において、
根拠となった単語または文のリストを出力することを特徴とする文書分類システム。 - 請求項3において、
根拠となった単語または文のリストに、単語または文の分類に寄与した重みを表示することを特徴とする文書分類システム。 - 請求項1乃至4のいずれかにおいて、
前記付与された分類の選択を受け付け、選択された分類の付与根拠を表示することを特徴とする文書分類システム。 - 請求項5において、
選択された分類の付与根拠は、分類の根拠となった重みの大きい単語または文を表示することを特徴とする文書分類システム。 - 請求項1乃至6のいずれかにおいて、
前記付与された分類ごとの分類精度を表示することを特徴とする文書分類システム。 - 請求項1乃至7のいずれかにおいて、
複数の分類について区別可能な状態で、前記分類の付与根拠を表示することを特徴とする文書分類システム。 - 請求項8において、
前記複数の分類の類似度に基づいて、前記分類の類似度に応じて、前記分類付与対象の単語または文の出力の様態を変えて出力することを特徴とする文書分類システム。 - 請求項1乃至9において、
分類を付与する根拠となった前記分類付与対象の単語または文を選択して、その前記分類付与対象の単語または文の分類の寄与が大きい文献一覧を表示することを特徴とする文書分類システム。 - 請求項3において、
根拠となった単語または文のリストの中の単語または文を選択して、その前記分類付与対象の単語または文の分類の寄与が大きい文献一覧を表示することを特徴とする文書分類システム。 - 文書に分類を付与する文書分類方法であって、
分類付与済み文書を教師データとして読み込んで作成したモデル情報作成するステップと、
分類付与対象の文書を読み込み、前記モデル情報を用いて、前記分類対象の文書に複数の分類を付与するステップと、
該当する文献に対する付与された分類を表示するステップと、
該当する文献に対する付与された分類の選択を受け付けて、選択された分類の付与根拠を表示するステップとを有することを特徴する文書分類方法。 - 請求項12において、
分類の付与根拠として、前記文書中で根拠となった単語または文が強調された文書とを出力することを特徴とする文書分類方法。 - 請求項12において、
分類の付与根拠として、根拠となった単語または文のリストを出力することを特徴とする文書分類方法。 - 請求項14において、
根拠となった単語または文のリストに、単語または文の分類に寄与した重みを表示することを特徴とする文書分類方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017095341A JP6814091B2 (ja) | 2017-05-12 | 2017-05-12 | 文書分類システムおよび文書分類方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017095341A JP6814091B2 (ja) | 2017-05-12 | 2017-05-12 | 文書分類システムおよび文書分類方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018194881A true JP2018194881A (ja) | 2018-12-06 |
| JP6814091B2 JP6814091B2 (ja) | 2021-01-13 |
Family
ID=64570847
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017095341A Active JP6814091B2 (ja) | 2017-05-12 | 2017-05-12 | 文書分類システムおよび文書分類方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6814091B2 (ja) |
Cited By (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020095521A (ja) * | 2018-12-13 | 2020-06-18 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| JP2020113218A (ja) * | 2019-01-16 | 2020-07-27 | 株式会社エクサウィザーズ | 情報処理装置、表示方法およびプログラム |
| WO2020179764A1 (ja) * | 2019-03-05 | 2020-09-10 | 株式会社医療情報技術研究所 | 分類システム |
| JP2021108012A (ja) * | 2019-12-27 | 2021-07-29 | Kddi株式会社 | 説明装置、説明方法及び説明プログラム |
| JPWO2021230000A1 (ja) * | 2020-05-15 | 2021-11-18 | ||
| JP2022104232A (ja) * | 2020-12-28 | 2022-07-08 | パナソニックIpマネジメント株式会社 | 分類装置、分類方法、及び、コンピュータプログラム |
| KR102427136B1 (ko) * | 2021-10-29 | 2022-08-01 | (주)제이엘케이 | 유사한 문장을 검색하기 위한 방법 및 장치 |
| JP2023013117A (ja) * | 2021-07-15 | 2023-01-26 | Kddi株式会社 | 説明可能化装置、説明可能化方法及び説明可能化プログラム |
| WO2023026140A1 (ja) * | 2021-08-26 | 2023-03-02 | 株式会社半導体エネルギー研究所 | 文書分類システム、及び文書分類方法 |
| JP2023054506A (ja) * | 2021-10-04 | 2023-04-14 | 株式会社ラック | 情報検索システム、情報検索方法およびプログラム |
| JP2024002456A (ja) * | 2022-06-24 | 2024-01-11 | 株式会社日立製作所 | 文書分類システム、文書分類装置、及び文書分類方法 |
| JP2024010619A (ja) * | 2022-07-12 | 2024-01-24 | 富士フイルム株式会社 | 学習装置、学習方法、及び学習プログラム |
| JP2024041521A (ja) * | 2022-09-14 | 2024-03-27 | 株式会社東芝 | 文書分類装置、方法およびプログラム |
| WO2025263427A1 (ja) * | 2024-06-21 | 2025-12-26 | 株式会社村田製作所 | 技術情報分類システムおよび技術情報を分類する方法 |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2024080119A (ja) | 2022-12-01 | 2024-06-13 | 株式会社東芝 | 文書分類装置、方法およびプログラム |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006285499A (ja) * | 2005-03-31 | 2006-10-19 | Nec Corp | データマイニング装置、データマイニング方法およびそのプログラム |
| JP2009217528A (ja) * | 2008-03-11 | 2009-09-24 | Hitachi Ltd | 文書分類付与方法、システムまたはコンピュータプログラム |
| JP2016206748A (ja) * | 2015-04-16 | 2016-12-08 | 株式会社日立製作所 | 分類付与方法および分類付与システム |
-
2017
- 2017-05-12 JP JP2017095341A patent/JP6814091B2/ja active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006285499A (ja) * | 2005-03-31 | 2006-10-19 | Nec Corp | データマイニング装置、データマイニング方法およびそのプログラム |
| JP2009217528A (ja) * | 2008-03-11 | 2009-09-24 | Hitachi Ltd | 文書分類付与方法、システムまたはコンピュータプログラム |
| JP2016206748A (ja) * | 2015-04-16 | 2016-12-08 | 株式会社日立製作所 | 分類付与方法および分類付与システム |
Non-Patent Citations (1)
| Title |
|---|
| 特許庁, 「平成29年度 F ターム等付与支援システム実用化に向けた実証的研究事業 仕様書」, JPN6020022857, April 2017 (2017-04-01), pages 1 - 9, ISSN: 0004295843 * |
Cited By (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7284371B2 (ja) | 2018-12-13 | 2023-05-31 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| JP2020095521A (ja) * | 2018-12-13 | 2020-06-18 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| JP2020113218A (ja) * | 2019-01-16 | 2020-07-27 | 株式会社エクサウィザーズ | 情報処理装置、表示方法およびプログラム |
| WO2020179764A1 (ja) * | 2019-03-05 | 2020-09-10 | 株式会社医療情報技術研究所 | 分類システム |
| JP2020144502A (ja) * | 2019-03-05 | 2020-09-10 | 株式会社医療情報技術研究所 | 分類システム |
| US12339932B2 (en) | 2019-03-05 | 2025-06-24 | Iryou Jyouhou Gijyutu Kenkyusho Corporation | Classification system |
| JP2021108012A (ja) * | 2019-12-27 | 2021-07-29 | Kddi株式会社 | 説明装置、説明方法及び説明プログラム |
| JP7179714B2 (ja) | 2019-12-27 | 2022-11-29 | Kddi株式会社 | 説明装置、説明方法及び説明プログラム |
| JPWO2021230000A1 (ja) * | 2020-05-15 | 2021-11-18 | ||
| WO2021230000A1 (ja) * | 2020-05-15 | 2021-11-18 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及び情報処理システム |
| US12469130B2 (en) | 2020-05-15 | 2025-11-11 | Sony Group Corporation | Pathology image diagnosis support apparatus, pathology image diagnosis support method, and pathology image diagnosis support system |
| JP7652188B2 (ja) | 2020-05-15 | 2025-03-27 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及び情報処理システム |
| JP7199028B2 (ja) | 2020-12-28 | 2023-01-05 | パナソニックIpマネジメント株式会社 | 分類装置、分類方法、及び、コンピュータプログラム |
| JP2022104232A (ja) * | 2020-12-28 | 2022-07-08 | パナソニックIpマネジメント株式会社 | 分類装置、分類方法、及び、コンピュータプログラム |
| JP7525449B2 (ja) | 2021-07-15 | 2024-07-30 | Kddi株式会社 | 説明可能化装置、説明可能化方法及び説明可能化プログラム |
| JP2023013117A (ja) * | 2021-07-15 | 2023-01-26 | Kddi株式会社 | 説明可能化装置、説明可能化方法及び説明可能化プログラム |
| WO2023026140A1 (ja) * | 2021-08-26 | 2023-03-02 | 株式会社半導体エネルギー研究所 | 文書分類システム、及び文書分類方法 |
| JP2023054506A (ja) * | 2021-10-04 | 2023-04-14 | 株式会社ラック | 情報検索システム、情報検索方法およびプログラム |
| KR102427136B1 (ko) * | 2021-10-29 | 2022-08-01 | (주)제이엘케이 | 유사한 문장을 검색하기 위한 방법 및 장치 |
| JP2024002456A (ja) * | 2022-06-24 | 2024-01-11 | 株式会社日立製作所 | 文書分類システム、文書分類装置、及び文書分類方法 |
| JP2024010619A (ja) * | 2022-07-12 | 2024-01-24 | 富士フイルム株式会社 | 学習装置、学習方法、及び学習プログラム |
| JP2024041521A (ja) * | 2022-09-14 | 2024-03-27 | 株式会社東芝 | 文書分類装置、方法およびプログラム |
| WO2025263427A1 (ja) * | 2024-06-21 | 2025-12-26 | 株式会社村田製作所 | 技術情報分類システムおよび技術情報を分類する方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6814091B2 (ja) | 2021-01-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6814091B2 (ja) | 文書分類システムおよび文書分類方法 | |
| Alene et al. | Prevalence and determinants of unintended pregnancy in Ethiopia: A systematic review and meta-analysis of observational studies | |
| US8521561B2 (en) | Database system, program, image retrieving method, and report retrieving method | |
| US9588955B2 (en) | Systems, methods, and software for manuscript recommendations and submissions | |
| JP2010527067A (ja) | 文書を解析するためのシステムおよび方法 | |
| CN101430704A (zh) | 支持分类规则创建的方法和装置 | |
| TW201322023A (zh) | 檢索裝置、檢索方法、檢索程式產品及記錄媒體 | |
| US20240419889A1 (en) | Programmatic Creation of Dynamically Configured, Hierarchically Organized Hyperlinked XML Documents For Presenting Data and Domain Knowledge From Diverse Sources | |
| CN109902152A (zh) | 用于检索信息的方法和装置 | |
| JP7259854B2 (ja) | 質問応答装置、質問応答方法およびプログラム | |
| CN102272727B (zh) | 用于支援多个应用程序间的数据连接的装置和方法 | |
| WO2019008394A1 (en) | CAPTURE AND EXTRACTION OF DIGITAL INFORMATION | |
| McGowan | Using text mining tools to inform search term generation: an introduction for librarians | |
| US20070100809A1 (en) | Mixed mode (mechanical process and english text) query building support for improving the process of building queries correctly | |
| JP5574775B2 (ja) | アイデア整理支援装置およびアイデア整理支援プログラム | |
| KR20090105715A (ko) | 전문가 추천 검색결과 제공 방법 및 이를 위한 기록매체 | |
| Kemp et al. | A taxonomy of design guidance for hypermedia design | |
| KR102111989B1 (ko) | 자연어 질의에 대하여 시계열 정보를 제공하는 시스템 및 방법 | |
| KR20230068762A (ko) | 의료기기 관련 정보 통합 검색 시스템 | |
| JP7103414B2 (ja) | 表示形式決定装置、表示形式決定方法およびプログラム | |
| Bibi et al. | Web semantics and ontologies-based framework for software component selection from online repositories | |
| Paternò et al. | How an LLM Can Improve Automatic Web Accessibility Validation? | |
| JP2003044486A (ja) | 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム | |
| CN112733527B (zh) | 建筑工程文档知识网络的构建方法及系统 | |
| Babych et al. | Cross-language comparability and its applications for MT |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191121 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200630 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200817 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201208 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201218 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6814091 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |