[go: up one dir, main page]

JP2011008373A - 自然言語処理装置及びプログラム - Google Patents

自然言語処理装置及びプログラム Download PDF

Info

Publication number
JP2011008373A
JP2011008373A JP2009149358A JP2009149358A JP2011008373A JP 2011008373 A JP2011008373 A JP 2011008373A JP 2009149358 A JP2009149358 A JP 2009149358A JP 2009149358 A JP2009149358 A JP 2009149358A JP 2011008373 A JP2011008373 A JP 2011008373A
Authority
JP
Japan
Prior art keywords
sentence
verb
proper noun
word
natural language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009149358A
Other languages
English (en)
Inventor
Hiroshi Umeki
宏 梅基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2009149358A priority Critical patent/JP2011008373A/ja
Publication of JP2011008373A publication Critical patent/JP2011008373A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】固有名詞の換喩表現の抽出精度の向上を図ること。
【解決手段】自然言語処理装置は、所与の固有名詞又は所与の固有名詞と同格の語、を主語とし、且つ、動詞リストに記憶される、固有名詞の換喩表現である語を目的語とする文に用いられ得る動詞を含む文を検索する文検索部20と、文検索部20により検索された文に含まれる、動詞リストの動詞の目的語を取得する目的語取得部22と、目的語取得部22により取得された目的語を上記所与の固有名詞の換喩表現として辞書に登録する登録部24と、を含む。
【選択図】図6

Description

本発明は、自然言語処理装置、及びプログラムに関する。
固有名詞の換喩表現を抽出する技術が知られている。
例えば、下記非特許文献1には、「AのB」や「AB」といった単語の並びに着目して、固有名詞の換喩表現を抽出する技術が開示されている。
人工知能学会誌,2000年,5月,第15巻,第3号,p503−510
本発明は、固有名詞の換喩表現の抽出精度の向上を図ることを目的とする。
請求項1に係る自然言語処理装置は、「所与の固有名詞又は前記所与の固有名詞と同格の語、を主語とし、且つ、記憶手段に記憶される、「固有名詞の換喩表現である語を目的語とする文に用いられ得る動詞」を含む」文を検索する文検索手段と、前記文検索手段により検索された文に含まれる、前記記憶手段に記憶される動詞の目的語を取得する目的語取得手段と、前記目的語取得手段により取得された目的語を前記所与の固有名詞の換喩表現として辞書に登録する登録手段と、を含む。
また、請求項2に係る自然言語処理装置は、請求項1の発明において、前記文検索手段が、前記所与の固有名詞を定義する定義文を検索する定義文検索手段と、前記定義文検索手段により検索された定義文に含まれる、前記所与の固有名詞と同格の語を取得する同格語取得手段と、を含み、前記同格語取得手段により取得された語を主語とし、且つ、前記記憶手段に記憶される動詞を含む文を検索することを特徴とする。
また、請求項3に係る自然言語処理装置は、請求項1又は2の発明において、前記記憶手段に記憶される動詞は、著作物の創作に関連する動詞、又は、実演に関連する動詞、又は、物の生産に関する動詞であることを特徴とする。
請求項4に係るプログラムは、「所与の固有名詞又は前記所与の固有名詞と同格の語、を主語とし、且つ、記憶手段に記憶される、「固有名詞の換喩表現である語を目的語とする文に用いられ得る動詞」を含む」文を検索する文検索手段、前記文検索手段により検索された文に含まれる、前記記憶手段に記憶される動詞の目的語を取得する目的語取得手段、前記目的語取得手段により取得された目的語を前記所与の固有名詞の換喩表現として辞書に登録する登録手段、としてコンピュータを機能させることを特徴とする。
なお、上記プログラムは、インターネットなどの通信ネットワークを介して提供されてもよいし、フレキシブルディスク、CD−ROM、DVD−ROMなどのコンピュータ読み取り可能な各種情報記録媒体に格納されて提供されてもよい。
また、上記プログラムは、コンピュータ読み取り可能な情報記録媒体に記憶されてもよい。情報記録媒体としては、例えば、磁気テープ、フレキシブルディスク、ハードディスク、CD−ROM、MO、MD、DVD−ROM、ICカードなどを用いることができる。
請求項1及び4の発明によれば、固有名詞の換喩表現の抽出精度が向上する。
請求項2の発明によれば、本構成を有しない場合に比して、固有名詞の換喩表現の抽出精度がより向上する。
請求項3の発明によれば、本構成を有しない場合に比して、固有名詞の換喩表現の抽出精度がより向上する。
本実施形態に係る自然言語処理装置を含む自然言語処理システムの構成の一例を示す図である。 百科事典データの記憶内容の一例を示す図である。 自然言語処理装置の構成の一例を示す図である。 動詞リストの一例を示す図である。 換喩辞書データの一例を示す図である。 自然言語処理装置にて実現される機能群を示す機能ブロック図である。 自然言語処理装置にて実行される処理の一例を示すフロー図である。 換喩辞書データの一例を示す図である。 自然言語処理装置にて実行される処理の一例を示すフロー図である。
以下、本発明の実施形態の例について図面に基づき詳細に説明する。
図1は、本発明の実施形態に係る自然言語処理装置1を含む自然言語処理システム2の構成の一例を示す図である。同図に示すように、自然言語処理システム2は、自然言語処理装置1と、コーパスデータベース3と、を含む。自然言語処理装置1と、コーパスデータベース3と、はネットワークを介して相互に通信可能である。
[コーパスデータベース]
コーパスデータベース3は、データベースサーバである。コーパスデータベース3は、百科事典データを記憶している。
図2は、百科事典データの記憶内容の一例を示す。同図に示すように、百科事典データは、複数の記事4を含む。各記事4は、一のテーマ(事柄や事物を表す語(例えば、人名や企業名等の固有名詞))についての解説文を含むテキストデータである。
本実施形態の場合、各記事4は、他の少なくとも1つの記事4と関連づけられている(図2参照)。具体的には、記事4は、該記事4に含まれる言葉を解説する記事4と関連づけられている。例えば、テーマAを解説する記事4の中に、「テーマB」という言葉が含まれているとする。この場合、テーマAを解説する記事4は、「テーマB」を解説する記事4に関連づけられている。
コーパスデータベース3は、記事4の送信要求を自然言語処理装置1から受信すると、該送信要求で指定される記事4を自然言語処理装置1に送信する。
なお、百科事典データとしては、例えば、ウィキペディア(登録商標)として知られる百科事典データが挙げられる。
[自然言語処理装置]
自然言語処理装置1は、パーソナルコンピュータ等の公知のコンピュータである。図3に自然言語処理装置1の構成の一例を示す。図3に示すように、自然言語処理装置1は、制御部6と、主記憶8と、ハードディスク10(記憶手段)と、操作入力部12と、表示部14と、ネットワークインタフェース16と、を含む。これらは、データバス18を介して接続されている。
制御部6は例えばマイクロプロセッサである。制御部6は、主記憶8に記憶されるプログラムに従って情報処理を実行する。
主記憶8は、例えばRAMである。主記憶8には上記プログラムが格納される。このプログラムは、DVD(登録商標)−ROM等のコンピュータ読取可能な情報記憶媒体から読み出されて主記憶8に格納されてもよいし、ネットワーク等の通信網から供給されて主記憶8に格納されてもよい。
また、主記憶8には情報処理の過程で必要となる各種データも格納される。
操作入力部12は、ユーザが操作入力を行うためのユーザインタフェースである。操作入力部12は、例えばキーボードやマウスである。
表示部14は、例えばディスプレイである。表示部14は、制御部6から出力される情報を表示する。
ネットワークインタフェース16は、ネットワークインタフェースカードである。ネットワークインタフェース16は、制御部6から出力されるデータをネットワークに送信する。また、ネットワークインタフェース16は、ネットワークからデータを受信する。
ハードディスク10(記憶手段)は、各種データを記憶している。本実施形態の場合、ハードディスク10は、動詞リストと、換喩辞書データと、を記憶している。
[動詞リスト]
図4は、動詞リストの一例を示す。動詞リストは、「固有名詞(例えば、人名や企業名)の換喩表現である語を目的語とする文」に用いられ得る動詞のリストである。
本実施形態の場合、動詞リストには、著作物の創作に関連する動詞(例えば、「(詩、戯曲などを)書く」、「(曲を)作曲する」、「(脚本を)執筆する」、「(歌詞を)作詞する」、「(絵画を)描く」、「(絵画を)制作する」など)、又は、実演に関連する動詞(例えば、「(チェロを)演奏する」、「(歌を)歌う」など)、又は、物の生産に関連する動詞(例えば、「(自動車を)製造する」、「(自動車を)生産する」、「(家を)建築する」など)が含まれる。
例えば、ゲーテなどの劇作家の換喩表現は、その劇作家によって書かれた「戯曲」である。そして、「書く」という動詞は「戯曲」を目的語とすることができるので、「書く」が動詞リストに含まれている。
また、例えば、ヨーヨーマなどのチェリストの換喩表現は、そのチェリストにより演奏される楽器たる「チェロ」である。そして、「演奏する」という動詞は「チェロ」を目的語とすることができるので、「演奏する」が動詞リストに含まれている。
また、例えば、自動車メーカーの換喩表現は、その自動車メーカーによって製造された「自動車」である。そして、「製造する」という動詞は「自動車」を目的語とすることができるので、「製造する」が動詞リストに含まれている。
なお、動詞リストに含まれる動詞は、「固有名詞の換喩表現である語を目的語とする文」に用いられ得る動詞であれば、どのような動詞であってもよい。
[換喩辞書データ]
図5は、換喩辞書データの一例を示す図である。同図に示すように、換喩辞書データは、固有名詞毎に、該固有名詞の換喩表現を関連づけて保持する。例えば、劇作家である「ゲーテ」には、その換喩表現として「戯曲」が関連づけられている。
なお、動詞リスト及び換喩辞書データは、自然言語処理装置1とは別体の記憶装置に記憶されてもよい。
[機能ブロック]
図6は、本発明の実施形態に係る自然言語処理装置1にて実現される機能群を示す機能ブロック図である。同図に示すように、自然言語処理装置1では、文検索部(文検索手段)20と、目的語取得部(目的語取得手段)22と、登録部(登録手段)24と、が実現され、文検索部20は、定義文検索部(定義文検索手段)20aと、同格語取得部(同格語取得手段)20bと、を含む。これらの機能は、制御部6が、上記プログラムに従って動作することにより実現される。
[文検索部]
文検索部20は、例えば制御部6を主として実現される。文検索部20は、「所与の固有名詞と同格の語、を主語とし、且つ、上記動詞リストに記憶される動詞を含む」文を検索する。
[定義文検索部、同格語取得部]
本実施形態の場合、定義文検索部20aが、上記所与の固有名詞を定義する定義文を検索する。そして、同格語取得部20bが、定義文検索部20aにより検索された定義文のうちから、上記所与の固有名詞と同格の語を取得する。
そして、文検索部20は、「同格語取得部20bにより取得された語を主語とし、且つ、上記動詞リストに記憶される動詞を含む」文を検索する。なお、文検索部20、定義文検索部20a、及び同格語取得部20bの詳細は後述する(後述のS102〜S108)。
[目的語取得部]
目的語取得部22は、例えば制御部6を主として実現される。目的語取得部22は、文検索部20により検索された文のうちから、上記動詞リストに記憶される動詞の目的語を取得する。目的語取得部22の詳細については後述する(後述のS109)。
[登録部]
登録部24は、例えば制御部6を主として実現される。登録部24は、目的語取得部22により取得された目的語を、上記所与の固有名詞の換喩表現として換喩辞書データに登録する。すなわち、登録部24は、目的語取得部22により取得された目的語を、上記所与の固有名詞と関連づけて換喩辞書データに記憶する。
[処理]
図7は、本発明の実施形態に係る自然言語処理装置1で実行される処理の一例を示すフロー図である。この処理は、制御部6が上記プログラムを実行することにより実行される。以下、この処理について説明する。なお、以下、動詞リストに記憶される動詞のことを、「動詞リストの動詞」と呼ぶ。
まず、制御部6は、処理対象の固有名詞X(所与の固有名詞に相当)を取得する(S101)。例えば、制御部6は、操作入力部12からの操作入力に基づいて固有名詞Xを取得する。
そして、制御部6(文検索手段、定義文検索手段)は、S102〜S104のステップの処理により、固有名詞Xの定義文を検索する。
すなわち、制御部6は、固有名詞Xをテーマとする記事4(以下、記事X)を取得する(S102)。例えば、制御部6は、記事Xの送信要求をコーパスデータベース3に送信することにより、記事Xを取得する。
そして、制御部6は、記事Xに対して構文解析及び意味解析を実行する(S103)。例えば、記事Xに含まれる複数の文の各々を単語に分割し、単語の係り受け関係や品詞などを特定する。
そして、制御部6は、S103での解析結果に基づいて、記事Xのうちから固有名詞Xを定義する定義文を検索する(S104)。例えば、記事Xに含まれる文ごとに、固有名詞Xが主語であり且つ繋辞(いわゆるコピュラ)が含まれているか否かを判定することにより、定義文を検索する。なお、ある文が固有名詞Xの定義文である場合とは、その文において固有名詞Xが主語であり且つその文に繋辞が含まれている場合をいう。
そして、制御部6(文検索手段、同格語取得手段)は、S103での解析結果に基づいて、定義文のうちから、固有名詞Xと同格の語(以下、同格語X)を取得する(S105)。例えば、制御部6は、定義文において固有名詞Xと繋辞で結ばれている語を取得する。
そして、制御部6(文検索手段)は、S106〜S108のステップの処理により、「同格語Xを主語とし、且つ、動詞リストの動詞を含む」文を検索する。
すなわち、制御部6は、同格語Xをテーマとする記事4(以下、記事Y)をS102のステップと同様にして取得し(S106)、S103のステップと同様にして記事Yに対して構文解析及び意味解析を実行する(S107)。
そして、制御部6は、S107での解析結果に基づいて、記事Yのうちから、「同格語Xを主語とし、且つ、動詞リストの動詞を含む」文を検索する(S108)。例えば、制御部6は、記事Yに含まれる複数の文の各々について、その文において同格語Xが主語であるか否かの判定と、その文に動詞リストの動詞のいずれかが含まれているか否かの判定と、を実行することにより、「同格語Xを主語とし、且つ、動詞リストの動詞を含む」文を検索する。なお、ある文が「同格語Xを主語とし、且つ、動詞リストの動詞を含む」文である場合とは、その文において同格語Xが主語であると判定され且つその文に動詞リストの動詞のいずれかが含まれていると判定された場合をいう。
そして、制御部6(目的語取得手段)は、検索された文のうちから、「その文に含まれる動詞リストの動詞」の目的語Xを取得する(S109)。
そして、制御部6(登録手段)は、目的語Xを、固有名詞Xの換喩表現として換喩辞書データに登録する(S110)。すなわち、目的語Xを、固有名詞Xと関連づけて換喩辞書データに記憶する。
例えば、固有名詞Xがイギリスの劇作家の人名「シェークスピア」であり、記事Xが、「シェークスピアは、イギリス(イングランド)の劇作家、詩人。」という文aを含んでいる場合を想定する。この場合、文aは、S104のステップにおいて固有名詞Xの定義文として検索され、S105のステップにおいて「劇作家」及び「詩人」(ここでは、「劇作家」とする)が同格語Xとして取得される。そして、S106において同格語X(すなわち、劇作家)をテーマとする記事4が記事Yとして取得される。
記事Yが「劇作家は、演劇の上演のために書かれる戯曲の作者。」という文bを含んでいる場合、文bは、同格語Xである「劇作家」を主語として含み且つ動詞リストの動詞「書く」を含んでいるので、S108のステップにおいて検索される。そして、S109のステップにおいて、文bのうちから、文bに含まれる動詞リストの動詞「書く」の目的語となっている「戯曲」が目的語Xとして取得され、S110のステップにおいて、固有名詞Xである「シェークスピア」の換喩表現として換喩辞書データに登録されることとなる(図8参照)。
[まとめ]
本発明の実施形態に係る自然言語処理装置1によれば、固有名詞の換喩表現の抽出精度の向上が図られるようになる。
なお、本発明は、以上に説明した実施形態に限定されるものではない。
例えば、上記実施形態では、制御部6(文検索手段)は、「固有名詞Xの「同格語X」を主語とし、且つ、動詞リストの動詞を含む」文を検索しているが、「固有名詞Xを主語とし、且つ、動詞リストの動詞を含む」文を検索するようにしてもよい。以下、制御部6が「固有名詞Xを主語とし、且つ、動詞リストの動詞を含む」文を検索する態様について説明する。
例えば、この態様では、制御部6(文検索手段)は、図7に示すS103のステップの後、図9に示すS201〜S203のステップを実行する。
すなわち、制御部6(文検索手段)は、S103での解析結果に基づいて、記事Xのうちから、「固有名詞Xを主語とし、且つ、動詞リストの動詞を含む」文を検索する(201)。例えば、制御部6は、記事Xに含まれる複数の文の各々について、その文において固有名詞Xが主語であるか否かの判定と、その文に動詞リストの動詞のいずれかが含まれているか否かの判定と、を実行することにより、「固有名詞Xを主語とし、且つ、動詞リストの動詞を含む」文を検索する。なお、ある文が「固有名詞Xを主語とし、且つ、動詞リストの動詞を含む」文である場合とは、その文において固有名詞Xが主語であると判定され且つその文に動詞リストの動詞のいずれかが含まれていると判定された場合をいう。
そして、制御部6(目的語取得手段)は、検索された文のうちから、「その文に含まれる動詞リストの動詞」の目的語Xを取得する(S202)。
そして、制御部6(登録手段)は、目的語Xを、固有名詞Xの換喩表現として換喩辞書データに登録する(S203)。
例えば、固有名詞Xがイギリスの劇作家の人名「シェークスピア」であり、記事Xが、「シェークスピアは、多くの戯曲を書いたイギリスの劇作家、詩人。」という文aを含んでいる場合を想定する。この場合、文aは、固有名詞Xである「シェークスピア」を主語として含み且つ動詞リストの動詞「書く」を含んでいるので、S201のステップにおいて検索される。そして、S202のステップにおいて、文aのうちから、文aに含まれる動詞リストの動詞「書く」の目的語となっている「戯曲」が目的語Xとして取得され、S203のステップにおいて、固有名詞Xである「シェークスピア」の換喩表現として換喩辞書データに登録されることとなる(図8参照)。
なお、制御部6は、S201〜S203のステップの処理と、S104〜S110のステップの処理と、の双方を実行してもよいし、いずれか一方を実行するようにしてもよい。
1 自然言語処理装置、2 自然言語処理システム、3 コーパスデータベース、4 記事、6 制御部、8 主記憶、10 ハードディスク、12 操作入力部、14 表示部、16 ネットワークインタフェース、18 データバス、20 文検索部、20a 定義文検索部、20b 同格語取得部、22 目的語取得部、24 登録部。

Claims (4)

  1. 所与の固有名詞又は前記所与の固有名詞と同格の語、を主語とし、且つ、記憶手段に記憶される、固有名詞の換喩表現である語を目的語とする文に用いられ得る動詞を含む文を検索する文検索手段と、
    前記文検索手段により検索された文に含まれる、前記記憶手段に記憶される動詞の目的語を取得する目的語取得手段と、
    前記目的語取得手段により取得された目的語を前記所与の固有名詞の換喩表現として辞書に登録する登録手段と、
    を含む自然言語処理装置。
  2. 前記文検索手段は、
    前記所与の固有名詞を定義する定義文を検索する定義文検索手段と、
    前記定義文検索手段により検索された定義文に含まれる、前記所与の固有名詞と同格の語を取得する同格語取得手段と、を含み、
    前記同格語取得手段により取得された語を主語とし、且つ、前記記憶手段に記憶される動詞を含む文を検索すること、
    を特徴とする請求項1に記載の自然言語処理装置。
  3. 前記記憶手段に記憶される動詞は、著作物の創作に関連する動詞、又は、実演に関連する動詞、又は、物の生産に関する動詞であること、
    を特徴とする請求項1又は2に記載の自然言語処理装置。
  4. 所与の固有名詞又は前記所与の固有名詞と同格の語、を主語とし、且つ、記憶手段に記憶される、固有名詞の換喩表現である語を目的語とする文に用いられ得る動詞を含む文を検索する文検索手段、
    前記文検索手段により検索された文に含まれる、前記記憶手段に記憶される動詞の目的語を取得する目的語取得手段、
    前記目的語取得手段により取得された目的語を前記所与の固有名詞の換喩表現として辞書に登録する登録手段、
    としてコンピュータを機能させるプログラム。
JP2009149358A 2009-06-24 2009-06-24 自然言語処理装置及びプログラム Pending JP2011008373A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009149358A JP2011008373A (ja) 2009-06-24 2009-06-24 自然言語処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009149358A JP2011008373A (ja) 2009-06-24 2009-06-24 自然言語処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2011008373A true JP2011008373A (ja) 2011-01-13

Family

ID=43564991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009149358A Pending JP2011008373A (ja) 2009-06-24 2009-06-24 自然言語処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2011008373A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021233A (zh) * 2016-05-24 2016-10-12 仲恺农业工程学院 基于文本语境信息层级量化的转喻加工实验方法及应用
KR20230068092A (ko) * 2021-11-10 2023-05-17 동의대학교 산학협력단 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021233A (zh) * 2016-05-24 2016-10-12 仲恺农业工程学院 基于文本语境信息层级量化的转喻加工实验方法及应用
CN106021233B (zh) * 2016-05-24 2018-07-27 广东外语外贸大学 基于文本语境信息层级量化的转喻加工实验方法及应用
KR20230068092A (ko) * 2021-11-10 2023-05-17 동의대학교 산학협력단 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템
KR102625347B1 (ko) * 2021-11-10 2024-01-15 동의대학교 산학협력단 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템

Similar Documents

Publication Publication Date Title
Altinok Mastering spaCy: An end-to-end practical guide to implementing NLP applications using the Python ecosystem
Mohit Named entity recognition
JP5319655B2 (ja) 情報処理装置、情報処理方法、プログラム、およびプログラムを記録したコンピュータ読取り可能な記録媒体
JP6310150B2 (ja) 意図理解装置、方法およびプログラム
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
US20070055493A1 (en) String matching method and system and computer-readable recording medium storing the string matching method
Kiyavitskaya et al. Cerno: Light-weight tool support for semantic annotation of textual documents
CN113157727B (zh) 提供召回结果的方法、设备和存储介质
JP6622236B2 (ja) 発想支援装置及び発想支援方法
JP2019082931A (ja) 検索装置、類似度算出方法、およびプログラム
JP6275569B2 (ja) 対話装置、方法およびプログラム
Moncla et al. Automated geoparsing of paris street names in 19th century novels
JP6305630B2 (ja) 文書検索装置、方法及びプログラム
US8229970B2 (en) Efficient storage and retrieval of posting lists
CN114625845B (zh) 一种信息检索方法、智能终端及计算机可读存储介质
Weitz et al. Mining MARC's hidden treasures: initial investigations into how notes of the past might shape our future
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
JP2011008373A (ja) 自然言語処理装置及びプログラム
JP2004334382A (ja) 構造化文書要約装置、プログラムおよび記録媒体
JP5302784B2 (ja) 機械翻訳方法、及びシステム
JP5019315B2 (ja) 情報処理装置、情報処理方法、及びプログラム
Beridze et al. Dialect dictionaries in the Georgian dialect corpus
JP4341077B2 (ja) 文書処理装置、文書処理方法、および、文書処理プログラム
JP2022002034A (ja) 抽出方法、抽出プログラム、及び、抽出装置
Nga et al. NT Team at multilingual job title matching task a: job matching via large language model-based description generation and retrieval