[go: up one dir, main page]

JP2008158641A - 議論展開検出方法、議論展開検出装置、議論展開検出プログラム、および議論展開検出プログラムを記録した記録媒体 - Google Patents

議論展開検出方法、議論展開検出装置、議論展開検出プログラム、および議論展開検出プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2008158641A
JP2008158641A JP2006344366A JP2006344366A JP2008158641A JP 2008158641 A JP2008158641 A JP 2008158641A JP 2006344366 A JP2006344366 A JP 2006344366A JP 2006344366 A JP2006344366 A JP 2006344366A JP 2008158641 A JP2008158641 A JP 2008158641A
Authority
JP
Japan
Prior art keywords
message
discussion
expansion
messages
structure graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006344366A
Other languages
English (en)
Inventor
Naomi Yamashita
直美 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006344366A priority Critical patent/JP2008158641A/ja
Publication of JP2008158641A publication Critical patent/JP2008158641A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】メッセージ集合から選択した重要メッセージに関する議論の展開レベルを検出する。
【解決手段】議論構造グラフ作成部15Cにより、メッセージ集合14Aから所定の重要度より高い関連度16Bを有するメッセージ対を選択し、これらメッセージ対ごとに両メッセージの開示順に応じた向きを有する有向枝で当該メッセージ間を結ぶことにより、議論の展開を示す議論構造グラフ16Cを作成し、メッセージ分類部15Dにより、この議論構造グラフ16Cに示された各メッセージに出入りする有向枝に基づいて各メッセージを予め設けた議論の展開レベルにそれぞれ分類し、各メッセージと展開レベルとの対応関係を示す検出結果情報14Bを出力する。
【選択図】 図1

Description

本発明は、情報検索技術に関し、特に任意のメッセージ集合から議論の展開を検出する技術に関する。
インターネットの普及に伴い、Web上に設けられたBBS(Bulletin Board System)など、質問、意見、提案などのメッセージをオンラインで書き込むことが可能な掲示板システムで、様々なテーマについて活発な議論が行われている。このように、情報が氾濫する今日、規模の大きいメッセージ集合から議論の内容を効率よく把握するための技術が注目を浴びている。
このような規模の大きいテキスト情報から効率的に短時間で情報を得る手段の一つとして、要約技術がある。この要約技術によれば、機械的に要約された文章を読むことによって、容易にテキスト情報について知識を得ることができ、読者は更に詳細の情報を読むか否かを短時間で判断することが可能になる。このような要約技術では、文書中から重要なテキスト情報を抽出し、これらを組み合わせて要約を作成する方法が一般的である。
従来、オンライン上の議論に限らず、様々な文書中から重要文や重要メッセージを抜き出す様々な手法が提案されている(例えば、非特許文献1など参照)。これは、各種単語やその組合せに対して予め重要度を付与しておき、文書から抽出した単語の重要度の和に基づき各文の重要度を算出し、これら重要度に基づいて文書中から重要文や重要メッセージを選択するものである。
平尾努,鈴木潤,磯崎秀樹,前田英作、「言語パターンに着目した複数文書要約」、IPSJ SIG Technical Report、2003.
しかしながら、このような従来技術では、単に重要な単語を含む文を抽出するといった手法を用いているため、メッセージ集合から重要メッセージを選択できるものの、メッセージ集合における議論の展開を検出できないという問題点があった。
重要メッセージを用いてメッセージ集合を要約した場合、議論の展開に沿って重要メッセージを連結することにより、要約として価値ある情報が得られる。したがって、重要メッセージを選択するだけでなく、重要メッセージに関連して議論の展開も検出する必要がある。
前述のように、メッセージ集合から単に重要メッセージを選択するだけでは、選択したメッセージが単に重要であるということを検出しているだけで、議論の展開においてどのように重要であるかを検出していない。すなわち、選択したメッセージが、具体的に、議論の発端として重要なのか、話題の転換点になっていて重要なのか、議論の総まとめを行っていて重要なのか、わからない。
このため、これら重要メッセージを議論の展開に沿って連結することができず、これら重要メッセージを単に列挙しても、要約として価値ある情報を得ることはできない。
本発明はこのような課題を解決するためのものであり、メッセージ集合から選択した重要メッセージに関する議論の展開レベルを検出できる議論展開検出方法、議論展開検出装置、議論展開検出プログラム、および議論展開検出プログラムを記録した記録媒体を提供することを目的としている。
このような目的を達成するために、本発明にかかる議論展開検出方法は、議論の内容を示す複数のメッセージからなるメッセージ集合について作成された、互いに関連性の高いメッセージ対とその開示順に応じた向きで当該メッセージ対を結ぶ有向枝とからなる議論構造グラフを情報処理することにより、これらメッセージに関する議論の展開を検出する議論展開検出装置で用いられる議論展開検出方法であって、メッセージ分類部により、議論構造グラフに示された各メッセージに出入りする有向枝に基づいて各メッセージを予め設けた議論の展開レベルにそれぞれ分類し、各メッセージと展開レベルとの対応関係を示す検出結果を出力するメッセージ分類ステップを備えている。
この際、メッセージ分類ステップで、議論構造グラフに示された各メッセージのうち、任意のメッセージに入る有向枝の数を示す入次数を当該メッセージから出る有向枝の数を示す出次数で除算した値が所定のしきい値を越えた場合、当該メッセージを「起承転結」のうち議論の導入を示す展開レベル「起」に分類するようにしてもよい。
また、メッセージ分類ステップで、議論構造グラフに示された各メッセージのうち、任意のメッセージから出る有向枝の数を示す出次数を当該メッセージに入る有向枝の数を示す入次数で除算した値が所定のしきい値を越えた場合、当該メッセージを「起承転結」のうち議論の結びを示す展開レベル「結」に分類するようにしてもよい。
また、メッセージ分類ステップで、議論構造グラフに示された各メッセージのうち展開レベル「起」および「結」に分類されなかった任意のメッセージについて、議論構造グラフに示された各メッセージの開示順に沿って当該メッセージの直前に位置する直前メッセージから当該メッセージの直後に位置する直後メッセージへ、当該メッセージを迂回して到達するパスが存在する場合、当該メッセージを「起承転結」のうち議論の継承を示す展開レベル「承」に分類するようにしてもよい。
また、メッセージ分類ステップで、議論構造グラフに示された各メッセージのうち展開レベル「起」、「結」、および「承」のいずれにも分類されなかったメッセージを「起承転結」のうち議論の変化を示す展開レベル「転」に分類するようにしてもよい。
また、本発明にかかる議論展開検出装置は、議論の内容を示す複数のメッセージからなるメッセージ集合について作成された、互いに関連性の高いメッセージ対とその開示順に応じた向きで当該メッセージ対を結ぶ有向枝とからなる議論構造グラフを情報処理することにより、これらメッセージに関する議論の展開を検出する議論展開検出装置であって、議論構造グラフに示された各メッセージに出入りする有向枝に基づいて各メッセージを予め設けた議論の展開レベルにそれぞれ分類し、各メッセージと展開レベルとの対応関係を示す検出結果を出力するメッセージ分類部とを備えている。
この際、メッセージ分類部で、議論構造グラフに示された各メッセージのうち、任意のメッセージに入る有向枝の数を示す入次数を当該メッセージから出る有向枝の数を示す出次数で除算した値が所定のしきい値を越えた場合、当該メッセージを「起承転結」のうち議論の導入を示す展開レベル「起」に分類するようにしてもよい。
また、メッセージ分類部で、議論構造グラフに示された各メッセージのうち、任意のメッセージから出る有向枝の数を示す出次数を当該メッセージに入る有向枝の数を示す入次数で除算した値が所定のしきい値を越えた場合、当該メッセージを「起承転結」のうち議論の結びを示す展開レベル「結」に分類するようにしてもよい。
また、メッセージ分類部で、議論構造グラフに示された各メッセージのうち展開レベル「起」および「結」に分類されなかった任意のメッセージについて、議論構造グラフに示された各メッセージの開示順に沿って当該メッセージの直前に位置する直前メッセージから当該メッセージの直後に位置する直後メッセージへ、当該メッセージを迂回して到達するパスが存在する場合、当該メッセージを「起承転結」のうち議論の継承を示す展開レベル「承」に分類するようにしてもよい。
また、メッセージ分類部で、議論構造グラフに示された各メッセージのうち展開レベル「起」、「結」、および「承」のいずれにも分類されなかったメッセージを「起承転結」のうち議論の変化を示す展開レベル「転」に分類するようにしてもよい。
また、本発明にかかる議論展開検出プログラムは、議論の内容を示す複数のメッセージからなるメッセージ集合について作成された、互いに関連性の高いメッセージ対とその開示順に応じた向きで当該メッセージ対を結ぶ有向枝とからなる議論構造グラフを情報処理することにより、これらメッセージに関する議論の展開を検出する議論展開検出装置のコンピュータに、上記のいずれかに記載された議論展開検出方法の各ステップを実行させる。
また、本発明にかかる記録媒体は、上記議論展開検出プログラムを記録したコンピュータ読取可能な記録媒体である。
本発明によれば、メッセージ集合から作成された議論構造グラフに示された各メッセージに出入りする有向枝に基づいて各メッセージを予め設けた議論の展開レベルにそれぞれ分類されて、各メッセージと展開レベルとの対応関係を示す検出結果が出力されるため、メッセージ集合から選択した重要メッセージに関する議論の展開レベルを検出できる。
したがって、選択したメッセージが単に重要であるというだけではなく、議論の展開においてどのように重要であるかを示すこと、具体的には、各メッセージが、議論の発端として重要なのか、話題の転換点になっていて重要なのか、議論の総まとめを行っていて重要なのかを把握することが可能となる。
これにより、これら重要メッセージを議論の展開に沿って連結することができ、多くのメッセージからメッセージ集合が構成されている場合でも、議論の展開を踏まえた要約文を極めて容易に作成することが可能となる。
次に、本発明の実施の形態について図面を参照して説明する。
[議論展開検出装置]
まず、図1を参照して、本発明の一実施の形態にかかる議論展開検出装置について説明する。図1は、本発明の一実施の形態にかかる議論展開検出装置の構成を示すブロック図である。
議論展開検出装置1は、全体として入力された情報に対しコンピュータを用いて所望の演算処理を行う情報処理装置からなり、議論の内容を示す複数のメッセージからなるメッセージ集合について、これらメッセージに含まれる議論の内容を情報処理することにより、重要メッセージとその議論の展開を検出し、メッセージ集合における議論展開を解析する機能を有している。
本実施の形態は、メッセージ集合から所定の重要度より高い関連度を有するメッセージ対を選択し、これらメッセージ対ごとに両メッセージの開示順に応じた向きを有する有向枝で当該メッセージ間を結ぶことにより、議論の展開を示す議論構造グラフを作成し、この議論構造グラフに示された各メッセージに出入りする有向枝に基づいて各メッセージを予め設けた議論の展開レベルにそれぞれ分類し、各メッセージと展開レベルとの対応関係を示す検出結果を出力するようにしたものである。
次に、図1を参照して、本発明の一実施の形態にかかる議論展開検出装置の構成について説明する。ここでは、Web上に設けられた掲示板システムから取得したメッセージ集合から重要メッセージに関する議論の展開を検出する場合を例として説明する。
議論展開検出装置1には、主な機能部として、メッセージ出力部11、操作入力部12、画面表示部13、記憶部14、および演算処理部15が設けられており、これら機能部が、各種情報がやり取りするためのバス19を介して接続されている。
メッセージ入力部11は、専用の入力インターフェース回路からなり、複数のメッセージからなるメッセージ集合2を外部装置から取得して記憶部14へ保存する機能を有している。
上記外部装置としては、掲示板システムを構成するWeb上のサーバ装置であってもよく、このサーバ装置から取得したメッセージ集合を記憶する記憶装置あるいは記録媒体であってもよい。
図2は、メッセージ集合の構成例を示す説明図である。このメッセージ集合は、各メッセージの内容を示すテキスト情報、当該メッセージを識別するためのID、および当該メッセージの時刻情報の組から構成されている。時刻情報としては、当該メッセージが発言者から送信された日時または当該メッセージが公開された日時など、当該メッセージの開示順を示す情報であればよい。したがって、時刻情報については、実際の日時を示す情報を用いる必要はなく、例えば他のメッセージとの開示順序を示す情報、例えば開示順に応じたシーケンス番号であってもよい。
操作入力部12は、キーボードやマウスなどの操作入力装置からなり、オペレータの操作を検出して演算処理部15へ出力する機能を有している。
画面表示部13は、LCDやPDPなどの画面表示装置からなり、演算処理部15からの指示に応じて、各種の操作画面や処理情報のほか、検出結果として重要メッセージとその議論展開レベルを画面表示する機能を有している。
記憶部14は、ハードディスクなどの記憶装置からなり、演算処理部15で用いる各種処理情報やプログラム14Pを記憶する機能を有している。
記憶部14で記憶するプログラム14Pは、演算処理部15に読み込んで実行することにより各種処理部を実現するプログラムであり、予めCD−ROMやDVDなどの記録媒体3や外部装置(図示せず)読み込まれて記憶部14へ格納される。
記憶部14で記憶する主な処理情報としては、メッセージ集合14A、検出結果情報14B、および要約文14Cがある。
メッセージ集合14Aは、処理対象となる複数のメッセージからなるテキスト情報であり、メッセージ入力部11により記憶部14に保存される。検出結果情報14Bは、メッセージ集合14Aから選択した重要メッセージに関する議論の展開を示す情報であり、演算処理部15で生成されて記憶部14に保存される。要約文14Cは、メッセージ集合14Aを要約した文章でありも演算処理部15で生成されて記憶部14に保存される。
演算処理部15は、CPUなどのマイクロプロセッサとその周辺回路を有し、記憶部14からプログラム14Pを読み込んで実行することにより、上記ハードウェアとプログラムとを協働させて、各種処理部を実現する機能を有している。
演算処理部15で実現される主な処理部としては、共起指数算出部15A、関連度算出部15B、議論構造グラフ作成部15C、およびメッセージ分類部15Dがある。
共起指数算出部15Aは、記憶部14のメッセージ集合14Aに含まれる各メッセージのメッセージ対ごとに共起指数16Aをそれぞれ算出する機能を有している。共起指数16Aは、対をなす2つのメッセージの内容に関する共通性を示す指数であり、例えば両メッセージに共通して含まれる単語の頻度に基づいて算出することができる。共起指数16Aの具体的な算出方法については、一般的な公知の技術を利用すればよく、ここでの詳細な説明は省略する。
関連度算出部15Bは、記憶部14のメッセージ集合14Aに含まれる各メッセージのメッセージ対ごとに両メッセージの関連度16Bを算出する機能を有している。関連度16Bは、対をなす2つのメッセージの内容および時間を考慮した関連性を示す指数であり、例えば共起指数算出部15Aで得られた両メッセージ間の共起指数16Aと各メッセージの時刻情報とを予め設定しておいた重み係数に基づき合算して導出することができる。関連度16Bの算出方法については、共起指数16Aを用いる方法に限定されるものではなく、2つのメッセージの内容の共通性を示す指数であれば他の指数を用いてもよい。
議論構造グラフ作成部15Cは、記憶部14のメッセージ集合14Aに含まれる各メッセージのメッセージ対のうち所定の重要度より高い関連度16Bを有するメッセージ対を選択する機能と、これらメッセージ対ごとに両メッセージの開示順に応じた向きを有する有向枝で当該メッセージ間を結ぶことにより議論の展開を示す議論構造グラフ16Cを作成する機能とを有している。
図3は、議論構造グラフの構成例を示す説明図である。図4は、議論構造グラフの表現例を示す説明図である。議論構造グラフ16Cは、図3に示すように、重要メッセージM1−M10を示すノード(図中楕円)と、これらノード間を結ぶ有向枝(図中矢印)とから構成されている。重要メッセージM1−M10は、メッセージ集合14Aを構成する各メッセージのうち所定の重要度より高い関連度16Bを有するメッセージ対として選択されたメッセージである。有向枝は、メッセージ対におけるメッセージの開示順を示している。
演算処理部15において、このような議論構造グラフ16Cを演算処理する場合、図3のようなグラフィックデータではなく、図4に示す行列式で表現される。図4の場合、縦方向に有向枝の始点となるメッセージが割り当てられ、横方向に有向枝の終点となるメッセージが割り当てられている。そして、これらメッセージの交点に有向枝の有無が「1/0」で表現されている。
このような議論構造グラフ16Cにより、例えば、M3の内容は、M3より前に開示されたM1,M2の内容と高い関連度を持つとともに、M3より後に開示されたM4−M7,M9の内容と高い関連度を持つことがわかる。また、M9の内容は、M9より前に開示されたM2−M8の内容と高い関連度を持つとともに、M9より後に開示されたM10の内容と高い関連度を持つことがわかる。
メッセージ分類部15Dは、議論構造グラフ16Cに示された各メッセージに出入りする有向枝に基づいて各メッセージを予め設けた議論の展開レベルにそれぞれ分類する機能と、各メッセージと展開レベルとの対応関係を検出結果情報14Bとして記憶部14へ保存する機能と、検出結果情報14Bに基づいて各メッセージを連結することにより、メッセージ集合14Aの要約文を生成して記憶部14へ保存する機能とを有している。
議論展開レベルとは、議論の流れを示す各ステップを示す識別子である。一般に、文章を構成する各文は、「起承転結」などの流れを示すステップに分類される。本実施の形態は、このような文章の流れを示すステップを記録の流れに割り当て、メッセージ集合から選択した重要メッセージを、対応するステップすなわち議論展開レベルに分類している。本実施の形態では、議論展開レベルが「起承転結」、すなわち議論の導入を示す「起」、議論の継承を示す「承」、議論の変化を示す「転」、議論の結びを示す「結」から構成される場合を例として説明するが、議論展開レベルの種別はこれに限定されるものではない。
[議論展開検出装置の動作]
次に、図5および図6を参照して、本発明の一実施の形態にかかる議論展開検出装置の動作について説明する。図5は、本発明の一実施の形態にかかる議論展開検出装置の議論展開検出処理を示すフローチャートである。図6は、本発明の一実施の形態にかかる議論展開検出装置のメッセージ分類処理を示すフローチャートである。
まず、図5を参照して、本実施の形態にかかる議論展開検出装置の議論展開検出処理について説明する。
議論展開検出装置1の演算処理部15は、操作入力部12で検出されたオペレータによる処理開始操作に応じて、図5の議論展開検出処理を開始する。
演算処理部15は、まず、メッセージ入力部11を介してメッセージ集合2を取得し、記憶部14へメッセージ集合14Aとして保存する(ステップ100)。
次に、演算処理部15は、共起指数算出部15Aにより、記憶部14のメッセージ集合14Aを構成する各メッセージのメッセージ対ごとに共起指数16Aをそれぞれ算出する(ステップ101)。
続いて、演算処理部15は、関連度算出部15Bにより、共起指数算出部15Aで得られた両メッセージ間の共起指数16Aと記憶部14のメッセージ集合14Aから読み出した各メッセージの時刻情報とを、予め設定しておいた重み係数に基づき合算することにより、メッセージ対ごとに関連度16Bをそれぞれ算出する(ステップ102)。
次に、演算処理部15は、議論構造グラフ作成部15Cにより、各メッセージ対のうち所定の重要度より高い関連度16Bを有するメッセージ対を重要メッセージとして選択し(ステップ103)、これらメッセージ対ごとに両メッセージの開示順に応じた向きを有する有向枝で当該メッセージ間を結ぶことにより議論の展開を示す議論構造グラフ16Cを作成する(ステップ104)。
続いて、演算処理部15は、メッセージ分類部15Dにより、議論構造グラフ16Cに示された各重要メッセージに出入りする有向枝に基づいて各重要メッセージを予め設けた議論の展開レベル「起承転結」のいずれかに分類し(ステップ105)、各重要メッセージと展開レベルとの対応関係を検出結果情報14Bとして記憶部14へ保存する。
その後、演算処理部15は、記憶部14から検出結果情報14Bを読み出して画面表示部13で画面表示し(ステップ106)、一連の議論展開検出処理を終了する。
次に、図6を参照して、本実施の形態にかかる議論展開検出装置のメッセージ分類処理について説明する。
演算処理部15は、図5のステップ105において、メッセージ分類部15Dにより、各重要メッセージを議論展開レベルのいずれかに分類する場合、図6に示すメッセージ分類処理を実行する。
メッセージ分類部15Dは、まず、議論構造グラフ16Cから任意の重要メッセージを処理対象メッセージXとして選択し(ステップ110)、議論構造グラフ作成部15Cに基づいて、処理対象メッセージXに出入りする有向枝を計数する。
ここで、メッセージXから他のメッセージに対して枝を張っている本数すなわち出次数をa本、逆に他のメッセージから入って来る枝の本数すなわち入次数をb本とし、a/b>しきい値αが成立するとき(ステップ111:YES)、メッセージXは「起」に相当するメッセージであると判断する(ステップ112)。
一方、a/b>αが成立しない場合(ステップ111:NO)、メッセージ分類部15Dは、メッセージXから他のメッセージに対して枝を張っている本数すなわち出次数がa本、逆に他のメッセージから入って来る枝の本数すなわち入次数をb本とし、b/a>αが成立するとき(ステップ113:YES)、メッセージXは「結」に相当するメッセージであると判断する(ステップ114)。
また、b/a>αが成立しない場合(ステップ113:NO)、メッセージ分類部15Dは、メッセージXに入って来る枝の中でその時刻情報がメッセージXに最も近いものをメッセージY(直前メッセージ)、メッセージXから出て行く枝の中でその送信時刻がメッセージXに最も近いものをメッセージZ(直後メッセージ)とする。そして、有向枝の方向に沿ってメッセージXを迂回してメッセージYからメッセージZへ到達するバスを検索する。
この際、例えばメッセージXとメッセージXに付いている枝(メッセージXに入ってくる枝とメッセージXから出ている枝)を全て取り除いた場合の議論構造グラフを作成し、この新しい議論構造グラフにおいて、メッセージYからメッセージZに有向枝の方向に沿って到達可能なパスを検索すればよい。
このような迂回パスが存在するとき(ステップ115:YES)、メッセージXは、「承」に相当するメッセージであると判断する(ステップ116)。
また、メッセージXが上記「起」,「承」,「結」のいずれにも属さない場合(ステップ115:NO)、メッセージXは、「転」に相当するメッセージであると判断する(ステップ117)。
このようにして、ステップ110〜117を議論構造グラフ16Cの重要メッセージごとに繰り返し実行することにより、各メッセージをいずれかの展開レベルに分類し(ステップ118:NO)、議論構造グラフ16Cのすべての重要メッセージを選択し終わった場合(ステップ118:NO)、いつ連のメッセージ分類処理を終了する。
図5および図6に示したアルゴリズムでは、まず、内容的に関連性が強いメッセージ間に枝を張り、それらのメッセージの時間順序によって枝に方向性を持たせる。この作業によってできた議論構造グラフ16Cにおいて、各メッセージがどのような位置づけにあるかを判別し、起承転結のラベリングを行っている。
ステップ111,112では、メッセージXから枝が多数出ていることが特徴になっている。このことは、メッセージXが後の複数のメッセージに影響を与えているメッセージであるごとを示唆するため、問題提起あるいは、議論の種になるメッセージであると考えられる。
ステップ113,114では、メッセージXに枝が多数入ってきていることが特徴になっている。このことは、多数のメッセージで議論されたことがメッセージXで終結していることを示唆する。このため、議論がメッセージXでまとめられたと考えることができる。
ステップ115,116では、メッセージXに入って来る枝の本数と出て行く枝の本数に大きな違いがなく、議論構造グラフからメッセージXを排除しても、周辺の議論が途絶えないことを意味している。このような場合、メッセージXは、ある話題について集中的に議論されている中心的なメッセージの一つであると判断できる。
最後に、ステップ115,117では、メッセージXに入って来る枝の本数と出て行く枝の本数に大きな違いがなく、議論構造グラフからメッセージXを排除することによって議論の流れが途切れることが特徴になっている。このような場合、メッセージXは、ある話題から異なる話題に転換するときのメッセージであると考えられる。
[本実施の形態の効果]
このように、本実施の形態は、メッセージ分類部15Dにより、この議論構造グラフ16Cに示された各メッセージに出入りする有向枝に基づいて各メッセージを予め設けた議論の展開レベルにそれぞれ分類し、各メッセージと展開レベルとの対応関係を示す検出結果情報14Bを出力するようにしたので、メッセージ集合から選択した重要メッセージに関する議論の展開レベルを検出できる。
したがって、選択したメッセージが単に重要であるというだけではなく、議論の展開においてどのように重要であるかを示すこと、具体的には、各メッセージが、議論の発端として重要なのか、話題の転換点になっていて重要なのか、議論の総まとめを行っていて重要なのかを把握することが可能となる。
これにより、これら重要メッセージを議論の展開に沿って連結することができ、多くのメッセージからメッセージ集合が構成されている場合でも、議論の展開を踏まえた要約文を極めて容易に作成することが可能となる。
[実施例]
次に、図7および図8を参照して、本実施の形態にかかる議論展開検出装置の実施例について説明する。図7は、メッセージ分類処理で生成した新たな議論構造グラフを示す説明図である。図8は、メッセージ分類処理で生成した他の新たな議論構造グラフを示す説明図である。
前述した図2のようなM1〜M10のメッセージからなるメッセージ集合14Aが与えられているものとする。
M1=「まず、掲示板の新機能について議論しましょう。私は、議論の流れが同時に幾つか進行することがあると考える。掲示板には、幾つかの表示方法が必要だ。例えば、スレッド形式にすれば、我々は議論の流れを理解しやすくなると思う。」
M2=「私も、スレッドの機能は重要だと思う。他にも、多言語機能なんかを付加するともっと良いBBSになる。」
M3=「議論が進むに連れて、私もメッセージがスレッドで表示されると便利だと思います。また、検索の機能もほしいですね。あと、リロードに時間がかかるのはあまり快適ではない。リロードの時間を短縮する機能もほしいです。」
M4=「ツールを快適に利用できることが一番重要だと思う。どうしてレスポンス(リロード)が遅いのか?」
M5=「リロードに時間がかかるのは、和歌山大学だけの問題ですか?今リロードに約50秒かかる。」
M6=「現在、私たちが京都大学からBBSを利用するときも、あまり調子が良くないようだ己リロードにかなりの時間がかかる。」
M7=「中国科学院からは比較的によくて、リロードに費やす時間はとても速い。こちら(側)で、リロード時間は普通は3秒間ぐらいにある。」
M8=「その読み込みの速さには驚きだ。通信速度は、中国からは速い。通信速度は、日本国内からは遅い。それは、どうしてだろう?」
M9=「今のところ、BBSに必要な機能として提案されているのは、1.スレッドの機能、2.多言語機能、3.リロード時問の短縮です。これらのアイデアの実現方法に対する提案はありませんか?また、他にアイデアはありませんか?」
M10=「多言語機能とは具体的にどのような機能ですか?機械翻訳機能のことですか?」
また、これらメッセージは、それぞれの時刻情報に基づき以下のような開示順を有しているものとする。
M1→M2→M3→M4→M5→M6→M7→M8→M9→M10
図5の議論展開検出処理では、まずメッセージ間の単語共起関係と時間関係により、メッセージ対ごとに関連度16Bを算出し(ステップ102)、関連度16Bの高いメッセージ対について、開示順の早いものから遅いものに有向枝を張る。この作業を全てのメッセージ対について繰り返すことによって、図2に示した議論構造グラフ16Cを得ることができる(ステップ104)。この際、メッセージM1〜M10のすべてが重要メッセージとして選択されたものとする。
次に、このようにして作成した議論構造グラフ16Cをもとに、すべてのメッセージについて、起承転結のラベリングを行うことができる。以下では、特にメッセージM1,M3,M4,M9が「起承転結」のいずれの展開レベルに相当するかを判別する。
まず、閾値αを定める。ここでは、α=3と定めたとする。以下、メッセージM1,M3,M4,M9について、それぞれ図6にしたがって順に展開レベルを調べていく。
メッセージM1について:
メッセージM3から他のメッセージに対して枝を張っている本数はa=2本(M2,M3)、逆に他のメッセージから入って来る枝の本数はb=0本である。したがって、ステップ111において、a/b(=∞)>α(=3)が成立するため、メッセージM1は「起」に相当するメッセージであると判断する。
メッセージM3について:
メッセージM3から他のメッセージに対して枝を張っている本数はa=5本(M4,M5,M6,M7,M9)、逆に他のメッセージから入って来る枝の本数はb=2本(M1、M2)である。したがって、ステップ111において、a/b(=2.5)>α(=3)が成立しないため、メッセージM3は「起」に相当するメッセージではない。次に、ステップ113において、b/a(=0.4)>α(=3)が成立しないため、メッセージM3は「結」に相当するメッセージではない。
一方、メッセージM3に入って来る枝の中でその送信時刻がM3に最も近いメッセージはメッセージM2であり、メッセージM3から出て行く枝の中でその送信時刻がメッセージM3に最も近いものはメッセージM4である。メッセージM3とこのM3に付いている枝を全て取り除いた場合の議論構造グラフを作成すると、図7を得る。
この議論構造グラフ16Cについては、ステップ115において、メッセージM2からメッセージM4へ、有向枝の方向に沿って他のパスを辿っても到達することはできない。したがって、メッセージM3は「承」に相当するメッセージではない。したがって、ステップ115において、メッセージM3は、「起」,「承」,「結」のいずれにも当てはまらないため、「転」に相当するメッセージと判別できる。
メッセージM4について:
メッセージM4から他のメッセージに対して枝を張っている本数はa=2本(M5,M7)、逆に他のメッセージから入って来る枝の本数はb=1本(M3)である。したがって、ステップ111において、a/b(=2)>α(=3)が成立しないため、メッセージM4は「起」に相当するメッセージではない。次に、ステップ113において、b/a(=0.5)>α(=3)が成立しないため、メッセージM4は「結」に相当するメッセージではない。
一方、メッセージM4に入って来る枝の中でその送信時刻がメッセージM4に最も近いメッセージはメッセージM3であり、メッセージM4から出て行く枝の中でその送信時刻がメッセージM3に最も近いものはメッセージM5である。メッセージM4とこのM4に付いている枝を全て取り除いた場合の議論構造グラフを作成すると、図8を得る。
この議論構造グラフ16Cについては、ステップ115において、メッセージM3からメッセージM5には、メッセージM3→メッセージM5という直接パスが存在するため、到達することができる。したがって、メッセージM4は「承」に相当するメッセージである。
メッセージM9について:
メッセージM9から他のメッセージに対して枝を張っている本数はa=1本(メッセージM10)、逆に他のメッセージから入って来る枝の本数はb=7本(M2〜M8)である。したがって、ステップ111において、a/b(=0.14)>α(=3)が成立しないため、メッセージM9は「起」に相当するメッセージではない。次に、ステップ113において、b/a(=7)>α(=3)が成立するため、メッセージM9は「結」に相当するメッセージである。
以上より、メッセージM1は「起」、メッセージM3は「転」、メッセージM4は「承」、メッセージM9は「結」の展開レベルを持つメッセージであることがわかる。
これに応じて、演算処理部15のメッセージ分類部15Dにより、図9に示す検出結果が記憶部14に保存される。図9は、検出結果の構成例を示す説明図である。この図9では、検出結果情報14Bが、重要メッセージのID、議論展開レベル、および重要メッセージの内容の組で構成されている。なお、検出結果情報14Bのうちメッセージの内容を省き、画面表示部13で画面表示する際に、メッセージのIDに基づいてメッセージ集合14Aから検索して表示してもよい。
また、演算処理部15のメッセージ分類部15Dにより、検出結果情報14Bに基づいて図10に示すような要約文14Cを作成してもよい。図10は、要約文の構成例を示す説明図である。この要約文14Cは、検出結果情報14Bの議論展開レベルの展開順に基づいて対応するメッセージを連結したものである。図10の場合、「起承転結」の順に基づいてメッセージM1,M3,M4,M9が連結されて要約文14Cが作成されている。したがって、この要約文14Cを画面表示部13で画面表示することにより、メッセージ集合14Aにおける議論の展開を極めて容易に理解できる。
[実施の形態の拡張]
以上では、メッセージ集合に含まれる重要メッセージについて議論展開レベルを判別する場合を例として説明したが、処理対象としては掲示板システムで得られたメッセージに限定されるものではない。例えば、メッセージの塊(スレッドやトピック)間の関連を議論構造グラフに表現できれば、これらメッセージの塊の起承転結も判別することができ、階層的に議論展開を解析することも可能となる。
また以上では、議論構造グラフを作成する構成や方法として、議論構造グラフ作成部15Cにより、メッセージ集合14Aから所定の重要度より高い関連度16Bを有するメッセージ対を選択し、これらメッセージ対ごとに両メッセージの開示順に応じた向きを有する有向枝で当該メッセージ間を結ぶことにより、議論の展開を示す議論構造グラフ16Cを作成する場合を例として説明したが、これに限定されるものではなく、他の構成や方法により作成した同様の議論構造グラフを用いてメッセージ分類部15Dにより各メッセージに関する議論の展開レベルを検出してもよい。
本発明の一実施の形態にかかる議論展開検出装置の構成を示すブロック図である。 メッセージ集合の構成例を示す説明図である。 議論構造グラフの構成例を示す説明図である。 議論構造グラフの表現例を示す説明図である。 本発明の一実施の形態にかかる議論展開検出装置の議論展開検出処理を示すフローチャートである。 本発明の一実施の形態にかかる議論展開検出装置のメッセージ分類処理を示すフローチャートである。 メッセージ分類処理で生成した新たな議論構造グラフを示す説明図である。 メッセージ分類処理で生成した他の新たな議論構造グラフを示す説明図である。 検出結果の構成例を示す説明図である。 要約文の構成例を示す説明図である。
符号の説明
1…議論展開検出装置、11…メッセージ入力部、12…操作入力部、13…画面表示部、14…記憶部、14A…メッセージ集合、14B…検出結果情報、14C…要約文、14P…プログラム、15…演算処理部、15A…共起指数算出部、15B…関連度算出部、15C…議論構造グラフ、15D…メッセージ分類部、16A…共起指数、16B…関連度、16C…議論構造グラフ、2…メッセージ集合、3…記録媒体。

Claims (12)

  1. 議論の内容を示す複数のメッセージからなるメッセージ集合について作成された、互いに関連性の高いメッセージ対とその開示順に応じた向きで当該メッセージ対を結ぶ有向枝とからなる議論構造グラフを情報処理することにより、これらメッセージに関する議論の展開を検出する議論展開検出装置で用いられる議論展開検出方法であって、
    メッセージ分類部により、前記議論構造グラフに示された各メッセージに出入りする有向枝に基づいて各メッセージを予め設けた議論の展開レベルにそれぞれ分類し、各メッセージと展開レベルとの対応関係を示す検出結果を出力するメッセージ分類ステップを備えることを特徴とする議論展開検出方法。
  2. 請求項1に記載の議論展開検出方法において、
    前記メッセージ分類ステップは、前記議論構造グラフに示された各メッセージのうち、任意のメッセージに入る有向枝の数を示す入次数を当該メッセージから出る有向枝の数を示す出次数で除算した値が所定のしきい値を越えた場合、当該メッセージを「起承転結」のうち議論の導入を示す展開レベル「起」に分類することを特徴とする議論展開検出方法。
  3. 請求項2に記載の議論展開検出方法において、
    前記メッセージ分類ステップは、前記議論構造グラフに示された各メッセージのうち、任意のメッセージから出る有向枝の数を示す出次数を当該メッセージに入る有向枝の数を示す入次数で除算した値が所定のしきい値を越えた場合、当該メッセージを「起承転結」のうち議論の結びを示す展開レベル「結」に分類することを特徴とする議論展開検出方法。
  4. 請求項3に記載の議論展開検出方法において、
    前記メッセージ分類ステップは、前記議論構造グラフに示された各メッセージのうち展開レベル「起」および「結」に分類されなかった任意のメッセージについて、前記議論構造グラフに示された各メッセージの開示順に沿って当該メッセージの直前に位置する直前メッセージから当該メッセージの直後に位置する直後メッセージへ、当該メッセージを迂回して到達するパスが存在する場合、当該メッセージを「起承転結」のうち議論の継承を示す展開レベル「承」に分類することを特徴とする議論展開検出方法。
  5. 請求項4に記載の議論展開検出方法において、
    前記メッセージ分類ステップは、前記議論構造グラフに示された各メッセージのうち展開レベル「起」、「結」、および「承」のいずれにも分類されなかったメッセージを「起承転結」のうち議論の変化を示す展開レベル「転」に分類することを特徴とする議論展開検出方法。
  6. 議論の内容を示す複数のメッセージからなるメッセージ集合について作成された、互いに関連性の高いメッセージ対とその開示順に応じた向きで当該メッセージ対を結ぶ有向枝とからなる議論構造グラフを情報処理することにより、これらメッセージに関する議論の展開を検出する議論展開検出装置であって、
    前記議論構造グラフに示された各メッセージに出入りする有向枝に基づいて各メッセージを予め設けた議論の展開レベルにそれぞれ分類し、各メッセージと展開レベルとの対応関係を示す検出結果を出力するメッセージ分類部と
    を備えることを特徴とする議論展開検出装置。
  7. 請求項6に記載の議論展開検出装置において、
    前記メッセージ分類部は、前記議論構造グラフに示された各メッセージのうち、任意のメッセージに入る有向枝の数を示す入次数を当該メッセージから出る有向枝の数を示す出次数で除算した値が所定のしきい値を越えた場合、当該メッセージを「起承転結」のうち議論の導入を示す展開レベル「起」に分類することを特徴とする議論展開検出装置。
  8. 請求項7に記載の議論展開検出装置において、
    前記メッセージ分類部は、前記議論構造グラフに示された各メッセージのうち、任意のメッセージから出る有向枝の数を示す出次数を当該メッセージに入る有向枝の数を示す入次数で除算した値が所定のしきい値を越えた場合、当該メッセージを「起承転結」のうち議論の結びを示す展開レベル「結」に分類することを特徴とする議論展開検出装置。
  9. 請求項8に記載の議論展開検出装置において、
    前記メッセージ分類部は、前記議論構造グラフに示された各メッセージのうち展開レベル「起」および「結」に分類されなかった任意のメッセージについて、前記議論構造グラフに示された各メッセージの開示順に沿って当該メッセージの直前に位置する直前メッセージから当該メッセージの直後に位置する直後メッセージへ、当該メッセージを迂回して到達するパスが存在する場合、当該メッセージを「起承転結」のうち議論の継承を示す展開レベル「承」に分類することを特徴とする議論展開検出装置。
  10. 請求項9に記載の議論展開検出装置において、
    前記メッセージ分類部は、前記議論構造グラフに示された各メッセージのうち展開レベル「起」、「結」、および「承」のいずれにも分類されなかったメッセージを「起承転結」のうち議論の変化を示す展開レベル「転」に分類することを特徴とする議論展開検出装置。
  11. 議論の内容を示す複数のメッセージからなるメッセージ集合について作成された、互いに関連性の高いメッセージ対とその開示順に応じた向きで当該メッセージ対を結ぶ有向枝とからなる議論構造グラフを情報処理することにより、これらメッセージに関する議論の展開を検出する議論展開検出装置のコンピュータに、請求項1〜5のいずれか1つに記載された議論展開検出方法の各ステップを実行させる議論展開検出プログラム。
  12. 請求項11に記載の議論展開検出プログラムを記録したコンピュータ読取可能な記録媒体。
JP2006344366A 2006-12-21 2006-12-21 議論展開検出方法、議論展開検出装置、議論展開検出プログラム、および議論展開検出プログラムを記録した記録媒体 Pending JP2008158641A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006344366A JP2008158641A (ja) 2006-12-21 2006-12-21 議論展開検出方法、議論展開検出装置、議論展開検出プログラム、および議論展開検出プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006344366A JP2008158641A (ja) 2006-12-21 2006-12-21 議論展開検出方法、議論展開検出装置、議論展開検出プログラム、および議論展開検出プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2008158641A true JP2008158641A (ja) 2008-07-10

Family

ID=39659502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006344366A Pending JP2008158641A (ja) 2006-12-21 2006-12-21 議論展開検出方法、議論展開検出装置、議論展開検出プログラム、および議論展開検出プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2008158641A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218032A (ja) * 2009-03-13 2010-09-30 Fuji Xerox Co Ltd 議論支援装置及び議論支援プログラム
US8307293B2 (en) 2009-03-13 2012-11-06 Fuji Xerox Co., Ltd. Discussion support apparatus, discussion support method, and computer-readable medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218032A (ja) * 2009-03-13 2010-09-30 Fuji Xerox Co Ltd 議論支援装置及び議論支援プログラム
US8296363B2 (en) 2009-03-13 2012-10-23 Fuji Xerox Co., Ltd. Discussion support apparatus, discussion support method, and computer-readable medium
US8307293B2 (en) 2009-03-13 2012-11-06 Fuji Xerox Co., Ltd. Discussion support apparatus, discussion support method, and computer-readable medium

Similar Documents

Publication Publication Date Title
JP5469244B2 (ja) 選択的なコンテンツ抽出
JP4382526B2 (ja) 文章分類装置および方法
US20090083096A1 (en) Handling product reviews
MXPA04006932A (es) Segmentacion de documentos con base en la vision.
JP2000003372A (ja) 選択可能リンクの提供方法及び選択可能リンク提供装置
CN112036187A (zh) 一种结合上下文语境的视频弹幕文本审核方法及系统
CN108804421A (zh) 文本相似性分析方法、装置、电子设备及计算机存储介质
JP6237168B2 (ja) 情報処理装置及び情報処理プログラム
WO2021258934A1 (zh) 平面排版方法及系统
JPH0581327A (ja) 情報検索支援処理装置
JP7053219B2 (ja) 文書検索装置および方法
CN117764051A (zh) 基于docx格式文档关键知识点智能提取方法及系统
JP2009043051A (ja) 文章処理方法および装置
JP2021189835A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2010026923A (ja) 文書分類方法、文書分類装置、文書分類プログラム、および、コンピュータ読取り可能記録媒体
JP2008158641A (ja) 議論展開検出方法、議論展開検出装置、議論展開検出プログラム、および議論展開検出プログラムを記録した記録媒体
JPH07129605A (ja) 文書検索装置
US20250053878A1 (en) Learning device, management sheet creation support device, non-transitory computer-readable storage medium, learning method, and management sheet creation support method
CN120124747A (zh) 问答场景中敏感信息的检测方法和内容展示方法
JP4423385B2 (ja) 文書分類支援装置およびコンピュータプログラム
JP2012014684A (ja) 名寄せ支援処理装置、方法及びプログラム
JP4972271B2 (ja) 検索結果提示装置
JP2024033123A (ja) 文書分析装置、及び文書分析用プログラム
JP2009134378A (ja) 文書群提示装置および文書群提示プログラム
JP2005063249A (ja) 分類結果表示装置および方法