[go: up one dir, main page]

JP2007102526A - Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium - Google Patents

Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium Download PDF

Info

Publication number
JP2007102526A
JP2007102526A JP2005292073A JP2005292073A JP2007102526A JP 2007102526 A JP2007102526 A JP 2007102526A JP 2005292073 A JP2005292073 A JP 2005292073A JP 2005292073 A JP2005292073 A JP 2005292073A JP 2007102526 A JP2007102526 A JP 2007102526A
Authority
JP
Japan
Prior art keywords
sentence
honorific
relationship
unit
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005292073A
Other languages
Japanese (ja)
Other versions
JP4437778B2 (en
Inventor
Shigeko Nariyama
重子 成山
Hiromi Nakaiwa
浩巳 中岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005292073A priority Critical patent/JP4437778B2/en
Publication of JP2007102526A publication Critical patent/JP2007102526A/en
Application granted granted Critical
Publication of JP4437778B2 publication Critical patent/JP4437778B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a hierarchical relationship determination method by which hierarchical human relationship relevant to a sentence can be determined more specifically, a hierarchical relationship determination device, a hierarchical relationship determination program and a recording medium thereof. <P>SOLUTION: A referent specification section 17a specifies that a noun extracted by an extraction section 16 corresponds to which of three persons, a speaker, a partner and a target person. A honorific determination section 17b determines the hierarchical relationship among the three persons based on a honorific extracted from a detection section 14. A rank determination section 17c determines the hierarchical relationship among the three persons based on a rank DB 18. An inside and outside determination section 17d determines the hierarchical relationship among the three persons based on an inside and outside relationship of a word of a honorific dictionary 15. A closeness determination section 17e determines the hierarchical relationship among the three persons based on the closeness among referents. Thereby, the hierarchical relationship among the three persons in the input sentence is determined. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、例えば機械翻訳や情報検索を行う自然言語処理システムに関するものである。   The present invention relates to a natural language processing system that performs machine translation and information retrieval, for example.

日本語や英語を始めとする各種言語で記述される自然言語は、往々にして抽象的で曖昧性が高い性質を持つが、文章を数学的に扱うことにより、コンピュータ処理を行うことができる。この結果、機械翻訳システム、対話システム、検索システム、質問応答システムなど、様々な自然言語処理システムが実現されている。   Natural languages described in various languages such as Japanese and English often have abstract and highly ambiguous properties, but they can be processed computerically by handling sentences mathematically. As a result, various natural language processing systems such as a machine translation system, a dialogue system, a search system, and a question answering system are realized.

ところで、自然言語、特に日本語では尊敬語、謙譲語および丁寧語などからなる敬語が用いられるが、それらの敬語のうち何れを用いるかは絶対的なものではなく、文章に関連する人間の社会的地位、年齢、話者の主観的な親密度、性差等の相対的な尺度により決定される。一例として、「部長が来た」という文章に対して敬語を用いる場合について説明する。例えば、話者が社内の同僚と話すときには、尊敬語を用いて「部長がいらした」となる。また、話者がその同僚に敬意を示すときには、丁寧語も用いて「部長がいらっしゃいました」となる。さらに、話者が顧客に話すときには、謙譲語と丁寧語を用いて「部長が参りました」となる。このような敬語の使い分けは、人間であれば、自身が有する一般常識等に基づいて行うことも可能であるが、機械では、所定のアルゴリズムに基づいて行われる。したがって、自然言語処理システムにおいて正しい敬語の解釈と使い分けをするには、文章に関連する人間の上下関係を判定するアルゴリズムが必要である。このため断片的ではあるが、敬語用法を考慮した提案がなされている(例えば、非特許文献1,2参照。)。   By the way, honorifics consisting of respected words, humility words, polite words, etc. are used in natural language, especially Japanese, but it is not absolute which one of those honorific words is used, and human society related to sentences It is determined by relative measures such as target status, age, speaker's subjective familiarity, and gender. As an example, a case where honorific words are used for the sentence “A manager has come” will be described. For example, when a speaker speaks with an in-house colleague, a respected word is used to say “A manager has come”. Also, when the speaker shows respect for his colleague, the polite language is used to say, “The manager has come.” In addition, when the speaker speaks to the customer, the head of the department has come, using humility and polite language. Such honorifics can be used properly based on general common sense or the like of a person, but in a machine, it is performed based on a predetermined algorithm. Therefore, in order to correctly interpret and properly use honorifics in a natural language processing system, an algorithm for determining the human hierarchical relationship related to sentences is required. For this reason, although it is fragmentary, the proposal which considered honorific usage is made (for example, refer nonpatent literatures 1 and 2).

K.Dohsaka, Identifying the referents of zero-pronouns in Japanese dialogues, In Proc. of the 9th European Conference on Artificial Intelligence. 240-245, 1990K. Dohsaka, Identifying the referents of zero-pronouns in Japanese dialogues, In Proc. Of the 9th European Conference on Artificial Intelligence. 240-245, 1990 M,Siegel, Japanese Honorification in an HPSG Frameworks, In Proc. of the 14th Pacific Asia Conference on Language, Information and Computation, 289-300, Waseda University, Tokyo, 2000M, Siegel, Japanese Honorification in an HPSG Frameworks, In Proc. Of the 14th Pacific Asia Conference on Language, Information and Computation, 289-300, Waseda University, Tokyo, 2000

しかしながら、従来の自然言語処理システムでは、対話形式の文、または、一人称および二人称の登場人物を中心としており、語彙のみからの絶対的かつ断片的な敬語情報を反映するのみで、文に関連する人間の上下関係を相対的に正しく判定することができず、結果として、処理精度向上に生かされていなかった。   However, the conventional natural language processing system focuses on interactive sentences or first-person and second-person characters, and only reflects absolute and fragmentary honorific information from only the vocabulary, and is related to sentences. As a result, it has not been possible to improve the processing accuracy because the human vertical relations cannot be correctly determined.

そこで、本願発明は上述したような課題を解決するためになされたものであり、文に関連する人間の上下関係を相対的に判定することができる上下関係判定方法、上下関係判定装置、上下関係判定プログラム、および、記録媒体を提供することを目的とする。   Accordingly, the present invention has been made to solve the above-described problems, and a hierarchical relationship determination method, a hierarchical relationship determination device, and a vertical relationship that can relatively determine the human hierarchical relationship related to a sentence. An object is to provide a determination program and a recording medium.

上述したような課題を解消するために、本発明にかかる上下関係判定方法は、電子化された文を解析し、この文の話者と、この話者の相手と、文が話題としている対象者との3者を特定する特定ステップと、この特定ステップにより特定された3者間の上下関係を判定する判定ステップとを備えることを特徴とする。   In order to solve the above-described problems, the hierarchical relation determination method according to the present invention analyzes a digitized sentence, and the subject of the sentence, the speaker's partner, and the sentence. And a determination step for determining a vertical relationship between the three parties specified by the specification step.

上記上下関係判定方法において、判定ステップは、文に含まれる敬語に基づいて、3者間の上下関係を判定するようにしてもよい。また、判定ステップは、文に含まれる敬語が尊敬表現の場合、文の主語に対応する3者のうちの何れかが、これ以外の3者より上位と判定し、文に含まれる敬語が謙譲表現の場合、文の主語に対応する3者のうちの何れかが、これ以外の3者より下位と判定し、文に丁寧表現の敬語が含まれない場合、相手は話者と同等または話者より下位と判定するようにしてもよい。   In the above-described hierarchical relationship determination method, the determination step may determine the vertical relationship between the three parties based on honorifics included in the sentence. In the determination step, when the honorific included in the sentence is a respect expression, any of the three parties corresponding to the subject of the sentence is determined to be higher than the other three, and the honorific included in the sentence is humility. In the case of expression, if one of the three parties corresponding to the subject of the sentence is determined to be lower than the other three, and the sentence does not contain a polite expression honorific, the other party is equal to or speaking with the speaker You may make it determine with a lower rank than a person.

上記判定ステップは、文に含まれる敬語が尊敬表現の場合、文の主語に対応する相手、対象者、または、相手および対象者のうちの何れかが、これを除く3者より上位と判定し、文に含まれる敬語が謙譲表現の場合、文の主語に対応する話者または相手が、これを除く3者より下位と判定し、文に含まれる敬語が意味的制約動詞の尊敬表現の場合、文の主語に対応する相手、対象者、または、相手および対象のうちの何れかが、これを除く3者より上位と判定し、文に含まれる敬語が意味的制約動詞の謙譲表現の場合、文の主語に対応する話者または相手が、これを除く3者より下位と判定し、文に丁寧表現の敬語が含まれない場合、相手は話者と同等または話者より下位と判定するようにしてもよい。   In the determination step, when the honorific word included in the sentence is a respect expression, it is determined that the partner, the target person, or the other person and the target person corresponding to the subject of the sentence are higher than the other three persons. If the honorific included in the sentence is a modest expression, the speaker or partner corresponding to the subject of the sentence is determined to be lower than the other three, and the honorific included in the sentence is a respected expression of a semantically restricted verb , If the partner, subject, or partner and subject corresponding to the subject of the sentence is determined to be higher than the other three, and the honorific in the sentence is a humility expression of a semantically restricted verb The speaker or partner corresponding to the subject of the sentence is determined to be lower than the other three, and if the sentence does not contain a polite expression honorific, the other party is determined to be equivalent to the speaker or lower than the speaker You may do it.

また、上記上下関係判定方法において、上記判定ステップは、3者間の社会的または年齢的な上下関係に基づいて、3者間の上下関係を判定するようにしてもよい。また、上記判定ステップは、3者間の内外関係に基づいて、3者間の上下関係を判定するようにしてもよい。これらの判定ステップの結果に基づいて、文に使用する敬語を選択する選択ステップをさらに備えるようにしてもよい。   Moreover, in the above-described hierarchical relationship determination method, the determination step may determine the vertical relationship between the three parties based on the social or age-related vertical relationship between the three parties. Further, the determination step may determine the vertical relationship between the three parties based on the internal / external relationship between the three parties. You may make it further provide the selection step which selects the honorific used for a sentence based on the result of these determination steps.

また、本発明にかかる上下関係判定装置は、電子化された文を解析し、この文の話者と、この話者の相手と、文が話題としている対象者との3者を特定する特定手段と、この特定ステップにより特定された3者間の上下関係を判定する判定手段とを備えることを特徴とする。   In addition, the hierarchical relationship determination device according to the present invention analyzes a digitized sentence, and specifies three parties: a speaker of the sentence, a partner of the speaker, and a target person who is talking about the sentence. Means and a determination means for determining a vertical relationship between the three specified by the specifying step.

また、本発明にかかる上下関係判定プログラムは、コンピュータに、電子化された文を解析し、この文の話者と、この話者の相手と、文が話題としている対象者との3者を特定する特定ステップと、この特定ステップにより特定された3者間の上下関係を判定する判定ステップとを実行させることを特徴とする。   In addition, the hierarchical relationship determination program according to the present invention analyzes a computerized sentence on a computer, and determines three persons: a speaker of the sentence, a partner of the speaker, and a target person who is talking about the sentence. A specific step of specifying and a determination step of determining a vertical relationship between the three parties specified by the specific step are executed.

また、本発明にかかる記録媒体は、上記上下関係判定プログラムを記録したことを特徴とする。   A recording medium according to the present invention is characterized in that the above-described hierarchical relationship determination program is recorded.

本発明によれば、電子化された文を解析し、話者、相手、および、対象者の3者を特定し、この特定された3者間の上下関係を判定することにより、話者、相手、および、対象者という文に関連するより具体的な人間の相対的な上下関係を判定することができる。   According to the present invention, an electronic sentence is analyzed, a speaker, a partner, and a target person are identified, and a hierarchical relationship between the identified three parties is determined. It is possible to determine a more specific human relative vertical relationship related to the sentence of the partner and the subject.

[第1の実施の形態]
以下、図面を参照して、本発明の第1の実施の形態について図面を参照して説明する。図1は、本実施の形態における上下関係判定装置の構成を示すブロック図である。上下関係検出装置1は、入力部11と、解析部12と、文法辞書13と、検出部14と、敬語辞書15と、抽出部16と、判定部17と、ランクDB(Data Base)18と、内外関係DB19とから構成される。このような上下関係検出装置1は、CPU等の演算装置と、メモリ、HDD(Hard Disc Drive)等の記憶装置と、キーボード、マウス、ポインティングデバイス、ボタン、タッチパネル等の外部から情報の入力を検出する入力装置と、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等の通信回線を介して各種情報の送受信を行うI/F装置と、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)またはFED(Field Emission Display)等の表示装置を備えたコンピュータと、このコンピュータにインストールされたプログラムとから構成される。すなわちハードウェア装置とソフトウェアとが協働することによって、上記のハードウェア資源がプログラムによって制御され、上述した入力部11、解析部12、文法辞書13、検出部14、敬語辞書15、抽出部16、判定部17およびランクDB18が実現される。なお、上記プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供されるようにしてもよい。
[First Embodiment]
Hereinafter, a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the vertical relationship determination apparatus according to the present embodiment. The hierarchical relationship detection apparatus 1 includes an input unit 11, an analysis unit 12, a grammar dictionary 13, a detection unit 14, an honorific dictionary 15, an extraction unit 16, a determination unit 17, and a rank DB (Data Base) 18. And the internal / external relation DB 19. Such an up-and-down relationship detection device 1 detects an input of information from the outside such as an arithmetic device such as a CPU, a storage device such as a memory and an HDD (Hard Disc Drive), and a keyboard, a mouse, a pointing device, a button, and a touch panel. Input devices, I / F devices that transmit and receive various types of information via communication lines such as the Internet, LAN (Local Area Network), and WAN (Wide Area Network), CRT (Cathode Ray Tube), LCD (Liquid Crystal) It comprises a computer equipped with a display device such as a display or FED (Field Emission Display) and a program installed in the computer. That is, the hardware device and the software cooperate to control the above hardware resources by a program, and the input unit 11, the analysis unit 12, the grammar dictionary 13, the detection unit 14, the honorific dictionary 15, and the extraction unit 16 described above. The determination unit 17 and the rank DB 18 are realized. The program may be provided in a state where it is recorded on a recording medium such as a flexible disk, a CD-ROM, a DVD-ROM, or a memory card.

入力部11は、外部から入力される文章(以下、「入力文」と呼ぶ。)を受け付けるインターフェース装置である。   The input unit 11 is an interface device that accepts texts input from outside (hereinafter referred to as “input texts”).

解析部12は、入力部11に入力された入力文に対して、文法辞書13に記憶された文法規則に基づいて形態素解析する演算処理部である。   The analysis unit 12 is an arithmetic processing unit that performs morphological analysis on the input sentence input to the input unit 11 based on the grammatical rules stored in the grammar dictionary 13.

文法辞書13は、対象とする自然言語の文法規則が登録されているデータベースである。   The grammar dictionary 13 is a database in which grammatical rules for a natural language of interest are registered.

検出部14は、敬語辞書15に基づいて、解析部12により形態素解析が行われた入力文から敬語を検出する演算処理部である。   The detection unit 14 is an arithmetic processing unit that detects a honorific from an input sentence that has been morphologically analyzed by the analysis unit 12 based on the honorific dictionary 15.

敬語辞書15は、図2に示すように、「述語」、「文型」、「動詞/サ変名詞の意味的制約」、「名詞」の項目毎に対応する敬語を登録したデータベースである。なお、「尊敬表現」とは、従来の国語文法に規定されるような「尊敬語」や文型や動詞またはサ変名詞の意味的制約等を含むものである。また、「謙譲表現」とは、従来の国語文法に規定されるような「尊敬語」や文型や動詞またはサ変名詞の意味的制約等を含むものである。また、「丁寧表現」とは、従来の国語文法に規定される「丁寧語」等を含むものである。このような敬語辞書15は予め作成される。   As shown in FIG. 2, the honorific dictionary 15 is a database in which honorifics corresponding to each item of “predicate”, “sentence pattern”, “semantic restriction of verb / sa variable noun”, and “noun” are registered. The “respected expression” includes “respected words” as defined in the conventional Japanese language grammar, sentence patterns, semantic restrictions of verbs or sa-nouns, and the like. In addition, “modest expression” includes “respected words” as defined in the conventional Japanese language grammar, sentence patterns, semantic restrictions of verbs or sa-nouns, and the like. “Polite expression” includes “Polite language” defined in the conventional Japanese language grammar. Such honorific dictionary 15 is created in advance.

一例として、「述語」の場合、「動詞」、「助動詞」、「サ変名詞」、「形容詞」、「形容動詞」の各単語の基本形と、この基本形となる単語の対応する「尊敬表現」、「謙譲表現」、「丁寧表現」が記録されている。
具体的には、「動詞」は「尊敬表現」や「謙譲表現」にはなるが、「丁寧表現」にはならない。例えば、動詞の基本形「言う」は、「尊敬表現」では「おっしゃる」になり、「謙譲表現」では「申す」になる。
また、「助動詞」は、「謙譲表現」にはなり得ない。例えば、助動詞の基本形「だ」は、「丁寧表現」では「です、ます」になる。また、助動詞「られる」は「尊敬表現」に該当する。
また、「サ変名詞」は、例えば、基本形「研究」,「訪問」は、「尊敬表現」ではそれぞれ「ご研究」,「ご訪問」になる。また、語彙や文脈によって、例えば基本形「報告」は「ご報告」となり、「尊敬表現」および「謙譲表現」の両方の解釈が可能となる。
また、「形容詞」は、例えば、基本形「早い」は、「尊敬表現」では「お早い」になる。
また、「形容動詞」は、例えば、基本形「元気」は、「尊敬表現」では「お元気」になる。
なお、各単語は、主語が二人称のとき「尊敬表現」と「丁寧表現」の両方になり得る。
As an example, in the case of “predicate”, the basic form of each word of “verb”, “auxiliary verb”, “sa variable noun”, “adjective”, “adjective verb”, and the corresponding “respect expression” of the word that becomes this basic form, "Humility expression" and "Polite expression" are recorded.
Specifically, “verb” can be “respect expression” or “humility expression” but not “poor expression”. For example, the basic form “say” of a verb becomes “speak” in “respect expression” and “speak” in “modesty expression”.
Also, “auxiliary verbs” cannot be “modest expressions”. For example, the basic form “DA” of an auxiliary verb becomes “Is, Masu” in “Polite Expression”. In addition, the auxiliary verb “re” corresponds to “respect expression”.
For example, the basic form “research” and “visit” become “research” and “visit” in “respect expression”, respectively. Depending on the vocabulary and context, for example, the basic form “report” becomes “report”, and it is possible to interpret both “respect expression” and “humility expression”.
In addition, the “adjective”, for example, the basic form “early” becomes “early” in “respect expression”.
In addition, the “adjective verb” is, for example, the basic form “genki” becomes “good” in “respect expression”.
Each word can be both a “respect expression” and a “poor expression” when the subject is a second person.

「文型」の場合は、「命令文」と「使役文」の各単語についてそれぞれが「尊敬表現」、「謙譲表現」、「丁寧表現」の何れになり得るかが記録されている。
「命令文」は、「丁寧表現」にはなり得ない。例えば、命令文「〜しなさい」は「謙譲表現」になる。
「使役文」は、「丁寧表現」にはなり得ない。例えば、使役文「〜させる」は「尊敬表現」になる。
In the case of “sentence pattern”, each word of “command sentence” and “use sentence” is recorded as “respect expression”, “humility expression”, or “poor expression”.
A “command sentence” cannot be a “poor expression”. For example, the imperative sentence “Please do” becomes “modesty expression”.
The “utility sentence” cannot be a “poor expression”. For example, the usage sentence “~ let” becomes “respect expression”.

動詞またはサ変名詞の意味的制約の場合は、例えば、基本形「求める」は、「謙遜語」では「仰ぐ」になり、基本形「たのむ」は「尊敬表現」では「指示する」になり、基本形「同席する」は「謙遜語」では「陪席する」になる。   In the case of a verbal or sa-variant noun, for example, the basic form “Request” becomes “Look up” in “Humility”, the basic form “Enjoy” becomes “Instruct” in “Respectful expression”, and the basic form “ “To be present” becomes “To be seated” in “Humility”.

「名詞」の場合は、「単語」、「接頭辞」、「接尾辞」の各単語についてそれぞれが「外の関係」、「内の関係」、「丁寧」の何れになり得るかが記録されている。ここで、「内の関係」とは話者が対象者と親しい関係にあると判断していることを意味し、「外の関係」とはそれほど親しくないことを意味する。なお、名詞の各「単語」は、主語が二人称のとき「尊敬表現」と「丁寧表現」の両方になり得る。
例えば、「内の関係」の単語「おかあさん」は、「外の関係」では単語「母」となる。
In the case of “noun”, the word “word”, “prefix”, “suffix” is recorded as to whether it can be “external relationship”, “internal relationship”, or “polite”. ing. Here, “inner relationship” means that the speaker determines that the speaker is intimately related to the target person, and “outer relationship” means that the speaker is not so close. Each “word” of the noun can be both “respect expression” and “poor expression” when the subject is the second person.
For example, the word “mother” in “inner relationship” becomes the word “mother” in “outer relationship”.

「接頭辞」は、例えば、基本形「荷物」は、「外の関係」では「お荷物」となる。また、基本形「会社」は、「外の関係」では「御社」、「内の関係」では「当社」となる。なお、「接頭辞」は、主語が二人称のとき「尊敬表現」と「丁寧表現」の両方に該当する場合がある。
また、「接尾辞」は、例えば、「外の関係」の「佐藤さん」,「学生さん」は、「内の関係」で「佐藤」,「田中」となる。
The “prefix” is, for example, the basic form “luggage” becomes “luggage” in “external relationship”. In addition, the basic form “company” is “your company” in “external relationship” and “our company” in “internal relationship”. The “prefix” may correspond to both “respect expression” and “poor expression” when the subject is the second person.
The “suffix” is, for example, “Sato-san” and “student” in “external relationship” are “Sato” and “Tanaka” in “internal relationship”.

抽出部16は、解析部12により形態素解析が行われた入力文からこの入力文の話者と、この話者の相手と、その文章の話題の対象となる対象者との3者(以下、「指示対象」と呼ぶ。)のうちの何れかを抽出する演算処理部である。   The extraction unit 16 includes three parties (hereinafter referred to as a speaker of the input sentence, a partner of the speaker, and a target subject of the topic of the sentence from the input sentence subjected to the morphological analysis by the analysis unit 12. (Referred to as “instruction target”).

判定部17は、入力文の指示対象間の社会的、年齢的または世代的な上下関係を判定する演算処理部であり、指示対象判断部17aと、敬語判断部17bと、ランク判断部17cと、内外判断部17dと、親密度判断部17eと、出力部17fとから構成される。   The determination unit 17 is an arithmetic processing unit that determines a social, age, or generational hierarchical relationship between input target instructions. The target target determination unit 17a, honorific determination unit 17b, rank determination unit 17c, The internal / external determination unit 17d, the closeness determination unit 17e, and the output unit 17f.

指示対象特定部17aは、抽出部16により抽出された指示対象が何れの指示対象に該当するかを特定する。敬語判断部17bは、検出部14から抽出された敬語に基づいて指示対象の上下関係を判断する。ランク判断部17cは、ランクDB18に基づいて指示対象の上下関係を判断する。内外判断部17dは、敬語辞書15の単語の内外関係に基づいて指示対象の上下関係を判断する。親密度判断部17eは、敬語判断部17b,ランク判断部17c,内外判断部17dの判断結果に基づいて、指示対象の上下関係を決定する。出力部17fは、敬語判断部17b,ランク判断部17c,内外判断部17dおよび親密度判断部17eの判断結果を外部に出力する。   The instruction target specifying unit 17a specifies which instruction target the instruction target extracted by the extraction unit 16 corresponds to. The honorific determination unit 17 b determines the vertical relationship of the instruction target based on the honorific extracted from the detection unit 14. The rank determination unit 17c determines the vertical relationship of the instruction target based on the rank DB 18. The internal / external determination unit 17d determines the vertical relationship of the instruction target based on the internal / external relationship of the words in the honorific dictionary 15. The closeness determination unit 17e determines the vertical relationship of the instruction target based on the determination results of the honorific determination unit 17b, the rank determination unit 17c, and the internal / external determination unit 17d. The output unit 17f outputs the determination results of the honorific determination unit 17b, the rank determination unit 17c, the inside / outside determination unit 17d, and the closeness determination unit 17e to the outside.

ランクDB18は、図3に示すような各名詞間の社会的、年齢的または世代的な上下関係を記録したデータベースである。例えば、図3(a)に示す社会的な上下関係には、「師匠」と「弟子」の場合は、「師匠」は「弟子」よりも社会的に上位にあることが記録されている。また、図3(b)に示す年齢的/世代的な上下関係には、「老人」と「成人」の場合、「老人」は「成人」よりも年齢的に上位にあることが記録されている。このようなランクDB18は予め作成される。   The rank DB 18 is a database in which social, age or generational hierarchical relationships between nouns as shown in FIG. 3 are recorded. For example, in the social hierarchical relationship shown in FIG. 3A, in the case of “master” and “disciple”, it is recorded that “master” is socially higher than “disciple”. In addition, in the age / generational hierarchical relationship shown in FIG. 3B, it is recorded that “old man” and “adult” are higher in age than “adult” in the case of “old man” and “adult”. Yes. Such a rank DB 18 is created in advance.

なお、ランクDB18に記録された上下関係は、異なるカテゴリーの上下関係を関連づけることもできる。例えば、図4に示すように、教育というカテゴリーにおける名詞間の上下関係が記録されたモジュール1と、世代というカテゴリーにおける名詞関係の上下関係が記録されたモジュール2とは、名詞「太郎」により関連づけがなされている。この場合、太郎は、モジュール1では「学生」に相当し、モジュール2では「本人」に相当する。モジュール1の「学生」では最下位にあるが、モジュール2の「本人」では最下位ではない。このように、各モジュールを関連づけることにより、相対的な上下関係を検出することができる。また、「太郎」の「祖父母」が「文科大臣」の「先生」の場合も有り得る。このような場合、モジュール間において複数の関連づけを行うことが可能となる。   Note that the vertical relationship recorded in the rank DB 18 can also relate the vertical relationship of different categories. For example, as shown in FIG. 4, module 1 in which the hierarchical relationship between nouns in the category of education is recorded and module 2 in which the hierarchical relationship of noun relationships in the category of generation are recorded are related by the noun “Taro”. Has been made. In this case, Taro corresponds to “Student” in Module 1 and corresponds to “Principal” in Module 2. Module 1 “Student” is at the bottom, but Module 2 “Principal” is not at the bottom. In this way, the relative vertical relationship can be detected by associating the modules. In addition, “Grandparent” of “Taro” may be “Teacher” of “Minister of Education”. In such a case, a plurality of associations can be performed between modules.

次に、本実施の形態にかかる上下関係検出装置1の動作について、図5を参照して説明する。なお、本実施の形態において、上下関係検出装置1は、言語として日本語を用いて以下に説明する処理を行うものとする。   Next, the operation of the hierarchical relationship detection apparatus 1 according to the present embodiment will be described with reference to FIG. In the present embodiment, it is assumed that the hierarchical relationship detection apparatus 1 performs processing described below using Japanese as a language.

ユーザの操作入力、記録媒体、通信回線等を介して外部からテキストデータ等からなる文(以下、「入力文」と呼ぶ。)が入力されると、入力部11は、その入力文を受け付け、解析部12に送出する(ステップS501)。なお、入力文としては、1つの文でもあってもよく、複数の文であってもよい。   When a sentence composed of text data or the like (hereinafter referred to as “input sentence”) is input from the outside through a user operation input, a recording medium, a communication line, etc., the input unit 11 accepts the input sentence, The data is sent to the analysis unit 12 (step S501). The input sentence may be one sentence or a plurality of sentences.

入力文が受け付けられると、解析部12は、その入力文に対して解析、すなわち形態素解析と構文解析を行う(ステップS502)。例えば、入力部11により「社長に進言する」という入力文が受け付けられた場合、解析部12は、「社長(名詞)/に(助詞)/進言(動詞)/する(助動詞)」と単語単位に分割するとともに各単語に品詞を付与する。このような形態素解析と構文解析は、例えば主辞駆動句構造文法(Head-Driven Phrase Structure Grammar:HPSG)等の手法により実現することができる。なお、本実施の形態では、各単語を「/」で区切って記載している。   When the input sentence is received, the analysis unit 12 analyzes the input sentence, that is, performs morphological analysis and syntax analysis (step S502). For example, when an input sentence “Proceed to the president” is received by the input unit 11, the analysis unit 12 reads “President (noun) / ni (particle) / advice (verb) / do (auxiliary verb)” as a word unit. And parts of speech are given to each word. Such morphological analysis and syntax analysis can be realized by a technique such as Head-Driven Phrase Structure Grammar (HPSG), for example. In this embodiment, each word is described by being separated by “/”.

形態素解析と構文解析が行われると、検出部14は、敬語辞書15に基づいて、形態素解析が行われた入力文から敬語を検出する(ステップS503)。具体的には、検出部14は、入力文に含まれる各単語と敬語辞書15に登録されている単語とを比較し、敬語辞書15に登録されている単語を抽出する。例えば、入力文「社長に進言する」の場合、敬語として「進言」が検出される。   When the morphological analysis and the syntax analysis are performed, the detection unit 14 detects a honorific from the input sentence subjected to the morphological analysis based on the honorific dictionary 15 (step S503). Specifically, the detection unit 14 compares each word included in the input sentence with a word registered in the honorific dictionary 15 and extracts a word registered in the honorific dictionary 15. For example, in the case of the input sentence “Prompt to the president”, “Progress” is detected as honorific.

検出部14により敬語が検出されない場合(ステップS504:NO)、判定部17の出力部17fは、敬語が検出されなかった旨を出力する(ステップS513)。出力部17fは、敬語が検出されなかった旨を上下関係検出装置1の表示画面に表示したり、プリントアウトしたり、通信回線を介して外部に送信したり、記録媒体に記録したりする。   When honorifics are not detected by the detection unit 14 (step S504: NO), the output unit 17f of the determination unit 17 outputs that no honorifics are detected (step S513). The output unit 17f displays on the display screen of the hierarchical relation detection apparatus 1 that the honorific word has not been detected, prints out, transmits it to the outside via a communication line, or records it on a recording medium.

敬語が検出された場合(ステップS504:YES)、抽出部16は、解析部12により解析された入力文から指示対象となり得る具体的な名詞を抽出する(ステップS504)。ここで、指示対象とは、上述したように、入力文の発した話者と、この話者が入力文を語りかけた相手と、入力文の話題の対象となる対象者の3者のことを意味する。抽出部16は、このような指示対象、すなわち、話者、相手および対象者のうちの何れかとなり得る具体的な名詞を抽出する。このとき、抽出部16は、名詞のみを抽出すると指示対象となり得ない名詞も抽出されることがあるので、格助詞が付随する名詞を抽出する。例えば、入力文「社長に進言する」の場合、格助詞が付随する名詞「社長に」を抽出する。なお、抽出部16は、格助詞が付随した名詞を抽出すると、その名詞のみを判定部17に出力する。   When an honorific is detected (step S504: YES), the extraction unit 16 extracts a specific noun that can be an instruction target from the input sentence analyzed by the analysis unit 12 (step S504). Here, as described above, the instruction target refers to the three speakers, that is, the speaker who issued the input sentence, the partner to whom the speaker spoke the input sentence, and the target person who is the subject of the topic of the input sentence. means. The extraction unit 16 extracts a specific noun that can be any one of such instructions, that is, a speaker, a partner, or a subject. At this time, the extraction unit 16 extracts a noun accompanied by a case particle because a noun that cannot be an instruction target may be extracted if only the noun is extracted. For example, in the case of the input sentence “advance to the president”, the noun “to the president” accompanied by the case particle is extracted. When the extraction unit 16 extracts a noun accompanied by a case particle, only the noun is output to the determination unit 17.

指示対象となり得る具体的な名詞が抽出されると、判定部17の指示対象特定部17aは、抽出された名詞が話者、相手、対象者の何れに対応するかを特定する(ステップS506)。具体的には、指示対象特定部17aは、抽出部16により抽出された名詞が一人称ときは「話者」、二人称のときは「相手」、これら以外のときは「対象者」であると特定する。例えば、入力文「社長に進言する」の場合、抽出部16により抽出された「社長に」から抽出した指示対象「社長」は、一人称および二人称ではないので、「対象者」であると特定する。また、入力文に主語が存在しない場合は、入力文の主語は「話者」をデフォルトとする。また、入力文に「相手」に対応する名詞が存在しない場合、「相手」はデフォルトとする。ここで、デフォルトとは、該当する具体的な名詞が存在しない場合に、指示対象に具体的な指示対象を対応付けない状態のことを意味する。   When a specific noun that can be an instruction target is extracted, the instruction target specifying unit 17a of the determination unit 17 specifies whether the extracted noun corresponds to a speaker, a partner, or a target person (step S506). . Specifically, the instruction target specifying unit 17a specifies that the noun extracted by the extracting unit 16 is “speaker” when the first person is first person, “partner” when it is the second person, and “target person” otherwise. To do. For example, in the case of the input sentence “advance to the president”, the instruction target “president” extracted from “to the president” extracted by the extraction unit 16 is not the first person or the second person, and thus is specified as “target person”. . When there is no subject in the input sentence, the subject of the input sentence defaults to “speaker”. Further, when there is no noun corresponding to “partner” in the input sentence, “partner” is set as a default. Here, the default means a state in which a specific instruction target is not associated with an instruction target when there is no corresponding specific noun.

なお、入力文によっては、相手と対象者とが同一など、指示対象が重複する場合もあり得る。この場合、各指示対象を独立して扱ってもよく、重複する指示対象を統合して扱うようにしてもよい。   Note that, depending on the input sentence, there may be a case where the instruction target is duplicated, for example, the other party is the same as the target person. In this case, each instruction object may be handled independently, or overlapping instruction objects may be handled in an integrated manner.

指示対象が特定されると、判定部17の敬語判断部17bは、検出部14により検出された敬語に基づいて、指示対象の上下関係を判断する(ステップS507)。具体的には、検出された敬語が尊敬表現の場合、主語が他の指示対象よりも上位となる。また、検出された敬語が謙譲表現の場合、主語が他の指示対象よりも下位となる。また、検出された敬語の意味的制約動詞の尊敬表現に対応する場合、主語が他の指示対象よりも上位となる。また、検出された敬語の意味的制約動詞の謙譲表現に対応する場合、主語が他の指示対象よりも下位となる。また、丁寧表現の敬語が検出されない場合、相手は話者と同等または話者より下位となる。
例えば、入力文「社長に進言する」の場合、検出された敬語「進言」は意味的制約動詞の「謙譲表現」なので、主語である話者は「社長」よりも下位となる。また、丁寧表現の敬語が検出されていないので、相手は話者と同等または話者よりも下位となる。したがって、「社長>話者≧相手」という上下関係が検出される。
When the instruction target is specified, the honorific determination unit 17b of the determination unit 17 determines the vertical relationship of the instruction target based on the honorific detected by the detection unit 14 (step S507). Specifically, when the detected honorific is a respected expression, the subject is higher than the other instruction objects. In addition, when the detected honorific is a humility expression, the subject is in a lower order than the other instruction objects. In addition, in the case of corresponding to the respect expression of the semantically restricted verb of the detected honorific, the subject is higher than the other instruction target. In addition, in the case of corresponding to the modest expression of the semantically restricted verb of the detected honorific, the subject is in a lower level than the other instruction objects. If no polite honorific expression is detected, the other party is equal to or lower than the speaker.
For example, in the case of the input sentence “advance to the president”, the detected honorificial word “advancement” is the “humility expression” of the semantically restricted verb, so the speaker as the subject is subordinate to the “president”. In addition, since the polite expression honorific is not detected, the other party is equal to or lower than the speaker. Therefore, the hierarchical relationship “president> speaker ≧ partner” is detected.

なお、敬語判断部17bは、入力文に主語がなく、文脈からも主語が特定できないが、その入力文の敬語が謙譲表現の場合、話者が主語であるとデフォルトで特定して、上述した指示対象の上下関係の判断を行う。   The honorific judgment unit 17b does not have a subject in the input sentence, and the subject cannot be specified from the context. However, when the honorific of the input sentence is a humility expression, it is specified by default that the speaker is the subject. Judgment of the upper and lower relation of the instruction target.

また、例えば、基本形「見る」は、「見られる」,「ごらんになる」、「ごらんになられる」というように、敬語表現には複数の段階が存在する場合がある。敬語判定部17bは、敬語表現の段階に基づいて、指示対象間の距離を判断するようにしてもよい。例えば、「見られる」などの敬語が用いられる場合には指示対象間の上下関係の距離が比較的近いとし、「ごらんになられる」などのより丁寧な敬語が用いられている場合には指示対象間の距離が比較的遠いと判断する。これにより、指示対象間の上下関係をより詳細に判断することができる。   Further, for example, the basic form “see” may have a plurality of stages in honorific expression, such as “seen”, “see”, and “become seen”. The honorific determination unit 17b may determine the distance between the instructions based on the level of honorific expression. For example, if honorifics such as “seen” are used, the vertical relationship distance between the target objects is relatively short, and if a more polite honorific such as “can be seen” is used Judge that the distance between objects is relatively long. Thereby, it is possible to determine the vertical relationship between the instruction targets in more detail.

敬語により指示対象の上下関係が検出された場合、または、敬語から上下関係が検出できない場合ランク判断部17cは、ランクDB18に基づいて上下関係の確認または判断を行う(ステップS508)。例えば、入力文「社長に電話を差し上げた」の話者が「部長」場合、ランクDB18から「部長」は「社長」より下位にあることが検出されるので、入力文にある謙譲表現「差し上げた」の用法が正しいことが確認される。   When the hierarchical relationship of the instruction target is detected by honorific or when the hierarchical relationship cannot be detected from honorific, the rank determining unit 17c confirms or determines the hierarchical relationship based on the rank DB 18 (step S508). For example, if the speaker of the input sentence “I gave a call to the president” is “director”, it is detected from the rank DB 18 that the “director” is lower than “president”. It is confirmed that the usage of “ta” is correct.

なお、話者と対象者の上下関係の検出を行うことにより、主語と目的語との上下関係の検出も同時に行うことができる。したがって、主語のみならず、目的語を用いて指示対象間の上下関係の検出を行うこともできる。   By detecting the hierarchical relationship between the speaker and the target person, it is possible to simultaneously detect the vertical relationship between the subject and the object. Therefore, not only the subject but also the object can be used to detect the vertical relationship between the target objects.

また、ランク判断部17cにより上下関係が検出されない場合(ステップS509:NO)、内外判断部17dは、敬語辞書15に含まれる単語の内外関係に基づいて指示対象の上下関係を判断する(ステップS510)。例えば、入力文「夫が田中さんに進言した」の場合、話者は、内の関係にある主語「夫」を用いているので、対象者よりも下位となる。したがって、「話者<対象者」という上下関係が検出される。   When the rank determination unit 17c does not detect the vertical relationship (step S509: NO), the internal / external determination unit 17d determines the vertical relationship of the instruction target based on the internal / external relationship of the words included in the honorific dictionary 15 (step S510). ). For example, in the case of the input sentence “husband promoted to Mr. Tanaka”, the speaker uses the subject “husband” having an internal relationship, and is therefore lower than the target person. Therefore, the hierarchical relationship “speaker <subject” is detected.

また、内外判断部17dにより上下関係が検出されない場合(ステップS511:NO)、親密度判断部17eは、指示対象の3者の親密度が低いと判断し、話者が他の指示対象よりも下位であると判断する(ステップS512)。したがって、内外判断部17dは、「対象者>話者,相手≧話者」という上下関係を検出する。   Further, when the inside / outside determination unit 17d does not detect the vertical relationship (step S511: NO), the closeness determination unit 17e determines that the closeness of the three target objects is low, and the speaker is more than the other target objects. It is determined that the position is lower (step S512). Therefore, the inside / outside determination unit 17d detects a hierarchical relationship of “subject> speaker, partner ≧ speaker”.

上下関係が検出されると(ステップS509:YES,S511:YES,S512)、出力部17fは、検出した上下関係を出力する(ステップS513)。出力部17fは、検出した上下関係を上下関係検出装置1の表示画面に表示したり、プリントアウトしたり、通信回線を介して外部に送信したり、記録媒体に記録したりする。これにより、ユーザは、入力した文から導き出される指示対象の上下関係を認識することが可能となる。   When the vertical relationship is detected (step S509: YES, S511: YES, S512), the output unit 17f outputs the detected vertical relationship (step S513). The output unit 17f displays the detected hierarchical relationship on the display screen of the hierarchical relationship detection device 1, prints it out, transmits it to the outside via a communication line, and records it on a recording medium. Thereby, the user can recognize the vertical relationship of the instruction target derived from the input sentence.

このように、本実施の形態によれば、敬語の種類、各対象者間の社会的、年齢的または世代的な上下関係、内外関係当等に基づいて、指示対象の上下関係を判定することにより、文に関連する人間の上下関係をより具体的に判定することができる。   As described above, according to the present embodiment, the hierarchical relationship of the instruction target is determined based on the type of honorific, the social, age or generational hierarchical relationship between the subjects, the internal / external relationship, etc. Thus, it is possible to more specifically determine the human vertical relationship related to the sentence.

[第2の実施の形態]
次に、本発明の第2の実施の形態について詳細に説明する、図7は、本実施の形態にかかる文生成装置2の構成を示すブロック図である。なお、本実施の形態において、第1の実施の形態と同等の構成要素については、同じ名称および符号を付し、適宜説明を省略する。
[Second Embodiment]
Next, the second embodiment of the present invention will be described in detail. FIG. 7 is a block diagram showing the configuration of the sentence generation device 2 according to the present embodiment. In the present embodiment, components equivalent to those in the first embodiment are denoted by the same names and reference numerals, and description thereof will be omitted as appropriate.

文生成装置2は、入力部11と、解析部12と、文法辞書13と、敬語辞書15と、抽出部16と、判定部17と、ランクDB18と、選択部21と、生成部22と、機械翻訳装置23から構成される。このような文生成装置2は、CPU等の演算装置と、メモリ、HDD等の記憶装置と、キーボード、マウス、ポインティングデバイス、ボタン、タッチパネル等の外部から情報の入力を検出する入力装置と、インターネット、LAN、WAN等の通信回線を介して各種情報の送受信を行うI/F装置と、CRT、LCDまたはFED等の表示装置を備えたコンピュータと、このコンピュータにインストールされたプログラムとから構成される。すなわちハードウェア装置とソフトウェアとが協働することによって、上記のハードウェア資源がプログラムによって制御され、上述した入力部11、解析部12、文法辞書13、敬語辞書15、抽出部16、判定部17、ランクDB18、選択部21、生成部22および機械翻訳装置23が実現される。なお、上記プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供されるようにしてもよい。   The sentence generation device 2 includes an input unit 11, an analysis unit 12, a grammar dictionary 13, an honorific dictionary 15, an extraction unit 16, a determination unit 17, a rank DB 18, a selection unit 21, a generation unit 22, The machine translation device 23 is configured. Such a sentence generation device 2 includes an arithmetic device such as a CPU, a storage device such as a memory and an HDD, an input device that detects input of information from the outside, such as a keyboard, a mouse, a pointing device, a button, and a touch panel, and the Internet. It consists of an I / F device that transmits and receives various types of information via a communication line such as a LAN or WAN, a computer having a display device such as a CRT, LCD, or FED, and a program installed in the computer . That is, the hardware device and software cooperate to control the above hardware resources by a program, and the above-described input unit 11, analysis unit 12, grammar dictionary 13, honorific dictionary 15, extraction unit 16, and determination unit 17 described above. The rank DB 18, the selection unit 21, the generation unit 22, and the machine translation device 23 are realized. Note that the program may be provided in a state of being recorded on a recording medium such as a flexible disk, a CD-ROM, a DVD-ROM, or a memory card.

判定部17は、入力文の指示対象の上下関係を判定する演算処理部であり、指示対象特定部17aと、ランク判断部17cと、内外判断部17dと、親密度判断部17eと、出力部17fとから構成される。指示対象特定部17aは、抽出部16により抽出された指示対象が何れの指示対象に該当するかを特定する。ランク判断部17cは、ランクDB18に基づいて指示対象の上下関係を判断する。内外判断部17dは、敬語辞書15の単語の内外関係に基づいて指示対象の上下関係を判断する。親密度判断部17eは、敬語判断部17b,ランク判断部17c,内外判断部17dの判断結果に基づいて、指示対象の上下関係を決定する。出力部17fは、敬語判断部17b,ランク判断部17c,内外判断部17dおよび親密度判断部17eの判断結果を選択部21に出力する。   The determination unit 17 is an arithmetic processing unit that determines the vertical relationship of the instruction target of the input sentence. The instruction target specifying unit 17a, the rank determination unit 17c, the inside / outside determination unit 17d, the closeness determination unit 17e, and an output unit 17f. The instruction target specifying unit 17a specifies which instruction target the instruction target extracted by the extraction unit 16 corresponds to. The rank determination unit 17c determines the vertical relationship of the instruction target based on the rank DB 18. The internal / external determination unit 17d determines the vertical relationship of the instruction target based on the internal / external relationship of the words in the honorific dictionary 15. The closeness determination unit 17e determines the vertical relationship of the instruction target based on the determination results of the honorific determination unit 17b, the rank determination unit 17c, and the internal / external determination unit 17d. The output unit 17f outputs the determination results of the honorific determination unit 17b, the rank determination unit 17c, the inside / outside determination unit 17d, and the closeness determination unit 17e to the selection unit 21.

受付部20は、外部から入力文を受け付け、この入力文を機械翻訳装置23により翻訳させて翻訳文を生成する演算処理部である。なお、受付部20は、入力文に対して翻訳を行わせるのみならず、例えば、入力文を要約させたり、入力文から文を抽出させたり、入力文に対する質疑応答により文を生成させたりするようにしてもよい。   The accepting unit 20 is an arithmetic processing unit that accepts an input sentence from the outside and translates the input sentence by the machine translation device 23 to generate a translated sentence. The accepting unit 20 not only translates the input sentence, but also summarizes the input sentence, extracts a sentence from the input sentence, or generates a sentence based on a question and answer for the input sentence. You may do it.

選択部21は、解析部12による解析結果と、判定部17による指示対象の上下関係の検出結果とに基づいて、翻訳文に用いるべき敬語の種類を選択する演算処理部である。   The selection unit 21 is an arithmetic processing unit that selects the type of honorific to be used for the translated sentence based on the analysis result by the analysis unit 12 and the detection result of the hierarchical relationship of the instruction target by the determination unit 17.

生成部22は、選択部21の演算結果に基づいて、敬語辞書15から翻訳文に用いるべき敬語を抽出し、この敬語を用いた翻訳文を生成する。   The generation unit 22 extracts a honorific to be used for the translated sentence from the honorific dictionary 15 based on the calculation result of the selection unit 21, and generates a translated sentence using the honorific.

機械翻訳装置23は、外国語辞書や対訳辞書等を用いて、1の言語を他の言語に翻訳する公知の機械翻訳システムである。上記他の言語としては、1カ国語のみならず複数の言語を設定することもできる。   The machine translation device 23 is a known machine translation system that translates one language into another language using a foreign language dictionary, a bilingual dictionary, or the like. As the other language, not only one language but also a plurality of languages can be set.

次に、本実施の形態にかかる文生成装置2の動作について図7を参照して説明する。なお、以下においては、受付部20には英語の入力文が入力され、機械翻訳装置23は、上記1の言語として英語語、上記他の言語として日本語が設定されている場合を例に説明する。   Next, operation | movement of the sentence generation apparatus 2 concerning this Embodiment is demonstrated with reference to FIG. In the following, an input sentence in English is input to the reception unit 20, and the machine translation device 23 will be described by taking as an example a case where English is set as the first language and Japanese is set as the other language. To do.

まず、受付部20は、ユーザの操作入力、記録媒体、通信回線等を介して外部からテキストデータ等からなる英語の入力文が入力されると、機械翻訳装置23にその入力文を日本語に翻訳させる(ステップS701)。例えば、受付部20は、入力文「I called the president」が入力されると、この入力文を機械翻訳装置23に日本語に翻訳させ、翻訳文「私は社長に電話した」を生成する。   First, when an English input sentence made up of text data or the like is input from the outside via a user operation input, a recording medium, a communication line, etc., the accepting unit 20 converts the input sentence into Japanese in the machine translation device 23. Translation is performed (step S701). For example, when the input sentence “I called the president” is input, the reception unit 20 causes the machine translation device 23 to translate the input sentence into Japanese, and generates a translated sentence “I called the president”.

翻訳文が生成されると、解析部12は、その翻訳文に対して解析、すなわち形態素解析および構文解析を行う(ステップS702)。例えば、受付部20により「私は社長に電話した」という翻訳文が生成されると、解析部12は、「私(名詞)/は(助詞)/社長(名詞)/に(助詞)/電話(名詞)/を(助詞)/し(動詞)/た(助動詞)」と単語単位に分割するとともに各単語に品詞を付与する。   When the translated sentence is generated, the analysis unit 12 analyzes the translated sentence, that is, performs morphological analysis and syntactic analysis (step S702). For example, when the translated text “I called the president” is generated by the reception unit 20, the analysis unit 12 reads “I (noun) / ha (particle) / president (noun) / ni (particle) / phone. (Noun) / is divided into (words) / do (verbs) / ta (auxiliary verbs) ”and part of speech is given to each word.

解析が行われると、抽出部16は、解析が行われた翻訳文から指示対象となり得る具体的な名詞を抽出する(ステップS703)。例えば、翻訳文「私は社長に電話した」の場合、格助詞が付随した名詞である「私は」,「社長に」を抽出する。なお、抽出部16は、格助詞が付随した名詞を抽出すると、その名詞のみを判定部17に出力する。   When the analysis is performed, the extraction unit 16 extracts a specific noun that can be an instruction target from the translated sentence that has been analyzed (step S703). For example, in the case of the translated sentence “I called the president”, the nouns accompanied by the case particles are extracted, “I am”, “to the president”. When the extraction unit 16 extracts a noun accompanied by a case particle, only the noun is output to the determination unit 17.

指示対象となり得る具体的な名詞が抽出されると、判定部17の指示対象特定部17aは、抽出された翻訳文の名詞が話者、相手、対象者の何れであるかを特定する(ステップS704)。例えば、翻訳文「私は社長に電話した」の場合、抽出部16により抽出された「私」は一人称であるので「話者」、「社長」は一人称および二人称ではないので「対象者」であると特定する。なお、形態素解析の格助詞の結果から、主語は「私」であることも特定される。   When a specific noun that can be an instruction target is extracted, the instruction target specifying unit 17a of the determination unit 17 specifies whether the extracted translation noun is a speaker, a partner, or a target person (step) S704). For example, in the case of the translated sentence “I called the president”, “I” extracted by the extraction unit 16 is a first person, so “speaker” and “president” are not first person and second person, so “target” Identifies it. The subject is also identified as “I” from the result of the case particle of morphological analysis.

指示対象が特定されると、判定部17のランク判断部17cは、ランクDB18に基づいて指示対象の上下関係を判断する(ステップS705)。例えば、翻訳文「私は社長に電話した」の文脈から、話者が「課長」、相手が「部長」、対象者が「社長」ということが検出されている場合、図3(a)に示すようなランクDB18から、「社長>部長>課長」という上下関係が検出される。   When the instruction target is specified, the rank determination unit 17c of the determination unit 17 determines the vertical relationship of the instruction target based on the rank DB 18 (step S705). For example, if it is detected from the context of the translated sentence “I called the president” that the speaker is “section manager”, the other party is “manager”, and the target person is “president”, FIG. From the rank DB 18 as shown, a vertical relationship of “President> Manager> Manager” is detected.

なお、ランク判断部17cにより上下関係が検出されない場合(ステップS706:NO)、内外判断部17dは、敬語辞書15の単語の内外関係に基づいて指示対象の上下関係を判断する(ステップS707)。例えば、翻訳文「夫が田中に電話した」の場合、主語「夫」は、内の関係である。したがって、「話者<対象者(田中)、話者=対象者(夫)」という上下関係が検出される。   If the rank determination unit 17c does not detect the vertical relationship (step S706: NO), the internal / external determination unit 17d determines the vertical relationship of the instruction target based on the internal / external relationship of the words in the honorific dictionary 15 (step S707). For example, in the case of a translated sentence “husband calls Tanaka”, the subject “husband” is an internal relationship. Therefore, the hierarchical relationship of “speaker <target person (Tanaka), speaker = target person (husband)” is detected.

また、内外判断部17dにより上下関係が検出されない場合(ステップS708:NO)、親密度判断部17eは、指示対象の3者の親密度が低いと判断し、話者が他の指示対象よりも下位であると判断する(ステップS709)。したがって、内外判断部17dは、「対象者>話者,相手≧話者」という上下関係を検出する。   Also, when the vertical relationship is not detected by the inside / outside determination unit 17d (step S708: NO), the closeness determination unit 17e determines that the closeness of the three target objects is low, and the speaker is lower than the other target objects. It is determined that it is a lower order (step S709). Therefore, the inside / outside determination unit 17d detects a hierarchical relationship of “subject> speaker, partner ≧ speaker”.

上下関係が検出されると(ステップS706:YES,S708:YES,S709)、出力部17fは、検出した上下関係を選択部21に出力する。選択部21は、出力部17fから入力される指示対象の上下関係と、解析部12により形態素解析された翻訳文とに基づいて、「尊敬表現」、「謙譲表現」、「丁寧表現」のうち何れを用いるべきかを選択する(ステップS710)。具体的には、翻訳文の構造と指示対象の上下関係から目的語が主語より上位にある場合、選択部21は、翻訳文に「謙譲表現」を用いると決定する。また、相手が話者より上位にある場合、選択部21は、翻訳文に「丁寧表現」を用いると決定する。例えば、翻訳文「私は社長に電話をした」の場合、目的語は対象者である「社長」であり、主語は話者である「課長(私)」であるから、翻訳文に「謙譲表現」を使用する。また、相手である「部長」は、話者である「課長(私)」よりも上位であるので、翻訳文に「丁寧表現」を使用する。   When the vertical relationship is detected (step S706: YES, S708: YES, S709), the output unit 17f outputs the detected vertical relationship to the selection unit 21. The selection unit 21 selects one of “respect expression”, “humility expression”, and “poor expression” based on the hierarchical relationship of the instruction target input from the output unit 17 f and the translation sentence analyzed by the analysis unit 12. Which one is to be used is selected (step S710). Specifically, when the object is higher than the subject, the selection unit 21 determines to use “humility expression” for the translated sentence, based on the structure of the translated sentence and the hierarchical relationship of the instruction target. If the other party is higher than the speaker, the selection unit 21 determines to use “a polite expression” for the translated sentence. For example, in the case of the translated sentence “I called the president”, the object is “President” who is the target, and the subject is “Section Manager (I)”. Use "expression". In addition, the “director” who is the other party is higher than the “section manager (I)” who is the speaker, and therefore “polite expression” is used in the translated sentence.

敬語の種類が選択されると、生成部22は、敬語辞書15から翻訳文に用いるべき敬語を抽出し、この敬語を用いた翻訳文を生成する(ステップS711)。具体的には、まず、生成部22は、翻訳文の中から敬語に置換すべき単語の基本形を検出する。これは、翻訳文の中から述語、文型、動詞またはサ変名詞の意味的制約から適切な単語を検索することにより行われる。次に、生成部22は、検出した単語を置換することができる敬語を、選択部21の選択結果に基づいて敬語辞書15から抽出する。最後に、生成部22は、検出した単語を抽出した敬語に置き換えた翻訳文を生成する。生成された翻訳文は、文生成装置2の表示画面に表示したり、プリントアウトしたり、通信回線を介して外部に送信したり、記録媒体に記録したりされる。例えば、翻訳文「私は社長に電話をした」の場合、生成部22は、置換する単語として「し」を検出し、これに置換する敬語として謙譲表現「いたし」と丁寧表現「まし」を敬語辞書15から抽出し、最終的に翻訳文「私は社長に電話をいたしました」を出力する。   When the type of honorific is selected, the generation unit 22 extracts the honorific to be used for the translated sentence from the honorific dictionary 15 and generates a translated sentence using the honorific (step S711). Specifically, the generation unit 22 first detects a basic form of a word to be replaced with honorific from the translated sentence. This is done by searching for an appropriate word from the semantic constraints of the predicate, sentence pattern, verb or sa variable noun from the translated sentence. Next, the generation unit 22 extracts honorific words that can replace the detected word from the honorific dictionary 15 based on the selection result of the selection unit 21. Finally, the generation unit 22 generates a translated sentence in which the detected word is replaced with the extracted honorific. The generated translation is displayed on the display screen of the sentence generation device 2, printed out, transmitted to the outside via a communication line, or recorded on a recording medium. For example, in the case of a translated sentence “I called the president”, the generation unit 22 detects “shi” as a replacement word, and uses a humble expression “shi” and a polite expression “masashi” as honorifics to replace it. It is extracted from the honorific dictionary 15 and finally the translated sentence “I called the president” is output.

なお、生成部22は、生成部22は、ランク判断部17cによるランクDB18を用いた上下関係の判断結果に基づいて、翻訳文に用いるべき敬語を抽出するようにしてもよい。例えば、基本形「見る」は、「見られる」,「ごらんになる」、「ごらんになられる」というように、敬語表現に複数の段階が存在する。したがって、例えば、「課長」と「社員」のように指示対象間の距離が近い場合には、「見られる」などの敬語を用い、「会長」と「社員」のように指示対象間の距離が遠い場合には、「ごらんになられる」などのより丁寧な敬語を用いる。このようにすることにより、より詳細に敬語の使い分けを行うことができる。   Note that the generation unit 22 may extract honorifics to be used in the translation based on the hierarchical relationship determination result using the rank DB 18 by the rank determination unit 17c. For example, the basic form “see” has a plurality of stages of honorific expression such as “seen”, “see”, and “become seen”. Therefore, for example, when the distance between the target objects is close, such as “section manager” and “employee”, use a honorific such as “seen”, and the distance between the target objects such as “chairman” and “employee” If you are far away, use a more polite honorific word such as “Look at it”. In this way, honorifics can be used in more detail.

このように、本実施の形態によれば、各指示対象間の社会的、年齢的または世代的な上下関係、内外関係当等に基づいて、指示対象の上下関係を判定し、この判定結果に基づいて翻訳文の敬語を選択することにより、語用的により適切な文を生成することができる。   Thus, according to the present embodiment, based on the social, age or generational hierarchical relationship between the target objects, the internal / external relationship, etc., the vertical relationship of the target objects is determined, and the determination result is By selecting the honorific of the translation sentence based on it, it is possible to generate a more appropriate sentence.

なお、本実施の形態では、英語の入力文を日本語に翻訳した翻訳文について上述した各処理をようにしたが、入力文の言語および翻訳文の言語はそれぞれ英語または日本語に限定されず、適宜自由に設定することができる。   In the present embodiment, the above-described processes are performed for a translated sentence obtained by translating an English input sentence into Japanese. However, the language of the input sentence and the language of the translated sentence are not limited to English or Japanese, respectively. It can be set freely as appropriate.

また、本実施の形態にかかる文生成装置は、機械翻訳による翻訳文について意味的に正しい文章を生成するようにしたが、語用的に適切な文を生成できる文は翻訳文に限定されず、例えば、機械的に文章を要約した要約文、機械的に文章から抽出した抽出文、質疑応答システムで生成された文章など、各種文章について意味的に正しい文章を生成することができる。   In addition, the sentence generation device according to the present embodiment generates a sentence that is semantically correct for a translation sentence obtained by machine translation, but a sentence that can generate a grammatically appropriate sentence is not limited to a translation sentence. For example, it is possible to generate semantically correct sentences for various sentences such as a summary sentence that mechanically summarizes sentences, an extracted sentence that is mechanically extracted from sentences, and a sentence generated by a question and answer system.

本発明は、自然言語処理システムに利用することができる。また、外国語等の言語を学習するための言語学習装置や、企業等の新人研修において正しい文章を学習させるための学習装置等にも利用することができる。   The present invention can be used in a natural language processing system. It can also be used for a language learning apparatus for learning a language such as a foreign language, a learning apparatus for learning correct sentences in a new employee training for a company or the like.

上下関係判定装置1の構成を示すブロック図である。1 is a block diagram illustrating a configuration of a vertical relationship determination device 1. FIG. 敬語辞書の構成を示す図である。It is a figure which shows the structure of a honorific dictionary. ランクDBの構成を示す図である。It is a figure which shows the structure of rank DB. ランクDBの各モジュールを関連づけた図である。It is the figure which linked | related each module of rank DB. 上下関係判定装置1の動作を示すフローチャートである。3 is a flowchart showing the operation of the vertical relationship determination device 1. 文生成装置2の構成を示すブロック図である。3 is a block diagram illustrating a configuration of a sentence generation device 2. FIG. 文生成装置2の動作を示すフローチャートである。4 is a flowchart showing the operation of the sentence generation device 2.

符号の説明Explanation of symbols

1…上下関係判定装置、2…文生成装置、11…入力部、12…解析部、13…文法辞書、14…検出部、15…敬語辞書、16…抽出部、17…判定部、17a…指示対象特定部、17b…敬語判断部、17c…ランク判断部、17d…内外判断部、17e…親密度判断部、17f…出力部、18…ランクDB、19a…述語取得手段、19b…翻訳手段、19c…判断手段、19d…登録手段、20…受付部、21…選択部、22…生成部、23…機械翻訳装置。
DESCRIPTION OF SYMBOLS 1 ... Vertical relationship determination apparatus, 2 ... Sentence generation apparatus, 11 ... Input part, 12 ... Analysis part, 13 ... Grammar dictionary, 14 ... Detection part, 15 ... Honorific dictionary, 16 ... Extraction part, 17 ... Determination part, 17a ... Reference target specifying unit, 17b ... honorifical word judging unit, 17c ... rank judging unit, 17d ... inside / outside judging unit, 17e ... familiarity judging unit, 17f ... output unit, 18 ... rank DB, 19a ... predicate obtaining unit, 19b ... translation unit , 19c ... determination means, 19d ... registration means, 20 ... reception part, 21 ... selection part, 22 ... generation part, 23 ... machine translation device.

Claims (9)

電子化された文を解析し、この文の話者と、この話者の相手と、前記文が話題としている対象者との3者を特定する特定ステップと、
この特定ステップにより特定された前記3者間の上下関係を判定する判定ステップと
を備えることを特徴とする上下関係判定方法。
A specific step of analyzing the digitized sentence and identifying three persons: a speaker of the sentence, a partner of the speaker, and a target person who is the subject of the sentence;
A determination step of determining a vertical relationship between the three parties specified by the specifying step.
前記判定ステップは、前記文に含まれる敬語に基づいて、前記3者間の上下関係を判定する
ことを特徴とする請求項1記載の上下関係判定方法。
The method according to claim 1, wherein the determining step determines a hierarchical relationship between the three parties based on honorifics included in the sentence.
前記判定ステップは、
前記文に含まれる敬語が尊敬表現の場合、前記文の主語に対応する前記3者のうちの何れかが、これ以外の前記3者より上位と判定し、
前記文に含まれる敬語が謙譲表現の場合、前記文の主語に対応する前記3者のうちの何れかが、これ以外の前記3者より下位と判定し、
前記文に丁寧表現の敬語が含まれない場合、相手は話者と同等または話者より下位と判定する
ことを特徴とする請求項2記載の上下関係判定方法。
The determination step includes
When the honorific word included in the sentence is a respect expression, it is determined that one of the three parties corresponding to the subject of the sentence is higher than the other three parties,
When the honorific word included in the sentence is a humility expression, it is determined that one of the three parties corresponding to the subject of the sentence is lower than the other three parties,
The hierarchical relation determination method according to claim 2, wherein when the sentence does not include a polite honorific expression, the partner is determined to be equal to or lower than the speaker.
前記判定ステップは、前記3者間の社会的または年齢的な上下関係に基づいて、前記3者間の上下関係を判定する
ことを特徴とする請求項1または2記載の上下関係判定方法。
The hierarchical relationship determination method according to claim 1, wherein the determining step determines a hierarchical relationship between the three parties based on a social or age-related hierarchical relationship between the three parties.
前記判定ステップは、前記3者間の内外関係に基づいて、前記3者間の上下関係を判定する
ことを特徴とする請求項1または2記載の上下関係判定方法。
The method according to claim 1 or 2, wherein the determining step determines a vertical relationship between the three parties based on an internal / external relationship between the three parties.
前記判定ステップの結果に基づいて、前記文に使用する敬語を選択する選択ステップ
をさらに備えることを特徴とする請求項3乃至5の何れか1項に記載の上下関係判定方法。
The hierarchical relation determination method according to any one of claims 3 to 5, further comprising a selection step of selecting a honorific to be used for the sentence based on a result of the determination step.
電子化された文を解析し、この文の話者と、この話者の相手と、前記文が話題としている対象者との3者を特定する特定手段と、
この特定ステップにより特定された前記3者間の上下関係を判定する判定手段と
を備えることを特徴とする上下関係判定装置。
A means for analyzing the digitized sentence and identifying three parties: a speaker of the sentence, a partner of the speaker, and a target person who is the subject of the sentence;
And a determining means for determining a vertical relationship between the three parties specified by the specifying step.
コンピュータに、
電子化された文を解析し、この文の話者と、この話者の相手と、前記文が話題としている対象者との3者を特定する特定ステップと、
この特定ステップにより特定された前記3者間の上下関係を判定する判定ステップと
を実行させることを特徴とする上下関係判定プログラム。
On the computer,
A specific step of analyzing the digitized sentence and identifying three persons: a speaker of the sentence, a partner of the speaker, and a target person who is the subject of the sentence;
And a determination step of determining a vertical relationship between the three parties specified by the specifying step.
請求項8に記載の上下関係判定プログラムを記録した記録媒体。
The recording medium which recorded the hierarchical relationship determination program of Claim 8.
JP2005292073A 2005-10-05 2005-10-05 Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium Expired - Fee Related JP4437778B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005292073A JP4437778B2 (en) 2005-10-05 2005-10-05 Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005292073A JP4437778B2 (en) 2005-10-05 2005-10-05 Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium

Publications (2)

Publication Number Publication Date
JP2007102526A true JP2007102526A (en) 2007-04-19
JP4437778B2 JP4437778B2 (en) 2010-03-24

Family

ID=38029399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005292073A Expired - Fee Related JP4437778B2 (en) 2005-10-05 2005-10-05 Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium

Country Status (1)

Country Link
JP (1) JP4437778B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012178043A (en) * 2011-02-25 2012-09-13 National Institute Of Information & Communication Technology Honorific misuse determination program and honorific misuse determination device
JP2014071769A (en) * 2012-09-28 2014-04-21 Toshiba Corp Expression conversion device, method and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012178043A (en) * 2011-02-25 2012-09-13 National Institute Of Information & Communication Technology Honorific misuse determination program and honorific misuse determination device
JP2014071769A (en) * 2012-09-28 2014-04-21 Toshiba Corp Expression conversion device, method and program

Also Published As

Publication number Publication date
JP4437778B2 (en) 2010-03-24

Similar Documents

Publication Publication Date Title
US10977452B2 (en) Multi-lingual virtual personal assistant
US9805718B2 (en) Clarifying natural language input using targeted questions
US7860705B2 (en) Methods and apparatus for context adaptation of speech-to-speech translation systems
US11222185B2 (en) Lexicon development via shared translation database
KR101445904B1 (en) System and methods for maintaining speech-to-speech translation in the field
US9753918B2 (en) Lexicon development via shared translation database
JP6058039B2 (en) Device and method for extracting information from dialogue
US10672391B2 (en) Improving automatic speech recognition of multilingual named entities
US20170206897A1 (en) Analyzing textual data
US20080133245A1 (en) Methods for speech-to-speech translation
US20090281789A1 (en) System and methods for maintaining speech-to-speech translation in the field
US20040006466A1 (en) System and method for automatic detection of collocation mistakes in documents
JP2005165958A (en) Information search system, information search support system, method and program thereof
WO2003056450A1 (en) Syntax analysis method and apparatus
JP2009139390A (en) Information processing system, processing method and program
JP2007219190A (en) Speech recognition device and recognision method, and program therefor
Seljan et al. Combined automatic speech recognition and machine translation in business correspondence domain for english-croatian
Nunes et al. As simple as it gets-a sentence simplifier for different learning levels and contexts
Stepanov et al. The Development of the Multilingual LUNA Corpus for Spoken Language System Porting.
JP4437778B2 (en) Vertical relationship determination method, vertical relationship determination device, vertical relationship determination program, and recording medium
JP2004118720A (en) Translating device, translating method, and translating program
US11971915B2 (en) Language processor, language processing method and language processing program
Bhatti et al. MANAGING CONTEXTUAL SHIFTS: PRAGMATICS AND SEMANTICS IN AI DIALOGUE SYSTEMS FOR PAKISTANI LANGUAGE DOCUMENTATION
JP2021128632A (en) Information processing apparatus and information processing method
JP4054035B2 (en) Database construction apparatus, database construction method, database construction program, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091224

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees