[go: up one dir, main page]

JP7655691B1 - Information processing device, information processing method, and program - Google Patents

Information processing device, information processing method, and program Download PDF

Info

Publication number
JP7655691B1
JP7655691B1 JP2024232738A JP2024232738A JP7655691B1 JP 7655691 B1 JP7655691 B1 JP 7655691B1 JP 2024232738 A JP2024232738 A JP 2024232738A JP 2024232738 A JP2024232738 A JP 2024232738A JP 7655691 B1 JP7655691 B1 JP 7655691B1
Authority
JP
Japan
Prior art keywords
caller
information processing
answer
processing device
inquiry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024232738A
Other languages
Japanese (ja)
Inventor
清一 松岡
Original Assignee
株式会社Fixer
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Fixer filed Critical 株式会社Fixer
Priority to JP2024232738A priority Critical patent/JP7655691B1/en
Application granted granted Critical
Publication of JP7655691B1 publication Critical patent/JP7655691B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】顧客の問い合わせへの対応において顧客の満足度の低下を抑制する情報処理装置等を提供する。【解決手段】情報処理装置100において、受付部110は、発信者端末から回答方法に関する方法選択信号を受け付ける。判定部120は、方法選択信号に基づいて、発信者が生成的人工知能による回答を要求しているか、人による回答を要求しているかを判定する。回答生成部130は、発信者が生成的人工知能による回答を要求していると判定した場合には、発信者からの問い合わせを受け付け、予め用意しておいた複数の生成的人工知能から一の生成的人工知能を選択し、選択した生成的人工知能に回答を生成させ、生成的人工知能が生成した回答を発信者端末へ送信する。接続処理部140は、発信者が人による回答を要求していると判定した場合には、発信者端末とスタッフ端末とを通話可能に接続する。【選択図】図1[Problem] To provide an information processing device etc. that suppresses a decrease in customer satisfaction in responding to customer inquiries. [Solution] In an information processing device 100, a reception unit 110 receives a method selection signal related to a response method from a caller terminal. A determination unit 120 determines whether the caller is requesting a response by a generative artificial intelligence or a response by a human based on the method selection signal. If a response generation unit 130 determines that the caller is requesting a response by a generative artificial intelligence, it receives the inquiry from the caller, selects one generative artificial intelligence from a plurality of generative artificial intelligences prepared in advance, causes the selected generative artificial intelligence to generate a response, and transmits the response generated by the generative artificial intelligence to the caller terminal. If a connection processing unit 140 determines that the caller is requesting a response by a human, it connects the caller terminal and the staff terminal so that they can communicate with each other. [Selected Figure] FIG.

Description

本開示は、情報処理装置、情報処理方法およびプログラムに関する。 This disclosure relates to an information processing device, an information processing method, and a program.

コールセンターなどの顧客対応業務において自動応答システムの利用が進んでいる。また自動応答システムにAI(Artificial Intelligence)を利用する提案が行われている。 The use of automated response systems is increasing in customer service operations at call centers and other facilities. There are also proposals to use AI (Artificial Intelligence) in automated response systems.

例えば、特許文献1によれば、顧客対応システムは、音声情報を取得し、音声認識処理でキーワードを抽出し、問合せ種別及び応答情報を特定してAIにより音声通話で応答する。 For example, according to Patent Document 1, a customer support system acquires voice information, extracts keywords using voice recognition processing, identifies the type of inquiry and response information, and responds via voice call using AI.

特許文献2に記載の方法は、顧客の発話内容に基づき応答文を決定し、要求に応じた業務内容を判定して業務実行装置に指示する。 The method described in Patent Document 2 determines a response sentence based on the content of the customer's speech, determines the content of the business operation requested, and issues instructions to the business operation execution device.

特開2022-032112号公報JP 2022-032112 A 特開2019-144400号公報JP 2019-144400 A

しかしながら、上述の技術は、顧客の意図した対応とならない可能性がある。そのため、顧客の満足度が低下するおそれがある。 However, the above-mentioned technologies may not provide the response that customers intended. As a result, there is a risk that customer satisfaction will decrease.

本開示は上記課題に鑑みて、顧客の問い合わせへの対応において顧客の満足度の低下を抑制する情報処理装置等を提供することを目的としている。 In view of the above problems, the present disclosure aims to provide an information processing device and the like that suppresses a decline in customer satisfaction when responding to customer inquiries.

本開示に係る情報処理装置は、受付部と、判定部と、回答生成部と、接続処理部と、を有している。受付部は、発信者端末から回答方法に関する方法選択信号を受け付ける。判定部は、方法選択信号に基づいて、発信者が生成的人工知能による回答を要求しているか、人による回答を要求しているかを判定する。回答生成部は、発信者が生成的人工知能による回答を要求していると判定した場合には、発信者からの問い合わせを受け付け、予め用意しておいた複数の生成的人工知能から一の生成的人工知能を選択する。回答生成部は、選択した生成的人工知能に回答を生成させ、生成的人工知能が生成した回答を発信者端末へ送信する。接続処理部は、発信者が人による回答を要求していると判定した場合には、発信者端末とスタッフ端末とを通話可能に接続する。 The information processing device according to the present disclosure has a reception unit, a determination unit, an answer generation unit, and a connection processing unit. The reception unit receives a method selection signal relating to the answer method from the caller terminal. The determination unit determines whether the caller is requesting an answer by a generative artificial intelligence or an answer by a human based on the method selection signal. If the answer generation unit determines that the caller is requesting an answer by a generative artificial intelligence, it receives an inquiry from the caller and selects one generative artificial intelligence from a plurality of generative artificial intelligences prepared in advance. The answer generation unit causes the selected generative artificial intelligence to generate an answer, and transmits the answer generated by the generative artificial intelligence to the caller terminal. If the connection processing unit determines that the caller is requesting an answer by a human, it connects the caller terminal and the staff terminal so that they can communicate with each other.

本開示に係る情報処理方法は、コンピュータが以下の処理を実行する。コンピュータは、発信者端末1から回答方法に関する方法選択信号を受け付ける。コンピュータは、方法選択信号に基づいて、発信者が生成的人工知能による回答を要求しているか、人による回答を要求しているかを判定する。コンピュータは、発信者が生成的人工知能による回答を要求していると判定した場合には、発信者からの問い合わせを受け付け、予め用意しておいた複数の生成的人工知能から一の生成的人工知能を選択する。コンピュータは、選択した生成的人工知能に回答を生成させ、生成的人工知能が生成した回答を発信者端末1へ送信する。コンピュータは、発信者が人による回答を要求していると判定した場合には、発信者端末1とスタッフ端末300とを通話可能に接続する。 In the information processing method according to the present disclosure, a computer executes the following processes. The computer receives a method selection signal relating to the answering method from the caller terminal 1. The computer determines whether the caller is requesting an answer by a generative artificial intelligence or an answer by a human based on the method selection signal. If the computer determines that the caller is requesting an answer by a generative artificial intelligence, it receives an inquiry from the caller and selects one generative artificial intelligence from a plurality of generative artificial intelligences prepared in advance. The computer causes the selected generative artificial intelligence to generate an answer, and transmits the answer generated by the generative artificial intelligence to the caller terminal 1. If the computer determines that the caller is requesting an answer by a human, it connects the caller terminal 1 and the staff terminal 300 so that they can communicate with each other.

本開示に係るプログラムは、コンピュータに以下の情報処理方法を実行させる。コンピュータは、発信者端末1から回答方法に関する方法選択信号を受け付ける。コンピュータは、方法選択信号に基づいて、発信者が生成的人工知能による回答を要求しているか、人による回答を要求しているかを判定する。コンピュータは、発信者が生成的人工知能による回答を要求していると判定した場合には、発信者からの問い合わせを受け付け、予め用意しておいた複数の生成的人工知能から一の生成的人工知能を選択する。コンピュータは、選択した生成的人工知能に回答を生成させ、生成的人工知能が生成した回答を発信者端末1へ送信する。コンピュータは、発信者が人による回答を要求していると判定した場合には、発信者端末1とスタッフ端末300とを通話可能に接続する。 The program according to the present disclosure causes a computer to execute the following information processing method. The computer receives a method selection signal relating to the answering method from the caller terminal 1. The computer determines whether the caller is requesting an answer by a generative artificial intelligence or an answer by a human based on the method selection signal. If the computer determines that the caller is requesting an answer by a generative artificial intelligence, it receives an inquiry from the caller and selects one generative artificial intelligence from a plurality of generative artificial intelligences prepared in advance. The computer causes the selected generative artificial intelligence to generate an answer and transmits the answer generated by the generative artificial intelligence to the caller terminal 1. If the computer determines that the caller is requesting an answer by a human, it connects the caller terminal 1 and the staff terminal 300 so that they can communicate with each other.

本開示によれば、顧客の問い合わせへの対応において顧客の満足度の低下を抑制する情報処理装置、情報処理方法およびプログラムを提供できる。 The present disclosure provides an information processing device, an information processing method, and a program that suppress a decrease in customer satisfaction when responding to customer inquiries.

第1実施形態に係る情報処理システムのブロック図である。1 is a block diagram of an information processing system according to a first embodiment. 第1実施形態に係る情報処理装置のブロック図である。1 is a block diagram of an information processing apparatus according to a first embodiment. 選択情報の内容を示す図である。FIG. 11 is a diagram showing the contents of selection information. コンピュータのハードウェア構成を例示するブロック図である。FIG. 2 is a block diagram illustrating an example of a hardware configuration of a computer. 第1実施形態に係る情報処理方法のフローチャートである。3 is a flowchart of an information processing method according to the first embodiment. 第1実施形態に係る情報処理方法の第1のシーケンス図である。FIG. 2 is a first sequence diagram of the information processing method according to the first embodiment. 第1実施形態に係る情報処理方法の第2のシーケンス図である。FIG. 2 is a second sequence diagram of the information processing method according to the first embodiment. 第2実施形態に係る情報処理システムのブロック図である。FIG. 11 is a block diagram of an information processing system according to a second embodiment. 第2実施形態に係る情報処理装置のブロック図である。FIG. 11 is a block diagram of an information processing apparatus according to a second embodiment. 第2実施形態に係る情報処理方法のシーケンス図である。FIG. 11 is a sequence diagram of an information processing method according to the second embodiment.

以下、発明の実施の形態を通じて本発明を説明するが、特許請求の範囲に係る発明を以下の実施形態に限定するものではない。また、実施形態で説明する構成の全てが課題を解決するための手段として必須であるとは限らない。説明の明確化のため、以下の記載および図面は、適宜、省略、および簡略化がなされている。なお、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。 The present invention will be described below through embodiments of the invention, but the invention according to the claims is not limited to the following embodiments. Furthermore, not all of the configurations described in the embodiments are necessarily essential as means for solving the problems. For clarity of explanation, the following description and drawings have been omitted and simplified as appropriate. In addition, the same elements are given the same reference numerals in each drawing, and duplicate explanations have been omitted as necessary.

<第1実施形態>
(情報処理システム10)
図1を参照して情報処理システム10について説明する。図1は、第1実施形態に係る情報処理システム10のブロック図である。情報処理システム10は、発信者P1から問い合わせを受け付け、受け付けた問い合わせに対する回答をする。情報処理システム10は、例えば、顧客からの問合せ、注文またはクレーム等に対応するコールセンターのシステムである。情報処理システム10はあるいは、コンタクトセンターのシステムであってもよいが、これらに限られない。
First Embodiment
(Information Processing System 10)
An information processing system 10 will be described with reference to Fig. 1. Fig. 1 is a block diagram of the information processing system 10 according to the first embodiment. The information processing system 10 receives an inquiry from a caller P1 and responds to the received inquiry. The information processing system 10 is, for example, a call center system that handles inquiries, orders, complaints, and the like from customers. Alternatively, the information processing system 10 may be, but is not limited to, a contact center system.

情報処理システム10は第1ネットワークN1を介して発信者P1が使用する発信者端末1と通信可能に接続する。発信者端末1は例えば、発信者P1が使用する携帯電話またはスマートフォンである。発信者端末1は固定電話であってもよいし、通信機能を有するコンピュータでもよい。第1ネットワークN1は例えば、固定電話または携帯電話のための公衆通信ネットワークである。情報処理システム10は主な構成として、情報処理装置100、サーバ200およびスタッフ端末300を有している。 The information processing system 10 is communicatively connected to a caller terminal 1 used by a caller P1 via a first network N1. The caller terminal 1 is, for example, a mobile phone or a smartphone used by the caller P1. The caller terminal 1 may be a landline phone or a computer with communication capabilities. The first network N1 is, for example, a public communications network for landlines or mobile phones. The information processing system 10 mainly comprises an information processing device 100, a server 200, and a staff terminal 300.

情報処理装置100は、第1ネットワークN1を介して発信者端末1と通信可能に接続する。情報処理装置100は例えば、通信機能を有するコンピュータまたはサーバである。情報処理装置100は、発信者端末1の発信呼を受け、自動音声により、所定の対応をすることができる。すなわち情報処理システム10は、IP-PBX(Internet protocol private branch exchange)の機能の少なくとも一部を有していてもよい。情報処理装置100は、IVR(Interactive Voice Response)の機能の少なくとも一部を有していてもよい。情報処理装置100は、発信者端末1からの着信に自動で応答し、予め設定した応答メッセージを再生する。また情報処理装置100は、発信者P1に電話の番号ボタンを押下させることによりトーン信号を発信させる。情報処理装置100は、状況に応じて、スタッフ端末300と発信者端末1とが通話可能に接続する。 The information processing device 100 is connected to the caller terminal 1 via the first network N1 so that they can communicate with each other. The information processing device 100 is, for example, a computer or server with a communication function. The information processing device 100 can receive a call from the caller terminal 1 and respond in a predetermined manner using an automated voice. That is, the information processing system 10 may have at least a part of the functionality of an IP-PBX (Internet protocol private branch exchange). The information processing device 100 may have at least a part of the functionality of an IVR (Interactive Voice Response). The information processing device 100 automatically responds to an incoming call from the caller terminal 1 and plays a preset response message. The information processing device 100 also causes the caller P1 to press a number button on the phone to send a tone signal. The information processing device 100 connects the staff terminal 300 and the caller terminal 1 so that they can talk to each other depending on the situation.

情報処理装置100は、サーバ200と通信可能に接続し、サーバ200が有する言語モデルにアクセスできる。これにより情報処理装置100は、状況に応じて、情報処理装置100が生成したプロンプトに対する回答を、サーバ200から取得する。 The information processing device 100 is communicatively connected to the server 200 and can access the language model held by the server 200. This allows the information processing device 100 to obtain, depending on the situation, a response to a prompt generated by the information processing device 100 from the server 200.

情報処理装置100は、スタッフ端末300と通信可能に接続できる。情報処理装置100は、状況に応じて、発信者端末1とスタッフ端末300とを中継して、発信者P1とスタッフP2とを通話可能にする。なお、発信者端末1とスタッフ端末300とを中継することを、発信者端末1と接続している回線をスタッフ端末300に転送する、と言い換えることもできる。 The information processing device 100 can be connected to the staff terminal 300 so that they can communicate with each other. Depending on the situation, the information processing device 100 relays between the caller terminal 1 and the staff terminal 300, allowing a call between the caller P1 and the staff P2. Note that relaying between the caller terminal 1 and the staff terminal 300 can also be said to transfer the line connected to the caller terminal 1 to the staff terminal 300.

サーバ200は、情報処理装置100と通信可能に接続している。サーバ200は、第1言語モデル210および第2言語モデル220を有している。第1言語モデル210および第2言語モデル220は、ユーザの様々なリクエストに応じた回答を生成する大規模言語モデル(LLM(Large Language Model))を用いた生成AI(Artificial Intelligence)である。生成AIは、生成的人工知能と言い換えることもできる。本開示における第1言語モデル210と第2言語モデル220とは、異なる言語モデルである。ここで、「異なる言語モデル」とは、言語モデルの種類そのものが異なる場合を含む。また「異なる言語モデル」とは、言語モデルの種類が同じであって、バージョンが異なる場合を含む。第1言語モデル210または第2言語モデル220は、情報処理装置100からプロンプトを受け取り、受け取ったプロンプトに対する回答を生成し、情報処理装置100に回答を供給する。 The server 200 is communicatively connected to the information processing device 100. The server 200 has a first language model 210 and a second language model 220. The first language model 210 and the second language model 220 are generative AI (Artificial Intelligence) using a large-scale language model (LLM (Large Language Model)) that generates answers according to various user requests. Generative AI can also be called generative artificial intelligence. In this disclosure, the first language model 210 and the second language model 220 are different language models. Here, "different language models" includes cases where the types of language models themselves are different. Also, "different language models" includes cases where the types of language models are the same but the versions are different. The first language model 210 or the second language model 220 receives a prompt from the information processing device 100, generates an answer to the received prompt, and supplies the answer to the information processing device 100.

なお、情報処理装置100とサーバ200とは有線又は無線により直接通信可能に接続していてもよい。情報処理装置100とサーバ200とはインターネット回線を通じて接続していてもよい。サーバ200はクラウドに設けられた仮想的な存在であってもよい。また、図1には、1つのサーバに第1言語モデル210および第2言語モデル220を有しているが、複数のサーバに第1言語モデル210および第2言語モデル220を有していてもよい。また、図1において、サーバ200は、第1言語モデル210と第2言語モデル220の2つの生成AIを有しているが、3つ以上の言語モデルを有していてもよい。 The information processing device 100 and the server 200 may be connected to each other via a wired or wireless connection so that they can communicate directly with each other. The information processing device 100 and the server 200 may be connected to each other via an Internet line. The server 200 may be a virtual entity provided in the cloud. In addition, in FIG. 1, one server has the first language model 210 and the second language model 220, but multiple servers may have the first language model 210 and the second language model 220. In addition, in FIG. 1, the server 200 has two generation AIs, the first language model 210 and the second language model 220, but it may have three or more language models.

スタッフ端末300は、スタッフP2が使用する端末であって、情報処理装置100と通信可能に接続する。スタッフ端末300は例えば通信機能を有するコンピュータである。スタッフ端末300は情報処理装置100を介して発信者端末1を使用する発信者P1と通話可能に設定されている。 The staff terminal 300 is a terminal used by staff member P2, and is communicatively connected to the information processing device 100. The staff terminal 300 is, for example, a computer with a communication function. The staff terminal 300 is set up so that it can communicate with caller P1 using caller terminal 1 via the information processing device 100.

(情報処理装置100)
次に、図2を参照して情報処理装置100について説明する。情報処理装置100は、第1ネットワークN1を介して発信者端末1の発信呼を受信する。情報処理装置100は、発信者端末1の発信呼を受信することにより、発信者P1からの問い合わせに対応する。情報処理装置100は主な構成として、受付部110、判定部120、回答生成部130、接続処理部140、通信部150および記憶部160を有している。
(Information processing device 100)
Next, the information processing device 100 will be described with reference to Fig. 2. The information processing device 100 receives an outgoing call from the caller terminal 1 via the first network N1. The information processing device 100 responds to an inquiry from the caller P1 by receiving the outgoing call from the caller terminal 1. The information processing device 100 mainly includes a reception unit 110, a determination unit 120, a response generation unit 130, a connection processing unit 140, a communication unit 150, and a storage unit 160.

受付部110は、発信者端末1の発信呼を受け付ける。受付部110は発信者端末1との接続が確立した後に、予め設定された受付メッセージを、発信者端末1に対して送信する。受付メッセージは、発信者P1の問い合わせに対する回答方法の指定を促すメッセージを含む。 The reception unit 110 receives an outgoing call from the caller terminal 1. After the reception unit 110 establishes a connection with the caller terminal 1, it sends a predefined reception message to the caller terminal 1. The reception message includes a message that prompts the caller to specify a response method for the inquiry from the caller P1.

受付部110は、発信者端末1から回答方法に関する方法選択信号を受け付ける。回答方法とは、発信者P1から受け付ける問い合わせに対して回答する方法である。回答方法は、生成AIによる回答と、人による回答と、を含む。回答方法に関する方法選択信号とは、生成AIによる回答と、人による回答と、から発信者P1がいずれの回答方法を希望するかを示す信号である。この方法選択信号は例えば、発信者端末1が発信可能なトーン信号である。なお、本開示におけるトーン信号は、一般的な電話機またはスマートフォンが発信するトーン信号である。トーン信号は、DTMF(Dual-Tone Multi-Frequency)とも称され得る。 The reception unit 110 receives a method selection signal regarding the answering method from the caller terminal 1. The answering method is a method of answering an inquiry received from the caller P1. The answering method includes an answer by a generated AI and an answer by a human. The method selection signal regarding the answering method is a signal indicating which answering method the caller P1 desires from an answer by a generated AI and an answer by a human. This method selection signal is, for example, a tone signal that can be transmitted by the caller terminal 1. Note that the tone signal in this disclosure is a tone signal transmitted by a general telephone or a smartphone. The tone signal may also be referred to as DTMF (Dual-Tone Multi-Frequency).

方法選択信号は、トーン信号とは異なる信号であってもよい。方法選択信号は、発信者P1の発話である音声データであってもよい。方法選択信号は、発信者P1が入力したテキストデータを発信者端末1が発信した信号であってもよい。また方法選択信号は、これらの組み合わせであってもよい。 The method selection signal may be a signal other than a tone signal. The method selection signal may be voice data that is an utterance by the caller P1. The method selection signal may be a signal that is text data input by the caller P1 and transmitted by the caller terminal 1. The method selection signal may also be a combination of these.

判定部120は、上述の方法選択信号に基づいて、発信者P1が生成AIによる回答を要求しているか、人による回答を要求しているかを判定する。具体的には例えば判定部120は、方法選択信号がトーン信号と設定されている場合において、発信者端末1から受け付けたトーン信号を検出し、検出したトーン信号の種類を判定する。 Based on the above-mentioned method selection signal, the determination unit 120 determines whether the caller P1 is requesting a response by the generated AI or a response by a human. Specifically, for example, when the method selection signal is set to a tone signal, the determination unit 120 detects the tone signal received from the caller terminal 1 and determines the type of the detected tone signal.

より具体的には例えば、人による回答を要求するトーン信号がプッシュ式電話回線の「1」に対応し、生成AIによる回答を要求するトーン信号がプッシュ式電話回線の「2」に対応すると設定されていたとする。この場合に、判定部120は方法選択信号が「1」、「2」、およびそれら以外かを判定する。 More specifically, for example, it is assumed that the tone signal requesting a human response corresponds to "1" on a push-button telephone line, and the tone signal requesting a response from the generation AI corresponds to "2" on a push-button telephone line. In this case, the determination unit 120 determines whether the method selection signal is "1", "2", or something other than these.

上述の判定において、判定部120は、記憶部160が記憶している選択情報161を参照する。ここで、選択情報161は、トーン信号の種類と回答方法とを紐づけた情報を含む。 In the above-mentioned determination, the determination unit 120 refers to the selection information 161 stored in the storage unit 160. Here, the selection information 161 includes information linking the type of tone signal with the response method.

判定部120は、情報処理システム10が有する複数の生成AIのうちどの生成AIによる回答を要求するか選択可能に設定されていてもよい。この場合例えば、第1言語モデル210による回答が「2」であって、第2言語モデル220による回答が「3」と設定され得る。またこの場合、判定部120は、方法選択信号が「1」、「2」、「3」およびそれら以外かを判定する。この場合、記憶部160が記憶する選択情報161は、トーン信号の種類と、回答方法とを紐づけた情報において、回答する生成AIの種類に関する情報も含み得る。 The determination unit 120 may be configured to be able to select which of the multiple generation AIs possessed by the information processing system 10 to request an answer from. In this case, for example, the answer from the first language model 210 may be set to "2", and the answer from the second language model 220 may be set to "3". In this case, the determination unit 120 determines whether the method selection signal is "1", "2", "3", or other than these. In this case, the selection information 161 stored in the memory unit 160 may also include information regarding the type of generation AI that will provide an answer in the information linking the type of tone signal and the answering method.

生成AIによる回答を要求するか、人による回答を要求するか、の判定は、発信者P1の発話を認識することにより行うと設定されていてもよい。この場合に、判定部120は、発信者P1の発話を検出し、検出した発話の内容から、発信者P1が生成AIによる回答を要求するのか、人による回答を要求するのか、を判定する。あるいは、判定部120は、発信者P1の発話の内容から、情報処理システム10が有する複数の生成AIのうちどの生成AIによる回答を要求するかを判定するものであってもよい。この場合、記憶部160が記憶する選択情報161は、発信者P1の発話の内容と、回答方法とを紐づけた情報において、回答する生成AIの種類に関する情報も含み得る。 The determination of whether to request a response from the generated AI or a human response may be set by recognizing the speech of the caller P1. In this case, the determination unit 120 detects the speech of the caller P1 and determines from the content of the detected speech whether the caller P1 requests a response from the generated AI or a human response. Alternatively, the determination unit 120 may determine from the content of the speech of the caller P1 which of the multiple generated AIs possessed by the information processing system 10 to request a response from. In this case, the selection information 161 stored in the storage unit 160 may also include information regarding the type of generated AI that will respond in information linking the content of the speech of the caller P1 with the response method.

回答生成部130は、発信者P1が生成AIによる回答を要求していると判定部120が判定した場合には、発信者P1からの問い合わせを受け付ける。この場合、回答生成部130は、発信者P1に対して問い合わせの内容を発話することを促すための音声データを発信者端末1に送信する。また回答生成部130は、発信者P1の発話である音声データを検出した場合には、問い合わせの内容を認識するために、受け付けた音声データをテキストデータに変換する。ここで回答生成部130は、テキストデータに対してトークナイズ等を行い、問い合わせ内容からプロンプトの生成を行う。 When the determination unit 120 determines that the caller P1 is requesting an answer from the generation AI, the answer generation unit 130 accepts an inquiry from the caller P1. In this case, the answer generation unit 130 transmits voice data to the caller terminal 1 to prompt the caller P1 to speak the content of the inquiry. Furthermore, when the answer generation unit 130 detects voice data that is the speech of the caller P1, it converts the accepted voice data into text data in order to recognize the content of the inquiry. Here, the answer generation unit 130 performs tokenization on the text data and generates a prompt from the content of the inquiry.

すなわち回答生成部130は、発信者P1の発話である問い合わせをテキストに変換し、変換したテキストに基づいて一の生成AIに回答を生成させるためのプロンプトを生成する。プロンプトは、生成AIに対して入力する指示文である。プロンプトは、発信者P1の問い合わせに対する回答を生成させるための具体的な内容を含む。 That is, the answer generation unit 130 converts the inquiry, which is the speech of the caller P1, into text, and generates a prompt for one generation AI to generate an answer based on the converted text. A prompt is an instruction sentence input to the generation AI. The prompt includes specific content for generating an answer to the inquiry of the caller P1.

また回答生成部130は、予め用意しておいた複数の生成AIから一の生成AIを選択する。すなわち回答生成部130は、サーバ200が有している第1言語モデル210および第2言語モデル220のうちいずれかを選択する。回答生成部130は、方法選択信号または発信者P1の発話のいずれかに応じて、この選択を行う。例えば、方法選択信号が生成AIのうち第1言語モデル210の選択を含むものである場合、回答生成部130は方法選択信号に従い第1言語モデル210を選択する。 The answer generation unit 130 also selects one generation AI from multiple generation AIs prepared in advance. That is, the answer generation unit 130 selects either the first language model 210 or the second language model 220 held by the server 200. The answer generation unit 130 makes this selection in response to either a method selection signal or the speech of the caller P1. For example, if the method selection signal includes the selection of the first language model 210 from the generation AIs, the answer generation unit 130 selects the first language model 210 in accordance with the method selection signal.

あるいは、回答生成部130は、発信者P1の発話をテキストに変換したデータの内容から生成AIを選択する。この場合、回答生成部130は、記憶部160が記憶している選択情報161を参照する。この場合の選択情報161は、問い合わせの内容に関連するテキストと生成AIの種類とを紐づけた情報である。回答生成部130は、発信者P1の発話をテキストに変換したデータを、選択情報161に含まれるテキストと照合し、同じテキストまたは近い意味のテキストを抽出する。さらに回答生成部130は、抽出した結果から発信者P1の発話とのつながりが強い言語モデルを選択する。 Alternatively, the answer generation unit 130 selects the generated AI from the contents of the data obtained by converting the speech of the sender P1 into text. In this case, the answer generation unit 130 refers to the selection information 161 stored in the storage unit 160. The selection information 161 in this case is information that links the text related to the content of the inquiry with the type of generated AI. The answer generation unit 130 compares the data obtained by converting the speech of the sender P1 into text with the text included in the selection information 161, and extracts the same text or text with a similar meaning. Furthermore, the answer generation unit 130 selects a language model that is closely connected to the speech of the sender P1 from the extracted results.

回答生成部130は、選択した生成AIに回答を生成させ、生成AIが生成した回答を発信者端末1へ送信する。すなわち回答生成部130は、選択した言語モデルに対して回答を生成させるためにプロンプトを生成する。回答生成部130は生成したプロンプトを、第1言語モデル210または第2言語モデル220のうちいずれか1つに供給する。回答生成部130は、プロンプトに対して生成された回答を受け取る。 The answer generation unit 130 causes the selected generation AI to generate an answer, and transmits the answer generated by the generation AI to the caller terminal 1. That is, the answer generation unit 130 generates a prompt to generate an answer for the selected language model. The answer generation unit 130 supplies the generated prompt to either the first language model 210 or the second language model 220. The answer generation unit 130 receives the answer generated in response to the prompt.

また回答生成部130は、生成AIが生成した回答を音声データに変換して発信者端末1へ送信する。すなわち回答生成部130は、言語モデルから受け取った回答を、発信者P1に伝えるために、回答の内容を音声データに変換する。そして回答生成部130は、変換した音声データを発信者端末1に送信する。このとき情報処理装置100は、通信部150を介して、発信者端末1に音声データを送信する。 The answer generation unit 130 also converts the answer generated by the generation AI into voice data and transmits it to the caller terminal 1. That is, the answer generation unit 130 converts the content of the answer received from the language model into voice data in order to convey it to the caller P1. The answer generation unit 130 then transmits the converted voice data to the caller terminal 1. At this time, the information processing device 100 transmits the voice data to the caller terminal 1 via the communication unit 150.

回答生成部130は、上述の機能を実現するために、主な構成として、信号変換部131、プロンプト生成部132および言語モデル選択部133を有している。 To realize the above-mentioned functions, the answer generation unit 130 has, as its main components, a signal conversion unit 131, a prompt generation unit 132, and a language model selection unit 133.

信号変換部131は、テキストデータを音声データに変換する。また信号変換部131は、音声データをテキストデータに変換する。例えば信号変換部131は、発信者P1の発話である音声データを、テキストデータに変換する。また信号変換部131は、言語モデルから受け取ったテキストデータである回答を、音声データに変換する。 The signal conversion unit 131 converts text data into voice data. The signal conversion unit 131 also converts voice data into text data. For example, the signal conversion unit 131 converts voice data, which is an utterance by the caller P1, into text data. The signal conversion unit 131 also converts a response, which is text data received from the language model, into voice data.

プロンプト生成部132は、発信者P1の発話である問い合わせ内容を含むテキストに基づいて、一の生成AIに回答を生成させるためのプロンプトを生成する。 The prompt generation unit 132 generates a prompt for one generation AI to generate an answer based on text including the inquiry content spoken by the caller P1.

言語モデル選択部133は、発信者端末1の電話機能におけるトーン信号または発信者の発話による音声データである方法選択信号に基づいて、一の生成AIを選択する。あるいは言語モデル選択部133は、発信者P1の発話である問い合わせに含まれる言葉の内容に基づいて、一の生成AIを選択する。言語モデル選択部133は、記憶部160が記憶している選択情報161を参照する。 The language model selection unit 133 selects one generation AI based on a method selection signal, which is a tone signal in the telephone function of the caller terminal 1 or voice data uttered by the caller. Alternatively, the language model selection unit 133 selects one generation AI based on the content of words included in the inquiry uttered by the caller P1. The language model selection unit 133 refers to the selection information 161 stored in the memory unit 160.

接続処理部140は、発信者P1が人による回答を要求していると判定部120が判定した場合には、発信者端末1とスタッフ端末300とを通話可能に接続する。すなわち、接続処理部140は、方法選択信号が人による回答を要求するものである場合に、発信者端末1から着信した回線をスタッフ端末300に接続する。接続処理部140が発信者端末1とスタッフ端末300とを中継することにより、発信者P1とスタッフP2とは通話が可能となる。 When the determination unit 120 determines that the caller P1 is requesting a human response, the connection processing unit 140 connects the caller terminal 1 and the staff terminal 300 so that they can communicate. In other words, when the method selection signal requests a human response, the connection processing unit 140 connects the line that receives the call from the caller terminal 1 to the staff terminal 300. The connection processing unit 140 relays between the caller terminal 1 and the staff terminal 300, so that the caller P1 and the staff P2 can communicate with each other.

通信部150は、第1ネットワークN1との通信、サーバ200との通信およびスタッフ端末300との通信に関する機能を担う。すなわち通信部150はこれらの通信機能における信号の送信、受信に関する信号処理を実行する。 The communication unit 150 is responsible for functions related to communication with the first network N1, communication with the server 200, and communication with the staff terminal 300. In other words, the communication unit 150 performs signal processing related to the transmission and reception of signals in these communication functions.

記憶部160は、情報処理装置100の機能を実現するための種々の情報を記憶する。記憶部160は例えば、受付部110が発信者端末1に送信する受付メッセージを記憶する。また記憶部160は、選択情報161を記憶する。選択情報161は、回答生成部130が生成AIを選択する場合に利用する情報である。 The storage unit 160 stores various information for implementing the functions of the information processing device 100. For example, the storage unit 160 stores a reception message that the reception unit 110 transmits to the caller terminal 1. The storage unit 160 also stores selection information 161. The selection information 161 is information that the answer generation unit 130 uses when selecting a generation AI.

以上、情報処理装置100について説明した。上述の構成により、情報処理装置100は、顧客の要求に合わせて、人による対応と生成AIによる回答とを提供可能である。また情報処理装置100は、複数の生成AIから問い合わせ内容に応じた生成AIを選択し、問い合わせ内容に応じた回答を発信者に提供する。よって、情報処理装置100は、顧客の問い合わせへの対応において顧客の満足度の低下を抑制できる。 The above describes the information processing device 100. With the above-mentioned configuration, the information processing device 100 can provide both human responses and responses from the generated AI in accordance with the customer's request. The information processing device 100 also selects a generated AI from multiple generated AIs according to the inquiry content, and provides the caller with an answer according to the inquiry content. Thus, the information processing device 100 can suppress a decrease in customer satisfaction in responding to customer inquiries.

(選択情報)
次に、図3を参照して選択情報161について説明する。図3は、選択情報161の内容を示す図である。図3に示す選択情報161は、言語モデルの種類と問い合わせ内容に含まれることが予想される複数のワードとを紐づけた情報である。
(Selection information)
Next, the selection information 161 will be described with reference to Fig. 3. Fig. 3 is a diagram showing the contents of the selection information 161. The selection information 161 shown in Fig. 3 is information that links the type of language model with a plurality of words that are expected to be included in the query content.

具体的には、「第1言語モデル」に紐づく問い合わせのワードは、「スペック」、「仕様」、「ラインナップ」、「使い方」、「何色」、などを含む。この場合、第1言語モデル210は、商品についての問い合わせおよび回答について学習した言語モデルである。「第2言語モデル」に紐づく問い合わせのワードは、「故障」、「壊れ」、「おかしい」、「動かない」、「異常」、などを含む。この場合、第2言語モデル220は、アフターサービスについての問い合わせおよび回答について学習した言語モデルである。 Specifically, inquiry words linked to the "first language model" include "specs," "specifications," "lineup," "how to use," "what color," etc. In this case, the first language model 210 is a language model that has learned about inquiries and responses about products. Inquiry words linked to the "second language model" include "fault," "broken," "strange," "not working," "abnormal," etc. In this case, the second language model 220 is a language model that has learned about inquiries and responses about after-sales service.

回答生成部130は、発信者P1の発話である問い合わせに含まれる言葉に含まれるワードと選択情報161に含まれるワードとを照合する。そして回答生成部130は発信者P1の問い合わせの内容に近いワードを多く含む方を選択する。 The answer generation unit 130 compares the words included in the inquiry uttered by the sender P1 with the words included in the selection information 161. The answer generation unit 130 then selects the one that contains more words that are close to the content of the inquiry from the sender P1.

なお、選択情報161は、上述の内容に限られない。情報処理システム10において、方法選択信号に、生成AIを選択させる内容を含む場合には、選択情報161は例えば、トーン信号の種類と生成AIの種類とを紐づけた情報を含んでもよい。また、選択情報161は、適宜、追加、削除、更新などができるようにしてもよい。 The selection information 161 is not limited to the above. In the information processing system 10, if the method selection signal includes content for selecting a generation AI, the selection information 161 may include, for example, information linking the type of tone signal with the type of generation AI. In addition, the selection information 161 may be able to be added, deleted, updated, etc., as appropriate.

(ハードウェア構成例)
図4は、コンピュータのハードウェア構成を例示するブロック図である。上述した情報処理装置100は、図4に示す構成を有し得る。コンピュータ1000は、バス1010、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060を有する。
(Hardware configuration example)
Fig. 4 is a block diagram illustrating an example of a hardware configuration of a computer. The above-mentioned information processing apparatus 100 may have the configuration shown in Fig. 4. The computer 1000 has a bus 1010, a processor 1020, a memory 1030, a storage device 1040, an input/output interface 1050, and a network interface 1060.

バス1010は、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1020などを互いに接続する方法は、バス接続に限定されない。 The bus 1010 is a data transmission path for the processor 1020, memory 1030, storage device 1040, input/output interface 1050, and network interface 1060 to transmit and receive data to and from each other. However, the method of connecting the processor 1020 and other components to each other is not limited to a bus connection.

プロセッサ1020は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)などの演算装置を含む回路である。 The processor 1020 is a circuit that includes arithmetic devices such as a CPU (Central Processing Unit) and a GPU (Graphics Processing Unit).

メモリ1030は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。 Memory 1030 is a main storage device realized using RAM (Random Access Memory) or the like.

ストレージデバイス1040は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ、又はROM(Read Only Memory)などの補助記憶装置である。ストレージデバイス1040は、本開示の機能を実現するためのプログラムを格納する。 Storage device 1040 is an auxiliary storage device such as a hard disk drive (HDD), a solid state drive (SSD), a flash memory, or a read only memory (ROM). Storage device 1040 stores programs for implementing the functions of the present disclosure.

プロセッサ1020は、このプログラムをメモリ1030に読み出して実行する。これによりプロセッサ1020は、このプログラムに対応する機能を実行する。換言すると、メモリ1030に格納されたプログラムは、コンピュータ1000に本開示の機能を実行させる。 The processor 1020 reads this program into the memory 1030 and executes it. This causes the processor 1020 to execute the function corresponding to this program. In other words, the program stored in the memory 1030 causes the computer 1000 to execute the functions of the present disclosure.

入出力インタフェース1050は、コンピュータ1000と所定の入出力デバイスとを接続する。入出力デバイスは例えば、キーボードなどの入力装置、ディスプレイなどの出力装置、又はディスプレイにタッチパネルが重畳された入出力装置である。 The input/output interface 1050 connects the computer 1000 to a specific input/output device. The input/output device is, for example, an input device such as a keyboard, an output device such as a display, or an input/output device in which a touch panel is superimposed on a display.

ネットワークインタフェース1060は、コンピュータ1000を所定の通信ネットワークに接続するためのインタフェースである。 The network interface 1060 is an interface for connecting the computer 1000 to a specified communication network.

以上、コンピュータ1000について説明したが、コンピュータ1000は、上述の構成に加えて、ユーザが操作をすることにより種々の情報をコンピュータ1000に入力するための情報入力装置を有し得る。情報入力装置は例えばキーボード、マウスまたはタッチパネル等である。またコンピュータ1000は、ユーザに種々の情報を示すためのディスプレイ、スピーカ、振動モータまたはLED(light-emitting diode)などを有していてもよい。 The computer 1000 has been described above, but in addition to the above configuration, the computer 1000 may have an information input device that allows the user to input various information to the computer 1000 through operation. The information input device is, for example, a keyboard, a mouse, or a touch panel. The computer 1000 may also have a display, a speaker, a vibration motor, or an LED (light-emitting diode) for showing various information to the user.

(情報処理方法)
次に、図5を参照して情報処理装置100が実行する処理について説明する。図5は、第1実施形態に係る情報処理方法のフローチャートである。図5において情報処理装置100が実行する処理は例えば、情報処理システム10が発信者端末1からの発信呼を受け付けることにより開始する。
(Information Processing Method)
Next, a process executed by the information processing device 100 will be described with reference to Fig. 5. Fig. 5 is a flowchart of an information processing method according to the first embodiment. The process executed by the information processing device 100 in Fig. 5 starts, for example, when the information processing system 10 accepts an outgoing call from the caller terminal 1.

ステップS11において、情報処理装置100は、通信が確立した発信者端末1に対して受付メッセージを送信する。受付メッセージには、回答方法について選択するための方法選択信号の送信を促すメッセージを含む。受付メッセージは例えば「お電話ありがとうございます。スタッフによる回答をご希望の場合は「1」と「#」を、生成AIによる回答をご希望の場合は「2」と「#」を、押してください。」という内容である。 In step S11, the information processing device 100 transmits a reception message to the caller terminal 1 with which communication has been established. The reception message includes a message prompting the caller to transmit a method selection signal to select a response method. For example, the reception message may say, "Thank you for calling. If you would like to be answered by a staff member, press '1' and '#'. If you would like to be answered by the generating AI, press '2' and '#'."

ステップS12において、受付部110は、発信者端末1から回答方法に関する方法選択信号を受け付ける。受付部110は、受け付けた回答方法に関する情報を、判定部120に供給する。 In step S12, the reception unit 110 receives a method selection signal related to the answering method from the caller terminal 1. The reception unit 110 supplies information related to the received answering method to the determination unit 120.

ステップS13において、判定部120は、方法選択信号に基づいて、発信者P1が生成AIによる回答を要求しているか、人による回答を要求しているかを判定する。より具体的には例えば、判定部120は、発信者P1が生成AIによる回答を要求しているか否かを判定する。発信者P1が生成AIによる回答を要求していると判定部120が判定した場合(ステップS13:YES)、情報処理装置100はステップS14に進む。一方、発信者P1が生成AIによる回答を要求していると判定部120が判定しない場合(ステップS13:NO)、情報処理装置100はステップS20に進む。 In step S13, the determination unit 120 determines whether the caller P1 is requesting a response from the generated AI or a response from a human based on the method selection signal. More specifically, for example, the determination unit 120 determines whether the caller P1 is requesting a response from the generated AI. If the determination unit 120 determines that the caller P1 is requesting a response from the generated AI (step S13: YES), the information processing device 100 proceeds to step S14. On the other hand, if the determination unit 120 does not determine that the caller P1 is requesting a response from the generated AI (step S13: NO), the information processing device 100 proceeds to step S20.

ステップS14において、発信者P1が生成AIによる回答を要求していると判定部120が判定した場合に、回答生成部130は、発信者P1からの問い合わせ内容を要求する。すなわち回答生成部130は、音声データとして例えば「お問い合わせ内容をお話しください」というメッセージを発信者端末1に送信する。 In step S14, if the determination unit 120 determines that the caller P1 is requesting a response from the generation AI, the response generation unit 130 requests the content of the inquiry from the caller P1. That is, the response generation unit 130 transmits a message such as "Please tell us the content of your inquiry" as voice data to the caller terminal 1.

ステップS15において、回答生成部130は発信者P1からの問い合わせを受け付ける。問い合わせを受け付けると、回答生成部130の信号変換部131は、受け付けた問い合わせをテキストデータに変換する。言語モデル選択部133は、テキストデータから、問い合わせを第1言語モデル210に回答させるか、第2言語モデル220に回答させるかを選択する。すなわち言語モデル選択部133は、予め用意しておいた複数の生成AIから一の生成AIを選択する。 In step S15, the answer generation unit 130 accepts an inquiry from the sender P1. Upon accepting the inquiry, the signal conversion unit 131 of the answer generation unit 130 converts the accepted inquiry into text data. The language model selection unit 133 selects, from the text data, whether to have the first language model 210 or the second language model 220 answer the inquiry. In other words, the language model selection unit 133 selects one generation AI from multiple generation AIs prepared in advance.

ステップS16において、プロンプト生成部132は、言語モデル選択部133による選択の結果から回答生成部130は、問い合わせを第1言語モデル210に回答させるか否かを判定する。第1言語モデル210に回答させると回答生成部130が判定した場合(ステップS16:YES)、回答生成部130はステップS17に進む。一方、第1言語モデル210に回答させると回答生成部130が判定しない場合(ステップS16:NO)、回答生成部130はステップS22に進む。 In step S16, the prompt generation unit 132 determines whether or not the answer generation unit 130 should have the first language model 210 answer the inquiry based on the result of the selection by the language model selection unit 133. If the answer generation unit 130 determines that the first language model 210 should answer the inquiry (step S16: YES), the answer generation unit 130 proceeds to step S17. On the other hand, if the answer generation unit 130 does not determine that the first language model 210 should answer the inquiry (step S16: NO), the answer generation unit 130 proceeds to step S22.

ステップS17において、回答生成部130は、選択した生成AIに回答を生成させる。すなわち、回答生成部130のプロンプト生成部132は、第1言語モデル210にプロンプトを送信して問い合わせに対する回答を生成させる。 In step S17, the answer generation unit 130 causes the selected generation AI to generate an answer. That is, the prompt generation unit 132 of the answer generation unit 130 sends a prompt to the first language model 210 to generate an answer to the inquiry.

ステップS18において、回答生成部130は、生成AIが生成した回答を発信者端末1へ送信する。回答生成部130は、第1言語モデル210または第2言語モデル220が生成した回答を音声データに変換し、変換した音声データを発信者端末1に送信する。なお、この処理において、情報処理装置100は発信者端末1に対して、「ご回答した内容でよろしければ電話をお切りください。さらにお問い合わせがある場合は、追加のお問い合わせをお話しください。」という音声データを送信し得る。このような音声データを送信することにより、情報処理装置100は発信者P1が問い合わせの継続を希望する場合に生成AIによる回答を続けることができる。 In step S18, the answer generation unit 130 transmits the answer generated by the generation AI to the caller terminal 1. The answer generation unit 130 converts the answer generated by the first language model 210 or the second language model 220 into voice data, and transmits the converted voice data to the caller terminal 1. In this process, the information processing device 100 may transmit voice data to the caller terminal 1 saying, "If you are satisfied with the answer, please hang up the phone. If you have any further inquiries, please state your additional inquiry." By transmitting such voice data, the information processing device 100 can continue responding using the generation AI if the caller P1 wishes to continue the inquiry.

ステップS19において、情報処理装置100は、一連の処理を終了するか否かを判定する。一連の処理を終了する場合とは例えば、発信者端末1との通信が終了した場合である。一方、一連の処理が終了しない場合とは、発信者端末1との通信が終了しない場合である。一連の処理を終了すると情報処理装置100が判定した場合(ステップS19:YES)、情報処理装置100は一連の処理を終了する。一方、一連の処理を終了すると情報処理装置100が判定しない場合(ステップS19:NO)、情報処理装置100はステップS14に戻り、問い合わせ内容を再び要求する。なお、情報処理装置100は、発信者P1が問い合わせを繰り返す場合に、問い合わせおよび回答の履歴を記録してもよい。またこの場合において、情報処理装置100は、記録した履歴の情報からプロンプトの内容を生成する機能を有していてもよい。これにより、情報処理装置100は、発信者P1が繰り返して問い合わせをする手間を低減させることができる。 In step S19, the information processing device 100 judges whether or not to end the series of processes. The series of processes is ended when, for example, communication with the caller terminal 1 is ended. On the other hand, the series of processes is not ended when communication with the caller terminal 1 is not ended. When the information processing device 100 judges that the series of processes is ended (step S19: YES), the information processing device 100 ends the series of processes. On the other hand, when the information processing device 100 does not judge that the series of processes is ended (step S19: NO), the information processing device 100 returns to step S14 and requests the inquiry content again. Note that when the caller P1 repeats an inquiry, the information processing device 100 may record the history of the inquiry and the answer. In this case, the information processing device 100 may have a function of generating the contents of the prompt from the information of the recorded history. This allows the information processing device 100 to reduce the effort of the caller P1 in repeatedly making inquiries.

ステップS13において、発信者P1が生成AIによる回答を要求していると判定部120が判定しなかった場合(ステップS13:NO)、発信者P1が人による回答を要求していると言える。そのため、ステップS20において、接続処理部140は、発信者端末1とスタッフ端末300とを通話可能に接続する。 In step S13, if the determination unit 120 does not determine that the caller P1 is requesting a response from the generated AI (step S13: NO), it can be said that the caller P1 is requesting a response from a human. Therefore, in step S20, the connection processing unit 140 connects the caller terminal 1 and the staff terminal 300 so that they can communicate with each other.

ステップS21において、接続処理部140は、発信者端末1とスタッフ端末300との通話が終了したか否かを判定する。発信者端末1とスタッフ端末300との通話が終了したと判定しない場合(ステップS21:NO)、接続処理部140はステップS21を繰り返す。一方、発信者端末1とスタッフ端末300との通話が終了したと判定した場合(ステップS21:YES)、情報処理装置100は一連の処理を終了する。 In step S21, the connection processing unit 140 determines whether the call between the caller terminal 1 and the staff terminal 300 has ended. If it is not determined that the call between the caller terminal 1 and the staff terminal 300 has ended (step S21: NO), the connection processing unit 140 repeats step S21. On the other hand, if it is determined that the call between the caller terminal 1 and the staff terminal 300 has ended (step S21: YES), the information processing device 100 ends the series of processes.

ステップS16において、第1言語モデル210に回答させると回答生成部130が判定しない場合(ステップS16:NO)、回答生成部130はステップS22に進む。ステップS22において、回答生成部130は、選択した生成AIに回答を生成させる。すなわち、プロンプト生成部132は、第2言語モデル220にプロンプトを送信して問い合わせに対する回答を生成させる。回答生成部130は、第2言語モデル220に回答を生成させると、ステップS18に進む。 In step S16, if the answer generation unit 130 does not determine that the first language model 210 should be made to answer (step S16: NO), the answer generation unit 130 proceeds to step S22. In step S22, the answer generation unit 130 makes the selected generation AI generate an answer. That is, the prompt generation unit 132 sends a prompt to the second language model 220 to generate an answer to the inquiry. After making the second language model 220 generate an answer, the answer generation unit 130 proceeds to step S18.

以上、情報処理装置100が実行する処理について説明した。上述の処理により、情報処理装置100は、発信者P1の問い合わせ内容を聞き出し、複数の生成AIから問い合わせ内容に応じた生成AIを選択して回答を生成する。よって、情報処理装置100は、顧客の問い合わせへの対応において顧客の満足度の低下を抑制できる。 The above describes the processing executed by the information processing device 100. Through the above processing, the information processing device 100 finds out the contents of the inquiry from the caller P1, selects a generation AI from multiple generation AIs according to the contents of the inquiry, and generates an answer. Therefore, the information processing device 100 can suppress a decrease in customer satisfaction in responding to customer inquiries.

なお、情報処理装置100が実行する処理は上述の構成に限られない。例えばステップS11において、受付部110が送信する受付メッセージは例えば、「スタッフによる回答」、「商品について生成AIによる回答」および「アフターサービスについて生成AIによる回答」の3つの選択を受け付ける内容であってもよい。この場合、情報処理装置100は例えば、商品についての問い合わせを第1言語モデル210に回答させる。第1言語モデル210は、商品についての問い合わせおよび回答について学習した言語モデルである。情報処理装置100は、アフターサービスについての問い合わせを第2言語モデル220に回答させる。第2言語モデル220は、アフターサービスについての問い合わせおよび回答について学習した言語モデルである。 The process executed by the information processing device 100 is not limited to the above-mentioned configuration. For example, in step S11, the reception message sent by the reception unit 110 may be a message that accepts three options: "Answer by staff", "Answer by AI generated about the product", and "Answer by AI generated about after-sales service". In this case, the information processing device 100, for example, causes the first language model 210 to answer inquiries about products. The first language model 210 is a language model that has learned about inquiries and answers about products. The information processing device 100 causes the second language model 220 to answer inquiries about after-sales service. The second language model 220 is a language model that has learned about inquiries and answers about after-sales service.

またステップS11において、受付部110は、スタッフの稼働状態を受付メッセージに含んでもよい。スタッフの稼働状態は、通話可能なスタッフが存在するか否かを示す情報を含み得る。これにより、情報処理装置100は、スタッフP2との通話がすぐに可能か否かの情報を発信者P1に提供できる。よってこの場合、情報処理装置100は、発信者P1が回答方法を選択する際のスムーズな判断を促すことができる。 In addition, in step S11, the reception unit 110 may include the working status of the staff in the reception message. The working status of the staff may include information indicating whether or not there is a staff member available to make a call. This allows the information processing device 100 to provide the caller P1 with information as to whether or not a call with the staff member P2 is immediately possible. Therefore, in this case, the information processing device 100 can encourage the caller P1 to make a smooth decision when selecting a response method.

またステップS19において、一連の処理を終了すると情報処理装置100が判定しない場合(ステップS19:NO)、情報処理装置100はステップS14に代えて、ステップS12に戻り、回答方法を再び受け付ける処理をしてもよい。これにより、情報処理装置100は、発信者P1が生成AIの回答に満足しない場合に、人による回答をする設定に変更できる。 In addition, in step S19, if the information processing device 100 does not determine that the series of processes is to be terminated (step S19: NO), the information processing device 100 may return to step S12 instead of step S14 and perform processing to accept the answering method again. This allows the information processing device 100 to change the setting to a human answer if the sender P1 is not satisfied with the answer of the generated AI.

次に、図6を参照して発信者端末1と情報処理システム10とのやり取りの例を説明する。図6は、第1実施形態に係る情報処理方法の第1のシーケンス図である。図6に示すシーケンス図は、発信者P1が生成AIによる回答を要求した場合における発信者端末1と情報処理システム10とのやりとりを示している。 Next, an example of the interaction between the caller terminal 1 and the information processing system 10 will be described with reference to FIG. 6. FIG. 6 is a first sequence diagram of the information processing method according to the first embodiment. The sequence diagram shown in FIG. 6 shows the interaction between the caller terminal 1 and the information processing system 10 when the caller P1 requests a response from the generation AI.

ステップS101において、発信者端末1は情報処理システム10に発信する。すなわち発信者端末1は情報処理システム10に発呼信号を送信する。情報処理システム10の情報処理装置100は、この信号を受け付けて着信となる。 In step S101, the caller terminal 1 makes a call to the information processing system 10. That is, the caller terminal 1 transmits a call signal to the information processing system 10. The information processing device 100 of the information processing system 10 receives this signal and receives an incoming call.

ステップS102において、情報処理装置100は着信呼を受け付け、受付メッセージを発信者端末1に送信する。受付メッセージは、回答方法の選択を促す内容を含む。 In step S102, the information processing device 100 accepts the incoming call and transmits a reception message to the caller terminal 1. The reception message includes content that prompts the caller to select a response method.

ステップS103において、発信者P1は回答方法を選択する。これにより、発信者端末1は方法選択信号を情報処理装置100に送信する。なお、図6に示すシーケンス図は、発信者P1が生成AIによる回答を選択する。 In step S103, the sender P1 selects a reply method. This causes the sender terminal 1 to transmit a method selection signal to the information processing device 100. Note that in the sequence diagram shown in FIG. 6, the sender P1 selects a reply by the generation AI.

ステップS104において、生成AIによる回答を選択する方法選択信号を受け付けた情報処理装置100は、問い合わせ内容を要求するための応答メッセージを発信者端末1に送信する。 In step S104, the information processing device 100, which has received a method selection signal for selecting an answer by the generation AI, transmits a response message to the caller terminal 1 to request the contents of the inquiry.

ステップS105において、発信者P1は問い合わせ内容を発話する。発信者端末1は、発信者P1が発話した問い合わせ内容を含む音声データを情報処理装置100に送信する。 In step S105, the caller P1 speaks the inquiry. The caller terminal 1 transmits voice data including the inquiry spoken by the caller P1 to the information processing device 100.

ステップS106において、情報処理装置100は、言語モデルを選択する。ここでは一例として、情報処理装置100が第1言語モデル210を選択するものとする。情報処理装置100は第1言語モデル210に回答を生成させるためのプロンプトを生成する。 In step S106, the information processing device 100 selects a language model. As an example, it is assumed here that the information processing device 100 selects the first language model 210. The information processing device 100 generates a prompt to cause the first language model 210 to generate an answer.

ステップS107において、情報処理装置100は、第1言語モデル210に回答を生成することをプロンプトにより指示する。回答を生成する指示には発信者P1が発話した問い合わせ内容を含む。 In step S107, the information processing device 100 prompts the first language model 210 to generate an answer. The instruction to generate an answer includes the inquiry content uttered by the caller P1.

ステップS108において、第1言語モデル210はプロンプトに対する回答を生成して情報処理装置100に供給する。 In step S108, the first language model 210 generates an answer to the prompt and provides it to the information processing device 100.

ステップS109において、情報処理装置100は、第1言語モデル210から受け取った回答から音声データを生成する。あるいは情報処理装置100は、第1言語モデル210が生成した回答を含む回答の文章を生成したうえで、回答の文章を音声データに変換してもよい。 In step S109, the information processing device 100 generates voice data from the answer received from the first language model 210. Alternatively, the information processing device 100 may generate an answer sentence that includes the answer generated by the first language model 210, and then convert the answer sentence into voice data.

ステップS110において、情報処理装置100は、発信者端末1に対して回答を含む音声データを送信する。 In step S110, the information processing device 100 transmits voice data including the response to the caller terminal 1.

次に、図7を参照して発信者端末1と情報処理システム10とのやり取りのもう一つの例を説明する。図7は、第1実施形態に係る情報処理方法の第2のシーケンス図である。図7に示すシーケンス図は、発信者P1が人による回答を要求した場合における発信者端末1と情報処理システム10とのやりとりを示している。なお、ステップS101およびステップS102のやり取りは、図6に示したシーケンス図と同様である。そのため、ここでは説明を省略する。 Next, another example of the interaction between the caller terminal 1 and the information processing system 10 will be described with reference to FIG. 7. FIG. 7 is a second sequence diagram of the information processing method according to the first embodiment. The sequence diagram shown in FIG. 7 shows the interaction between the caller terminal 1 and the information processing system 10 when the caller P1 requests a human response. Note that the interaction in steps S101 and S102 is the same as in the sequence diagram shown in FIG. 6. Therefore, a description thereof will be omitted here.

ステップS103において、発信者P1は回答方法を選択する。これにより、発信者端末1は方法選択信号を情報処理装置100に送信する。図7に示すシーケンス図は、発信者P1が人による回答を選択する。 In step S103, the sender P1 selects a reply method. This causes the sender terminal 1 to transmit a method selection signal to the information processing device 100. In the sequence diagram shown in FIG. 7, the sender P1 selects a human reply.

ステップS201において、人による回答を選択する方法選択信号を受け付けた情報処理装置100は、発信者端末1とスタッフ端末300とを接続する。 In step S201, the information processing device 100 receives a method selection signal for selecting a human response and connects the caller terminal 1 to the staff terminal 300.

ステップS202において、情報処理装置100は、発呼信号をスタッフ端末300に送信する。スタッフ端末300を使用するスタッフP2は、情報処理装置100が送信する発呼信号を受けて、スタッフ端末300を通信可能な状態にセットする。以降は、発信者端末1とスタッフ端末300とが通話可能状態となる。 In step S202, the information processing device 100 transmits a call signal to the staff terminal 300. Staff member P2, who uses the staff terminal 300, receives the call signal transmitted by the information processing device 100 and sets the staff terminal 300 to a state in which communication is possible. After this, the caller terminal 1 and the staff terminal 300 are in a state in which communication is possible.

以上、発信者端末1と情報処理システム10とのやりとりについて説明した。上述の通り、情報処理システム10は、発信者端末1から送られる方法選択信号に応じて、言語モデルによる回答または人による回答を適宜設定する。また情報処理システム10は、生成AIによる回答を選択された場合には、複数の生成AIから一の生成AIを選択して回答を生成させる。 The above describes the interaction between the caller terminal 1 and the information processing system 10. As described above, the information processing system 10 appropriately sets an answer based on a language model or an answer by a person in response to a method selection signal sent from the caller terminal 1. Furthermore, when an answer based on a generation AI is selected, the information processing system 10 selects one generation AI from multiple generation AIs to generate an answer.

以上、第1実施形態について説明した。なお、情報処理システム10は上述の構成に限られない。情報処理装置100は、複数の発信者端末1と接続し得る。なお接続可能な回線数は予め設定されていてもよい。また情報処理システム10は、複数のスタッフ端末300を含み得る。この場合、通信部150は、複数のスタッフ端末300のそれぞれの接続状況を認識し、接続状況に応じて発信者端末1との接続を行う。上述の構成により、情報処理装置100は、問い合わせの件数に対してスタッフの数が少ない場合であっても、生成AIによる対応が可能となる。 The first embodiment has been described above. Note that the information processing system 10 is not limited to the above-mentioned configuration. The information processing device 100 can be connected to multiple caller terminals 1. Note that the number of lines that can be connected may be set in advance. The information processing system 10 can also include multiple staff terminals 300. In this case, the communication unit 150 recognizes the connection status of each of the multiple staff terminals 300, and connects to the caller terminal 1 according to the connection status. With the above-mentioned configuration, the information processing device 100 can respond using the generation AI even when the number of staff is small compared to the number of inquiries.

サーバ200が有する生成AIはマルチモーダル対応であってもよい。この場合、回答生成部130は、発信者P1の問い合わせを含む音声データを、テキストデータに変換せずにサーバ200に供給してもよい。また生成AIが音声データにより回答を出力する場合には、回答生成部130は、生成AIが出力した音声データを、発信者端末1に送信してもよい。 The generation AI of the server 200 may be multimodal compatible. In this case, the answer generation unit 130 may supply the voice data including the inquiry of the caller P1 to the server 200 without converting it into text data. In addition, when the generation AI outputs an answer using voice data, the answer generation unit 130 may transmit the voice data output by the generation AI to the caller terminal 1.

以上、情報処理システム10および情報処理装置100について説明した。情報処理装置100が有する各構成は、それぞれが専用のハードウェアで実現されていてもよい。また、各構成要素の一部又は全部は、汎用または専用の回路(circuitry)、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。また、プロセッサとして、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)等を用いることができる。また、本実施形態の機能の少なくとも一部が、IaaS(Infrastructure as a Service)、PaaS(Platform as a Service)またはSaaS(Software as a Service)等の形式で提供されてもよい。 The information processing system 10 and the information processing device 100 have been described above. Each component of the information processing device 100 may be realized by dedicated hardware. In addition, a part or all of each component may be realized by a general-purpose or dedicated circuit, processor, etc., or a combination of these. These may be configured by a single chip, or may be configured by multiple chips connected via a bus. A part or all of each component may be realized by a combination of the above-mentioned circuits, etc., and a program. In addition, a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), an FPGA (field-programmable gate array), etc. may be used as a processor. In addition, at least a part of the functions of this embodiment may be provided in the form of IaaS (Infrastructure as a Service), PaaS (Platform as a Service), SaaS (Software as a Service), etc.

以上のとおり、本実施形態は、顧客の問い合わせへの対応において顧客の満足度の低下を抑制できる情報処理装置100、情報処理方法およびプログラムを提供できる。 As described above, this embodiment can provide an information processing device 100, an information processing method, and a program that can suppress a decrease in customer satisfaction when responding to customer inquiries.

<第2実施形態>
続いて第2実施形態について説明する。図8は、第2実施形態に係る情報処理システム10のブロック図である。本実施形態に係る情報処理システム10は、参照情報格納部400を有している点が、第1実施形態の情報処理システム10と異なる。また本実施形態に係る情報処理システム10は、第1ネットワークN1に加えて第2ネットワークN2にも通話可能に接続する点が、第1実施形態の情報処理システム10と異なる。
Second Embodiment
Next, a second embodiment will be described. Fig. 8 is a block diagram of an information processing system 10 according to the second embodiment. The information processing system 10 according to this embodiment differs from the information processing system 10 according to the first embodiment in that it has a reference information storage unit 400. The information processing system 10 according to this embodiment also differs from the information processing system 10 according to the first embodiment in that it is connected to the second network N2 in addition to the first network N1 so as to be able to make calls.

第2実施形態に係る情報処理装置100は、第1ネットワークN1に加えて第2ネットワークN2に接続する。第1ネットワークN1は、固定電話または携帯電話のための公衆通信ネットワークである。一方、第2ネットワークN2は例えば、インターネット回線である。すなわち情報処理装置100は、発信者端末1と通話可能に接続することができ、さらに、通話以外の情報通信手段により、発信者端末1との通信が可能である。より具体的には例えば情報処理装置100は、テキストデータ、画像データなど、任意のデータによる情報伝達が可能である。 The information processing device 100 according to the second embodiment is connected to a second network N2 in addition to a first network N1. The first network N1 is a public communications network for landlines or mobile phones. On the other hand, the second network N2 is, for example, an Internet line. That is, the information processing device 100 can be connected to a caller terminal 1 so as to be able to make a call, and can also communicate with the caller terminal 1 by information communication means other than calls. More specifically, for example, the information processing device 100 can transmit information by any data, such as text data, image data, etc.

第2実施形態に係る情報処理装置100は、参照情報格納部400と通信可能に接続する。参照情報格納部400は、発信者P1からの問い合わせに関する情報を格納する。例えば、発信者P1から所定の商品に関する問い合わせを受けることが想定される場合において、参照情報格納部400は、問い合わせを受ける商品に関する情報を格納する。参照情報格納部400は、格納する情報を情報処理装置100に提供可能である。情報処理装置100は、発信者P1から受け付けた問い合わせを第1言語モデル210または第2言語モデル220に回答させる際に、参照情報格納部400の情報を参照してプロンプトを生成できる。すなわち、情報処理装置100は、RAG機能(Retrieval-Augmented Generation)を有している。なお、情報処理装置100と参照情報格納部400とは一体となった構成であってもよい。すなわち、情報処理装置100は、参照情報格納部400を含む構成であってもよい。 The information processing device 100 according to the second embodiment is communicatively connected to the reference information storage unit 400. The reference information storage unit 400 stores information related to an inquiry from the sender P1. For example, in a case where it is expected that the sender P1 will make an inquiry about a specific product, the reference information storage unit 400 stores information related to the product about which the inquiry is made. The reference information storage unit 400 can provide the stored information to the information processing device 100. When the information processing device 100 has the first language model 210 or the second language model 220 respond to the inquiry received from the sender P1, the information processing device 100 can generate a prompt by referring to the information in the reference information storage unit 400. That is, the information processing device 100 has a RAG function (Retrieval-Augmented Generation). Note that the information processing device 100 and the reference information storage unit 400 may be configured as an integrated unit. That is, the information processing device 100 may include the reference information storage unit 400.

図9は、第2実施形態に係る情報処理装置のブロック図である。本実施形態に係る情報処理装置100は主には、受付部110、回答生成部130、接続処理部140および記憶部160の構成が、第1実施形態に係る情報処理装置100と異なる。 Figure 9 is a block diagram of an information processing device according to the second embodiment. The information processing device 100 according to this embodiment differs from the information processing device 100 according to the first embodiment mainly in the configurations of the reception unit 110, the response generation unit 130, the connection processing unit 140, and the storage unit 160.

本実施形態に係る受付部110は、発信者P1に対して顧客を特定するための確認を行う。顧客を特定する目的は、発信者P1の問い合わせに対する回答を、テキストデータとして発信者端末1に送信するためである。情報処理システム10は、第1ネットワークN1および第2ネットワークN2を介して、発信者端末1または発信者P1の認証を行ってもよい。すなわち受付部110は発信者P1を認証する機能を有していてもよい。 The reception unit 110 in this embodiment performs confirmation for the caller P1 to identify the customer. The purpose of identifying the customer is to send a response to the caller P1's inquiry to the caller terminal 1 as text data. The information processing system 10 may authenticate the caller terminal 1 or the caller P1 via the first network N1 and the second network N2. That is, the reception unit 110 may have a function of authenticating the caller P1.

本実施形態に係る回答生成部130は検索機能部134を有している。検索機能部134は、RAG機能を実現するための構成である。検索機能部134は、発信者P1の問い合わせの内容を参照し、問い合わせの内容に関連する情報を参照情報格納部400から抽出し、抽出した情報をプロンプト生成部132に供給する。プロンプト生成部132は、発信者P1の問い合わせの内容に加えて検索機能部134から受け取った参照情報を含むプロンプトを生成する。すなわち回答生成部130は、問い合わせに関連する情報について所定のデータベースを検索し、検索した結果を用いてプロンプトを生成する。これによりサーバ200が有する第1言語モデル210または第2言語モデル220は、参照情報を参照したうえで問い合わせに対する回答を生成する。 The answer generation unit 130 according to this embodiment has a search function unit 134. The search function unit 134 is configured to realize the RAG function. The search function unit 134 refers to the contents of the inquiry of the sender P1, extracts information related to the contents of the inquiry from the reference information storage unit 400, and supplies the extracted information to the prompt generation unit 132. The prompt generation unit 132 generates a prompt including the reference information received from the search function unit 134 in addition to the contents of the inquiry of the sender P1. That is, the answer generation unit 130 searches a specified database for information related to the inquiry and generates a prompt using the search results. As a result, the first language model 210 or the second language model 220 of the server 200 generates an answer to the inquiry by referring to the reference information.

本実施形態に係る回答生成部130は、第2ネットワークN2を介して発信者端末1にテキストデータを送信する。このとき回答生成部130は、記憶部160が格納する顧客情報162を参照し、発信者P1の個人情報から発信者P1にテキストデータを送信する手段を特定する。発信者P1にテキストデータを送信する手段は例えば電子メールアドレスである。発信者P1の電子メールアドレスは、発信者P1が発話することによって情報処理装置100が取得する音声データに含まれるものであってもよい。発信者P1にテキストデータを送信する手段は、所定のSNSにおける発信者P1のアカウント情報であってもよい。回答生成部130が発信者端末1にテキストデータを送信することにより、情報処理システム10は、音声データでメッセージを伝えるとともに、テキストデータでも発信者P1にメッセージを伝えることができる。回答生成部130が送信するテキストデータは、回答を生成した言語モデルの種類に関する情報を含んでいてもよい。そのため、情報処理システム10は顧客満足度の高い対応が可能となる。 The answer generation unit 130 according to the present embodiment transmits text data to the sender terminal 1 via the second network N2. At this time, the answer generation unit 130 refers to the customer information 162 stored in the storage unit 160 and identifies the means for transmitting the text data to the sender P1 from the personal information of the sender P1. The means for transmitting the text data to the sender P1 is, for example, an email address. The email address of the sender P1 may be included in the voice data acquired by the information processing device 100 by the sender P1 speaking. The means for transmitting the text data to the sender P1 may be the account information of the sender P1 in a specified SNS. By the answer generation unit 130 transmitting the text data to the sender terminal 1, the information processing system 10 can convey a message to the sender P1 by voice data as well as by text data. The text data transmitted by the answer generation unit 130 may include information regarding the type of language model that generated the answer. Therefore, the information processing system 10 can respond with high customer satisfaction.

本実施形態に係る記憶部160は、顧客情報162を有している。顧客情報162は、顧客の固有識別子および顧客への連絡手段に関する情報を含む。 The memory unit 160 in this embodiment has customer information 162. The customer information 162 includes a unique identifier for the customer and information regarding a means of contacting the customer.

次に、図10を参照して、発信者端末1と情報処理システム10とのやりとりについて説明する。図10は、第2実施形態に係る情報処理方法のシーケンス図である。図10に示すシーケンス図は、ステップS108より後の処理が、図6のシーケンス図と異なる。 Next, with reference to FIG. 10, the exchange between the caller terminal 1 and the information processing system 10 will be described. FIG. 10 is a sequence diagram of the information processing method according to the second embodiment. The sequence diagram shown in FIG. 10 differs from the sequence diagram in FIG. 6 in the processing after step S108.

ステップS108において第1言語モデル210から回答を受け取った後、ステップS301において、情報処理装置100は、回答の音声データおよびテキストデータを生成する。音声データは、第1ネットワークN1を介して発信者端末1に送信するためのデータである。テキストデータは、第2ネットワークN2を介して発信者端末1に送信するためのデータである。なお、音声データの内容とテキストデータの内容は同じであってもよいし、異なる部分があってもよい。例えばテキストデータは、音声データよりも詳細な情報を含むものであってもよい。テキストデータは、回答に関連する所定のURL(Uniform Resource Locator)を含むものであってもよい。また音声データは、テキストデータとの違いを説明する内容を含んでもよい。これにより、情報処理装置100は、顧客へより丁寧な回答を提供できる。 After receiving the answer from the first language model 210 in step S108, the information processing device 100 generates voice data and text data of the answer in step S301. The voice data is data to be transmitted to the caller terminal 1 via the first network N1. The text data is data to be transmitted to the caller terminal 1 via the second network N2. The content of the voice data and the content of the text data may be the same, or may differ in some parts. For example, the text data may include more detailed information than the voice data. The text data may include a specified URL (Uniform Resource Locator) related to the answer. The voice data may also include content explaining the difference from the text data. This allows the information processing device 100 to provide a more polite answer to the customer.

ステップS302において、情報処理システム10は第1ネットワークN1を介して、回答に関する音声データを発信者端末1に送信する。 In step S302, the information processing system 10 transmits voice data regarding the response to the caller terminal 1 via the first network N1.

ステップS303において、情報処理システム10は第2ネットワークN2を介して、回答に関するテキストデータを発信者端末1に送信する。すなわち、情報処理装置100の回答生成部130は、生成AIが生成した回答をテキストデータとして発信者端末1へ送信する。 In step S303, the information processing system 10 transmits text data regarding the answer to the sender terminal 1 via the second network N2. That is, the answer generation unit 130 of the information processing device 100 transmits the answer generated by the generation AI to the sender terminal 1 as text data.

以上、第2実施形態について説明した。本実施形態は、顧客の問い合わせへの対応において、RAG機能を用いることにより、詳細な回答を迅速に提供できる。また本実施形態は、音声データに加えてテキストデータによる回答が可能である。これにより、本実施形態は、顧客満足度が高い情報処理装置100、情報処理方法およびプログラムを提供できる。 The second embodiment has been described above. In this embodiment, by using the RAG function in responding to customer inquiries, detailed responses can be provided quickly. This embodiment also allows responses to be provided using text data in addition to voice data. As a result, this embodiment can provide an information processing device 100, information processing method, and program that provide high customer satisfaction.

上述のプログラムは、コンピュータに読み込まれた場合に、実施形態で説明された1又はそれ以上の機能をコンピュータに行わせるための命令群(又はソフトウェアコード)を含む。プログラムは、非一時的なコンピュータ可読媒体又は実体のある記憶媒体に格納されてもよい。限定ではなく例として、コンピュータ可読媒体又は実体のある記憶媒体は、RAM(random-access memory)、ROM(read-only memory)、フラッシュメモリ、SSD(solid-state drive)又はその他のメモリ技術を含む。コンピュータ可読媒体又は実体のある記憶媒体は、CD-ROM、DVD(digital versatile disc)、ブルーレイディスク又はその他の光ディスクストレージを含む。コンピュータ可読媒体又は実体のある記憶媒体は、磁気テープ、磁気ディスクストレージ又はその他の磁気ストレージデバイスを含む。プログラムは、一時的なコンピュータ可読媒体又は通信媒体上で送信されてもよい。限定ではなく例として、一時的なコンピュータ可読媒体又は通信媒体は、電気的、光学的、音響的、またはその他の形式の伝搬信号を含む。 The above-mentioned program includes a set of instructions (or software code) that, when loaded into a computer, causes the computer to perform one or more functions described in the embodiments. The program may be stored on a non-transitory computer-readable medium or a tangible storage medium. By way of example and not limitation, the computer-readable medium or tangible storage medium includes random-access memory (RAM), read-only memory (ROM), flash memory, solid-state drive (SSD) or other memory technology. The computer-readable medium or tangible storage medium includes CD-ROM, digital versatile disc (DVD), Blu-ray disc or other optical disk storage. The computer-readable medium or tangible storage medium includes magnetic tape, magnetic disk storage or other magnetic storage devices. The program may be transmitted on a transitory computer-readable medium or communication medium. By way of example and not limitation, the transitory computer-readable medium or communication medium includes electrical, optical, acoustic or other forms of propagating signals.

以上、実施形態について述べたが、上述した実施形態の構成は、互いに組み合わせたり、一部の構成を他の構成に入れ替えたりしてもよい。また、上述した実施形態の構成は、趣旨を逸脱しない範囲内において種々の変更を加えてもよい。 Although the embodiments have been described above, the configurations of the above-mentioned embodiments may be combined with each other, or some of the configurations may be replaced with other configurations. Furthermore, the configurations of the above-mentioned embodiments may be modified in various ways without departing from the spirit of the invention.

各図面は、1又はそれ以上の実施形態を説明するための単なる例示である。各図面は、1つの特定の実施形態のみに関連付けられるのではなく、1又はそれ以上の他の実施形態に関連付けられてもよい。当業者であれば理解できるように、いずれか1つの図面を参照して説明される様々な特徴又はステップは、例えば明示的に図示または説明されていない実施形態を作り出すために、1又はそれ以上の他の図に示された特徴又はステップと組み合わせることができる。例示的な実施形態を説明するためにいずれか1つの図に示された特徴またはステップのすべてが必ずしも必須ではなく、一部の特徴またはステップが省略されてもよい。いずれかの図に記載されたステップの順序は、適宜変更されてもよい。 Each drawing is merely an example for describing one or more embodiments. Each drawing may relate not only to one particular embodiment, but also to one or more other embodiments. As will be appreciated by those skilled in the art, various features or steps described with reference to any one drawing may be combined with features or steps shown in one or more other figures to create, for example, an embodiment not explicitly shown or described. Not all features or steps shown in any one drawing are necessary to describe an exemplary embodiment, and some features or steps may be omitted. The order of steps described in any drawing may be changed as appropriate.

1 発信者端末
10 情報処理システム
100 情報処理装置
110 受付部
120 判定部
130 回答生成部
131 信号変換部
132 プロンプト生成部
133 言語モデル選択部
134 検索機能部
140 接続処理部
150 通信部
160 記憶部
161 選択情報
162 顧客情報
200 サーバ
210 第1言語モデル
220 第2言語モデル
300 スタッフ端末
400 参照情報格納部
1000 コンピュータ
1010 バス
1020 プロセッサ
1030 メモリ
1040 ストレージデバイス
1050 入出力インタフェース
1060 ネットワークインタフェース
N1 第1ネットワーク
N2 第2ネットワーク
P1 発信者
P2 スタッフ
REFERENCE SIGNS LIST 1 Caller terminal 10 Information processing system 100 Information processing device 110 Reception unit 120 Determination unit 130 Answer generation unit 131 Signal conversion unit 132 Prompt generation unit 133 Language model selection unit 134 Search function unit 140 Connection processing unit 150 Communication unit 160 Storage unit 161 Selection information 162 Customer information 200 Server 210 First language model 220 Second language model 300 Staff terminal 400 Reference information storage unit 1000 Computer 1010 Bus 1020 Processor 1030 Memory 1040 Storage device 1050 Input/output interface 1060 Network interface N1 First network N2 Second network P1 Caller P2 Staff

Claims (9)

発信者端末から回答方法に関する方法選択信号を受け付ける受付部と、
前記方法選択信号に基づいて、発信者が生成的人工知能による回答を要求しているか、人による前記回答を要求しているかを判定する判定部と、
前記発信者が前記生成的人工知能による前記回答を要求していると判定した場合には、前記発信者からの問い合わせを受け付け、予め用意しておいた複数の生成的人工知能から一の生成的人工知能を選択し、選択した前記生成的人工知能に前記回答を生成させ、前記生成的人工知能が生成した前記回答を前記発信者端末へ送信する回答生成部と、
前記発信者が人による前記回答を要求していると判定した場合には、前記発信者端末とスタッフ端末とを通話可能に接続する接続処理部と、を備え
前記回答生成部は、前記発信者の発話である前記問い合わせに含まれる言葉の内容と、複数の前記生成的人工知能の種類と前記問い合わせ内容に含まれることが予想される複数のワードとを紐づけた選択情報と、に基づいて、一の前記生成的人工知能を選択する、
情報処理装置。
a reception unit for receiving a method selection signal regarding a reply method from a caller terminal;
A determination unit that determines whether the sender is requesting a response by a generative artificial intelligence or a human based on the method selection signal;
an answer generation unit that, when it is determined that the caller requests the answer from the generative artificial intelligence, accepts an inquiry from the caller, selects one generative artificial intelligence from a plurality of generative artificial intelligences prepared in advance, causes the selected generative artificial intelligence to generate the answer, and transmits the answer generated by the generative artificial intelligence to the caller terminal;
a connection processing unit that connects the caller terminal and a staff terminal so that they can communicate with each other when it is determined that the caller has requested a human response ;
The answer generation unit selects one of the generative artificial intelligences based on the content of words included in the inquiry uttered by the sender and selection information linking the types of the generative artificial intelligences with a plurality of words expected to be included in the inquiry content.
Information processing device.
請求項1に記載の情報処理装置において、
前記回答生成部は、前記発信者端末の電話機能におけるトーン信号または前記発信者の発話による音声データである前記方法選択信号に基づいて、一の前記生成的人工知能を選択する、
情報処理装置。
2. The information processing device according to claim 1,
The answer generation unit selects one of the generative artificial intelligences based on the method selection signal, which is a tone signal in a telephone function of the caller terminal or voice data uttered by the caller.
Information processing device.
請求項1に記載の情報処理装置において、
前記回答生成部は、第1ネットワークを介して前記発信者端末に送信するためのデータである音声データと、前記第1ネットワークとは異なる第2ネットワークを介して前記発信者端末1に送信するためのデータであるテキストデータと、を前記発信者端末へ送信する、
情報処理装置。
2. The information processing device according to claim 1,
the answer generation unit transmits to the caller terminal voice data, which is data to be transmitted to the caller terminal via a first network, and text data, which is data to be transmitted to the caller terminal 1 via a second network different from the first network;
Information processing device.
請求項1に記載の情報処理装置において、
前記回答生成部は、前記生成的人工知能が生成した前記回答をテキストデータとして前記発信者端末へ送信する、
情報処理装置。
2. The information processing device according to claim 1,
The answer generation unit transmits the answer generated by the generative artificial intelligence to the caller terminal as text data.
Information processing device.
請求項1に記載の情報処理装置において、
前記回答生成部は、前記生成的人工知能が生成した前記回答を音声データに変換して前記発信者端末へ送信した後に、前記発信者の応答に応じて、再び前記発信者からの問い合わせを受け付ける、
情報処理装置。
2. The information processing device according to claim 1,
The answer generation unit converts the answer generated by the generative artificial intelligence into voice data and transmits it to the caller terminal, and then accepts an inquiry from the caller again in response to the caller's response.
Information processing device.
請求項1~5のいずれか一項に記載の情報処理装置において、
前記回答生成部は、前記発信者の発話である前記問い合わせをテキストに変換し、変換したテキストに基づいて一の前記生成的人工知能に前記回答を生成させるためのプロンプトを生成する、
情報処理装置。
In the information processing device according to any one of claims 1 to 5,
The answer generation unit converts the inquiry, which is an utterance of the caller, into text, and generates a prompt for causing one of the generative artificial intelligences to generate the answer based on the converted text.
Information processing device.
請求項6に記載の情報処理装置は、
前記回答生成部は、前記問い合わせに関連する情報について所定のデータベースを検索し、検索した結果を用いて前記プロンプトを生成する、
情報処理装置。
The information processing device according to claim 6 further comprises:
the answer generation unit searches a predetermined database for information related to the inquiry, and generates the prompt using the search results.
Information processing device.
コンピュータが、
発信者端末から回答方法に関する方法選択信号を受け付け、
前記方法選択信号に基づいて、発信者が生成的人工知能による回答を要求しているか、人による前記回答を要求しているかを判定し、
前記発信者が前記生成的人工知能による前記回答を要求していると判定した場合には、前記発信者からの問い合わせを受け付け、予め用意しておいた複数の生成的人工知能から一の生成的人工知能を選択し、選択した前記生成的人工知能に前記回答を生成させ、前記生成的人工知能が生成した前記回答を前記発信者端末へ送信し、
前記発信者が人による前記回答を要求していると判定した場合には、前記発信者端末とスタッフ端末とを通話可能に接続する、
情報処理方法であって、
前記発信者の発話である前記問い合わせに含まれる言葉の内容と、複数の前記生成的人工知能の種類と前記問い合わせ内容に含まれることが予想される複数のワードとを紐づけた選択情報と、に基づいて、一の前記生成的人工知能を選択する、
情報処理方法。
The computer
receiving a method selection signal regarding the answering method from the caller terminal;
determining whether the caller is requesting a generative artificial intelligence response or a human response based on the method selection signal;
When it is determined that the caller has requested the answer from the generative artificial intelligence, the method accepts an inquiry from the caller, selects one generative artificial intelligence from a plurality of generative artificial intelligences prepared in advance, causes the selected generative artificial intelligence to generate the answer, and transmits the answer generated by the generative artificial intelligence to the caller terminal;
when it is determined that the caller has requested the answer by a person, the caller terminal and the staff terminal are connected so as to be able to communicate with each other;
1. An information processing method , comprising:
Selecting one of the generative artificial intelligences based on the content of words included in the inquiry, which is the utterance of the sender, and selection information linking a plurality of types of the generative artificial intelligences with a plurality of words expected to be included in the content of the inquiry.
Information processing methods.
発信者端末から回答方法に関する方法選択信号を受け付け、
前記方法選択信号に基づいて、発信者が生成的人工知能による回答を要求しているか、人による前記回答を要求しているかを判定し、
前記発信者が前記生成的人工知能による前記回答を要求していると判定した場合には、前記発信者からの問い合わせを受け付け、予め用意しておいた複数の生成的人工知能から一の生成的人工知能を選択し、選択した前記生成的人工知能に前記回答を生成させ、前記生成的人工知能が生成した前記回答を前記発信者端末へ送信し、
前記発信者が人による前記回答を要求していると判定した場合には、前記発信者端末とスタッフ端末とを通話可能に接続する、
情報処理方法であって、
前記発信者の発話である前記問い合わせに含まれる言葉の内容と、複数の前記生成的人工知能の種類と前記問い合わせ内容に含まれることが予想される複数のワードとを紐づけた選択情報と、に基づいて、一の前記生成的人工知能を選択する、
情報処理方法をコンピュータに実行させる、
プログラム。
receiving a method selection signal regarding the answering method from the caller terminal;
determining whether the caller is requesting a generative artificial intelligence response or a human response based on the method selection signal;
When it is determined that the caller has requested the answer from the generative artificial intelligence, the method accepts an inquiry from the caller, selects one generative artificial intelligence from a plurality of generative artificial intelligences prepared in advance, causes the selected generative artificial intelligence to generate the answer, and transmits the answer generated by the generative artificial intelligence to the caller terminal;
when it is determined that the caller has requested the answer by a person, the caller terminal and the staff terminal are connected so as to be able to communicate with each other;
1. An information processing method, comprising:
Selecting one of the generative artificial intelligences based on the content of words included in the inquiry, which is the utterance of the sender, and selection information linking a plurality of types of the generative artificial intelligences with a plurality of words expected to be included in the content of the inquiry.
Making a computer execute an information processing method;
program.
JP2024232738A 2024-12-27 2024-12-27 Information processing device, information processing method, and program Active JP7655691B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024232738A JP7655691B1 (en) 2024-12-27 2024-12-27 Information processing device, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2024232738A JP7655691B1 (en) 2024-12-27 2024-12-27 Information processing device, information processing method, and program

Publications (1)

Publication Number Publication Date
JP7655691B1 true JP7655691B1 (en) 2025-04-02

Family

ID=95198726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024232738A Active JP7655691B1 (en) 2024-12-27 2024-12-27 Information processing device, information processing method, and program

Country Status (1)

Country Link
JP (1) JP7655691B1 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018207143A (en) * 2017-05-30 2018-12-27 沖電気工業株式会社 Customer service system, customer service method, customer service device, and program
JP2019047170A (en) * 2017-08-29 2019-03-22 沖電気工業株式会社 Call center system, call center device, interaction method, and program therefor, comprising customer complaint detection function
JP2019159880A (en) * 2018-03-14 2019-09-19 Kddi株式会社 Answering device, answering method, answering program and answering system
JP2021182387A (en) * 2020-05-18 2021-11-25 アバイア マネジメント エル.ピー. Variable chat box
JP2022109340A (en) * 2021-01-14 2022-07-28 株式会社サテライトオフィス Operator system, operator system program
JP2023073412A (en) * 2019-09-27 2023-05-25 Tradfit株式会社 Information provision method, information provision system, information provision device, and computer program
JP2024101561A (en) * 2023-01-17 2024-07-29 アップセルテクノロジィーズ株式会社 Query response system, query response device, query response method and query response program, and program generation system and program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018207143A (en) * 2017-05-30 2018-12-27 沖電気工業株式会社 Customer service system, customer service method, customer service device, and program
JP2019047170A (en) * 2017-08-29 2019-03-22 沖電気工業株式会社 Call center system, call center device, interaction method, and program therefor, comprising customer complaint detection function
JP2019159880A (en) * 2018-03-14 2019-09-19 Kddi株式会社 Answering device, answering method, answering program and answering system
JP2023073412A (en) * 2019-09-27 2023-05-25 Tradfit株式会社 Information provision method, information provision system, information provision device, and computer program
JP2021182387A (en) * 2020-05-18 2021-11-25 アバイア マネジメント エル.ピー. Variable chat box
JP2022109340A (en) * 2021-01-14 2022-07-28 株式会社サテライトオフィス Operator system, operator system program
JP2024101561A (en) * 2023-01-17 2024-07-29 アップセルテクノロジィーズ株式会社 Query response system, query response device, query response method and query response program, and program generation system and program

Similar Documents

Publication Publication Date Title
EP3138272B1 (en) Voice call diversion to alternate communication method
US8775188B2 (en) Method, device, and system for voice approval
US20130226579A1 (en) Systems and methods for interactively accessing hosted services using voice communications
US8724779B2 (en) Persisting customer identity validation during agent-to-agent transfers in call center transactions
US9167090B2 (en) Public safety answering point language detection
EP3785134A1 (en) System and method for providing a response to a user query using a visual assistant
US9247055B2 (en) Interactive voice response (IVR) routing system
JP6452165B2 (en) Inquiry support device, system, method and program
US20220309251A1 (en) Automated outcome classification systems in contact interactions, and methods
CN109120804B (en) Outbound system based on response information identification
JP2023532247A (en) Incoming call control based on call setup
JPWO2015083741A1 (en) Relay device, display device, and communication system
JP7655691B1 (en) Information processing device, information processing method, and program
US20100299178A1 (en) Method and system for contacting a prospect or requestor immediately after a request for product information
US9042523B2 (en) Modifying voice messages stored in a voicemail system
CN113905137A (en) Call method and device, and storage medium
CN113472957B (en) Call processing method, device, medium and electronic equipment
CN117834778A (en) IVVR-based telephone call replacing method and device, electronic equipment and storage medium
JP6568462B2 (en) Information presenting apparatus, information presenting method, and program
JP6669374B1 (en) Setting device, setting method and setting program
JP2005292476A (en) Customer service method and apparatus
CN113472950A (en) Automatic response method, system and electronic equipment
US20250317518A1 (en) Systems and methods for multimodal conversation support at a contact center
CN113934826B (en) Question-answering session processing method, question-answering system, electronic device and storage medium
JP4813798B2 (en) Method for processing network audio data and apparatus for performing the method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250109

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20250109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250306

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250320

R150 Certificate of patent or registration of utility model

Ref document number: 7655691

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150