KR102241532B1 - Intelligent callbot server and unmanned counsel systeim using thereof - Google Patents
Intelligent callbot server and unmanned counsel systeim using thereof Download PDFInfo
- Publication number
- KR102241532B1 KR102241532B1 KR1020210006362A KR20210006362A KR102241532B1 KR 102241532 B1 KR102241532 B1 KR 102241532B1 KR 1020210006362 A KR1020210006362 A KR 1020210006362A KR 20210006362 A KR20210006362 A KR 20210006362A KR 102241532 B1 KR102241532 B1 KR 102241532B1
- Authority
- KR
- South Korea
- Prior art keywords
- server
- stt
- customer
- call
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5166—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Telephonic Communication Services (AREA)
Abstract
본 발명의 일실시예에 따른 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법은, 고객 음성을 STT 서버를 통하여 수신 텍스트로 변환하고, 수신 텍스트의 분석 결과를 기초로 음성 인식률을 향상시킬 수 있는 STT 서버의 유형을 결정하고, 상기 결정된 STT 서버의 유형에 따라 상기 STT 서버 중 최적의 STT 서버를 연결하여 음성 인식을 수행할 수 있다. 이때, 고객의 발화 형태, 발화 주제, 발화 의도 중 어느 하나를 이용하여 최적의 STT 서버를 결정할 수 있다.The intelligent call bot server and the unmanned counseling method using the same according to an embodiment of the present invention is a STT server capable of converting a customer's voice into a received text through an STT server and improving the speech recognition rate based on the analysis result of the received text. The type may be determined, and voice recognition may be performed by connecting an optimal STT server among the STT servers according to the determined type of the STT server. At this time, the optimal STT server may be determined using any one of the customer's speech type, speech topic, and speech intention.
Description
본 발명은 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법에 관한 것으로, 보다 상세하게는 콜센터 서비스에 접속하는 고객에 대하여 무인으로 상담을 진행할 수 있도록 하는 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법에 관한 것이다.The present invention relates to an intelligent call bot server and an unmanned counseling method using the same, and more particularly, to an intelligent call bot server that enables unmanned counseling for a customer accessing a call center service, and an unmanned counseling method using the same.
일반적으로 제조 업체, 서비스 제공 업체 등 많은 회사들은 자신이 판매하는 제품 또는 제공하는 서비스에 대한 고객 서비스를 제공하기 위해 콜센터와 같은 고객 센터를 운영하고 있다.In general, many companies, such as manufacturers and service providers, operate customer centers such as call centers to provide customer service for products they sell or services they provide.
종래의 콜센터는 음성 안내 시스템을 이용하여 고객과 상담사를 연결하여 고객으로부터 상담 내용을 접수 받고, 상담사는 접수된 상담 내용을 직접 전산에 입력하고, 서비스 내용을 처리할 담당자를 선택하는 등의 온라인 상의 후속 절차를 진행하였다.Conventional call centers use a voice guidance system to connect customers and counselors to receive counseling information from customers, and counselors directly enter the received counseling information into a computer, and select a person in charge to handle the service content. The subsequent procedure was carried out.
하지만 종래의 콜센터 시스템은 상담사가 많은 작업을 수행해야 하는 등으로 업무 효율이 떨어지고 인건비 지출이 증가하는 문제점이 있었다. 이러한 한계를 극복하기 위하여 상담사 없이 무인으로 상담을 진행할 수 있는 콜봇 시스템이 도입되어 사용되고 있다.However, the conventional call center system has a problem in that work efficiency decreases and labor expenses increase due to the need for a counselor to perform many tasks. In order to overcome these limitations, a call bot system has been introduced and used that can conduct counseling without a counselor.
콜봇 시스템은 미리 구축된 시나리오 또는 학습내용에 따라 대화를 진행하며, 고객의 음성을 STT(Speech To Text) 엔진을 이용하여 텍스트로 변환하고, 변환된 텍스트를 기반으로 의도를 판단하여 답변 내용을 선택 후 출력 멘트를 TTS(Text To Speech) 엔진을 이용하여 음성으로 고객에게 답변을 진행하는 방식을 사용한다.The call bot system conducts conversations according to pre-built scenarios or learning contents, converts the customer's voice to text using the STT (Speech To Text) engine, determines the intention based on the converted text, and selects the answer content. After the output comment is sent to the customer by voice using the TTS (Text To Speech) engine.
이러한 콜봇 시스템은 고객의 음성 데이터를 빠르고 정확하게 분석하여 정확한 텍스트를 추출하는 것이 매우 중요하다. 하지만, STT 엔진의 특성에 따라 음성 인식의 결과의 정확도가 달라지고, 음성 데이터가 고정 패킷 사이즈로 전송되어 음성 인식의 정확도가 떨어지는 등의 문제가 있었다.It is very important for such a call bot system to quickly and accurately analyze the customer's voice data to extract the correct text. However, according to the characteristics of the STT engine, the accuracy of the speech recognition result is different, and the speech data is transmitted in a fixed packet size, so that the accuracy of speech recognition is deteriorated.
한국공개특허 제10-2016-0100412호의 경우 통화가 시작된 타이밍 직후에 음성인식 처리를 개시하는 것에 대해서는 개시하고 있으나, 음성 인식의 정확도 및 속도를 향상시킬 수 있는 구성에 대해서는 개시하고 있지 않다.In the case of Korean Patent Application Laid-Open No. 10-2016-0100412, it discloses starting the voice recognition processing immediately after the start of the call, but does not disclose a configuration capable of improving the accuracy and speed of voice recognition.
본 발명은 위와 같은 문제를 해결하기 위한 것으로, 상세하게는 음성 인식의 속도 및 정확도를 향상시킬 수 있는 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법을 제공하는 것을 목적으로 한다.The present invention is to solve the above problems, and in detail, an object of the present invention is to provide an intelligent call bot server capable of improving the speed and accuracy of voice recognition, and an unattended counseling method using the same.
본 발명의 과제들은 이상에서 언급한 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The problems of the present invention are not limited to the problems mentioned above, and other problems that are not mentioned will be clearly understood by those skilled in the art from the following description.
상기 과제를 해결하기 위한 본 발명의 일실시예에 따른 지능형 콜봇 서버는, 콜센터 시스템의 교환기, TTS 서버 및 복수의 STT 서버에 연동되어 고객에게 무인 상담 서비스를 제공하되, 상기 교환기를 통하여 고객의 상담 요청이 접수되는 경우 상기 교환기로 호를 연결하고, 상기 교환기로 입력되는 고객의 음성을 상기 STT 서버를 통하여 수신 텍스트로 변환하고, 상기 변환된 수신 텍스트를 분석하여 발신 텍스트를 생성하고, 상기 발신 텍스트를 상기 TTS 서버를 통하여 발신 음성으로 변환하고, 상기 발신 음성을 상기 교환기를 통하여 고객에게 송출하도록 구성되고, 상기 수신 텍스트의 분석 결과를 기초로 음성 인식률을 향상시킬 수 있는 STT 서버의 유형을 결정하고, 상기 결정된 STT 서버의 유형에 따라 상기 STT 서버 중 최적의 STT 서버를 연결하여 음성 인식을 수행하도록 하는 STT 서버 결정부를 포함할 수 있다.The intelligent call-bot server according to an embodiment of the present invention for solving the above problems is interlocked with an exchange of a call center system, a TTS server, and a plurality of STT servers to provide an unattended consultation service to a customer, but the customer's consultation through the exchange When a request is received, a call is connected to the exchange, the customer's voice input to the exchange is converted into a received text through the STT server, the converted received text is analyzed to generate an outgoing text, and the outgoing text Is configured to convert the outgoing voice into an outgoing voice through the TTS server, and transmit the outgoing voice to the customer through the exchange, and determine the type of STT server capable of improving the voice recognition rate based on the analysis result of the received text. , It may include an STT server determination unit for performing voice recognition by connecting an optimal STT server among the STT servers according to the determined type of the STT server.
상기 STT 서버 결정부는, 상기 수신 텍스트를 분석하여 발화 형태, 발화 주제, 발화 의도 중 어느 하나를 파악하여 음성 인식률을 향상시킬 수 있는 STT 서버의 유형을 결정할 수 있다.The STT server determination unit may analyze the received text to determine any one of a speech type, speech topic, and speech intention to determine a type of STT server capable of improving a speech recognition rate.
상기 STT 서버 결정부는, 상기 발화 주제별 최적의 STT 서버의 유형 정보에 관한 STT 유형 데이터베이스를 미리 구축하고 있으며, 상기 STT 유형 데이터베이스를 기초로 상기 발화 주제에 최적인 STT 서버를 선택하여 연결할 수 있다.The STT server determination unit has previously built an STT type database regarding type information of the optimal STT server for each speech topic, and may select and connect an STT server that is optimal for the speech topic based on the STT type database.
상기 STT 서버 결정부는, 상기 발화 형태가 자연어 형태인 경우 또는 상기 발화 의도가 복수의 의도를 포함하는 것으로 판단된 경우 AI 계열의 STT 서버를 선택하여 연결할 수 있다.The STT server determination unit may select and connect to an AI-based STT server when the utterance form is a natural language form or when it is determined that the utterance intention includes a plurality of intentions.
상기 STT 서버 결정부는, 상기 발화 형태가 전문용어를 포함하는 전문 발화 형태인 경우 또는 상기 발화 의도가 단일의 의도를 포함하는 것으로 판단된 경우 전문 계열의 STT 서버를 선택하여 연결할 수 있다.The STT server determination unit may select and connect a specialized STT server when the utterance type is a specialized utterance form including a terminology or when it is determined that the utterance intention includes a single intention.
또한 본 발명의 일실시예에 따른 지능형 콜봇 서버는, 상기 고객의 음성 데이터 패킷을 분석하여 무음 구간 또는 볼륨값이 미리 설정된 기준값 이하인 약음 구간을 산출하고, 버퍼(buffer)를 이용하여 상기 무음 구간 또는 상기 약음 구간의 전후로 패킷 단위를 가변시켜 상기 STT 서버로 전송하는 패킷 처리부를 더 포함할 수 있다.In addition, the intelligent call-bot server according to an embodiment of the present invention analyzes the customer's voice data packet to calculate a silent section or a quiet section in which a volume value is less than a preset reference value, and uses a buffer to calculate the silent section or It may further include a packet processing unit for varying a packet unit before and after the attenuating period and transmitting it to the STT server.
또한 본 발명의 일실시예에 따른 지능형 콜봇 서버는, 상기 고객과 상기 지능형 콜봇 서버와의 대화 히스토리 및 음성 녹취를 관리하는 콜처리부를 더 포함하고, 상기 콜처리부는 네트워크를 통하여 연결된 상담사 단말기에 상기 대화 히스토리를 실시간으로 제공하고, 상기 음성 녹취를 확인할 수 있는 링크 정보를 제공할 수 있다.In addition, the intelligent call bot server according to an embodiment of the present invention further includes a call processing unit for managing a conversation history and voice recording between the customer and the intelligent call bot server, the call processing unit to the counselor terminal connected through a network. A conversation history may be provided in real time, and link information for confirming the voice recording may be provided.
상기 콜처리부는 네트워크를 통하여 연결된 상기 고객의 단말기에 상기 대화 히스토리와, 상기 음성 녹취를 확인할 수 있는 링크 정보를 제공할 수 있도록 구성될 수 있다.The call processing unit may be configured to provide link information for confirming the conversation history and the voice recording to the customer's terminal connected through a network.
상기 콜처리부는 상기 고객의 본인 인증이 완료된 경우에 상기 음성 녹취를 확인할 수 있는 링크 정보를 제공할 수 있다.The call processing unit may provide link information for confirming the voice recording when the customer's identity verification is completed.
또한 본 발명의 일실시예에 따른 지능형 콜봇 서버는, 네트워크를 통하여 연결된 상담사 단말기에 상기 고객과 상기 지능형 콜봇 서버의 대화 시나리오를 실시간 확인 및 변경할 수 있는 시나리오 관리 화면을 제공하는 시나리오 관리부를 포함하고, 상기 시나리오 관리 화면은 각각 다른 기능을 가지는 복수의 노드를 드래그 앤 드롭 방식으로 연결하여 플로우를 형성할 수 있도록 구성될 수 있다.In addition, the intelligent call bot server according to an embodiment of the present invention includes a scenario management unit that provides a scenario management screen for real-time confirmation and change of a conversation scenario between the customer and the intelligent call bot server to a counselor terminal connected through a network, The scenario management screen may be configured to form a flow by connecting a plurality of nodes having different functions in a drag-and-drop manner.
또한 본 발명의 일실시예에 따른 콜센터 시스템의 교환기, TTS 서버 및 복수의 STT 서버에 연동된 지능형 콜봇 서버를 이용한 무인 상담 방법은, (a) 교환기를 통하여 고객의 호 접속 요청을 수신하는 단계; (b) 상기 교환기와 상기 지능형 콜봇 서버 사이의 호를 연결하는 단계; (c) 상기 교환기로부터 입력되는 고객의 음성을 상기 STT 서버를 통하여 수신 텍스트로 변환하는 단계; (d) 상기 변환된 수신 텍스트를 분석하여 발신 텍스트를 생성하는 단계; (e) 상기 TTS 서버를 통하여 상기 발신 텍스트를 발신 음성으로 변환하는 단계; (f) 상기 변환된 발신 음성을 상기 교환기를 통하여 상기 고객에게 송출하는 단계; (g) 상기 수신 텍스트의 분석 결과를 기초로 음성 인식률을 향상시킬 수 있는 STT 서버의 유형을 결정하는 단계; 및 (h) 상기 결정된 STT 서버의 유형에 따라 상기 STT 서버 중 최적의 STT 서버를 연결하여 음성 인식을 수행하는 단계를 포함할 수 있다.In addition, an unattended counseling method using an intelligent call bot server interlocked with a switch, a TTS server, and a plurality of STT servers of a call center system according to an embodiment of the present invention includes the steps of: (a) receiving a call connection request from a customer through the switch; (b) connecting a call between the exchange and the intelligent call-bot server; (c) converting the customer's voice input from the exchange into a received text through the STT server; (d) analyzing the converted received text to generate an outgoing text; (e) converting the outgoing text into outgoing voice through the TTS server; (f) transmitting the converted outgoing voice to the customer through the exchange; (g) determining a type of STT server capable of improving a speech recognition rate based on the analysis result of the received text; And (h) performing voice recognition by connecting an optimal STT server among the STT servers according to the determined type of the STT server.
상기 (g) 단계는, 상기 수신 텍스트를 분석하여 발화 형태, 발화 주제, 발화 의도 중 어느 하나를 파악하여 음성 인식률을 향상시킬 수 있는 STT 서버의 유형을 결정할 수 있다.The step (g) may determine the type of STT server capable of improving a speech recognition rate by analyzing the received text to determine any one of a speech type, speech topic, and speech intention.
상기 (c) 단계는, 상기 고객의 음성 데이터 패킷을 분석하여 무음 구간 또는 볼륨값이 미리 설정된 기준값 이하인 약음 구간을 산출하는 단계; 및 버퍼(buffer)를 이용하여 상기 무음 구간 또는 상기 약음 구간의 전후로 패킷 단위를 가변시켜 상기 STT 서버로 전송하는 단계를 포함할 수 있다.The step (c) may include analyzing the voice data packet of the customer to calculate a silent section or a muted section in which a volume value is less than or equal to a preset reference value; And changing a packet unit before and after the silent period or the attenuated period using a buffer and transmitting the packet to the STT server.
또한 본 발명의 일실시예에 따른 무인 상담 방법은, 네트워크를 통하여 연결된 상기 고객의 단말기에 상기 고객과 상기 지능형 콜봇 서버와의 대화 히스토리 및 음성 녹취를 확인할 수 있는 링크 정보를 제공하는 단계를 더 포함할 수 있다.In addition, the unattended counseling method according to an embodiment of the present invention further includes providing link information for confirming the conversation history and voice recording between the customer and the intelligent call bot server to the customer's terminal connected through the network. can do.
또한 본 발명의 일실시예에 따른 무인 상담 방법은, 상기 고객의 단말기로부터 상기 링크 정보에 대한 클릭 정보가 수신되는 경우 상기 고객의 단말기로 본인인증 요청 정보를 전송하는 단계; 및 상기 고객의 단말기로부터 본인인증 완료 정보가 수신되는 경우 음성 녹취 파일을 상기 고객의 단말기로 전송하는 단계를 더 포함할 수 있다.In addition, an unattended counseling method according to an embodiment of the present invention includes: transmitting identity authentication request information to the customer's terminal when click information on the link information is received from the customer's terminal; And transmitting the voice recording file to the customer's terminal when the user authentication completion information is received from the customer's terminal.
또한 본 발명의 일실시예에 따른 무인 상담 방법은, 네트워크를 통하여 연결된 상담사 단말기에 상기 고객과 상기 지능형 콜봇 서버와의 대화 시나리오를 실시간 확인 및 변경할 수 있는 시나리오 관리 화면을 제공하는 단계를 더 포함하고, 상기 시나리오 관리 화면은 각각 다른 기능을 가지는 복수의 노드를 드래그 앤 드롭 방식으로 연결하여 플로우를 형성할 수 있도록 구성될 수 있다.In addition, the unattended counseling method according to an embodiment of the present invention further includes providing a scenario management screen capable of checking and changing a conversation scenario between the customer and the intelligent call bot server in real time to a counselor terminal connected through a network, , The scenario management screen may be configured to form a flow by connecting a plurality of nodes having different functions in a drag-and-drop method.
본 발명의 일실시예에 따른 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법은 음성 인식의 속도 및 정확도를 향상시켜 실시간 대화 히스토리 출력을 할 수 있다.The intelligent call bot server and the unmanned counseling method using the same according to an embodiment of the present invention can improve the speed and accuracy of voice recognition to output a real-time conversation history.
또한, 본 발명의 일실시예에 따른 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법은 대화 히스토리 및 음성 녹취 파일을 상담사 및 고객에게 제공할 수 있다.In addition, the intelligent call-bot server and the unattended counseling method using the same according to an embodiment of the present invention may provide a conversation history and a voice recording file to a counselor and a customer.
또한, 본 발명의 일실시예에 따른 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법은 웹 브라우저에서 복수의 노드를 드래그 앤 드롭 방식으로 연결하여 플로우를 형성할 수 있도록 하여 시나리오 관리를 편리하게 수행할 수 있도록 한다.In addition, the intelligent call-bot server and the unmanned counseling method using the same according to an embodiment of the present invention allow a plurality of nodes to be connected in a drag-and-drop method in a web browser to form a flow, so that scenario management can be conveniently performed. do.
본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.The effects according to the present invention are not limited by the contents exemplified above, and more various effects are included in the present specification.
도 1은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 적용된 콜센터 시스템의 개략 구성도이다.
도 2는 본 발명의 일실시예에 따른 지능형 콜봇 서버의 세부 구성 및 동작을 설명하기 위한 콜센터 시스템의 개략 구성도이다.
도 3은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 무인 상담을 진행하는 방법을 설명하는 개략 순서도이다.
도 4는 도 3에서 S330 단계의 패킷 전송 단위 리사이징의 세부 방법을 설명하는 순서도이다.
도 5는 도 3에서 S360 단계의 최적의 STT 서버의 유형을 결정하는 세부 방법을 설명하는 순서도이다.
도 6은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 고객에게 대화 히스토리 및 녹취 파일을 전송하는 방법을 설명하는 순서도이다.
도 7은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 상담사 단말기에 제공하는 특정 상담의 발화현황상태를 나타내는 도면이다.
도 8은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 상담사 단말기에 제공하는 특정 상담사의 상담이력 및 특정 상담에 대한 세부상담현황을 나타내는 도면이다.
도 9는 본 발명의 일실시예에 따른 지능형 콜봇 서버가 상담사 단말기에 제공하는 시나리오 관리하면을 나타내는 도면이다.1 is a schematic configuration diagram of a call center system to which an intelligent call bot server according to an embodiment of the present invention is applied.
2 is a schematic configuration diagram of a call center system for explaining the detailed configuration and operation of an intelligent call bot server according to an embodiment of the present invention.
3 is a schematic flowchart illustrating a method for an intelligent call bot server to perform unmanned consultation according to an embodiment of the present invention.
4 is a flowchart illustrating a detailed method of resizing a packet transmission unit in step S330 in FIG. 3.
5 is a flowchart illustrating a detailed method of determining an optimal STT server type in step S360 in FIG. 3.
6 is a flowchart illustrating a method of transmitting a conversation history and recording file to a customer by an intelligent call bot server according to an embodiment of the present invention.
7 is a diagram illustrating a state of utterance of a specific consultation provided by an intelligent call bot server to a counselor terminal according to an embodiment of the present invention.
8 is a diagram illustrating a counseling history of a specific counselor and a detailed counseling status for a specific counseling provided by an intelligent call bot server to a counselor terminal according to an embodiment of the present invention.
9 is a diagram illustrating a scenario management surface provided by an intelligent call bot server to a counselor terminal according to an embodiment of the present invention.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.Advantages and features of the present invention, and a method of achieving them will become apparent with reference to the embodiments described below in detail together with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but may be implemented in a variety of different forms, and only these embodiments make the disclosure of the present invention complete, and are common knowledge in the technical field to which the present invention pertains. It is provided to completely inform the scope of the invention to those who have, and the invention is only defined by the scope of the claims. The same reference numerals refer to the same elements throughout the specification.
이하, 본 발명의 실시예들에 따른 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법에 대하여 도면들을 참고하여 설명하도록 한다.Hereinafter, an intelligent call bot server and an unmanned counseling method using the same according to embodiments of the present invention will be described with reference to the drawings.
도 1은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 적용된 콜센터 시스템의 개략 구성도이다.1 is a schematic configuration diagram of a call center system to which an intelligent call bot server according to an embodiment of the present invention is applied.
도 1을 참조하면 콜센터 시스템은 데이터망(네트워크망) 및 전화망(보이스망)으로 연결되어 있음을 확인할 수 있다. 실선으로 된 부분은 데이터망으로 연결된 것을 나타내며, 점선으로 된 부분은 전화망으로 연결된 것을 나타낸다.Referring to FIG. 1, it can be seen that the call center system is connected to a data network (network network) and a telephone network (voice network). The solid line indicates the connection through the data network, and the dotted line indicates the connection through the telephone network.
도 1에는 본 발명의 일실시예에 따른 지능형 콜봇 서버(100)는 기존 고객사의 콜센터 시스템에 연동되어 설치된 것이 도시되어 있다. 지능형 콜봇 서버(100)는 ARS(Audio Response System) 또는 IVR(Interactive Voice Response)라고 불리는 자동응답시스템의 역할도 수행할 수 있기 때문에 도 1과 같이 IVR이 없는 경우에도 연동되어 설치될 수 있다.FIG. 1 shows that the intelligent
물론, 기존 고객사의 콜센터 시스템에 IVR이 있는 경우에도 본 발명의 일실시예에 따른 지능형 콜봇 서버(100)가 연동되어 설치될 수 있다. 이 경우 고객으로부터 전화가 걸려오는 경우 고객사의 IVR을 경유하여 호가 분기되어 콜봇 서버(100)가 동작될 수 있다.Of course, even if there is an IVR in the existing customer's call center system, the intelligent
지능형 콜봇 서버(100)의 기존 고객사 시스템의 교환기(IPPBX, 10), STT 서버(20), TTS 서버(30), 컴퓨터 전화 통합 시스템(CTI, 40), 녹취 서버(REC, 50), 웹 응용 서버(WAS, 70), 데이터베이스 관리 시스템(DBMS, 70) 및 전광판(80)과 연동되어 설치될 수 있다.Switchboard (IPPBX, 10) of existing customer system of intelligent call-bot server (100), STT server (20), TTS server (30), computer telephone integration system (CTI, 40), recording server (REC, 50), web application A server (WAS, 70), a database management system (DBMS, 70), and may be installed in conjunction with the electronic display (80).
고객이 콜센터에 전화를 하게 되면 전화망으로 교환기(IPPBX, 10)으로 접속하여 상담을 요청하게 된다. 이때, 교환기(10)는 도 1에서 VoIP 기반의 IPPBX인 것으로 도시되어 있으나 반드시 이에 한정되는 것은 아니며 종래의 PBX를 포괄하는 개념이다.When a customer makes a call to the call center, they connect to the switchboard (IPPBX, 10) through the telephone network and request a consultation. In this case, the
교환기(10)는 지능형 콜봇 서버(100)와 호를 연결하여 고객과 콜봇 서버(100)가 통화할 수 있도록 한다. The
지능형 콜봇 서버(100)는 고객과 무인으로 상담을 진행하는 역할을 하며, AS 서비스 신청, 배달 주문, 민원 접수 신청, 보험 계약 체결, 핸드폰 구매 계약 체결, 핸드폰 요금제 변경 등 다양한 상담을 진행할 수 있다.The intelligent
교환기(10) 및 지능형 콜봇 서버(100)는 전화망으로 서로 연결되며, 상담사 그룹(3, 5)과도 전화망으로 연결될 수 있다. 여기서, 상담사 그룹(3, 5)는 상담 내용이나 기타 기준에 따라 구분된 그룹을 의미할 수 있다.The
교환기(10)는 고객으로부터 서비스 접수 등의 상담 요청 전화가 걸려온 경우 지능형 콜봇 서버(100)로 분기하는 역할을 하며, 지능형 콜봇 서버(100)는 미리 설정된 시나리오에 따라 무인으로 상담을 진행하는 역할을 한다.The
또한 교환기(10), 지능형 콜봇 서버(100), STT 서버(20), TTS 서버(30), CTI(40), 녹취 서버(50), WAS(60), DBMS(70) 및 전광판(80)은 내부 데이터망으로 연결되어 구성될 수 있다.In addition, switchboard (10), intelligent call-bot server (100), STT server (20), TTS server (30), CTI (40), recording server (50), WAS (60), DBMS (70), and billboard (80) Can be configured by being connected to the internal data network.
STT 서버(20)는 음성 데이터를 텍스트 데이터로 변환하는 역할을 하며, TTS 서버(30)는 텍스트 데이터를 음성 데이터로 변환하는 역할을 한다. 구체적으로, 고객으로부터 음성 데이터가 수신되면 STT 서버(20)는 이를 텍스트 데이터로 변환하여 지능형 콜봇 서버(100)로 전달하며, 지능형 콜봇 서버(100)가 고객에게 전송할 텍스트 데이터를 생성하면, TTS 서버(30)는 이를 전달받아 음성 데이터로 변환하여 교환기(10)를 통하여 고객에게 전달하는 역할을 한다.The
STT 서버(20)으로 비정형 자연어 음성인식에 강점을 가지는 RNN(Recurrent Neural Network) 기반 알고리즘 기반의 LTSM(Long Short Term Memory) 엔진이 사용될 수 있다.As the
TTS 서버(30)로 USS(Unit Selection Speech) 방식에 DNN(Deep Neural Network) 방식을 추가한 DNN 기반의 자연어 음성합성 엔진이 사용될 수 있다.As the
CTI(40)는 컴퓨터와 전화를 결합시켜 콜센터 시스템으로 걸려오는 전화를 효율적으로 분산 관리하는 역할을 한다. CTI(40)에는 고객과의 통화시 컴퓨터 화면을 통하여 상담 내역 등의 정보 등이 실시간으로 표시되어 효율적인 콜센터 운영을 가능하게 한다.The
녹취 서버(50)는 콜센서의 상담사와 고객과의 음성 통화를 녹취하여 저장하는 역할을 한다.The
WAS(60)는 콜센터 시스템의 데이터망에서 실행되는 각 어플리케이션을 관리하는 소프트웨어 관리 서버로 서버단에서 어플리케이션을 동작할 수 있도록 하는 역할을 한다.The WAS 60 is a software management server that manages each application executed in the data network of the call center system, and serves to operate the application at the server side.
DMBS(70)는 콜센터 시스템의 고객과 상담원의 상담 내역 등의 정보를 소프트웨어를 통하여 구축된 데이터베이스를 관리하는 역할을 한다.The
전광판(80)은 콜센터 전체 시스템의 운영 상태를 모니터링하는 화면을 출력하는 역할을 한다.The
도 1에서는 콜센터 시스템의 모든 구성이 내부 데이터망에서 구축된 것으로 도시되었으나 특정 구성이 외부 데이터망에서 클라우드 서비스 형태로 구축되는 실시예도 가능할 것이다.In FIG. 1, all configurations of the call center system are shown as being built in an internal data network, but an embodiment in which a specific configuration is built in the form of a cloud service in an external data network may also be possible.
예를 들어, STT 서버(20) 및 TTS 서버(30)가 외부 데이터망에 형성되고, 본 발명의 지능형 콜봇 서버(100)는 내부 데이터망의 “DMZ Zone”에 설치되는 실시예가 가능할 수 있다. 여기서 “DMZ Zone”은 내부 데이터망에 위치하지만 외부 데이터망에서 접근이 가능한 영역을 의미한다.For example, the
고객은 전화기와 같은 단말기를 통하여 전화망으로 지능형 콜봇 서버(100)와 호가 연결되며, 필요한 경우 인터넷망을 통하여 문자 메시지, 영상 데이터 등의 정보 등을 송수신 할 수 있다.The customer is connected to the intelligent
본 발명의 지능형 콜봇 서버(100)는 실시간 음성 인식 및 대화 히스토리 출력의 속도 및 정확도를 향상시키기 위하여 복수의 STT 서버(20) 중에서 최적의 서버를 자동으로 선택할 수 있으며, STT 서버(20)로 전송되는 음성 데이터의 패킷 단위를 리사이징 하는 등의 기능을 수행할 수 있는데 이하 도 2 등을 참조하여 상술한다.The intelligent
도 2는 본 발명의 일실시예에 따른 지능형 콜봇 서버의 세부 구성 및 동작을 설명하기 위한 콜센터 시스템의 개략 구성도이다.2 is a schematic configuration diagram of a call center system for explaining the detailed configuration and operation of an intelligent call bot server according to an embodiment of the present invention.
도 2에는 편의상 콜센터 시스템의 전체 구성을 도시하지 않고 지능형 콜봇 서버(100)가 교환기(10), STT 서버(20), TTS 서버(30), 녹취 서버(50), 고객 단말기(2) 및 상담사 단말기(4)에 연결된 것만 도시하였다.2, for convenience, the entire configuration of the call center system is not shown, and the intelligent
고객 단말기(2)로부터 호가 접수되면 교환기(10)는 지능형 콜봇 서버(100)에 호를 분기시켜 원하는 상담을 진행할 수 있도록 한다.When a call is received from the
지능형 콜봇 서버(100)는 챗봇 서버(110), 콜처리부(120), 상담 처리부(130), 상담내용 저장부(140), 상담내용 출력부(150), STT 서버 결정부(160) 및 시나리오 관리부(170)를 포함하여 구성될 수 있다.The intelligent
상담 처리부(130)는 교환기(10)를 통하여 고객 단말기(2)와 호가 연결되면 고객의 음성을 STT 서버(20)를 통하여 수신 텍스트로 변환하여 챗봇 서버(110)로 전달하고, 챗봇 서버(100)에서 생성된 발신 텍스트를 전달받아 TTS 서버(30)를 통하여 발신 음성으로 변환하고, 변환된 상기 발신 음성을 교환기(10)로 전송함으로써 상담을 처리하는 역할을 한다.When a call is connected to the
챗봇 서버(110)는 상기 수신 텍스트를 분석하여 발신 텍스트를 생성하며, 시나리오별 출력 멘트를 생성하는 역할을 하며, 전처리부(112), 구어체 변환부(114), 데이터베이스(116) 및 멘트 출력부(118)를 포함하여 구성된다.The
전처리부(112)는 상기 수신 텍스트의 어절 구분 등을 수행하며 의미를 가지는 단위로 분리하는 역할을 한다.The
구어체 변환부(114)는 전처리부(112)에서 전처리된 수신 텍스트를 정제 또는 치환하는 역할을 한다.The
데이터베이스(116)는 구어체 변환부(114)에서 구어체 변환의 기초가 되는 데이터를 미리 구축하여 저장하는 역할을 한다.The
멘트 출력부(118)는 구어체 변환부(114)에서 변환된 내용을 기초로 발신 텍스트 및 시나리오별 출력 멘트를 생성 및 출력하는 역할을 한다.The
예를 들어, 구어체 변환부(114)는 “긍정/부정”을 구분할 수 있도록 단어를 관리하여 봇대화 시나리오에 활용할 수 있다. 데이터베이스(116)에 긍정 표현으로 “좋아요, 맞아요” 등을 저장하고, 부정 표현으로 “아니오, 아닙니다” 등을 저장한 다음 고객의 음성이 STT 서버(20)를 통하여 입력 텍스트로 변환되어 수신된 경우 데이터베이스(116)에 저장된 내용과 비교하여 미리 구축된 알고리즘에 의하여 유사어로 치환되거나 문구가 정제되는 등의 방식으로 구어체 변환부(114)에서 변환될 수 있다. For example, the
또한, 구어체 변환부(114)는 “날짜” 또는 “금액”과 같이 숫자가 포함된 수사의 경우에도 위와 유사한 방식으로 미리 데이터베이스(116)에 데이터를 구축하여 최적의 출력 텍스트를 생성할 수 있다.In addition, the
또한, 데이터베이스(116)에는 상담 카테고리, 질의 및 답변 내용에 따른 챗봇 시나리오 및 출력 멘트 등이 저장되어 있을 수 있으며, 멘트 출력부(118)는 구어체 변환부(114)에서 변환된 텍스트를 기초로 고객에게 전송할 멘트를 출력할 수 있다.In addition, the
콜처리부(120)는 지능형 콜봇 서버(100)와 고객과의 대화 히스토리 및 음성 녹취를 관리하는 역할을 하며, 봇대화 이력관리부(122), 녹취 관리부(124), 인증 처리부(126) 및 운영기준 관리부(128)를 포함하여 구성된다.The
봇대화 이력관리부(122)는 고객과 지능형 콜봇 서버(100)와의 대화 히스토리를 고객전화번호, 이름 등을 기초로 추적할 수 있도록 관리하는 역할을 한다. 이때, 대화 히스토리는 고객의 음성을 텍스트로 변환한 텍스트 데이터와, 멘트 출력부(118)가 생성한 텍스트 데이터를 의미한다.The bot conversation
녹취 관리부(124)는 고객과 지능형 콜봇 서버(100)와의 음성 대화 내용을 녹취 서버(50)를 통하여 녹취하도록 하는 역할을 한다. The
이때, 녹취 관리부(124)의 제어에 따라서 녹취 서버(50)는 고객의 음성만을 녹취하거나 지능형 콜봇 서버(100)가 합성하여 제공하는 음성을 동시에 녹취할 수 있다.At this time, under the control of the
또한, 녹취 관리부(124)는 지능형 콜봇 서버(100)의 질의 항목별로 추적하여 재생 가능한 형태로 고객 및 콜봇 서버(100)의 음성을 녹취할 수도 있다. In addition, the
이때, 녹취 서버(50)가 질의 항목별로 추적 가능한 형태로 녹취하는 방법은 녹취 파일 생성시 질의 항목별 내용 별로 추적 가능하도록 인덱싱하는 기법 등을 사용할 수 있다. In this case, a method of recording in a form that can be traced for each query item by the
인증 처리부(126)는 상담 과정 중에서 본인 인증의 과정이 필요한 경우 고객 단말기(2)로 인증 요청 정보를 전송하고, 인증 성공이 확인된 경우 미리 설정된 다음 절차가 수행될 수 있도록 한다.The
예를 들어, 후술할 상담내용 출력부(150)는 고객 단말기(2)로 대화 히스토리 및 음성 녹취파일에 대한 다운로드 링크 정보를 제공할 수 있는데, 이때 고객이 고객 단말기(2)의 문자 메시지 상의 링크 정보를 클릭하는 경우에 인증 처리부(126)는 본인 인증 요청 메시지를 전송하고, 본인 인증이 성공한 경우에 해당 대화 히스토리 및 음성 녹취 파일이 다운로드 되게 할 수 있다.For example, the consultation
상기 본인인증은 인증 처리부(126)가 직접 수행할 수도 있지만 지능형 콜봇 서버(100)와 연동된 통신사 서버, 은행 서버 등을 통하여 수행되는 것도 가능하다.The identity authentication may be performed directly by the
운영기준 관리부(128)는 지능형 콜봇 서버(100)의 운영시간, 시간대별 멘트 및 상담원 연결 기준 등을 관리하는 역할을 한다. 예를 들어, 운영기준 관리부(128)는 상담 카테고리, 내용 등을 기준으로 운영시간 등을 설정할 수 있다.The operation
상담내용 저장부(140)는 상담 처리부(130)에서 처리되는 상담 내용을 저장하는 역할을 한다. 예를 들어, 고객의 상담 내용이 제품에 대한 AS 접수인 경우에는 AS 접수 내역을 정리하여 저장할 수 있다. 이때, AS 접수 내역에는 고객의 정보, AS 대상 제품, AS 필요 내용, 상담사 정보, 대화 히스토리 정보, 음성 녹취 내역 등이 포함될 수 있다.The consultation
상담내용 출력부(150)는 상기 상담내용 저장부(140)에 저장되는 상담 내용을 상담사 단말기(4) 또는 고객 단말기(2)로 출력하는 역할을 한다.The counseling
예를 들어, 상담내용 출력부(150)는 실시간으로 상담사별 상담 상황 및 내용을 상담사 단말기(4)에 출력시킬 수 있다. 특히, 상담내용 출력부(150)가 실시간으로 출력하는 상담 상황 및 내용은 상담사 단말기(4) 중 관리자 단말기일 수 있다. For example, the counseling
또한, 필요한 경우 상담내용 출력부(150)는 실시간 또는 비실시간으로 개별 상담 내용을 특정 고객에게 제공할 수 있다. 예를 들어, 상담을 진행하는 고객에게 대화 히스토리를 문자 또는 채팅 형식으로 고객 단말기(2)에게 제공하고 상담이 끝난 경우에 음성 녹취 파일을 제공할 수 있다. In addition, if necessary, the counseling
물론, 상기 설명한 바와 같이 대화 히스토리 및 음성 녹취 파일을 바로 제공하지 않고 본인 인증이 성공한 경우에만 제공하도록 구성할 수도 있다. Of course, as described above, the conversation history and the voice recording file may not be provided immediately, but may be provided only when the user authentication is successful.
STT 서버 결정부(160)는 복수로 이루어지는 STT 서버(20) 중에서 음성 인식의 정확도 및 속도를 향상시킬 수 있는 최적의 STT 서버를 결정하여 연결할 수 있도록 하는 역할을 한다.The STT
도 2에 도시된 바와 같이 STT 서버(20)는 STT 서버 #1(22), STT 서버 #2(24), STT 서버 #3(26)을 포함하여 구성될 수 있다. 각각의 STT 서버는 특정 카테고리의 음성에 대하여 정확도가 다른 서버일 수 있다.As shown in Figure 2, the
예를 들어, STT 서버(20)는 구글, 왓슨 등의 회사가 제공하는 AI 계열의 STT 서버와, 리드스피커코리아, 솔루게이트 등의 회사가 제공하는 전문 계열의 STT 서버를 포함하여 구성될 수 있다.For example, the
STT 서버 결정부(160)는 챗봇 서버(110)의 전처리부(112) 및 구어체 변환부(114)에서 변환된 텍스트 정보 또는 파악되는 상담 카테고리 등에 의하여 최적의 STT 서버의 유형을 결정할 수 있는데, 이는 도 5를 참조하여 후술한다.The STT
패킷 처리부(170)는 교환기(10)를 통하여 전송되는 고객의 음성 데이터 패킷 사이즈를 리사이징 하는 역할을 한다. The
일반적으로 음성 데이터는 RTP 패킷의 형태로 전송되는데, RTP 패킷은 일반적으로 320 바이트, 640 바이트 등과 같은 고정 패킷 사이즈로 전송된다. 하지만 이러한 경우 문장의 어절이 끊기거나 하는 등으로 STT 서버(20)의 음성 인식의 속도 및 정확도가 떨어지게 된다.In general, voice data is transmitted in the form of an RTP packet, and the RTP packet is generally transmitted in a fixed packet size such as 320 bytes and 640 bytes. However, in this case, the speed and accuracy of speech recognition of the
따라서, 패킷 처리부(170)은 패킷을 분석하여 무음 구간 또는 볼륨값이 미리 설정된 기준값 이하인 약음 구간을 검출하여 무음 구간 또는 약음 구간 전후로 패킷을 구분하여 리사이징하여 패킷을 STT 서버(20)로 전송한다. Accordingly, the
패킷 처리부(170)의 상세 리사이징 방법에 대해서는 도 4를 참조하여 후술한다.A detailed resizing method of the
시나리오 관리부(180)는 네트워크를 통하여 연결된 상담사 단말기(4)에 고객과 지능형 콜봇 서버(100)와의 대화 시나리오를 실시간 확인 및 변경할 수 있는 시나리오 관리 화면을 제공하는 역할을 한다. The
특히, 시나리오 관리부(180)는 각각 다른 기능을 가지는 복수의 노드를 드래그 앤 드롭 방식으로 연결하여 플로우를 형성할 수 있도록 하는 웹기반 시나리오 관리 화면을 제공할 수 있다. In particular, the
도 3은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 무인 상담을 진행하는 방법을 설명하는 개략 순서도이다.3 is a schematic flowchart illustrating a method for an intelligent call bot server to perform unmanned consultation according to an embodiment of the present invention.
고객 단말기(2)와 지능형 콜봇 서버(100)와의 호가 연결된 경우 지능형 콜봇 서버(100)는 상담 안내 멘트를 송출한다(S310).When a call between the
다음 미리 구축된 시나리오에 의하여 지능형 콜봇 서버(100)는 상담 질의 멘트를 송출한다(S315).Next, the intelligent
고객의 답변 음성정보가 수신되면(S320), 패킷 처리부(170)는 패킷 전송 단위를 리사이징한다(S330).When the customer's response voice information is received (S320), the
이때, 패킷 처리부(170)가 패킷 전송 단위를 리사이징 하는 것은 STT 서버(20)의 음성인식의 속도 및 정확성을 향상시키기 위한 것으로 음성 데이터의 묵음 또는 약음 구간을 기준으로 패킷 사이즈를 가변시키는데 자세한 내용은 도 4를 참조하여 후술한다.At this time, the
리사이징된 패킷이 STT 서버로 전달되면 지능형 콜봇 서버(100)는 STT 서버(20)를 통해 수신 텍스트로 변환시킨다(S340).When the resized packet is delivered to the STT server, the intelligent call-
도 3에 도시되지는 않았지만 수신 텍스트는 전처리부(112) 및 구어체 변환부(114)를 통하여 정확도 높은 데이터로 변환될 수 있다.Although not shown in FIG. 3, the received text may be converted into highly accurate data through the
다음 변환된 텍스트를 기초로 질의 항목에 대하여 답변 기준에 적합한 답변이 수신되었는지를 판단한다(S350).Next, based on the converted text, it is determined whether an answer suitable for the answer criterion has been received for the query item (S350).
S350 단계에서 답변 기준에 적합하다고 판단되면 STT 서버 결정부(160)는 최적의 STT 서버의 유형을 결정하고(S360), 최적의 STT 서버로 연결시키고(S365), 다시 S315 단계로 돌아와 다음 항목 질의 멘트를 송출한다.If it is determined that the answer criteria are appropriate in step S350, the STT
S350 단계에서 답변 기준에 적합하지 않다고 판단되면 답변 실패 회수가 미리 설정된 기준값보다 큰지를 판단한다(S370).If it is determined in step S350 that the answer criteria are not met, it is determined whether the number of failures to answer is greater than a preset reference value (S370).
S370 단계에서 답변 실패 회수가 기준값보다 크지 않은 경우라고 판단되면 단계 S315로 돌아가 동일 항목에 대한 재질의 멘트를 송출한다.If it is determined in step S370 that the number of failures to answer is not greater than the reference value, the process returns to step S315 and transmits a material comment for the same item.
S370 단계에서 답변 실패 회수가 기준값보다 크다고 판단되면 상담 실패로 처리한다(S375).If it is determined that the number of failures to answer is greater than the reference value in step S370, it is processed as a counseling failure (S375).
이와 같은 방법으로 상담 질의 멘트를 송출하고 답변을 입력 받고, 모든 질의 항목에 대한 답변이 모두 수신되면 상담 종료를 하고 상담 내용을 저장하게 된다.In this way, the counseling query is sent and the answers are inputted. When all answers to all the query items are received, the counseling ends and the counseling contents are saved.
도 3의 실시예에서는 고객의 음성 인식의 결과인 텍스트 정보를 분석하여 해당 결과로 최적의 STT 서버의 유형을 결정하여 최적의 STT 서버를 선택 및 연결하는 방법을 보여주고 있다. 이 방법에서는 최초 고객의 음성에 대한 STT 서버는 기본값으로 설정되게 되며, 최초 음성 인식의 결과로 최적의 STT 서버를 선택 및 연결하게 된다.The embodiment of FIG. 3 shows a method of selecting and connecting an optimal STT server by analyzing text information that is a result of speech recognition of a customer, and determining an optimal STT server type based on the corresponding result. In this method, the STT server for the first customer's voice is set as a default value, and the optimal STT server is selected and connected as a result of the initial voice recognition.
하지만, 이 방법 외에도 상담 시작에서 고객이 선택하는 상담 카테고리 등의 항목이 미리 설정되는 경우 해당 카테고리에 의하여 최초 고객의 음성에 대한 음성 인식을 수행하는 STT 서버를 최적의 STT 서버로 선택하여 음성 인식을 수행하는 방법도 가능할 것이다. However, in addition to this method, if items such as a consultation category selected by the customer at the start of the consultation are preset, the STT server that performs speech recognition for the first customer's voice according to the category is selected as the optimal STT server to perform speech recognition How to do it would be possible.
이 경우에는 상담 카테고리 등을 기준으로 최적의 STT 서버의 유형이 미리 데이터베이스로 구축되어 있고, 해당 데이터베이스를 기준으로 초기 STT 서버를 자동으로 선택하여 연결할 수 있다.In this case, the optimal STT server type based on the consultation category, etc., has been established as a database in advance, and an initial STT server can be automatically selected and connected based on the database.
도 4는 도 3에서 S330 단계의 패킷 전송 단위 리사이징의 세부 방법을 설명하는 순서도이다.4 is a flowchart illustrating a detailed method of resizing a packet transmission unit in step S330 in FIG. 3.
먼저 고객의 음성정보 패킷을 수신한다(S410). 이때, 음성정보는 RTP 패킷일 수 있다. 지능형 콜봇 서버(100)는 음성정보 패킷을 분석하여(S415), 해당 패킷이 묵음 또는 볼륨값이 미리 설정된 기준값보다 작은지를 판단한다(S420).First, a customer's voice information packet is received (S410). In this case, the voice information may be an RTP packet. The intelligent call-
S420 단계에서 해당 패킷이 묵음 또는 볼륨값이 미리 설정된 기준값보다 작다고 판단되면 묵음 개수를 카운트하고(S430), 현재 패킷을 이전 버퍼에 복사한다(S440).If it is determined in step S420 that the corresponding packet has a silence or a volume value less than a preset reference value, the number of silences is counted (S430), and the current packet is copied to the previous buffer (S440).
S420 단계에서 해당 패킷이 묵음 또는 볼륨값이 미리 설정된 기준값보다 작은 경우가 아니라고 판단되면 이전 버퍼가 비어 있는지를 판단한다(S421).In step S420, if it is determined that the packet is not silent or the volume value is less than a preset reference value, it is determined whether the previous buffer is empty (S421).
S412 단계에서 이전 버퍼가 비어 있지 않다면 이전 버퍼를 새로운 버퍼에 저장시킨다(S423).If the previous buffer is not empty in step S412, the previous buffer is stored in the new buffer (S423).
S423 단계 이후 또는 S412 단계에서 이전 버퍼가 비어 있다고 판단되는 경우에는 패킷을 새로운 버퍼에 저장시킨다(S425).If it is determined that the previous buffer is empty after step S423 or in step S412, the packet is stored in the new buffer (S425).
다음 묵음 개수를 초기화시키고(S427), 이전 버퍼를 초기화한다(S429)The next silence count is initialized (S427), and the previous buffer is initialized (S429).
S440 단계 이후 또는 S429 단계 이후에는 묵음 개수가 미리 설정된 기준값보다 큰지를 판단한다(S450).After step S440 or after step S429, it is determined whether the number of silences is greater than a preset reference value (S450).
S450 단계에서 묵음 개수가 기준값보다 크지 않다고 판단되면 S410 단계로 돌아가 다음 패킷을 수신한다.If it is determined in step S450 that the number of silences is not greater than the reference value, the process returns to step S410 to receive the next packet.
S450 단계에서 묵음 개수가 기준값보다 크다고 판단되면 새로운 버퍼의 맨 앞에 묵음을 저장시키고(S470), 새로운 버퍼를 STT 서버(20)로 전송시킨다(S470).If it is determined in step S450 that the number of silences is greater than the reference value, the silence is stored in front of the new buffer (S470), and the new buffer is transmitted to the STT server 20 (S470).
다음 묵음 개수를 초기화하고(S480), 새로운 버퍼도 초기화하고(S490), S410 단계로 돌아가 다음 패킷을 수신한다.The next silent number is initialized (S480), a new buffer is also initialized (S490), and the process returns to step S410 to receive the next packet.
상기와 같은 방식으로 패킷이 묵음이거나 볼륨값이 일정값 이하인 약음인 경우에는 미리 설정된 갯수 만큼의 묵음 개수 기준으로 패킷을 재분류하여 사이즈를 재조정한 후 STT 서버(20)로 전송함으로써 음성 인식의 속도 및 정확도를 향상시킬 수 있다.In the same way as described above, if the packet is silent or the volume value is attenuated below a certain value, the packet is reclassified based on the number of silences equal to the preset number, readjusted the size, and then transmitted to the
도 5는 도 3에서 S360 단계의 최적의 STT 서버의 유형을 결정하는 세부 방법을 설명하는 순서도이다.5 is a flowchart illustrating a detailed method of determining an optimal STT server type in step S360 in FIG. 3.
지능형 콜봇 서버(100)는 수신 텍스트를 분석하여(S510), 발화 주제가 식별되는지를 판단한다(S520).The intelligent call-
발화 주제가 식별되면 발화 주제에 대응되는 STT 서버 유형 정보를 호출하여 선택한다(S570). When the speech topic is identified, STT server type information corresponding to the speech topic is called and selected (S570).
S520 단계에서 발화 주제가 식별되지 않는 경우에는 발화 형태가 자연어 형태인지를 판단한다(S530).If the subject of speech is not identified in step S520, it is determined whether the speech form is a natural language form (S530).
S530 단계에서 발화 형태가 자연어 형태라고 판단되면 AI 계열의 STT 서버로 결정한다(S550).If it is determined that the speech form is a natural language form in step S530, it is determined as an AI-based STT server (S550).
S530 단계에서 발화 형태가 자연어 형태가 아닌 경우라고 판단되면 발화 의도가 복수개인지를 판단한다(S540).If it is determined that the utterance form is not a natural language form in step S530, it is determined whether there are a plurality of utterance intentions (S540).
S540 단계에서 발화 의도가 복수개라고 판단되면 AI 계열의 STT 서버로 결정한다(S550).If it is determined that there are a plurality of utterance intentions in step S540, it is determined as an AI-based STT server (S550).
이때, AT 계열의 STT 서버로는 구글, 왓슨 등의 STT 서버일 수 있다.At this time, the AT series STT server may be an STT server such as Google or Watson.
S540 단계에서 발화 의도가 단수개라고 판단되면 전문 계열의 STT 서버로 결정한다(S560).If it is determined that the utterance intention is singular in step S540, it is determined as a specialized STT server (S560).
이때, 전문 계열의 STT 서버로는 리드스피커코리아, 솔루게이트 등의 STT 서버일 수 있다.At this time, the STT server of a specialized series may be an STT server such as Lead Speaker Korea or Solugate.
도 5는 일실시예에 따른 방법일 뿐이며 다른 알고리즘으로 진행이 가능할 것이다. Fig. 5 is only a method according to an embodiment, and it may be possible to proceed with another algorithm.
예를 들어, S520 단계의 발화 주제의 식별은 텍스트 분석이 아닌 상기 설명한 바와 같이 상담 초기시에 사용자가 입력하는 카테고리 정보 등에 의하여 수행될 수도 있다.For example, the identification of the speech topic in step S520 may be performed not by text analysis, but by category information input by the user at the beginning of the consultation as described above.
또한, S530 단계에서 발화 형태가 자연어 형태가 아닌 경우 바로 S560 단계로 넘어가 전문 계열의 STT 서버로 결정할 수도 있다.In addition, in step S530, if the speech form is not in the natural language form, the process may proceed directly to step S560 and may be determined as a specialized STT server.
또한, S540 단계는 S530 단계 이후가 아닌 S530 단계와 별개로 독립적인 조건으로 사용될 수도 있을 것이다.In addition, step S540 may be used as an independent condition independently of step S530 rather than after step S530.
도 6은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 고객에게 대화 히스토리 및 녹취 파일을 전송하는 방법을 설명하는 순서도이다.6 is a flowchart illustrating a method of transmitting a conversation history and recording file to a customer by an intelligent call bot server according to an embodiment of the present invention.
본 발명의 지능형 콜봇 서버(100)는 대화 히스토리 및 녹취 파일에 대한 다운로드 링크 정보를 고객 단말기(2)로 전송할 수 있다(S610).The intelligent call-
고객이 고객 단말기(2) 상의 링크 정보를 클릭하는 경우 지능형 콜봇 서버(100)는 고객의 링크 클릭 완료 정보를 수신한다(S620).When the customer clicks the link information on the
지능형 콜봇 서버(100)는 고객 단말기(2)로 본인 인증 요청 정보를 전송할 수 있다(S630). 물론, 이때 지능형 콜봇 서버(100)가 직접 인증 요청 정보를 전송하는 것이 아닌 외부 연동 서버를 통하여 인증 요청 메세지가 전송하는 것도 가능하다.The intelligent call-
다음 지능형 콜봇 서버(100)는 본인 인증을 성공하였는지를 판단한다(S640).Next, the intelligent
본인 인증이 성공한 경우에는 대화 히스토리 및 녹취 파일을 전송하고(S650), 성공하지 못한 경우에는 전송하지 않고 인증 실패 메시지 등을 전송하고 전송을 하지 않고 종료한다.If authentication is successful, the conversation history and recording file are transmitted (S650), and if not, the authentication failure message is transmitted without transmission, and the transmission is terminated without transmission.
도 6에서 대화 히스토리 및 녹취 파일 모두를 인증 후에 다운로드 가능한 실시예를 설명하였지만 둘 중에 하나의 파일만 제공하는 것도 가능할 것이다.In FIG. 6, although an embodiment in which both the conversation history and the recording file can be downloaded after authentication has been described, it may be possible to provide only one of the two files.
또한, 대화 히스토리 및 녹취 파일은 상담사 단말기(4)에게도 제공이 가능한데 이 경우 보통 본인인증 필요 없이 관리자 단말기에 의하여 조회가 가능하도록 구성되는 것이 보통일 것이다.In addition, the conversation history and recording files can be provided to the
상기와 같은 방법으로 고객 단말기(2)에 본인 인증을 통하여 대화 히스토리 및 음성 녹취 파일을 제공하는 것은 콜봇을 이용한 전자계약이 이루어지는 경우에 계약 증빙을 위한 자료를 제공하는 측면에서 매우 효과적일 것이다.Providing the conversation history and voice recording file to the
이 경우 고객이 고객 단말기(2)를 통하여 전화망으로 통신을 수행하면서 전자 계약을 하는 경우에 계약의 완료는 전화망으로만 완결시킬 수 있으며 상기와 같은 다운로드 링크 정보는 전화망 또는 인터넷망을 통하여 문자 메시지 형태로 제공할 수 있을 것이다. In this case, when the customer makes an electronic contract while performing communication through the phone network through the customer terminal (2), the contract can be completed only through the phone network, and the download link information as described above is in the form of a text message through the phone network or the Internet network. Will be able to provide.
추후 해당 링크 클릭을 통한 본인 인증 및 다운로드는 인터넷망을 통하여 이루어질 수 있다. 이와 같은 방법으로 인터넷망이 깔리지 않는 도서지역에 위치한 고객들도 간편하게 전화망으로 전자 계약을 완결시킬 수 있으며, 추후 인터넷망이 있는 장소에서 대화 히스토리 및 녹취 파일을 본인 인증을 통하여 다운로드 받음으로써 계약에 대한 증빙을 용이하게 할 수 있다.In the future, identification and download by clicking the link may be performed through the Internet network. In this way, even customers located in island areas where the Internet network is not installed can easily complete an electronic contract through the telephone network, and proof of the contract by downloading conversation history and recording files through self-authentication at a location with an Internet network in the future. Can be facilitated.
도 7은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 상담사 단말기에 제공하는 특정 상담의 발화현황상태를 나타내는 도면이다.7 is a diagram illustrating a state of utterance of a specific consultation provided by an intelligent call bot server to a counselor terminal according to an embodiment of the present invention.
도 7에는 고객과 ARS 사이의 상담 내용이 각 대화별로 구분되어 표시되어 있다. 구체적으로 발신번호, 일시, 화자, 결과, 점수 및 오디오 항목이 표시되어 있다. '결과'란에는 고객 및 ARS의 발화 내용이 텍스트로 표시되어 있으며, '점수'란에는 고객의 답변 내용에 대하여 점수화가 되어 표시되어 있으며, '오디오'란에는 해당 발화 내용의 녹음 파일을 재생할 수 있는 재생 아이콘이 표시되어 있다.In FIG. 7, the content of consultation between the customer and the ARS is divided and displayed for each conversation. Specifically, the calling number, date and time, speaker, result, score, and audio items are displayed. The utterances of the customer and ARS are displayed in text in the ‘Result’ column, the ‘Score’ column shows the customer’s response as a score, and in the ‘Audio’ column, you can play the recorded file of the corresponding utterance. Play icon is displayed.
도 8은 본 발명의 일실시예에 따른 지능형 콜봇 서버가 상담사 단말기에 제공하는 특정 상담사의 상담이력 및 특정 상담에 대한 세부상담현황을 나타내는 도면이다.8 is a diagram illustrating a counseling history of a specific counselor and a detailed counseling status for a specific counseling provided by an intelligent call bot server to a counselor terminal according to an embodiment of the present invention.
도 8에는 '1007' 번호의 상담사가 수행한 4월 한달 동안의 상담 이력이 표시되어 있으며, 우측에는 선택한 특정 상담의 세부 상담 내용이 표시되어 있음을 확인할 수 있다. In FIG. 8, it can be seen that the counseling history for the month of April performed by the counselor of number '1007' is displayed, and detailed counseling contents of the selected specific counseling are displayed on the right side.
각 상담에 대한 'CALL ID', '시작일시', '종료일시', '녹음 시간', 'STT 엔진'의 정보가 표시되어 있으며, 특정 상담에 대하여 상세보기를 클릭하는 경우 우측과 같이 상담사와 고객 간의 세부 대화 내용이 표시된다.Information on'CALL ID','start date and time','end date','recording time', and'STT engine' for each consultation is displayed. Detailed conversations between customers are displayed.
도 7 및 도 8과 같은 상담현황 정보는 실시간으로 제공될 수 있는데 본 발명의 지능형 콜봇 서버(100)의 상기 설명한 바와 같이 패킷 사이즈를 리사이징 하여 STT 서버(20)로 전송하며, 음성 인식의 정확도를 향상시킬 수 있는 최적의 STT 서버(20)을 자동으로 선택함으로써 상기와 같은 실시간 대화 히스토리 정보의 제공에 있어 속도 및 정확도를 향상시킬 수 있다.The counseling status information as shown in FIGS. 7 and 8 can be provided in real time. As described above, the intelligent
도 9는 본 발명의 일실시예에 따른 지능형 콜봇 서버가 상담사 단말기에 제공하는 시나리오 관리하면을 나타내는 도면이다.9 is a diagram illustrating a scenario management surface provided by an intelligent call bot server to a counselor terminal according to an embodiment of the present invention.
도 9의 화면과 같이 각각의 사나리오에 대하여 좌측에 배치된 각각의 다른 기능을 가지는 복수의 노드를 드래그 앤 드롭 방식으로 이동시켜 각각의 노드에 대한 연결 관계를 형성함으로써 시나리오를 변경할 수 있다.As shown in the screen of FIG. 9, the scenario can be changed by moving a plurality of nodes having different functions arranged on the left side of each scenario in a drag-and-drop method to form a connection relationship with each node.
또한, 특정 노드를 선택하는 경우에는 맨 우측에 해당 노드에 대한 상세 속성값을 입력하는 화면이 나타나 관리자는 각각의 노드에 대한 설정값을 입력할 수 있다.In addition, when a specific node is selected, a screen for inputting detailed attribute values for the corresponding node is displayed on the far right, allowing the administrator to input setting values for each node.
도 9와 같이 웹기반으로 기능별 노드를 드래그 앤 드롭 방식으로 조작하는 방식을 채택하여 복잡한 시나리오의 흐름을 손쉽게 파악하고 시나리오 변경도 손쉽게 할 수 있다.As shown in FIG. 9, by adopting a method of manipulating nodes for each function in a web-based manner in a drag-and-drop method, it is possible to easily grasp the flow of complex scenarios and easily change the scenario.
이상으로 본 발명의 실시예들에 따른 지능형 콜봇 서버 및 이를 이용한 무인 접수 방법에 대하여 설명하였다.As described above, an intelligent call bot server and an unattended reception method using the same according to embodiments of the present invention have been described.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Those of ordinary skill in the art to which the present invention pertains will appreciate that the present invention can be implemented in other specific forms without changing the technical spirit or essential features thereof. Therefore, it should be understood that the embodiments described above are illustrative in all respects and are not limiting. The scope of the present invention is indicated by the claims to be described later rather than the detailed description, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts should be construed as being included in the scope of the present invention. do.
2: 고객 단말기 3, 5: 상담사 그룹
4: 상담사 단말기 10: 교환기(IPPBX)
20: STT 서버 30: TTS 서버
40: 컴퓨터 전화 통합 시스템(CTI) 50: 녹취 서버
60: 웹 응용 서버(WAS) 70: 데이터베이스 관리 시스템(DBMS)
80: 전광판 100: 지능형 콜봇 서버(100)
112: 전처리부 114: 구어체 변환부
116: 데이터베이스 118: 멘트 출력부
120: 콜처리부 122: 봇대화 이력관리부
124: 녹취 관리부 126: 인증 처리부
128: 운영기준 관리부 130: 상담 처리부
140: 상담내용 저장부 150: 상담내용 출력부
160: STT 서버 결정부 170: 패킷 처리부
180: 시나리오 관리부2:
4: Consultant terminal 10: Switchboard (IPPBX)
20: STT server 30: TTS server
40: Computer Telephony Integration System (CTI) 50: Recording Server
60: Web Application Server (WAS) 70: Database Management System (DBMS)
80: electronic board 100: intelligent
112: preprocessing unit 114: colloquial conversion unit
116: database 118: comment output
120: call processing unit 122: bot conversation history management unit
124: recording management unit 126: authentication processing unit
128: operation standard management unit 130: consultation processing unit
140: consultation contents storage unit 150: consultation contents output unit
160: STT server determination unit 170: packet processing unit
180: Scenario Management Department
Claims (16)
상기 지능형 콜봇 서버는 상기 교환기를 통하여 고객의 상담 요청이 접수되는 경우 상기 교환기로 호를 연결하고, 상기 교환기로 입력되는 고객의 음성을 상기 STT 서버를 통하여 수신 텍스트로 변환하고, 상기 변환된 수신 텍스트를 분석하여 발신 텍스트를 생성하고, 상기 발신 텍스트를 상기 TTS 서버를 통하여 발신 음성으로 변환하고, 상기 발신 음성을 상기 교환기를 통하여 고객에게 송출하도록 구성되고,
상기 수신 텍스트의 분석 결과를 기초로 음성 인식률을 향상시킬 수 있는 STT 서버의 유형을 결정하고, 상기 결정된 STT 서버의 유형에 따라 상기 STT 서버 중 최적의 STT 서버를 연결하여 음성 인식을 수행하도록 하는 STT 서버 결정부를 포함하는 지능형 콜봇 서버.In the intelligent call bot server that provides unmanned consultation service to customers by interlocking with the exchange of the call center system, TTS server, and multiple STT servers,
The intelligent call-bot server connects a call to the exchange when a customer's consultation request is received through the exchange, converts the customer's voice input to the exchange into a received text through the STT server, and converts the received text Is configured to generate an outgoing text by analyzing the outgoing text, convert the outgoing text into an outgoing voice through the TTS server, and transmit the outgoing voice to a customer through the exchange,
STT to determine the type of STT server capable of improving the speech recognition rate based on the analysis result of the received text, and to perform speech recognition by connecting the optimal STT server among the STT servers according to the determined type of STT server Intelligent call-bot server including a server decision unit.
상기 STT 서버 결정부는, 상기 수신 텍스트를 분석하여 발화 형태, 발화 주제, 발화 의도 중 어느 하나를 파악하여 음성 인식률을 향상시킬 수 있는 STT 서버의 유형을 결정하는 것을 특징으로 하는 지능형 콜봇 서버.The method of claim 1,
The STT server determination unit analyzes the received text to determine any one of a speech type, speech topic, and speech intention to determine a type of STT server capable of improving a speech recognition rate.
상기 STT 서버 결정부는, 상기 발화 주제별 최적의 STT 서버의 유형 정보에 관한 STT 유형 데이터베이스를 미리 구축하고 있으며, 상기 STT 유형 데이터베이스를 기초로 상기 발화 주제에 최적인 STT 서버를 선택하여 연결하는 것을 특징으로 하는 지능형 콜봇 서버.The method of claim 2,
The STT server determination unit has previously built an STT type database on type information of the optimal STT server for each utterance topic, and selects and connects the STT server optimal for the utterance topic based on the STT type database. Intelligent callbot server.
상기 STT 서버 결정부는, 상기 발화 형태가 자연어 형태인 경우 또는 상기 발화 의도가 복수의 의도를 포함하는 것으로 판단된 경우 AI 계열의 STT 서버를 선택하여 연결하는 것을 특징으로 하는 지능형 콜봇 서버.The method of claim 2,
The STT server determination unit, when the speech type is a natural language type or when it is determined that the speech intention includes a plurality of intentions, the intelligent call bot server, characterized in that for selecting and connecting an AI-based STT server.
상기 STT 서버 결정부는, 상기 발화 형태가 전문용어를 포함하는 전문 발화 형태인 경우 또는 상기 발화 의도가 단일의 의도를 포함하는 것으로 판단된 경우 전문 계열의 STT 서버를 선택하여 연결하는 것을 특징으로 하는 지능형 콜봇 서버.The method of claim 2,
The STT server determination unit selects and connects a specialized STT server when the utterance type is a specialized utterance form including a terminology or when the utterance intention is determined to include a single intention. Callbot server.
상기 고객의 음성 데이터 패킷을 분석하여 무음 구간 또는 볼륨값이 미리 설정된 기준값 이하인 약음 구간을 산출하고, 버퍼(buffer)를 이용하여 상기 무음 구간 또는 상기 약음 구간의 전후로 패킷 단위를 가변시켜 상기 STT 서버로 전송하는 패킷 처리부를 더 포함하는 지능형 콜봇 서버.The method of claim 2,
By analyzing the voice data packet of the customer, a silent section or a soft tone section in which the volume value is less than a preset reference value is calculated, and the packet unit is changed before and after the silent section or the attenuated section using a buffer to the STT server. Intelligent call-bot server further comprising a packet processing unit to transmit.
상기 고객과 상기 지능형 콜봇 서버와의 대화 히스토리 및 음성 녹취를 관리하는 콜처리부를 더 포함하고,
상기 콜처리부는 네트워크를 통하여 연결된 상담사 단말기에 상기 대화 히스토리를 실시간으로 제공하고, 상기 음성 녹취를 확인할 수 있는 링크 정보를 제공하는 것을 특징으로 하는 지능형 콜봇 서버.The method of claim 2,
Further comprising a call processing unit for managing the conversation history and voice recording between the customer and the intelligent call bot server,
The call processing unit provides the conversation history to a counselor terminal connected through a network in real time, and provides link information for confirming the voice recording.
상기 콜처리부는 네트워크를 통하여 연결된 상기 고객의 단말기에 상기 대화 히스토리와, 상기 음성 녹취를 확인할 수 있는 링크 정보를 제공할 수 있도록 구성된 것을 특징으로 하는 지능형 콜봇 서버.The method of claim 7,
The call processing unit is configured to provide link information for confirming the conversation history and the voice recording to the customer's terminal connected through a network.
상기 콜처리부는 상기 고객의 본인 인증이 완료된 경우에 상기 음성 녹취를 확인할 수 있는 링크 정보를 제공하는 것을 특징으로 하는 지능형 콜봇 서버.The method of claim 8,
The call processing unit intelligent call bot server, characterized in that to provide link information for confirming the voice recording when the customer's identity authentication is completed.
네트워크를 통하여 연결된 상담사 단말기에 상기 고객과 상기 지능형 콜봇 서버의 대화 시나리오를 실시간 확인 및 변경할 수 있는 시나리오 관리 화면을 제공하는 시나리오 관리부를 포함하고,
상기 시나리오 관리 화면은 각각 다른 기능을 가지는 복수의 노드를 드래그 앤 드롭 방식으로 연결하여 플로우를 형성할 수 있도록 구성된 것을 특징으로 하는 지능형 콜봇 서버.The method of claim 2,
A scenario management unit that provides a scenario management screen capable of checking and changing a conversation scenario between the customer and the intelligent call bot server in real time to a counselor terminal connected through a network,
The scenario management screen is configured to form a flow by connecting a plurality of nodes each having a different function in a drag-and-drop method.
(a) 교환기를 통하여 고객의 호 접속 요청을 수신하는 단계;
(b) 상기 교환기와 상기 지능형 콜봇 서버 사이의 호를 연결하는 단계;
(c) 상기 교환기로부터 입력되는 고객의 음성을 상기 STT 서버를 통하여 수신 텍스트로 변환하는 단계;
(d) 상기 변환된 수신 텍스트를 분석하여 발신 텍스트를 생성하는 단계;
(e) 상기 TTS 서버를 통하여 상기 발신 텍스트를 발신 음성으로 변환하는 단계;
(f) 상기 변환된 발신 음성을 상기 교환기를 통하여 상기 고객에게 송출하는 단계;
(g) 상기 수신 텍스트의 분석 결과를 기초로 음성 인식률을 향상시킬 수 있는 STT 서버의 유형을 결정하는 단계; 및
(h) 상기 결정된 STT 서버의 유형에 따라 상기 STT 서버 중 최적의 STT 서버를 연결하여 음성 인식을 수행하는 단계를 포함하는 무인 상담 방법.In the unmanned consultation method using an intelligent call bot server interlocked with an exchange of a call center system, a TTS server, and a plurality of STT servers,
(a) receiving a call connection request from a customer through an exchange;
(b) connecting a call between the exchange and the intelligent call-bot server;
(c) converting the customer's voice input from the exchange into a received text through the STT server;
(d) analyzing the converted received text to generate an outgoing text;
(e) converting the outgoing text into outgoing voice through the TTS server;
(f) transmitting the converted outgoing voice to the customer through the exchange;
(g) determining a type of STT server capable of improving a speech recognition rate based on the analysis result of the received text; And
(h) Unmanned counseling method comprising the step of performing voice recognition by connecting an optimal STT server among the STT servers according to the determined type of STT server.
상기 (g) 단계는, 상기 수신 텍스트를 분석하여 발화 형태, 발화 주제, 발화 의도 중 어느 하나를 파악하여 음성 인식률을 향상시킬 수 있는 STT 서버의 유형을 결정하는 것을 특징으로 하는 무인 상담 방법.The method of claim 11,
In the step (g), the received text is analyzed to determine any one of a speech form, speech topic, and speech intention to determine a type of STT server capable of improving a speech recognition rate.
상기 (c) 단계는,
상기 고객의 음성 데이터 패킷을 분석하여 무음 구간 또는 볼륨값이 미리 설정된 기준값 이하인 약음 구간을 산출하는 단계; 및
버퍼(buffer)를 이용하여 상기 무음 구간 또는 상기 약음 구간의 전후로 패킷 단위를 가변시켜 상기 STT 서버로 전송하는 단계를 포함하는 무인 상담 방법.The method of claim 12,
The step (c),
Analyzing the voice data packet of the customer to calculate a silent section or a soft tone section in which a volume value is less than or equal to a preset reference value; And
And transmitting to the STT server by varying a packet unit before and after the silent period or the attenuated period using a buffer.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020210006362A KR102241532B1 (en) | 2021-01-15 | 2021-01-15 | Intelligent callbot server and unmanned counsel systeim using thereof |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020210006362A KR102241532B1 (en) | 2021-01-15 | 2021-01-15 | Intelligent callbot server and unmanned counsel systeim using thereof |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR102241532B1 true KR102241532B1 (en) | 2021-04-16 |
Family
ID=75743541
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020210006362A Active KR102241532B1 (en) | 2021-01-15 | 2021-01-15 | Intelligent callbot server and unmanned counsel systeim using thereof |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR102241532B1 (en) |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114025050A (en) * | 2021-11-08 | 2022-02-08 | 浙江百应科技有限公司 | Speech recognition method and device based on intelligent outbound and text analysis |
| KR102369263B1 (en) * | 2021-12-08 | 2022-03-04 | 주식회사 세븐포인트원 | Method, apparatus and system for controlling volume of outbound call for dementia test of subject based on artificial intelligence |
| CN114500757A (en) * | 2022-01-07 | 2022-05-13 | 马上消费金融股份有限公司 | Voice interaction method and device, computer equipment and storage medium |
| KR20220155065A (en) * | 2021-05-14 | 2022-11-22 | (주)와이즈에이아이 | System and method for providing automatic response call service based on ai chatbot |
| KR20240047850A (en) | 2022-10-05 | 2024-04-12 | 이명재 | Omni-channel ai counseling bot serverand unmanned counseling service providing method using thereof |
| KR102671579B1 (en) * | 2023-08-14 | 2024-06-03 | 무 혁 권 | Method for connect a call to customer center through automatic voice and text conversion |
| KR102747255B1 (en) * | 2024-09-19 | 2024-12-27 | (주)와이즈에이아이 | System for executing inbound ai calls by way of serving web content and image analysis results |
| KR20250009831A (en) * | 2023-07-11 | 2025-01-20 | 주식회사 케이티 | Server, methoed and computer providing call assistant service |
| KR102862233B1 (en) * | 2023-12-18 | 2025-09-22 | 주식회사 브리지텍 | Device and method for testing automatic response scenario |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101179915B1 (en) * | 2011-12-29 | 2012-09-06 | 주식회사 예스피치 | Apparatus and method for cleaning up vocalization data in Voice Recognition System provided Statistical Language Model |
| KR20160100412A (en) | 2014-03-17 | 2016-08-23 | 어드밴스드 미디어, 인코포레이티드 | Call Recording Server, Call-Data Management System, and Call-Data Management Method |
| KR101901920B1 (en) * | 2018-03-07 | 2018-11-14 | 주식회사 아크로노드 | System and method for providing reverse scripting service between speaking and text for ai deep learning |
| KR102163081B1 (en) * | 2020-04-08 | 2020-10-07 | (주)아이컴시스 | Interactive voice bot server and unmanned counsel system |
-
2021
- 2021-01-15 KR KR1020210006362A patent/KR102241532B1/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101179915B1 (en) * | 2011-12-29 | 2012-09-06 | 주식회사 예스피치 | Apparatus and method for cleaning up vocalization data in Voice Recognition System provided Statistical Language Model |
| KR20160100412A (en) | 2014-03-17 | 2016-08-23 | 어드밴스드 미디어, 인코포레이티드 | Call Recording Server, Call-Data Management System, and Call-Data Management Method |
| KR101901920B1 (en) * | 2018-03-07 | 2018-11-14 | 주식회사 아크로노드 | System and method for providing reverse scripting service between speaking and text for ai deep learning |
| KR102163081B1 (en) * | 2020-04-08 | 2020-10-07 | (주)아이컴시스 | Interactive voice bot server and unmanned counsel system |
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20220155065A (en) * | 2021-05-14 | 2022-11-22 | (주)와이즈에이아이 | System and method for providing automatic response call service based on ai chatbot |
| KR102518448B1 (en) * | 2021-05-14 | 2023-04-06 | (주)와이즈에이아이 | System and method for providing automatic response call service based on ai chatbot |
| CN114025050A (en) * | 2021-11-08 | 2022-02-08 | 浙江百应科技有限公司 | Speech recognition method and device based on intelligent outbound and text analysis |
| KR102369263B1 (en) * | 2021-12-08 | 2022-03-04 | 주식회사 세븐포인트원 | Method, apparatus and system for controlling volume of outbound call for dementia test of subject based on artificial intelligence |
| CN114500757A (en) * | 2022-01-07 | 2022-05-13 | 马上消费金融股份有限公司 | Voice interaction method and device, computer equipment and storage medium |
| KR20240047850A (en) | 2022-10-05 | 2024-04-12 | 이명재 | Omni-channel ai counseling bot serverand unmanned counseling service providing method using thereof |
| KR20250009831A (en) * | 2023-07-11 | 2025-01-20 | 주식회사 케이티 | Server, methoed and computer providing call assistant service |
| KR102847095B1 (en) * | 2023-07-11 | 2025-08-20 | 주식회사 케이티 | Server, methoed and computer providing call assistant service |
| KR102671579B1 (en) * | 2023-08-14 | 2024-06-03 | 무 혁 권 | Method for connect a call to customer center through automatic voice and text conversion |
| KR102862233B1 (en) * | 2023-12-18 | 2025-09-22 | 주식회사 브리지텍 | Device and method for testing automatic response scenario |
| KR102747255B1 (en) * | 2024-09-19 | 2024-12-27 | (주)와이즈에이아이 | System for executing inbound ai calls by way of serving web content and image analysis results |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102241532B1 (en) | Intelligent callbot server and unmanned counsel systeim using thereof | |
| KR102163081B1 (en) | Interactive voice bot server and unmanned counsel system | |
| US11636430B2 (en) | Device, system and method for summarizing agreements | |
| US9565310B2 (en) | System and method for message-based call communication | |
| US9699315B2 (en) | Computer-implemented system and method for processing caller responses | |
| US7609829B2 (en) | Multi-platform capable inference engine and universal grammar language adapter for intelligent voice application execution | |
| US7242752B2 (en) | Behavioral adaptation engine for discerning behavioral characteristics of callers interacting with an VXML-compliant voice application | |
| US20210136207A1 (en) | Methods and systems for seamless outbound cold calls using virtual agents | |
| US9225841B2 (en) | Method and system for selecting and navigating to call examples for playback or analysis | |
| US7136814B1 (en) | Syntax-driven, operator assisted voice recognition system and methods | |
| US20210136205A1 (en) | Methods and systems of virtual agent real-time recommendation, suggestion and advertisement | |
| EP1976255B1 (en) | Call center with distributed speech recognition | |
| US20210134284A1 (en) | Methods and systems for personalized virtual agents to learn from customers | |
| US20210134283A1 (en) | Methods and systems of virtual agent real-time recommendation, suggestion and advertisement | |
| US20170155768A1 (en) | Method and system for analyzing caller interaction event data | |
| US20210136206A1 (en) | Virtual agents within a cloud-based contact center | |
| US20210136204A1 (en) | Virtual agents within a cloud-based contact center | |
| US20210133765A1 (en) | Methods and systems for socially aware virtual agents | |
| US20210136209A1 (en) | Methods and systems for virtual agents to check caller identity via multi channels | |
| KR100986971B1 (en) | Call recording service method and system | |
| TW202036323A (en) | Intelligent online customer service convergence core system which can provide a reply or query to an intention generated through voice recognition and natural language processing procedures | |
| CN117424960A (en) | Intelligent voice service method, device, terminal equipment and storage medium | |
| US8027457B1 (en) | Process for automated deployment of natural language | |
| KR102163067B1 (en) | Unmanned receiving bot server and unmanned receiving method using the same | |
| KR102810361B1 (en) | Integrated callbot server using multi-dimentional structured database and unmanned counsel system using thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20210115 |
|
| PA0201 | Request for examination | ||
| PA0302 | Request for accelerated examination |
Patent event date: 20210115 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination |
|
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210324 Patent event code: PE09021S01D |
|
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210408 |
|
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210412 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20210412 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |