KR20250045973A - System of providing natural language response to user queries - Google Patents
System of providing natural language response to user queries Download PDFInfo
- Publication number
- KR20250045973A KR20250045973A KR1020230129604A KR20230129604A KR20250045973A KR 20250045973 A KR20250045973 A KR 20250045973A KR 1020230129604 A KR1020230129604 A KR 1020230129604A KR 20230129604 A KR20230129604 A KR 20230129604A KR 20250045973 A KR20250045973 A KR 20250045973A
- Authority
- KR
- South Korea
- Prior art keywords
- query
- natural language
- user terminal
- feature information
- authentication key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/08—Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
- H04L9/0861—Generation of secret information including derivation or calculation of cryptographic keys or passwords
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/32—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명의 사용자 질의에 대한 자연어 응답 제공 시스템은, 내부 네트워크 상에 연결되어, 동일한 내부 네트워크 상에 위치하는 사용자단말에 사전 정의된 인증키를 생성 제공하는 인증키 생성 서버와 분야별 텍스트 기반 데이터가 저장되는 데이터베이스 및 데이터베이스에 저장된 분야별 텍스트 기반 데이터를 문자열 단위로 분리하고, 분리된 문자열 내의 문장 또는 단어로부터 특징을 추출하여, 추출한 특징을 통해 분야별 특징정보를 재생성하며, 사용자단말로부터 입력된 질의에 대응되는 특징정보를 포함하는 문자열을 자연어 처리 서버에 송신하고, 자연어 처리 서버로부터 수신한 자연어 처리된 문자열을 해당 사용자단말에 중개 제공하는 질의 응답 서버를 포함하며, 질의 응답 서버는 인증키 생성 서버로부터 사용자단말에 제공된 인증키를 인증하고, 인증키가 유효한 경우에 한하여, 해당 사용자단말의 질의에 따른 자연어 응답을 제공하는 것을 특징으로 한다.The system for providing a natural language response to a user's query of the present invention includes an authentication key generation server which is connected to an internal network and generates and provides a predefined authentication key to a user terminal located on the same internal network, a database which stores text-based data by field, and a query response server which divides the text-based data by field stored in the database into string units, extracts features from sentences or words in the divided strings, regenerates feature information by field through the extracted features, transmits a string including feature information corresponding to a query input from a user terminal to a natural language processing server, and provides a natural language processed string received from the natural language processing server to the corresponding user terminal. The query response server is characterized in that it authenticates an authentication key provided to the user terminal from the authentication key generation server and provides a natural language response according to the query of the corresponding user terminal only when the authentication key is valid.
Description
본 발명은 사용자단말로부터 입력된 질의에 대한 응답을 자연어 형태로 제공하는 사용자 질의에 대한 자연어 응답 제공 시스템에 관한 것이다.The present invention relates to a system for providing a natural language response to a user query, which provides a response to a query input from a user terminal in the form of natural language.
최근 ChatGPT 등과 같은 AI 기술의 발전에 의해, 사용자가 요청한 질의에 대해 웹 검색을 수행하고, 그에 따른 답변을 제공하는 기술이 등장하였다.Recently, with the advancement of AI technologies such as ChatGPT, technologies have emerged that perform web searches for queries requested by users and provide answers accordingly.
이러한 AI 질의응답 기술은 질문자의 의도를 파악하고 이미 구축된 웹 환경에서 의도에 적합한 데이터를 추출하고, 추출된 데이터를 사용자가 원하는 답변의 형태로 재가공하여 제공하는 일련의 과정을 거치게 된다.This AI question-answering technology goes through a series of processes to identify the questioner's intent, extract data appropriate to the intent from an already built web environment, and reprocess the extracted data into the form of an answer desired by the user.
한편, 이러한 AI기반의 질의응답 기술은 웹 자료 검색, 유사도 분석 및 자연어 처리 등에 서버 단위의 리소스가 소요되고, 해당 기능을 수행하는 서버의 자체 구축에는 많은 비용이 소요됨에 따라, 일반 사용자가 자체적으로 구축하기에는 무리가 있으며, 사용자가 해당 환경이 이미 구축된 질의응답 서비스를 이용하고 이용량만큼의 비용을 지불하는 형태로 서비스가 이루어져 왔으며, 이러한 자연어 질의 응답과 관련된 기술은, 대한민국 등록특허공보 제10-0452024호(출원일:2001.01.08., 공고일: 2004.10.08., 이하, ‘종래기술’이라 칭함)에 개시된 바 있다. Meanwhile, since such AI-based question-answering technology requires server-level resources for web data search, similarity analysis, and natural language processing, and it costs a lot of money to build a server that performs the corresponding functions, it is difficult for general users to build it on their own, and the service has been provided in the form of users using a question-answering service in which the corresponding environment has already been built and paying only for the amount of usage. The technology related to such natural language question-answering is disclosed in Republic of Korea Patent Publication No. 10-0452024 (Application date: 2001.01. 08., Publication date: 2004.10. 08., hereinafter referred to as “prior art”).
하지만, 종래기술은 사용자의 질의에 대하여 웹 환경에서의 유의미한 자료의 선별 검색, 응답 처리에 대한 전체 프로세스를 수행하기 때문에, 사용자의 질의에 발생되는 비용이 높게 책정될 수 있고, 질의를 요청하는 사용자가 유효한지 여부를 확인하지 못함에 따라, 비인가 사용자에 의한 질의 요청으로 인해 불필요한 비용이 발생할 수 있다.However, since the prior art performs the entire process of selecting, searching, and responding to meaningful data in a web environment in response to a user's query, the cost incurred in response to the user's query may be set high, and since it is not possible to verify whether the user requesting the query is valid, unnecessary costs may be incurred due to query requests by unauthorized users.
또한, 종래기술은 검색결과에 따른 응답을 단답형으로 제공함에 따라 사용자의 어휘력에 따라 정확한 응답을 전달하기에 무리가 있으며, 웹 기반 자료에서의 자료 선별 과정에서 불필요한 노이즈가 많이 발생할 경우, 비전문적인 응답을 도출할 가능성이 높은 문제가 있었다.In addition, since the conventional technology provides responses based on search results in the form of short answers, it is difficult to deliver accurate responses depending on the user's vocabulary, and there is a problem that if a lot of unnecessary noise occurs during the data selection process in web-based data, there is a high possibility of deriving non-professional responses.
더욱이, 공공기관 등에 구축된 독립/폐쇄형 웹서비스 환경에서는 외부서버의 API(Application Programming Interface) 접속을 위한 권한과 접속환경이 제공되지 못하나, 종래기술은 상술한 환경에서의 적용이 불가능함에 따라, 자연어 처리 등과 같은 외부 Open AI 서비스를 제공할 수 없는 문제점이 있었다.Furthermore, in the independent/closed web service environment established in public institutions, etc., the authority and connection environment for accessing the API (Application Programming Interface) of an external server are not provided, but since the conventional technology cannot be applied in the above-described environment, there was a problem in that external Open AI services such as natural language processing could not be provided.
본 발명은 상술한 문제점을 해결하기 위해, 사용자의 질의 요청이 유효한지 여부를 확인하고, 확인된 사용자 질의에 대한 자연어 응답 처리에 발생되는 비용을 최소화하면서 전달력 높은 질의응답을 제공하며, 독립/폐쇄형 웹서비스 환경에서도 외부 서비스를 제공할 수 있는 사용자 질의에 대한 자연어 응답 시스템을 제공하는 것을 목적으로 한다.The present invention aims to provide a natural language response system for user queries that can verify whether a user's query request is valid, minimize the cost incurred in processing a natural language response to the verified user query, provide a highly transferable query response, and provide an external service even in an independent/closed web service environment, in order to solve the above-described problem.
본 발명의 일 실시예에 따른 사용자 질의에 대한 자연어 응답 제공 시스템은, 내부 네트워크 상에 연결되어, 동일한 내부 네트워크 상에 위치하는 사용자단말에 사전 정의된 인증키를 생성 제공하는 인증키 생성 서버; 분야별 텍스트 기반 데이터가 저장되는 데이터베이스; 상기 데이터베이스에 저장된 분야별 텍스트 기반 데이터를 문자열 단위로 분리하고, 분리된 문자열 내의 문장 또는 단어로부터 특징을 추출하여, 추출한 특징을 통해 분야별 특징정보를 재생성하며, 사용자단말로부터 입력된 질의에 대응되는 특징정보를 포함하는 문자열을 자연어 처리 서버에 송신하고, 자연어 처리 서버로부터 수신한 자연어 처리된 문자열을 해당 사용자단말에 중개 제공하는 질의 응답 서버;를 포함하며, 상기 질의 응답 서버는 상기 인증키 생성 서버로부터 사용자단말에 제공된 인증키를 인증하고, 인증키가 유효한 경우에 한하여, 해당 사용자단말의 질의에 따른 자연어 응답을 제공하는 것을 특징으로 한다.According to one embodiment of the present invention, a system for providing a natural language response to a user query includes: an authentication key generation server which is connected to an internal network and generates and provides a predefined authentication key to a user terminal located on the same internal network; a database in which text-based data by field is stored; a query response server which divides the text-based data by field stored in the database into string units, extracts features from sentences or words in the divided strings, regenerates feature information by field through the extracted features, transmits a string including feature information corresponding to a query input from a user terminal to a natural language processing server, and provides a natural language processed string received from the natural language processing server to the corresponding user terminal; wherein the query response server authenticates an authentication key provided to the user terminal from the authentication key generation server, and provides a natural language response according to the query of the corresponding user terminal only when the authentication key is valid.
여기서, 상기 인증키 생성 서버는 자연어 응답 요청 횟수, 자연어 응답 요청 유효 주기를 포함하는 인증키를 생성하여 상기 사용자단말에 제공하는 것을 특징으로 한다.Here, the authentication key generation server is characterized by generating an authentication key including the number of natural language response requests and the natural language response request validity period and providing the authentication key to the user terminal.
또한, 상기 질의 응답 서버는, 상기 데이터베이스, 사용자단말 및 자연어 처리 시스템과 통신하는 통신부; 상기 인증키 생성 서버로부터 제공된 사용자단말의 인증키를 인증하는 인증부; 상기 데이터베이스에 저장된 분야별 텍스트 기반 데이터를 수집하는 수집부; 상기 수집부가 수집한 분야별 텍스트 기반 데이터를 문자열 단위로 분리하고, 분리된 문자열 내의 문장 또는 단어로부터 특징정보를 생성하는 추출부; 및 상기 통신부가 상기 인증부를 통해 인증키가 유효한 것으로 확인된 사용자단말로부터 수신한 질의 문자열과 상기 추출부가 생성한 특징정보를 비교하여, 일치 정도가 가장 높은 특징정보를 포함하는 문자열을 선택하는 비교부;를 포함하며, 상기 비교부는 상기 추출부를 통해 상기 통신부로부터 상기 사용자단말로부터 수신한 질의 문자열 내의 특징을 추출하고, 추출한 특징과 일치 정도가 가장 높은 특징정보를 포함하는 선택하는 것을 특징으로 한다.In addition, the query response server includes a communication unit that communicates with the database, the user terminal, and the natural language processing system; an authentication unit that authenticates an authentication key of the user terminal provided from the authentication key generation server; a collection unit that collects text-based data by field stored in the database; an extraction unit that separates the text-based data by field collected by the collection unit into string units and generates feature information from sentences or words in the separated strings; and a comparison unit that compares a query string received by the communication unit from a user terminal whose authentication key has been confirmed to be valid through the authentication unit with the feature information generated by the extraction unit, and selects a string including feature information with the highest degree of matching; and the comparison unit is characterized in that it extracts features in the query string received from the user terminal by the communication unit through the extraction unit, and selects feature information including the feature information with the highest degree of matching with the extracted feature.
그리고, 상기 추출부는 상기 수집부가 상기 데이터베이스로부터 추가 또는 변경된 임의의 분야에 대한 텍스트 기반 데이터를 수집한 경우에 한하여, 해당 분야의 텍스트 기반 데이터를 문자열 단위로 재분리하고, 분리된 문자열 내의 문장 또는 단어로부터 특징을 추출하여 분야별 특징정보를 재생성하는 것을 특징으로 한다.And, the extraction unit is characterized in that, only when the collection unit collects text-based data for any field added or changed from the database, the text-based data for the field is re-separated into strings, and features are extracted from sentences or words within the separated strings to regenerate feature information for each field.
게다가, 상기 추출부는 하기의 [식 1]을 통해, 각 텍스트 기반 데이터 내의 임의의 단어 또는 문장에 대한 제 1값으로부터 특징정보를 생성하는 것을 특징으로 한다.In addition, the above extraction unit is characterized by generating feature information from the first value for any word or sentence in each text-based data through the following [Formula 1] .
[식 1][Formula 1]
덧붙여, 상기 추출부는 하기의 [식 2]을 통해, 전체 텍스트 기반 데이터 내의 임의의 단어 또는 문장에 대한 제 2값으로부터 특징정보를 생성하는 것을 특징으로 한다.In addition, the above extraction unit is characterized by generating feature information from the second value for any word or sentence in the entire text-based data through the following [Formula 2] .
[식 2][Formula 2]
이때, 상기 추출부는 상기 제1 값과 제2 값의 곱 연산하여, 임의의 단어 또는 문장에 대한 실수 벡터(vector) 형태의 특징정보를 생성하는 것을 특징으로 한다.At this time, the extraction unit is characterized by generating feature information in the form of a real number vector for an arbitrary word or sentence by performing a product operation of the first value and the second value.
한편, 상기 비교부는 상기 사용자단말로부터 수신된 질의 문자열 내의 단어 또는 문장에 해당하는 특징과 사전 생성된 각 단어 또는 문장에 대한 특징정보를 비교하여, 유사도가 높은 특징정보를 확인하고, 확인된 특징정보의 실수 벡터 값을 질의 문자열 내의 특징에 부여하는 것을 특징으로 한다.Meanwhile, the comparison unit is characterized by comparing features corresponding to words or sentences in a query string received from the user terminal with feature information for each word or sentence generated in advance, identifying feature information with a high degree of similarity, and assigning a real number vector value of the identified feature information to the feature in the query string.
아울러, 기 비교부로는 질의 문자열 내의 단어 또는 문장에 대한 실수 벡터 값과 상기 추출부로부터 생성된 각 단어 또는 문장의 특징정보의 실수 벡터 값에 대한 코사인 유사도(Cosine Similarity)를 확인하여, 코사인 유사도가 높은 단어 또는 문장이 포함된 문자열을 질의 문자열에 대한 응답으로 적합한 문자열로 선택하는 것을 특징으로 한다.In addition, the present invention is characterized in that the cosine similarity between the real number vector values of words or sentences in the query string and the real number vector values of the feature information of each word or sentence generated from the extraction unit is checked by the base comparison unit, and a string including a word or sentence with a high cosine similarity is selected as a string suitable as a response to the query string.
본 발명에 따른 사용자 질의에 대한 자연어 응답 제공 시스템은, 인증키 생성 서버의 인증키 발급 방식으로, 질의 응답 서버가 유효한 인증키가 발급된 사용자단말에 한하여, 사용자단말의 질의 요청 수신, 자연어 처리 서버로의 내용 전달 및 사용자단말로의 자연어 처리 서버로부터 자연어 처리된 응답을 제공함에 따라, 인증키를 기반으로 독립/폐쇄형 웹서비스 환경에 위치한 사용자단말도 외부 네트워트 상의 자연어 처리 서비스 이용이 가능한 효과가 있다.The system for providing a natural language response to a user query according to the present invention uses an authentication key issuance method of an authentication key generation server, and the query response server receives a query request from a user terminal, transmits the content to a natural language processing server, and provides a natural language processed response from the natural language processing server to the user terminal only for a user terminal to which a valid authentication key has been issued, thereby enabling a user terminal located in an independent/closed web service environment to use a natural language processing service on an external network based on the authentication key.
또한, 본 발명에 따른 사용자 질의에 대한 자연어 응답 제공 시스템은, 사용자단말로부터 수신한 질의에 가장 적합한 동 분야의 텍스트 기반 데이터 내의 문자열을 선택하고, 선택한 문자열만을 자연어 처리 서버에 전달하여, 자연어 처리된 응답을 사용자단말에 제공함으로써, 질의 전체에 대한 자연어 응답 처리 방식에 비해 발생되는 비용을 최소화면서 동일한 수준의 자연어 응답을 제공할 수 있는 효과가 있다.In addition, the system for providing a natural language response to a user query according to the present invention selects a character string within text-based data of the same field that is most suitable for a query received from a user terminal, transmits only the selected character string to a natural language processing server, and provides a naturally processed response to the user terminal, thereby having the effect of providing a natural language response of the same level while minimizing the cost incurred compared to a natural language response processing method for the entire query.
도 1은 본 발명의 바람직한 실시예에 따른 사용자 질의에 대한 자연어 응답 제공 시스템을 대략적으로 도식한 것이다.
도 2 내지 도 3은 본 발명의 바람직한 실시예에 따른 사용자 질의에 대한 자연어 응답 제공 시스템에서의 질의 응답 서버의 각 구성에 의한 자연어 응답 제공 방법을 시각화한 것이다.FIG. 1 is a schematic diagram of a system for providing natural language responses to user queries according to a preferred embodiment of the present invention.
FIGS. 2 and 3 visualize a method for providing a natural language response by each configuration of a question response server in a system for providing a natural language response to a user query according to a preferred embodiment of the present invention.
이하, 첨부한 도면을 참조하여 본 발명의 사용자 질의에 대한 자연어 응답 시스템에 대한 바람직한 실시 예를 상세히 설명한다.Hereinafter, a preferred embodiment of a natural language response system for a user inquiry of the present invention will be described in detail with reference to the attached drawings.
각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 또한 본 발명의 실시 예들에 대해서 특정한 구조적 내지 기능적 설명들은 단지 본 발명에 따른 실시 예를 설명하기 위한 목적으로 예시된 것으로, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는 것이 바람직하다.The same reference numerals presented in each drawing represent the same members. In addition, specific structural and functional descriptions of the embodiments of the present invention are merely illustrative for the purpose of explaining the embodiments according to the present invention, and unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as generally understood by those of ordinary skill in the art to which the present invention belongs. Terms defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning they have in the context of the related art, and are preferably not interpreted in an ideal or excessively formal meaning unless explicitly defined herein.
도 1은 본 발명의 바람직한 실시예에 따른 사용자 질의에 대한 자연어 응답 제공 시스템을 대략적으로 도식한 것이고, 도 2 내지 도 3은 본 발명의 바람직한 실시예에 따른 사용자 질의에 대한 자연어 응답 제공 시스템에서의 질의 응답 서버의 각 구성에 의한 자연어 응답 제공 방법을 시각화한 것이다.FIG. 1 is a schematic diagram of a system for providing a natural language response to a user query according to a preferred embodiment of the present invention, and FIGS. 2 and 3 are visual diagrams of a method for providing a natural language response by each configuration of a query response server in a system for providing a natural language response to a user query according to a preferred embodiment of the present invention.
도 1 내지 도 3을 참조하여 설명하자면, 본 발명의 바람직한 실시예에 따른 사용자 질의에 대한 자연어 응답 제공 시스템은, 질의 응답 서버(100), 인증키 생성 서버(200) 및 데이터베이스(300)를 포함할 수 있다.Referring to FIGS. 1 to 3, a system for providing a natural language response to a user query according to a preferred embodiment of the present invention may include a query response server (100), an authentication key generation server (200), and a database (300).
이하에서는, 본 발명의 바람직한 실시예에 따른 질의 응답 서버(100)를 통해 독립/폐쇄형 웹서비스 환경에 위치하여 외부 네트워크에 위치한 자연어 처리 서버(500) 서버에 직접적인 요청이 불가능한 사용자단말(400)에 사용자단말(400)로부터 요청된 질의를 자연어 처리 서버(500)에서 자연어 처리하여, 재차 사용자단말(400)에 제공하는 것에 한하여 각 구성과 동작을 설명하도록 하나, 이에 국한되지 않고, 독립/폐쇄형 웹서비스 환경 외에도 다양한 환경에 적용이 가능한 것으로 이해되어져야 할 것이다. 또한, 설명의 편의를 위해, 독립/폐쇄형 환경 상의 네트워크와 독립/폐쇄형 환경에서 직접적으로 도달되지 않은 외부 서비스 네트워크를, 각각 ‘내부 네트워크’ 및 ‘외부 네트워크’로 치환하여 설명하도록 한다.Hereinafter, each configuration and operation will be described only for the purpose of processing a query requested from a user terminal (400) that is located in an independent/closed web service environment and cannot make a direct request to a natural language processing server (500) located in an external network through a query response server (100) according to a preferred embodiment of the present invention, performing natural language processing on the natural language processing server (500), and then providing the query back to the user terminal (400). However, the present invention is not limited thereto, and it should be understood that the present invention can be applied to various environments in addition to an independent/closed web service environment. In addition, for the convenience of explanation, the network in an independent/closed environment and the external service network that is not directly reached from the independent/closed environment will be described by replacing them with ‘internal network’ and ‘external network’, respectively.
본 발명의 바람직한 실시예에 따른 질의 응답 서버(100)를 설명하기에 앞서, 본 발명의 바람직한 실시예에 따른 사용자 질의에 대한 자연어 응답 제공 시스템의 또 다른 구성인 인증키 생성 서버(200) 및 데이터베이스(300)에 대하여 우선적으로 설명하도록 한다.Before explaining the question response server (100) according to a preferred embodiment of the present invention, the authentication key generation server (200) and database (300), which are other components of the system for providing natural language responses to user queries according to a preferred embodiment of the present invention, will first be explained.
인증키 생성 서버(200)는 내부 네트워크 상에 연결되어, 동일한 내부 네트워크 상에 위치하는 사용자단말에 사전 정의된 인증키를 생성 제공할 수 있다. 여기서, 인증키 생성 서버(200)에서 생성하는 인증키는, 내부 네트워크 상의 인가된 사용자단말(400)만이 외부 네트워크 상의 자연어 처리 서버(500)를 중개하는 질의 응답 서버(100)가 사용자단말(400)의 요청내용(=질의)에 대한 자연어 처리를 외부 네트워크상의 자연어 처리 서버(500)에 API 접속을 통해 대신 수행하도록, 사용자단말(400)이 위치하는 내부 네트워크 명칭(=기관명), 이용하고자하는 서비스 명칭, 해당 사용자단말(400)의 IP주소, 고유한 토큰 및 자연어 응답 요청 횟수, 자연어 응답 요청 유효 주기를 포함할 수 있어, 사용자단말(400)은 질의 요청 때마다, 인증키의 발급 없이 사전 정의된 횟수 및 주기 동안 질의 응답 서버(100)을 통한 질의 요청 및 응답을 제공받을 수 있게 된다.The authentication key generation server (200) is connected to an internal network and can generate and provide a predefined authentication key to a user terminal located on the same internal network. Here, the authentication key generated by the authentication key generation server (200) can include the internal network name (=organization name) where the user terminal (400) is located, the name of the service to be used, the IP address of the user terminal (400), a unique token and the number of natural language response requests, and the natural language response request validity period, so that only an authorized user terminal (400) on the internal network can perform natural language processing on behalf of a query response server (100) that mediates a natural language processing server (500) on an external network through API access for the request content (=query) of the user terminal (400), so that the user terminal (400) can receive query requests and responses through the query response server (100) for a predefined number of times and period without issuing an authentication key for each query request.
데이터베이스(300)는 분야별 텍스트 기반 데이터가 저장될 수 있다. 여기서, 텍스트 기반 데이터는 문서 또는 텍스트 파일 등의 형태로 마련되며, 경우에 따라서, 텍스트와 이미지 등이 혼재된 문서 형태일 수 있다. 텍스트 기반 데이터의 일예로는 특정 제품의 사용설명서, 백과사전 등과 같은 것들이 있으며, 정보 제공을 목적으로 제작된 문서 등이 이에 해당할 수 있다. 또한, 텍스트 기반 데이터는 다양한 분야별로 그룹화된 형태로 저장될 수 있어, 후술할 질의 응답 서버(100)의 수집부(130)가 사전 분류된 텍스트 기반 데이터를 분야별로 분류 수집할 수 있게 된다.The database (300) can store text-based data by field. Here, the text-based data is provided in the form of a document or a text file, and in some cases, it can be a document form that mixes text and images. Examples of text-based data include a user manual for a specific product, an encyclopedia, and the like, and documents produced for the purpose of providing information can be included. In addition, the text-based data can be stored in a form grouped by various fields, so that the collection unit (130) of the question-and-answer server (100) described below can classify and collect pre-classified text-based data by field.
본 발명의 바람직한 실시예에 따른 질의 응답 서버(100)는 인증시 생성 서버(200)로부터 인증키를 발급 받은 사용자단말(400)의 인증키 유효 여부를 확인하고, 유효한 것으로 확인된 사용자단말(400)로부터 질의 입력을 수신하고, 수신된 질의 내의 특징과 데이터베이스(300) 내의 복수의 텍스트 기반 데이터로부터 사전 구성된 특징을 비교하여 사용자 질의와 유사한 특징을 포함하는 문자열을 선택하고, 선택된 문자열을 자연어 처리 서버(500)에 송신하여 자연어 처리된 내용을 사용자단말(400)에 제공하며, 통신부(110), 인증부(120), 수집부(130), 추출부(140) 및 비교부(150)를 포함할 수 있다.A query response server (100) according to a preferred embodiment of the present invention verifies whether an authentication key of a user terminal (400) that has received an authentication key from a generation server (200) upon authentication is valid, receives a query input from a user terminal (400) that has been confirmed to be valid, compares features in the received query with features pre-configured from a plurality of text-based data in a database (300), selects a character string including features similar to the user query, transmits the selected character string to a natural language processing server (500) to provide natural language processed content to the user terminal (400), and may include a communication unit (110), an authentication unit (120), a collection unit (130), an extraction unit (140), and a comparison unit (150).
통신부(110)는 통신망을 통해, 데이터베이스(300), 사용자단말(400) 및 자연어 처리 서버(500)와 통신할 수 있다. 여기서, 통신부(110)는 데이터베이스(300) 및 사용자단말(400)과 내부 네트워크를 통해 연결되고, 외부 네트워크를 통해 자연어 처리 서버(500)와 연결되어 내부 네트워크상의 사용자단말(400)로부터 요청된 질의를 가공한 이후에 외부 네트워크에 위치한 자연어 처리 서버(500)의 가공 결과물을 제공하며, 자연어 처리된 최종 결과물을 사용자단말(400)에 제공할 수 있게 된다.The communication unit (110) can communicate with the database (300), the user terminal (400), and the natural language processing server (500) through the communication network. Here, the communication unit (110) is connected to the database (300) and the user terminal (400) through the internal network, and is connected to the natural language processing server (500) through the external network. After processing a query requested from the user terminal (400) on the internal network, the communication unit provides the processed result of the natural language processing server (500) located on the external network, and can provide the final result of the natural language processing to the user terminal (400).
인증부(120)는 인증키 생성 서버(200)로부터 제공된 사용자단말(400)의 인증키를 인증할 수 있다. 여기서, 인증부(120)는 인증키 생성 서버(200)로부터 생성된 인증키에 포함된 요청 유효 횟수, 요청 유효 주기 등을 확인하여, 해당 인증키가 현재 사용 가능한 인증키인지를 검증하는 것으로, 사용자단말(400)의 질의 요청 및 사용자단말(400)로의 응답 제공 여부를 판단하게 된다. 또한, 인증부(120)는 유효한 것으로 판단된 인증키를 제공한 사용자단말(400)로부터 입력된 질의 내용 및 질의 응답에 대한 암복호화를 수행할 수 있다. 또한, 인증부(120)에는 각 사용자단말(400)의 IP주소, 이용 사용자의 ID를 포함하는 정보 등이 추가적으로 저장될 수 있으며, 인증 결과에 따라 해당 사용자단말(400) 및 사용자의 질의 요청 및 응답 제공 여부를 판단하게 된다.The authentication unit (120) can authenticate the authentication key of the user terminal (400) provided from the authentication key generation server (200). Here, the authentication unit (120) verifies whether the authentication key is a currently available authentication key by checking the number of request validity periods, request validity periods, etc. included in the authentication key generated from the authentication key generation server (200), and determines whether to provide a query request from the user terminal (400) and a response to the user terminal (400). In addition, the authentication unit (120) can perform encryption and decryption of the query content and the query response input from the user terminal (400) that provided the authentication key determined to be valid. In addition, the authentication unit (120) can additionally store information including the IP address of each user terminal (400), the ID of the user, etc., and determines whether to provide a query request and response from the user terminal (400) and the user based on the authentication result.
수집부(130)는 후술할 통신부(110)를 통해 데이터베이스(300) 내에 분야별로 사전 분류된 텍스트 기반 데이터를 수집할 수 있다. 여기서, 수집부(130)가 수집하는 텍스트 기반 데이터는 문서 또는 텍스트 파일 등의 형태로 마련되며, 경우에 따라서, 수집부(130)는 텍스트와 이미지 등이 혼재된 문서에서 텍스트만을 발췌하여 수집할 수도 있다. 또한, 수집부(130)는 데이터베이스(300) 내에 특정 분야에 대한 텍스트 기반 데이터의 추가 또는 변경을 감지하며, 감지된 텍스트 기반 데이터를 새로 수집하거나, 이전에 수집된 텍스트 기반 데이터와 교체할 수도 있다.The collection unit (130) can collect text-based data that is pre-classified by field within the database (300) through the communication unit (110) described below. Here, the text-based data collected by the collection unit (130) is prepared in the form of a document or a text file, and in some cases, the collection unit (130) can extract and collect only text from a document containing text and images. In addition, the collection unit (130) can detect additions or changes to text-based data for a specific field within the database (300), and can newly collect the detected text-based data or replace it with previously collected text-based data.
추출부(140)는 수집부(130)로부터 수집된 분야별 텍스트 기반 데이터를 문자열 단위로 분리하고, 분리된 문자열 내의 문장 또는 단어로부터 특징정보를 생성할 수 있다. 여기서, 추출부(140)는 분리한 문자열과 각 문자열 단위 내에서 생성한 특징정보를 각 텍스트 기반 데이터 단위로 그루핑(Grouping)할 수 있으며, 그루핑된 문자열단위와 특징정보는 또한 분야별로 분류될 수 있다. 또한, 추출부(140)는 후술할 통신부(110)를 통해 사용자단말(400)로부터 질의가 입력되면, 입력된 질의 문자열에서도 특징을 추출할 수 있으며, 이때, 질의 문자열로부터 추출된 특징은 문장 또는 단어일 수 있다. 한편, 추출부(140)가 생성하는 분야별 특징정보는 분야별 각 텍스트 기반 데이터 또는 분야별 전체 텍스트 기반 데이터에 포함된 각 단어 또는 문장을 출현 빈도 및 중요도에 따라 실수 벡터 단위로 나타낸 정보일 수 있으며, 추출부(140)는 하기의 [식 1]을 통해 분야별 각 텍스트 기반 데이터 내의 임의의 단어 또는 문장의 출현 빈도(TF, Term Frequency)에 해당하는 제 1값을 산출할 수 있다.The extraction unit (140) can separate the field-based text data collected from the collection unit (130) into string units and generate feature information from sentences or words within the separated strings. Here, the extraction unit (140) can group the separated strings and the feature information generated within each string unit into each text-based data unit, and the grouped string units and feature information can also be classified by field. In addition, when a query is input from a user terminal (400) through the communication unit (110) described below, the extraction unit (140) can extract features from the input query string. At this time, the features extracted from the query string can be sentences or words. Meanwhile, the field-specific feature information generated by the extraction unit (140) may be information that represents each word or sentence included in each field-specific text-based data or the entire field-specific text-based data in real-valued vector units according to frequency of occurrence and importance, and the extraction unit (140) may calculate a first value corresponding to the term frequency (TF) of any word or sentence in each field-specific text-based data through the following [Formula 1].
[식 1][Formula 1]
추출부(140)는 하기의 [식 2]을 통해 분야별 전체 텍스트 기반 데이터 내의 임의의 단어 또는 문장의 중요도(IDF, Inverse Document Frequency)에 해당하는 제 2값을 산출할 수 있다.The extraction unit (140) can calculate a second value corresponding to the importance (IDF, Inverse Document Frequency) of any word or sentence in the entire text-based data by field through [Formula 2] below.
[식 2][Formula 2]
이후, 추출부(140)는 제1 값과 제2 값을 곱 연산하여, 임의의 단어 또는 문장에 대한 실수 벡터(vector) 형태의 특징정보를 생성하게 되어, 추출부(140)는 생성된 특징정보를 통해 각 텍스트 기반 데이터 내의 단어 또는 문장을 실수 벡터 값으로 나타낼 수 있게 된다.Thereafter, the extraction unit (140) performs a multiplication operation on the first value and the second value to generate feature information in the form of a real number vector for any word or sentence, so that the extraction unit (140) can express the word or sentence in each text-based data as a real number vector value through the generated feature information.
비교부(150)는 추출부(140)로부터 추출된 질의 문자열 내의 특징과, 추출부(140)가 기 생성한 특징정보를 비교하여, 일치 정도 및 중요도가 높은 특징정보를 포함하는 문자열을 선택할 수 있다. 여기서, 비교부(150)는 사용자단말(400)로부터의 질의 수신 이전에 추출부(140)가 생성한 실수 벡터 형태의 특징정보를 통해, 사용자 질의에서의 특징, 다시 말해, 사용자단말(400)로부터 입력된 질의 문자열 내의 단어 또는 문장 각각에 대응되는 실수 벡터 값을 부여하게 된다. 이 과정에서, 비교부(150)는 일치하는 특징의 수가 많은 텍스트 기반 데이터를 우선적으로 확인하여, 질의 내용에 대응하는 분야의 텍스트 기반 데이터를 선택하고, 실수 벡터 값이 부여된 질의 문자열 내의 단어 또는 문장에 대한 실수 벡터 값과 추출부(140)로부터 생성된 동 분야의 텍스트 기반 데이터 내의 각 단어 또는 문장의 특징정보의 실수 벡터 값에 대한 코사인 유사도(Cosine Similarity)를 확인하여, 코사인유사도가 높은 단어 또는 문장이 포함된 문자열을 질의 문자열에 대한 응답으로 적합한 ‘KEY’문자열로 선택할 수 있다. 이후, 비교부(150)로부터 선택된 ‘KEY’문자열은 통신부(110)를 통해 자연어 처리 서버(500)에 송신되고, 자연어 처리 서버(500)로부터 자연어 처리되어 수신한 자연어 질의응답 내용을 재차 통신부(110)를 통해 사용자단말(400)에 제공함으로써, 사용자는 질의에 대한 자연어 응답을 얻을 수 있게 된다.The comparison unit (150) can compare the features in the query string extracted from the extraction unit (140) with the feature information previously generated by the extraction unit (140), and select a string including feature information with a high degree of agreement and importance. Here, the comparison unit (150) assigns a real number vector value corresponding to each feature in the user query, that is, each word or sentence in the query string input from the user terminal (400), through the feature information in the form of a real number vector generated by the extraction unit (140) prior to receiving the query from the user terminal (400). In this process, the comparison unit (150) first checks text-based data having a large number of matching features, selects text-based data in a field corresponding to the query content, and checks the cosine similarity between the real vector values for words or sentences in the query string to which real vector values are assigned and the real vector values of the feature information of each word or sentence in the text-based data of the same field generated from the extraction unit (140), so that a string including a word or sentence with a high cosine similarity can be selected as a ‘KEY’ string suitable as a response to the query string. Thereafter, the ‘KEY’ string selected by the comparison unit (150) is transmitted to the natural language processing server (500) through the communication unit (110), and the natural language query response content received by the natural language processing server (500) through natural language processing is provided to the user terminal (400) again through the communication unit (110), so that the user can obtain a natural language response to the query.
즉, 본 발명의 바람직한 실시예에 따른 사용자 질의에 대한 자연어 응답 제공 시스템은, 질의 응답 서버(100)가 데이터베이스(200)에 저장된 분야별 텍스트 기반 데이터를 수집하여, 각 텍스트 기반 데이터를 문자열 단위로 분리하고, 각 문자열에 포함된 단어 또는 문장으로부터 특징정보를 생성하며, 동일한 내부 네트워크상에 위치한 인증키 생성 서버(200)로부터 인증키를 발급받은 사용자단말(400)이 질의 응답 서버(100)에 질의를 요청하게 되면, 질의 응답 서버(100)는 사용자단말(300)의 인증키가 유효한지를 검토하고, 유효한 경우에 한하여, 사용자단말(400)로부터 입력된 질의 문자열 내의 단어 또는 문장으로부터 특징을 추출하고, 추출된 특징와 유사도가 가장 높은 특징정보를 선택하여 자연어 처리 서버(500)에 제공하며, 자연어 처리 서버(500)로부터 자연어 처리가 완료되면, 자연어 처리된 문자열을 사용자단말(500)에 제공하는 것으로 사용자 질의에 대한 자연어 응답을 제공할 수 있게 된다.That is, a system for providing a natural language response to a user query according to a preferred embodiment of the present invention comprises a query response server (100) that collects text-based data by field stored in a database (200), separates each text-based data into a string unit, generates feature information from words or sentences included in each string, and when a user terminal (400) that has received an authentication key from an authentication key generation server (200) located on the same internal network requests a query to the query response server (100), the query response server (100) checks whether the authentication key of the user terminal (300) is valid, and if valid, extracts features from words or sentences in a query string input from the user terminal (400), selects feature information with the highest similarity to the extracted features, and provides the feature information to the natural language processing server (500), and when the natural language processing is completed by the natural language processing server (500), the natural language processed string is provided to the user terminal (500), thereby enabling a natural language response to the user query to be provided.
따라서, 본 발명에 따른 사용자 질의에 대한 자연어 응답 제공 시스템은, 인증키 생성 서버의 인증키 발급 방식으로, 질의 응답 서버가 유효한 인증키가 발급된 사용자단말에 한하여, 사용자단말의 질의 요청 수신, 자연어 처리 서버로의 내용 전달 및 사용자단말로의 자연어 처리 서버로부터 자연어 처리된 응답을 제공함에 따라, 인증키를 기반으로 독립/폐쇄형 웹서비스 환경에 위치한 사용자단말도 외부 네트워트 상의 자연어 처리 서비스 이용이 가능한 효과가 있다.Therefore, the system for providing a natural language response to a user query according to the present invention has the effect of allowing a user terminal located in an independent/closed web service environment to use a natural language processing service on the external network, as the query response server receives a query request from a user terminal, transmits the content to a natural language processing server, and provides a natural language processed response from the natural language processing server to a user terminal only for a user terminal to which a valid authentication key has been issued, through an authentication key issuance method of an authentication key generation server.
또한, 본 발명에 따른 사용자 질의에 대한 자연어 응답 제공 시스템은, 사용자단말로부터 수신한 질의에 가장 적합한 동 분야의 텍스트 기반 데이터 내의 문자열을 선택하고, 선택한 문자열만을 자연어 처리 서버에 전달하여, 자연어 처리된 응답을 사용자단말에 제공함으로써, 질의 전체에 대한 자연어 응답 처리 방식에 비해 발생되는 비용을 최소화면서 동일한 수준의 자연어 응답을 제공할 수 있는 효과가 있다.In addition, the system for providing a natural language response to a user query according to the present invention selects a character string within text-based data of the same field that is most suitable for a query received from a user terminal, transmits only the selected character string to a natural language processing server, and provides a naturally processed response to the user terminal, thereby having the effect of providing a natural language response of the same level while minimizing the cost incurred compared to a natural language response processing method for the entire query.
상기한 본 발명의 실시 예는 예시의 목적을 위해 개시된 것이고, 본 발명에 대해 통상의 지식을 가진 당업자라면 본 발명의 사상과 범위 안에서 다양한 수정, 변경, 부가가 가능할 것이며, 이러한 수정, 변경 및 부가는 하기의 특허 청구범위에 속하는 것으로 보아야 할 것이다.The above-described embodiments of the present invention have been disclosed for the purpose of illustration, and those skilled in the art with common knowledge of the present invention will be able to make various modifications, changes, and additions within the spirit and scope of the present invention, and such modifications, changes, and additions should be considered to fall within the scope of the following patent claims.
100: 질의 응답 서버
110: 통신부
120: 인증부
130: 수집부
140: 추출부
150: 비교부
200: 인증키 생성 서버
300: 사용자단말
400: 데이터베이스
500: 자연어 처리 서버100: Query Response Server
110: Communications Department
120: Authentication Department
130: Collection Department
140: Extraction section
150: Comparison Department
200: Authentication key generation server
300: User terminal
400: Database
500: Natural Language Processing Server
Claims (9)
분야별 텍스트 기반 데이터가 저장되는 데이터베이스;
상기 데이터베이스에 저장된 분야별 텍스트 기반 데이터를 문자열 단위로 분리하고, 분리된 문자열 내의 문장 또는 단어로부터 특징을 추출하여, 추출한 특징을 통해 분야별 특징정보를 재생성하며, 사용자단말로부터 입력된 질의에 대응되는 특징정보를 포함하는 문자열을 자연어 처리 서버에 송신하고, 자연어 처리 서버로부터 수신한 자연어 처리된 문자열을 해당 사용자단말에 중개 제공하는 질의 응답 서버;를 포함하며,
상기 질의 응답 서버는 상기 인증키 생성 서버로부터 사용자단말에 제공된 인증키를 인증하고, 인증키가 유효한 경우에 한하여, 해당 사용자단말의 질의에 따른 자연어 응답을 제공하는 것을 특징으로 하는 사용자 질의에 대한 자연어 응답 제공 시스템.
An authentication key generation server that is connected to an internal network and provides a predefined authentication key to a user terminal located on the same internal network;
A database that stores text-based data by field;
A query response server is included, which separates field-specific text-based data stored in the above database into string units, extracts features from sentences or words within the separated strings, regenerates field-specific feature information through the extracted features, transmits a string containing feature information corresponding to a query input from a user terminal to a natural language processing server, and provides a natural language-processed string received from the natural language processing server to the corresponding user terminal.
A system for providing a natural language response to a user's query, characterized in that the query response server authenticates an authentication key provided to a user terminal from the authentication key generation server and, only when the authentication key is valid, provides a natural language response according to the query of the user terminal.
상기 인증키 생성 서버는 자연어 응답 요청 횟수, 자연어 응답 요청 유효 주기를 포함하는 인증키를 생성하여 상기 사용자단말에 제공하는 것을 특징으로 하는 사용자 질의에 대한 자연어 응답 제공 시스템.
In the first paragraph,
A system for providing a natural language response to a user query, characterized in that the authentication key generation server generates an authentication key including the number of natural language response requests and the natural language response request validity period and provides the authentication key to the user terminal.
상기 질의 응답 서버는,
상기 데이터베이스, 사용자단말 및 자연어 처리 시스템과 통신하는 통신부;
상기 인증키 생성 서버로부터 제공된 사용자단말의 인증키를 인증하는 인증부;
상기 데이터베이스에 저장된 분야별 텍스트 기반 데이터를 수집하는 수집부;
상기 수집부가 수집한 분야별 텍스트 기반 데이터를 문자열 단위로 분리하고, 분리된 문자열 내의 문장 또는 단어로부터 특징정보를 생성하는 추출부; 및
상기 통신부가 상기 인증부를 통해 인증키가 유효한 것으로 확인된 사용자단말로부터 수신한 질의 문자열과 상기 추출부가 생성한 특징정보를 비교하여, 일치 정도가 가장 높은 특징정보를 포함하는 문자열을 선택하는 비교부;를 포함하며,
상기 비교부는 상기 추출부를 통해 상기 통신부로부터 상기 사용자단말로부터 수신한 질의 문자열 내의 특징을 추출하고, 추출한 특징과 일치 정도가 가장 높은 특징정보를 포함하는 선택하는 것을 특징으로 하는 사용자 질의에 대한 자연어 응답 제공 시스템.
In the second paragraph,
The above query response server,
A communication unit communicating with the above database, user terminal, and natural language processing system;
An authentication unit that authenticates the authentication key of a user terminal provided from the authentication key generation server;
A collection unit that collects field-specific text-based data stored in the above database;
An extraction unit that separates the field-specific text-based data collected by the above collection unit into strings and generates feature information from sentences or words within the separated strings; and
The above communication unit includes a comparison unit that compares a query string received from a user terminal whose authentication key has been confirmed to be valid through the authentication unit with the feature information generated by the extraction unit, and selects a string including the feature information with the highest degree of matching;
A system for providing a natural language response to a user query, characterized in that the comparison unit extracts features from a query string received from the user terminal through the communication unit through the extraction unit, and selects feature information including the feature information with the highest degree of consistency with the extracted features.
상기 추출부는 상기 수집부가 상기 데이터베이스로부터 추가 또는 변경된 임의의 분야에 대한 텍스트 기반 데이터를 수집한 경우에 한하여, 해당 분야의 텍스트 기반 데이터를 문자열 단위로 재분리하고, 분리된 문자열 내의 문장 또는 단어로부터 특징을 추출하여 분야별 특징정보를 재생성하는 것을 특징으로 하는 사용자 질의에 대한 자연어 응답 제공 시스템.
In the third paragraph,
A system for providing a natural language response to a user's query, characterized in that the extraction unit re-separates text-based data of the field into string units only when the collection unit collects text-based data for any field added or changed from the database, and extracts features from sentences or words within the separated strings to regenerate feature information by field.
상기 추출부는 하기의 [식 1]을 통해, 각 텍스트 기반 데이터 내의 임의의 단어 또는 문장에 대한 제 1값으로부터 특징정보를 생성하는 것을 특징으로 하는 사용자 질의에 대한 자연어 응답 제공 시스템.
[식 1]
In paragraph 4,
A system for providing a natural language response to a user query, characterized in that the above extraction unit generates feature information from a first value for any word or sentence in each text-based data through the following [Formula 1] .
[Formula 1]
상기 추출부는 하기의 [식 2]을 통해, 전체 텍스트 기반 데이터 내의 임의의 단어 또는 문장에 대한 제 2값으로부터 특징정보를 생성하는 것을 특징으로 하는 사용자 질의에 대한 자연어 응답 제공 시스템.
[식 2]
In paragraph 5,
A system for providing a natural language response to a user query, characterized in that the above extraction unit generates feature information from a second value for any word or sentence in the entire text-based data through the following [Formula 2] .
[Formula 2]
상기 추출부는 상기 제1 값과 제2 값의 곱 연산하여, 임의의 단어 또는 문장에 대한 실수 벡터(vector) 형태의 특징정보를 생성하는 것을 특징으로 하는 사용자 질의에 대한 자연어 응답 제공 시스템.
In Article 6,
A system for providing a natural language response to a user query, characterized in that the above extraction unit performs a product operation of the first value and the second value to generate feature information in the form of a real number vector for an arbitrary word or sentence.
상기 비교부는 상기 사용자단말로부터 수신된 질의 문자열 내의 단어 또는 문장에 해당하는 특징과 사전 생성된 각 단어 또는 문장에 대한 특징정보를 비교하여, 유사도가 높은 특징정보를 확인하고, 확인된 특징정보의 실수 벡터 값을 질의 문자열 내의 특징에 부여하는 것을 특징으로 하는 사용자 질의에 대한 자연어 응답 제공 시스템.
In Article 7,
A system for providing a natural language response to a user query, characterized in that the comparison unit compares the features corresponding to the words or sentences in the query string received from the user terminal with the feature information for each word or sentence generated in advance, identifies the feature information with a high degree of similarity, and assigns the real number vector value of the identified feature information to the feature in the query string.
상기 비교부로는 질의 문자열 내의 단어 또는 문장에 대한 실수 벡터 값과 상기 추출부로부터 생성된 각 단어 또는 문장의 특징정보의 실수 벡터 값에 대한 코사인 유사도(Cosine Similarity)를 확인하여, 코사인 유사도가 높은 단어 또는 문장이 포함된 문자열을 질의 문자열에 대한 응답으로 적합한 문자열로 선택하는 것을 특징으로 하는 사용자 질의에 대한 자연어 응답 제공 시스템.In Article 8,
A system for providing a natural language response to a user query, characterized in that the above comparison unit checks the cosine similarity between the real number vector values for words or sentences in the query string and the real number vector values of the feature information of each word or sentence generated from the above extraction unit, and selects a string containing a word or sentence with a high cosine similarity as a string suitable as a response to the query string.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230129604A KR20250045973A (en) | 2023-09-26 | 2023-09-26 | System of providing natural language response to user queries |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230129604A KR20250045973A (en) | 2023-09-26 | 2023-09-26 | System of providing natural language response to user queries |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20250045973A true KR20250045973A (en) | 2025-04-02 |
Family
ID=95475848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230129604A Pending KR20250045973A (en) | 2023-09-26 | 2023-09-26 | System of providing natural language response to user queries |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20250045973A (en) |
-
2023
- 2023-09-26 KR KR1020230129604A patent/KR20250045973A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12379975B2 (en) | Systems and methods for censoring text inline | |
CN110929125B (en) | Search recall method, device, equipment and storage medium thereof | |
CN107945015B (en) | Man-machine question and answer auditing method, device, equipment and computer readable storage medium | |
CN109063138B (en) | Method, apparatus, and storage medium for searching data in a blockchain as a service platform | |
JPH10232878A (en) | Document management method and apparatus | |
US20010054151A1 (en) | System and method for determining user identity fraud using similarity searching | |
CN111753171B (en) | Malicious website identification method and device | |
KR20200006493A (en) | A System Providing Job Search Service Using Block Chain | |
CN109087053B (en) | Collaborative office processing method, device, equipment and medium based on association topological graph | |
CN103139172A (en) | Service implementation method and device | |
Lux et al. | Full-text search for verifiable credential metadata on distributed ledgers | |
CN111324611B (en) | Certificate retrieval method and device for asset type certificate | |
CN107517180B (en) | Login method and device | |
US20060026692A1 (en) | Network resource access authentication apparatus and method | |
US20090083840A1 (en) | Inference search engine security | |
WO2008046342A1 (en) | Method for providing third party service and system thereof | |
CN113821608B (en) | Service search method, device, computer equipment and storage medium | |
CN110209804B (en) | Target corpus determining method and device, storage medium and electronic device | |
JP2012208855A (en) | Identity confirmation system and identity confirmation method | |
KR20250045973A (en) | System of providing natural language response to user queries | |
US20030120614A1 (en) | Automated e-commerce authentication method and system | |
US20090287654A1 (en) | Device for identifying electronic file based on assigned identifier | |
JP2001229067A (en) | Structured document description data processing apparatus and structured document description data processing program recording medium | |
US20230004989A1 (en) | Customer recognition system | |
CN111061885A (en) | Electronic document making method and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20230926 |
|
PA0201 | Request for examination |
Patent event code: PA02011R01I Patent event date: 20230926 Comment text: Patent Application |
|
PN2301 | Change of applicant |
Patent event date: 20240604 Comment text: Notification of Change of Applicant Patent event code: PN23011R01D |
|
PG1501 | Laying open of application |