[go: up one dir, main page]

KR101667918B1 - Methodand device of providing query-adaptive smart search service - Google Patents

Methodand device of providing query-adaptive smart search service Download PDF

Info

Publication number
KR101667918B1
KR101667918B1 KR1020150117003A KR20150117003A KR101667918B1 KR 101667918 B1 KR101667918 B1 KR 101667918B1 KR 1020150117003 A KR1020150117003 A KR 1020150117003A KR 20150117003 A KR20150117003 A KR 20150117003A KR 101667918 B1 KR101667918 B1 KR 101667918B1
Authority
KR
South Korea
Prior art keywords
snippet
query
pattern
extracting
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020150117003A
Other languages
Korean (ko)
Inventor
배원식
정형일
김태일
은종진
김도연
Original Assignee
네이버 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네이버 주식회사 filed Critical 네이버 주식회사
Priority to KR1020150117003A priority Critical patent/KR101667918B1/en
Application granted granted Critical
Publication of KR101667918B1 publication Critical patent/KR101667918B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • G06F17/30011
    • G06F17/21
    • G06F17/277
    • G06F17/30684

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 스마트 검색 서비스 제공 방법 및 이를 구현하기 위한 검색 서비스 장치로서, 사용자가 입력한 질의에 대한 자연어 처리를 통해 질의를 인식하고, 질의와 관련있는 문서의 내용을 해당 패턴으로 정리하여 질의에 대한 전반적인 내용을 포함하는 스니펫 정보를 노출시킴으로써 스니펫 정보만으로도 해당 문서 상에서 사용자가 필요로 하는 구체적인 내용을 쉽게 파악할 수 있는 검색 서비스를 제공하는 방안을 개시한다.The present invention relates to a method of providing a smart search service and a search service apparatus for implementing the smart search service. The smart search service providing method includes: recognizing a query through natural language processing of a query input by a user; arranging contents of a document related to the query as a corresponding pattern; Discloses a method for providing a search service that exposes snippet information including an overall content so that specific contents required by a user can be easily grasped on the document even with only snippet information.

Description

질의 반응형 스마트 검색 서비스 제공 방법 및 이를 구현하기 위한 검색 서비스 장치{Methodand device of providing query-adaptive smart search service}TECHNICAL FIELD [0001] The present invention relates to a smart search service providing method and a search service apparatus for implementing the same,

본 발명은 질의 반응형 스마트 검색 서비스 제공 방법 및 이를 구현하기 위한 검색 서비스 장치에 대한 것으로서, 보다 상세하게는 사용자가 입력한 질의에 대한 자연어 처리를 통해 질의를 인식하고, 질의와 관련 있는 문서의 내용을 해당 패턴으로 정리하여 질의에 대한 전반적인 내용을 포함하는 스니펫 정보를 노출시킴으로써 스니펫 정보만으로도 해당 문서 상에서 사용자가 필요로 하는 구체적인 내용을 쉽게 파악할 수 있는 검색 서비스를 제공하는 방안에 관한 것이다.The present invention relates to a method of providing a query response type smart search service and a search service apparatus for implementing the method. More particularly, the present invention relates to a method and apparatus for recognizing a query through natural language processing on a query input by a user, And a method of providing a search service that can easily grasp a specific content required by a user on the document by using only snippet information by exposing snippet information including the overall contents of the query.

ICT 기술 발달에 따라 현대인들은 시간과 공간의 제한 없이 인터넷 검색서비스를 통한 검색으로 궁금한 사항이나 업무적인 사항에 대한 적절한 해답을 찾고 있다.With the development of ICT technology, modern people are searching for an appropriate answer to questions or business matters by searching through internet search service without limitation of time and space.

도 1은 종래기술에 따른 검색 서비스의 검색 결과에 대한 일례를 도시하는데, 사용자가 검색 창에 질의 내용을 입력하면, 검색 서비스 서버가 질의 내용을 기초로 문서를 검색하여 그에 따른 검색 결과를 제공한다.FIG. 1 shows an example of a search result of a search service according to the related art. When a user inputs a query content into a search window, the search service server searches the document based on the query content and provides search results according to the search result .

종래 검색 서비스의 경우, 상기 도 1의 (a)에 도시된 바와 같이 일반적인 검색 엔진은 검색 창(11)을 통해 입력된 질의 내용에 포함된 키워드를 추출하고 키워드를 포함하는 문서를 검색하여 문서 상에서 해당 키워드(15)를 포함하는 문장의 일부분 등의 스니펫(Snippet)을 노출시키는 검색 결과(13)를 제공한다.In the case of the conventional search service, as shown in FIG. 1 (a), a general search engine extracts keywords included in the query content input through the search window 11, searches for a document including keywords, A search result 13 that exposes a snippet such as a part of a sentence including the keyword 15 is provided.

스니펫(Snippet)이란 검색 엔진이 사용자에게 보여주는 웹 페이지의 간단한 대표 글 등을 의미하며, 추가적으로 미리보기를 렌더링하는 링크 또는 페이지 제목, 간단한 페이지 설명, 미리보기 이미지 등이 스니펫과 함께 검색결과로 제공되기도 한다.A snippet is a simple representation of a web page that a search engine displays to a user. In addition, a link or page title, a short page description, or a thumbnail that renders a preview, along with a snippet, It is also provided.

그러나 이와 같은 검색 결과로는 검색된 문서 내용 중 단순히 키워드가 해당 문서에 포함되어 있다는 정보 수준에 그쳐, 사용자는 검색 결과로서 노출된 영역의 클릭을 통해 해당 문서에 접근하여 전체적인 내용을 찾아보지 않는 이상 검색 결과만으로 원하는 해답을 찾기에는 검색결과로서 제공되는 정보가 빈약하다.However, as a result of such a search, only the information level indicating that the keyword is included in the document is searched, and the user accesses the document through the click of the exposed area as a search result, The information provided as search results is poor to find the answers you want with just the results.

보다 효과적인 검색결과를 제공하는 방안으로서, 상기 도 1의 (b)에 도시된 바와 같이 검색 창(21)을 통해 입력된 질의 내용과 관련되어 검색된 해당 문서의 인기도나 신뢰도 등의 부가적인 정보(25)를 추가적으로 검색 결과(23)에 포함시켜 제공하는 검색 서비스가 제공되었으나, 이와 같은 검색 서비스의 경우에도 검색된 문서의 내용 중 단순히 질의 내용에 포함된 키워드(27)를 포함하는 문장이나 문단의 일부 내용만 검색 결과로 노출되며, 추가적인 부가 정보(25)를 통해서는 사용자가 찾고자 하는 해답을 얻기 위해 접근할 문서의 수를 줄일 수 있다는 정도의 수준에 그칠뿐으로, 결국 실질적으로는 사용자가 검색 결과로서 노출된 영역을 클릭하여 해당 문서에 접근해야 원하는 정보를 얻을 수 있는 문제점이 여전히 존재하고 있다.In order to provide a more effective search result, additional information 25 (e.g., popularity, reliability, etc.) of the document retrieved in association with the query content input through the search window 21 as shown in FIG. 1 In the retrieval result 23. However, even in the case of such a retrieval service, even among the contents of the retrieved document, a sentence including the keyword 27 included in the query content or a partial content of the paragraph Is only exposed to the search result and only the level of the additional information 25 is such that the number of documents to be accessed can be reduced in order to obtain a solution to be searched by the user. There is still a problem in that the desired information can be obtained by clicking on the exposed area to access the document.

특허공개번호 제10-2013-0128697호Patent Publication No. 10-2013-0128697

본 발명은 상술한 바와 같은 종래 기술의 문제점을 해결하고자 하는 것으로서, 사용자의 질의에 대한 검색 결과로 노출되는 정보가 단순히 키워드를 포함하는 일부 내용이나 해당 문서의 인기도, 신뢰도 등의 부가적인 정보만 제공됨으로써 사용자가 검색 결과만으로 원하는 해답을 찾기에는 제공되는 정보가 빈약한 문제점을 해결하고자 한다.SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems of the prior art, and it is an object of the present invention to provide a method and a system for providing information, So that the user can solve the problem that the information provided is insufficient to search for the desired solution only by the search result.

상기 기술적 과제를 달성하고자 본 발명에 따른 검색 서비스 제공 방법은, 사용자의 질의를 수신하는 질의 수신 단계; 상기 질의에 기초하여 문서를 검색하는 문서 검색 단계; 검색된 문서 중 하나 이상의 문서에서 상기 질의와 연관된 주요 내용을 발굴하고, 이를 취합하여 스니펫을 추출하는 스니펫 추출 단계; 및 상기 추출된 스니펫을 포함하는 상기 질의에 대한 검색 결과를 제공하는 검색 결과 제공 단계를 포함할 수 있다.According to an aspect of the present invention, there is provided a method of providing a search service, the method comprising: receiving a query of a user; A document retrieval step of retrieving a document based on the query; A snippet extracting step of extracting a main content associated with the query from at least one of the retrieved documents, extracting a main content associated with the query, and extracting a snippet; And a search result providing step of providing a search result for the query including the extracted snippet.

바람직하게는 상기 질의에 대한 질의 유형을 분석하여 질의 도메인을 판단하는 질의 유형 분석 단계를 더 포함하고, 상기 스니펫 추출 단계는, 상기 질의 도메인에 대응되는 내용 전개 구조가 정의된 스니펫 패턴을 추출하고, 상기 문서에 상기 스니펫 패턴을 적용하여 상기 스니펫 패턴에 따라 상기 문서에서 주요 내용을 발굴하고 이를 취합하여 스니펫을 추출할 수 있다.The method further includes a query type analysis step of analyzing a query type of the query to determine a query domain, wherein the snippet extraction step extracts a snippet pattern in which a content development structure corresponding to the query domain is defined, The snippet pattern may be applied to the document, the main content may be extracted from the document according to the snippet pattern, and the snippet may be extracted by collecting the main content.

나아가서 상기 스니펫 추출 단계는, 상기 문서에 상기 스니펫 패턴을 적용하여 상기 스니펫 패턴에 따라 상기 문서에서 주요 내용을 발굴하고 이를 취합하여 스니펫 후보를 추출하는 스니펫 후보 추출 단계; 및 상기 스니펫 후보에 대한 형태 분석과 의미 분석을 통해 상기 스니펫 후보에서 스니펫을 선택하는 스니펫 선택 단계를 포함할 수 있다.Further, the snippet extracting step may include a snippet candidate extracting step of extracting a snippet candidate by extracting main contents from the document according to the snippet pattern by applying the snippet pattern to the document and extracting the snippet candidate; And a snippet selection step of selecting a snippet from the snippet candidate through morphological analysis and semantic analysis of the snippet candidate.

바람직하게는 상기 질의 유형 분석 단계는, 상기 질의에서 요소를 추출하고, 관계어 사전을 통해 상기 요소에서 단서(Clue) 요소와 상기 단서 요소에 대응되는 키워드 요소를 판단하는 질의 판단 단계; 상기 단서 요소와 상기 키워드 요소의 결합에 따른 질의 유형을 판단하는 질의 유형 판단 단계; 및 상기 질의 유형에 대응되는 질의 도메인을 판단하는 도메인 판단 단계를 포함할 수 있다.Preferably, the query type analysis step includes a query determination step of extracting an element from the query, and determining a clue element and a keyword element corresponding to the clue element in the element through a relation dictionary; A query type determination step of determining a query type according to the combination of the clue element and the keyword element; And a domain determination step of determining a query domain corresponding to the query type.

또한 도메인별 스니펫 패턴을 저장한 스니펫 패턴 DB를 구축하는 스니펫 패턴 DB 구축 단계를 더 포함하고, 상기 스니펫 후보 추출 단계는, 상기 질의 도메인에 대응되는 스니펫 패턴을 상기 스니펫 패턴 DB에서 추출할 수도 있다.And a snippet pattern DB constructing step of constructing a snippet pattern DB storing a domain-specific snippet pattern, wherein the snippet candidate extracting step extracts a snippet pattern corresponding to the query domain from the snippet pattern DB .

여기서 상기 스니펫 패턴 DB 구축 단계는, 문서를 수집하고, 수집된 문서에 대한 자연어 처리 과정을 수행하여 상기 문서를 각각의 요소로 분석하는 문서 수집 단계; 기보유된 관계어 사전을 통해 상기 요소에서 단서 요소와 상기 단서 요소에 대응되는 키워드 요소를 판단하고, 상기 단서 요소와 상기 키워드 요소의 결합에 따른 스니펫 도메인을 결정하는 도메인 결정 단계; 상기 요소를 포함하는 영역에 대한 구조를 분석하는 문서 분석 단계; 상기 요소 간의 연관 관계를 판단하고, 상기 연관 관계를 기초로 분석된 구조를 조합하여 스니펫 패턴을 생성하는 스니펫 패턴 생성 단계; 및 상기 스니펫 패턴을 상기 스니펫 도메인에 대응시켜 상기 스니펫 패턴 DB에 저장하는 스니펫 패턴 저장 단계를 포함할 수 있다.Wherein the step of constructing the snippet pattern DB includes a document collection step of collecting a document and analyzing the document by each element by performing a natural language process on the collected document; Determining a clue element and a keyword element corresponding to the clue element in the element through a previously held relation dictionary, and determining a snippet domain according to the combination of the clue element and the keyword element; A document analysis step of analyzing a structure of an area including the element; A snippet pattern generation step of determining an association between the elements and generating a snippet pattern by combining the analyzed structures based on the association; And a snippet pattern storing step of storing the snippet pattern in the snippet pattern DB in association with the snippet domain.

나아가서 상기 스니펫 후보 추출 단계는, 상기 질의에 포함된 요소를 기초로 문서를 검색하고, 검색된 문서에 대한 자연어 처리 과정을 수행하여 각각의 요소로 분석하는 단계; 및 분석된 상기 문서에 추출한 스니펫 패턴을 적용하여, 상기 스니펫 패턴에 따라 상기 문서에서 상기 질의에 대응되는 내용을 발굴하고 이를 취합하여 스니펫 후보를 추출하는 단계를 포함할 수 있다.Further, the extracting of the snippet candidates may include searching a document based on the elements included in the query, performing natural language processing on the retrieved document, and analyzing the extracted elements by respective elements. And extracting the snippet candidate by applying the extracted snippet pattern to the analyzed document, extracting the content corresponding to the query from the document according to the snippet pattern, collecting the collected content, and extracting the snippet candidate.

한걸음 더 나아가서 상기 스니펫 후보 추출 단계는, 상기 질의 도메인에 대응되는 복수의 스니펫 패턴을 추출하고, 하나의 문서에 각각의 스니펫 패턴을 적용하여 복수의 스니펫 후보를 추출하며, 추출한 복수의 스니펫 후보를 취합하여 하나의 스니펫 후보로 통합하는 스니펫 후보 가공 단계를 더 포함할 수도 있다.The step of extracting a snippet candidate may further include extracting a plurality of snippet patterns corresponding to the query domain, extracting a plurality of snippet candidates by applying each snippet pattern to one document, And may further include a snippet candidate processing step of collecting snippet candidates and integrating them into one snippet candidate.

또한 상기 스니펫 패턴 생성 단계는, 특정 도메인에 대응되는 도메인별 특화 스니펫 패턴과 모든 도메인에 대응되는 공통 스니펫 패턴을 구분하여 생성할 수 있다.In addition, the snippet pattern generation step may be performed by separating domain specific snippet patterns corresponding to a specific domain and common snippet patterns corresponding to all domains.

나아가서 상기 스니펫 후보 추출 단계는, 상기 질의와 관련된 문서를 수집하고, 수집된 문서에 대한 자연어 처리 과정을 수행하여 상기 문서를 각각의 요소로 분석하는 단계; 기보유된 관계어 사전을 통해 상기 요소에서 단서 요소와 상기 단서 요소에 대응되는 키워드 요소를 판단하고, 상기 단서 요소와 상기 키워드 요소의 결합에 따른 도메인을 판단하여 이를 상기 질의 도메인과 대비하는 단계; 상기 요소를 포함하는 영역에 대한 구조를 분석하는 문서 분석 단계; 상기 요소 간의 연관 관계를 판단하고, 상기 연관 관계를 기초로 분석된 구조를 조합하여 스니펫 패턴을 생성하는 스니펫 패턴 생성 단계; 및 분석된 상기 문서에 추출한 스니펫 패턴을 적용하여, 상기 스니펫 패턴에 따라 상기 문서에서 상기 질의에 대응되는 내용을 발굴하고 이를 취합하여 스니펫 후보를 추출하는 단계를 포함할 수도 있다.Further, the extracting of the snippet candidates may include collecting documents related to the query, analyzing the documents by respective elements by performing a natural language process on the collected documents, Determining a clue element corresponding to the clue element and a keyword element corresponding to the clue element in the element through a previously held relation dictionary, determining a domain according to the combination of the clue element and the keyword element, and comparing the domain with the query domain; A document analysis step of analyzing a structure of an area including the element; A snippet pattern generation step of determining an association between the elements and generating a snippet pattern by combining the analyzed structures based on the association; And extracting snippet candidates by applying the extracted snippet pattern to the analyzed document, extracting contents corresponding to the query in the document according to the snippet pattern, collecting the contents, and extracting the snippet candidates.

바람직하게는 상기 스니펫 추출 단계는, 상기 스니펫 후보에 대한 형태 분석으로 가중치를 산출하고, 상기 스니펫 후보의 의미 분석으로 관련도를 산출하여, 상기 가중치와 상기 관련도를 기초로 스니펫 후보를 필터링하여 스니펫을 추출할 수 있다.Preferably, the snippet extracting step may include calculating a weight by a morphological analysis of the snippet candidate, calculating relevance by semantic analysis of the snippet candidate, and extracting a snippet candidate based on the weight and the degree of relevance, Can be filtered to extract the snippet.

여기서 상기 스니펫 추출 단계는, 상기 스니펫 후보에 대한 형태 분석으로서, 상기 스니펫 후보의 추출에 적용된 스니펫 패턴에 대한 적용 회수, 상기 스니펫 후보의 추출에 적용된 스니펫 패턴에 대한 평가 점수 또는 상기 스니펫 후보의 문장 길이 중 어느 하나 이상을 고려하여 상기 스니펫 후보에 대한 가중치를 산출할 수 있다.Here, the snippet extracting step may include a step of analyzing the shape of the snippet candidate, the number of times of application of the snippet pattern applied to the extraction of the snippet candidate, the score of the snippet pattern applied to extraction of the snippet candidate, The weight for the snippet candidate may be calculated in consideration of one or more of the sentence lengths of the snippet candidates.

또한 상기 스니펫 추출 단계는, 상기 스니펫 후보에 대한 의미 분석으로서, 관계어 사전을 기초로 상기 스니펫 후보에 포함된 각 요소에 대한 상기 질의 도메인과의 관련도를 산출할 수 있다.The snippet extracting step may be a semantic analysis of the snippet candidate, and may calculate the relevance of each element included in the snippet candidate to the query domain based on the relational dictionary.

나아가서 상기 검색 결과 제공 단계는, 추출된 상기 스니펫의 수와 상기 스니펫에 포함된 정보 형태를 기초로 템플릿 DB에서 템플릿을 추출하는 템플릿 추출 단계; 상기 스니펫을 상기 템플릿에 매칭시켜 검색 결과를 생성하는 검색 결과 생성 단계를 포함할 수 있다.Further, the search result providing step may include a template extracting step of extracting a template from the template DB based on the number of extracted snippets and the information type included in the snippet; And a search result generating step of matching the snippet with the template to generate a search result.

한걸음 더 나아가서 상기 검색 결과 제공 단계는, 복수의 스니펫을 취합하여 통합하는 스니펫 가공 단계를 더 포함할 수도 있다.Further, the search result providing step may further include a snippet processing step of collecting and integrating a plurality of snippets.

바람직하게는 상기 검색 결과 제공 단계는, 복수의 스니펫을 순차적으로 정렬하여 검색 결과를 제공하되, 기설정된 사이즈에 대응시켜 각 스니펫의 일부 내용을 노출시키고, 사용자의 선택시 선택된 스니펫의 전체 내용을 노출시킬 수 있다.Preferably, the search result providing step is a step of providing a search result by sequentially sorting a plurality of snippets, exposing a part of each snippet in correspondence with a predetermined size, The contents can be exposed.

또한 본 발명에 따른 검색 서비스 장치는, 사용자의 질의를 수신하는 질의 수신부; 상기 질의에 기초하여 검색된 문서 중 하나 이상의 문서에서 상기 질의와 연관된 주요 내용을 발굴하고, 이를 취합하여 스니펫을 추출하는 스니펫 추출부; 및 추출된 스니펫을 포함하는 상기 질의에 대한 검색 결과를 제공하는 검색 결과 제공부를 포함할 수 있다.According to another aspect of the present invention, there is provided a search service apparatus comprising: a query receiving unit receiving a query of a user; A snippet extractor for extracting a main content associated with the query from one or more documents retrieved based on the query, extracting a main content associated with the query, and extracting a snippet; And a search result providing unit for providing a search result for the query including the extracted snippet.

바람직하게는 상기 질의를 분석하여 질의 유형을 판단하는 질의 분석부를 더 포함하며, 상기 스니펫 추출부는, 상기 질의에 대응되는 내용 전개 구조가 정의된 스니펫 패턴을 추출하고, 상기 스니펫 패턴을 적용하여 문서 상에서 스니펫을 추출할 수 있다.The snippet extracting unit preferably extracts a snippet pattern in which a content development structure corresponding to the query is defined and determines whether the snippet pattern is applied And extract the snippet from the document.

나아가서 문서 또는 문장을 형태소 분석하여 요소를 추출하는 자연어 처리기; 및 도메인별 단어, 개체어, 불용어, 동의어, 유의어 또는 이형태 중 적어도 하나 이상에 대한 정보를 저장한 관계어 사전을 더 포함할 수 있다.A natural language processor for extracting elements by morpheme analysis of documents or sentences; And a relational dictionary storing information on at least one of domain-specific words, dogs, abbreviations, synonyms, synonyms, or stereotypes.

바람직하게는 상기 질의 분석부는, 상기 자연어 처리기와 상기 관계어 사전을 이용하여 상기 질의에서 요소를 추출하고 추출된 요소를 기초로 질의 유형을 분석하여 질의 도메인을 판단하는 질의 유형 분석기를 포함할 수 있다.Preferably, the query analyzing unit may include a query type analyzer for extracting an element from the query using the natural language processor and the related dictionary, and analyzing the query type based on the extracted element to determine a query domain .

또한 상기 스니펫 추출부는, 문서를 수집하고, 상기 자연어 처리기와 상기 관계어 사전을 이용하여 수집된 문서에서 요소와 구조를 분석하고, 상기 요소 간의 연관 관계를 판단하여 상기 연관 관계를 기초로 분석된 구조를 조합하여 스니펫 패턴을 생성하는 스니펫 패턴 생성기; 상기 질의에 포함된 요소를 기초로 검색된 문서를 상기 자연어 처리기와 상기 관계어 사전을 이용하여 요소와 구조로 분석하고 스니펫 패턴을 적용하여 스니펫 후보를 추출하는 스니펫 후보 추출기; 및 상기 스니펫 후보에 대한 형태 분석과 의미 분석을 통해 스니펫을 추출하는 스니펫 필터를 포함할 수 있다.The snippet extracting unit may collect the documents, analyze the elements and the structure in the document collected using the natural language processor and the related dictionary, determine the association between the elements, A snippet pattern generator for generating a snippet pattern by combining structures; A snippet candidate extractor for extracting a snippet candidate by analyzing a document retrieved on the basis of the elements included in the query by elements and structure using the natural language processor and the related dictionary, and applying a snippet pattern; And a snippet filter for extracting a snippet through morphological analysis and semantic analysis for the snippet candidate.

나아가서 상기 스니펫 패턴 생성기는,생성한 스니펫 패턴에 대한 스니펫 도메인을 판단하며,상기 스니펫 패턴 생성기가 생성한 스니펫 패턴을 상기 스니펫 도메인에 대응시켜 저장하는 스니펫 패턴 DB를 더 포함할 수 있다.The snippet pattern generator further includes a snippet pattern DB for determining a snippet domain for the generated snippet pattern and storing the snippet pattern generated by the snippet pattern generator in association with the snippet domain can do.

한걸음 더 나아가서 상기 질의 분석부는, 검색 서비스 서버로부터 사용자의 질의를 전달받고, 상기 검색 결과 제공부는, 상기 검색 결과를 상기 검색 서비스 서버로 제공할 수 있다.Further, the query analyzing unit may receive the query of the user from the search service server, and the search result providing unit may provide the search result to the search service server.

여기서 상기 스니펫 추출부는, 사전에 문서를 저장한 문서 DB 또는 인터넷 상에서 문서를 수집할 수 있다.Here, the snippet extracting unit may collect a document in a document DB storing a document in advance or on the Internet.

또한 본 발명에 따른 검색 서비스 장치는 상기의 검색 서비스 제공 방법의 각 단계를 수행하는 컴퓨터프로그램이 기록된 검색 서비스 장치가 될 수도 있다.The search service apparatus according to the present invention may be a search service apparatus in which a computer program for performing each step of the search service providing method is recorded.

이와 같은 본 발명에 의하면, 자연어 처리 기술을 통해 사용자의 질의와문서 분석을 수행하고 사용자의 질의에 대응되는 패턴을 문서에 적용하여 문서에서 질의와 관련된 내용을 요약하여 추출한 결과를 제공함으로써 검색 결과만으로도 전체적인 내용의 파악이 가능하게 된다.According to the present invention, a query and a document analysis of a user are performed through a natural language processing technique, and a pattern corresponding to a user's query is applied to a document to provide a result of summarizing contents related to a query in a document, The entire contents can be grasped.

나아가서, 도메인별로 특화된 내용 전개 패턴을 사전에 파악하여 스니펫 패턴으로 설정하고, 사용자의 질의에 대응되는 도메인의 스니펫 패턴을 문서에 적용함으로써 특정 분야의 문서 상에서 전반적인 주요 내용을 보다 용이하게 발굴하여 스니펫으로 추출할 수 있게 된다.In addition, by identifying domain specific content development patterns in advance and setting them as snippet patterns, and by applying the domain's snippet pattern corresponding to the user's query to the document, And can be extracted by a snippet.

또한, 본 발명에 의하면, 복잡한 구조를 갖는 문서일지라도 다양한 형태의 스니펫 패턴을 적용하여, 각각의 스니펫 패턴에 따라 용이하게 문서 상에서 해당 내용을 발굴할 수 있으며, 이를 통합함으로써 문서 상의 전체적인 내용을 적절하게 요약한 스니펫을 추출할 수 있게 된다.In addition, according to the present invention, even if a document having a complicated structure is used, various types of snippet patterns can be applied to easily find corresponding contents in a document according to respective snippet patterns, and by integrating them, It is possible to extract a snippet that has been appropriately summarized.

나아가서 다수의 스니펫을 포함하는 검색 결과를 사용자가 한눈에 파악할 수 있도록 검색 결과 화면의 제공시, 다수의 스니펫을 기설정된 사이즈에 대응시켜 각 스니펫의 일부 내용을 노출시키고, 사용자의 선택시 선택된 스니펫의 전체 내용을 노출시킴으로써 사용자는 보다 쉽게 다수의 스니펫을 포함하는 검색 결과를 한눈에 파악할 수 있게 된다.Furthermore, when a search result screen is provided so that the user can grasp the search results including a large number of snippets, a plurality of snippets are associated with predetermined sizes to expose a part of each snippet, By exposing the entire contents of the selected snippet, the user can more easily grasp the search results containing multiple snippets at a glance.

도 1은 종래기술에 따른 검색 서비스를 통한 검색 결과에 대한 일례를 도시하며,
도 2는 본 발명에 따른 질의 반응형 스마트 검색 서비스를 제공하기 위한 검색 서비스 시스템에 대한 개략적인 구성도를 도시하며,
도 3은 본 발명에 따른 검색 서비스 장치의 실시예에 대한 구성도를 도시하며,
도 4는 본 발명에 따른 검색 서비스 장치의 주요 구성에 대한 세부 구성도를 도시하며,
도 5는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법의 일실시예에 대한 개략적인 흐름도를 도시하며,
도 6은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 질의 분석 과정에 대한 실시예의 흐름도를 도시하며,
도 7은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 질의 분석 과정에 대한 구현예를 도시하며,
도 8은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 패턴 생성 과정에 대한 실시예의 흐름도를 도시하며,
도 9는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 패턴 생성 과정에 대한 구현예를 도시하며,
도 10은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 후보 추출 과정에 대한 실시예의 흐름도를 도시하며,
도 11 및 도 12는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 후보 추출 과정에 대한 구현예를 도시하며,
도 13은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 후보 추출 과정에 대한 다른 실시예의 흐름도를 도시하며,
도 14는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 후보 추출 과정에 대한 다른 구현예를 도시하며,
도 15는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 패턴 추출과 스니펫 후보 추출의 통합 과정에 대한 실시예의 흐름도를 도시하며,
도 16은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 추출 과정에 대한 실시예의 흐름도를 도시하며,
도 17은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 검색 결과 생성 과정에 대한 실시예의 흐름도를 도시하며,
도 18은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 검색 결과 제공 과정에 대한 구현예를 도시하며,
도 19는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 검색 결과 제공 과정에 대한 다른 구현예를 도시하며,
도 20은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 검색 결과 제공 과정에 대한 또 다른 구현예를 도시하며,
도 21은 종래 검색 서비스와 본 발명에 따른 검색 서비스에 대한 비교예를 도시한다.
1 shows an example of a search result through a search service according to the related art,
2 shows a schematic configuration diagram of a search service system for providing a query response type smart search service according to the present invention,
3 shows a configuration diagram of an embodiment of a search service apparatus according to the present invention,
4 shows a detailed configuration diagram of a main configuration of a search service apparatus according to the present invention,
Figure 5 shows a schematic flow diagram of an embodiment of a method of providing a query response type smart search service according to the present invention,
6 is a flowchart of an embodiment of a query analysis process in a query response type smart search service providing method according to the present invention,
FIG. 7 shows an embodiment of a query analysis process in a query response smart search service providing method according to the present invention,
8 shows a flowchart of an embodiment of a snippet pattern generation process in a method of providing a query response type smart search service according to the present invention,
9 shows an embodiment of a process of generating a snippet pattern in a method of providing a query response type smart search service according to the present invention,
10 is a flowchart illustrating an embodiment of a snippet candidate extraction process in a query response type smart search service providing method according to the present invention,
11 and 12 illustrate an embodiment of a snippet candidate extraction process in a query response type smart search service providing method according to the present invention,
13 shows a flowchart of another embodiment of a snippet candidate extraction process in a query response type smart search service providing method according to the present invention,
FIG. 14 shows another embodiment of a snippet candidate extraction process in a query response type smart search service providing method according to the present invention,
15 is a flowchart illustrating an embodiment of an integrated process of extracting a snippet pattern and extracting a snippet candidate in a query response type smart search service providing method according to the present invention,
16 is a flowchart of an embodiment of a snippet extraction process in a query response type smart search service providing method according to the present invention,
17 shows a flowchart of an embodiment of a search result generation process in a query response type smart search service providing method according to the present invention,
18 shows an embodiment of a search result providing process in a query response type smart search service providing method according to the present invention,
FIG. 19 shows another embodiment of a search result providing process in a query response type smart search service providing method according to the present invention,
20 shows another embodiment of the search result providing process in the query response type smart search service providing method according to the present invention,
FIG. 21 shows a comparative example of a conventional search service and a search service according to the present invention.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 설명하기 위하여 이하에서는 본 발명의 바람직한 실시예를 예시하고 이를 참조하여 살펴본다.BRIEF DESCRIPTION OF THE DRAWINGS The above and other objects, features and advantages of the present invention will become more apparent from the following detailed description of the present invention when taken in conjunction with the accompanying drawings.

먼저, 본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로서, 본 발명을 한정하려는 의도가 아니며, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 또한 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.First, the terminology used in the present application is used only to describe a specific embodiment, and is not intended to limit the present invention, and the singular expressions may include plural expressions unless the context clearly indicates otherwise. Also, in this application, the terms "comprise", "having", and the like are intended to specify that there are stated features, integers, steps, operations, elements, parts or combinations thereof, But do not preclude the presence or addition of features, numbers, steps, operations, components, parts, or combinations thereof.

본 발명을 설명함에 있어서, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear.

본 발명은, 사용자가 입력한 질의에 대한 자연어 처리를 통해 질의를 인식하고, 질의와 관련 있는 문서의 내용을 해당 패턴으로 정리하여 질의에 대한 전반적인 내용을 포함하는 스니펫 정보를 노출시킴으로써 스니펫 정보만으로도 해당 문서 상에서 사용자가 필요로 하는 구체적인 내용을 쉽게 파악할 수 있는 질의 반응형 스마트 검색 서비스를 제공하는 방안을 제시한다.The present invention recognizes a query through natural language processing on a query input by a user, exposes snippet information including the overall contents of the query by organizing the contents of a document related to the query into a corresponding pattern, This paper proposes a smart search service that can easily grasp the specific contents required by users on the document.

도 2는 본 발명에 따른 질의 반응형 스마트 검색 서비스를 구현하기 위한 검색 서비스 시스템에 대한 개략적인 구성도를 도시한다.FIG. 2 shows a schematic diagram of a search service system for implementing a query response type smart search service according to the present invention.

검색 서비스 시스템은, 사용자 단말기(10), 검색 서비스 장치(100) 및 문서(50)를 포함할 수 있으며, 상황에 따라서는 별개의 검색 서비스 서버(30)를 더 포함할 수도 있다.The search service system may include a user terminal 10, a search service apparatus 100, and a document 50, and may further include a separate search service server 30 depending on the situation.

사용자 단말기(10)는 사용자로부터 질의를 입력받아 전달하고, 질의에 대한 검색 결과를 전송받아 사용자에게 제공하는 통신 단말기로서, PC, 노트북, PDA, 스마트폰 등 일반적으로 보급되는 유무선 통신 단말기를 포함하며, 나아가서 본 발명에 따른 검색 서비스를 제공받기 위해 개별적으로 제공되는 특화된 통신 단말기일 수도 있다.The user terminal 10 is a communication terminal for inputting and receiving a query from a user and for receiving a search result of a query and providing the search result to a user, and includes a wired / wireless communication terminal commonly used such as a PC, a notebook computer, a PDA, And may be a specialized communication terminal that is individually provided to provide a search service according to the present invention.

검색 서비스 장치(100)는 사용자의 질의에 대한 질의 반응형 스마트 검색 결과를 생성하여 검색 서비스를 제공하는 장치로서, 단일 서버로 구성될 수도 있고 필요에 따라 복수의 장치나 모듈 등이 결합되거나 연동하는 그룹으로 구성될 수도 있다. 여기서 질의 반응형 스마트 검색 결과란, 단순히 문서 상에서 질의에 사용된 단어가 존재하는 일정 영역만을 검색 결과로서 제공하던 기존 검색 결과와는 상이하게 사용자의 질의 및 문서의 내용을 자연어 처리 기술을 기반으로 분석하여 파악하고 문서 상에서 질의와 관련된 내용들을 요약하여 질의에 대한 전반적인 내용이 취합된 스니펫을 포함하는 검색 결과를 의미한다.The search service apparatus 100 is a device for providing a search service by generating a query response type smart search result with respect to a query of a user, and may be configured as a single server or may be a combination of a plurality of devices or modules, Group. Here, the query-response type smart search result is different from the existing search result that only provides a certain region in which a word used in a query exists in the document as a search result, and the user's query and contents of the document are analyzed based on a natural language processing technique And summarizes the contents related to the query in the document, and includes the snippet containing the overall contents of the query.

그리고 사용자 단말기(10)는 네트워크 망을 통해 검색 서비스 장치(100)에 접속하여 검색 서비스를 제공받을 수 있으며, 네트워크 망은 일반적인 인터넷 회선으로서 유선망과 무선망을 포함할 수 있고, 나아가서 한정된 영역이나 제한된 인원이 특정 조건에서 접속가능한 가상 사설망이나 인트라넷 등을 포함할 수도 있다. Also, the user terminal 10 can access the search service apparatus 100 through the network and receive the search service. The network can include a wired network and a wireless network as general Internet lines. Further, A person may include a virtual private network or an intranet accessible under certain conditions.

문서(50)는 인터넷(50a)을 통해 누구나 쉽게 수집 가능한 블로그, 카페 등에 게재된 정보 등의 문서뿐만 아니라 제한된 회원이나 일정 영역에 서비스를 제공하는 전문분야 데이터베이스를 통해 제공되는 논문이나 업무 문서 등을 포함할 수 있으며, 본 발명에서 문서란, 단순한 글자 형태의 텍스트뿐만 아니라 영상, 음향, 이미지 등 정보가 내포된 모든 데이터를 지칭하는 의미로 사용된다.The document 50 includes not only documents such as information posted on blogs and cafes that can be easily collected by anyone via the Internet 50a but also papers or business documents provided through a specialized database providing services to a limited member or a predetermined area In the present invention, a document is used to mean not only plain text but also all data including information such as image, sound, image and the like.

나아가서 웹 봇 등을 통해 다양한 문서를 사전에 수집하여 저장하는 문서 DB(50b)를 구축하고 검색 서비스 장치(100)가 문서 DB(50b) 상에 보유된 문서를 기초로 검색 서비스를 제공할 수도 있다.Furthermore, a document DB 50b, which collects and stores various documents in advance through a web bot or the like, may be constructed, and the search service apparatus 100 may provide a search service based on a document held on the document DB 50b .

또한 본 발명에 따른 검색 서비스 장치(100)는 일반적인 검색 서비스를 제공하는 검색 서비스 서버(30)와 연동하여 본 발명에 따른 질의 반응형 스마트 검색 서비스를 제공할 수도 있는데, 가령 기존 구축된 검색 서비스 서버(30)로 사용자가 접속하여 검색 서비스 서버(30)에 질의를 입력하면 검색 서비스 서버(30)는 본 발명에 따른 검색 서비스 장치(100)로 사용자의 질의에 대한 질의 반응형 스마트 검색 결과를 요청하며, 검색 서비스 장치(100)가 사용자의 질의에 대한 질의 반응형 스마트 검색 결과를 생성하여 그 결과가 검색 서비스 서버(30)를 통해 사용자에게 제공될 수도 있다.In addition, the search service apparatus 100 according to the present invention may provide a query response type smart search service according to the present invention in cooperation with a search service server 30 that provides a general search service. For example, When the user accesses the search service server 30 and inputs a query to the search service server 30, the search service server 30 requests the search service apparatus 100 according to the present invention to send a query response type smart search result for the user query The search service apparatus 100 may generate a query response type smart search result for the user's query, and the result may be provided to the user through the search service server 30. [

본 발명에 따른 질의 반응형 스마트 검색 서비스를 제공하는 검색 서비스 장치에 대하여 도 3에 도시된 실시예를 통해 살펴보기로 한다.A search service apparatus for providing a query response type smart search service according to the present invention will be described with reference to an embodiment shown in FIG.

본 발명에 따른 검색 서비스 장치(100)는 개략적으로 질의 분석부(110), 스니펫 추출부(130), 검색 결과 제공부(150)를 포함할 수 있으며, 추가적으로 관계어 사전(210), 스니펫 패턴 DB(250), 템플릿 DB(270) 등을 포함할 수도 있다. 또한 상기 도 3에 도시되진 않았으나 검색 서비스 장치(100)가 사용자 단말기(10)로부터 질의를 받기 위한 질의 수신부가 포함될 수도 있다. 여기서 기본적 구성외에 추가적인 구성들은 검색 서비스 장치(100)에 포함되어 구성될 수도 있으나 상황에 따라서는 별개의 장치들로 구성되어 검색 서비스 장치(100)의 각 구성들과 연동될 수 있다.The search service apparatus 100 according to the present invention may include a query analyzing unit 110, a snippet extracting unit 130 and a search result providing unit 150 in addition to the related language dictionary 210, A nipple pattern DB 250, a template DB 270, and the like. 3, a query receiving unit for receiving a query from the user terminal 10 may be included in the search service apparatus 100. [ In addition to the basic configuration, additional configurations may be included in the search service apparatus 100, but they may be configured as separate apparatuses depending on the circumstances, and may be interworked with the respective configurations of the search service apparatus 100.

질의 분석부(110)는, 사용자의 질의를 분석하여 질의 유형을 판단하고, 질의 유형에 따른 질의 도메인을 판단하는데, 일례로서 관계어 사전(210)을 이용하여 질의에 포함된 요소를 추출하고 요소의 의미와 요소 간의 관계 분석을 통해 질의 도메인을 판단한다. 질의 분석부(110)는 직접 사용자 단말기(10)에 검색 서비스 페이지를 제공하여 사용자 단말기(10)로부터 질의를 입력받을 수도 있고 또는 별개의 검색 서비스 서버(30)와 연동하거나 별도의 질의 수신부를 통해 사용자의 질의를 전송받을 수도 있다.The query analyzing unit 110 analyzes the query of the user to determine the query type and determines the query domain according to the query type. For example, the query analyzer 110 extracts the elements included in the query using the related word dictionary 210, And the query domain is determined through the analysis of the relationship between the elements and the elements. The query analyzing unit 110 may directly provide a search service page to the user terminal 10 to receive a query from the user terminal 10 or may interwork with a separate search service server 30 or through a separate query receiving unit The user's query may be sent.

스니펫 추출부(130)는 질의에 대응되는 스니펫 패턴을 추출하고 상기 스니펫 패턴을 적용하여 상기 질의와 관련된 문서(50) 상에서 스니펫을 추출한다.The snippet extractor 130 extracts a snippet pattern corresponding to the query and extracts the snippet on the document 50 related to the query by applying the snippet pattern.

스니펫 패턴이란, 문서 상에서 내용이 전개되어 있는 구조 형태를 의미하는데, 일반적으로 문서는 일정한 구조를 갖고 그 구조 형태에 맞춰서 내용이 제시되어 있으며, 특히 특정 도메인별로 문서의 구조 형태는 각기 상이할 수 있다. 따라서 이와 같은 문서의 구조 형태를 파악하면 문서에서 원하는 주요 내용을 용이하게 추출하여 정리할 수 있으며, 본 발명에서는 문서에서 내용이 전개되어 있는 구조 형태를 정의하여 이를 스니펫 패턴으로 설정한다.A snippet pattern is a structure in which contents are developed in a document. In general, a document has a certain structure and contents are presented according to the structure. In particular, the structure of documents may be different depending on a specific domain have. Accordingly, if the structural form of the document is identified, the main contents desired in the document can be easily extracted and arranged. In the present invention, the structural form in which the contents are developed in the document is defined and set as a snippet pattern.

사전에 관리자가 도메인별로 설정한 스니펫 패턴을 스니펫 패턴 DB(250)에 저장하거나 또는 스니펫 추출부(130)가 다양한 문서(50)를 수집하여 자연어 처리 기술을 기반으로 수집한 문서 상의 내용과 그 구조를 파악한 후 이를 기초로 문서 상에서 전반적인 주요 내용이 제시되는 구조 형태를 인식하여 이를 스니펫 패턴으로 생성하고 스니펫 패턴 DB(250)에 저장할 수 있다.The snippet pattern database 250 stores the snippet patterns set by the administrator in each domain in advance or the snippet extractor 130 collects the various documents 50 and collects the contents on the document based on the natural language processing technique And the structure thereof is recognized, and the structure type in which the main contents are presented on the document is recognized based on the structure, and it can be generated as a snippet pattern and stored in the snippet pattern DB 250.

그리고 스니펫 추출부(130)는 질의 도메인에 대응되는 스니펫 패턴을 스니펫 패턴 DB(250)에서 검색하여 추출하고 질의와 관련된 문서(50)에 추출한 스니펫 패턴을 적용하여 스니펫 패턴의 구조 형태에 따라 문서에서 주요 내용을 발굴하여 스니펫을 추출할 수 있다.The snippet extracting unit 130 retrieves and extracts a snippet pattern corresponding to the query domain from the snippet pattern DB 250 and applies the extracted snippet pattern to the document 50 related to the query to extract the structure of the snippet pattern Depending on the form, you can extract the snippet by extracting the main contents from the document.

본 발명에서 스니펫은, 단순히 특정 단어가 포함된 일분 내용만을 의미하지 않고, 문서 상에서 질의와 연관된 내용을 발굴하고 이를 취합하여 가공함으로써 질의와 관련된 문서 상의 전반적인 내용이 요약된 정보를 의미한다.In the present invention, a snippet does not simply mean only one minute containing a specific word but refers to information summarizing the overall contents of the document related to the query by extracting contents related to the query on the document and processing the collected information.

본 발명에서 제시하는 스니펫 패턴과 스니펫에 대해서는 이후의 실시예를 통해 좀 더 자세히 설명하기로 한다.The snippet pattern and the snippet presented in the present invention will be described in more detail in the following embodiments.

검색 결과 제공부(150)는 스니펫 추출부(130)에서 추출한 스니펫을 기초로 사용자의 질의에 대한 검색 결과를 제공하는데, 추출한 스니펫을 그대로 나열한 검색 결과를 제공할 수도 있으나, 바람직하게는 스니펫에 포함된 정보 구조를 파악하여 이에 대응하는 템플릿을 템플릿 DB(270)에서 추출하고 추출한 템플릿에 스니펫을 매칭시켜 가공한 검색결과를 생성하여 제공할 수도 있다.The search result providing unit 150 provides a search result of the user's query based on the snippet extracted by the snippet extracting unit 130. The search result providing unit 150 may provide a search result in which the extracted snippet is directly arranged, The information structure included in the snippet may be identified, the corresponding template may be extracted from the template DB 270, and the retrieved result may be generated by matching the snippet with the extracted template.

나아가서 검색 결과 제공부(150)는 복수의 스니펫을 포함하는 검색 결과 화면의 제공시 화면 사이즈에 따라 복수의 스니펫 각각을 일부 내용만 노출시키고 사용자의 선택에 따라 선택된 스니펫의 전체 내용을 노출시키도록 검색 결과 화면을 제공할 수도 있다.Further, the search result providing unit 150 exposes only a part of the plurality of snippets according to the screen size when providing the search result screen including a plurality of snippets, and exposes the entire contents of the selected snippet according to the user's selection A search result screen may be provided.

본 발명에 따른 검색 서비스 장치의 주요 구성에 대하여 도 4를 참조하여 좀 더 살펴보면, 질의 분석과 문서 분석을 보다 효과적으로 수행하기 위해 검색 서비스 장치(100)는 자연어 처리기(120)를 보유할 수 있으며, 질의 분석부(110)와 스니펫 추출부(130)는 자연어 처리기(120)를 통해 질의 또는 문서를 형태소 분석하여 요소를 추출하고 관계어 사전(210)을 이용하여 요소에 대한 의미 분석과 요소 간의 연관 관계를 분석한다.4, the search service apparatus 100 may have a natural language processor 120 for more effectively performing query analysis and document analysis, The query analyzing unit 110 and the snippet extracting unit 130 extract the elements by morphological analysis of the query or document through the natural language processor 120 and use the related language dictionary 210 to perform semantic analysis Analyze the association.

여기서, 관계어 사전(210)은, 단순한 용어 사전일 수도 있으나, 바람직하게는 도메인별 단어, 개체어, 불용어, 동의어, 유의어 또는 이형태 등의 정보를 필요에 따라 선택적으로 보유하고, 나아가서 요소별 특징이 태깅되어 저장된 포괄적인 의미의 사전이 될 수 있다.Here, the relative word dictionary 210 may be a simple term dictionary, but it is preferable to selectively retain information such as domain-specific words, words, idioms, synonyms, synonyms or stereotype according to need, This can be a tagged, comprehensive dictionary of meaning.

질의 분석부(110)는 질의 유형 분석기(115)를 포함하며, 질의 유형 분석기(115)가 자연어 처리기(120)와 관계어 사전(210)을 이용하여 사용자의 질의에서 요소를 추출하고 추출된 요소를 기초로 질의 유형을 분석하여 질의 도메인을 판단한다.The query analyzer 110 includes a query type analyzer 115 and the query type analyzer 115 extracts elements from the user's query using the natural language processor 120 and the dictionary dictionary 210, And determines the query domain by analyzing the query type.

스니펫 추출부(130)는, 스니펫 패턴 생성기(131), 스니펫 후보 추출기(133), 스니펫 필터(135) 등을 포함할 수 있다.The snippet extracting unit 130 may include a snippet pattern generator 131, a snippet candidate extractor 133, a snippet filter 135, and the like.

스니펫 패턴 생성기(131)는, 자연어 처리기(120)와 관계어 사전(210)을 이용하여 문서에서 요소와 구조를 분석하고, 상기 요소 간의 연관 관계를 판단하며, 상기 연관 관계를 기초로 분석된 구조를 조합하여 스니펫 패턴을 생성한다. 그리고 스니펫 패턴 생성기(131)가 생성한 스니펫 패턴을 곧바로 스니펫 후보 추출기(133)가 이용할 수도 있으나 바람직하게는 생성한 스니펫 패턴을 스니펫 패턴 DB(250)에 저장하며, 이때 스니펫 패턴 생성기(131)는 스니펫 패턴에 대한 스니펫 도메인을 판단하여 생성한 스니펫 패턴을 해당 스니펫 도메인에 대응시켜서 스니펫 패턴 DB(250)에 저장한다.The snippet pattern generator 131 analyzes elements and structures in a document by using the natural language processor 120 and the dictionary dictionary 210, determines an association between the elements, The structure is combined to create a snippet pattern. Although the snippet pattern extractor 133 may directly use the snippet pattern generated by the snippet pattern generator 131, the generated snippet pattern is preferably stored in the snippet pattern DB 250, The pattern generator 131 determines the snippet domain for the snippet pattern and stores the generated snippet pattern in the snippet pattern DB 250 in correspondence with the corresponding snippet domain.

스니펫 후보 추출기(133)는, 질의에 포함된 요소를 기초로 검색된 문서를 자연어 처리기(120)와 관계어 사전(210)을 이용하여 요소와 구조로 분석하고, 스니펫 패턴을 적용하여 문서 상에서 스니펫 후보를 추출한다. 만약 사전에 스니펫 패턴 DB(250)가 구축되어 있는 경우, 스니펫 후보 추출기(133)는 질의 분석부(110)에서 분석한 질의 도메인에 대응되는 스니펫 패턴을 스니펫 패턴 DB(250)에서 추출하고 이를 문서에 적용하여 스니펫 후보를 추출할 수 있다.The snippet candidate extractor 133 analyzes the document retrieved based on the elements included in the query by using the natural language processor 120 and the dictionary 210 in the element and structure, Extract the snippet candidate. If the snippet pattern DB 250 is constructed in advance, the snippet candidate extractor 133 extracts a snippet pattern corresponding to the query domain analyzed by the query analyzer 110 from the snippet pattern DB 250 You can extract the snippet candidates by extracting them and applying them to the document.

스니펫 필터(135)는, 스니펫 후보 추출기(133)가 추출한 스니펫 후보를 필터링하여 질의에 적합한 스니펫을 추출하는데, 스니펫 후보에 대한 형태 분석과 의미 분석을 통해 스니펫 후보를 필터링하여 스니펫을 추출할 수 있다.The snippet filter 135 filters the snippet candidates extracted by the snippet candidate extractor 133 to extract snippets suitable for the query. The snippet candidates are filtered through shape analysis and semantic analysis of the snippet candidates You can extract the snippet.

본 발명에 따른 검색 서비스 장치는 이와 같은 구성들을 구비하여 질의 반응형 스마트 검색 서비스를 구현할 수 있는데, 이와 같은 각 구성들은 개별적인 장치와 모듈로서 구성될 수도 있고 또는 하나의 장치에 포함될 수도 있다. 나아가서 일종의 서버로 본 발명에 따른 검색 서비스 장치를 대체할 수도 있는데, 가령 이후 살펴볼 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법을 구현하는 컴퓨터프로그램을 서버에 탑재시켜 본 발명에 따른 검색 서비스 장치가 구성될 수도 있다. The search service apparatus according to the present invention can implement the query response type smart search service by having such configurations, and each of the configurations may be configured as an individual device and a module, or may be included in one device. Furthermore, the search service apparatus according to the present invention may be replaced with a server of a kind. For example, a computer program implementing a query response type smart search service providing method according to the present invention to be described later is installed in a server, .

본 발명에서는 상기에서 살펴본 검색 서비스 장치를 이용하여 질의 반응형 스마트 검색 서비스를 제공하는 방법을 제시하는데, 이하에서는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에 대하여 그 실시예를 통해 살펴보기로 한다. 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법은 앞서 살펴본 본 발명에 따른 검색 서비스 장치를 포함하는 검색 서비스 시스템을 통해 구현되므로 이를 같이 참조하여 설명하기로 한다.The present invention proposes a method of providing a query response type smart search service using the search service apparatus described above. Hereinafter, a method of providing a query response type smart search service according to the present invention will be described with reference to the embodiments. do. The query response type smart search service providing method according to the present invention is implemented through a search service system including the search service apparatus according to the present invention described above, and will be described with reference to the same.

본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법은, 개략적으로 사용자의 질의를 수신하는 질의 수신 단계; 상기 질의에 기초하여 문서를 검색하는 문서 검색 단계; 검색된 문서 중 하나 이상의 문서에서 상기 질의와 연관된 주요 내용을 발굴하고, 이를 취합하여 스니펫을 추출하는 스니펫 추출 단계; 및 상기 추출된 스니펫을 포함하는 상기 질의에 대한 검색 결과를 제공하는 검색 결과 제공 단계를 포함할 수 있다.A method of providing a query response type smart search service according to the present invention includes: a query receiving step of receiving a query of a user; A document retrieval step of retrieving a document based on the query; A snippet extracting step of extracting a main content associated with the query from at least one of the retrieved documents, extracting a main content associated with the query, and extracting a snippet; And a search result providing step of providing a search result for the query including the extracted snippet.

도 5는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법의 일실시예에 대한 개략적인 흐름도를 도시한다.FIG. 5 shows a schematic flow diagram of an embodiment of a method of providing a query response type smart search service according to the present invention.

상기 도 5의 실시예는, 개략적으로 질의 분석 과정(S100), 스니펫 추출 과정(S300), 검색 결과 제공 과정(S400)을 포함할 수 있는데, 각 과정은 본 발명의 주된 기술적 특징을 벗어나지 않는 수준에서 필요에 따라 선택적으로 변경될 수 있다. 상기 도 5를 통해서는 각 과정에 대하여 개략적인 개념을 간략하게 설명하며, 각 과정에 대한 세부적인 내용은 이후에 제시된 실시예과 구현예를 통해 자세히 살펴보기로 한다.5 may include a query analysis process S100, a snippet extraction process S300, and a search result providing process S400. Each process may be performed in a manner that does not deviate from the main technical features of the present invention Can be selectively changed as needed. FIG. 5 briefly explains the concept of each process, and details of each process will be described in detail with reference to the following embodiments and implementation examples.

질의 분석 과정(S100)에서는, 사용자로부터의 질의가 입력(S110)되면, 자연어처리 기술을 기반으로 질의에 대한 질의 유형을 분석(S150)하여 질의 도메인을 판단한다. 질의 유형에 따른 질의 도메인은 사전에 분류되어 있으며, 질의 분석 과정(S100)에서는 사용자의 질의가 어떤 질의 도메인에 해당되는가를 판단한다.In the query analysis process S100, when a query from the user is input (S110), the query type for the query is analyzed based on the natural language processing technique (S150) to determine the query domain. The query domain according to the query type is classified in advance, and in the query analysis process (S100), it is determined which query domain corresponds to the user query.

스니펫 추출 과정(S300)에서는, 질의 분석 과정(S100)을 통해 판단된 질의에 대한 도메인에 대응되는 스니펫 패턴을 추출(S310)하는데, 이때 사전에 스니펫 패턴 DB(250)가 구축된 경우, 스니펫 패턴 DB(250)에서 질의 도메인에 대응되는 스니펫 패턴을 추출할 수 있다. 만약 스니펫 패턴 DB(250)를 적용하지 않는 경우, 질의와 관련된 문서를 자연어 처리 기술을 기반으로 분석하여 스니펫 패턴을 추출할 수도 있다. 그리고 질의와 관련된 문서에 추출한 스니펫 패턴을 적용하여 스니펫 후보를 추출(S330)한 후 추출된 스니펫 후보를 필터링하여 질의에 대한 응답으로 적합한 스니펫을 추출(S350)한다.In the snippet extraction process (S300), a snippet pattern corresponding to the domain determined through the query analysis process (S100) is extracted (S310). At this time, if the snippet pattern DB , The snippet pattern corresponding to the query domain can be extracted from the snippet pattern DB 250. [ If the snippet pattern DB 250 is not applied, the snippet pattern can be extracted by analyzing the document related to the query based on the natural language processing technique. Then, the extracted snippet pattern is applied to the document related to the query to extract the snippet candidate (S330), and the extracted snippet candidate is filtered to extract an appropriate snippet in response to the query (S350).

앞서 설명한 바와 같이 스니펫 패턴은 문서 상에서 주요 내용이 제시되는 구조 형태로서, 본 발명에서는 스니펫 패턴을 추출한 후 질의와 관련된 문서에 스니펫 패턴을 적용함으로써 용이하게 문서 상에서 주요 내용을 발굴하며, 발굴된 내용을 취합하여 스니펫 후보를 추출한다. 그리고 추출된 스니펫 후보가 질의에 대하여 적절한 검색 결과인지 필터링을 통해 선별하고 선별된 스니펫 후보를 질의에 대한 스니펫으로 추출한다.As described above, the snippet pattern is a structure in which the main content is presented on the document. In the present invention, the snippet pattern is extracted and the snippet pattern is applied to the document related to the query, And extracts the snippet candidates. Then, the extracted snippet candidate is selected by filtering whether the search result is appropriate for the query, and the selected snippet candidate is extracted as a snippet for the query.

다음으로 검색 결과 제공 과정(S400)은, 추출한 스니펫을 기초로 질의에 대한 검색 결과를 생성(S410)하고 이를 사용자의 질의에 대한 응답으로 제공하는데, 필요에 따라서는 사용자가 검색 결과를 보다 쉽게 파악할 수 있도록 스니펫을 통합하거나 가공하여 검색 결과를 제공할 수 있다.Next, the search result providing step (S400) generates a search result for the query based on the extracted snippet (S410) and provides it as a response to the user's query. If necessary, the user can easily search results You can integrate or manipulate snippets to provide insight into your search results.

이와 같은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법은, 자연어 처리 기술을 통해 사용자의 질의와 문서 분석을 수행하고 사용자의 질의에 대응되는 패턴을 문서에 적용하여 문서에서 질의와 관련된 내용을 요약하여 추출한 결과를 제공함으로써 검색 결과만으로도 전체적인 내용의 파악이 가능하게 된다.The method of providing a query response type smart search service according to the present invention performs user query and document analysis through a natural language processing technique and applies a pattern corresponding to a user query to a document, So that the entire contents can be grasped only by the search result.

본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법의 각 과정에 대한 실시예를 통해 좀더 세부적으로 살펴보기로 한다.The details of each process of the query response smart search service providing method according to the present invention will be described in more detail.

먼저, 질의 분석 과정(S100)과 관련하여, 도 6은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 질의 분석 과정에 대한 실시예의 흐름도를 도시한다.First, with reference to a query analysis process S100, FIG. 6 shows a flowchart of an embodiment of a query analysis process in a query response type smart search service providing method according to the present invention.

질의 분석부(110)가 사용자의 질의를 자연어 처리기(120)와 관계어 사전(210)를 통해 분석하여 상기 질의에서 요소를 추출(S151)하고, 추출된 요소에서 단서 요소와 키워드 요소를 판단(S153)한다. 그리고 상기 단서 요소와 상기 키워드 요소의 결합에 따른 질의 유형을 분석(S155)하여 질의 유형에 대응되는 질의 도메인을 판단(S157)한다.The query analyzing unit 110 analyzes the query of the user through the natural language processor 120 and the related dictionary 210 to extract the element from the query S151 and determines the clue element and the keyword element from the extracted element S153). Then, the query type according to the combination of the clue element and the keyword element is analyzed (S155), and the query domain corresponding to the query type is determined (S157).

가령, 도 7에 도시된 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 질의 분석 과정에 대한 구현예를 참조하여 살펴보면, 상기 도 7의 (a)와 같이 검색 입력창(310)을 통해 사용자의 질의로서 '김치찌개 조리법'이 입력된 경우, 이를 자연어 처리기(120)와 관계어 사전(210)를 통해 분석하여 상기 도 7의 (b)와 같이 단서 요소(311)로서 '조리법'과 상기 단서 요소에 대응되는 키워드 요소(313)로서 '김치찌개'가 추출될 수 있다.For example, referring to the embodiment of the query analysis process in the query response type smart search service providing method according to the present invention shown in FIG. 7, When the 'kimchi stew recipe' is inputted as the query of the 'kimchi stew recipe', it is analyzed through the natural language processor 120 and the dictionary dictionary 210, and the 'recipe' The 'Kimchi stew' may be extracted as the keyword element 313 corresponding to the clue element.

이는 관계어 사전(210)에 보유된 도메인별 단어를 기초로 단서 요소(311)와 키워드 요소(313)가 해당되는 도메인이 판단될 수 있는데, 이때 관계어 사전(210)에 도메인별 주요 요소 리스트가 저장되어, 단서 요소(311)에 대한 도메인을 먼저 파악한 후 키워드 요소(313)가 단서 요소(311)의 도메인에 대응되는 도메인 단어인지를 파악할 수도 있다.This is because the domain in which the clue element 311 and the keyword element 313 correspond can be determined on the basis of the domain-specific word held in the related word dictionary 210. At this time, It is possible to determine whether the keyword element 313 is a domain word corresponding to the domain of the clue element 311 after the domain of the clue element 311 is first recognized.

단서 요소(311)에 대한 도메인과 키워드 요소(313)에 대한 의미나 태그를 관계어 사전(210)을 통해 파악하면, 상기 도 7의 (C)와 같이 관계어 사전(210) 상에 단서 요소(311)인 '조리법'은 도메인이 '레시피'로 분류되어 있고, 키워드 요소(313)인'김치찌개'는 음식명으로 분류되어, 단서 요소(311)와 키워드 요소(313)의 결합으로 음식 레시피에 대한 질의 유형이 파악되며, 이에 따라 상기 도 7의 (d)와 같이 질의에 대한 도메인이 '레시피'로 판단될 수 있다.If the meaning and the tag for the domain element 311 and the keyword element 313 for the clue element 311 are grasped through the relation dictionary 210 as shown in FIG. 7C, The combination of the clue element 311 and the keyword element 313 is classified into a food name and a food item by the combination of the clue element 311 and the keyword element 313, The query type for the recipe is grasped, and the domain for the query can be judged as a 'recipe' as shown in FIG. 7 (d).

이와 같이 질의 분석 과정(S100)에서는, 자연어 처리 기술과 사전에 정의된 도메인별 단어를 보유한 관계어 사전을 통해 질의 유형을 분석하여 질의에 대한 도메인을 판단하게 된다.As described above, in the query analysis process (S100), the domain of the query is determined by analyzing the query type through the natural language processing technique and the related dictionary having the domain-specific words defined in advance.

다음으로 스니펫 추출 과정(S300)과 관련하여, 스니펫 패턴 DB를 구축하는 과정을 도 8에 도시된 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 패턴 생성 과정에 대한 실시예의 흐름도를 참조하여 살펴보기로 한다.Next, with respect to the process of extracting the snippet pattern (S300), a process of constructing the snippet pattern DB will be described with reference to the flow chart of the embodiment of the snippet pattern generation process in the query response type smart search service providing method according to the present invention shown in FIG. As shown in FIG.

먼저, 웹 봇 등이 문서를 검색(S210)하여 수집하면, 수집된 문서를 스니펫 추출부(130)가 자연어 처리기(120)를 통해 각각의 요소로 분석(S220)한다. 여기서 문서에 대한 요소의 분석은 자연어 처리기(120)를 통한 형태소 분석, 문장 분리 등을 통해 이루어질 수 있다.First, when a web bot or the like searches for a document (S210) and collects the collected document, the snippet extractor 130 analyzes the collected document as a respective element through the natural language processor 120 (S220). Here, the analysis of the elements of the document can be performed through morphological analysis through the natural language processor 120, sentence separation, and the like.

그리고 관계어 사전(210)을 이용하여 분석된 요소에서 단서 요소와 이에 대응되는 키워드 요소를 판단하고 이들 결합에 따른 도메인을 판단하여 스니펫 도메인을 결정하는데, 이는 앞서 질의에 대한 질의 도메인을 판단하는 과정과 유사하며, 스니펫 도메인을 결정하는 과정은 상황에 따라서 다른 과정과의 순위가 변경될 수 있기에 상기 도 8의 흐름도에서는 생략하였다.The sniff domain is determined by determining the clue element and the corresponding keyword element in the analyzed element by using the related word dictionary 210 and determining the domain according to the combination of the clue element and the keyword element. And the process of determining the snippet domain is omitted in the flowchart of FIG. 8 because the order of the other processes may be changed depending on the situation.

문서에 대한 요소 분석이 완료되면, 상기 문서 상에서 요소를 포함하는 영역에 대한 구조를 분석(S230)하고, 요소 간의 연관 관계를 판단(S240)하여 상기 연관 관계를 기초로 분석된 구조를 조합하여 스니펫 패턴을 생성(S250)한다.When the element analysis of the document is completed, the structure of the region including the element is analyzed (S230), the relationship between the elements is determined (S240), and the analyzed structure is combined And creates a nipple pattern (S250).

이때, 스니펫 패턴은 특정 도메인에 대응되는 도메인별 특화 스니펫 패턴과 모든 도메인에 대응되는 공통 스니펫 패턴을 구분하여 생성할 수 있는데, 가령 단순히 순서가 부여된 순차적인 리스트, 테이블 리스트, 단어 나열 리스트 등은 모든 도메인에서 적용 가능한 구조 형태이므로 이러한 구조 조합은 공통 스니펫 패턴으로 구분될 수 있으며, 재료 리스트와 조리 순서 리스트 등의 구조 조합은 레시피 도메인에 제한적으로 적용될 수 있기에 레시피 도메인의 특화 스니펫 패턴으로 구분될 수 있다. 공통 스니펫 패턴이나 특화 스니펫 패턴의 구분은 관리자가 설정하는 조건에 따라 변경될 수 있으며, 나아가서 추출된 스니펫 패턴을 관리자가 임의적으로 공통 스니펫 패턴이나 특화 스니펫 패턴으로 분류할 수도 있다.At this time, the snippet pattern can be generated by distinguishing the domain-specific specialized snippet pattern corresponding to the specific domain and the common snippet pattern corresponding to all the domains. For example, a simple sequential list, a table list, List can be divided into common snippet pattern, and the combination of structure such as material list and cooking order list can be applied to the recipe domain in a limited manner, so that the specialization snippet of the recipe domain Patterns. The distinction between the common snippet pattern and the specialized snippet pattern can be changed according to the condition set by the administrator, and the administrator can arbitrarily classify the extracted snippet pattern into a common snippet pattern or a specialized snippet pattern.

그리고 생성된 스니펫 패턴은 스니펫 패턴 DB(250)에 저장되는데, 이때 생성된 스니펫 패턴을 앞서 판단한 상기 스니펫 도메인에 대응시켜 저장한다.The generated snippet pattern is stored in the snippet pattern DB 250, and the generated snippet pattern is stored in association with the snippet domain determined in advance.

스니펫 패턴을 생성하는 구현예인 도 9를 참조하여 살펴보면, 상기 도 9의 (a)에 제시된 문서(410)에 대하여 자연어 처리 기술을 기반으로 요소를 분석하고, 요소들 중에서 단서 요소와 키워드 요소를 파악하면 단서 요소로서 '레시피'(413)가 존재하고 이에 대응되는 키워드 요소로서 '오일 파스타'(412)가 존재한다. 따라서 상기 도 9의 (a)에 제시된 문서의 경우, 상기 단서 요소와 상기 키워드 요소의 결합에 따라 문서(410)에 대한 도메인이 '레시피'로 분류될 수 있다. 이는 앞서 상기 도 7을 통해 질의 도메인의 판단하는 과정에서 살펴본 바와 유사하므로 자세한 설명은 생략한다.Referring to FIG. 9, which is an embodiment of generating a snippet pattern, an element is analyzed based on a natural language processing technique for the document 410 shown in FIG. 9A, and a clue element and a keyword element There is a 'recipe' 413 as a clue element and 'oil pasta' 412 exists as a keyword element corresponding to the 'recipe' 413. Therefore, in the case of the document shown in FIG. 9A, the domain for the document 410 can be classified as 'recipe' according to the combination of the clue element and the keyword element. This is similar to the process of determining a query domain through the above-described FIG. 7, and thus a detailed description thereof will be omitted.

그리고 분석된 요소를 중심으로 문서(410)의 구조를 분석하면, 주요 요소로서 레시피(413), 재료(413), 조리방법(415) 등이 존재하며, 문서(310) 상단 영역에 레시피(413)를 포함하는 제목(411)이 위치하고, 중단 영역에 재료(413)와 연관된 재료 단어들이 나열(414)되어 있으며, 하단 영역에 조리방법(415)과 연관된 조리 순서 리스트(416)가 기재되어 있는 것으로 분석된다. 이를 기초로 요소 간의 연관 관계를 판단하면 제목(411)에 포함된 '오일 파스타', '레시피'에 대응되어 '재료'(413)가 위치하는 영역에 재료 단어들(413)이 연관되고, 또한 제목(411)에 포함된 '오일 파스타', '레시피'와 '재료'(413)에 대응되어 '조리 방법'(415)이 위치하는 영역에 조리 순서 리스트(416)가 연관되는 것으로 분석될 수 있다. 이러한 연관 관계 분석을 기초로 구조를 조합하여 스니펫 패턴을 생성한다. When the structure of the document 410 is analyzed based on the analyzed elements, there are a recipe 413, a material 413, a cooking method 415 and the like as main elements, and a recipe 413 , The material words associated with the material 413 are listed 414 in the stop area and the cooking order list 416 associated with the cooking method 415 is listed in the bottom area Respectively. The material words 413 are related to the area where the 'material' 413 corresponds to the 'oil pasta' and the 'recipe' included in the title 411, The cooking order list 416 may be analyzed as being associated with the area where the 'cooking method' 415 is located corresponding to the 'oil pasta', 'recipe' and 'material' 413 included in the title 411 have. A snippet pattern is generated by combining structures based on this association analysis.

가령 상기 도 9의 (a)에 제시된 문서(410)의 분석 결과를 통합하면, 상기 도 9의 (b)에 도시된 바와 같이 스니펫 도메인이 '레시피'이며 '순서 리스트' 패턴(420)으로서, 레시피 도메인에 대응되어 제목, 재료, 조리방법으로 구성된 특화 스니펫 패턴(430)이 생성될 수 있다.For example, when the analysis result of the document 410 shown in FIG. 9A is integrated, as shown in FIG. 9B, the snippet domain is a 'recipe' and the 'order list' , And a specialized snippet pattern 430 composed of a title, a material, and a cooking method corresponding to the recipe domain can be generated.

또한 상기 도 9의 (a)에 제시된 문서(410)의 분석 결과를 개별적으로 분리하면, 상기 도 9의 (c)에 도시된 바와 같이 두가지 스니펫 패턴이 생성될 수 있는데, 하나는 스니펫 도메인이 '레시피'이며 재료에 대한 '개체명 나열' 패턴(440)으로서, 레시피 도메인에 대응되어 제목, 재료로 구성된 특화 스니펫 패턴(450)이 생성될 수 있고, 다른 하나는 스니펫 도메인이 '레시피'이며 조리 순서에 대한 '순서 리스트' 패턴(460)으로서, 레시피 도메인에 대응되어 제목, 조리 순서로 구성된 특화 스니펫 패턴(470)이 생성될 수도 있다.In addition, when the analysis results of the document 410 shown in FIG. 9A are individually separated, two types of snippet patterns can be generated as shown in FIG. 9C, The specialized snippet pattern 450 composed of the title and the material corresponding to the recipe domain can be generated as the 'recipe' and the 'list entity name' pattern 440 for the material, Recipe 'and the' order list 'pattern 460 for the cooking order, a special snippet pattern 470 corresponding to the recipe domain and composed of title and cooking order may be generated.

이와 같은 과정을 통해 다양한 스니펫 패턴을 추출하고 이를 스니펫 패턴 DB(250)에 보유할 수 있다.Through this process, various snippet patterns can be extracted and stored in the snippet pattern DB 250.

스니펫 추출 과정(S300)에서 스니팻 패턴을 적용하여 질의에 대한 스니펫 후보를 추출하는 과정과 관련하여, 도 10은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 후보 추출 과정에 대한 실시예의 흐름도를 도시한다.FIG. 10 is a flowchart illustrating a method for extracting a snippet candidate for a query by applying a snippet pattern in a snippet extracting process (S300). FIG. 10 is a flowchart illustrating a process of extracting a snippet candidate from a query response- 1 shows a flow chart of an embodiment of the present invention.

스니펫 추출부(130)는 앞서 상기 도 6의 실시예 등을 통해 판단된 사용자의 질의에 대한 질의 도메인에 대응되는 스니펫 패턴을 스니펫 패턴 DB(250)에서 검색(S311)하여 추출(S312)하는데, 스니펫 패턴 DB(250)에서 상기 질의 도메인과 대응되는 스니펫 도메인을 검색하고 검색된 스니펫 도메인에 매칭되어 저장된 스니펫 패턴을 추출한다.The snippet extracting unit 130 searches the snippet pattern DB 250 for a snippet pattern corresponding to the query domain for the query of the user determined through the embodiment of FIG. 6 or the like (S311) , Searches the snippet domain corresponding to the query domain in the snippet pattern DB 250, and extracts a snippet pattern stored in a matching manner with the retrieved snippet domain.

또한 스니펫 추출부(130)는 사용자의 질의에 포함된 요소를 기초로 문서를 검색(S331)하는데, 이때 문서는 필요시에 인터넷 등을 통해 검색할 수도 있고 또는 사전에 보유된 문서 DB에서 검색할 수도 있다.In addition, the snippet extracting unit 130 searches for a document based on the elements included in the query of the user (S331). At this time, the document may be searched through the Internet or the like, if necessary, You may.

스니펫 추출부(130)는 검색된 문서를 자연어 처리기(120)와 관계어 사전(250)을 이용하여 요소로 분석(S332)하고, 질의 도메인에 대응되어 추출한 스니펫 패턴을 검색된 문서에 적용하여 상기 문서 상에서 스니펫 후보를 추출(S333)한다.The snippet extracting unit 130 analyzes the searched document as an element by using the natural language processor 120 and the dictionary 250 in operation S332 and applies the extracted snippet pattern corresponding to the query domain to the searched document, The snippet candidate is extracted on the document (S333).

앞서 상기 9의 구현예를 통해 살펴본 바와 같이 스니펫 패턴은 문서 상에 내용이 개재된 형태로서, 스니펫 패턴을 적용하여 스니펫 패턴에 따라 해당 문서에서 내용을 추출하고 이를 취합함으로써 용이하게 문서 상에서 스니펫 후보를 추출할 수 있게 된다.As described in the embodiment of the above 9, the snippet pattern is a form having contents on the document. The snippet pattern is applied to extract the contents from the document according to the snippet pattern, The snippet candidate can be extracted.

스니펫 후보를 추출하는 과정에 대한 하나의 구현예로서, 도 11을 참조하면, 상기 도 11의 (a)는 질의 분석 과정의 결과로서, 사용자의 질의(510)' 여자 헬스 운동 순서'에 대하여 자연어 처리 기술을 기반으로 분석하여 요소와 질의 도메인(515) '피트니스'가 판단된 예이다. Referring to FIG. 11, FIG. 11 (a) illustrates a query process 510 of a user, as a result of a query analysis process, It is an example of judging the element and the query domain 515 'fitness' by analyzing based on natural language processing technology.

상기 질의에 포함된 요소를 기초로 상기 도 11의 (b)에 도시된 문서(530)가 검색되어, 검색된 문서(530)에서 스니펫 후보를 추출하는 과정을 살펴보면, 먼저 검색된 문서(530)에 대한 자연어 처리 과정을 수행하여 문서(530) 상의 각각의 요소를 분석한다. 11 (b) is searched based on the elements included in the query, and a process of extracting a snippet candidate from the searched document 530 will be described. First, in the retrieved document 530, And performs a natural language process on the document 530 to analyze each element on the document 530.

그리고 질의 도메인(515) '피트니스'에 대응되어 스니펫 패턴 DB(250)에서 추출된 스니펫 패턴(530)을 문서(530)에 적용하는데, 여기서 질의 도메인 '피트니스'에 대응되어 스니펫 도메인이 '피트니스'이며 제목, 운동 순서 리스트로 구성된 스니펫 패턴(530)이 추출되어 이를 적용하는 경우로서 설명한다.Then, the snippet pattern 530 extracted from the snippet pattern DB 250 is applied to the document 530 in correspondence with the query domain 515 'fitness', where the snippet domain corresponding to the query domain 'fitness' Fitness ", and a snippet pattern 530 composed of a title and a movement order list is extracted and applied.

스니펫 패턴(530)이 제목, 운동 순서 리스트로 구성되어 있으므로 이를 문서(530)에 적용하면, 문서 상에서 제목을 나타내는 요소(531)와 순서를 나타내는 요소(533, 534)가 스니펫 패턴(530)에 대응되므로, 이를 중심으로 내용을 발굴하면, 제목을 나타내는 요소(531)를 포함하는 내용, 순서를 나타내는 요소(533, 534)를 포함하는 내용(532, 535)이 발굴될 수 있다.Since the snippet pattern 530 is composed of a title and a movement order list and is applied to the document 530, the element 531 indicating the title and the elements 533 and 534 indicating the order on the document are included in the snippet pattern 530 The contents 532 and 535 including the contents 533 and 534 indicating the contents and the contents including the element 531 indicating the title can be found out.

이와 같이 발굴된 내용을 스니펫 패턴(530)에 따라 취합하고 가공함으로써,문서(530) 상에서 제목에 대한 내용과 운동 순서에 대한 내용이 요약 정리된 스니펫 후보(540)가 추출된다.The snippet candidate 540, which summarizes the content of the title and the order of the exercise, is extracted on the document 530 by collecting and processing the excavated contents according to the snippet pattern 530. [

스니펫 후보를 추출하는 과정에 대한 다른 하나의 구현예로서, 도 12를 참조하면, 상기 도 12의 (a)는 질의 분석 과정의 결과로서, 사용자의 질의(550) '김연아 동영상 모음'에 대하여 자연어 처리 기술을 기반으로 분석하여 요소와 질의 도메인(555) '동영상 리스트'로 판단된 예이다. 이와 같은 질의에 포함된 요소를 기초로 상기 도 12의 (b)에 도시된 문서(570)가 검색되어, 검색된 문서(570)에서 스니펫 후보를 추출하는 과정을 살펴보기로 한다.Referring to FIG. 12, (a) of FIG. 12 shows a result of a query analysis process, a query 550 of the user ' And analyzed based on a natural language processing technique to determine an element and a query domain 555 as a 'moving picture list'. A process of extracting a snippet candidate from the retrieved document 570 will be described with reference to the document 570 shown in FIG. 12B based on the elements included in the query.

먼저 검색된 문서(570)에 대한 자연어 처리 과정을 수행하여 문서(570) 상의 각각의 요소를 분석하고, 질의 도메인(555) '동영상 리스트'에 대응되어 스니펫 패턴 DB(250)에서 추출된 스니펫 패턴(560)을 문서(570)에 적용하는데, 여기서 질의 도메인 '동영상 리스트'에 대응되어 스니펫 도메인이 '동영상 리스트'이며 제목, 동영상 명칭과 URL의 순서 리스트로 구성된 스니펫 패턴(560)이 추출되어 이를 문서(570)에 적용한다. A natural language process is performed on the searched document 570 to analyze each element on the document 570 and the snippets extracted from the snippet pattern DB 250 corresponding to the query domain 555 ' The pattern 560 is applied to the document 570 where a snippet pattern 560 consisting of an ordered list of titles, video names, and URLs corresponding to the query domain 'video list' And applies it to the document 570.

문서(570) 상에는 동영상 명칭을 나타내는 요소(571, 573)와 동영상 요소(572)가 존재하며, 순차적으로 동영상 명칭을 나타내는 요소(571) 이후에 동영상 요소(572)가 존재하고 있다. 따라서 스니펫 패턴(560)의 형태를 적용하면 문서(570) 상에서 동영상 명칭을 나타내는 요소(571)와 동영상 요소(572)의 링크 URL이 연관되어 발굴될 수 있다.On the document 570, there are the elements 571 and 573 indicating the moving picture name and the moving picture element 572, and the moving picture element 572 exists after the element 571 indicating the moving picture name sequentially. Therefore, when the form of the snippet pattern 560 is applied, the element 571 representing the moving picture name and the link URL of the moving picture element 572 can be found in association with each other on the document 570.

이와 같이 발굴된 내용을 스니펫 패턴(560)에 따라 취합하고 가공함으로써, 문서(570) 상에서 동영상 명칭과 동영상 URL이 결합된 내용이 요약 정리된 스니펫 후보(580)가 추출된다.The snippet candidate 580 in which the contents combined with the moving picture name and the moving picture URL are summarized on the document 570 is extracted by collecting and processing the excavated contents according to the snippet pattern 560 and processing.

나아가서 스니펫 추출 과정(S300)에서 스니팻 패턴을 적용하여 질의에 대한 스니펫 후보를 추출하는 과정은, 하나의 문서에 다수의 스니펫 패턴을 적용하여 다수의 스니펫 후보를 추출하고 추출된 다수의 스니펫 후보를 취합하여 하나의 스니펫 후보로 추출할 수 있는데, 이와 관련하여 도 13은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 후보 추출 과정에 대한 다른 실시예의 흐름도를 도시한다.Further, in the process of extracting a snippet candidate for a query by applying a snippet pattern in the snippet extraction process (S300), a plurality of snippet candidates are extracted by applying a plurality of snippet patterns to one document, 13 is a flow chart of another embodiment of the snippet candidate extracting process in the query response type smart search service providing method according to the present invention. do.

상기 도 13의 실시예는 상기 도 10의 실시예에서 복수의 스니펫 패턴을 추출(S312)하고 검색된 문서를 자연어 처리 기술을 기반으로 분석(S332)한 이후의 과정을 나타낸다.The embodiment of FIG. 13 shows a process after extracting a plurality of snippet patterns (S312) in the embodiment of FIG. 10 and analyzing the retrieved document based on the natural language processing technique (S332).

스니펫 추출부(130)는, 분석된 문서(S335)에 복수의 스니펫 패턴 각각을 적용하여 스니펫 후보를 추출하는데, 상기 도 13에서는 분석된 문서에 공통 스니펫 패턴을 적용하여 스니펫 후보를 추출(S336)하는 과정과 특화 스니펫 패턴을 적용하여 스니펫 후보를 추출(S337)하는 과정으로 도시되어 있으나, 추출된 스니펫 패턴에 따라 복수의 특화 스니펫 패턴이나 복수의 공통 스니펫 패턴을 적용할 수도 있다.The snippet extracting unit 130 extracts the snippet candidates by applying each of the plurality of snippet patterns to the analyzed document S335. In FIG. 13, the common snippet pattern is applied to the analyzed document, (Step S336), and extracting a snippet candidate by applying a specialized snippet pattern (step S337). However, according to the extracted snippet pattern, a plurality of specialized snippet patterns or a plurality of common snippet patterns May be applied.

그리고 복수의 스니펫 패턴 각각을 적용하여 추출된 복수의 스니펫 후보를 취합하여 통합 가공(S338)함으로써 하나의 문서에 복수의 스니펫 패턴을 적용하여 스니펫 후보를 추출(S339)할 수 있다.Then, a plurality of snippet candidates extracted by applying each of the plurality of snippet patterns are collected and integrated (S338), whereby a plurality of snippet patterns are applied to one document to extract the snippet candidates (S339).

상기 도 13의 실시예와 관련하여, 도 14는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 후보 추출 과정에 대한 다른 구현예를 도시한다.14, another embodiment of the snippet candidate extraction process in the method of providing a query response type smart search service according to the present invention is shown.

상기 도 14의 구현예를 설명함에 있어서, 문서의 분석으로 요소를 추출하고 영역 분석을 통해 전체적인 구조를 파악하는 과정은 앞서 상기 도 11 및 도 12를 통해 자세히 살펴보았으므로, 여기에서는 복수의 스니펫 패턴을 적용하는 개념에 대해서만 간략하게 설명하기로 한다.In the description of the embodiment of FIG. 14, a process of extracting elements by analyzing a document and analyzing the entire structure through area analysis has been described in detail with reference to FIGS. 11 and 12, The concept of applying a pattern is briefly described.

상기 도 14의 구현예는 사용자의 '파스타 조리방법'의 질의에 대한 스니펫 후보를 추출하는 경우로서, 스니펫 도메인이 '레시피'이며 제목, 재료로 구성된 '레시피'에 대한 특화 스니펫 패턴(620)과 모든 도메인에 적용가능한 순서 리스트로 구성된 공통 스니펫 패턴(640)을 추출하여 문서(610)에 적용하는 경우이다.The embodiment of FIG. 14 is a case of extracting a snippet candidate for a query of the 'pasta cooking method' of a user, wherein a snippet domain is a 'recipe' and a specialized snippet pattern for a 'recipe' 620) and a common snippet pattern 640 composed of an order list applicable to all domains are extracted and applied to the document 610.

제목, 재료로 구성된 '레시피'에 대한 특화 스니펫 패턴(620)을 문서(610)에 적용하면 문서(610) 상에서 특화 스니펫 패턴(620)에 따라 재료 리스트의 내용에 대한 스니펫 후보(630)가 추출될 수 있다. 또한 순서 리스트로 구성된 공통 스니펫 패턴(640)을 문서(610)에 적용하면 문서(610) 상에서 순차적인 순서로 나열된 내용에 대한 스니펫 후보(650)가 추출될 수 있는데, 이때 순차적인 순서로 나열된 내용으로서 조리 순서가 스니펫 패턴에 대응되어 추출될 수 있다.Applying a specialized snippet pattern 620 for a 'recipe' consisting of a title and a material to a document 610 causes a snippet candidate 630 for the content of the material list according to the specialized snippet pattern 620 on the document 610 Can be extracted. In addition, when a common snippet pattern 640 composed of an order list is applied to the document 610, the snippet candidates 650 for the contents listed in a sequential order on the document 610 can be extracted. In this case, The cooking sequence can be extracted corresponding to the snippet pattern as the listed contents.

그리고 특화 스니펫 패턴(620)을 적용하여 추출한 스니펫 후보(630)와 공통 스니펫 패턴(640)을 적용하여 추출한 스니펫 후보(650)를 통합하여 가공하면, 상기 도 14에 도시된 바와 같이 제목, 재료, 조리 순서의 내용이 요약된 스니펫 후보(660)가 추출된다.If the snippet candidate 630 extracted by applying the specialized snippet pattern 620 and the snippet candidate 650 extracted by applying the common snippet pattern 640 are integrated and processed, A snippet candidate 660 is extracted which summarizes the contents of the title, the material, and the cooking order.

이와 같이 본 발명에서는 하나의 문서에 다양한 형태의 스니펫 패턴을 적용함으로써, 복잡한 구조를 갖는 문서일지라도 각각의 스니펫 패턴에 따라 용이하게 각각의 내용을 발굴할 수 있으며, 이를 통합하여 문서 상의 내용을 적절하게 요약할 수 있게 된다.As described above, according to the present invention, by applying various types of snippet patterns to one document, it is possible to easily find each content according to each snippet pattern even in a document having a complicated structure. And can summarize appropriately.

한걸음 더 나아가서 스니펫 추출 과정(S300)은, 별도의 스니펫 패턴 DB를 구축하지 않고, 질의에 관련하여 검색된 문서 상에서 스니펫 패턴을 추출하고 곧바로 이를 적용하여 스니펫 후보를 추출할 수도 있는데, 이와 관련하여 도 15는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 패턴 추출과 스니펫 후보 추출의 통합 과정에 대한 실시예의 흐름도를 도시한다.Further, the snippet extraction process (S300) can extract a snippet candidate by extracting a snippet pattern on a document retrieved in association with a query without directly constructing a separate snippet pattern DB, FIG. 15 is a flowchart illustrating an embodiment of a process of integrating a snippet pattern extraction and a snippet candidate extraction in a query response type smart search service providing method according to the present invention.

상기 도 15는 질의 분석 과정(S100)을 통해 사용자의 질의 유형에 대한 분석이 완료된 이후의 과정으로서, 사용자의 질의에 포함된 요소를 기초로 문서를 검색(S315)하고, 자연어 처리 기술을 기반으로 검색된 문서를 분석(S316)한다. 그리고 분석된 문서에 대하여 요소 영역에 대한 구조를 분석(S317)을 통해 해당 문서의 전체적인 형태를 파악하고, 요소 간의 연관 관계를 판단(S318)한다.FIG. 15 is a process after the analysis of the query type of the user is completed through the query analysis process (S100). The document is searched (S315) based on the elements included in the query of the user (S315) The retrieved document is analyzed (S316). Then, the analyzed structure of the element area is analyzed (S317), the overall shape of the document is identified, and the relation between the elements is determined (S318).

이와 같은 문서의 분석 과정을 통해 해당 문서의 전반적인 구조와 요소 간의 연관 관계를 기초로 문서 상에서 질의 유형에 대응되는 스니펫 패턴을 추출(S319)한다. 상기 도 15에서 문서를 분석하고 문서로부터 스니펫 패턴을 추출하는 과정은 앞서 살펴본 상기 도 8의 실시예와 유사한데, 상기 도 15에서는 사용자의 질의와 관련되어 검색된 문서에서 스니펫 패턴을 추출하는 점이 상기 도 8과는 상이하다.Through the analysis process of the document, a snippet pattern corresponding to the query type is extracted (S319) based on the relation between the overall structure of the document and the element. 15, the process of analyzing a document and extracting a snippet pattern from a document is similar to the embodiment of FIG. 8 described above. In FIG. 15, a point of extracting a snippet pattern from a retrieved document 8 is different from the above.

사용자의 질의와 관련되어 검색된 문서에서 스니펫 패턴을 추출한 후 곧바로 스니펫 패턴을 상기 문서에 적용하여 상기 문서 상에서 스니펫 후보를 추출(S335)한다. 스니펫 후보의 추출에 대해서는 앞서 상기 도 11, 도 12 및 도 14의 구현예를 통해 상세하게 설명하였으므로, 이에 대한 자세한 설명은 생략하기로 한다.After extracting the snippet pattern from the retrieved document in association with the query of the user, the snippet pattern is applied to the document immediately and the snippet candidate is extracted on the document (S335). The extraction of the snippet candidates has been described in detail with reference to the embodiments of FIGS. 11, 12 and 14, and thus a detailed description thereof will be omitted.

다음으로 스니펫 추출 과정(S300)에서 스니펫 후보 중에서 스니펫을 추출하는 과정은, 하나 이상의 스니펫 후보를 추출한 상태에서 필터링을 통해 적절한 스니펫 후보만을 선별하여 스니펫으로 추출하며, 이와 관련하여 도 16은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 스니펫 추출 과정에 대한 실시예의 흐름도를 도시한다.Next, in the process of extracting the snippet from the snippet candidates in the snippet extracting process (S300), only one or more snippet candidates are extracted, and only appropriate snippet candidates are selected through filtering to extract them as snippets. 16 is a flowchart illustrating an embodiment of a snippet extraction process in a query response type smart search service providing method according to the present invention.

앞서 살펴본 다양한 실시예와 구현예를 통해 사용자의 질의와 관련된 스니펫 후보를 추출하여 준비한 상태(S351)에서, 스니펫 추출부(130)는, 스니펫 후보에 대한 형태 분석(S352)과 의미 분석(S354)으로 질의에 대한 응답으로 적합한 스니펫을 추출하게 된다.In the state (S351) in which the snippet candidates related to the user's query are extracted and prepared through the various embodiments and the implementation examples described above, the snippet extractor 130 extracts the snippet candidate from the form analysis (S352) (S354), an appropriate snippet is extracted in response to the query.

스니펫 후보에 대한 형태 분석(S352)으로서, 상기 스니펫 후보의 추출에 적용된 스니펫 패턴에 대한 적용 회수, 상기 스니펫 후보의 추출에 적용된 스니펫 패턴에 대한 평가 점수, 상기 스니펫 후보의 문장 길이 등 상기 스니펫 후보의 외형적인 여러 사항을 고려하여 상기 스니펫 후보에 대한 가중치를 산출(S353)한다.A form analysis (S352) for a snippet candidate includes: an application count for a snippet pattern applied to extraction of the snippet candidate; an evaluation score for a snippet pattern applied to the extraction of the snippet candidate; The weight of the snippet candidate is calculated in consideration of various external factors of the snippet candidate such as the length (S353).

가령, 사용자의 질의와 관련하여 스니펫 후보를 추출하는데 적용된 스니펫 패턴에 대한 평가를 통해 추출된 스니펫 후보가 질의에 적절한 응답인지를 판단할 수 있는데, 사용자의 질의에 대한 다수의 스니펫 후보의 추출시 하나의 특정 스니펫 패턴이 많이 적용될수록 해당 질의와 상기 특정 스니펫 패턴은 관련성이 높다고 볼 수 있으므로 상기 특정 스니펫 패턴을 적용하여 추출된 스니펫 후보도 상기 질의에 적합하다고 예상할 수 있다. 또한 특정 스니펫 패턴으로 추출한 스니펫 후보를 스니펫으로 추출하여 검색 결과로서 제공하였을 때, 이에 대한 사용자의 반응 정도를 파악하거나 또는 특정 스니펫 패턴에 대한 신뢰도를 사전에 관리자 등이 설정하여, 스니펫 패턴에 대한 평가 점수를 산정하고, 스니펫 패턴에 산정된 평가 점수를 고려하여 이를 적용한 스니펫 후보가 상기 질의에 적합한지를 판단할 수도 있다.For example, an evaluation of a snippet pattern applied to extract a snippet candidate with respect to a user query can determine whether the extracted snippet candidate is an appropriate response to the query. A plurality of snippet candidates The more the one specific snippet pattern is applied, the higher the relevance of the query and the specific snippet pattern is. Therefore, the snippet candidate extracted by applying the specific snippet pattern may be expected to be suitable for the query have. In addition, when a snippet candidate extracted with a specific snippet pattern is extracted as a snippet and provided as a search result, the user's response to the snippet is determined, or the reliability of the specific snippet pattern is set in advance by the manager The evaluation score for the nipple pattern may be calculated and the evaluation score calculated in the snippet pattern may be taken into consideration to determine whether the snippet candidate applied to the query is suitable for the query.

나아가서 스니펫 후보의 문장 길이가 너무 짧거나 너무 긴 경우, 확률적으로 상기 질의에서 벗어난 내용을 포함할 가능성이 높아지므로 스니펫 후보의 문장 길이 정보를 고려할 수도 있다.Furthermore, if the sentence length of the snippet candidate is too short or too long, it is highly probable that the content of the snippet candidate deviates from the query. Therefore, the sentence length information of the snippet candidate may be considered.

이와 같은 스니펫 후보의 외형적인 여러 요인을 고려하여 스니펫 후보에 대한 형태 분석을 통해 스니펫 후보에 대한 가중치를 산출(S353)할 수 있다.In consideration of various external factors of the snippet candidate, the weight for the snippet candidate may be calculated (S353) through the type analysis of the snippet candidate.

스니펫 후보에 대한 의미 분석(S342)으로서, 관계어 사전을 기초로 상기 스니펫 후보에 포함된 각 요소에 대한 상기 질의 도메인과의 관련도를 산출한다.As a semantic analysis (S342) for a snippet candidate, the relevance degree of each element included in the snippet candidate to the query domain is calculated on the basis of a related word dictionary.

가령, 질의 도메인과 관련성이 있는 단어들이 스니펫 후보의 내용에 많이 포될수록 상기 스니펫 후보가 질의에 적합한 응답일 가능성이 높아지므로, 관계어 사전에 보유된 도메인별 단어를 기초로 스니펫 후보에 포함된 단어들을 파악하여 스니펫 후보에 대한 관련도를 산출(S355)한다.For example, the more snippets related to the query domain are included in the content of the snippet candidate, the more likely it is that the snippet candidate is an appropriate response to the query. Therefore, the snippet candidate based on the domain- And the relevance to the snippet candidate is calculated (S355).

그리고 스니펫 후보에 대하여 산출된 가중치와 관련도를 종합하여 스니펫 후보를 필터링(S356)하는데, 가령 가중치와 관련도를 각각 변수로 대입하는 함수를 설정하고, 설정된 함수에 산출된 가중치와 관련도를 대입하여 그에 따른 결과치의 정도가 설정된 범위 내인 경우 스니펫 후보를 스니펫으로 선택(S257)할 수 있다.In step S356, the snippet candidates are filtered based on the weights and related degrees calculated for the snippet candidates. For example, a function for assigning the weights and the degrees of association to the respective variables is set, and the weights and the degrees of association And if the degree of the result is within the set range, the snippet candidate may be selected as a snippet (S257).

이와 같은 과정을 통해 스니펫이 추출되면, 추출된 스니펫을 취합하여 사용자의 질의에 대한 검색 결과를 생성하여 제공하는데, 이때 추출된 스니펫을 단순히 나열한 검색 결과를 제공할 수도 있으나, 바람직하게는 추출된 스니펫을 사용자가 보다 쉽게 인식할 수 있는 형태로 가공하여 검색 결과를 제공할 수 있다. 일례로서, 스니펫에 포함된 내용을 관계어 사전을 기초로 사용자가 인지하기 쉽게 가공할 수도 있고, 구조화나 테이블화시킬 수도 있으며, 나아가서 다수의 스니펫을 통합하여 하나의 스니펫으로 재구성할 수도 있다.When the snippet is extracted through the above process, the extracted snippet is collected to generate a search result for the user's query. In this case, the search result obtained by simply listing the extracted snippet may be provided, The extracted snippet can be processed in a form that can be easily recognized by the user, thereby providing search results. As an example, the content contained in a snippet can be easily recognized, structured, or tabulated by a user based on a related dictionary, and furthermore, a plurality of snippets can be integrated into a single snippet have.

검색 결과 제공 과정(S400)에 대한 하나의 예로써, 도 17은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 검색 결과 생성 과정에 대한 실시예의 흐름도를 도시한다.FIG. 17 shows a flowchart of an embodiment of a search result generation process in a query response type smart search service providing method according to the present invention, as an example of a search result providing process (S400).

검색 결과 생성부(150)는, 질의에 대한 검색 결과로 제공할 스니펫의 수, 스니펫에 포함된 정보 형태 등을 종합적으로 판단(S411)하고, 사전에 템플릿 DB(270)에 보유된 템플릿 중 스니펫의 정보 형태에 대응되는 템플릿을 추출(S412)하여, 추출한 템플릿의 형태에 스니펫을 매칭(S413)시켜 검색 결과를 생성(S414)한다.The search result generation unit 150 comprehensively determines the number of the snippets to be provided as a search result for the query and the information types included in the snippet in step S411, The template corresponding to the information type of the snippet is extracted (S412), the snippet is matched to the extracted template type (S413), and the search result is generated (S414).

도 18은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 검색 결과 제공 과정에 대한 구현예를 도시한다.18 shows an embodiment of a search result providing process in a query response type smart search service providing method according to the present invention.

상기 도 18의 (a)와 같이 단순 텍스트 형태의 스니펫(810)의 경우에는 스니펫(810)에 포함된 정보 형태에 대응되는 단순 텍스트 구조의 템플릿(815)을 템플릿 DB(270)에서 추출하고 추출한 템플릿(815)에 스니펫(810)을 매칭시켜서 검색 결과를 생성한다. 그리고 생성된 검색 결과를 포함하는 화면(820)을 사용자에게 제공한다.18A, a simple text format template 815 corresponding to the information format included in the snippet 810 is extracted from the template DB 270 in the case of the simple text type snippet 810 And the search result is generated by matching the snippet 810 with the extracted template 815. And provides a screen 820 containing the generated search results to the user.

상기 도 18의 (b)와 같이 텍스트와 이미지가 혼합된 스니펫(820)의 경우에는 텍스트와 이미지의 배치 위치가 설정된 템플릿(825)을 템플릿 DB(270)에서 추출하고 추출한 템플릿(825)에 스니펫(820)을 매칭시켜서 검색 결과를 생성한다. 그리고 생성된 검색 결과를 포함하는 화면(830)을 사용자에게 제공한다.In the case of the snippet 820 in which the text and the image are mixed as shown in FIG. 18 (b), the template 825 having the text and image arrangement positions set therein is extracted from the template DB 270, The snippet 820 is matched to generate a search result. And provides a screen 830 containing the generated search results to the user.

상기 도 18의 구현예에서는 하나의 스니펫 자체를 그대로 템플릿에 매칭시켜서 검색 결과를 생성하므로 스니펫에 대한 특별한 가공이 요구되지 않으나 다수의 스니펫을 취합하는 경우에는 중복되는 내용에 대한 가공이 요구되는데, 이와 관련하여, 도 19는 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 검색 결과 생성 과정에 대한 다른 구현예를 도시한다.In the embodiment of FIG. 18, since one snippet itself is directly matched to a template to generate a search result, no special processing is required for the snippet. However, when a plurality of snippets are collected, In this regard, FIG. 19 shows another embodiment of the search result generation process in the query response smart search service providing method according to the present invention.

두 개의 스니펫(850, 860)을 취합하여 통합 결과를 제공함에 있어서, 하나의 스니펫(850)에 포함된 내용(851, 853)과 다른 하나의 스니펫(860)에 포함된 내용(861, 863) 상에 서로 중복되는 내용이 존재하는 경우에는, 각 스니펫(850, 860)에 포함된 내용을 상호 대비하여 중복된 내용(853, 861)을 파악하고, 중복된 내용을 취합하여 스니펫(850, 860)을 가공한다. 그리고 가공 과정을 통해 두 개의 스니펫(850, 860)의 내용을 취합한 통합 내용(870)으로 하나의 스니펫(840)을 생성한다. The content 851 and 853 included in one snippet 850 and the content 861 included in the other snippet 860 in the aggregation of the two snippets 850 and 860 , 863), it is possible to grasp the duplicated contents 853, 861 by comparing the contents included in each of the snippets 850, 860 with each other, collect the duplicated contents, The kneaders 850 and 860 are processed. Then, a snippet 840 is created from the merged contents 870 by combining the contents of the two snippets 850 and 860 through the processing.

스니펫에 대한 가공이 완료되면, 가공된 스니펫(840)에 대응되는 템플릿(875)을 템플릿 DB(270)에서 추출하고 추출한 템플릿에 스니펫(840)을 매칭시켜 검색 결과를 생성한다.When the processing for the snippet is completed, the template 875 corresponding to the processed snippet 840 is extracted from the template DB 270, and the snippet 840 is matched with the extracted template to generate a search result.

나아가서 하나의 질의에 대하여 다수의 스니펫(881, 883, 885)을 포함하는 검색 결과(880)를 생성하여 이를 검색 결과 화면으로 제공할 수도 있다.Furthermore, a search result 880 including a plurality of snippets 881, 883, and 885 for one query may be generated and provided as a search result screen.

상기 도 19에서와 같이 하나의 질의에 대하여 다수의 스니펫(881, 883, 885)을 포함하는 검색 결과(880)의 제공시, 다수의 스니펫(881, 883, 885)을 포함하는 검색 결과(830)를 사용자가 단번에 인식할 수 있도록 각 스니펫(881, 883, 885)의 일부 내용만을 검색 결과 화면에 노출시킬 수도 있는데, 이와 관련하여 도 20은 본 발명에 따른 질의 반응형 스마트 검색 서비스 제공 방법에서 검색 결과 제공 과정에 대한 구현예를 도시한다.As shown in FIG. 19, when providing search results 880 including a plurality of snippets 881, 883, and 885 for one query, search results including a plurality of snippets 881, 883, and 885 It is possible to expose only a part of the contents of each of the snippets 881, 883 and 885 to the search result screen so that the user can recognize the search result 830 at a time. In this regard, FIG. 2 shows an embodiment of a search result providing method in a search method.

상기 도 20의 (a)에 도시된 바와 같이, 검색 결과 화면(910)으로 복수의 스니펫(911, 915)을 순차적으로 정렬하여 제공하면서, 각 스니펫(911, 915)의 일부 내용만 화면 상에 노출시키고, 화면 상에 스니펫(911)의 전체 내용 시현을 선택할 수 있는 버튼(912)을 위치시킨다.20A, a plurality of snippets 911 and 915 are sequentially arranged and provided in the search result screen 910, and only a part of the contents of each of the snippets 911 and 915 is displayed on the screen And places a button 912 on the screen that allows selection of the entire contents of the snippet 911. [

사용자가 스니펫(911)의 전체 내용 시현을 선택할 수 있는 버튼(912)을 클릭하면, 이에 따라 상기 도 20의 (b)와 같이 선택된 스니펫(921)의 전체 내용이 노출되도록 검색 결과 화면(920)이 재구성되어 제공된다. 또한 전체 내용이 노출된 스니펫(921)을 다시 일부 내용만 노출되도록 선택할 수 있는 버튼(922)이 위치되어 이의 선택시 상기 도 20의 (a)와 같은 검색 결과 화면(910)으로 다시 재구성되어 제공된다.When the user clicks a button 912 for selecting the entire contents appearance of the snippet 911, a search result screen (not shown) is displayed so that the entire contents of the selected snippet 921 are exposed as shown in FIG. 920) are reconstructed and provided. A button 922 for selecting a portion of the snippet 921 in which the entire content is exposed is displayed again. When the snippet 921 is selected, the search result screen 910 shown in FIG. 20A is reconstructed / RTI >

이와 같이 본 발명에서는 문서에 대한 전반적인 주요 내용이 요약된 스니펫이 검색 결과로서 제공되기에 하나의 스니펫이 화면 상의 넓은 영역을 차지하여 노출될 수 있다. 따라서 다수의 스니펫을 포함하는 검색 결과를 사용자가 한눈에 파악할 수 있도록 다수의 스니펫을 기설정된 사이즈에 대응시켜 각 스니펫의 일부 내용을 노출시키고, 사용자의 선택시 선택된 스니펫의 전체 내용을 노출시킴으로써 사용자는 보다 쉽게 다수의 스니펫을 포함하는 검색 결과를 한눈에 파악할 수 있게 된다.As described above, in the present invention, a snippet summarizing the main contents of a document is provided as a search result, so that one snippet occupies a large area on the screen and can be exposed. Accordingly, in order to allow users to grasp search results including a large number of snippets, a plurality of snippets are corresponded to predetermined sizes to expose a part of each snippet, and the entire contents of the snippet By exposing, the user can more easily grasp search results containing a large number of snippets at a glance.

이상에서 살펴본 바와 같이 본 발명에 따른 질의 반응형 스마트 검색 서비스는, 질의와 관련된 문서의 전반적인 주요 내용을 요약하여 추출한 결과를 제공함으로써 검색 결과만으로도 전체적인 내용의 파악이 가능하게 되는데, 도 21은 종래 검색 서비스와 본 발명에 따른 검색 서비스에 대한 비교예를 도시한다.As described above, the query response type smart search service according to the present invention provides a result of summarizing the main contents of a document related to a query, so that the entire contents can be grasped only by a search result. Service and a search service according to the present invention.

상기 도 21에 도시된 바와 같이, 종래 검색 서비스에 따른 검색 결과 화면(930, 940)은 단순히 사용자의 질의에 포함된 키워드를 중심으로 일부 영역만이 검색 결과로서 노출되기에 검색 결과만으로는 사용자가 원하는 해답을 파악할 수가 없고 검색 결과에 포함된 내용을 클릭하여 해당 문서에 접근해야만 전반적인 내용을 파악하게 되는 번거로움이 있으며, 특히 검색 결과에 포함된 내용만으로 해당 문서에 접근시 자신이 원하는 해답을 얻지 못하는 경우가 다반사이다. As shown in FIG. 21, the search result screens 930 and 940 according to the conventional search service merely show only a part of the keyword as a search result centering on the keywords included in the user's query. Therefore, If you do not know the answer and click on the contents included in the search result to access the document, you will have to understand the whole contents. Especially, when you access the document with only contents included in the search result, The case is common.

그러나 본 발명에 따른 질의 반응형 스마트 검새 서비스에 따른 검색 결과 화면(940, 950)은 질의와 관련된 문서에 포함된 전반적인 주요 내용이 요약되어 검색 결과로 제공됨으로써, 사용자는 검색 결과만으로도 해당 문서에 대한 전반적인 주요 내용을 파악할 수 있게 되며, 검색 결과를 통해 해당 문서의 전체적인 내용 파악이 가능하기에 자신이 원하는 문서를 보다 쉽고 빠르게 찾을 수 있게 된다.However, since the search results screen 940 and 950 according to the query response type smart search service according to the present invention are summarized as the search result as a summary of the main contents included in the document related to the query, the user can search for the corresponding document You will be able to see the overall contents of the document, and the search results will give you an overall understanding of the document so that you can find the document you want more easily and quickly.

나아가서 본 발명에 따른 질의 반응형 스마트 검색 서비스는, 검색 결과 화면(940)을 질의 반응형 검색 서비스에 따른 스니펫을 포함하는 검색 결과(941)와 종래 검색 서비스에 따른 스니펫을 포함하는 검색 결과(945)를 혼합하여 제공할 수도 있는데, 검색 결과 화면(940)제공시 정확도가 높은 상위 스니펫만 본 발명에 따른 검색 서비스 제공 방법으로 추출하여 제공하고 그외 나머지 스니펫은 기존 검색 서비스 제공 방법으로 제공함으로써 사용자에게 보다 많은 검색 결과를 제공하는 동시에 정확도 높은 검색 결과를 제공할 수 있게 된다.Further, the query response type smart search service according to the present invention may include a search result screen 940, which includes a search result 941 including a snippet according to a query response type search service and a search result 942 including a snippet according to a conventional search service Only the uppermost snippet having high accuracy when providing the search result screen 940 is extracted and provided by the search service providing method according to the present invention, and the remaining remaining snippets are provided to the existing search service providing method It is possible to provide more search results to the user while providing accurate search results.

한걸음 더 나아가서, 질의 반응형 검색 서비스에 따른 스니펫(951, 955)만을 포함하도록 검색 결과 화면(950)을 구성할 수도 있고, 본 발명에 다른 질의 반응형 검색 서비스에 따른 스니펫과 기존 검색 서비스에 다른 스니펫이 혼합된 검색 결과 화면을 구성할 수도 있다. 이와 같은 검색 결과 화면은 사용자의 선택이나 관리자의 설정에 따라 변경이 가능하다.Further, the search result screen 950 may be configured to include only the snippets 951 and 955 according to the query response type search service, and a snippet according to the query response type search service according to the present invention and an existing search service You can also configure a search results screen with a mix of different snippets. Such a search result screen can be changed according to a user's selection or an administrator's setting.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서 본 발명에 기재된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상이 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의해서 해석되어야하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The foregoing description is merely illustrative of the technical idea of the present invention, and various changes and modifications may be made by those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments of the present invention are not intended to limit the scope of the present invention but to limit the scope of the present invention. The scope of protection of the present invention should be construed according to the following claims, and all technical ideas within the scope of equivalents thereof should be construed as being included in the scope of the present invention.

10 :사용자 단말기,
30 : 검색 서비스 서버,
50 : 문서
100 : 검색 서비스 장치,
110 : 질의 분석부, 115 : 질의 유형 분류기,
120 : 자연어 처리기,
130 : 스니펫 추출부, 131 : 스니펫 패턴 생성기,
133 : 스니펫 후보 추출기, 135 : 스니펫 필터,
210 : 관계어 사전,
250 : 스니펫 패턴 DB,
270 : 템플릿 DB.
10: user terminal,
30: Search service server,
50: Document
100: Search service device,
110: query analysis unit, 115: query type classifier,
120: natural language processor,
130: a snippet extracting unit, 131: a snippet pattern generator,
133: snippet candidate extractor, 135: snippet filter,
210: Relational dictionary,
250: Snippet pattern DB,
270: Template DB.

Claims (25)

사용자의 질의를 수신하는 질의 수신 단계;
상기 질의에 대한 질의 유형을 분석하여 질의 도메인을 판단하는 질의 유형 분석 단계;
상기 질의에 기초하여 검색된 문서 중 하나 이상의 문서에서 상기 질의 도메인에 대응되는 내용 전개 구조가 정의된 스니펫 패턴을 추출하고, 상기 문서에 상기 스니펫 패턴을 적용하여 상기 스니펫 패턴에 따라 상기 문서에서 주요 내용을 발굴하고, 이를 취합하여 스니펫을 추출하는 스니펫 추출 단계; 및
상기 추출된 스니펫을 포함하는 상기 질의에 대한 검색 결과를 제공하는 검색 결과 제공 단계를 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
Receiving a query of a user;
A query type analysis step of analyzing a query type of the query to determine a query domain;
Extracting a snippet pattern defining a content expansion structure corresponding to the query domain from at least one of documents retrieved based on the query, applying the snippet pattern to the document, A snippet extracting step of extracting a main content and extracting a snippet; And
And a search result providing step of providing a search result of the query including the extracted snippet.
삭제delete 제 1 항에 있어서,
상기 스니펫 추출 단계는,
상기 문서에 상기 스니펫 패턴을 적용하여 상기 스니펫 패턴에 따라 상기 문서에서 주요 내용을 발굴하고 이를 취합하여 스니펫 후보를 추출하는 스니펫 후보 추출 단계; 및
상기 스니펫 후보에 대한 형태 분석과 의미 분석을 통해 상기 스니펫 후보에서 스니펫을 선택하는 스니펫 선택 단계를 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
The method according to claim 1,
In the snippet extracting step,
A snippet candidate extracting step of extracting a snippet candidate by extracting main contents from the document according to the snippet pattern by applying the snippet pattern to the document, and extracting a snippet candidate; And
And a snippet selecting step of selecting a snippet from the snippet candidate through a type analysis and a semantic analysis of the snippet candidate.
제 1 항에 있어서,
상기 질의 유형 분석 단계는,
상기 질의에서 요소를 추출하고, 관계어 사전을 통해 상기 요소에서 단서(Clue) 요소와 상기 단서 요소에 대응되는 키워드 요소를 판단하는 질의 판단 단계;
상기 단서 요소와 상기 키워드 요소의 결합에 따른 질의 유형을 판단하는 질의 유형 판단 단계; 및
상기 질의 유형에 대응되는 질의 도메인을 판단하는 도메인 판단 단계를 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
The method according to claim 1,
Wherein the query type analysis step comprises:
A query determination step of extracting an element from the query and determining a clue element and a keyword element corresponding to the clue element in the element through a relation dictionary;
A query type determination step of determining a query type according to the combination of the clue element and the keyword element; And
And a domain determination step of determining a query domain corresponding to the query type.
제 3 항에 있어서,
도메인별 스니펫 패턴을 저장한 스니펫 패턴 DB를 구축하는 스니펫 패턴 DB 구축 단계를 더 포함하고,
상기 스니펫 후보 추출 단계는,
상기 질의 도메인에 대응되는 스니펫 패턴을 상기 스니펫 패턴 DB에서 추출하는 것을 특징으로 하는 검색 서비스 제공 방법.
The method of claim 3,
And a snippet pattern database building step of building a snippet pattern DB storing a domain specific snippet pattern,
The snippet candidate extracting step includes:
And extracting a snippet pattern corresponding to the query domain from the snippet pattern DB.
제 5 항에 있어서,
상기 스니펫 패턴 DB 구축 단계는,
문서를 수집하고, 수집된 문서에 대한 자연어 처리 과정을 수행하여 상기 문서를 각각의 요소로 분석하는 문서 수집 단계;
기보유된 관계어 사전을 통해 상기 요소에서 단서 요소와 상기 단서 요소에 대응되는 키워드 요소를 판단하고, 상기 단서 요소와 상기 키워드 요소의 결합에 따른 스니펫 도메인을 결정하는 도메인 결정 단계;
상기 요소를 포함하는 영역에 대한 구조를 분석하는 문서 분석 단계;
상기 요소 간의 연관 관계를 판단하고, 상기 연관 관계를 기초로 분석된 구조를 조합하여 스니펫 패턴을 생성하는 스니펫 패턴 생성 단계; 및
상기 스니펫 패턴을 상기 스니펫 도메인에 대응시켜 상기 스니펫 패턴 DB에 저장하는 스니펫 패턴 저장 단계를 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
6. The method of claim 5,
The step of constructing the snippet pattern DB comprises:
A document collecting step of collecting a document, performing a natural language process on the collected document, and analyzing the document into respective elements;
Determining a clue element and a keyword element corresponding to the clue element in the element through a previously held relation dictionary, and determining a snippet domain according to the combination of the clue element and the keyword element;
A document analysis step of analyzing a structure of an area including the element;
A snippet pattern generation step of determining an association between the elements and generating a snippet pattern by combining the analyzed structures based on the association; And
And storing the snippet pattern in the snippet pattern DB in association with the snippet domain.
제 3 항에 있어서,
상기 스니펫 후보 추출 단계는,
상기 질의에 포함된 요소를 기초로 문서를 검색하고, 검색된 문서에 대한 자연어 처리 과정을 수행하여 각각의 요소로 분석하는 단계; 및
분석된 상기 문서에 추출한 스니펫 패턴을 적용하여, 상기 스니펫 패턴에 따라 상기 문서에서 상기 질의에 대응되는 내용을 발굴하고 이를 취합하여 스니펫 후보를 추출하는 단계를 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
The method of claim 3,
The snippet candidate extracting step includes:
Searching for a document based on the elements included in the query, performing a natural language process on the retrieved document, and analyzing the natural language process with each element; And
And extracting a snippet candidate by extracting contents corresponding to the query from the document according to the snippet pattern and collecting the extracted snippet pattern in accordance with the snippet pattern. Delivery method.
제 3 항에 있어서,
상기 스니펫 후보 추출 단계는,
상기 질의 도메인에 대응되는 복수의 스니펫 패턴을 추출하고, 하나의 문서에 각각의 스니펫 패턴을 적용하여 복수의 스니펫 후보를 추출하며,
추출한 복수의 스니펫 후보를 취합하여 하나의 스니펫 후보로 통합하는 스니펫 후보 가공 단계를 더 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
The method of claim 3,
The snippet candidate extracting step includes:
Extracting a plurality of snippet patterns corresponding to the query domain, extracting a plurality of snippet candidates by applying each snippet pattern to one document,
Further comprising a snippet candidate processing step of collecting a plurality of extracted snippet candidates and consolidating them into one snippet candidate.
제 6 항에 있어서,
상기 스니펫 패턴 생성 단계는,
특정 도메인에 대응되는 도메인별특화 스니펫 패턴과 모든 도메인에 대응되는 공통 스니펫 패턴을 구분하여 생성하는 것을 특징으로 하는 검색 서비스 제공 방법.
The method according to claim 6,
The snippet pattern generation step may include:
And generating a common snippet pattern corresponding to each domain by distinguishing a special snippet pattern for each domain corresponding to a specific domain and a common snippet pattern corresponding to all the domains.
제 3 항에 있어서,
상기 스니펫 후보 추출 단계는,
상기 질의와 관련된 문서를 수집하고, 수집된 문서에 대한 자연어 처리 과정을 수행하여 상기 문서를 각각의 요소로 분석하는 단계;
기보유된 관계어 사전을 통해 상기 요소에서 단서 요소와 상기 단서 요소에 대응되는 키워드 요소를 판단하고, 상기 단서 요소와 상기 키워드 요소의 결합에 따른 도메인을 판단하여 이를 상기 질의 도메인과 대비하는 단계;
상기 요소를 포함하는 영역에 대한 구조를 분석하는 문서 분석 단계;
상기 요소 간의 연관 관계를 판단하고, 상기 연관 관계를 기초로 분석된 구조를 조합하여 스니펫 패턴을 생성하는 스니펫 패턴 생성 단계; 및
분석된 상기 문서에 추출한 스니펫 패턴을 적용하여, 상기 스니펫 패턴에 따라 상기 문서에서 상기 질의에 대응되는 내용을 발굴하고 이를 취합하여 스니펫 후보를 추출하는 단계를 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
The method of claim 3,
The snippet candidate extracting step includes:
Collecting a document associated with the query, and performing a natural language process on the collected document to analyze the document into respective elements;
Determining a clue element corresponding to the clue element and a keyword element corresponding to the clue element in the element through a previously held relation dictionary, determining a domain according to the combination of the clue element and the keyword element, and comparing the domain with the query domain;
A document analysis step of analyzing a structure of an area including the element;
A snippet pattern generation step of determining an association between the elements and generating a snippet pattern by combining the analyzed structures based on the association; And
And extracting a snippet candidate by extracting contents corresponding to the query from the document according to the snippet pattern and collecting the extracted snippet pattern in accordance with the snippet pattern. Delivery method.
제 3 항에 있어서,
상기 스니펫 추출 단계는,
상기 스니펫 후보에 대한 형태 분석으로 가중치를 산출하고, 상기 스니펫 후보의 의미 분석으로 관련도를 산출하여, 상기 가중치와 상기 관련도를 기초로 스니펫 후보를 필터링하여 스니펫을 추출하는 것을 특징으로 하는 검색 서비스 제공 방법.
The method of claim 3,
In the snippet extracting step,
A weight is calculated by a morphological analysis of the snippet candidate, a relevance degree is calculated by semantic analysis of the snippet candidate, and a snippet is extracted by filtering the snippet candidate based on the weight value and the degree of association The search service providing method comprising:
제 11 항에 있어서,
상기 스니펫 추출 단계는,
상기 스니펫 후보에 대한 형태 분석으로서, 상기 스니펫 후보의 추출에 적용된 스니펫 패턴에 대한 적용 회수, 상기 스니펫 후보의 추출에 적용된 스니펫 패턴에 대한 평가 점수 또는 상기 스니펫 후보의 문장 길이 중 어느 하나 이상을 고려하여 상기 스니펫 후보에 대한 가중치를 산출하는 것을 특징으로 하는 검색 서비스 제공 방법.
12. The method of claim 11,
In the snippet extracting step,
The method according to claim 1, wherein, as the type analysis of the snippet candidate, the number of times of application to the snippet pattern applied to the extraction of the snippet candidate, the evaluation score of the snippet pattern applied to the extraction of the snippet candidate, And a weight for the snippet candidate is calculated in consideration of one or more of the snippet candidates.
제 11 항에 있어서,
상기 스니펫 추출 단계는,
상기 스니펫 후보에 대한 의미 분석으로서, 관계어 사전을 기초로 상기 스니펫 후보에 포함된 각 요소에 대한 상기 질의 도메인과의 관련도를 산출하는 것을 특징으로 하는 검색 서비스 제공 방법.
12. The method of claim 11,
In the snippet extracting step,
Wherein the degree of relevance of each element included in the snippet candidate to the query domain is calculated based on the relation dictionary as a semantic analysis of the snippet candidate.
제 1 항에 있어서,
상기 검색 결과 제공 단계는,
추출된 상기 스니펫의 수와 상기 스니펫에 포함된 정보 형태를 기초로 템플릿 DB에서 템플릿을 추출하는 템플릿 추출 단계;
상기 스니펫을 상기 템플릿에 매칭시켜 검색 결과를 생성하는 검색 결과생성 단계를 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
The method according to claim 1,
The search result providing step may include:
Extracting a template from the template DB based on the number of extracted snippets and the information type included in the snippet;
And a search result generation step of matching the snippet with the template to generate a search result.
제 14 항에 있어서,
상기 검색 결과 제공 단계는,
복수의 스니펫을 취합하여 통합하는 스니펫 가공 단계를 더 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
15. The method of claim 14,
The search result providing step may include:
And a snippet processing step of collecting and integrating a plurality of snippets.
제 1 항에 있어서,
상기 검색 결과 제공 단계는,
복수의 스니펫을 순차적으로 정렬하여 검색 결과를 제공하되, 기설정된 사이즈에 대응시켜 각 스니펫의 일부 내용을 노출시키고, 사용자의 선택시 선택된 스니펫의 전체 내용을 노출시키는 것을 특징으로 하는 검색 서비스 제공 방법.
The method according to claim 1,
The search result providing step may include:
Wherein a search result is provided by sequentially arranging a plurality of snippets, exposing a part of each snippet in correspondence with a predetermined size, and exposing the entire contents of a snippet selected at the time of a user's selection Delivery method.
사용자의 질의를 수신하는 질의 수신부;
상기 질의를 분석하여 질의 유형을 판단하는 질의 분석부;
상기 질의에 대응되는 내용 전개 구조가 정의된 스니펫 패턴을 추출하고, 상기 스니펫 패턴을 적용하여 상기 질의에 기초하여 검색된 문서 중 하나 이상의 문서에서 상기 질의와 연관된 주요 내용을 발굴하고, 이를 취합하여 스니펫을 추출하는 스니펫 추출부; 및
추출된 스니펫을 포함하는 상기 질의에 대한 검색 결과를 제공하는 검색 결과 제공부를 포함하는 것을 특징으로 하는 검색 서비스 장치.
A query receiving unit for receiving a user query;
A query analyzer for analyzing the query to determine a query type;
Extracting a snippet pattern in which a content development structure corresponding to the query is defined, extracting a main content associated with the query from one or more documents retrieved based on the query by applying the snippet pattern, A snippet extracting unit for extracting a snippet; And
And a search result providing unit for providing a search result for the query including the extracted snippet.
삭제delete 제 17 항에 있어서,
문서 또는 문장을 형태소 분석하여 요소를 추출하는 자연어 처리기; 및
도메인별 단어, 개체어, 불용어, 동의어, 유의어 또는 이형태 중 적어도 하나 이상에 대한 정보를 저장한 관계어 사전을 더 포함하는 것을 특징으로 하는 검색 서비스 장치.
18. The method of claim 17,
A natural language processor for extracting elements by morpheme analysis of documents or sentences; And
And a relation dictionary storing information on at least one of a domain-specific word, an entity word, an abbreviation, a synonym, a thesaurus, or a variant.
제 19 항에 있어서,
상기 질의 분석부는,
상기 자연어 처리기와 상기 관계어 사전을 이용하여 상기 질의에서 요소를 추출하고 추출된 요소를 기초로 질의 유형을 분석하여 질의 도메인을 판단하는 질의 유형 분석기를 포함하는 것을 특징으로 하는 검색 서비스 장치.
20. The method of claim 19,
The query analyzing unit,
And a query type analyzer for extracting an element from the query using the natural language processor and the related dictionary, and analyzing a query type based on the extracted element to determine a query domain.
제 19 항에 있어서,
상기 스니펫 추출부는,
문서를 수집하고, 상기 자연어 처리기와 상기 관계어 사전을 이용하여 수집된 문서에서 요소와 구조를 분석하고, 상기 요소 간의 연관 관계를 판단하여 상기 연관 관계를 기초로 분석된 구조를 조합하여 스니펫 패턴을 생성하는 스니펫 패턴 생성기;
상기 질의에 포함된 요소를 기초로 검색된 문서를 상기 자연어 처리기와 상기 관계어 사전을 이용하여 요소와 구조로 분석하고 스니펫 패턴을 적용하여 스니펫 후보를 추출하는 스니펫 후보 추출기; 및
상기 스니펫 후보에 대한 형태 분석과 의미 분석을 통해 스니펫을 추출하는 스니펫 필터를 포함하는 것을 특징으로 하는 검색 서비스 장치.
20. The method of claim 19,
The snippet extracting unit extracts,
Analyzing elements and structures in a document collected by using the natural language processor and the related dictionary, judging an association between the elements, and combining the analyzed structures based on the association, A snippet pattern generator for generating a snippet pattern;
A snippet candidate extractor for extracting a snippet candidate by analyzing a document retrieved on the basis of the elements included in the query by elements and structures using the natural language processor and the related dictionary, and applying a snippet pattern; And
And a snippet filter for extracting a snippet through morphological analysis and semantic analysis of the snippet candidate.
제 21 항에 있어서,
상기 스니펫 패턴 생성기는,
생성한 스니펫 패턴에 대한 스니펫 도메인을 판단하며,
상기 스니펫 패턴 생성기가 생성한 스니펫 패턴을 상기 스니펫 도메인에 대응시켜 저장하는 스니펫 패턴 DB를 더 포함하는 것을 특징으로 하는 검색 서비스 장치.
22. The method of claim 21,
The snippet pattern generator comprising:
Determine the snippet domain for the snippet pattern you created,
And a snippet pattern DB for storing the snippet pattern generated by the snippet pattern generator in association with the snippet domain.
제 17 항에 있어서,
상기 질의 분석부는,
검색 서비스 서버로부터 사용자의 질의를 전달받고,
상기 검색 결과 제공부는,
상기 검색 결과를 상기 검색 서비스 서버로 제공하는 것을 특징으로 하는 검색 서비스 장치.
18. The method of claim 17,
The query analyzing unit,
Receives a query of the user from the search service server,
The search result providing unit,
And provides the search result to the search service server.
제 17 항에 있어서,
상기 스니펫 추출부는,
사전에 문서를 저장한 문서 DB 또는 인터넷 상에서 문서를 수집하는 것을 특징으로 하는 검색 서비스 장치.
18. The method of claim 17,
The snippet extracting unit extracts,
And collects the document on the document DB or the Internet storing the document in advance.
컴퓨터에서 제1항, 제3항 내지 16항 중 어느 한 항에 기재된 검색 서비스 제공 방법의 각 단계를 실행시키기 위한 컴퓨터로 판독 가능한 매체에 저장된 컴퓨터 프로그램.A computer program stored in a computer-readable medium for causing a computer to execute the steps of the method of providing a search service according to any one of claims 1 to 17.
KR1020150117003A 2015-08-19 2015-08-19 Methodand device of providing query-adaptive smart search service Active KR101667918B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150117003A KR101667918B1 (en) 2015-08-19 2015-08-19 Methodand device of providing query-adaptive smart search service

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150117003A KR101667918B1 (en) 2015-08-19 2015-08-19 Methodand device of providing query-adaptive smart search service

Publications (1)

Publication Number Publication Date
KR101667918B1 true KR101667918B1 (en) 2016-10-21

Family

ID=57257043

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150117003A Active KR101667918B1 (en) 2015-08-19 2015-08-19 Methodand device of providing query-adaptive smart search service

Country Status (1)

Country Link
KR (1) KR101667918B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102351388B1 (en) 2020-05-06 2022-01-14 송형석 System for providing question and automatical answer service of homepage
KR20220087704A (en) * 2020-12-18 2022-06-27 주식회사 와이즈넛 The pattern recognition method of text sentences using language resources

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100132376A (en) * 2009-06-09 2010-12-17 성균관대학교산학협력단 Snippet providing device and method
KR20130021944A (en) * 2011-08-24 2013-03-06 한국전자통신연구원 Method and apparatus for descriptive question answering
KR20130128697A (en) 2012-05-17 2013-11-27 목포대학교산학협력단 Method of snippet extraction using term correlation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100132376A (en) * 2009-06-09 2010-12-17 성균관대학교산학협력단 Snippet providing device and method
KR20130021944A (en) * 2011-08-24 2013-03-06 한국전자통신연구원 Method and apparatus for descriptive question answering
KR20130128697A (en) 2012-05-17 2013-11-27 목포대학교산학협력단 Method of snippet extraction using term correlation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102351388B1 (en) 2020-05-06 2022-01-14 송형석 System for providing question and automatical answer service of homepage
KR20220087704A (en) * 2020-12-18 2022-06-27 주식회사 와이즈넛 The pattern recognition method of text sentences using language resources
KR102445748B1 (en) * 2020-12-18 2022-09-21 주식회사 와이즈넛 The pattern recognition method of text sentences using language resources

Similar Documents

Publication Publication Date Title
US6598043B1 (en) Classification of information sources using graph structures
US20080270386A1 (en) Document retrieval system and document retrieval method
GB2575141A (en) Conversational query answering system
WO2021019831A1 (en) Management system and management method
JP2002230035A (en) Information arranging method, information processor, information processing system, storage medium and program transmitting device
WO2000075809A1 (en) Information sorting method, information sorter, recorded medium on which information sorting program is recorded
KR100396826B1 (en) Term-based cluster management system and method for query processing in information retrieval
JP4967037B2 (en) Information search device, information search method, terminal device, and program
WO2003032199A2 (en) Classification of information sources using graph structures
CN109948154A (en) A system and method for character acquisition and relationship recommendation based on mailbox name
JP2004021445A (en) Text data analysis system, text data analysis method, and computer program
JP2007279978A (en) Document search apparatus and document search method
JP2001290840A (en) Keyword search device
JP4075094B2 (en) Information classification device
US9875298B2 (en) Automatic generation of a search query
JP2004192355A (en) Informational searching method, its device and computer program for information search
KR101667918B1 (en) Methodand device of providing query-adaptive smart search service
JP3583631B2 (en) Information mining method, information mining device, and computer-readable recording medium recording information mining program
JP2003345829A (en) Method and apparatus for retrieving information, and computer program for information retrieval
CN109213830B (en) Document retrieval system for professional technical documents
JP2014102625A (en) Information retrieval system, program, and method
JP4428703B2 (en) Information retrieval method and system, and computer program
JP2010266971A (en) Terminal device
JP5368900B2 (en) Information presenting apparatus, information presenting method, and program
JP5688754B2 (en) Information retrieval apparatus and computer program

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20150819

PA0201 Request for examination
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20160523

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20160929

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20161014

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20161017

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 4

PR1001 Payment of annual fee

Payment date: 20191001

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20200925

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20210929

Start annual number: 6

End annual number: 6

PR1001 Payment of annual fee

Payment date: 20230925

Start annual number: 8

End annual number: 8

PR1001 Payment of annual fee