[go: up one dir, main page]

KR100922691B1 - 테마 연관 질의어 제공 방법 및 시스템 - Google Patents

테마 연관 질의어 제공 방법 및 시스템 Download PDF

Info

Publication number
KR100922691B1
KR100922691B1 KR1020070141352A KR20070141352A KR100922691B1 KR 100922691 B1 KR100922691 B1 KR 100922691B1 KR 1020070141352 A KR1020070141352 A KR 1020070141352A KR 20070141352 A KR20070141352 A KR 20070141352A KR 100922691 B1 KR100922691 B1 KR 100922691B1
Authority
KR
South Korea
Prior art keywords
query
theme
association
word
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020070141352A
Other languages
English (en)
Other versions
KR20090073417A (ko
Inventor
정윤영
최재걸
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020070141352A priority Critical patent/KR100922691B1/ko
Publication of KR20090073417A publication Critical patent/KR20090073417A/ko
Application granted granted Critical
Publication of KR100922691B1 publication Critical patent/KR100922691B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

사용자에 의해 입력된 질의어에 대한 연관 질의어들 중 해당 질의어가 속한 테마와 관련된 연관 질의어들을 선별하여 제공할 수 있는 본 발명의 일 실시예에 따른 테마 연관 질의어 제공 방법은, 사용자로부터 질의어의 테마에 대한 선택을 수신하는 단계; 상기 질의어에 대한 연관 질의어들을 추출하는 단계; 상기 연관 질의어들과 상기 선택된 테마간의 연관도를 산출하는 단계; 및 상기 연관도가 기준치 이상인 연관 질의어들을 상기 질의어에 대한 테마 연관 질의어로 결정하는 단계를 포함한다.
검색, 질의어, 연관, 테마

Description

테마 연관 질의어 제공 방법 및 시스템{Method and System for Providing Theme Relating Query}
본 발명은 연관 질의어 제공에 관한 것으로서, 보다 구체적으로, 특정 테마에 대한 연관 질의어를 제공하는 방법 및 그 시스템에 관한 것이다.
인터넷의 발달 및 보급의 증가로 인해 인터넷을 이용한 다양한 서비스가 제공되고 있는데, 그 중 대표적인 예가 검색 서비스라 할 수 있다. 검색 서비스란 사용자가 입력하는 소정의 질의어에 대해 검색을 수행한 후 질의어에 상응하는 검색 결과를 사용자에게 제공하는 서비스를 의미한다.
이러한 검색 서비스의 제공을 위해 검색 서비스 제공 시스템은 웹페이지들을 색인하여 미리 저장해 둠으로써 데이터베이스를 구축하고, 사용자로부터 질의어 입력을 통한 검색 요청이 수신되는 경우 데이터베이스에 저장된 웹페이지들 중 수신된 질의어에 상응하는 웹페이지를 검색결과 문서로 제공한다.
한편, 최근의 검색 서비스 제공 시스템은 사용자가 원하는 정보뿐만 아니라 이와 관련된 정보를 보다 빠르고 정확하게 찾을 수 있도록 하기 위해 사용자에 의해 입력된 질의어와 연관 관계가 있는 질의어들을 추출하여 사용자에게 제공하는 연관 질의어 제공 서비스를 제공하고 있다.
여기서, 연관 관계가 있는 질의어라 함은, 사용자에 의해 입력된 질의어의 상위개념 또는 하위개념에 속하는 질의어들과 같이 사용자에 의해 입력된 질의어와 의미적으로 관련이 있는 질의어뿐만 아니라, 사용자에 의해 입력된 질의어와 다양한 관점에서 관련이 있는 질의어를 연관 질의어로 제공할 수도 있다. 예컨대, 사용자에 의해 "박찬호"라는 질의어가 입력된 경우 그의 직업인 "야구", 그가 속한 리그인 "메이저 리그", 그의 출신 대학인 "한양대"와 같은 질의어를 연관 질의어로 제공할 수 있다.
그러나, 상술한 연관 질의어 제공 서비스에 의해 제공되는 연관 질의어 목록에는 사용자에 의해 입력된 질의어가 속하는 테마와 관련된 연관 질의어들뿐만 아니라 해당 테마에 관련되지 않은 연관 질의어들이 동시에 포함되어 있어서, 사용자가 자신이 원하는 테마에 관련된 연관 질의어들을 선별하여 열람하는 것이 불편하다는 문제점이 있었다.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 사용자에 의해 입력된 질의어에 대한 연관 질의어들 중 해당 질의어가 속한 테마와 관련된 연관 질의어들을 선별하여 제공할 수 있는 테마 연관 질의어 제공 방법 및 시스템을 제공하는 것을 기술적 과제로 한다.
또한, 본 발명은 사용자에 의해 입력된 질의어에 대한 테마 연관 질의어를 결정함에 있어서, 사용자에 의해 입력된 질의어를 확장할 수 있는 테마 연관 질의어 제공 방법 및 시스템을 제공하는 것을 다른 기술적 과제로 한다.
상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 테마 연관 질의어 제공 방법은 사용자로부터 질의어의 테마에 대한 선택을 수신하는 단계; 상기 질의어에 대한 연관 질의어들을 추출하는 단계; 상기 연관 질의어들과 상기 선택된 테마간의 연관도를 산출하는 단계; 및 상기 연관도가 기준치 이상인 연관 질의어들을 상기 질의어에 대한 테마 연관 질의어로 결정하는 단계를 포함한다.
일 실시예에 있어서, 상기 연관도 산출 단계는, 하나의 검색세션 내에서 상기 연관 질의어와 함께 입력된 동반 질의어들을 추출하는 단계; 및 상기 동반 질의어들이 상기 선택된 테마의 테마자료에 포함되어 있는 비율을 산출하는 단계를 포함하고, 상기 산출된 비율을 상기 연관도로 결정하는 것을 특징으로 한다.
한편, 상기 테마 연관 질의어 결정단계에서, 상기 연관도가 기준치 미만인 연관 질의어들 중 상기 선택된 테마에 관련된 테마용어를 포함하는 연관 질의어 또는 상기 선택된 테마에 관련된 테마자료에 포함되어 있는 연관 질의어들은 상기 테마 연관 질의어로 결정하는 것을 특징으로 한다.
일 실시예에 있어서, 상기 테마 연관 질의어 결정단계 이후에, 상기 테마 연관 질의어들의 랭킹을 산출하는 단계; 및 상기 랭킹을 이용하여 테마 연관 질의어 목록을 생성하는 단계를 더 포함하는 것을 특징으로 한다.
한편, 상기 연관 질의어 추출단계 이전에, 상기 선택된 테마에 대한 테마자료들 중 상기 질의어를 포함하고 있는 단어들을 추출하는 단계를 더 포함하고, 상기 연관 질의어 추출단계에서, 상기 추출된 단어들에 대한 연관 질의어들을 함께 추출하는 것을 특징으로 한다.
또한, 상기 연관 질의어 추출단계에서, 상기 질의어에 소정 접두사가 포함되어 있는 경우, 상기 질의어에서 상기 접두사를 제외한 질의어에 대한 연관 질의어를 함께 추출하는 것을 특징으로 한다.
상술한 목적을 달성하기 위한 본 발명의 다른 측면에 따른 테마 연관 질의어 제공 방법은 사용자로부터 제1 질의어의 테마에 대한 선택을 수신하는 단계; 상기 제1 질의어로부터 하나 이상의 제2 질의어를 생성하는 단계; 상기 하나 이상의 제2 질의어에 대한 연관 질의어들을 추출하는 단계; 상기 추출된 연관 질의어들의 랭킹을 산출하는 단계; 및 상기 산출된 랭킹 중 상위 N개의 연관 질의어들 이용하여 상기 제1 질의어에 대한 테마 연관 질의어 목록을 생성하는 단계를 포함한다.
일 실시예에 있어서, 상술한 테마 연관 질의어 제공 방법은 상기 테마 연관 질의어 목록 생성단계 이후에, 상기 테마 연관 질의어 목록에 포함된 연관 질의어들과 상기 선택된 테마간의 연관도를 산출하는 단계; 및 상기 연관도가 기준치 미만인 연관 질의어들을 상기 테마 연관 질의어 목록으로부터 삭제함으로써 상기 테마 연관 질의어 목록을 수정하는 단계를 더 포함할 수 있다.
상술한 목적을 달성하기 위한 본 발명의 또 다른 측면에 따른 테마 연관 질의어 제공 시스템은 사용자로부터 질의어의 테마에 대한 선택을 수신하는 사용자 인터페이스부; 상기 질의어에 대한 연관 질의어들을 추출하는 연관 질의어 추출부; 상기 연관 질의어들과 상기 선택된 테마간의 연관도를 산출하는 연관도 산출부; 및 상기 연관도가 기준치 이상인 연관 질의어들을 테마 연관 질의어로 결정하는 테마 연관 질의어 결정부를 포함한다.
상술한 목적을 달성하기 위한 본 발명의 여전히 다른 측면에 따른 테마 연관 질의어 제공 시스템은 사용자로부터 제1 질의어의 테마에 대한 선택을 수신하는 사용자 인터페이스부; 상기 제1 질의어로부터 하나 이상의 제2 질의어를 생성하는 질의어 생성부; 상기 하나 이상의 제2 질의어에 대한 연관 질의어들을 추출하는 연관 질의어 추출부; 상기 추출된 연관 질의어들의 랭킹을 산출하고, 산출된 랭킹 중 상위 N개의 연관 질의어들 이용하여 상기 제1 질의어에 대한 테마 연관 질의어 목록을 생성하는 테마 연관 질의어 목록 생성부; 및 상기 테마 연관 질의어 목록에 포함된 연관 질의어들과 상기 선택된 테마간의 연관도를 이용하여 상기 테마 연관 질의어 목록을 수정하는 테마 연관 질의어 목록 수정부를 포함하는 것을 특징으로 한다.
상술한 바와 같이, 본 발명에 따르면, 사용자에 의해 입력된 질의어에 대한 연관 질의어들 중 해당 질의어가 속한 테마와 관련된 연관 질의어들을 선별하여 제공하기 때문에 사용자가 연관 질의어 목록 내에서 별도로 자신이 원하는 테마에 관련된 연관 질의어들을 선별할 필요가 없어 사용자의 편의성을 증대시킬 수 있다는 효과가 있다.
또한, 본 발명에 따르면, 사용자에 의해 입력된 질의어에 대한 테마 연관 질의어를 결정함에 있어서, 사용자에 의해 입력된 질의어를 확장하여 확장된 질의어에 대한 테마 연관 질의어를 제공함으로써 사용자에 의해 선택된 테마 내에서 보다 많은 테마 연관 질의어를 제공할 수 있다는 효과가 있다.
이하 첨부되는 도면을 참고하여, 본 발명의 바람직한 실시예를 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 테마 연관 질의어 제공 시스템의 개략적인 블록도이다. 도시된 바와 같이, 테마 연관 질의어 제공 시스템(100)은 연관 질의어 DB(110), 테마자료 DB(112), 사용자 인터페이스부(120), 연관 질의어 추출부(130), 연관도 산출부(140), 연관 질의어 결정부(150), 테마 연관 질의어 목록 생성부(160)를 포함한다.
연관 질의어 DB(110)는 각 질의어에 대한 연관 질의어들이 저장되는 것으로서, 연관 질의어 DB(110)에는 각 질의어에 대한 연관 질의어들이 해당 질의어와 매칭되어 저장되어 있다. 이때, 각 질의어에 대한 연관 질의어들은 일반적인 검색 시스템에서 사용되는 연관 질의어 결정 알고리즘을 이용하여 산출될 수 있다.
한편, 상술한 실시예에 있어서는 연관 질의어 DB(110)가 테마 연관 질의어 제공 시스템에 포함되는 것으로 기재하였지만, 변형된 실시예에 있어서는 테마 연관 질의어 제공 시스템(100)이 연관 질의어 DB(110)를 직접 포함하지 않고, 외부의 검색 시스템(미도시)으로부터 연관 질의어를 제공받을 수 있기 때문에, 이러한 경우 테마 연관 질의어 제공 시스템(100)이 연관 질의어 DB(110)를 직접 포함하지 않을 수도 있을 것이다.
테마자료 DB(112)는 각 테마별로 해당 테마에 관한 자료인 테마자료가 저장되는 것으로서, 예컨대, 영화테마의 경우, 영화감독, 영화배우, 영화제목 등이 테마자료로 저장되어 있을 수 있다. 일 실시예에 있어서, 이러한 테마자료는 각 테마에 관련된 단어들을 대표어와 해당 대표어에 유사한 유사어 형태로 그룹핑함으로써 생성될 수 있다.
예컨대, 도 2에 도시된 바와 같이, 영화테마의 경우, "사랑의 레시피"라는 영화제목이 테마자료에 포함될 수 있는데, 이때 "사랑의 레시피"에 대한 테마자료는 "사랑의 레시피"라는 대표어 및 이와 유사한 "사랑의 레시피", "noreservations", "노레저베이션스", "노레저베이션즈", "영화사랑의레시피", "사랑의레시피영화" 등과 같은 유사어들을 하나의 그룹으로 그룹핑 함으로써 생성된다.
다시 도 1을 참조하면, 사용자 인터페이스부(120)는 사용자 클라이언트(미도 시, 이하. '사용자'라 함)와의 인터페이스 기능을 담당하는 것으로서, 특히, 본 발명에서는 사용자로부터 질의어의 테마에 대한 선택을 수신한다. 이러한, 사용자 인터페이스부(120)는 질의어 수신부(122), 테마 결정부(124), 및 탭 제공부(126)를 포함할 수 있다.
질의어 수신부(122)는 사용자로부터 질의어를 수신하고, 테마 결정부(124)는 수신된 질의어가 속하는 테마를 결정한다. 일 실시예에 있어서, 테마 결정부(124)는 수신된 질의어들이 속하는 테마를 결정함에 있어서, 수신된 질의어가 상술한 테마자료 DB(112) 중 어떤 테마자료에 포함되어 있는지 여부를 판단함으로써 수신된 질의어의 테마를 결정할 수 있다.
변형된 실시예에 있어서, 각 테마와 해당 테마에 관련되는 질의어들을 매칭시켜 저장하여 두고, 사용자로부터 질의어가 수신되면, 테마 결정부(124)는 수신된 질의어와 매핑되어 있는 테마를 해당 질의어에 대한 테마로 결정할 수도 있을 것이다.
탭 제공부(126)는 테마 결정부(124)에 의해 결정된 테마에 대한 탭(Tab)을 생성한 후 검색 결과 페이지에 포함시켜 사용자에게 제공하고, 사용자로부터 탭에 대한 선택요청을 수신함으로써 사용자에 의해 선택된 테마 정보를 수신한다.
탭 제공부(126)에 제공되는 탭의 일 예가 도 3에 도시되어 있다. 도시된 바와 같이, 질의어 수신부(122)를 통해 "식객"이라는 질의어가 수신되고, 테마 결정부(124)에 의해 "식객"이라는 질의어가 영화테마에 속하는 것으로 결정된 경우, 탭 제공부(126)는 "영화"라는 탭(300)을 검색 결과 페이지에 포함시켜 사용자에게 제 공하는 것이다.
한편, 탭 제공부(126)에 의해 영화 탭(300)에 대한 선택요청이 수신되면, "식객"이라는 질의어에 대해 영화라는 테마가 선택된 것으로 판단된다.
상술한 실시예에 있어서는 사용자 인터페이스부(120)가 질의어 수신부(122)를 포함함으로써 사용자로부터 질의어도 수신하는 것으로 기재하였지만, 변형된 실시예에 있어서는 질의어는 외부의 검색서버(미도시)를 통해 수신되고, 사용자 인터페이스부(120)가 외부의 검색서버로부터 사용자가 입력한 질의어를 전달받을 수도 있기 때문에, 질의어 수신부(120)는 선택적으로 포함될 수 있는 구성요소이다. 이하에서는 설명의 편의를 위해 질의어가 사용자 인터페이스부(120)를 통해 수신되는 것으로 가정하여 설명한다.
다시 도 1을 참조하면, 연관 질의어 추출부(130)는 연관 질의어 DB(110)로부터 사용자 인터페이스부(120)를 통해 수신된 질의어에 대한 연관 질의어를 추출한다.
일 실시예에 있어서, 연관 질의어 추출부(130)는 사용자 인터페이스부(120)를 통해 수신된 질의어에 대해서만 연관 질의어를 추출할 수도 있지만, 이러한 경우 추출되는 연관 질의어들의 개수가 제한적일 수 있기 때문에, 연관 질의어 추출부(130)는 사용자 인터페이스부(120)를 통해 수신된 질의어에 대한 확장 질의어를 생성한 후, 확장 질의어에 대한 연관 질의어도 함께 추출할 수도 있다.
일 실시예에 있어서, 연관 질의어 추출부(130)는 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 모든 유사어들 중 사용자 인터페이스부(120)를 통해 수신된 질의어를 포함하고 있는 유사어와 매칭되어 있는 대표어를 결정하고, 결정된 대표어에 매칭되어 있는 모든 유사어들을 추출함으로써 확장 질의어를 생성할 수 있다.
연관 질의어 추출부(130)가 확장된 질의어를 결정하는 과정을 상술한 도 2를 참조하여 구체적으로 설명한다. 먼저, 사용자로부터 "레시피"라는 질의어와 해당 질의어에 대한 테마로 영화테마가 선택되었다고 가정한다. 연관 질의어 추출부(130)는 영화테마에 대한 테마자료에 포함되어 있는 모든 유사어들 중 "레시피"라는 단어가 포함되어 있는 유사어들에 매칭되어 있는 대표어인 "사랑의 레시피"를 결정하고, "사랑의 레시피"라는 대표어에 포함되어 있는 유사어들인 "사랑의 레시피", "noreservations", "노레저베이션스", "노레저베이션즈", "영화사랑의레시피", "사랑의레시피영화"와 같은 모든 유사어들을 확장 질의어로 결정하는 것이다.
상술한 실시예에 있어서는 사용자 인터페이스부(120)를 통해 수신된 질의어를 포함하고 있는 유사어들에 매칭되어 있는 대표어를 결정하고, 해당 대표어에 매칭되어 있는 모든 유사어들을 추출함으로써 확장 질의어를 생성하는 것으로 기재하였다.
하지만, 변형된 실시예에 있어서는, 사용자 인터페이스부(120)를 통해 수신된 질의어의 길이를 판단하여, 해당 질의어의 길이가 임계치 이하인 경우, 수신된 질의어를 포함하고 있는 유사어들이 아니라 수신된 질의어와 완전히 동일한 유사어와 매칭되어 있는 대표어의 유사어들을 추출할 수 있을 것이다. 이는 사용자 인터페이스부(120)를 통해 수신된 질의어의 길이가 임계치 이하인 경우, 이러한 질의어 를 포함하는 유사어들의 개수가 무수히 많을 수 있기 때문에, 유사어들의 개수를 제한하기 위한 것이다.
예컨대, 임계치가 4바이트로 설정되어 있는 경우, 사용자로부터 "사랑"이라는 질의어가 입력된 경우, "사랑"이라는 질의어는 4바이트 미만이므로 테마자료의 유사어들 중 "사랑"이 포함되어 있는 유사어가 아니라, "사랑"과 완전히 동일한 유사어에 대한 대표어를 결정한 후 해당 대표어에 포함된 모든 유사어들을 추출함으로써 추출된 유사어들을 확장 질의어로 결정하는 것이다.
한편, 상술한 실시예에 있어서는, 사용자 인터페이스부(120)를 통해 수신된 질의어를 포함하고 있는 유사어에 매칭된 대표어의 모든 유사어들을 추출함으로써 확장 질의어를 생성하는 것으로 기재하였다. 하지만, 변형된 실시예에 있어서는, 사용자 인터페이스부(120)를 통해 수신된 질의어에 각 테마별로 설정되어 있는 소정 접두어가 포함되어 있는 경우, 해당 질의어로부터 접두어를 제거함으로써 확장 질의어를 생성할 수도 있다. 즉, 수신된 질의어 중 소정 접두어가 제거된 질의어를 확장 질의어로 결정하는 것이다.
예컨대, 사용자에 의해 선택된 테마가 자동차 테마인 경우, 질의어 중 "뉴"나 " 그랜드"가 포함되어 있는 경우, 해당 질의어로부터 "뉴" 또는 "그랜드"를 제외한 질의어를 확장 질의어로 결정하는 것이다. 구체적으로, 사용자에 의해 "뉴라세티"라는 질의어가 입력된 경우, "뉴라세티" 뿐만 아니라, "뉴라세티"에서 "뉴"라는 접두어가 제거된 "라세티"라는 질의어를 확장 질의어로 결정하는 것이다.
즉, 연관 질의어 추출부(130)는 연관 질의어를 추출함에 있어서, 사용자 인 터페이스부(120)를 통해 수신된 질의어뿐만 아니라 해당 질의어로부터 확장된 질의어 및 해당 질의어에서 소정 접두어를 제거한 질의어에 대한 연관 질의어도 함께 추출함으로써 연관 질의어의 개수를 증가시키는 것이다.
다시 도 1을 참조하면, 연관도 산출부(140)는 연관 질의어 추출부(130)에 의해 추출된 연관 질의어들과 사용자에 의해 선택된 테마간의 연관도를 산출하는 것으로서, 동반 질의어 추출부(142) 및 비율 산출부(144)를 포함한다.
동반 질의어 추출부(142)는 연관 질의어 추출부(130)에 의해 추출된 각 연관 질의어들에 대한 동반 질의어를 검색로그(미도시)로부터 추출한다. 여기서, 동반 질의어란 하나의 검색세션 내에서 연관 질의어와 함께 입력된 질의어들을 의미하고, 검색세션은 하나의 검색 의도를 해결하기 위한 일련의 검색 행위가 수행되는 과정을 의미하는 것으로서, 하나의 검색세션은 검색 창을 통해 질의어가 최초로 입력되는 시점에서 시작하여 소정 시간 동안 사용자 단말기로부터 데이터 전송이 없는 시점 또는 사용자에 의해 웹브라우저가 닫히는 시점에서 종료하게 된다.
비율 산출부(144)는 동반 질의어 추출부(142)에 의해 추출된 각 연관 질의어의 동반 질의어들이 테마자료 DB(112)에 저장된 테마자료에 포함되어 있는 비율을 산출한다. 비율 산출부(144)에 의해 산출된 비율이 각 연관 질의어와 테마간의 연관도가 되는 것이다.
테마 연관 질의어 결정부(130)는 연관도 산출부(120)에 의해 산출된 연관도가 기준치 이상인 연관 질의어를 테마 연관 질의어로 결정한다. 즉, 테마 연관 질의어 결정부(130)는 사용자 인터페이스부(120)를 통해 수신된 질의어에 대한 모든 연관 질의어들 중 해당 질의어가 속하는 테마에 관련된 연관 질의어들을 선별해 내는 것이다.
일 실시예에 있어서, 테마 연관 질의어 결정부(130)는 연관도가 기준치 미만인 연관 질의어들 중 사용자에 의해 선택된 테마에 관련된 테마용어를 포함하는 연관 질의어 또는 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 연관 질의어들은 테마 연관 질의어로 결정할 수 있다.
여기서, 테마용어란 도 4에 도시된 바와 같이, 특정 테마에서 그 출현빈도가 높은 단어들을 의미하는 것으로서, 이러한 테마용어는 테마용어 DB(114)에 저장되어 있다.
상술한 테마 연관 질의어 결정부(130)에 의해 "영화"라는 질의어에 대해 결정된 테마 연관 질의어의 일 예가 도 5에 도시되어 있다. 도 5를 참조하면, 사용자에 의해 선택된 테마가 "영화" 인 경우, "행복"이라는 질의어에 대한 연관 질의어에는 "슈퍼주니어행복", "행복노래", "슈주행복", "Hot행복", "행복가사", "행복슈퍼주니어", "슈퍼주니어-행복" 등과 같이 영화테마와 관련이 없는 연관 질의어들이 포함되어 있지만, 테마 연관 질의어 결정부(130)에 의해 결정된 테마 연관 질의어에는 상술한 연관 질의어들이 배제되어 있음을 알 수 있다.
다시 도 1을 참조하면, 테마 연관 질의어 목록 생성부(150)는 테마 연관 질의어 결정부(140)에 의해 결정된 테마 연관 질의어들의 랭킹을 산출하고, 산출된 랭킹을 이용하여 테마 연관 질의어 목록을 생성한다.
일 실시예에 있어서, 테마 연관 질의어 목록 생성부(150)는 각 테마 연관 질 의어들의 리프트(Lift)값을 산출한 후, 리프트 값이 높은 순서대로 테마 연관 질의어를 배치함으로써 테마 연관 질의어 목록을 생성한다.
여기서, 리프트 값이란 해당 질의어가 입력된 후 각 테마 연관 질의어가 입력된 확률과 각 테마 연관 질의어가 입력된 확률의 비율로 결정된다.
도 6은 본 발명의 다른 실시예에 따른 테마 연관 질의어 제공 시스템의 개략적인 블록도이다. 도시된 바와 같이, 테마 연관 질의어 제공 시스템(600)은 연관 질의어 DB(610), 테마자료 DB(612), 테마용어 DB(614), 사용자 인터페이스부(620), 질의어 생성부(630), 연관 질의어 추출부(640), 테마 연관 질의어 목록 생성부(650), 및 테마 연관 질의어 목록 수정부(660)을 포함한다.
연관 질의어 DB(610), 테마자료 DB(612), 테마용어 DB(614), 및 사용자 인터페이스부(620)의 기능은 도 1에 도시된 것과 동일하므로 상세한 설명은 생략하기로 한다.
질의어 생성부(630)는 사용자 인터페이스부(620)를 통해 수신된 질의어(이하, '제1 질의어'라 함)로부터 하나 이상의 제2 질의어를 생성한다. 여기서, 제 2질의어 생성은 도 1의 연관 질의어 추출부(130)에 의해 수행되는 확장 질의어 생성과 동일하다.
즉, 질의어 생성부(630)는 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 모든 유사어들 중 제1 질의어를 포함하고 있는 유사어와 매칭되어 있는 대표어의 모든 유사어들을 추출함으로써 제2 질의어를 생성하거나, 제1 질의어에 각 테마별로 설정되어 있는 소정 접두어가 포함되어 있는 경우, 제1 질의어로부터 접 두어를 제거함으로써 제2 질의어를 생성한다.
이때, 제1 질의어를 포함하고 있는 유사어와 매칭되어 있는 대표어의 모든 유사어들을 추출함에 있어서, 상술한 바와 같이, 제1 질의어의 길이가 임계치 이하인 경우에는 제1 질의어와 완전히 동일한 유사어와 매칭되어 있는 대표어의 모든 유사어들을 추출할 수 있을 것이다.
연관 질의어 추출부(640)는 연관 질의어 DB(610)로부터 질의어 생성부(630)에 의해 생성된 제2 질의어에 대한 연관 질의어들을 추출한다. 즉, 본 실시예에 있어서는 제1 질의어가 아니라 제2 질의어에 대해서만 연관 질의어를 추출하는 것이다. 이를 통해, 사용자에 의해 선택된 테마에 관련된 연관 질의어들만이 추출되게 할 수 있다.
테마 연관 질의어 목록 생성부(650)는 연관 질의어 추출부(640)에 의해 추출된 연관 질의어들의 랭킹을 산출하고, 산출된 랭킹 중 상위 N개의 연관 질의어들을 이용하여 테마 연관 질의어 목록을 생성한다. 이때, 연관 질의어들의 랭킹은 상술한 바와 같이, 각 연관 질의어들의 리프트(Lift)값을 이용하여 산출될 수 있다.
테마 연관 질의어 목록 수정부(660)는 테마 연관 질의어 목록 생성부(66)에 의해 생성된 테마 연관 질의어 목록을 필터링 함으로써 테마 연관 질의어 목록을 수정한다. 구체적으로, 테마 연관 질의어 목록 수정부(660)는 테마 연관 질의어 목록에 포함되어 있는 각 연관 질의어들과 사용자에 의해 선택된 테마간의 연관도를 산출하여, 연관도가 기준치 미만인 연관 질의어들을 테마 연관 질의어 목록으로부터 제거하는 것이다.
이때, 각 연관 질의어들과 테마간의 연관도는 상술한 바와 같이, 각 연관 질의어들의 동반 질의어들이 사용자에 의해 선택된 테마자료에 포함되어 있는 비율을 이용하여 결정할 수 있다. 따라서, 테마 연관 질의어 목록 수정부(660)는 연관도를 산출하기 위해 검색로그(미도시)로부터 각 연관 질의어들에 대한 동반 질의어들을 추출한다.
일 실시예에 있어서, 테마 연관 질의어 목록 수정부(660)는 연관도가 기준치 미만인 연관 질의어들 중 사용자에 의해 선택된 테마에 관련된 테마용어를 포함하는 연관 질의어 또는 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 연관 질의어들은 테마 연관 질의어 목록으로부터 제거하지 않을 수 있다.
도 7은 본 발명의 일 실시예에 따른 테마 연관 질의어 제공 방법을 보여주는 플로우차트이다.
도시된 바와 같이, 사용자로부터 질의어에 대한 테마 선택을 수신한다(제700단계).
질의어에 대한 테마 선택 과정을 도 8을 참조하여 보다 상세히 설명하면, 사용자부터 질의어가 수신되면(제800단계), 수신된 질의어에 대한 테마를 결정하여(제810단계), 결정된 테마에 대한 탭을 생성한다(제820단계). 이후, 생성된 탭을 검색 결과 페이지에 포함시켜 사용자에게 제공하고(제830단계), 제공된 탭에 대한 사용자의 선택 요청을 수신함으로써(제840단계), 사용자에 의해 선택된 테마 정보가 수신된다. 상술한 바와 같이, 질의어는 사용자로부터 직접 수신할 수도 있지만, 변형된 실시예에 있어서는 외부의 검색서버로부터 전달받을 수도 있을 것이다.
다시 도 7을 참조하면, 수신된 질의어에 대한 연관 질의어를 추출한다(제710단계). 일 실시예에 있어서, 연관 질의어를 추출함에 있어서, 수신된 질의어뿐만 아니라, 수신된 질의어의 확장 질의어에 대한 연관 질의어도 함께 추출한다.
여기서, 확장 질의어란 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 모든 유사어들 중 수신된 질의어를 포함하고 있는 유사어와 매칭되어 있는 대표어의 모든 유사어들, 또는 수신된 질의어에서 각 테마별로 설정되어 있는 소정 접두어를 제거한 질의어를 의미한다.
이때, 수신된 질의어를 포함하고 있는 유사어와 매칭되어 있는 대표어의 유사어들을 확장 질의어로 결정함에 있어서, 상술한 바와 같이, 수신된 질의어의 길이가 임계치 이하인 경우에는 수신된 질의어와 완전히 동일한 유사어와 매칭되어 있는 대표어의 모든 유사어들을 추출한다.
다음으로, 추출된 연관 질의어들과 사용자에 의해 선택된 테마간의 연관도를 산출한다(제720단계). 일 실시예에 있어서, 각 연관 질의어들과 사용자에 의해 선택된 테마간의 유사도는 각 연관 질의어들의 동반 질의어가 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 비율에 의해 결정될 수 있다.
여기서, 동반 질의어란 상술한 바와 같이, 하나의 검색세션 동안 각 연관 질의어들과 함께 입력된 질의어들을 의미한다. 따라서, 연관도를 산출하기 위해 각 연관 질의어 별로 동반 질의어를 추출하는 과정이 더 포함될 수 있을 것이다.
이후, 산출된 연관도가 기준치 이상인 연관 질의어들을 테마 연관 질의어로 결정한다(제730단계). 일 실시예에 있어서, 연관도가 기준치 미만이지만 사용자에 의해 선택된 테마에 대한 테마용어를 포함하고 있는 연관 질의어 또는 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 연관 질의어들은 테마 연관 질의어에 포함시킬 수 있다.
다음으로, 결정된 테마 연관 질의어들의 랭킹을 산출하고(제740단계), 산출된 랭킹을 이용하여 테마 연관 질의어 목록을 생성한다(제750단계). 일 실시예에 있어서, 테마 연관 질의어들의 랭킹은 각 테마 연관 질의어들의 리프트값을 이용하여 산출될 수 있다. 이후, 생성된 테마 연관 질의어 목록을 사용자에게 제공한다(제760단계).
도 9는 본 발명의 다른 실시예에 따른 테마 연관 질의어 제공 방법을 보여주는 플로우차트이다.
도시된 바와 같이, 사용자로부터 제1 질의어에 대한 테마 선택을 수신한다(제900단계). 제1 질의어에 대한 테마 선택 과정은 도 8에 도시된 것과 동일하므로 상세한 설명은 생략한다.
이후, 제1 질의어로부터 하나 이상의 제2 질의어를 생성한다(제910단계). 이때, 제 2 질의어는 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 모든 유사어들 중 제1 질의어를 포함하고 있는 유사어와 매칭되어 있는 대표어의 모든 유사어들을 추출하거나, 제1 질의어에서 각 테마별로 설정되어 있는 소정 접두어를 제거함에 의해 생성된다.
다음으로, 제2 질의어에 대한 연관 질의어를 추출한다(제920단계). 즉, 사용자로부터 수신된 제1 질의어가 아니라 제2 질의어에 대해서만 연관 질의어를 추 출함으로써 사용자에 의해 선택된 테마에 관련된 연관 질의어들만이 추출되게 하는 것이다.
다음으로, 추출된 연관 질의어들의 랭킹을 산출하고(제930단계), 산출된 랭킹 중 상위 N개의 연관 질의어들을 이용하여 제1 질의어에 대한 테마 연관 질의어 목록을 생성한다(제940단계). 이때, 연관 질의어들의 랭킹은 상술한 바와 같이, 각 연관 질의어들의 리프트 값을 이용하여 산출될 수 있다.
이후, 테마 연관 질의어 목록에 포함된 각 연관 질의어와 사용자에 의해 선택된 테마간의 연관도를 산출한다(제950단계). 이때, 각 연관 질의어들과 사용자에 의해 선택된 테마간의 연관도는 각 연관 질의어들의 동반 질의어가 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 비율에 의해 결정된다.
이후, 산출된 연관도가 기준치 미만인 연관 질의어들을 테마 연관 질의어 목록으로부터 삭제함으로써 테마 연관 질의어 목록을 수정한다(제960단계). 일 실시예에 있어서, 연관도가 기준치 미만이지만 사용자에 의해 선택된 테마에 대한 테마용어를 포함하고 있는 연관 질의어 또는 사용자에 의해 선택된 테마의 테마자료에 포함되어 있는 연관 질의어들은 테마 연관 질의어 목록으로부터 삭제하지 않을 수 있다.
다음으로, 수정된 테마 연관 질의어 목록을 사용자에게 제공한다(제970단계).
상술한 실시예에 있어서는, 테마 연관 질의어 목록 수정 과정이 필수적인 것으로 기재하였지만, 변형된 실시예에 있어서는 테마 연관 질의어 목록을 수정하지 않고 사용자에게 제공할 수 있으므로 이러한 과정은 선택적으로 포함될 수 있을 것이다.
상술한 테마 연관 질의어 제공 방법은 다양한 컴퓨터 수단을 이용하여 수행될 수 있는 프로그램 형태로도 구현될 수 있는데, 이때 테마 연관 질의어 제공 방법을 수행하기 위한 프로그램은 하드 디스크, CD-ROM, DVD, 롬(ROM), 램, 또는 플래시 메모리와 같은 컴퓨터로 판독할 수 있는 기록 매체에 저장된다.
본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.
그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
도 1은 본 발명의 일 실시예에 따른 테마 연관 질의어 제공 시스템의 개략적인 블록도.
도 2는 테마자료의 일 예를 보여주는 도면.
도 3은 도 1에 도시된 탭 제공부에 의해 생성된 탭이 포함된 검색 결과 페이지의 일 예를 보여주는 도면.
도 4는 테마용어의 일 예를 보여주는 도면.
도 5는 연관 질의어로부터 결정된 테마 연관 질의어의 일 예를 보여주는 도면.
도 6은 본 발명의 다른 실시예에 따른 테마 연관 질의어 제공 시스템의 개략적인 블록도.
도 7은 본 발명의 일 실시예에 따른 테마 연관 질의어 제공 방법을 보여주는 플로우차트.
도 8은 본 발명의 일 실시예에 따른 질의어 및 테마 선택 수신 방법을 보여주는 플로우차트.
도 9는 본 발명의 다른 실시예에 따른 테마 연관 질의어 제공 방법을 보여주는 플로우차트.

Claims (25)

  1. 테마 연관 질의어 제공 시스템이 테마 연관 질의어를 제공하는 방법으로서,
    사용자로부터 질의어의 테마에 대한 선택 요청을 수신하는 단계;
    상기 질의어에 대한 연관 질의어들을 추출하는 단계;
    상기 연관 질의어와 함께 입력된 동반 질의어들이 상기 사용자에 의해 선택된 질의어의 테마에 대한 테마자료에 포함된 비율을 이용하여 상기 연관 질의어들과 상기 사용자에 의해 선택된 질의어의 테마간의 연관도를 산출하는 단계; 및
    상기 연관도가 기준치 이상인 연관 질의어들을 상기 질의어에 대한 테마 연관 질의어로 결정하는 단계를 포함하는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  2. 제1항에 있어서,
    상기 동반 질의어들은 하나의 검색세션 내에서 상기 연관 질의어와 함께 입력된 질의어들인 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  3. 제1항에 있어서, 상기 테마자료는 테마에 관련된 단어들이 대표어 및 상기 대표어와 유사한 유사어 형태로 그룹핑된 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  4. 제1항에 있어서, 상기 테마 연관 질의어 결정단계에서,
    상기 연관도가 기준치 미만인 연관 질의어들 중 상기 사용자에 의해 선택된 질의어의 테마에 관련된 테마용어를 포함하는 연관 질의어 또는 상기 선택된 테마에 관련된 테마자료에 포함되어 있는 연관 질의어들은 상기 테마 연관 질의어로 결정하는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  5. 제1항에 있어서, 상기 테마 연관 질의어 결정단계 이후에,
    상기 테마 연관 질의어들의 랭킹을 산출하는 단계; 및
    상기 랭킹을 이용하여 테마 연관 질의어 목록을 생성하는 단계를 더 포함하는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  6. 제5항에 있어서,
    상기 랭킹은 상기 질의어가 입력된 후 상기 각 테마 연관 질의어가 입력된 확률값과 상기 테마 연관 질의어가 입력된 확률값의 비율을 이용하여 산출되는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  7. 제1항에 있어서, 상기 테마 선택 수신 단계는,
    사용자로부터 상기 질의어를 수신하는 단계;
    상기 수신된 질의어가 속하는 테마를 결정하는 단계;
    상기 결정된 테마를 탭 형태로 사용자에게 제공하는 단계; 및
    사용자로부터 상기 탭에 대한 선택요청을 수신하는 단계를 포함하는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  8. 제1항에 있어서, 상기 연관 질의어 추출단계 이전에,
    상기 테마자료 중 상기 질의어를 포함하고 있는 단어들을 추출하는 단계를 더 포함하고,
    상기 연관 질의어 추출단계에서, 상기 추출된 단어들에 대한 연관 질의어들을 함께 추출하는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  9. 제8항에 있어서,
    상기 테마자료는 상기 테마에 관련된 단어들이 대표어 및 상기 대표어와 유사한 유사어 형태로 그룹핑 된 것이고,
    상기 단어 추출 단계에서 상기 단어는 상기 테마자료의 유사어들 중 상기 질의어를 포함하고 있는 유사어에 매칭되어 있는 대표어의 모든 유사어들인 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  10. 제9항에 있어서, 상기 질의어의 길이가 임계치 이하인 경우,
    상기 단어 추출단계에서, 상기 테마자료의 유사어들 중 상기 질의어와 동일한 유사어에 매칭된 대표어의 모든 유사어들을 추출하는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  11. 제1항에 있어서, 상기 연관 질의어 추출단계에서,
    상기 질의어에 소정 접두사가 포함되어 있는 경우, 상기 질의어에서 상기 접두사를 제외한 질의어에 대한 연관 질의어를 함께 추출하는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  12. 테마 연관 질의어 제공 시스템이 테마 연관 질의어를 제공하는 방법으로서,
    사용자로부터 제1 질의어의 테마에 대한 선택 요청을 수신하는 단계;
    상기 사용자에 의해 선택된 제1 질의어의 테마에 대한 테마자료들 중 상기 제1 질의어를 포함하고 있는 하나 이상의 단어 및 상기 제1 질의어에서 소정 접두사를 제거한 질의어들을 이용하여 하나 이상의 제2 질의어를 생성하는 단계;
    상기 하나 이상의 제2 질의어에 대한 연관 질의어들을 추출하는 단계;
    상기 추출된 연관 질의어들의 랭킹을 산출하는 단계; 및
    상기 산출된 랭킹 중 상위 N개의 연관 질의어들로 결정되는 상기 제1 질의어에 대한 테마 연관 질의어의 목록을 생성하는 단계를 포함하는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  13. 삭제
  14. 제12항에 있어서,
    상기 테마자료는 상기 테마에 관련된 단어들이 대표어 및 상기 대표어와 유사한 유사어 형태로 그룹핑 된 것이고,
    상기 하나 이상의 단어는 상기 테마자료의 유사어들 중 상기 제1 질의어를 포함하고 있는 유사어에 매칭되어 있는 대표어의 모든 유사어들인 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  15. 제12항에 있어서, 상기 테마 연관 질의어의 목록 생성단계 이후에,
    상기 테마 연관 질의어의 목록에 포함된 연관 질의어들과 상기 사용자에 의해 선택된 질의어의 테마간의 연관도를 산출하는 단계; 및
    상기 연관도가 기준치 미만인 연관 질의어들을 상기 테마 연관 질의어의 목록으로부터 삭제함으로써 상기 테마 연관 질의어의 목록을 수정하는 단계를 더 포함하는 것을 특징으로 하는 테마 연관 질의어 제공 방법.
  16. 제1항 내지 제12, 제14항, 또는 제15 중 어느 하나의 항에 기재된 방법을 수행하기 위한 컴퓨터로 판독 가능한 프로그램이 기록된 기록매체.
  17. 사용자로부터 질의어의 테마에 대한 선택 요청을 수신하는 사용자 인터페이스부;
    상기 질의어에 대한 연관 질의어들을 추출하는 연관 질의어 추출부;
    상기 연관 질의어와 함께 입력된 동반 질의어들이 상기 사용자에 의해 선택된 질의어의 테마에 대한 테마자료에 포함된 비율을 이용하여 상기 연관 질의어들과 상기 사용자에 의해 선택된 질의어의 테마간의 연관도를 산출하는 연관도 산출부; 및
    상기 연관도가 기준치 이상인 연관 질의어들을 테마 연관 질의어로 결정하는 테마 연관 질의어 결정부를 포함하는 것을 특징으로 하는 테마 연관 질의어 제공 시스템.
  18. 제17항에 있어서, 상기 연관도 산출부는,
    하나의 검색세션 내에서 상기 연관 질의어와 함께 입력된 상기 동반 질의어들을 추출하는 동반 질의어 추출부; 및
    상기 동반 질의어들이 상기 테마자료에 포함되어 있는 비율을 산출하는 비율 산출부를 포함하고,
    상기 산출된 비율을 상기 연관도로 결정하는 것을 특징으로 하는 테마 연관 질의어 제공 시스템.
  19. 제18항에 있어서, 상기 테마자료는 테마에 관련된 단어들이 대표어 및 상기 대표어와 유사한 유사어 형태로 그룹핑된 것을 특징으로 하는 테마 연관 질의어 제공 시스템.
  20. 제17항에 있어서, 상기 테마 연관 질의어 결정부는,
    상기 연관도가 기준치 미만인 연관 질의어들 중 상기 사용자에 의해 선택된 질의어의 테마에 관련된 테마용어를 포함하는 연관 질의어 또는 상기 테마에 관련된 테마자료에 포함되어 있는 연관 질의어들은 상기 테마 연관 질의어로 결정하는 것을 특징으로 하는 테마 연관 질의어 제공 시스템.
  21. 제17항에 있어서,
    상기 테마 연관 질의어들의 랭킹을 산출하고, 산출된 랭킹을 이용하여 테마 연관 질의어의 목록을 생성하는 테마 연관 질의어 목록 생성부를 더 포함하는 것을 특징으로 하는 테마 연관 질의어 제공 시스템.
  22. 제17항에 있어서, 상기 사용자 인터페이스부는,
    사용자로부터 상기 질의어를 수신하는 질의어 수신부;
    상기 수신된 질의어가 속하는 테마를 결정하는 테마 결정부;
    상기 결정된 테마를 탭 형태로 사용자에게 제공하고, 사용자로부터 상기 탭에 대한 선택요청을 수신하는 탭 제공부를 포함하는 것을 특징으로 하는 테마 연관 질의어 제공 시스템.
  23. 제17항에 있어서, 상기 연관 질의어 추출부는,
    상기 테마자료 중 상기 질의어를 포함하고 있는 단어들을 추출하고, 상기 추출된 단어들에 대한 연관 질의어들을 함께 추출하는 것을 특징으로 하는 테마 연관 질의어 제공 시스템.
  24. 제23항에 있어서,
    상기 테마자료는 상기 테마에 관련된 단어들이 대표어 및 상기 대표어와 유사한 유사어 형태로 그룹핑 된 것이고,
    상기 연관 질의어 추출부는 상기 테마자료의 유사어들 중 상기 질의어를 포함하고 있는 유사어에 매칭된 대표어를 결정하고, 상기 결정된 대표어에 매칭되어 있는 모든 유사어들을 추출하는 것을 특징으로 하는 테마 연관 질의어 제공 시스템.
  25. 사용자로부터 제1 질의어의 테마에 대한 선택 요청을 수신하는 사용자 인터페이스부;
    상기 사용자에 의해 선택된 제1 질의어의 테마에 대한 테마자료들 중 상기 제1 질의어를 포함하고 있는 하나 이상의 단어 및 상기 제1 질의어에서 소정 접두사를 제거한 질의어들을 이용하여 하나 이상의 제2 질의어를 생성하는 질의어 생성부;
    상기 하나 이상의 제2 질의어에 대한 연관 질의어들을 추출하는 연관 질의어 추출부;
    상기 추출된 연관 질의어들의 랭킹을 산출하고, 산출된 랭킹 중 상위 N개의 연관 질의어들로 결정되는 상기 제1 질의어에 대한 테마 연관 질의어 목록을 생성하는 테마 연관 질의어의 목록 생성부; 및
    상기 테마 연관 질의어의 목록에 포함된 테마 연관 질의어들과 상기 사용자에 의해 선택된 질의어의 테마간의 연관도를 이용하여 상기 테마 연관 질의어의 목록을 수정하는 테마 연관 질의어 목록 수정부를 포함하는 것을 특징으로 하는 테마 연관 질의어 제공 시스템.
KR1020070141352A 2007-12-31 2007-12-31 테마 연관 질의어 제공 방법 및 시스템 Active KR100922691B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070141352A KR100922691B1 (ko) 2007-12-31 2007-12-31 테마 연관 질의어 제공 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070141352A KR100922691B1 (ko) 2007-12-31 2007-12-31 테마 연관 질의어 제공 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20090073417A KR20090073417A (ko) 2009-07-03
KR100922691B1 true KR100922691B1 (ko) 2009-10-20

Family

ID=41330569

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070141352A Active KR100922691B1 (ko) 2007-12-31 2007-12-31 테마 연관 질의어 제공 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR100922691B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101400412B1 (ko) * 2012-07-13 2014-05-27 주식회사 다음커뮤니케이션 검색 시스템 및 그의 동의어 생성 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020003915A (ko) * 2000-06-26 2002-01-16 김상배 검색조건을 추천하는 검색결과 제공방법 및 검색서버
KR20040063641A (ko) * 2003-01-08 2004-07-14 주식회사 옵투스 키워드확장장치 및 방법과 키워드확장장치를 이용한검색시스템
KR20060006377A (ko) * 2004-07-16 2006-01-19 정의신 웹 사이트에서의 1차 키워드 검색에 대해 관련성 있는 2차키워드의 리스트를 제공하는 방법 및 장치
WO2007062397A2 (en) 2005-11-22 2007-05-31 Google Inc. Inferring search category synonyms from user logs

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020003915A (ko) * 2000-06-26 2002-01-16 김상배 검색조건을 추천하는 검색결과 제공방법 및 검색서버
KR20040063641A (ko) * 2003-01-08 2004-07-14 주식회사 옵투스 키워드확장장치 및 방법과 키워드확장장치를 이용한검색시스템
KR20060006377A (ko) * 2004-07-16 2006-01-19 정의신 웹 사이트에서의 1차 키워드 검색에 대해 관련성 있는 2차키워드의 리스트를 제공하는 방법 및 장치
WO2007062397A2 (en) 2005-11-22 2007-05-31 Google Inc. Inferring search category synonyms from user logs

Also Published As

Publication number Publication date
KR20090073417A (ko) 2009-07-03

Similar Documents

Publication Publication Date Title
JP5638616B2 (ja) 情報検索方法およびシステム
KR102080362B1 (ko) 쿼리 확장
US9195738B2 (en) Tokenization platform
US8510322B2 (en) Enriched search features based in part on discovering people-centric search intent
US12469282B2 (en) Systems and methods for retrieving videos using natural language description
KR100930455B1 (ko) 쿼리별 검색 컬렉션 생성 방법 및 시스템
JP2015506515A (ja) タグをドキュメントに自動的に追加するための方法、装置およびコンピュータ記憶媒体
CN103514236A (zh) 检索应用中基于拼音的检索条件纠错提示处理方法
CN106682012A (zh) 商品对象信息搜索方法及装置
US9165058B2 (en) Apparatus and method for searching for personalized content based on user's comment
CN102541910A (zh) 提取关键字的方法
JP2013196358A (ja) 検索支援装置および検索支援方法
CN112364126A (zh) 一种关键词的提示方法、装置、计算机设备和存储介质
JP2003091552A (ja) 検索要求情報抽出方法及びその実施システム並びにその処理プログラム
JP2015506509A (ja) 評価情報を生成するための方法およびシステム、ならびにコンピュータ記憶媒体
US20170132294A1 (en) App store searching
JP5418138B2 (ja) 文書検索システム、情報処理装置およびプログラム
JP5780036B2 (ja) 抽出プログラム、抽出方法及び抽出装置
KR101683138B1 (ko) 정보검색장치 및 그 동작 방법
KR100922691B1 (ko) 테마 연관 질의어 제공 방법 및 시스템
KR100899930B1 (ko) 연관 데이터 클래스 생성 방법 및 시스템
CN108345679B (zh) 一种音视频检索方法、装置、设备及可读存储介质
TWI550420B (zh) 資訊取得系統與方法、以及儲存裝置
CN113641783B (zh) 基于关键语句的内容块检索方法、装置、设备和介质
CN112182283B (zh) 歌曲搜索方法、装置、网络设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20071231

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20090227

Patent event code: PE09021S01D

E90F Notification of reason for final refusal
PE0902 Notice of grounds for rejection

Comment text: Final Notice of Reason for Refusal

Patent event date: 20090602

Patent event code: PE09021S02D

PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20091005

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20091013

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20091013

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20121011

Year of fee payment: 4

PR1001 Payment of annual fee

Payment date: 20121011

Start annual number: 4

End annual number: 4

FPAY Annual fee payment

Payment date: 20130926

Year of fee payment: 5

PR1001 Payment of annual fee

Payment date: 20130926

Start annual number: 5

End annual number: 5

FPAY Annual fee payment

Payment date: 20140925

Year of fee payment: 6

PR1001 Payment of annual fee

Payment date: 20140925

Start annual number: 6

End annual number: 6

FPAY Annual fee payment

Payment date: 20151008

Year of fee payment: 7

PR1001 Payment of annual fee

Payment date: 20151008

Start annual number: 7

End annual number: 7

FPAY Annual fee payment

Payment date: 20161010

Year of fee payment: 8

PR1001 Payment of annual fee

Payment date: 20161010

Start annual number: 8

End annual number: 8

FPAY Annual fee payment

Payment date: 20181008

Year of fee payment: 10

PR1001 Payment of annual fee

Payment date: 20181008

Start annual number: 10

End annual number: 10

FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 11

PR1001 Payment of annual fee

Payment date: 20191001

Start annual number: 11

End annual number: 11

PR1001 Payment of annual fee

Payment date: 20200925

Start annual number: 12

End annual number: 12

PR1001 Payment of annual fee

Payment date: 20210929

Start annual number: 13

End annual number: 13

PR1001 Payment of annual fee

Payment date: 20230925

Start annual number: 15

End annual number: 15

PR1001 Payment of annual fee