KR20080096887A - Information search ranking system reflecting user's interest and its method - Google Patents
Information search ranking system reflecting user's interest and its method Download PDFInfo
- Publication number
- KR20080096887A KR20080096887A KR1020070041741A KR20070041741A KR20080096887A KR 20080096887 A KR20080096887 A KR 20080096887A KR 1020070041741 A KR1020070041741 A KR 1020070041741A KR 20070041741 A KR20070041741 A KR 20070041741A KR 20080096887 A KR20080096887 A KR 20080096887A
- Authority
- KR
- South Korea
- Prior art keywords
- interest
- user
- rank
- document
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 사용자 관심도를 반영한 정보검색 랭킹 시스템 및 그 방법에 관한 것이다.The present invention relates to an information retrieval ranking system and method that reflects user interest.
본 발명이 개시하는 정보검색 랭킹 시스템은, 정보통신망에 접속된 사용자단말기 또는 네트워크 제공자 서버로부터 다수의 사용자 행위 로그(UAL)를 수집하는 UAL 수집모듈과, 수집된 사용자 행위 로그들을 기반으로 상기 문서DB에 축적된 개별 문서에 모인 모든 사용자들에 대해서, 각 사용자가 보인 모든 행위에 대한 관심값(AV)과 사용자의 행위 영향력(IV)의 곱으로부터 관심랭크(AR)를 계산하고, 관심랭크DB에 갱신하는 관심랭크 계산모듈과, 검색엔진이 사용자단말기로부터 질의어 기반의 검색요청을 받아 문서DB로부터 검색한 문서 각각에 대해 관심랭크DB의 관심랭크로부터 랭크값(RV)을 계산하여 순위화하는 랭크값 계산모듈을 포함한다.The information retrieval ranking system disclosed by the present invention comprises an UAL collection module for collecting a plurality of user behavior logs (UAL) from a user terminal or a network provider server connected to an information communication network, and the document DB based on the collected user behavior logs. For all users gathered in the individual documents accumulated in, the interest rank (AR) is calculated from the product of the interest value (AV) and the user's behavior influence (IV) for all actions shown by each user, and is calculated in the interest rank DB. A rank calculation module for updating the rank of interest and a rank value for calculating and ranking a rank value (RV) from the rank of interest of interest rank DB for each document retrieved from the document DB by receiving a query-based search request from a user terminal. It includes a calculation module.
본 발명에 의하면, 사용자가 개별 문서에 보인 행위를 관심도로 변환한 후 해당 문서에 부여하여 이를 순위화에 적용함으로써, 사용자에게 보다 향상된 검색결과를 제공할 수 있다.According to the present invention, by converting the behavior shown in the individual document to the interest and then assigning it to the document and applying it to the ranking, it is possible to provide the user with improved search results.
Description
도 1은 본 발명의 기술적 사상이 적용되는 전체 시스템을 보인 예시도,1 is an exemplary view showing an entire system to which the technical spirit of the present invention is applied;
도 2는 본 발명에 따른 정보검색 랭킹 시스템에 대한 구성도,2 is a block diagram of an information retrieval ranking system according to the present invention;
도 3은 본 발명에 따른 관심랭크 계산모듈의 세부 구성도,3 is a detailed configuration diagram of an interest rank calculation module according to the present invention;
도 4는 본 발명에 따른 정보검색 랭킹 방법을 보인 흐름도.4 is a flowchart illustrating an information retrieval ranking method according to the present invention.
** 도면의 주요 부분에 대한 부호의 설명 ** ** Description of symbols for the main parts of the drawing **
200: 정보검색 랭킹 시스템200: information search ranking system
210: 문서 수집모듈 220: 검색엔진210: document collection module 220: search engine
230: UAL 수집모듈 240: 관심랭크 계산모듈230: UAL collection module 240: interest rank calculation module
242: 관심값 계산부 244: 행위 영향력 계산부242: interest value calculator 244: behavior influence calculator
250: 랭크값 계산모듈 10: 문서DB250: rank value calculation module 10: document DB
20: UAL DB 30: 관심랭크DB20: UAL DB 30: Rank of interest DB
본 발명은 사용자 행동 로그(UAL: User Action Log)를 기반으로 문서에 관한 사용자의 관심도를 산출하고, 이를 검색결과의 랭킹(Ranking, 순위화)에 반영하는 기술에 관한 것이다.The present invention relates to a technique of calculating a user's interest in a document based on a user action log (UAL) and reflecting the same in a ranking of search results.
주지된 바와 같이 정보검색 시스템은 사용자가 입력한 질의어에 부합하는 문서들을 색인하여 검색결과를 생성한다. 이때의 검색결과에 포함되는 문서들은 내용분석, 링크분석 등의 통계적인 기법을 통해 순위화된 리스트 형태(문서를 가리키는 링크들의 집합)로 제공된다. As is well known, the information retrieval system indexes documents corresponding to a query input by a user and generates search results. The documents included in the search results are provided in a ranked list form (set of links pointing to the documents) through statistical techniques such as content analysis and link analysis.
여기서 '문서'란 다소 모호한 의미로 통용되고 있으나, 통상적으로 웹페이지(web page)로 정의될 수 있다. 웹페이지와 같은 문서는 크게 컨텐츠와 메타데이터로 구성되는데, 컨텐츠는 텍스트를 비롯한 음성, 동영상 파일 등을 포함하는 포괄적인 의미를 형성한다. 메타데이터는 문서 언어, 문서 제목, 문서 크기, 문서 식별자(예: URL 정보), 문서 포맷, 카테고리, 기타 다양한 속성들을 포함할 수 있다.Here, 'document' is used in a somewhat vague sense, but can be generally defined as a web page. Documents such as web pages are largely composed of content and metadata, which form a comprehensive meaning that includes text, voice, and video files. The metadata may include document language, document title, document size, document identifier (eg, URL information), document format, category, and various other attributes.
한편, 정보검색의 랭킹에는 주로 문서의 내용 및 메타데이터, 그리고 문서들 간의 관계정보(예: 링크 또는 카테고리)가 사용된다. 그러나 이러한 정보들은 컨텐츠를 생성하거나 혹은 유통하고자 하는 제공자의 입장에서 기술되는 정보로서 컨텐츠를 최종적으로 소비하는 소비자의 관점은 반영되어 있지 않다. 예컨대, 주목받는 컨텐츠라던가 현재 인기를 얻고 있는 컨텐츠라던가 하는 사용자 입장의 정보는 랭킹 결정의 요소에서 배재되고 있는 반면, 문서 내의 제목 또는 백링크(backlink) 등 제공자 입장 일색의 요소들이 채용되고 있는 것이다. On the other hand, the ranking of information retrieval mainly uses the content and metadata of the document, and the relationship information (eg, links or categories) between the documents. However, such information is described from the point of view of a provider who wants to generate or distribute the content, and does not reflect the viewpoint of the consumer who ultimately consumes the content. For example, information on the user's point of view, such as content that is noticeable or currently popular, is excluded from the ranking decision factor, while elements of the provider's position such as a title or a backlink in the document are employed.
정보검색 시스템의 대표적인 예로 'Google(구글)'을 들 수 있다. 구글의 경 우 '페이지 랭크(PageRank)' 기법을 근간으로 문서에 포함된 정보 이외에 그 문서를 가리키고 있는 링크정보(하이퍼링크, hyperlink)를 분석하여 해당 문서에 페이지 랭크 값을 부여하고, 문서 내의 분석정보와 앞서 부여된 페이지 랭크 값(0~10의 범위)을 취합하여 순위화된 검색결과를 제공하고 있다. 이러한 기법은 링크정보가 주된 요소로 작용하는 웹사이트에서는 양호하게 실현될 수 있다.A good example of an information retrieval system is Google. In the case of Google, based on the 'PageRank' technique, the link information (hyperlink, hyperlink) pointing to the document is analyzed in addition to the information included in the document, and the page rank value is assigned to the document. The information and the previously given page rank value (range of 0 to 10) are collected to provide a ranked search result. This technique can be well realized in websites where link information is the main factor.
그러나 최근 급증하고 있는 사용자 저작물(UCC: User Created Contents)과 모바일 컨텐츠, 예를 들어 동영상 컨텐츠, 블로그 컨텐츠 등은 링크정보가 부족한바, 페이지 랭크 기법으로는 바람직한 검색결과를 기대할 수 없다.However, user creation contents (UCC) and mobile contents, such as video contents and blog contents, which are rapidly increasing in recent years, lack link information. Therefore, a page rank technique cannot expect desirable search results.
본 발명은 사용자가 개별 문서(컨텐츠)에 보인 행위를 관심도로 변환한 후 해당 문서에 부여하여 이를 순위화에 적용함으로써, 사용자에게 보다 향상된 검색결과를 제공토록 한다.The present invention converts the behaviors shown in individual documents (contents) into interests and assigns them to the corresponding documents to apply them to ranking, thereby providing the user with improved search results.
이러한 기술적 과제를 달성하기 위한 본 발명의 정보검색 랭킹 방법은, 기본적으로 검색요청에 따라 문서DB에 축적된 문서를 검색하여 순위화된 검색결과를 제공하는 검색엔진을 포함한 시스템에 적용된다.The information retrieval ranking method of the present invention for achieving the technical problem is basically applied to a system including a search engine that searches for documents accumulated in the document DB according to a search request and provides ranked search results.
본 발명의 특징에 따르면, 정보통신망을 통해 다수의 문서들을 문서DB에 수집·축적하는 과정과, 사용자단말기 또는 네트워크 제공자 서버로부터 사용자 행위 로그(UAL)를 수집·축적하는 과정과, 수집된 사용자 행위 로그들을 기반으로 축적된 개별 문서에 모인 모든 사용자들에 대해서 각 사용자가 보인 모든 행위에 대한 관심값(AV)과 사용자의 행위 영향력(IV)의 곱으로부터 관심랭크(AR)를 계산하여 관심랭크DB에 축적하는 과정, 그리고 사용자단말기로부터 질의어 기반의 검색요청을 받아 문서DB로부터 검색한 문서 각각에 대해 관심랭크DB의 관심랭크로부터 랭크값(RV)을 계산하여 순위화한 검색결과를 제공하는 과정으로 이루어진다.According to a feature of the present invention, a process of collecting and accumulating a plurality of documents in a document DB through an information communication network, a process of collecting and accumulating user behavior logs (UAL) from a user terminal or a network provider server, and collected user behaviors The interest rank DB is calculated by calculating the interest rank (AR) from the product of the interest value (AV) and the behavior influence (IV) of all actions shown by each user for all users gathered in the individual documents accumulated based on the logs. Process of accumulating the rank value (RV) from the interest rank of the interest rank DB for each document retrieved from the document DB by receiving a query-based search request from the user terminal and providing a search result ranked by the user terminal. Is done.
본 발명의 관심값(AV)은 개별 문서에 모인 어느 한 사용자가 행한 각 행위에 기 부여된 소정의 가중치()와, 행위 경과시간(t)을 변수로 하는 시그모이드 함수의 곱으로 계산한다.The interest value AV of the present invention is a predetermined weight given to each action performed by a user gathered in an individual document. ) Is calculated as the product of the sigmoid function whose behavior elapsed time t is a variable.
또한, 행위 영향력(IV)은 로 계산하되, 는 시그모이드 함수이고, 는 사용자 h가 행한 모든 행위의 총회수이며, m은 를 모든 사용자 수로 나눈 값이다.Also, the behavioral influence (IV) Calculate as Is the sigmoid function, Is the total number of all actions performed by user h, and m is Divided by the number of users.
본 발명의 구체적 특징 및 이점들은 첨부도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다. 이에 앞서 본 발명에 관련된 공지 기능 및 그 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는, 그 구체적인 설명을 생략하였음에 유의해야 할 것이다.Specific features and advantages of the present invention will become more apparent from the following detailed description based on the accompanying drawings. In the meantime, when it is determined that the detailed description of the known functions and configurations related to the present invention may unnecessarily obscure the subject matter of the present invention, it should be noted that the detailed description is omitted.
첨부도면 도 1은 본 발명이 적용되는 전체 시스템을 예시한 도면으로, 정보통신망에 연동된 미도시된 하나 이상의 컨텐츠(문서) 서버가 제공하는 문서를 열람하고 열람한 문서에 대해 사용자 행위 로그(UAL: User Action Log)를 생성하는 문 서이용 사용자단말기(100)와, 정보통신망을 통해 다수의 문서를 수집·색인하며, 문서이용 사용자단말기로부터 또는 네트워크 제공자 서버(미도시)로부터 사용자 행위 로그를 수집하고, 수집된 사용자 행위 로그를 기반으로 관심값(AV: Attention Value)을 계산한 후, 수집된 문서 각각에 관심랭크(AR: Attention Rank)를 부여하는 정보검색 랭킹 시스템(200)과, 질의어 기반으로 상기 정보검색 랭킹 시스템(200)에 검색을 요청하여 사용자 관심도가 반영된 순위화된 검색결과를 제공받는 문서검색 사용자단말기(300)로 이루어진다.1 is a diagram illustrating an entire system to which the present invention is applied, and a user action log (UAL) for a document that is viewed and viewed by one or more contents (document) servers not shown linked to an information communication network. : Collects and indexes a plurality of documents through a document user terminal 100 generating a user action log) and an information communication network, and collects user activity logs from the document user terminal or from a network provider server (not shown). After calculating an Attention Value (AV) based on the collected user behavior log, an information
본 발명에서, 사용자단말기는 인터넷 통신 가능한 휴대폰 또는 컴퓨터를 포함하며, 설명의 편의상 '문서이용 사용자단말기'와 '문서검색 사용자단말기'로 대분하였다. '문서이용 사용자단말기'는 정보통신망에 연계된 다수의 컨텐츠 서버로부터 문서를 열람(예: 웹서핑)하고, 그에 따른 사용자 행위 로그(UAL)를 생성하는 측면에 입각하고 있으며, '문서검색 사용자단말기'는 정보검색 랭킹 시스템(200)이 수집한 다수의 사용자 행위 로그를 기반으로 문서별 관심랭크(AR)를 축적한 이후, 질의어에 따른 순위화된 검색결과를 정보검색 랭킹 시스템(200)으로부터 제공받는 측면에 입각하고 있다. 그러나 실제로 양자는 동일한 '사용자단말기'인 것으로 이해해도 무방하다. In the present invention, the user terminal includes a mobile phone or computer capable of internet communication, and is divided into a 'document user terminal' and a 'document search user terminal' for convenience of description. 'Document User Terminal' is based on the aspect of reading documents (e.g. web surfing) from a number of content servers connected to the information communication network and generating a log of user actions (UAL) accordingly. 'Accumulates interest ranks for each document based on a plurality of user activity logs collected by the information retrieval
한편, 사용자 행위 로그(UAL)란, 문서이용 사용자단말기가 어떤 문서를 열람했을 경우에 발생하는 사용자가 행한 행위(user action)들을 기록한 로그 파일로서, 1. 문서 식별자, 2. 행위 식별자, 3. 행위의 종류, 4. 행위의 시간, 그리고 5. 부가데이터를 포함한다.On the other hand, the user action log (UAL) is a log file that records the user actions (user actions) that occur when a document user terminal reads a document, 1. document identifier, 2. action identifier, 3. The type of action, 4. time of action, and 5. additional data.
구체적으로 '문서 식별자'는 행위의 대상이 되는 문서에 대한 식별자이다. '행위 식별자'는 행위를 야기한 사용자를 식별하기 위한 정보로서, 예컨대 사용자가 컴퓨터를 이용하는 경우 IP주소 또는 MAC주소가 될 수 있으며, 휴대폰을 이용하는 경우 휴대폰 전화번호 또는 휴대폰 고유정보가 될 수 있다.In more detail, the document identifier is an identifier for a document that is the target of an action. The 'action identifier' is information for identifying the user who caused the action, for example, may be an IP address or a MAC address when the user uses a computer, and may be a mobile phone number or unique mobile phone information when using a mobile phone.
또한, '행위의 종류'는 읽기(문서의 요약정보, 미리보기 등을 보는 행위), 플레이(동영상, 음악, 이미지 등을 보는 행위), 자세히 보기(요약정보가 아닌 문서의 내용 전문을 보는 행위), 보관하기(문서를 보관 또는 저장하는 행위), 구매하기(판매용 문서 또는 컨텐츠를 구매하는 행위), 추천하기(타인에게 문서 또는 컨텐츠를 추천하는 행위), 평가하기(문서 또는 컨텐츠에 대한 개인의 의견을 수치화 혹은 정례화한 정보로서 표현하는 행위), 부가정보 붙이기(문서 또는 컨텐츠에 의견, 태그 등의 부가정보를 부여하는 행위), 북마크하기(문서 또는 컨텐츠를 추후에 보기 위해 주소 저장 혹은 이에 준하는 행위) 등과 같이 매우 다양하다. 한편, '부가데이터'는 사용자가 행한 행위의 환경정보로서 예를 들면 사용자 위치, 환경형태(예: 이동 중) 등을 꼽을 수 있다.In addition, the 'type of behavior' refers to the act of reading (looking at the summary of documents, previews, etc.), playing (looking at videos, music, images, etc.), viewing details (seeing the full text of the document, not summary information). ), Archiving (keeping or storing documents), making a purchase (purchasing documents or content for sale), making recommendations (recommending documents or content to others), evaluating (individual Expressing opinions as digitized or regularized information), attaching additional information (giving additional information such as comments or tags to documents or contents), bookmarking (storing or storing addresses for later viewing of documents or contents) And the like's behavior. Meanwhile, the 'additional data' may include, for example, a user's location and an environment type (for example, moving) as environment information of an action performed by a user.
도 2는 본 실시예의 정보검색 랭킹 시스템(200)에 대한 세부 구성도로서, 도시된 바와 같이 정보검색 랭킹 시스템(200)은, 문서 수집모듈(210), 검색엔진(220), UAL 수집모듈(230), 관심값 계산모듈(240), 랭크값 계산모듈(250), 문서DB(10), UAL DB(20) 및 관심랭크DB(30)를 구성한다.2 is a detailed configuration diagram of the information
문서 수집모듈(210)은 정보통신망을 통해 다수의 문서를 수집하여 문서DB(10)에 저장하되, 질의어 기반의 검색요청(문서검색 사용자단말기로부터의 검색 요청)에 대응하기 위해 색인(indexing)하여 저장한다.The
검색엔진(220)은 입력되는 질의어에 따라 문서DB(10)를 검색하여 검색결과를 제공하는 통상의 검색에 필요한 기능들을 갖춘 엔진이다. 본 발명의 특징에 따라 검색엔진(220)은 순위화된 검색결과를 제공하되, 검색결과를 구성하는 문서들 각각에 연관된 관심랭크DB(30)의 관심랭크(AR)를 참조하고, '사용자 관심도'를 반영한 랭크값(RV)을 부여하여 순위화된 리스트 형식으로 제공한다. 이에 대해서는 아래에서 상세히 기술한다.The
본 발명에서 '사용자 관심도'란, 문서(컨텐츠) 평가를 위한 주요 요소로서 사용자의 기억모델(또는 메모리모델)을 적용하여 수치화한 것을 의미한다. 주지된 바와 같이 인간은 어떤 사실 또는 대상을 인지한 후, 시간이 경과됨에 따라 점차 그 사실을 잊게 된다. 이것이 시그모이드 함수(sigmoid function)로 표현되는 인간의 기억모델이다. 종래에는 어떤 문서에 사용자의 관심이 집중되고 있음을 수치화하기 위해 링크정보(구글의 PageRank) 혹은 문서를 열람한 총회수를 지표로 삼는 것이 태반이다. 그러나 이러한 지표는 기억모델의 시간적 요소를 반영하지 않은 축적성 단순 지표에 불과하다.In the present invention, 'user interest' means a numerical value by applying a user's memory model (or memory model) as a main factor for document (content) evaluation. As is well known, humans recognize a fact or object and then gradually forget it over time. This is the human memory model represented by the sigmoid function. Conventionally, in order to quantify that the user's attention is focused on a document, the placenta is based on link information (Google's PageRank) or the total number of times the document is viewed. However, these indicators are merely cumulative indicators that do not reflect the temporal component of the memory model.
한편, UAL 수집모듈(230)은, 앞서 언급한 바와 같이, 문서이용 사용자단말기(100) 또는 네트워크 제공자 서버로부터 사용자 행위 로그(UAL)를 수집하여, UAL DB(20)에 저장·관리한다. 사용자 행위 로그(UAL)는 문서이용 사용자단말기(100)에 설치되는 로깅 툴(logging tool, 웹브라우저에 편성되는 형태의 소프트웨어)로부터 수집하거나, 혹은 네트워크 제공자 서버에 저장된 것을 수집할 수 있다. 양자의 수 집 방식이 혼용될 수 있음은 물론이다.Meanwhile, as mentioned above, the
관심랭크 계산모듈(240)은 도 3에 예시된 바와 같이 관심값 계산부(242) 및 행위 영향력 계산부(244)를 구성하여, 개별 문서(아래의 수학식 1에서 p)에 모인 모든 사용자들에 대해서, 각각의 사용자가 보인 모든 행위(action)에 대한 관심값(AV: Attention Value)과 행위 각각에 대한 사용자의 행위 영향력(IV: Influence Value)의 곱으로부터 관심랭크(AR)를 산출하여, 이를 관심랭크DB(30)에 갱신한다. 상기 관심랭크(AR)는 다음의 수학식으로 정의된다.The interest
.................. [수학식 1] .................. Equation 1
위 [수학식 1]에서, 관심값 계산부(242)가 계산하게 되는 관심값(AV)은 다음의 수학식으로 표현된다.In Equation 1, the interest value AV calculated by the
............................... [수학식 2] ............................... [ Equation 2 ]
여기서, 는 사용자 h가 문서 p에 대해 k라는 행위(action)를 보인 것을 의미한다. 는 k라는 행위의 종류에 대해 기 부여된 소정의 가중치(weight)이며, t는 상기 관심값(AV)을 산출하는 시점의 시간과 k라는 행위가 실제 일어난 시간의 차이, 즉 k라는 행위의 경과시간(이하, 행위 경과시간)을 의미한다. here, Means that user h showed k action on document p. Is a predetermined weight given to the type of action k, and t is the difference between the time at which the interest value AV is calculated and the time k is actually occurring, i.e., the progress of the action k. It means time (hereinafter, elapsed time of action).
가중치는 행위의 종류에 따라 0~1 사이의 값을 갖는다. 예컨대, '읽기'인 경우 0.2, '플레이'인 경우 0.4, '자세히 보기'인 경우 0.5, …, '추천'인 경우 0.9로 정의될 수 있다. 이와 같은 [수학식 2]는 그 우변에서 정의된 것과 같이 행위 경과시간 t를 변수로 하는 시그모이드 함수로서, 앞서 언급한 인간의 기억을 모델 링하고 있다. 따라서 가중치 는 그 행위 경과시간에 따라 감소한다.The weight has a value between 0 and 1 depending on the type of action. For example, 0.2 for 'read', 0.4 for 'play', 0.5 for 'detail',... For example, 'recommended' may be defined as 0.9. Equation 2 is a sigmoid function whose behavior elapsed time t is a variable as defined on the right side, and models the aforementioned human memory. Thus weight Decreases with the elapsed time of the act.
상기한 관심값 계산부(242)가 산출한 관심값(AV)에는 그 행위를 보인 사용자의 행위 영향력(IV)이 고려되어야 한다. 예를 들면, 1,000개의 행위를 보인 사용자와 10개의 행위를 보인 사용자가 있다고 가정할 경우, 전자는 후자보다 무려 100배 많게 참여한 것으로 된다. 이를 환언하면, 해당 문서에 대한 사용자 관심도 산출시 1,000개의 행위를 보인 사용자가 나머지 사용자들에 비해 지나치게 편중된 영향력을 행사하게 된다. 따라서 행위 영향력 계산부(244)가 산출한 사용자의 행위 영향력(IV)이 상기 관심값(AV)에 반영되는 보정이 이루어져야 한다. 사용자에 대한 행위 영향력(IV)은 다음의 수학식으로 표현된다.In the interest value AV calculated by the
............................... [수학식 3] ............................... [ Equation 3 ]
여기서, 는 시그모이드 함수를 나타내며, 는 사용자 h가 보인 모든 행위의 총회수이며, m은 상기 를 모든 사용자 수로 나눈 값이다(). 이러한 [수학식 3]은 '사용자의 행위 표준편차'로 요약될 수 있다.here, Represents the sigmoid function, Is the total number of all actions shown by user h, and m is the above Divided by all users ( ). Equation 3 may be summarized as 'a standard deviation of a user's behavior'.
한편, 랭크값 계산모듈(250)은 검색엔진(220)이 문서DB(10)를 참조하여 질의어에 부합하는 문서들을 추출한 경우, 추출된 각 문서에 대한 관심랭크(AR)를 기반으로 랭크값(RV: Ranking Value)을 계산하여 순위화한다. 랭크값 계산을 위한 요소로서 상기한 관심랭크(AR)만을 이용할 수 있으나, 경우에 따라서는 아래의 수학식과 같이 질의어에 대한 문서 유사도가 부가될 수 있다.Meanwhile, when the
...................... [수학식 4] .......... [Equation 4]
여기서, DocRel은 질의어에 대한 소정의 문서 유사도를 의미한다. 문사 유사도 산출은 다양한 알고리즘으로 구현된 사례가 다수 개시되어 있으므로, 본 발명에서는 상세한 언급을 생략한다.Here, DocRel means predetermined document similarity with respect to the query word. Since the calculation of the sentence similarity has been disclosed in a number of cases implemented by various algorithms, detailed description thereof will be omitted.
이하, 첨부도면 도 4를 참조하여 상술한 바람직한 실시예에 따른 정보검색 랭킹 방법에 대해 정리한다. 먼저, 문서 수집모듈(210)은 정보통신망을 통해 다수의 문서들을 수집하여 축적한다(S100). 본 과정은 통상의 정보검색 시스템에서 소정의 주기에 따라 수행하는 과정이다. Hereinafter, the information retrieval ranking method according to the above-described preferred embodiment will be described with reference to FIG. 4. First, the
이어서, UAL 수집모듈(230)은 문서이용 사용자단말기(100) 또는 네트워크 제공자 서버로부터 문서에 대한 사용자 행위 로그(UAL)를 수집·축적한다(S200).Subsequently, the
관심랭크 계산모듈(240)은 S200 과정에서 수집된 사용자 행위 로그(UAL)들을 기반으로, 각 문서(문서DB에 축적된 문서)에 행위를 보인 모든 사용자들에 대해서, 각 사용자가 보인 모든 행위에 대한 관심값(AV)과 각 행위에 대한 사용자의 영향력(IV)을 반영하여 관심랭크(AR)를 계산한다(S300). The interest
문서검색 사용자단말기(300)로부터 질의어 기반의 검색요청에 대해, 검색엔진(220)은 질의어에 부합하는 문서들을 문서DB(10)에서 검색한다(S400). 랭크값 계산모듈(250)은 검색된 문서 각각에 대한 관심랭크(AR)를 관심랭크DB(30)로부터 참조하여 랭크값(RV)을 계산한 후, 상기 검색된 문서들을 순위화한다(S500). 본 과정에서 전술한 바와 같은 문서 유사도가 랭크값(RV) 계산에 반영될 수 있다. For the query-based search request from the document search user terminal 300, the
이어서, 검색엔진(220)은 검색을 요청한 문서검색 사용자단말기(300)로 순위 화된 검색결과를 제공한다(S600). 이러한 일련의 과정을 통해 질의자(사용자)는 '사용자 관심도'가 반영된 양질의 검색결과를 열람하게 된다.Subsequently, the
상기와 같은 본 발명에 따르면, 개별 문서에 보인 행위를 인간의 기억모델에 기초한 사용자 관심도로 이용함으로써, 질의어 기반의 검색요청에 대해 사용자의 관심 혹은 선호에 민감한 양질의 순위화된 검색결과를 제공할 수 있다. 또한, 최근 급증하고 있는 사용자 저작물(UCC)에 대해서도 양질의 순위화된 검색결과를 제공할 수 있다.According to the present invention as described above, by using the behavior shown in the individual document as the user interest based on the human memory model, it is possible to provide a high-quality ranked search results sensitive to the user's interest or preference for the query-based search request. Can be. In addition, it is possible to provide a high-quality ranking search results for the user's work (UCC) that has recently increased rapidly.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.Although the embodiments of the present invention have been described in detail above, the scope of the present invention is not limited thereto, and various modifications and improvements of those skilled in the art using the basic concepts of the present invention defined in the following claims are also provided. It belongs to the scope of rights.
Claims (12)
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020070041741A KR100923505B1 (en) | 2007-04-30 | 2007-04-30 | Information search ranking system reflecting user's interest and its method |
| PCT/KR2007/002701 WO2008133368A1 (en) | 2007-04-30 | 2007-06-04 | Information search ranking system and method based on users' attention levels |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020070041741A KR100923505B1 (en) | 2007-04-30 | 2007-04-30 | Information search ranking system reflecting user's interest and its method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20080096887A true KR20080096887A (en) | 2008-11-04 |
| KR100923505B1 KR100923505B1 (en) | 2009-11-02 |
Family
ID=39925803
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020070041741A Active KR100923505B1 (en) | 2007-04-30 | 2007-04-30 | Information search ranking system reflecting user's interest and its method |
Country Status (2)
| Country | Link |
|---|---|
| KR (1) | KR100923505B1 (en) |
| WO (1) | WO2008133368A1 (en) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101218141B1 (en) * | 2011-09-27 | 2013-01-03 | (주)레드테이블 | Method and system for calculating ranking |
| US8452798B2 (en) | 2009-03-26 | 2013-05-28 | Korea Advanced Institute Of Science And Technology | Query and document topic category transition analysis system and method and query expansion-based information retrieval system and method |
| KR20130065912A (en) * | 2011-12-12 | 2013-06-20 | 에스케이플래닛 주식회사 | System for providing personalized information, method thereof, and recordable medium storing the method |
| WO2016021878A1 (en) * | 2014-08-06 | 2016-02-11 | 네이버 주식회사 | Information providing system and method |
| KR101593876B1 (en) * | 2015-04-27 | 2016-02-16 | 연세대학교 산학협력단 | Method and system for assessing environmental impacts capable of establishing weighting factors for environmental impact categories using internet search statistics |
| KR101868729B1 (en) * | 2015-09-29 | 2018-06-19 | 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 | Resource portfolio processing method, device, apparatus and computer strorage medium |
| KR20190030566A (en) * | 2017-09-14 | 2019-03-22 | 인하대학교 산학협력단 | Patent search engine evaluation system based on recall and method thereof |
| KR102008387B1 (en) * | 2018-04-30 | 2019-08-07 | 인하대학교 산학협력단 | Patent search engine evaluation system based on non-recall and method thereof |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8979538B2 (en) | 2009-06-26 | 2015-03-17 | Microsoft Technology Licensing, Llc | Using game play elements to motivate learning |
| US20110270850A1 (en) * | 2010-04-30 | 2011-11-03 | Microsoft Corporation | Prioritization of Resources based on User Activities |
| US9697500B2 (en) | 2010-05-04 | 2017-07-04 | Microsoft Technology Licensing, Llc | Presentation of information describing user activities with regard to resources |
| US8819009B2 (en) | 2011-05-12 | 2014-08-26 | Microsoft Corporation | Automatic social graph calculation |
| US9477574B2 (en) | 2011-05-12 | 2016-10-25 | Microsoft Technology Licensing, Llc | Collection of intranet activity data |
| KR101649146B1 (en) | 2015-01-15 | 2016-08-19 | 주식회사 카카오 | Method and server for searching |
| US11960555B2 (en) * | 2021-03-03 | 2024-04-16 | Home Depot Product Authority, Llc | Attentive pseudo-relevance feedback network for query categorization |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6665655B1 (en) * | 2000-04-14 | 2003-12-16 | Rightnow Technologies, Inc. | Implicit rating of retrieved information in an information search system |
| KR20020043679A (en) * | 2000-12-02 | 2002-06-12 | 김동현 | System and method for supporting search continuously according to user's inclination, and storage media having program source thereof |
| KR20040006515A (en) * | 2002-07-12 | 2004-01-24 | 주식회사 네오위즈 | Method And System for Providing Information Service System and Searching Result by Using Log Analysis and Information Inputed by User |
| KR100645608B1 (en) * | 2004-03-25 | 2006-11-13 | (주)첫눈 | Server providing information retrieval service using user visit UAEL log and its method |
| US20060074883A1 (en) * | 2004-10-05 | 2006-04-06 | Microsoft Corporation | Systems, methods, and interfaces for providing personalized search and information access |
-
2007
- 2007-04-30 KR KR1020070041741A patent/KR100923505B1/en active Active
- 2007-06-04 WO PCT/KR2007/002701 patent/WO2008133368A1/en not_active Ceased
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8452798B2 (en) | 2009-03-26 | 2013-05-28 | Korea Advanced Institute Of Science And Technology | Query and document topic category transition analysis system and method and query expansion-based information retrieval system and method |
| KR101218141B1 (en) * | 2011-09-27 | 2013-01-03 | (주)레드테이블 | Method and system for calculating ranking |
| KR20130065912A (en) * | 2011-12-12 | 2013-06-20 | 에스케이플래닛 주식회사 | System for providing personalized information, method thereof, and recordable medium storing the method |
| WO2016021878A1 (en) * | 2014-08-06 | 2016-02-11 | 네이버 주식회사 | Information providing system and method |
| KR101593876B1 (en) * | 2015-04-27 | 2016-02-16 | 연세대학교 산학협력단 | Method and system for assessing environmental impacts capable of establishing weighting factors for environmental impact categories using internet search statistics |
| KR101868729B1 (en) * | 2015-09-29 | 2018-06-19 | 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 | Resource portfolio processing method, device, apparatus and computer strorage medium |
| KR20190030566A (en) * | 2017-09-14 | 2019-03-22 | 인하대학교 산학협력단 | Patent search engine evaluation system based on recall and method thereof |
| KR102008387B1 (en) * | 2018-04-30 | 2019-08-07 | 인하대학교 산학협력단 | Patent search engine evaluation system based on non-recall and method thereof |
Also Published As
| Publication number | Publication date |
|---|---|
| KR100923505B1 (en) | 2009-11-02 |
| WO2008133368A1 (en) | 2008-11-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100923505B1 (en) | Information search ranking system reflecting user's interest and its method | |
| CN102929928B (en) | Multidimensional-similarity-based personalized news recommendation method | |
| US7941383B2 (en) | Maintaining state transition data for a plurality of users, modeling, detecting, and predicting user states and behavior | |
| US10102307B2 (en) | Method and system for multi-phase ranking for content personalization | |
| Lewandowski | Understanding search engines | |
| US20140281861A1 (en) | Method And Apparatus For Tagging Data | |
| EP2628097A1 (en) | Systems and methods for using a behavior history of a user to augment content of a webpage | |
| CN102799662A (en) | Method, device and system for recommending website | |
| CN101382954A (en) | Method and system for providing web site collection name | |
| CN101479751A (en) | On-line e mail service system, and service method thereof | |
| JP2011154467A (en) | Retrieval result ranking method and system | |
| JP2010128928A (en) | Retrieval system and retrieval method | |
| JP2009265754A (en) | Information providing system, information providing method, and information providing program | |
| JP5284064B2 (en) | Product ID server device and method for controlling product ID server device | |
| CN117056619A (en) | Method and device for determining user behavior characteristics | |
| JP5191499B2 (en) | Search result ranking method and search result ranking system | |
| JP2006146446A (en) | Retrieval optimization system and method for web site | |
| JP4569380B2 (en) | Vector generation method and apparatus, category classification method and apparatus, program, and computer-readable recording medium storing program | |
| JP4820147B2 (en) | Attribute evaluation program, attribute evaluation system, and attribute evaluation method | |
| JP4875911B2 (en) | Content identification method and apparatus | |
| KR101180371B1 (en) | Folksonomy-based personalized web search method and system for performing the method | |
| KR101277300B1 (en) | Method and apparatus for presenting personalized advertisements | |
| JP5286007B2 (en) | Document search device, document search method, and document search program | |
| CN114925263A (en) | Recommended word processing method, electronic device and computer-readable storage medium | |
| KR100371805B1 (en) | Method and system for providing related web sites for the current visitting of client |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| R15-X000 | Change to inventor requested |
St.27 status event code: A-3-3-R10-R15-oth-X000 |
|
| R16-X000 | Change to inventor recorded |
St.27 status event code: A-3-3-R10-R16-oth-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E90F | Notification of reason for final refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| N231 | Notification of change of applicant | ||
| PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| N231 | Notification of change of applicant | ||
| PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20121019 Year of fee payment: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| FPAY | Annual fee payment |
Payment date: 20151015 Year of fee payment: 9 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| P14-X000 | Amendment of ip right document requested |
St.27 status event code: A-5-5-P10-P14-nap-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20180921 Year of fee payment: 12 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 10 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R14-asn-PN2301 |
|
| P14-X000 | Amendment of ip right document requested |
St.27 status event code: A-5-5-P10-P14-nap-X000 |
|
| P16-X000 | Ip right document amended |
St.27 status event code: A-5-5-P10-P16-nap-X000 |
|
| Q16-X000 | A copy of ip right certificate issued |
St.27 status event code: A-4-4-Q10-Q16-nap-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 13 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 16 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 17 |