[go: up one dir, main page]

KR100832859B1 - Mobile web content service system and method - Google Patents

Mobile web content service system and method Download PDF

Info

Publication number
KR100832859B1
KR100832859B1 KR1020060082696A KR20060082696A KR100832859B1 KR 100832859 B1 KR100832859 B1 KR 100832859B1 KR 1020060082696 A KR1020060082696 A KR 1020060082696A KR 20060082696 A KR20060082696 A KR 20060082696A KR 100832859 B1 KR100832859 B1 KR 100832859B1
Authority
KR
South Korea
Prior art keywords
content
block
mobile device
words
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020060082696A
Other languages
Korean (ko)
Other versions
KR20080020011A (en
Inventor
최중민
강진범
이은실
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020060082696A priority Critical patent/KR100832859B1/en
Publication of KR20080020011A publication Critical patent/KR20080020011A/en
Application granted granted Critical
Publication of KR100832859B1 publication Critical patent/KR100832859B1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 모바일 웹 콘텐츠 서비스 시스템 및 그 방법에 관한 것으로, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS)을 이용하여 블록 단위로 분류하고, 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하고, 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하고, 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하고, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 함으로써, 모바일 디바이스의 사용자에 의해 요청된 웹콘텐츠를 모바일 디바이스에 맞게 자동으로 변환하고, 사용자 관심정보를 이용한 학습을 통해 콘텐츠 목록의 우선순위를 사용자 개개인에게 맞게 변형된 형태로 제공할 수 있다.The present invention relates to a mobile web content service system and a method thereof, wherein any web page requested from a mobile device is classified in block units by using a visual web page segmentation technique (VIPS), and a block of the classified web page is provided. Among them, filters other than the block containing the content of the webpage, remove the block, extract the title of the content from the block containing the content, and phrases having a frequency greater than or equal to a predetermined number of blocks containing the content as important phrases. Selects, summarizes the block containing the content using sentences containing the selected important phrase, compares the words included in the block containing the content with the words of interest of the prestored mobile device user, and the word of interest of the mobile device user. Contains content that contains words that are very similar to By allowing the title of the block to be displayed on the screen of the mobile device, the web content requested by the user of the mobile device is automatically converted to fit the mobile device, and the priority of the content list is provided to the individual users by learning using user interest information. It may be provided in a form modified to suit.

모바일 디바이스, 웹 콘텐츠 서비스 Mobile device, web content service

Description

모바일 웹 콘텐츠 서비스 시스템 및 그 방법{MOBILE WEB CONTENTS SERVICE SYSTEM AND METHOD}Mobile web content service system and its method {MOBILE WEB CONTENTS SERVICE SYSTEM AND METHOD}

도 1은 본 발명에 따른 모바일 웹 콘텐츠 서비스 시스템에 대한 구성을 나타낸 도면.1 is a diagram showing a configuration of a mobile web content service system according to the present invention.

도 2는 도 1에 도시된 블록 분류부는 웹 콘텐츠의 블록을 분류하는 방법에 대한 흐름을 예시한 도면.FIG. 2 is a diagram illustrating a flow of a method of classifying blocks of web content in the block classifier shown in FIG. 1.

도 3은 도 1에 도시된 타이틀 추출부의 타이틀 추출에 대한 예시를 나타낸 도면.3 is a diagram illustrating an example of title extraction of a title extraction unit shown in FIG. 1;

도 4는 도 1에 도시된 요약부의 컨텐츠 블록에서 중요구문 추출에 대한 예시를 나타낸 도면.4 is a diagram illustrating an example of extracting important phrases from a content block of the summary unit illustrated in FIG. 1.

도 5는 도 1에 도시된 요약부의 중요구문의 요약 흐름에 대한 예시를 나타낸 도면.FIG. 5 is a diagram illustrating an example of a summary flow of important phrases of the summary unit illustrated in FIG. 1.

도 6은 도 1에 도시된 필터링부의 결과를 모바일 디바이스에 출력한 예를 나타낸 도면.6 is a diagram illustrating an example of outputting a result of the filtering unit illustrated in FIG. 1 to a mobile device;

도 7은 도 1에 도시된 요약부의 수행결과를 모바일 디바이스에 예시한 도면.FIG. 7 is a diagram illustrating a mobile device performing results of the summary unit illustrated in FIG. 1;

도 8은 도 1에 도시된 학습부의 학습과정에 대한 예시를 모바일 디바이스 화면에 나타낸 도면.8 is a diagram illustrating an example of a learning process of the learning unit illustrated in FIG. 1 on a mobile device screen;

본 발명은 모바일 웹 콘텐츠 서비스 시스템 및 그 방법에 관한 것으로, 더욱 자세하게는 웹콘텐츠를 모바일 디바이스에 맞게 자동으로 변환하고, 사용자 관심정보를 이용한 학습을 통해 콘텐츠 목록의 우선순위를 사용자 개개인에게 맞게 변형된 형태로 제공하는 모바일 웹 콘텐츠 서비스 시스템 및 그 방법에 관한 것이다.The present invention relates to a mobile web content service system and a method thereof, and more particularly, automatically converts web content to a mobile device, and modifies the priority of a content list to a user by learning using user interest information. The present invention relates to a mobile web content service system and a method thereof.

최근에는 인터넷과 더불어 휴대전화나 PDA(Personal Digital Assistants)와 같은 다양한 모바일 디바이스들이 널리 보급되고 있다. Recently, in addition to the Internet, various mobile devices such as mobile phones and PDAs (Personal Digital Assistants) are widely used.

더불어 모바일 디바이스 사용자들은 PC에서 제공받았던 풍부하고 다양한 콘텐츠를 모바일 장치에서도 볼 수 있기를 원한다. 하지만, 모바일 디바이스마다 서로 다른 성능과 사용자 선호도 및 네트워크 대역폭 때문에 서비스는 제한되고 있다. In addition, mobile device users want to see the rich variety of content available on their PCs on mobile devices. However, services are limited because of different performance, user preferences and network bandwidth for each mobile device.

더욱이 모바일 디바이스는 화면 크기가 제한되어 있으며, 다양한 콘텐츠를 서비스하기 위한 모듈이 제공되고 있지 않다. 이는 모바일 디바이스는 경량화에 그 목적이 있기 때문에 이와 같은 부수적인 기능을 제거하고 있다. 따라서 일반 PC에서 폭넓게 사용하고 있는 웹 정보를 모바일 사용자가 불편 없이 서비스받기 위해서 콘텐츠 적응화(Adaptation)라는 과정이 필요하게 된다.Moreover, the mobile device has a limited screen size, and no module for providing various contents is provided. This eliminates this ancillary feature as mobile devices are designed to be lightweight. Therefore, a process called content adaptation is required for mobile users to receive web services widely used in general PCs without inconvenience.

웹에서 제공되는 콘텐츠는 대부분 모바일 장치에서 바로 볼 수 없다. 이는 웹 콘텐츠가 모바일 디바이스에 표현되기에는 큰 내용의 데이터 크기를 가지거나, 표현할 수 없는 형식 또는 소리파일, 플래시와 같은 멀티미디어 정보 등의 다양한 형태의 콘텐츠를 담고 있기 때문이다. Most content available on the web is not immediately available on mobile devices. This is because the web content has a large data size, or contains various types of content such as a format or sound file or multimedia information such as flash that cannot be represented on the mobile device.

따라서, 다양한 콘텐츠를 모바일 디바이스에서 출력되도록 변환방법이 이슈화되고 있다. Therefore, a method of converting various contents to be output on a mobile device has been issued.

그런데, 모바일 디바이스의 사용자가 웹서버에 접속하여 웹콘텐츠를 선택한 경우, 웹 서버에서 작성된 모바일 전용 페이지의 콘텐츠가 사용자의 모바일 디바이스에 제공되고 있다. However, when a user of a mobile device accesses a web server and selects web content, content of a mobile-only page created in the web server is provided to the user's mobile device.

이는 모바일 디바이스의 사용자가 관심이 있는 정보를 모바일 디바이스의 목록에서 우선적으로 제공되기를 원하는 것과는 상반되는 결과를 가져오는 문제점을 발생한다.This results in a problem that results in the opposite of what the user of the mobile device wants to preferentially provide information of interest in the list of mobile devices.

따라서, 본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로, 모바일 디바이스의 사용자에 의해 요청된 웹콘텐츠를 모바일 디바이스에 맞게 자동으로 변환하고, 사용자 관심정보를 이용한 학습을 통해 콘텐츠 목록의 우선순위를 사용자 개개인에게 맞게 변형된 형태로 제공하는 모바일 웹 콘텐츠 서비스 시스템 및 그 방법을 제공함에 그 목적이 있다.Therefore, the present invention was devised to solve the above problems, and automatically converts web content requested by the user of the mobile device to the mobile device, and prioritizes the content list through learning using user interest information. The purpose of the present invention is to provide a mobile web content service system and a method for providing a modified form to a user.

상기 목적을 달성하기 위한 본 발명의 일 측면에 따른 모바일 웹 콘텐츠 서비스 시스템은, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류하는 블록 분류부; 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하는 필터링부; 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하는 타이틀 추출부; 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하는 요약부; 및 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 학습부를 포함한다.Mobile web content service system according to an aspect of the present invention for achieving the above object, block any web page requested from the mobile device using a visual web page segmentation technique (VIPS, Vision-based Page Segmentation Algorithm) A block classification unit classified into units; A filtering unit for filtering and removing blocks other than the block including the contents of the web page among the classified web page blocks; A title extraction unit which extracts a title of the content from the block including the content; A summary unit for selecting phrases having a frequency greater than or equal to a predetermined number in the block including the content as a critical phrase, and summarizing the block including the content using the sentences including the selected important phrase; And comparing the words included in the block including the content with the words of interest of the mobile device user previously stored, and the title of the block including the content including words having high similarity to the words of interest of the mobile device user is displayed on the screen of the mobile device. It includes a learning unit to be output.

상기 블록 분류부는, 상기 모바일 디바이스의 화면에 블록 단위로 나누어진 웹콘텐츠에 출력한다.The block classification unit outputs the web content divided into blocks on the screen of the mobile device.

상기 필터링부는, 상기 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록과 상기 웹페이지의 콘텐츠를 포함한 블록 이외의 블록으로 분류한다.The filtering unit classifies the classified blocks of the webpage into blocks other than blocks including the content of the webpage and blocks including the content of the webpage using a heuristic rule.

상기 요약부는, 상기 콘텐츠를 포함한 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택한다.The summary unit selects, as an important phrase, a phrase having a frequency greater than or equal to a set number using a N-gram method in a block including the content.

상기 요약부는, 상기 선택된 중요구문이 포함된 문장들 중 접속사를 포함한 문장들을 제거하여 콘텐츠를 포함한 블록을 요약한다.The summary unit summarizes a block including content by removing sentences including a conjunction from among sentences containing the selected important phrase.

상기 학습부는, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 기저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 측정으로 측정하고, 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면 상단에 출력되도록 한다.The learning unit may express words included in a block including the content and words of interest of a mobile device user previously stored on a vector using a vector model, and the words of interest of the user stored as the query of the vector model. The similarity with the block including the content is measured by cosine measurement, and the title of the block including the content containing the high similarity word is output on the top of the screen of the mobile device by the cosine measurement.

상기 목적을 달성하기 위한 본 발명의 일 측면에 따른 모바일 웹 콘텐츠 서비스 방법은, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류하는 단계; 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하는 단계; 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하는 단계; 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하는 단계; 및 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계를 포함한다.The mobile web content service method according to an aspect of the present invention for achieving the above object, block any web page requested from the mobile device using a visual web page segmentation technique (VIPS, Vision-based Page Segmentation Algorithm) Classifying the unit; Filtering and removing blocks other than the block including the content of the webpage from among the classified webpage blocks; Extracting a title of the content from the block including the content; Selecting phrases having a frequency greater than or equal to a predetermined number in the block including the contents as important phrases, and summarizing the blocks containing the content using sentences including the selected important phrases; And comparing the words included in the block including the content with the words of interest of the mobile device user previously stored, and the title of the block including the content including words having high similarity to the words of interest of the mobile device user is displayed on the screen of the mobile device. Causing the output to occur.

상기 블록 단위로 분류하는 단계는, 상기 모바일 디바이스의 화면에 블록 단위로 나누어진 웹콘텐츠에 출력하는 단계를 포함한다.The classifying in block units may include outputting web content divided in block units on a screen of the mobile device.

상기 필터링하여 제거하는 단계는, 상기 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록과 상기 웹페이지의 콘텐츠를 포함한 블록 이외의 블록으로 분류하는 단계를 포함한다.The filtering and removing may include classifying the classified blocks of the webpage into blocks other than the blocks including the contents of the webpage and the blocks including the contents of the webpage using a heuristic rule.

상기 요약하는 단계는, 상기 콘텐츠를 포함한 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하는 단계를 포함한다.The summarizing may include selecting, as an important phrase, a phrase having a frequency greater than or equal to a set number using an N-gram method in a block including the content.

상기 요약하는 단계는, 상기 선택된 중요구문이 포함된 문장들 중 접속사를 포함한 문장들을 제거하여 콘텐츠를 포함한 블록을 요약하는 단계를 포함한다.The summarizing may include summarizing a block including content by removing sentences including conjunctions among sentences including the selected important phrase.

상기 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계는, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 기저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 측정으로 측정하는 단계; 와 상기 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계를 포함한다.The step of outputting a title of a block including content including words with high similarity to words of interest of the mobile device user on the screen of the mobile device may include: words included in the block including the content; Expressing words of interest on a vector using a vector model, and measuring similarity with a block including the content by cosine measurement using the pre-stored user's word of interest as a query of the vector model; And outputting a title of a block including content having high similarity words to the screen of the mobile device through the cosine measurement.

이하 본 발명에 따른 모바일 웹 콘텐츠 서비스 시스템 및 그 방법을 첨부한 도면을 참조하여 상세히 설명한다.Hereinafter, a mobile web content service system and a method thereof according to the present invention will be described in detail with reference to the accompanying drawings.

또한, 이해의 편의를 위하여 비록 다른 도면에 속하더라도 동일한 구성요소에는 동일한 부호를 부여하였음을 주의하여야 한다.In addition, it should be noted that the same reference numerals are given to the same elements, although belonging to different drawings for convenience of understanding.

도 1은 본 발명에 따른 모바일 웹 콘텐츠 서비스 시스템에 대한 구성을 나타낸 도면이다.1 is a diagram showing the configuration of a mobile web content service system according to the present invention.

도 1에 도시된 바와 같이, 본 발명에 따른 웹 콘텐츠 서비스 시스템은, 모바일 디바이스(10)와 적응화 서버(20)로 구성된다.As shown in FIG. 1, the web content service system according to the present invention comprises a mobile device 10 and an adaptation server 20.

적응화 서버(20)는 블록 분류부(21), 필터링부(22), 타이틀 추출부(23), 요약부(24), 학습부(25) 및 데이터베이스(26)를 포함한다.The adaptation server 20 includes a block classification unit 21, a filtering unit 22, a title extraction unit 23, a summary unit 24, a learning unit 25, and a database 26.

블록 분류부(21)는 모바일 디바이스(10)의 사용자가 요청한 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류한다. The block classification unit 21 classifies any web page requested by the user of the mobile device 10 in units of blocks by using a visual web page segmentation algorithm (VIPS).

블록 분류부(21)은 블록 단위로 분류된 웹 페이지를 모바일 디바이스(10)의 화면에 출력할 수 있다.The block classification unit 21 may output a web page classified in units of blocks on the screen of the mobile device 10.

필터링부(22)는 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거한다. 이때, 웹페이지의 콘텐츠를 포함한 블록 이외의 블록에는 광고 등의 내용을 포함한 블록 등이 해당될 수 있다. The filtering unit 22 filters and removes blocks other than the blocks including the content of the web page using heuristic rules. In this case, blocks other than the block including the content of the web page may include a block including the content of the advertisement.

타이틀 추출부(23)는 콘텐츠 블록에서 콘텐츠의 타이틀(title)을 추출한다.The title extractor 23 extracts a title of the content from the content block.

요약부(24)는 콘텐츠 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들 중 접속사로 시작되는 문장을 제외하여 콘텐츠 블록의 내용을 요약한다.The summary unit 24 selects phrases having a frequency greater than or equal to a set number using a N-gram method in the content block as important phrases, and excludes sentences starting with conjunctions among sentences containing the selected important phrases. Summarize

학습부(25)는 콘텐츠 블록에 포함된 단어들과 데이터베이스(26)에 저장된 모 바일 디바이스(10) 사용자의 관심 단어들을 비교하고, 모바일 디바이스(10) 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠 블록의 제목이 모바일 디바이스(10)의 화면 상단에 출력되도록 한다.The learner 25 compares the words included in the content block with the words of interest of the user of the mobile device 10 stored in the database 26, and compares the words of high interest with words of interest of the user of the mobile device 10. The title of the content block to be included is output at the top of the screen of the mobile device 10.

좀 더 구체적으로, 학습부(25)는 상기 콘텐츠를 포함한 블록에 포함된 단어들과 데이터베이스(26)에 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 데이터베이스(26)에 저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 값으로 측정하고, 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 한다.More specifically, the learning unit 25 expresses words included in a block including the content and words of interest of a mobile device user stored in the database 26 on a vector using a vector model, and the database 26 Using the user's words stored in the query as the query of the vector model, the similarity with the block including the content is measured by the cosine value, and the title of the block including the content including the high similarity word is determined by the cosine measurement. To be output to

도 2는 도 1에 도시된 블록 분류부는 웹 콘텐츠의 블록을 분류하는 방법에 대한 흐름을 예시한 도면이다.FIG. 2 is a diagram illustrating a flow of a method of classifying blocks of web content in the block classification unit illustrated in FIG. 1.

도 2에 도시된 바와 같이, 블록 분류부는 사용자가 요청한 임의의 웹 페이지를 웹 페이지 세그멘테이션 기법(VIPS)을 통하여 분류된 블록의 내용이 웹 페이지 크기의 설정된 크기 이상이면 콘텐츠를 포함한 블록으로 판단한다(S20).As illustrated in FIG. 2, the block classifier determines that any web page requested by the user is a block including content if the content of the classified block through the web page segmentation technique (VIPS) is equal to or larger than the set size of the web page size (see FIG. 2). S20).

블록 분류부는 콘텐츠를 포함한 블록에 링크가 포함되어 있는가를 검사한다(S21).The block classification unit checks whether a link is included in the block including the content (S21).

블록 분류부는 콘텐츠를 포함한 블록에 링크가 포함되어 있으면, 포함된 링크에 다른 도메인 네임이 있는가를 검사한다(S22).If the block classification unit includes a link in the block including the content, the block classification unit checks whether there is another domain name in the included link (S22).

블록 분류부는 포함된 링크에 다른 도메인 네임이 있으면, 해당 블록을 삭제한다(S23).If there is another domain name in the included link, the block classification unit deletes the block (S23).

블록 분류부는 단계 S22에서 포함된 링크에 다른 도메인 네임이 없으면, 포함된 링크가 콘텐츠를 포함한 블록의 절반 이상인가를 검사한다(S24).If there is no other domain name in the link included in step S22, the block classification unit checks whether the included link is at least half of the block including the content (S24).

블록 분류부는 포함된 링크 안의 텍스트가 콘텐츠를 포함한 블록의 절반 이상을 차지하면, 평균 링크 안 텍스트 길이가 설정된 길이(예로, "10") 이상인가를 검사한다(S25).If the text in the included link occupies more than half of the block including the content, the block classification unit checks whether the average length of the text in the link is greater than or equal to a set length (eg, "10") (S25).

블록 분류부는 포함된 링크가 평균 링크 길이가 설정된 길이 이상이면, 해당 블록을 네비게이션 리스트 블록으로 판단한다(S26).If the included link is at least the length of the average link length is set, the block classification unit determines that the block as a navigation list block (S26).

이때, 네비게이션 리스트 블록은 내용을 포함하고 있는 링크들이 존재하는 블록을 나타낸다.In this case, the navigation list block represents a block in which links including content exist.

반면, 블록 분류부는 단계 S25에서 포함된 링크가 콘텐츠를 포함한 블록의 절반 이하이면, 해당 블록을 네비게이션 바 블록으로 판단한다(S27).On the other hand, if the link included in step S25 is less than half of the block including the content, the block classification unit determines that the block as a navigation bar block (S27).

이때, 네비게이션 바 블록은 메뉴를 가진 블록을 나타낸다.At this time, the navigation bar block represents a block having a menu.

한편, 블록 분류부는 단계 S21에서 콘텐츠를 포함한 블록에 링크가 포함되어 있지 않으면, 콘텐츠를 포함한 블록에 포함된 단어 수가 설정된 단어 수(100) 이상인가를 검사한다(S29).On the other hand, if the link is not included in the block including the content in step S21, the block classification unit checks whether the number of words included in the block including the content is equal to or greater than the set number of words 100 (S29).

블록 분류부는 콘텐츠를 포함한 블록에 포함된 단어 수가 설정된 단어 수 이상이면, 콘텐츠를 포함한 블록을 콘텐츠 블록으로 판단한다(S30).If the number of words included in the block including the content is greater than or equal to the set word number, the block classification unit determines the block including the content as the content block (S30).

이때, 콘텐츠 블록은 콘텐츠 포함한 블록이 내용을 포함한 블록임을 나타낸다. In this case, the content block indicates that the block including the content is a block including the content.

반면, 블록 분류부는 콘텐츠를 포함한 블록에 포함된 단어 수가 설정된 단어 수 이하이면, 해당 블록을 삭제한다(S31).On the other hand, if the number of words included in the block including the content is less than the set number of words, the block classification unit deletes the block (S31).

도 3은 도 1에 도시된 타이틀 추출부의 타이틀 추출에 대한 예시를 나타낸 도면이다.FIG. 3 is a diagram illustrating an example of title extraction of the title extraction unit shown in FIG. 1.

도 3에 도시된 바와 같이, 타이틀 추출부는 도 1에 도시된 필터링부(24)에서 필터링된 컨텐츠 블록에서 타이틀을 추출하기 위해서 웹페이지를 구성하고 있는 태그들 중 <title> 태그(35), <meta name="title">태그(36), <HI>태그(37)에서 중복되는 내용을 타이틀로 선택한다.As shown in FIG. 3, the title extracting unit includes <title> tags 35 and <of tags constituting a web page to extract titles from the content block filtered by the filtering unit 24 shown in FIG. 1. meta name = "title"> tag 36 and <HI> tag 37 select duplicate contents as a title.

도 4는 도 1에 도시된 요약부의 컨텐츠 블록에서 중요구문 추출에 대한 예시를 나타낸 도면이다.4 is a diagram illustrating an example of extracting an important phrase from a content block of the summary unit illustrated in FIG. 1.

도 4에 도시된 바와 같이, 요약부는 도 1에 도시된 필터링부(22)에서 출력된 콘텐츠 블록의 내용을 N-gram 방법을 통하여 요약한다.As shown in FIG. 4, the summary unit summarizes the content of the content block output from the filtering unit 22 shown in FIG. 1 through the N-gram method.

다시 말해서, 요약부는 콘텐츠 블록에 포함된 토큰(예, 단어)들을 결합하여 구를 생성하고, 생성된 구가 설정된 회수 이상 존재하면 생성된 구를 다른 토큰과 결합하여 새로운 구를 생성한다. In other words, the summary unit generates a phrase by combining tokens (eg, words) included in the content block, and generates a new phrase by combining the generated phrase with another token when the generated phrase exists over a set number of times.

이에 대해서 구체적으로 살펴보기로 한다.This will be described in detail.

요약부는 웹페이지(40)에 포함된 단어들(41, 42, 43)에 대해서 단어(41)와 단어(42)를 결합하여 구를 생성하고, 단어(41)와 단어(42)에 의해 생성된 구가 웹페이지(40)에 설정된 회수 이상 존재하면 해당 구를 단어(43)와 결합하여 새로운 구를 생성한다. 만약, 단어(41)와 단어(42)에 의해 생성된 구가 웹페이지(40)에 설정된 회수 이하로 존재하면 단어(42)와 단어(43)를 결합하여 구를 생성하고, 단 어(42)와 단어(43)에 의해 생성된 구가 설정된 회수 이상 존재하는가를 검사한다.The summary unit combines the word 41 and the word 42 with respect to the words 41, 42, and 43 included in the web page 40 to generate a phrase, and is generated by the word 41 and the word 42. If there are more than the number of phrases set in the web page 40, the phrase is combined with the word 43 to create a new phrase. If the phrase generated by the word 41 and the word 42 is less than or equal to the number set in the web page 40, the word 42 and the word 43 are combined to generate a phrase, and the word 42 ) And the phrase generated by the word 43 exist over the set number of times.

이러한 과정을 통해서 요약부는 웹페이지(40)에서 중요구문을 추출하게 되는 것이다.Through this process, the summary unit extracts important phrases from the web page 40.

도 5는 도 1에 도시된 요약부의 중요구문의 요약 흐름에 대한 예시를 나타낸 도면이다.FIG. 5 is a diagram illustrating an example of a summary flow of important phrases of the summary unit illustrated in FIG. 1.

도 5에 도시된 바와 같이, 요약부는 콘텐츠 블록(51)에서 도 4에 도시된 바와 같이 중요구문추출을 통하여 얻어진 중요구문들(50)이 존재하는 절(paragraph)을 추출하여 요약 후보(summary candidate)(52)를 획득한다. As shown in FIG. 5, the summary unit extracts a paragraph in which the important phrases 50 obtained by extracting the important phrases from the content block 51 exist as a summary candidate. 52 is obtained.

요약부는 획득된 요약 후보(52) 중 접속사로 시작되는 절을 제외하는 예외 처리(53)과정을 통해 콘텐츠 블록에 대한 요약(54)을 획득하게 되는 것이다. The summary unit obtains the summary 54 of the content block through an exception process 53 excluding the section beginning with the conjunction of the obtained summary candidates 52.

도 6은 도 1에 도시된 필터링부의 결과를 모바일 디바이스에 출력한 예를 나타낸 도면이다.FIG. 6 is a diagram illustrating an example of outputting a result of the filtering unit illustrated in FIG. 1 to a mobile device.

모바일 디바이스에서 네비게이션 바 블록(60)은 MENU로 나타나고, 네비게이션 리스트 블록(62)은 모바일 디바이스에 초기에 출력되는 경우에 모바일 사용자의 관심단어 정보를 수집하지 않은 상태이므로 웹페이지에서의 링크 정보들 중 상위에 나타난 링크의 제목을 출력한다. 모바일 사용자의 관심단어 정보가 존재한다면 링크들 중 모바일 사용자가 관심을 가지는 내용의 링크 제목이 모바일 디바이스(10)에 출력된다. 한편, 모바일 디바이스(10)에 출력되는 네비게이션 리스트 블록의 괄호는 네비게이션 리스트 블록 내 링크들의 개수를 나타낸다. In the mobile device, the navigation bar block 60 is shown as MENU, and the navigation list block 62 is not collecting the word of interest information of the mobile user when initially outputted to the mobile device. Print the title of the link that appears at the top. If there is a word of interest information of the mobile user, a link title of content of interest to the mobile user among the links is output to the mobile device 10. Meanwhile, parentheses of the navigation list block output to the mobile device 10 indicate the number of links in the navigation list block.

마지막으로 콘텐츠 블록(61)은 모바일 디바이스(10)의 화면에 "2.NASA Glenn"으로 디스플레이되고 있음을 알 수 있다. Finally, it can be seen that the content block 61 is displayed as “2.NASA Glenn” on the screen of the mobile device 10.

도 7은 도 1에 도시된 요약부의 수행결과에 대한 예시를 나타낸 도면이다. FIG. 7 is a diagram illustrating an example of an execution result of the summary unit illustrated in FIG. 1.

도 7에 도시된 바와 같이, 내용을 가진 콘텐츠 블록(70)에 대한 타이틀(71)이 모바일 디바이스 화면에 디스플레이된다.As shown in FIG. 7, a title 71 for content block 70 with content is displayed on the mobile device screen.

이렇게 모바일 디바이스 화면에 디스플레이된 콘텐츠 블록(70)에 대한 타이틀(71)이 선택되면, 해당 타이틀(71)에 대한 요약(72)이 모바일 디바이스 화면에 디스플레이된다.When the title 71 for the content block 70 displayed on the mobile device screen is selected in this way, the summary 72 for the title 71 is displayed on the mobile device screen.

타이틀(71)에 대한 요약(72)이 디스플레이된 모바일 디바이스 화면에서 Full Story의 선택이 있으면, 타이틀(71)에 대한 원문(73)이 모바일 디바이스 화면에 디스플레이된다.If there is a selection of Full Story in the mobile device screen on which the summary 72 for the title 71 is displayed, the original text 73 for the title 71 is displayed on the mobile device screen.

이렇게 함으로써, 모바일 디바이스 화면 사이즈에 맞게 나눠진 원문(71)을 사용자가 볼 수 있게 되는 것이다.By doing so, the user can see the text 71 divided according to the mobile device screen size.

도 8은 도 1에 도시된 학습부의 학습과정에 대한 예시를 모바일 디바이스 화면에 나타낸 도면이다. FIG. 8 is a diagram illustrating an example of a learning process of the learning unit illustrated in FIG. 1 on a screen of a mobile device.

모바일 디바이스의 화면(80)에 디스플레이된 세번째 네비게이션 리스트 블록의 선택이 있은 후, 링크들 중 "Afghan"에 관한 내용을 선택하여 원문까지 보게 되면, 사용자의 관심단어에 "Afghan"이라는 단어가 저장된다. 학습부는 사용자가 "Afghan"에 대해 관심이 있다고 인식하고 그에 관한 내용을 목록의 상위에 위치시킨다.After the selection of the third navigation list block displayed on the screen 80 of the mobile device, if the user selects the contents related to "Afghan" among the links and views the original text, the word "Afghan" is stored in the user's word of interest. . The learning unit recognizes that the user is interested in "Afghan" and places the content at the top of the list.

세번째 모바일 디바이스에서 첫번째 모바일 디바이스의 화면(82)에서 두번째 와 세번째의 순서가 변경되었음을 알 수 있다.In the third mobile device, it can be seen that the order of the second and third has been changed on the screen 82 of the first mobile device.

상술한 바와 같이, 본 발명에 따른 모바일 웹 콘텐츠 웹 서비스 시스템 및 그 방법에 따르면, 모바일 디바이스의 사용자에 의해 요청된 웹콘텐츠를 모바일 디바이스에 맞게 자동으로 변환하고, 사용자 관심정보를 이용한 학습을 통해 콘텐츠 목록의 우선순위를 사용자 개개인에게 맞게 변형된 형태로 제공할 수 있다.As described above, according to the mobile web content web service system and method thereof according to the present invention, the web content requested by the user of the mobile device is automatically converted to fit the mobile device, the content by learning using the user interest information The priority of the list can be provided in a form customized for each user.

Claims (14)

모바일 웹 콘텐츠 서비스 시스템에 있어서,In the mobile web content service system, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류하는 블록 분류부; A block classification unit classifying any web page requested from the mobile device into blocks by using a visual web page segmentation technique (VIPS); 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하는 필터링부; A filtering unit for filtering and removing blocks other than the block including the contents of the web page among the classified web page blocks; 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하는 타이틀 추출부;A title extraction unit which extracts a title of the content from the block including the content; 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하는 요약부; 및 A summary unit for selecting phrases having a frequency greater than or equal to a predetermined number in the block including the content as a critical phrase, and summarizing the block including the content using the sentences including the selected important phrase; And 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 학습부를 포함하는 모바일 웹 콘텐츠 서비스 시스템.The words included in the block including the content are compared with the words of interest of the mobile device user, and the title of the block including the content including words with high similarity to the words of interest of the mobile device user is displayed on the screen of the mobile device. Mobile web content service system comprising a learning unit to be. 제1항에 있어서,The method of claim 1, 상기 블록 분류부는,The block classification unit, 상기 모바일 디바이스의 화면에 블록 단위로 나누어진 웹콘텐츠에 출력하는 모바일 웹 콘텐츠 서비스 시스템. Mobile web content service system for outputting the web content divided into blocks on the screen of the mobile device. 제1항에 있어서,The method of claim 1, 상기 필터링부는,The filtering unit, 상기 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록과 상기 웹페이지의 콘텐츠를 포함한 블록 이외의 블록으로 분류하는 모바일 웹 콘텐츠 서비스 시스템.And classifying the blocks of the classified webpage into blocks including content of the webpage and blocks other than blocks containing the content of the webpage using heuristic rules. 제1항에 있어서,The method of claim 1, 상기 요약부는,The summary section, 상기 콘텐츠를 포함한 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하는 모바일 웹 콘텐츠 서비스 시스템. A mobile web content service system for selecting phrases having a frequency greater than or equal to a predetermined number as an important phrase in a block including the content using an N-gram method. 제1항에 있어서,The method of claim 1, 상기 요약부는,The summary section, 상기 선택된 중요구문이 포함된 문장들 중 접속사를 포함한 문장들을 제거하 여 콘텐츠를 포함한 블록을 요약하는 모바일 웹 콘텐츠 서비스 시스템.The mobile web content service system of summarizing the block containing the content by removing the sentences including the conjunctions among the sentences containing the selected important phrases. 제1항에 있어서,The method of claim 1, 상기 학습부는,The learning unit, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 기저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 측정으로 측정하고, 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 모바일 웹 콘텐츠 서비스 시스템.Words included in the block including the content and words of interest of a mobile device user, which are previously stored, are expressed on a vector using a vector model, and the content of the word of interest is stored as a query of the vector model. And measure the similarity with the block by cosine measurement, and output the title of the block including the content containing the high similarity word on the screen of the mobile device by cosine measurement. 모바일 웹 콘텐츠 서비스 시스템에 있어서,In the mobile web content service system, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류하는 블록 분류부와, 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하는 필터링부와, 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하는 타이틀 추출부와, 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하는 요약부와, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 학습부를 포함하되,A block classifier which classifies any web page requested from the mobile device into block units using a visual web page segmentation algorithm (VIPS), and a web page among the blocks of the classified web pages. A filtering unit for filtering and removing blocks other than the block containing the content of the content, a title extracting unit extracting a title of the content from the block containing the content, and a phrase having a frequency equal to or greater than a set number of frequencies in the block containing the content. Selects an important phrase, compares a summary section summarizing a block including content using sentences containing the selected important phrase, compares words included in the block containing the content with words of interest of a previously stored mobile device user, Cones that contain words that are most similar to words of interest to the mobile device user. Includes a learning unit for displaying the title of the block containing the content on the screen of the mobile device, 상기 블록 분류부는 모바일 디바이스의 화면에 블록 단위로 나누어진 웹콘텐츠에 출력하고, 상기 필터링부는 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록과 상기 웹페이지의 콘텐츠를 포함한 블록 이외의 블록으로 분류하며, The block classification unit outputs the web content divided into block units on the screen of the mobile device, and the filtering unit includes the blocks including the contents of the web page and the contents of the web page using heuristic rules. Are classified as blocks other than blocks, 상기 요약부는 상기 콘텐츠를 포함한 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 상기 선택된 중요구문이 포함된 문장들 중 접속사를 포함한 문장들을 제거하여 콘텐츠를 포함한 블록을 요약하며,The summary unit selects a phrase having a frequency greater than or equal to a predetermined number using a N-gram method in a block including the content, and removes a sentence including a connection word from among sentences containing the selected important phrase and includes a content block. To summarize, 상기 학습부는 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 기저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 측정으로 측정하고, 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 모바일 웹 콘텐츠 서비스 시스템.The learning unit expresses the words included in the block including the content and the words of interest of the mobile device user previously stored on the vector using a vector model, and the contents of the content by using the prestored user's words of interest as a query of the vector model. The mobile web content service system for measuring the similarity with the block including a cosine measurement, and the title of the block including the content containing the high similarity words by the cosine measurement is displayed on the screen of the mobile device. 모바일 웹 콘텐츠 서비스 방법에 있어서,In the mobile web content service method, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류하는 단계; Classifying any web page requested from the mobile device into units of blocks using a visual web page segmentation technique (VIPS); 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하는 단계; Filtering and removing blocks other than the block including the content of the webpage from among the classified webpage blocks; 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하는 단계;Extracting a title of the content from the block including the content; 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하는 단계; 및 Selecting phrases having a frequency greater than or equal to a predetermined number in the block including the contents as important phrases, and summarizing the blocks containing the content using sentences including the selected important phrases; And 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계를 포함하는 모바일 웹 콘텐츠 서비스 방법.The words included in the block including the content are compared with the words of interest of the mobile device user, and the title of the block including the content including words with high similarity to the words of interest of the mobile device user is displayed on the screen of the mobile device. Mobile Web content service method comprising the step of. 제8항에 있어서,The method of claim 8, 상기 블록 단위로 분류하는 단계는, The step of classifying the block unit, 상기 모바일 디바이스의 화면에 블록 단위로 나누어진 웹콘텐츠에 출력하는 단계를 포함하는 모바일 웹 콘텐츠 서비스 방법.The mobile web content service method comprising the step of outputting the web content divided into blocks on the screen of the mobile device. 제8항에 있어서,The method of claim 8, 상기 필터링하여 제거하는 단계는,Removing by filtering, 상기 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록과 상기 웹페이지의 콘텐츠를 포함한 블록 이외의 블록으로 분류하는 단계를 포함하는 모바일 웹 콘텐츠 서비스 방법.And classifying the classified blocks of the webpage into blocks including content of the webpage and blocks other than blocks containing the content of the webpage using heuristic rules. 제8항에 있어서,The method of claim 8, 상기 요약하는 단계는,Summarizing the step, 상기 콘텐츠를 포함한 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하는 단계를 포함하는 모바일 웹 콘텐츠 서비스 방법.The mobile web content service method comprising the step of selecting a phrase having an important frequency or more in the block containing the content by using an N-gram method as an important phrase. 제8항에 있어서,The method of claim 8, 상기 요약하는 단계는,Summarizing the step, 상기 선택된 중요구문이 포함된 문장들 중 접속사를 포함한 문장들을 제거하여 콘텐츠를 포함한 블록을 요약하는 단계를 포함하는 모바일 웹 콘텐츠 서비스 방 법. The mobile web content service method comprising the step of summarizing the block containing the content by removing the sentences including the connection among the sentences containing the selected important phrases. 제8항에 있어서,The method of claim 8, 상기 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계는, The step of outputting the title of the block including the content containing the words of high similarity to the words of interest of the mobile device user on the screen of the mobile device, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 기저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 측정으로 측정하는 단계; 와Words included in the block including the content and words of interest of a mobile device user, which are previously stored, are expressed on a vector using a vector model, and the content of the word of interest is stored as a query of the vector model. Measuring similarity with the block by cosine measurement; Wow 상기 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계를 포함하는 모바일 웹 콘텐츠 서비스 방법.And outputting a title of a block including content having high similarity words to the screen of the mobile device by the cosine measurement. 모바일 웹 콘텐츠 서비스 방법에 있어서,In the mobile web content service method, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류하는 단계와, 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하는 단계와, 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하는 단계와, 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하는 단계와, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계를 포함하되,Classifying any web page requested from the mobile device into block units by using a visual web-based segmentation algorithm (VIPS), and the content of the web page among the classified web page blocks. Filtering and removing blocks other than the block including; and extracting a title of the content from the block including the content; selecting phrases having a frequency greater than or equal to a predetermined number of blocks including the content; Summarizing the block containing the content using sentences including the selected important phrase, comparing words included in the block including the content with interest words of the prestored mobile device user, and interest word of the mobile device user. Block containing content that contains words that are very similar to Sore throat comprising the step of: so that the output of the mobile device screen, 상기 블록 단위로 분류하는 단계는 모바일 디바이스의 화면에 블록 단위로 나누어진 웹콘텐츠에 출력하는 단계를 포함하고, 상기 필터링하여 제거하는 단계는 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록과 상기 웹페이지의 콘텐츠를 포함한 블록 이외의 블록으로 분류하는 단계를 포함하며, 상기 요약하는 단계는 콘텐츠를 포함한 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하는 단계를 포함하고, 상기 요약하는 단계는 선택된 중요구문이 포함된 문장들 중 접속사를 포함한 문장들을 제거하여 콘텐츠를 포함한 블록을 요약하는 단계를 포함하며,The classifying of the block unit may include outputting the web content divided into block units on the screen of the mobile device, and the filtering and removing may include removing the blocks of the classified web page using a heuristic rule. Classifying the block into blocks other than the block containing the content and the block including the content of the web page, and the summarizing step includes a phrase having a frequency equal to or greater than a predetermined number using a N-gram method. Including the step of selecting, and the step of summarizing includes the step of summarizing the block containing the content by removing the sentences including the conjunctions among the sentences containing the selected important phrases, 상기 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계는 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 기저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 측정으로 측정하는 단계와, 상기 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계를 포함하는 모바일 웹 콘텐츠 서비스 방법.The step of outputting the title of the block including the content containing the words with high similarity to the words of interest of the mobile device user on the screen of the mobile device may include the words included in the block including the content and the words of interest of the mobile device user. Expressing them on a vector using a vector model, measuring the similarity with the block including the content by cosine measurement using the pre-stored user's word of interest as the query of the vector model, and the similarity by the cosine measurement. Causing the title of the block containing the content containing the high words to be output on the screen of the mobile device.
KR1020060082696A 2006-08-30 2006-08-30 Mobile web content service system and method Expired - Fee Related KR100832859B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060082696A KR100832859B1 (en) 2006-08-30 2006-08-30 Mobile web content service system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060082696A KR100832859B1 (en) 2006-08-30 2006-08-30 Mobile web content service system and method

Publications (2)

Publication Number Publication Date
KR20080020011A KR20080020011A (en) 2008-03-05
KR100832859B1 true KR100832859B1 (en) 2008-05-28

Family

ID=39395105

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060082696A Expired - Fee Related KR100832859B1 (en) 2006-08-30 2006-08-30 Mobile web content service system and method

Country Status (1)

Country Link
KR (1) KR100832859B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101095069B1 (en) 2010-02-03 2011-12-20 고려대학교 산학협력단 Portable communication device and method for extracting user interest
KR101340588B1 (en) * 2012-02-29 2013-12-11 주식회사 팬택 Method and apparatus for comprising webpage
KR101409386B1 (en) * 2012-09-21 2014-06-20 한양대학교 에리카산학협력단 Apparatus and method for analyzing web page

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020072922A (en) * 2001-03-13 2002-09-19 (주)이너베이 Wireless internet service system using categorized service and the method thereof
KR20020079133A (en) * 2001-04-13 2002-10-19 (주)오픈베이스 Web content transcoding device
JP2003296358A (en) 2002-04-01 2003-10-17 Nec Corp Information distribution system, information distribution device and information distribution program
KR20040038458A (en) * 2002-11-01 2004-05-08 한국전자통신연구원 web contents transcoding system and method for small display devices
US20050028086A1 (en) 2001-06-08 2005-02-03 Nokia Mobile Phones, Ltd. Viewing Web Pages On Small Screen Devices Using A Keypad For Navigation
JP2005108004A (en) 2003-09-30 2005-04-21 Dowango:Kk Portable terminal, web browsing method for portable terminal, and web browsing program for portable terminal
KR20060045873A (en) * 2004-04-29 2006-05-17 마이크로소프트 코포레이션 Method and system for calculating importance of blocks in display pages

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020072922A (en) * 2001-03-13 2002-09-19 (주)이너베이 Wireless internet service system using categorized service and the method thereof
KR20020079133A (en) * 2001-04-13 2002-10-19 (주)오픈베이스 Web content transcoding device
US20050028086A1 (en) 2001-06-08 2005-02-03 Nokia Mobile Phones, Ltd. Viewing Web Pages On Small Screen Devices Using A Keypad For Navigation
JP2003296358A (en) 2002-04-01 2003-10-17 Nec Corp Information distribution system, information distribution device and information distribution program
KR20040038458A (en) * 2002-11-01 2004-05-08 한국전자통신연구원 web contents transcoding system and method for small display devices
JP2005108004A (en) 2003-09-30 2005-04-21 Dowango:Kk Portable terminal, web browsing method for portable terminal, and web browsing program for portable terminal
KR20060045873A (en) * 2004-04-29 2006-05-17 마이크로소프트 코포레이션 Method and system for calculating importance of blocks in display pages

Also Published As

Publication number Publication date
KR20080020011A (en) 2008-03-05

Similar Documents

Publication Publication Date Title
US11720572B2 (en) Method and system for content recommendation
US11762926B2 (en) Recommending web API&#39;s and associated endpoints
CN106383875B (en) Human-computer interaction method and device based on artificial intelligence
US8874590B2 (en) Apparatus and method for supporting keyword input
JP5257071B2 (en) Similarity calculation device and information retrieval device
US20180095946A1 (en) Intelligent system that dynamically improves its knowledge and code-base for natural language understanding
US20150033116A1 (en) Systems, Methods, and Media for Generating Structured Documents
US10860638B2 (en) System and method for interactive searching of transcripts and associated audio/visual/textual/other data files
US20160042230A1 (en) Processing of images during assessment of suitability of books for conversion to audio format
JP5587821B2 (en) Document topic extraction apparatus, method, and program
JP2021047817A (en) Output device and output program
JP2008234431A (en) Comment accumulation device, comment creation browsing device, comment browsing system, and program
US20100131534A1 (en) Information providing system
JP2011028747A (en) System and method for generating search term
CN115687572A (en) Data information retrieval method, device, equipment and storage medium
KR20150102817A (en) Method and device for generating educational contents map
KR100832859B1 (en) Mobile web content service system and method
JP2009223372A (en) Recommendation device, recommendation system, control method for recommendation device and control method for recommendation system
CN106406882A (en) Method and device for displaying post background in forum
JP2008226110A (en) Information processing apparatus, information processing method, and control program
JP2008262506A (en) Information extraction system, information extraction method, and information extraction program
WO2010103916A1 (en) Device for presentation of characteristic words in document and program giving priority of characteristic words
KR100897992B1 (en) Text-Image Conversion System and Method Using Natural Language Processing Technology
JP5688754B2 (en) Information retrieval apparatus and computer program
JP2007188427A (en) Topic image selection method, apparatus and program

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

FPAY Annual fee payment

Payment date: 20110419

Year of fee payment: 4

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20120522

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20120522

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000