KR100832859B1 - Mobile web content service system and method - Google Patents
Mobile web content service system and method Download PDFInfo
- Publication number
- KR100832859B1 KR100832859B1 KR1020060082696A KR20060082696A KR100832859B1 KR 100832859 B1 KR100832859 B1 KR 100832859B1 KR 1020060082696 A KR1020060082696 A KR 1020060082696A KR 20060082696 A KR20060082696 A KR 20060082696A KR 100832859 B1 KR100832859 B1 KR 100832859B1
- Authority
- KR
- South Korea
- Prior art keywords
- content
- block
- mobile device
- words
- blocks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
본 발명은 모바일 웹 콘텐츠 서비스 시스템 및 그 방법에 관한 것으로, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS)을 이용하여 블록 단위로 분류하고, 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하고, 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하고, 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하고, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 함으로써, 모바일 디바이스의 사용자에 의해 요청된 웹콘텐츠를 모바일 디바이스에 맞게 자동으로 변환하고, 사용자 관심정보를 이용한 학습을 통해 콘텐츠 목록의 우선순위를 사용자 개개인에게 맞게 변형된 형태로 제공할 수 있다.The present invention relates to a mobile web content service system and a method thereof, wherein any web page requested from a mobile device is classified in block units by using a visual web page segmentation technique (VIPS), and a block of the classified web page is provided. Among them, filters other than the block containing the content of the webpage, remove the block, extract the title of the content from the block containing the content, and phrases having a frequency greater than or equal to a predetermined number of blocks containing the content as important phrases. Selects, summarizes the block containing the content using sentences containing the selected important phrase, compares the words included in the block containing the content with the words of interest of the prestored mobile device user, and the word of interest of the mobile device user. Contains content that contains words that are very similar to By allowing the title of the block to be displayed on the screen of the mobile device, the web content requested by the user of the mobile device is automatically converted to fit the mobile device, and the priority of the content list is provided to the individual users by learning using user interest information. It may be provided in a form modified to suit.
모바일 디바이스, 웹 콘텐츠 서비스 Mobile device, web content service
Description
도 1은 본 발명에 따른 모바일 웹 콘텐츠 서비스 시스템에 대한 구성을 나타낸 도면.1 is a diagram showing a configuration of a mobile web content service system according to the present invention.
도 2는 도 1에 도시된 블록 분류부는 웹 콘텐츠의 블록을 분류하는 방법에 대한 흐름을 예시한 도면.FIG. 2 is a diagram illustrating a flow of a method of classifying blocks of web content in the block classifier shown in FIG. 1.
도 3은 도 1에 도시된 타이틀 추출부의 타이틀 추출에 대한 예시를 나타낸 도면.3 is a diagram illustrating an example of title extraction of a title extraction unit shown in FIG. 1;
도 4는 도 1에 도시된 요약부의 컨텐츠 블록에서 중요구문 추출에 대한 예시를 나타낸 도면.4 is a diagram illustrating an example of extracting important phrases from a content block of the summary unit illustrated in FIG. 1.
도 5는 도 1에 도시된 요약부의 중요구문의 요약 흐름에 대한 예시를 나타낸 도면.FIG. 5 is a diagram illustrating an example of a summary flow of important phrases of the summary unit illustrated in FIG. 1.
도 6은 도 1에 도시된 필터링부의 결과를 모바일 디바이스에 출력한 예를 나타낸 도면.6 is a diagram illustrating an example of outputting a result of the filtering unit illustrated in FIG. 1 to a mobile device;
도 7은 도 1에 도시된 요약부의 수행결과를 모바일 디바이스에 예시한 도면.FIG. 7 is a diagram illustrating a mobile device performing results of the summary unit illustrated in FIG. 1;
도 8은 도 1에 도시된 학습부의 학습과정에 대한 예시를 모바일 디바이스 화면에 나타낸 도면.8 is a diagram illustrating an example of a learning process of the learning unit illustrated in FIG. 1 on a mobile device screen;
본 발명은 모바일 웹 콘텐츠 서비스 시스템 및 그 방법에 관한 것으로, 더욱 자세하게는 웹콘텐츠를 모바일 디바이스에 맞게 자동으로 변환하고, 사용자 관심정보를 이용한 학습을 통해 콘텐츠 목록의 우선순위를 사용자 개개인에게 맞게 변형된 형태로 제공하는 모바일 웹 콘텐츠 서비스 시스템 및 그 방법에 관한 것이다.The present invention relates to a mobile web content service system and a method thereof, and more particularly, automatically converts web content to a mobile device, and modifies the priority of a content list to a user by learning using user interest information. The present invention relates to a mobile web content service system and a method thereof.
최근에는 인터넷과 더불어 휴대전화나 PDA(Personal Digital Assistants)와 같은 다양한 모바일 디바이스들이 널리 보급되고 있다. Recently, in addition to the Internet, various mobile devices such as mobile phones and PDAs (Personal Digital Assistants) are widely used.
더불어 모바일 디바이스 사용자들은 PC에서 제공받았던 풍부하고 다양한 콘텐츠를 모바일 장치에서도 볼 수 있기를 원한다. 하지만, 모바일 디바이스마다 서로 다른 성능과 사용자 선호도 및 네트워크 대역폭 때문에 서비스는 제한되고 있다. In addition, mobile device users want to see the rich variety of content available on their PCs on mobile devices. However, services are limited because of different performance, user preferences and network bandwidth for each mobile device.
더욱이 모바일 디바이스는 화면 크기가 제한되어 있으며, 다양한 콘텐츠를 서비스하기 위한 모듈이 제공되고 있지 않다. 이는 모바일 디바이스는 경량화에 그 목적이 있기 때문에 이와 같은 부수적인 기능을 제거하고 있다. 따라서 일반 PC에서 폭넓게 사용하고 있는 웹 정보를 모바일 사용자가 불편 없이 서비스받기 위해서 콘텐츠 적응화(Adaptation)라는 과정이 필요하게 된다.Moreover, the mobile device has a limited screen size, and no module for providing various contents is provided. This eliminates this ancillary feature as mobile devices are designed to be lightweight. Therefore, a process called content adaptation is required for mobile users to receive web services widely used in general PCs without inconvenience.
웹에서 제공되는 콘텐츠는 대부분 모바일 장치에서 바로 볼 수 없다. 이는 웹 콘텐츠가 모바일 디바이스에 표현되기에는 큰 내용의 데이터 크기를 가지거나, 표현할 수 없는 형식 또는 소리파일, 플래시와 같은 멀티미디어 정보 등의 다양한 형태의 콘텐츠를 담고 있기 때문이다. Most content available on the web is not immediately available on mobile devices. This is because the web content has a large data size, or contains various types of content such as a format or sound file or multimedia information such as flash that cannot be represented on the mobile device.
따라서, 다양한 콘텐츠를 모바일 디바이스에서 출력되도록 변환방법이 이슈화되고 있다. Therefore, a method of converting various contents to be output on a mobile device has been issued.
그런데, 모바일 디바이스의 사용자가 웹서버에 접속하여 웹콘텐츠를 선택한 경우, 웹 서버에서 작성된 모바일 전용 페이지의 콘텐츠가 사용자의 모바일 디바이스에 제공되고 있다. However, when a user of a mobile device accesses a web server and selects web content, content of a mobile-only page created in the web server is provided to the user's mobile device.
이는 모바일 디바이스의 사용자가 관심이 있는 정보를 모바일 디바이스의 목록에서 우선적으로 제공되기를 원하는 것과는 상반되는 결과를 가져오는 문제점을 발생한다.This results in a problem that results in the opposite of what the user of the mobile device wants to preferentially provide information of interest in the list of mobile devices.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로, 모바일 디바이스의 사용자에 의해 요청된 웹콘텐츠를 모바일 디바이스에 맞게 자동으로 변환하고, 사용자 관심정보를 이용한 학습을 통해 콘텐츠 목록의 우선순위를 사용자 개개인에게 맞게 변형된 형태로 제공하는 모바일 웹 콘텐츠 서비스 시스템 및 그 방법을 제공함에 그 목적이 있다.Therefore, the present invention was devised to solve the above problems, and automatically converts web content requested by the user of the mobile device to the mobile device, and prioritizes the content list through learning using user interest information. The purpose of the present invention is to provide a mobile web content service system and a method for providing a modified form to a user.
상기 목적을 달성하기 위한 본 발명의 일 측면에 따른 모바일 웹 콘텐츠 서비스 시스템은, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류하는 블록 분류부; 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하는 필터링부; 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하는 타이틀 추출부; 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하는 요약부; 및 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 학습부를 포함한다.Mobile web content service system according to an aspect of the present invention for achieving the above object, block any web page requested from the mobile device using a visual web page segmentation technique (VIPS, Vision-based Page Segmentation Algorithm) A block classification unit classified into units; A filtering unit for filtering and removing blocks other than the block including the contents of the web page among the classified web page blocks; A title extraction unit which extracts a title of the content from the block including the content; A summary unit for selecting phrases having a frequency greater than or equal to a predetermined number in the block including the content as a critical phrase, and summarizing the block including the content using the sentences including the selected important phrase; And comparing the words included in the block including the content with the words of interest of the mobile device user previously stored, and the title of the block including the content including words having high similarity to the words of interest of the mobile device user is displayed on the screen of the mobile device. It includes a learning unit to be output.
상기 블록 분류부는, 상기 모바일 디바이스의 화면에 블록 단위로 나누어진 웹콘텐츠에 출력한다.The block classification unit outputs the web content divided into blocks on the screen of the mobile device.
상기 필터링부는, 상기 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록과 상기 웹페이지의 콘텐츠를 포함한 블록 이외의 블록으로 분류한다.The filtering unit classifies the classified blocks of the webpage into blocks other than blocks including the content of the webpage and blocks including the content of the webpage using a heuristic rule.
상기 요약부는, 상기 콘텐츠를 포함한 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택한다.The summary unit selects, as an important phrase, a phrase having a frequency greater than or equal to a set number using a N-gram method in a block including the content.
상기 요약부는, 상기 선택된 중요구문이 포함된 문장들 중 접속사를 포함한 문장들을 제거하여 콘텐츠를 포함한 블록을 요약한다.The summary unit summarizes a block including content by removing sentences including a conjunction from among sentences containing the selected important phrase.
상기 학습부는, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 기저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 측정으로 측정하고, 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면 상단에 출력되도록 한다.The learning unit may express words included in a block including the content and words of interest of a mobile device user previously stored on a vector using a vector model, and the words of interest of the user stored as the query of the vector model. The similarity with the block including the content is measured by cosine measurement, and the title of the block including the content containing the high similarity word is output on the top of the screen of the mobile device by the cosine measurement.
상기 목적을 달성하기 위한 본 발명의 일 측면에 따른 모바일 웹 콘텐츠 서비스 방법은, 모바일 디바이스로부터 요청된 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류하는 단계; 상기 분류된 웹페이지의 블록들 중 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거하는 단계; 상기 콘텐츠를 포함한 블록에서 콘텐츠의 타이틀(title)을 추출하는 단계; 상기 콘텐츠를 포함한 블록에서 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들을 이용하여 콘텐츠를 포함한 블록을 요약하는 단계; 및 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 비교하고, 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계를 포함한다.The mobile web content service method according to an aspect of the present invention for achieving the above object, block any web page requested from the mobile device using a visual web page segmentation technique (VIPS, Vision-based Page Segmentation Algorithm) Classifying the unit; Filtering and removing blocks other than the block including the content of the webpage from among the classified webpage blocks; Extracting a title of the content from the block including the content; Selecting phrases having a frequency greater than or equal to a predetermined number in the block including the contents as important phrases, and summarizing the blocks containing the content using sentences including the selected important phrases; And comparing the words included in the block including the content with the words of interest of the mobile device user previously stored, and the title of the block including the content including words having high similarity to the words of interest of the mobile device user is displayed on the screen of the mobile device. Causing the output to occur.
상기 블록 단위로 분류하는 단계는, 상기 모바일 디바이스의 화면에 블록 단위로 나누어진 웹콘텐츠에 출력하는 단계를 포함한다.The classifying in block units may include outputting web content divided in block units on a screen of the mobile device.
상기 필터링하여 제거하는 단계는, 상기 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록과 상기 웹페이지의 콘텐츠를 포함한 블록 이외의 블록으로 분류하는 단계를 포함한다.The filtering and removing may include classifying the classified blocks of the webpage into blocks other than the blocks including the contents of the webpage and the blocks including the contents of the webpage using a heuristic rule.
상기 요약하는 단계는, 상기 콘텐츠를 포함한 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하는 단계를 포함한다.The summarizing may include selecting, as an important phrase, a phrase having a frequency greater than or equal to a set number using an N-gram method in a block including the content.
상기 요약하는 단계는, 상기 선택된 중요구문이 포함된 문장들 중 접속사를 포함한 문장들을 제거하여 콘텐츠를 포함한 블록을 요약하는 단계를 포함한다.The summarizing may include summarizing a block including content by removing sentences including conjunctions among sentences including the selected important phrase.
상기 모바일 디바이스 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계는, 상기 콘텐츠를 포함한 블록에 포함된 단어들과 기 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 기저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 측정으로 측정하는 단계; 와 상기 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 하는 단계를 포함한다.The step of outputting a title of a block including content including words with high similarity to words of interest of the mobile device user on the screen of the mobile device may include: words included in the block including the content; Expressing words of interest on a vector using a vector model, and measuring similarity with a block including the content by cosine measurement using the pre-stored user's word of interest as a query of the vector model; And outputting a title of a block including content having high similarity words to the screen of the mobile device through the cosine measurement.
이하 본 발명에 따른 모바일 웹 콘텐츠 서비스 시스템 및 그 방법을 첨부한 도면을 참조하여 상세히 설명한다.Hereinafter, a mobile web content service system and a method thereof according to the present invention will be described in detail with reference to the accompanying drawings.
또한, 이해의 편의를 위하여 비록 다른 도면에 속하더라도 동일한 구성요소에는 동일한 부호를 부여하였음을 주의하여야 한다.In addition, it should be noted that the same reference numerals are given to the same elements, although belonging to different drawings for convenience of understanding.
도 1은 본 발명에 따른 모바일 웹 콘텐츠 서비스 시스템에 대한 구성을 나타낸 도면이다.1 is a diagram showing the configuration of a mobile web content service system according to the present invention.
도 1에 도시된 바와 같이, 본 발명에 따른 웹 콘텐츠 서비스 시스템은, 모바일 디바이스(10)와 적응화 서버(20)로 구성된다.As shown in FIG. 1, the web content service system according to the present invention comprises a
적응화 서버(20)는 블록 분류부(21), 필터링부(22), 타이틀 추출부(23), 요약부(24), 학습부(25) 및 데이터베이스(26)를 포함한다.The
블록 분류부(21)는 모바일 디바이스(10)의 사용자가 요청한 임의의 웹페이지를 시각적인 웹 페이지 세그멘테이션 기법(VIPS, Vision-based Page Segmentation Algorithm)을 이용하여 블록 단위로 분류한다. The
블록 분류부(21)은 블록 단위로 분류된 웹 페이지를 모바일 디바이스(10)의 화면에 출력할 수 있다.The
필터링부(22)는 분류된 웹페이지의 블록들을 휴리스틱 규칙을 이용하여 웹페이지의 콘텐츠를 포함한 블록 이외의 블록을 필터링하여 제거한다. 이때, 웹페이지의 콘텐츠를 포함한 블록 이외의 블록에는 광고 등의 내용을 포함한 블록 등이 해당될 수 있다. The
타이틀 추출부(23)는 콘텐츠 블록에서 콘텐츠의 타이틀(title)을 추출한다.The title extractor 23 extracts a title of the content from the content block.
요약부(24)는 콘텐츠 블록에서 N-gram 방법을 이용하여 빈도 수가 설정된 수 이상인 구를 중요구문으로 선택하고, 선택된 중요구문이 포함된 문장들 중 접속사로 시작되는 문장을 제외하여 콘텐츠 블록의 내용을 요약한다.The
학습부(25)는 콘텐츠 블록에 포함된 단어들과 데이터베이스(26)에 저장된 모 바일 디바이스(10) 사용자의 관심 단어들을 비교하고, 모바일 디바이스(10) 사용자의 관심 단어들과 유사도가 높은 단어들을 포함한 콘텐츠 블록의 제목이 모바일 디바이스(10)의 화면 상단에 출력되도록 한다.The
좀 더 구체적으로, 학습부(25)는 상기 콘텐츠를 포함한 블록에 포함된 단어들과 데이터베이스(26)에 저장된 모바일 디바이스 사용자의 관심 단어들을 벡터모델을 이용하여 벡터 상에 표현하고, 상기 데이터베이스(26)에 저장된 사용자의 관심단어를 상기 벡터모델의 질의로 하여 상기 콘텐츠를 포함한 블록과의 유사도를 코사인 값으로 측정하고, 코사인 측정으로 유사도가 높은 단어들을 포함한 콘텐츠를 포함한 블록의 제목이 모바일 디바이스의 화면에 출력되도록 한다.More specifically, the
도 2는 도 1에 도시된 블록 분류부는 웹 콘텐츠의 블록을 분류하는 방법에 대한 흐름을 예시한 도면이다.FIG. 2 is a diagram illustrating a flow of a method of classifying blocks of web content in the block classification unit illustrated in FIG. 1.
도 2에 도시된 바와 같이, 블록 분류부는 사용자가 요청한 임의의 웹 페이지를 웹 페이지 세그멘테이션 기법(VIPS)을 통하여 분류된 블록의 내용이 웹 페이지 크기의 설정된 크기 이상이면 콘텐츠를 포함한 블록으로 판단한다(S20).As illustrated in FIG. 2, the block classifier determines that any web page requested by the user is a block including content if the content of the classified block through the web page segmentation technique (VIPS) is equal to or larger than the set size of the web page size (see FIG. 2). S20).
블록 분류부는 콘텐츠를 포함한 블록에 링크가 포함되어 있는가를 검사한다(S21).The block classification unit checks whether a link is included in the block including the content (S21).
블록 분류부는 콘텐츠를 포함한 블록에 링크가 포함되어 있으면, 포함된 링크에 다른 도메인 네임이 있는가를 검사한다(S22).If the block classification unit includes a link in the block including the content, the block classification unit checks whether there is another domain name in the included link (S22).
블록 분류부는 포함된 링크에 다른 도메인 네임이 있으면, 해당 블록을 삭제한다(S23).If there is another domain name in the included link, the block classification unit deletes the block (S23).
블록 분류부는 단계 S22에서 포함된 링크에 다른 도메인 네임이 없으면, 포함된 링크가 콘텐츠를 포함한 블록의 절반 이상인가를 검사한다(S24).If there is no other domain name in the link included in step S22, the block classification unit checks whether the included link is at least half of the block including the content (S24).
블록 분류부는 포함된 링크 안의 텍스트가 콘텐츠를 포함한 블록의 절반 이상을 차지하면, 평균 링크 안 텍스트 길이가 설정된 길이(예로, "10") 이상인가를 검사한다(S25).If the text in the included link occupies more than half of the block including the content, the block classification unit checks whether the average length of the text in the link is greater than or equal to a set length (eg, "10") (S25).
블록 분류부는 포함된 링크가 평균 링크 길이가 설정된 길이 이상이면, 해당 블록을 네비게이션 리스트 블록으로 판단한다(S26).If the included link is at least the length of the average link length is set, the block classification unit determines that the block as a navigation list block (S26).
이때, 네비게이션 리스트 블록은 내용을 포함하고 있는 링크들이 존재하는 블록을 나타낸다.In this case, the navigation list block represents a block in which links including content exist.
반면, 블록 분류부는 단계 S25에서 포함된 링크가 콘텐츠를 포함한 블록의 절반 이하이면, 해당 블록을 네비게이션 바 블록으로 판단한다(S27).On the other hand, if the link included in step S25 is less than half of the block including the content, the block classification unit determines that the block as a navigation bar block (S27).
이때, 네비게이션 바 블록은 메뉴를 가진 블록을 나타낸다.At this time, the navigation bar block represents a block having a menu.
한편, 블록 분류부는 단계 S21에서 콘텐츠를 포함한 블록에 링크가 포함되어 있지 않으면, 콘텐츠를 포함한 블록에 포함된 단어 수가 설정된 단어 수(100) 이상인가를 검사한다(S29).On the other hand, if the link is not included in the block including the content in step S21, the block classification unit checks whether the number of words included in the block including the content is equal to or greater than the set number of words 100 (S29).
블록 분류부는 콘텐츠를 포함한 블록에 포함된 단어 수가 설정된 단어 수 이상이면, 콘텐츠를 포함한 블록을 콘텐츠 블록으로 판단한다(S30).If the number of words included in the block including the content is greater than or equal to the set word number, the block classification unit determines the block including the content as the content block (S30).
이때, 콘텐츠 블록은 콘텐츠 포함한 블록이 내용을 포함한 블록임을 나타낸다. In this case, the content block indicates that the block including the content is a block including the content.
반면, 블록 분류부는 콘텐츠를 포함한 블록에 포함된 단어 수가 설정된 단어 수 이하이면, 해당 블록을 삭제한다(S31).On the other hand, if the number of words included in the block including the content is less than the set number of words, the block classification unit deletes the block (S31).
도 3은 도 1에 도시된 타이틀 추출부의 타이틀 추출에 대한 예시를 나타낸 도면이다.FIG. 3 is a diagram illustrating an example of title extraction of the title extraction unit shown in FIG. 1.
도 3에 도시된 바와 같이, 타이틀 추출부는 도 1에 도시된 필터링부(24)에서 필터링된 컨텐츠 블록에서 타이틀을 추출하기 위해서 웹페이지를 구성하고 있는 태그들 중 <title> 태그(35), <meta name="title">태그(36), <HI>태그(37)에서 중복되는 내용을 타이틀로 선택한다.As shown in FIG. 3, the title extracting unit includes <title> tags 35 and <of tags constituting a web page to extract titles from the content block filtered by the
도 4는 도 1에 도시된 요약부의 컨텐츠 블록에서 중요구문 추출에 대한 예시를 나타낸 도면이다.4 is a diagram illustrating an example of extracting an important phrase from a content block of the summary unit illustrated in FIG. 1.
도 4에 도시된 바와 같이, 요약부는 도 1에 도시된 필터링부(22)에서 출력된 콘텐츠 블록의 내용을 N-gram 방법을 통하여 요약한다.As shown in FIG. 4, the summary unit summarizes the content of the content block output from the
다시 말해서, 요약부는 콘텐츠 블록에 포함된 토큰(예, 단어)들을 결합하여 구를 생성하고, 생성된 구가 설정된 회수 이상 존재하면 생성된 구를 다른 토큰과 결합하여 새로운 구를 생성한다. In other words, the summary unit generates a phrase by combining tokens (eg, words) included in the content block, and generates a new phrase by combining the generated phrase with another token when the generated phrase exists over a set number of times.
이에 대해서 구체적으로 살펴보기로 한다.This will be described in detail.
요약부는 웹페이지(40)에 포함된 단어들(41, 42, 43)에 대해서 단어(41)와 단어(42)를 결합하여 구를 생성하고, 단어(41)와 단어(42)에 의해 생성된 구가 웹페이지(40)에 설정된 회수 이상 존재하면 해당 구를 단어(43)와 결합하여 새로운 구를 생성한다. 만약, 단어(41)와 단어(42)에 의해 생성된 구가 웹페이지(40)에 설정된 회수 이하로 존재하면 단어(42)와 단어(43)를 결합하여 구를 생성하고, 단 어(42)와 단어(43)에 의해 생성된 구가 설정된 회수 이상 존재하는가를 검사한다.The summary unit combines the
이러한 과정을 통해서 요약부는 웹페이지(40)에서 중요구문을 추출하게 되는 것이다.Through this process, the summary unit extracts important phrases from the
도 5는 도 1에 도시된 요약부의 중요구문의 요약 흐름에 대한 예시를 나타낸 도면이다.FIG. 5 is a diagram illustrating an example of a summary flow of important phrases of the summary unit illustrated in FIG. 1.
도 5에 도시된 바와 같이, 요약부는 콘텐츠 블록(51)에서 도 4에 도시된 바와 같이 중요구문추출을 통하여 얻어진 중요구문들(50)이 존재하는 절(paragraph)을 추출하여 요약 후보(summary candidate)(52)를 획득한다. As shown in FIG. 5, the summary unit extracts a paragraph in which the
요약부는 획득된 요약 후보(52) 중 접속사로 시작되는 절을 제외하는 예외 처리(53)과정을 통해 콘텐츠 블록에 대한 요약(54)을 획득하게 되는 것이다. The summary unit obtains the
도 6은 도 1에 도시된 필터링부의 결과를 모바일 디바이스에 출력한 예를 나타낸 도면이다.FIG. 6 is a diagram illustrating an example of outputting a result of the filtering unit illustrated in FIG. 1 to a mobile device.
모바일 디바이스에서 네비게이션 바 블록(60)은 MENU로 나타나고, 네비게이션 리스트 블록(62)은 모바일 디바이스에 초기에 출력되는 경우에 모바일 사용자의 관심단어 정보를 수집하지 않은 상태이므로 웹페이지에서의 링크 정보들 중 상위에 나타난 링크의 제목을 출력한다. 모바일 사용자의 관심단어 정보가 존재한다면 링크들 중 모바일 사용자가 관심을 가지는 내용의 링크 제목이 모바일 디바이스(10)에 출력된다. 한편, 모바일 디바이스(10)에 출력되는 네비게이션 리스트 블록의 괄호는 네비게이션 리스트 블록 내 링크들의 개수를 나타낸다. In the mobile device, the
마지막으로 콘텐츠 블록(61)은 모바일 디바이스(10)의 화면에 "2.NASA Glenn"으로 디스플레이되고 있음을 알 수 있다. Finally, it can be seen that the
도 7은 도 1에 도시된 요약부의 수행결과에 대한 예시를 나타낸 도면이다. FIG. 7 is a diagram illustrating an example of an execution result of the summary unit illustrated in FIG. 1.
도 7에 도시된 바와 같이, 내용을 가진 콘텐츠 블록(70)에 대한 타이틀(71)이 모바일 디바이스 화면에 디스플레이된다.As shown in FIG. 7, a
이렇게 모바일 디바이스 화면에 디스플레이된 콘텐츠 블록(70)에 대한 타이틀(71)이 선택되면, 해당 타이틀(71)에 대한 요약(72)이 모바일 디바이스 화면에 디스플레이된다.When the
타이틀(71)에 대한 요약(72)이 디스플레이된 모바일 디바이스 화면에서 Full Story의 선택이 있으면, 타이틀(71)에 대한 원문(73)이 모바일 디바이스 화면에 디스플레이된다.If there is a selection of Full Story in the mobile device screen on which the
이렇게 함으로써, 모바일 디바이스 화면 사이즈에 맞게 나눠진 원문(71)을 사용자가 볼 수 있게 되는 것이다.By doing so, the user can see the
도 8은 도 1에 도시된 학습부의 학습과정에 대한 예시를 모바일 디바이스 화면에 나타낸 도면이다. FIG. 8 is a diagram illustrating an example of a learning process of the learning unit illustrated in FIG. 1 on a screen of a mobile device.
모바일 디바이스의 화면(80)에 디스플레이된 세번째 네비게이션 리스트 블록의 선택이 있은 후, 링크들 중 "Afghan"에 관한 내용을 선택하여 원문까지 보게 되면, 사용자의 관심단어에 "Afghan"이라는 단어가 저장된다. 학습부는 사용자가 "Afghan"에 대해 관심이 있다고 인식하고 그에 관한 내용을 목록의 상위에 위치시킨다.After the selection of the third navigation list block displayed on the
세번째 모바일 디바이스에서 첫번째 모바일 디바이스의 화면(82)에서 두번째 와 세번째의 순서가 변경되었음을 알 수 있다.In the third mobile device, it can be seen that the order of the second and third has been changed on the
상술한 바와 같이, 본 발명에 따른 모바일 웹 콘텐츠 웹 서비스 시스템 및 그 방법에 따르면, 모바일 디바이스의 사용자에 의해 요청된 웹콘텐츠를 모바일 디바이스에 맞게 자동으로 변환하고, 사용자 관심정보를 이용한 학습을 통해 콘텐츠 목록의 우선순위를 사용자 개개인에게 맞게 변형된 형태로 제공할 수 있다.As described above, according to the mobile web content web service system and method thereof according to the present invention, the web content requested by the user of the mobile device is automatically converted to fit the mobile device, the content by learning using the user interest information The priority of the list can be provided in a form customized for each user.
Claims (14)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060082696A KR100832859B1 (en) | 2006-08-30 | 2006-08-30 | Mobile web content service system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060082696A KR100832859B1 (en) | 2006-08-30 | 2006-08-30 | Mobile web content service system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080020011A KR20080020011A (en) | 2008-03-05 |
KR100832859B1 true KR100832859B1 (en) | 2008-05-28 |
Family
ID=39395105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060082696A Expired - Fee Related KR100832859B1 (en) | 2006-08-30 | 2006-08-30 | Mobile web content service system and method |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100832859B1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101095069B1 (en) | 2010-02-03 | 2011-12-20 | 고려대학교 산학협력단 | Portable communication device and method for extracting user interest |
KR101340588B1 (en) * | 2012-02-29 | 2013-12-11 | 주식회사 팬택 | Method and apparatus for comprising webpage |
KR101409386B1 (en) * | 2012-09-21 | 2014-06-20 | 한양대학교 에리카산학협력단 | Apparatus and method for analyzing web page |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020072922A (en) * | 2001-03-13 | 2002-09-19 | (주)이너베이 | Wireless internet service system using categorized service and the method thereof |
KR20020079133A (en) * | 2001-04-13 | 2002-10-19 | (주)오픈베이스 | Web content transcoding device |
JP2003296358A (en) | 2002-04-01 | 2003-10-17 | Nec Corp | Information distribution system, information distribution device and information distribution program |
KR20040038458A (en) * | 2002-11-01 | 2004-05-08 | 한국전자통신연구원 | web contents transcoding system and method for small display devices |
US20050028086A1 (en) | 2001-06-08 | 2005-02-03 | Nokia Mobile Phones, Ltd. | Viewing Web Pages On Small Screen Devices Using A Keypad For Navigation |
JP2005108004A (en) | 2003-09-30 | 2005-04-21 | Dowango:Kk | Portable terminal, web browsing method for portable terminal, and web browsing program for portable terminal |
KR20060045873A (en) * | 2004-04-29 | 2006-05-17 | 마이크로소프트 코포레이션 | Method and system for calculating importance of blocks in display pages |
-
2006
- 2006-08-30 KR KR1020060082696A patent/KR100832859B1/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020072922A (en) * | 2001-03-13 | 2002-09-19 | (주)이너베이 | Wireless internet service system using categorized service and the method thereof |
KR20020079133A (en) * | 2001-04-13 | 2002-10-19 | (주)오픈베이스 | Web content transcoding device |
US20050028086A1 (en) | 2001-06-08 | 2005-02-03 | Nokia Mobile Phones, Ltd. | Viewing Web Pages On Small Screen Devices Using A Keypad For Navigation |
JP2003296358A (en) | 2002-04-01 | 2003-10-17 | Nec Corp | Information distribution system, information distribution device and information distribution program |
KR20040038458A (en) * | 2002-11-01 | 2004-05-08 | 한국전자통신연구원 | web contents transcoding system and method for small display devices |
JP2005108004A (en) | 2003-09-30 | 2005-04-21 | Dowango:Kk | Portable terminal, web browsing method for portable terminal, and web browsing program for portable terminal |
KR20060045873A (en) * | 2004-04-29 | 2006-05-17 | 마이크로소프트 코포레이션 | Method and system for calculating importance of blocks in display pages |
Also Published As
Publication number | Publication date |
---|---|
KR20080020011A (en) | 2008-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11720572B2 (en) | Method and system for content recommendation | |
US11762926B2 (en) | Recommending web API's and associated endpoints | |
CN106383875B (en) | Human-computer interaction method and device based on artificial intelligence | |
US8874590B2 (en) | Apparatus and method for supporting keyword input | |
JP5257071B2 (en) | Similarity calculation device and information retrieval device | |
US20180095946A1 (en) | Intelligent system that dynamically improves its knowledge and code-base for natural language understanding | |
US20150033116A1 (en) | Systems, Methods, and Media for Generating Structured Documents | |
US10860638B2 (en) | System and method for interactive searching of transcripts and associated audio/visual/textual/other data files | |
US20160042230A1 (en) | Processing of images during assessment of suitability of books for conversion to audio format | |
JP5587821B2 (en) | Document topic extraction apparatus, method, and program | |
JP2021047817A (en) | Output device and output program | |
JP2008234431A (en) | Comment accumulation device, comment creation browsing device, comment browsing system, and program | |
US20100131534A1 (en) | Information providing system | |
JP2011028747A (en) | System and method for generating search term | |
CN115687572A (en) | Data information retrieval method, device, equipment and storage medium | |
KR20150102817A (en) | Method and device for generating educational contents map | |
KR100832859B1 (en) | Mobile web content service system and method | |
JP2009223372A (en) | Recommendation device, recommendation system, control method for recommendation device and control method for recommendation system | |
CN106406882A (en) | Method and device for displaying post background in forum | |
JP2008226110A (en) | Information processing apparatus, information processing method, and control program | |
JP2008262506A (en) | Information extraction system, information extraction method, and information extraction program | |
WO2010103916A1 (en) | Device for presentation of characteristic words in document and program giving priority of characteristic words | |
KR100897992B1 (en) | Text-Image Conversion System and Method Using Natural Language Processing Technology | |
JP5688754B2 (en) | Information retrieval apparatus and computer program | |
JP2007188427A (en) | Topic image selection method, apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
FPAY | Annual fee payment |
Payment date: 20110419 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20120522 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20120522 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |