KR102818562B1 - Taxonomy of Webpage Layouts for AI Analysis, Classification System of Webpage Layouts for AI Analysis And Classification Method of Webpage Layouts by the Same - Google Patents
Taxonomy of Webpage Layouts for AI Analysis, Classification System of Webpage Layouts for AI Analysis And Classification Method of Webpage Layouts by the Same Download PDFInfo
- Publication number
- KR102818562B1 KR102818562B1 KR1020240092713A KR20240092713A KR102818562B1 KR 102818562 B1 KR102818562 B1 KR 102818562B1 KR 1020240092713 A KR1020240092713 A KR 1020240092713A KR 20240092713 A KR20240092713 A KR 20240092713A KR 102818562 B1 KR102818562 B1 KR 102818562B1
- Authority
- KR
- South Korea
- Prior art keywords
- section
- classified
- block
- image
- layout
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 기존 정리된 태그로 분류가 모호하여 결과가 명확하지 않은 블록들에 대한 태그를 추가로 지정하고, 타이틀과 여백 등 요소에 대한 학습을 병행하고, 태그의 수를 41개로 늘려 디테일한 형태의 블록을 규격화할 수 있게 하여, 헤더, 푸터, 배너, 2단블록, 3단블록, 4단블록, 5단블록, 단블록, 갤러리, 신규 중 하나로 분류하고, 다시 41개의 태그로 분류하는 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계, 분류 시스템 및 이에 의한 웹페이지 레이아웃 분류 방법을 개시한다.The present invention additionally designates tags for blocks whose classification by existing organized tags is ambiguous and the results are unclear, conducts learning on elements such as titles and margins in parallel, and increases the number of tags to 41 so as to enable standardization of detailed blocks, thereby classifying them as one of header, footer, banner, two-column block, three-column block, four-column block, five-column block, single block, gallery, and new, and further classifies them by 41 tags, a classification system and a webpage layout classification method using the same for artificial intelligence analysis.
Description
본 발명은 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계, 분류 시스템 및 이에 의한 웹페이지 레이아웃 분류 방법에 관한 것으로, 보다 상세하게는 기존 정리된 태그로 분류가 모호하여 결과가 명확하지 않은 블록들에 대한 태그를 추가로 지정하고, 타이틀과 여백 등 요소에 대한 학습을 병행하고, 태그의 수를 41개로 늘려 디테일한 형태의 블록을 규격화할 수 있게 하여, 헤더, 푸터, 배너, 2단블록, 3단블록, 4단블록, 5단블록, 단블록, 갤러리, 신규 중 하나로 분류하고, 다시 41개의 태그로 분류하는 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계, 분류 시스템 및 이에 의한 웹페이지 레이아웃 분류 방법에 관한 것이다.The present invention relates to a classification system for web page layout for artificial intelligence analysis, a classification system, and a web page layout classification method using the same, and more specifically, to a classification system for web page layout for artificial intelligence analysis, a classification system, and a web page layout classification method using the same, which additionally designates tags for blocks whose classification by existing organized tags is ambiguous and the results are unclear, conducts learning on elements such as titles and margins in parallel, and increases the number of tags to 41 so as to enable standardization of detailed blocks, thereby classifying them as one of header, footer, banner, two-column block, three-column block, four-column block, five-column block, single block, gallery, and new, and then classifies them again by 41 tags.
레이아웃(Layout)이란 웹사이트에서 정보를 쉽고 빠르게 볼 수 있게 할 뿐만 아니라 내용의 이해를 더 쉽고 명확하게 제공하기 위한 웹사이트 구성요소다. 웹페이지를 구성하는 단락의 분류 체계를 수립하기 위해서는 웹사이트 레이아웃에 대해 알아야 한다. 웹사이트는 크게 헤더(Header), 바디(Body), 푸터(Footer) 3가지 단락으로 분류가 가능하다. 이 3가지 중 헤더와 푸터는 대부분의 사이트에 존재하며, 메뉴, 필수 기능 배열이 존재하는 등 공통된 특징이 많이 존재하기 때문에 인공지능을 학습시키는데 매우 용이하다. 하지만, 바디 영역은 콘텐츠가 다수 포함되어 있고 각 사이트 특징마다 콘텐츠가 매우 다양하게 달라질 수 있는 요소이기 때문에 바디 영역에서도 단락별로 분리가 필요하다. Layout is a website component that not only makes it easy and fast to view information on a website, but also provides an easier and clearer understanding of the content. In order to establish a classification system for the paragraphs that make up a web page, you need to know about the website layout. A website can be broadly classified into three paragraphs: header, body, and footer. Among these three, the header and footer exist on most sites, and since they have many common features such as the existence of menus and arrangement of essential functions, they are very easy to train artificial intelligence. However, since the body area contains a lot of content and the content can vary greatly depending on the characteristics of each site, it is necessary to separate the body area by paragraph.
종래의 기술에 의한 인공지능의 웹페이지 레이아웃 도출 방식은 학습태그 12개 추출 후 태그를 분석하여 결과를 내는 방식을 사용하고 있다. 학습량 부족도 결과에 영향을 미치지만 현재의 학습은 태그수가 부족하기 때문에 생기는 블록들의 편입이 데이터 분류 과정에서의 오류를 발생시키는 원인이 되고 있다. 이러한 문제 해결을 위해 인공지능을 활용해 웹페이지 구성요소를 식별하고 분석하기 위한 일련의 분류 체계 필요한 실정이다.The conventional method of deriving web page layouts using artificial intelligence uses a method of extracting 12 learning tags and then analyzing the tags to produce results. The lack of learning volume also affects the results, but the current learning has a lack of tags, so the inclusion of blocks causes errors in the data classification process. In order to solve this problem, a series of classification systems are needed to identify and analyze web page components using artificial intelligence.
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로, 기존 정리된 태그로 분류가 모호하여 결과가 명확하지 않은 블록들에 대한 태그를 추가로 지정하고, 타이틀과 여백 등 요소에 대한 학습을 병행하고, 태그의 수를 41개로 늘려 디테일한 형태의 블록을 규격화할 수 있게 하여, 헤더, 푸터, 배너, 2단블록, 3단블록, 4단블록, 5단블록, 단블록, 갤러리, 신규 중 하나로 분류하고, 새로운 레이아웃 체계가 나오면 H,V 형태에 따라서 추가적으로 태그를 확장할 수 있는 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계, 분류 시스템 및 이에 의한 웹페이지 레이아웃 분류 방법을 제공하는 것을 목적으로 한다.The present invention is to solve the above problems, and it additionally designates tags for blocks whose classification is ambiguous with existing organized tags and thus the results are unclear, conducts learning on elements such as titles and margins in parallel, and increases the number of tags to 41 so as to enable standardization of detailed blocks, thereby classifying them as one of header, footer, banner, two-column block, three-column block, four-column block, five-column block, single block, gallery, and new, and provides a classification system for web page layout for artificial intelligence analysis, a classification system, and a web page layout classification method using the same, which can additionally expand tags according to the H and V forms when a new layout system is released.
상기한 목적을 달성하기 위한 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계 모듈은, 웹페이지의 가장 상단에 위치하며, 로고와 메뉴가 포함되는 헤더부; 웹페이지의 가장 하단에 위치하며, 사이트 정보, 개인정보보호와 관련된 링크가 포함되는 푸터부; 상기 헤더부 및 푸터부 사이에 위치하며, 광고성 메시지 또는 광고성 이미지가 포함되는 배너부; 상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 2개 영역으로 분리되는 2단블록부; 상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 3개 영역으로 분리되는 3단블록부; 상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 4개 영역으로 분리되는 4단블록부; 상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 5개 영역으로 분리되는 5단블록부; 상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 6개 내지 8 영역으로 분리되는 단블록부; 및 상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 중 영역 구분이 모호한 단락인 갤러리부;를 포함하며, 상기 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부 및 갤러리부는 다시 세분류되고, 이에 대응하는 영문 또는 숫자로 조합된 세분류 태그를 포함한다.According to one embodiment of the present invention for achieving the above-described purpose, a classification system module of a web page layout for artificial intelligence analysis comprises: a header section located at the top of a web page and including a logo and a menu; a footer section located at the bottom of a web page and including site information and links related to privacy protection; a banner section located between the header section and the footer section and including an advertising message or an advertising image; a two-stage block section located between the header section and the footer section and having an image paragraph or a text paragraph divided into two areas; a three-stage block section located between the header section and the footer section and having an image paragraph or a text paragraph divided into three areas; a four-stage block section located between the header section and the footer section and having an image paragraph or a text paragraph divided into four areas; a five-stage block section located between the header section and the footer section and having an image paragraph or a text paragraph divided into five areas; a single block section located between the header section and the footer section and having an image paragraph or a text paragraph divided into six to eight areas; And it includes a gallery section which is a paragraph with an ambiguous area division among image paragraphs, and is located between the header section and the footer section; and the header section, footer section, banner section, two-block section, three-block section, four-block section, five-block section, single block section and gallery section are further subdivided and include subdivision tags combined with corresponding English letters or numbers.
상기 세분류 태그에서, 상기 헤더부의 좌측로고헤더는 LLH, 중앙로고헤더는 CLH로 분류되고, 상기 푸터부의 푸터는 FT로 분류되고, 상기 배너부의 배너는 HI11, 이미지 및 텍스트는 HI11T, 텍스트 및 이미지는 HTI11, 좌측타이틀은 LT, 중앙타이틀은 CT, 여백은 WS로 분류되고, 상기 2단블록부의 2단블록은 HI21, 이미지 및 3층리스트는 HI11I13, 3층리스트 및 이미지는 HI31I11, 텍스트 상하반전은 HI11TTI11, 텍스트 상하반전역방향은 HTI11I11T로 분류되고, 상기 3단블록부의 3단블록은 HI31, 이미지 및 2단리스트는 HI11I21, 2단리스트 및 이미지는 HI21I11, 텍스트 및 3단리스트는 HTI31, 3단리스트 및 텍스트는 HI31T, 캐러셀은 C31로 분류되고, 상기 4단블록부의 4단블록은 HI41, 이미지 및 3단리스트는 HI11I31, 3단리스트 및 이미지는 HI31I11, 텍스트 및 4단리스트는 HTI41, 4단리스트 및 텍스트는 HI41T로 분류되고, 상기 5단블록부의 5단블록은 HI51, 이미지 및 4단리스트는 HI11I41, 4단리스트 및 이미지는 HI41I11로 분류되고, 상기 단블록부의 6단블록은 HI61, 7단블록은 HI71, 8단블록은 HI81로 분류되고, 상기 갤러리부의 갤러리는 GR, 이미지 및 2층리스트는 HI11I12, 2층리스트 및 이미지는 HI12I11, 이미지 및 2단2층리스트는 HI11I22, 2단2층리스트 및 이미지는 HI22I11, 이미지 및 3단2층리스트는 HI11I32, 3단2층리스트 및 이미지는 HI32I11로 분류되는 것을 특징으로 한다.In the above detailed classification tags, the left logo header of the header part is classified as LLH, the center logo header is classified as CLH, the footer of the footer part is classified as FT, the banner of the banner part is classified as HI11, the image and text are classified as HI11T, the text and image are classified as HTI11, the left title is classified as LT, the center title is classified as CT, and the margin is classified as WS, the 2-level block of the 2-level block part is classified as HI21, the image and 3-level list are classified as HI11I13, the 3-level list and image are classified as HI31I11, the text upside-down inversion is HI11TTI11, and the text upside-down inversion direction is classified as HTI11I11T, the 3-level block of the 3-level block part is classified as HI31, the image and 2-level list are classified as HI11I21, the 2-level list and image are classified as HI21I11, the text and 3-level list are classified as HTI31, and the 3-level list and text are classified as HI31T, carousel is classified as C31, 4-level block of the 4-level block part is classified as HI41, image and 3-level list are classified as HI11I31, 3-level list and image are classified as HI31I11, text and 4-level list are classified as HTI41, 4-level list and text are classified as HI41T, 5-level block of the 5-level block part is classified as HI51, image and 4-level list are classified as HI11I41, 4-level list and image are classified as HI41I11, 6-level block of the single block part is classified as HI61, 7-level block is classified as HI71, 8-level block is classified as HI81, gallery of the gallery part is classified as GR, image and 2-level list is classified as HI11I12, 2-level list and image are classified as HI12I11, image and 2-level 2-level list are classified as HI11I22, 2-level 2-level list and image are classified as HI22I11, image and The 3-tier, 2-layer list is characterized by being classified as HI11I32, and the 3-tier, 2-layer list and image are classified as HI32I11.
본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계 모듈은, 새로운 구성을 추가할 수 있는 신규부를 더 포함하며, 상기 신규부의 세로형 2층리스트는 VI11I12, 세로형 3층리스트는 VI11I13 및 카테고리는 O11로 분류되는 것을 특징으로 한다.A classification system module of a web page layout for artificial intelligence analysis according to one embodiment of the present invention further includes a new section capable of adding a new configuration, and is characterized in that a vertical two-level list of the new section is classified as VI11I12, a vertical three-level list is classified as VI11I13, and a category is classified as O11.
또한, 상기한 목적을 달성하기 위한 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템은, 전처리된 웹페이지가 인공지능에 의해 학습되는 선행 학습 모듈; 레이아웃 분류가 필요한 웹페이지가 입력되는 웹페이지 입력 모듈; 입력된 웹페이지가 레이아웃별로 커팅되는 레이아웃 커팅 모듈; 커팅된 레이아웃이 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부 중 하나로 분류되는 제1 레이아웃 분류 모듈; 상기 제1 레이아웃 분류 모듈에서 분류된 레이아웃이 다시 세분류 태그에 의해 분류되는 제2 레이아웃 분류 모듈; 및 상기 세분류 태그에 의해 분류된 레이아웃의 단락의 높이, 단락의 너비 및 텍스트의 위치가 분석되고 저장되는 레이아웃 분석 모듈;를 포함한다.In addition, a classification system of a web page layout for artificial intelligence analysis according to one embodiment of the present invention for achieving the above-described purpose includes: a pre-learning module in which a preprocessed web page is learned by artificial intelligence; a web page input module in which a web page requiring layout classification is input; a layout cutting module in which the input web page is cut by layout; a first layout classification module in which the cut layout is classified into one of a header section, a footer section, a banner section, a two-column block section, a three-column block section, a four-column block section, a five-column block section, a single block section, a gallery section, and a new section; a second layout classification module in which the layout classified in the first layout classification module is further classified by a sub-classification tag; and a layout analysis module in which the height of a paragraph, the width of a paragraph, and the position of a text of the layout classified by the sub-classification tag are analyzed and stored.
또한, 상기한 목적을 달성하기 위한 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 의한 웹페이지의 레이아웃 분류 방법은, 전처리된 웹페이지가 인공지능에 의해 학습되는 제1 단계; 새로운 웹페이지의 구성요소가 레이아웃별로 커팅되는 제2 단계; 상기 제2 단계에서 커팅된 레이아웃이 인공지능에 의해 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부 중 하나로 분류되는 제3 단계; 상기 제3 단계에서 분류된 후 인공지능에 의해 다시 세분류 태그를 기준으로 세분류되는 제4 단계; 및 상기 세분류 태그에 의해 분류된 레이아웃에 대해 단락의 높이, 단락의 너비 및 텍스트의 위치가 인공지능에 의해 분석되는 제5 단계;를 포함한다.In addition, a method for classifying the layout of a webpage by a classification system for a webpage layout for artificial intelligence analysis according to one embodiment of the present invention for achieving the above-described purpose includes: a first step in which a preprocessed webpage is learned by artificial intelligence; a second step in which components of a new webpage are cut by layout; a third step in which the layout cut in the second step is classified by artificial intelligence into one of a header section, a footer section, a banner section, a two-column block section, a three-column block section, a four-column block section, a five-column block section, a single block section, a gallery section, and a new section; a fourth step in which, after being classified in the third step, the layout is further subdivided by artificial intelligence based on subdivision tags; and a fifth step in which, for the layout classified by the subdivision tags, the height of a paragraph, the width of a paragraph, and the position of a text are analyzed by artificial intelligence.
상술한 바와 같이, 본 발명을 통해 인공지능으로 다양한 웹페이지 레이아웃을 자동으로 분석하고 분류할 수 있으므로, 디자이너는 반복적인 작업을 줄이고 창의적인 작업에 더 집중가능하고, 자동화된 시스템은 디자인 요소의 일관성을 유지하고, 사용자가 더 직관적으로 접근할 수 있도록 도와준다.As described above, the present invention can automatically analyze and classify various web page layouts using artificial intelligence, so that designers can reduce repetitive tasks and focus more on creative work, and the automated system maintains consistency in design elements and helps users access them more intuitively.
또한, 인공지능 모델, 특히 CNN 모델을 활용하면 레이아웃의 각 구성 요소를 정확하게 감지하고 분류 가능하며, 이는 수작업으로 분석하는 것보다 훨씬 높은 정확도와 신뢰성을 제공한다.Additionally, utilizing artificial intelligence models, especially CNN models, can accurately detect and classify each component of the layout, which provides much higher accuracy and reliability than manual analysis.
또한, 인공지능을 통해 웹페이지 레이아웃 분석이 자동화되면, 대규모 웹페이지나 쇼핑몰을 효율적으로 관리할 수 있고, 이는 특히 많은 양의 데이터를 다루는 경우에 매우 유용하며, 시간과 인력을 절약하여 더 많은 프로젝트를 동시에 진행이 가능하게 한다.In addition, if web page layout analysis is automated through artificial intelligence, large-scale web pages or shopping malls can be managed efficiently, which is especially useful when handling large amounts of data, and saves time and manpower, allowing more projects to be carried out simultaneously.
또한, 인공지능을 통해 사용자의 행동 패턴을 분석하고 이를 기반으로 웹페이지를 최적화할 수 있다. 이는 사용자가 더 쉽게 웹페이지를 탐색하고 필요한 정보를 빠르게 찾을 수 있도록 도와주고, 사용자 친화적인 디자인을 구현하여 고객 만족도를 높일 수 있다.In addition, AI can be used to analyze user behavior patterns and optimize web pages based on this. This can help users navigate web pages more easily and quickly find the information they need, and can increase customer satisfaction by implementing user-friendly designs.
도 1은 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계의 구성도이다.
도 2는 웹페이지가 헤드, 바디 및 푸터로 구분된 예시도이다.
도 3은 세분류 태그 중 HI11I13, HI11 및 HI11I22의 예시도이다.
도 4는 세분류 태그 중 HI11 및 HI21의 예시도이다.
도 5는 세분류 태그 중 HI11I22, HI22I11, HI31 및 HI12I11의 예시도이다.
도 6은 세분류 태그 중 HI11, HI11I22, HI11I32 및 HI31의 예시도이다.
도 7은 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템의 구성도이다.
도 8은 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 의한 웹페이지 레이아웃 분류 방법의 순서도이다.
도 9는 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 의한 웹페이지 레이아웃 분류 방법의 제3 단계의 예시도이다.
도 10은 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 의한 웹페이지 레이아웃 분류 방법의 제4 단계의 예시도이다.Figure 1 is a diagram illustrating a classification system for web page layout for artificial intelligence analysis according to one embodiment of the present invention.
Figure 2 is an example of a web page divided into a head, body, and footer.
Figure 3 is an example diagram of HI11I13, HI11, and HI11I22 among the detailed classification tags.
Figure 4 is an example of HI11 and HI21 among the detailed classification tags.
Figure 5 is an example diagram of the detailed classification tags HI11I22, HI22I11, HI31, and HI12I11.
Figure 6 is an example diagram of the subcategory tags HI11, HI11I22, HI11I32, and HI31.
Figure 7 is a configuration diagram of a classification system for web page layout for artificial intelligence analysis according to one embodiment of the present invention.
FIG. 8 is a flowchart of a method for classifying web page layouts by a classification system for web page layouts for artificial intelligence analysis according to one embodiment of the present invention.
FIG. 9 is an exemplary diagram of the third step of a method for classifying web page layouts by a classification system for artificial intelligence analysis according to one embodiment of the present invention.
FIG. 10 is an exemplary diagram of the fourth step of a method for classifying web page layouts by a classification system for artificial intelligence analysis according to one embodiment of the present invention.
본 개시의 다양한 실시예에서 사용될 수 있는 "포함한다." 또는 "포함할 수 있다." 등의 표현은 개시(disclosure)된 해당 기능, 동작 또는 구성요소 등의 존재를 가리키며, 추가적인 하나 이상의 기능, 동작 또는 구성요소 등을 제한하지 않는다. 또한, 본 개시의 다양한 실시예에서, "포함하다." 또는 "가지다." 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.In various embodiments of the present disclosure, the expressions such as “includes,” “may include,” etc., indicate the presence of the disclosed corresponding function, operation, or component, etc., and do not limit one or more additional functions, operations, or components, etc. In addition, in various embodiments of the present disclosure, it should be understood that the terms such as “includes,” “have,” etc., are intended to specify the presence of a feature, a number, a step, an operation, a component, a part, or a combination thereof described in the specification, but do not exclude in advance the possibility of the presence or addition of one or more other features, numbers, steps, operations, components, parts, or combinations thereof.
본 개시의 다양한 실시예에서 "또는" 등의 표현은 함께 나열된 단어들의 어떠한, 그리고 모든 조합을 포함한다. 예를 들어, "A 또는 B"는, A를 포함할 수도, B를 포함할 수도, 또는 A 와 B 모두를 포함할 수도 있다.In various embodiments of the present disclosure, the expression "or" and the like includes any and all combinations of the words listed together. For example, "A or B" may include A, may include B, or may include both A and B.
본 개시의 다양한 실시예에서 사용된 "제1", "제2", "첫째", 또는 "둘째" 등의 표현들은 다양한 실시예들의 다양한 구성요소들을 수식할 수 있지만, 해당 구성요소들을 한정하지 않는다. 예를 들어, 상기 표현들은 해당 구성요소들의 순서 및/또는 중요도 등을 한정하지 않는다. 상기 표현들은 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 수 있다. 예를 들어, 제1 사용자 기기와 제2 사용자 기기는 모두 사용자 기기이며, 서로 다른 사용자 기기를 나타낸다. 예를 들어, 본 개시의 다양한 실시예의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.The expressions “first,” “second,” “first,” or “second,” etc., used in various embodiments of the present disclosure can modify various components of the various embodiments, but do not limit the components. For example, the expressions do not limit the order and/or importance of the components. The expressions can be used to distinguish one component from another component. For example, the first user device and the second user device are both user devices, and represent different user devices. For example, without departing from the scope of the various embodiments of the present disclosure, the first component can be referred to as the second component, and similarly, the second component can also be referred to as the first component.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성 요소와 상기 다른 구성요소 사이에 새로운 다른 구성요소가 존재하지 않는 것으로 이해될 수 있어야 할 것이다.When it is said that a component is "connected" or "connected" to another component, it should be understood that the component may be directly connected or connected to the other component, but that there may also be other new components between the component and the other component. On the other hand, when it is said that a component is "directly connected" or "directly connected" to another component, it should be understood that no other new components exist between the component and the other component.
본 개시의 실시예에서 "모듈", "유닛", "부(part)" 등과 같은 용어는 적어도 하나의 기능이나 동작을 수행하는 구성요소를 지칭하기 위한 용어이며, 이러한 구성요소는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈", "유닛", "부(part)" 등은 각각이 개별적인 특정한 하드웨어로 구현될 필요가 있는 경우를 제외하고는, 적어도 하나의 모듈이나 칩으로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.In the embodiments of the present disclosure, terms such as "module," "unit," "part," etc. are terms used to refer to components that perform at least one function or operation, and these components may be implemented as hardware or software, or as a combination of hardware and software. In addition, a plurality of "modules," "units," "parts," etc. may be integrated into at least one module or chip and implemented as at least one processor, except in cases where each of them needs to be implemented as individual specific hardware.
본 개시의 다양한 실시예에서 사용한 용어는 단지 특정일 실시예를 설명하기 위해 사용된 것으로, 본 개시의 다양한 실시예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.The terms used in the various embodiments of the present disclosure are only used to describe specific embodiments and are not intended to limit the various embodiments of the present disclosure. The singular expression includes the plural expression unless the context clearly indicates otherwise.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 개시의 다양한 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which various embodiments of the present disclosure belong.
일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 개시의 다양한 실시예에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Terms defined in commonly used dictionaries should be interpreted as having a meaning consistent with their meaning in the context of the relevant technology, and will not be interpreted in an idealized or overly formal sense unless explicitly defined in various embodiments of the present disclosure.
이하에서는 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계를 도면을 참조하여 설명한다. 도 1은 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계의 구성도이다. 도 1을 참조하면, 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 체계는 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부 및 갤러리부를 포함하여 구성될 수 있다. 여기서, 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부 및 갤러리부는 다시 세분류되는 영문 또는 숫자로 조합된 세분류 태그를 포함하여 인공지능에 의하여 분석될 수 있다. Hereinafter, a classification system of a web page layout for artificial intelligence analysis according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing the configuration of a classification system of a web page layout for artificial intelligence analysis according to an embodiment of the present invention. Referring to FIG. 1, the classification system of a web page layout for artificial intelligence analysis according to an embodiment of the present invention may be configured to include a header section, a footer section, a banner section, a two-block section, a three-block section, a four-block section, a five-block section, a single block section, and a gallery section. Here, the header section, the footer section, the banner section, the two-block section, the three-block section, the four-block section, the five-block section, the single block section, and the gallery section may include subdivision tags combined with English letters or numbers that are further subdivided, and may be analyzed by artificial intelligence.
헤더부는 웹페이지의 가장 상단에 위치하며, 로고와 메뉴가 포함된다. 도 2는 웹페이지가 헤드, 바디 및 푸터로 구분된 예시도이다. 도 2를 참조하면, 웹페이지는 일반적으로 헤드, 바디 및 푸터로 구분된다. 본 발명의 헤더부는 도 2의 헤드와 동일한 구성이며, 헤더부는 좌측로고헤더와 중앙로고헤더를 포함한다. 본 발명에서 헤더부의 세분류는 로고의 위치를 기준으로 하는데, 로고는 웹페이지의 상단의 좌측 또는 중앙에 위치하고, 우측에는 위치하지 않는다. 좌측로고헤더는 좌측에 로고가 위치하며, 세분류 태그는 LLH(Left Logo Head)이다. 중앙로고헤더는 우측에 로고가 위치하며, 세분류 태그는 CLH(Center Logo Head)이다. The header section is located at the very top of the webpage and includes a logo and a menu. Fig. 2 is an example diagram in which a webpage is divided into a head, a body, and a footer. Referring to Fig. 2, a webpage is generally divided into a head, a body, and a footer. The header section of the present invention has the same configuration as the head of Fig. 2, and includes a left logo header and a center logo header. In the present invention, the subdivision of the header section is based on the position of the logo, and the logo is located on the left or center of the top of the webpage, and not on the right. The left logo header has the logo located on the left, and the subdivision tag is LLH (Left Logo Head). The center logo header has the logo located on the right, and the subdivision tag is CLH (Center Logo Head).
푸터부는 웹페이지의 가장 하단에 위치하며, 사이트 정보 및 개인정보보호와 관련된 링크가 포함된다. 본 발명의 푸터부는 도 2의 푸터와 동일한 구성이며, 푸터부는 푸터를 포함한다. 푸터부는 내용이 다양하지 않기 때문에 하나의 태그로 푸터부를 포괄할 수 있다. 푸터부의 푸터의 세분류 태그는 FT(Footer)이다.The footer is located at the very bottom of the web page and includes links related to site information and privacy protection. The footer of the present invention has the same configuration as the footer of Fig. 2, and includes a footer. Since the footer does not have a variety of contents, the footer can be covered by a single tag. The footer's subcategory tag is FT (Footer).
하기에 설명하는 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부 및 갤러리부는 바디부를 구성한다. 본 발명은 웹페이지 레이아웃 분류가 쉽지 않았던 바디부의 구성요소를 빠짐없이 포괄하기 위해 35개의 세분류 태그를 사용한다.The banner section, two-block section, three-block section, four-block section, five-block section, single block section, and gallery section described below constitute the body section. The present invention uses 35 detailed classification tags to completely encompass the components of the body section, which were not easy to classify in the web page layout.
배너부는 헤더부 및 푸터부 사이에 위치하며, 광고성 메시지 또는 광고성 이미지가 포함된다. 배너부는 6개의 세분류 태그로 분류되는데, 배너는 HI11, 이미지 및 텍스트는 HI11T, 텍스트 및 이미지는 HTI11, 좌측타이틀은 LT, 중앙타이틀은 CT, 여백은 WS로 분류된다. 배너를 의미하는 태그로는 HI11, 우선 이미지가 나오고 다음에 텍스트가 나오는 구성의 배너는 HI11T, 우선 텍스트과 나오고 다음에 이미지가 나오는 구성의 배너는 HTI11, 좌측에 텍스트로만 이루어진 타이틀이 있는 배너는 LT, 중앙에 텍스트로만 이루어진 타이틀이 있는 배너는 CT, 이미지나 텍스트가 존재하지 않고 여백으로만 구성된 것은 WS로 구성된다. The banner section is located between the header and footer sections, and includes advertising messages or advertising images. The banner section is classified into six detailed tags: banner is HI11, image and text is HI11T, text and image is HTI11, left title is LT, center title is CT, and margin is WS. Tags indicating banners are HI11, a banner with an image first and then text is HI11T, a banner with text first and then image is HTI11, a banner with a title consisting only of text on the left is LT, a banner with a title consisting only of text in the center is CT, and a banner without an image or text and consisting only of margins is WS.
2단블록부는 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 2개 영역으로 분리된다. 2단블록부는 5개의 세분류 태그로 분류되는데, 2단블록은 HI21, 이미지 및 3층리스트는 HI11I13, 3층리스트 및 이미지는 HI31I11, 텍스트 상하반전은 HI11TTI11, 텍스트 상하반전역방향은 HTI11I11T로 분류된다. 2단블록을 의미하는 태그로는 HI21, 우선 이미지가 나오고 다음에 3층리스트가 나와 2개의 단락으로 구성된 2단블록은 HI11I13, 우선 3층리스트가 나오고 다음에 이미지가 나와 2개의 단락으로 구성된 2단블록은 HI31I11, 좌측에 텍스트가 위치하고 우측에는 상기 텍스트가 반전되어 2개의 단락으로 구성된 2단블록은 HI11TTI11, 좌측에 텍스트가 위치하고 우측에는 상기 텍스트가 반전되어 2개의 단락으로 구성된 HTI11I11T이 있다.The 2-block section is located between the header and footer sections, and divides the image paragraph or text paragraph into two areas. The 2-block section is classified into five subcategories of tags: 2-block is HI21, image and 3-level list is HI11I13, 3-level list and image is HI31I11, text upside-down is HI11TTI11, and text upside-down reverse direction is HTI11I11T. Tags for a 2-level block include HI21, a 2-level block with an image first, then a 3-level list, and consisting of 2 paragraphs is HI11I13, a 2-level block with a 3-level list first, then an image, and consisting of 2 paragraphs is HI31I11, a 2-level block with text on the left and the text reversed on the right and consisting of 2 paragraphs is HI11TTI11, and a 2-level block with text on the left and the text reversed on the right and consisting of 2 paragraphs is HTI11I11T.
3단블록부는 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 3개 영역으로 분리된다. 3단블록부는 6개의 세분류 태그로 분류되는데, 3단블록은 HI31, 이미지 및 2단리스트는 HI11I21, 2단리스트 및 이미지는 HI21I11, 텍스트 및 3단리스트는 HTI31, 3단리스트 및 텍스트는 HI31T, 캐러셀은 C31로 분류된다. 3단블록을 의미하는 태그로는 HI31, 우선 이미지가 나오고 다음에 2단리스트가 나와 3개의 단락으로 구성된 3단블록은 HI11I21, 우선 2단리스트가 나오고 다음에 이미지가 나와 3개의 단락으로 구성된 3단블록은 HI21I11, 좌측에 텍스트가 위치하고 우측에는 3단리스트로 구성된 3단블록은 HTI31, 좌측에 3단리스트가 위치하고 우측에는 텍스트로 구성된 3단블록은 HI31T, 캐러셀은 C31이다. 여기서, 캐러셀(Carousel)은 웹페이지 영역 내에 여러 개의 서로 다른 콘텐츠를 표시할 수 있는 구성요소이며, 캐러셀에 포함된 콘텐츠는 가로로 배치되어 있으며, 사용자가 좌/우로 콘텐츠를 회전시켜 콘텐츠를 탐색하도록 하거나 자동으로 회전하도록 설정할 수 있다.The 3-column block section is located between the header and footer sections, and divides the image paragraph or text paragraph into three areas. The 3-column block section is classified into six subcategories: HI31 for 3-column blocks, HI11I21 for images and 2-column lists, HI21I11 for 2-column lists and images, HTI31 for text and 3-column lists, HI31T for 3-column lists and text, and C31 for carousels. The tags for a 3-column block are HI31, a 3-column block with an image first, followed by a 2-column list, and consisting of 3 paragraphs is HI11I21, a 3-column block with a 2-column list first, followed by an image, and consisting of 3 paragraphs is HI21I11, a 3-column block with text on the left and a 3-column list on the right is HTI31, a 3-column block with a 3-column list on the left and text on the right is HI31T, and a carousel is C31. Here, a carousel is a component that can display multiple different contents within a web page area, and the contents included in the carousel are arranged horizontally, and the user can navigate the contents by rotating the contents left/right, or can be set to automatically rotate.
4단블록부는 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 4개 영역으로 분리된다. 4단블록부는 5개의 세분류 태그로 분류되는데, 4단블록은 HI41, 이미지 및 3단리스트는 HI11I31, 3단리스트 및 이미지는 HI31I11, 텍스트 및 4단리스트는 HTI41, 4단리스트 및 텍스트는 HI41T로 분류된다. 4단블록을 의미하는 태그로는 HI41, 우선 이미지가 나오고 다음에 3단리스트가 나와 4개의 단락으로 구성된 4단블록은 HI11I31, 우선 3단리스트가 나오고 다음에 이미지가 나와 4개의 단락으로 구성된 4단블록은 HI31I11, 좌측에 텍스트가 위치하고 우측는 4단리스트로 구성된 4단블록은 HTI41, 좌측에 4단리스트가 위치하고 우측에는 텍스트로 구성된 4단블록은 HI41T이다. The 4-column block section is located between the header and footer sections, and the image paragraph or text paragraph is divided into four areas. The 4-column block section is classified into five subcategories: HI41 for 4-column blocks, HI11I31 for images and 3-column lists, HI31I11 for 3-column lists and images, HTI41 for text and 4-column lists, and HI41T for 4-column lists and text. The tags indicating the 4-column block are HI41, a 4-column block consisting of four paragraphs with an image coming first followed by a 3-column list is HI11I31, a 4-column block consisting of four paragraphs with a 3-column list coming first followed by an image is HI31I11, a 4-column block consisting of text on the left and a 4-column list on the right is HTI41, and a 4-column block consisting of a 4-column list on the left and text on the right is HI41T.
5단블록부는 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 5개 영역으로 분리된다. 5단블록부는 3개의 세분류 태그로 분류되는데, 5단블록은 HI51, 이미지 및 4단리스트는 HI11I41, 4단리스트 및 이미지는 HI41I11로 분류된다. 5단블록을 의미하는 태그로는 HI51, 우선 이미지가 나오고 다음에 4단리스트가 나와 5개의 단락으로 구성된 4단블록은 HI11I41, 우선 4단리스트가 나오고 다음에 이미지가 나와 5개의 단락으로 구성된 5단블록은 HI41I11이다. The 5-column block section is located between the header and footer sections, and the image paragraph or text paragraph is divided into 5 areas. The 5-column block section is classified into 3 subcategories tags: 5-column block is HI51, image and 4-column list is HI11I41, and 4-column list and image is HI41I11. The tags indicating 5-column blocks are HI51, 4-column blocks consisting of 5 paragraphs with an image coming first followed by a 4-column list are HI11I41, and 5-column blocks consisting of 5 paragraphs with a 4-column list coming first followed by an image are HI41I11.
단블록부는 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 6개 내지 8 영역으로 분리된다. 단블록부는 3개의 세분류 태그로 분류되는데, 6단블록은 HI61, 7단블록은 HI71, 8단블록은 HI81로 분류된다. The single block section is located between the header and footer sections, and divides image paragraphs or text paragraphs into 6 to 8 areas. The single block section is classified into three subcategories tags: a 6-block section is classified into HI61, a 7-block section is classified into HI71, and an 8-block section is classified into HI81.
갤러리부는 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 중 영역 구분이 모호한 단락이다. 갤러리부는 7개의 세분류 태그로 분류되는데, 갤러리는 GR, 이미지 및 2층리스트는 HI11I12, 2층리스트 및 이미지는 HI12I11, 이미지 및 2단2층리스트는 HI11I22, 2단2층리스트 및 이미지는 HI22I11, 이미지 및 3단2층리스트는 HI11I32, 3단2층리스트 및 이미지는 HI32I11로 분류된다. 갤러리를 의미하는 태그로는 GR, 우선 이미지가 나오고 다음에 2층리스트가 나오는 구성은 HI11I12, 우선 2층리스트가 나오고 다음에 이미지가 나오는 구성은 HI22I11, 우선 이미지가 나오고 다음에 3단2층리스트가 나오는 구성은 HI11I32, 우선 3단2층리스트가 나오고 다음에 이미지가 나오는 구성은 HI32I11이다. 도 3은 세분류 태그 중 HI11I13, HI11 및 HI11I22의 예시도이고, 도 4는 세분류 태그 중 HI11 및 HI21의 예시도이고, 도 5는 세분류 태그 중 HI11I22, HI22I11, HI31 및 HI12I11의 예시도이고, 도 6은 세분류 태그 중 HI11, HI11I22, HI11I32 및 HI31의 예시도이다. 도 3 내지 도 6을 참조하면 웹페이지의 레이아웃의 세분류 태그에 따라 분류하는 예를 확인할 수 있는데, 예를 들어 도 3에서 상단 우측에 위치한 레이아웃은 HI11I22인데 이는 갤러리부의 이미지 및 2층리스트의 세분류로 좌측에 이미지가 위치하고 우측에 2층의 이미지로 구성된 2층리스트가 위치함을 확인할 수 있다. The gallery section is located between the header and footer sections, and is a paragraph among the image paragraphs where the area division is ambiguous. The gallery section is classified into seven detailed tags: GR for gallery, HI11I12 for image and 2-level list, HI12I11 for 2-level list and image, HI11I22 for image and 2-level 2-level list, HI22I11 for 2-level 2-level list and image, HI11I32 for image and 3-level 2-level list and image. The tag indicating the gallery is GR, HI11I12 for a configuration where an image appears first followed by a 2-level list, HI22I11 for a configuration where a 2-level list appears first followed by an image, HI11I32 for a configuration where an image appears first followed by a 3-level 2-level list, and HI32I11 for a configuration where a 3-level 2-level list appears first followed by an image. FIG. 3 is an example diagram of HI11I13, HI11, and HI11I22 among the subcategories tags, FIG. 4 is an example diagram of HI11 and HI21 among the subcategories tags, FIG. 5 is an example diagram of HI11I22, HI22I11, HI31, and HI12I11 among the subcategories tags, and FIG. 6 is an example diagram of HI11, HI11I22, HI11I32, and HI31 among the subcategories tags. Referring to FIGS. 3 to 6, examples of classification according to subcategories tags of the layout of a web page can be confirmed. For example, the layout located on the upper right in FIG. 3 is HI11I22, which is a subcategories of images and a two-story list in the gallery section. It can be confirmed that images are located on the left and a two-story list consisting of two images is located on the right.
본 발명은 새로운 구성을 추가할 수 있는 신규부가 추가되는데, 신규부는 세로형 2층리스트는 VI11I12, 세로형 3층리스트는 VI11I13 및 카테고리는 O11로 분류된다. 상기에 설명된 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부 및 갤러리부는 대부분이 가로형 구성이었는데, 신규부에서는 2층리스트 또는 3층리스트가 세로로 배열된 구성이다. 카테고리에서는 웹페이지에 나열되는 제품의 카테고리에 대한 설명이 제시된다. 따라서, 본 발명에 사용되는 세분류 태그의 갯수는 헤더부 2개, 푸터부 1개, 신규부를 포함하는 바디부는 38개로 전체 41개이다.The present invention adds a new section that can add a new configuration, and the new section is classified into a vertical two-tier list VI11I12, a vertical three-tier list VI11I13, and a category O11. Most of the banner section, two-level block section, three-level block section, four-level block section, five-level block section, single block section, and gallery section described above have horizontal configurations, but the new section has a configuration in which a two-level list or a three-level list is arranged vertically. In the category, a description of the category of products listed on the web page is presented. Accordingly, the number of subdivision tags used in the present invention is 41 in total, including 2 for the header section, 1 for the footer section, and 38 for the body section including the new section.
이하에서는 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템을 도면을 참조하여 설명한다. 도 7은 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템의 구성도이다. 도 7을 참조하면, 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템은 선행 학습 모듈(10), 웹페이지 입력 모듈(20), 레이아웃 커팅 모듈(30), 제1 레이아웃 분류 모듈(40), 제2 레이아웃 분류 모듈(50) 및 레이아웃 분석 모듈(60)을 포함하여 구성될 수 있다. 본 발명은 인공지능을 활용하여 웹페이지 레이아웃을 분석하는 것의 높은 정확도와 일관성을 제공하고 자동화를 통해 효율성을 극대화할 수 있다. 이러한 접근 방식은 웹페이지 디자인 분석 및 최적화에 있어 매우 유용하며, 사용자 경험을 개선하는 데 큰 도움을 줄 수 있다. 본 발명의 인공지능의 모델로는 CNN(convolution Neural Network) 모델을 활용할 수 있는데, CNN 모델은 정확하고 신뢰성 있는 결과를 얻을 수 있어 다양한 사람이 쉽게 이해하고 적용할 수 있다. 보다 구체적으로, 본 발명에서는 객체 탐지를 위해서는 YOLOv8 모델을, 이미지 분류를 위해서는 EfficientNetV2 모델을 사용할 수 있다. 본 발명에서 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템은 하나 이상의 프로세서(processor), 하나 이상의 메모리(memory), 하나 이상의 스토리지(storage), 그리고 하나 이상의 통신 인터페이스(communication interface)를 포함할 수 있고, 이들은 버스(bus)를 통해 서로 연결될 수 있다. 이외에도, 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템은 입력 장치, 출력 장치 등의 하드웨어를 포함할 수 있다. 또한, 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에는 프로그램을 구동할 수 있는 운영 체제를 비롯한 각종 소프트웨어가 탑재될 수 있다.Hereinafter, a classification system for web page layout for artificial intelligence analysis according to an embodiment of the present invention will be described with reference to the drawings. FIG. 7 is a configuration diagram of a classification system for web page layout for artificial intelligence analysis according to an embodiment of the present invention. Referring to FIG. 7, a classification system for web page layout for artificial intelligence analysis according to an embodiment of the present invention may be configured to include a pre-learning module (10), a web page input module (20), a layout cutting module (30), a first layout classification module (40), a second layout classification module (50), and a layout analysis module (60). The present invention provides high accuracy and consistency in analyzing web page layouts using artificial intelligence, and can maximize efficiency through automation. This approach is very useful in analyzing and optimizing web page designs, and can be of great help in improving user experience. The artificial intelligence model of the present invention can utilize a CNN (convolutional Neural Network) model, and the CNN model can obtain accurate and reliable results, so that various people can easily understand and apply it. More specifically, the present invention can use the YOLOv8 model for object detection, and the EfficientNetV2 model for image classification. In the present invention, the classification system of a web page layout for artificial intelligence analysis may include one or more processors, one or more memories, one or more storages, and one or more communication interfaces, which may be connected to each other via a bus. In addition, the classification system of a web page layout for artificial intelligence analysis may include hardware such as an input device and an output device. In addition, the classification system of a web page layout for artificial intelligence analysis may be equipped with various software including an operating system capable of running a program.
선행 학습 모듈(10)은 전처리된 웹페이지를 인공지능에 의해 학습한다. 관리자는 레이아웃이 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부로 분류되고, 세분류 태그 41개에 분류되어 2개의 분류 체계에 대한 학습이 진행되도록 인공지능이 인식할 수 있도록 전처리된 웹페이지를 지속적으로 입력하여 충분한 학습이 진행되도록 한다.The pre-learning module (10) learns preprocessed web pages by artificial intelligence. The administrator continuously inputs preprocessed web pages so that the artificial intelligence can recognize that the layout is classified into a header section, a footer section, a banner section, a two-column block section, a three-column block section, a four-column block section, a five-column block section, a single block section, a gallery section, and a new section, and is classified into 41 subcategories, so that learning for the two classification systems can proceed, so that sufficient learning can proceed.
웹페이지 입력 모듈(20)에는 레이아웃 분류가 필요한 웹페이지가 입력된다. 인공지능이 선행 학습 모듈(10)에 의해 충분한 학습이 진행되었으면, 웹페이지의 레이아웃 분류를 위해 웹페이지 입력 모듈(20)을 통해 웹페이지가 입력된다. 웹페이지 입력 모듈(20)은 다양한 입력 장치를 통해 웹페이지를 입력할 수 있고, 입력 장치로는, 예를 들어 키보드, 마우스, 펜마우스, 트랙볼, 터치패드, 포인팅 스틱, 스캐너, 디지털 카메라 중에서 하나 또는 복수로 선택하여 사용할 수 있다. A webpage requiring layout classification is input into the webpage input module (20). If the artificial intelligence has sufficiently learned through the pre-learning module (10), the webpage is input through the webpage input module (20) for layout classification of the webpage. The webpage input module (20) can input the webpage through various input devices, and as the input devices, for example, one or more of a keyboard, a mouse, a pen mouse, a trackball, a touchpad, a pointing stick, a scanner, and a digital camera can be selected and used.
레이아웃 커팅 모듈(30)은 입력된 웹페이지를 레이아웃별로 커팅한다. 레이아웃의 분류 체계에 따라 분류하기 위해서는 우선 웹페이지의 레이아웃을 커팅해야 한다. 레이아웃 커팅 모듈(30)은 공백을 인식하여 이미지 또는 텍스트가 있는 곳과 공백이 있는 곳을 구분하여 공백이 있는 곳을 커팅 위치로 해서 웹페이지를 스크롤하며 가로로 커팅을 진행한다.The layout cutting module (30) cuts the input web page by layout. In order to classify according to the classification system of the layout, the layout of the web page must first be cut. The layout cutting module (30) recognizes blank spaces and distinguishes between the places where images or texts are and the places where blank spaces are, and then scrolls the web page and performs horizontal cutting with the places where blank spaces are set as the cutting positions.
제1 레이아웃 분류 모듈(40)은 커팅된 레이아웃이 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부 중 하나로 분류한다. 인공지능은 선행 학습 모듈(10)에서 학습된 내용에 의해 커팅된 레이아웃이 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부 중 하나에 분류되도록 한다.The first layout classification module (40) classifies the cut layout into one of the header section, footer section, banner section, two-column block section, three-column block section, four-column block section, five-column block section, single block section, gallery section, and new section. The artificial intelligence classifies the cut layout into one of the header section, footer section, banner section, two-column block section, three-column block section, four-column block section, five-column block section, single block section, gallery section, and new section based on the content learned in the pre-learning module (10).
제2 레이아웃 분류 모듈(50)은 제1 레이아웃 분류 모듈(40)에서 분류된 레이아웃을 다시 세분류 태그에 의해 분류한다. 세분류 태그는 전체 41개로, 헤더부의 좌측로고헤더는 LLH, 중앙로고헤더는 CLH이고, 푸터부의 푸터는 FT이고, 배너부의 배너는 HI11, 이미지 및 텍스트는 HI11T, 텍스트 및 이미지는 HTI11, 좌측타이틀은 LT, 중앙타이틀은 CT, 여백은 WS이고, 2단블록부의 2단블록은 HI21, 이미지 및 3층리스트는 HI11I13, 3층리스트 및 이미지는 HI31I11, 텍스트 상하반전은 HI11TTI11, 텍스트 상하반전역방향은 HTI11I11T이고, 3단블록부의 3단블록은 HI31, 이미지 및 2단리스트는 HI11I21, 2단리스트 및 이미지는 HI21I11, 텍스트 및 3단리스트는 HTI31, 3단리스트 및 텍스트는 HI31T, 캐러셀은 C31이고, 4단블록부의 4단블록은 HI41, 이미지 및 3단리스트는 HI11I31, 3단리스트 및 이미지는 HI31I11, 텍스트 및 4단리스트는 HTI41, 4단리스트 및 텍스트는 HI41T이고, 5단블록부의 5단블록은 HI51, 이미지 및 4단리스트는 HI11I41, 4단리스트 및 이미지는 HI41I11이고, 단블록부의 6단블록은 HI61, 7단블록은 HI71, 8단블록은 HI81이고, 갤러리부의 갤러리는 GR, 이미지 및 2층리스트는 HI11I12, 2층리스트 및 이미지는 HI12I11, 이미지 및 2단2층리스트는 HI11I22, 2단2층리스트 및 이미지는 HI22I11, 이미지 및 3단2층리스트는 HI11I32, 3단2층리스트 및 이미지는 HI32I11이고, 신규부의 세로형 2층리스트는 VI11I12, 세로형 3층리스트는 VI11I13 및 카테고리는 O11이다. 제2 레이아웃 분류 모듈(50)은 제1 레이아웃 분류 모듈(40)에서 분류한 것을 상기 세분류 태그 중 하나로 다시 분류한다. 상기 세분류 태그를 사용하게 되면, 웹페이지의 레이아웃을 모두 포괄할 수 있어 인공지능이 어떠한 웹페이지의 레이아웃도 분류할 수 있는 장점이 있다.The second layout classification module (50) classifies the layout classified by the first layout classification module (40) again by sub-classification tags. There are 41 subcategories in total. The left logo header of the header is LLH, the center logo header is CLH, the footer of the footer is FT, the banner of the banner is HI11, the image and text is HI11T, the text and image is HTI11, the left title is LT, the center title is CT, the margin is WS, the 2-column block of the 2-column block is HI21, the image and 3-level list is HI11I13, the 3-level list and image is HI31I11, the text upside-down is HI11TTI11, the text upside-down inversion direction is HTI11I11T, the 3-column block of the 3-column block is HI31, the image and 2-column list is HI11I21, the 2-column list and image is HI21I11, the text and 3-column list is HTI31, the 3-column list and text is HI31T, and the carousel is C31, and the 4-level block of the 4-level block part is HI41, the image and 3-level list are HI11I31, the 3-level list and image are HI31I11, the text and 4-level list are HTI41, the 4-level list and text are HI41T, the 5-level block of the 5-level block part is HI51, the image and 4-level list are HI11I41, the 4-level list and image are HI41I11, the 6-level block of the single-block part is HI61, the 7-level block is HI71, and the 8-level block is HI81, the gallery of the gallery part is GR, the image and 2-level list is HI11I12, the 2-level list and image is HI12I11, the image and 2-level 2-level list is HI11I22, the 2-level 2-level list and image are HI22I11, the image and 3-level 2-level list is HI11I32, the 3-level 2-level list and The image is HI32I11, the vertical 2-layer list of the new section is VI11I12, the vertical 3-layer list is VI11I13, and the category is O11. The second layout classification module (50) reclassifies what has been classified by the first layout classification module (40) into one of the above-mentioned sub-classification tags. Using the above-mentioned sub-classification tags has the advantage of allowing artificial intelligence to classify the layout of any web page since it can encompass all of the web page layouts.
레이아웃 분석 모듈(60)은 세분류 태그에 의해 분류된 레이아웃의 단락의 높이, 단락의 너비 및 텍스트의 위치를 분석하고 저장한다. 세분류 태그에 의해 레이아웃이 분류되었으면 분류된 레이아웃에서 단락의 높이, 단락의 너비 및 텍스트의 위치를 분석한다. 레이아웃 분석 모듈(60)은 레이아웃의 단락의 높이, 단락의 너비 및 텍스트의 위치 정보를 추출하는데, 레이아웃이 분류 체계에 의해 분류되고 레이아웃의 단락의 높이, 단락의 너비 및 텍스트의 위치 정보를 추출하면 레이아웃의 모든 정보가 확인되게 된다. 레이아웃 분석 모듈(60)은 레이아웃의 분류 체계 정보, 레이아웃의 단락의 높이 정보, 단락의 너비 정보, 텍스트의 위치 정보를 저장한다. 레이아웃 분석 모듈(60)은 정보 저장을 위한 메모리를 구비한다. 메모리는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), SSD 타입(Solid State Disk type), SDD 타입(Silicon Disk Drive type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(random access memory; RAM), SRAM(static random access memory), 롬(read-only memory; ROM), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크 및 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. The layout analysis module (60) analyzes and stores the paragraph height, paragraph width, and text position of the layout classified by the subcategory tag. If the layout is classified by the subcategory tag, the paragraph height, paragraph width, and text position of the classified layout are analyzed. The layout analysis module (60) extracts paragraph height, paragraph width, and text position information of the layout. If the layout is classified by the classification system and the paragraph height, paragraph width, and text position information of the layout are extracted, all information of the layout is confirmed. The layout analysis module (60) stores classification system information of the layout, paragraph height information of the layout, paragraph width information, and text position information. The layout analysis module (60) has a memory for storing information. The memory may include at least one type of storage medium among a flash memory type, a hard disk type, an SSD (Solid State Disk type), an SDD (Silicon Disk Drive) type, a multimedia card micro type, a card type memory (for example, an SD or XD memory, etc.), a random access memory (RAM), a static random access memory (SRAM), a read-only memory (ROM), an electrically erasable programmable read-only memory (EEPROM), a programmable read-only memory (PROM), a magnetic memory, a magnetic disk, and an optical disk.
이하에서는 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 의한 웹페이지 레이아웃 분류 방법에 대해 도면을 참조하여 설명한다. 도 8은 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 의한 웹페이지 레이아웃 분류 방법의 순서도이다. 도 8을 참조하면, 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 의한 웹페이지 레이아웃 분류 방법은 하기의 다섯 단계로 구성될 수 있다. Hereinafter, a method for classifying web page layouts by a classification system for artificial intelligence analysis according to an embodiment of the present invention will be described with reference to drawings. FIG. 8 is a flowchart of a method for classifying web page layouts by a classification system for artificial intelligence analysis according to an embodiment of the present invention. Referring to FIG. 8, a method for classifying web page layouts by a classification system for artificial intelligence analysis according to an embodiment of the present invention can be composed of the following five steps.
제1 단계(S10)는 전처리된 웹페이지가 인공지능에 의해 학습되는 단계이다. 선행 학습 모듈(10)의 인공지능이 웹페이지의 구성요소를 분석하여 분류하기 위해서는 선행 학습이 필요하다. 인공지능의 학습을 위해서는 데이터셋을 마련하여 인공지능이 지속적으로 학습하게 해야 한다. 이를 위해 웹페이지에서 학습이 용이하도록 전처리 과정을 거쳐 준비된 데이터셋이 학습되도록 한다. 웹페이지의 레이아웃을 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부 중 하나로 분리하고, 41개의 세분류 태그로 분류하여 각각의 세분류 태그별로 학습이 진행될 수 있도록 한다.The first stage (S10) is the stage where the preprocessed webpage is learned by artificial intelligence. In order for the artificial intelligence of the pre-learning module (10) to analyze and classify the components of the webpage, pre-learning is necessary. In order for the artificial intelligence to learn, a dataset must be prepared so that the artificial intelligence can continuously learn. To this end, the dataset prepared through a preprocessing process so that learning is easy on the webpage is learned. The layout of the webpage is divided into one of the header, footer, banner, two-block, three-block, four-block, five-block, single-block, gallery, and new sections, and is classified into 41 subcategories so that learning can proceed for each subcategories tag.
제2 단계(S20)는 새로운 웹페이지의 구성요소가 레이아웃별로 커팅되는 단계이다. 충분한 선행 학습이 진행된 인공지능은 새로운 웹페이지가 웹페이지 입력 모듈(20)에 입력되면 학습 내용에 의해 웹페이지의 구성요소를 분석하여 분류할 수 있다. 이를 위해 레이아웃 커팅 모듈(30)은 공백을 인식하여 이미지 또는 텍스트가 있는 곳과 공백이 있는 곳을 구분하여 공백이 있는 곳을 커팅 위치로 해서 웹페이지를 스크롤하며 가로로 커팅을 진행한다.The second stage (S20) is the stage where the components of a new web page are cut according to the layout. An artificial intelligence that has undergone sufficient prior learning can analyze and classify the components of a web page based on the learning content when a new web page is input to the web page input module (20). To this end, the layout cutting module (30) recognizes blank spaces, distinguishes between places where images or texts are located and places where blank spaces are located, and scrolls the web page horizontally and cuts it using the blank spaces as the cutting position.
제3 단계(S30)는 제2 단계(S20)에서 커팅된 레이아웃이 인공지능에 의해 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부 중 하나로 분류되는 단계이다. 도 5는 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 의한 레이아웃 분류 방법의 제3 단계(S30)의 예시도이다. 도 9를 참조하면, 제2 단계(S20)에서 커팅된 레이아웃에 대해 제1 레이아웃 분류 모듈(40)은 인공지능이 분석하여 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부 중 하나로 분류하게 한다. The third step (S30) is a step in which the layout cut in the second step (S20) is classified by artificial intelligence into one of a header section, a footer section, a banner section, a two-column block section, a three-column block section, a four-column block section, a five-column block section, a single block section, a gallery section, and a new section. FIG. 5 is an example diagram of the third step (S30) of a layout classification method by a classification system of a web page layout for artificial intelligence analysis according to one embodiment of the present invention. Referring to FIG. 9, the first layout classification module (40) causes the layout cut in the second step (S20) to be analyzed by artificial intelligence and classified into one of a header section, a footer section, a banner section, a two-column block section, a three-column block section, a four-column block section, a five-column block section, a single block section, a gallery section, and a new section.
제4 단계(S40)는 제3 단계(S30)에서 분류된 후 인공지능에 의해 다시 세분류 태그를 기준으로 세분류되는 단계이다. 세분류 태그는 전체 41개로 구성된다. 구체적으로는, 헤더부의 좌측로고헤더는 LLH, 중앙로고헤더는 CLH이고, 푸터부의 푸터는 FT이고, 배너부의 배너는 HI11, 이미지 및 텍스트는 HI11T, 텍스트 및 이미지는 HTI11, 좌측타이틀은 LT, 중앙타이틀은 CT, 여백은 WS이고, 2단블록부의 2단블록은 HI21, 이미지 및 3층리스트는 HI11I13, 3층리스트 및 이미지는 HI31I11, 텍스트 상하반전은 HI11TTI11, 텍스트 상하반전역방향은 HTI11I11T이고, 3단블록부의 3단블록은 HI31, 이미지 및 2단리스트는 HI11I21, 2단리스트 및 이미지는 HI21I11, 텍스트 및 3단리스트는 HTI31, 3단리스트 및 텍스트는 HI31T, 캐러셀은 C31이고, 4단블록부의 4단블록은 HI41, 이미지 및 3단리스트는 HI11I31, 3단리스트 및 이미지는 HI31I11, 텍스트 및 4단리스트는 HTI41, 4단리스트 및 텍스트는 HI41T이고, 5단블록부의 5단블록은 HI51, 이미지 및 4단리스트는 HI11I41, 4단리스트 및 이미지는 HI41I11이고, 단블록부의 6단블록은 HI61, 7단블록은 HI71, 8단블록은 HI81이고, 갤러리부의 갤러리는 GR, 이미지 및 2층리스트는 HI11I12, 2층리스트 및 이미지는 HI12I11, 이미지 및 2단2층리스트는 HI11I22, 2단2층리스트 및 이미지는 HI22I11, 이미지 및 3단2층리스트는 HI11I32, 3단2층리스트 및 이미지는 HI32I11이고, 신규부의 세로형 2층리스트는 VI11I12, 세로형 3층리스트는 VI11I13 및 카테고리는 O11이다. 도 10은 본 발명의 일 실시예에 의한 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 의한 레이아웃 분류 방법의 제4 단계(S40)의 예시도이다. 도 10을 참조하면, 제2 레이아웃 분류 모듈(50)은 제1 단계(S10)에서 학습된 내용에 따라 제3 단계(S30)에서 분류된 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부에 대해 다시 세분류 태그에 의해 세부적으로 분석하여 분류한다.Step 4 (S40) is the step where the classification in Step 3 (S30) is further subdivided by artificial intelligence based on the subdivision tags. There are a total of 41 subdivision tags. Specifically, the left logo header of the header part is LLH, the center logo header is CLH, the footer of the footer part is FT, the banner of the banner part is HI11, the image and text are HI11T, the text and image are HTI11, the left title is LT, the center title is CT, the margin is WS, the 2-column block of the 2-column block part is HI21, the image and 3-level list are HI11I13, the 3-level list and image are HI31I11, the text upside-down flip is HI11TTI11, the text upside-down flip direction is HTI11I11T, the 3-column block of the 3-column block part is HI31, the image and 2-column list are HI11I21, the 2-column list and image are HI21I11, the text and 3-column list are HTI31, the 3-column list and text are HI31T, the carousel is C31, and the 4-column block part is The 4-level block is HI41, the image and 3-level list is HI11I31, the 3-level list and image is HI31I11, the text and 4-level list is HTI41, the 4-level list and text is HI41T, the 5-level block of the 5-level block part is HI51, the image and 4-level list is HI11I41, the 4-level list and image is HI41I11, the 6-level block of the single block part is HI61, the 7-level block is HI71, the 8-level block is HI81, the gallery of the gallery part is GR, the image and 2-level list is HI11I12, the 2-level list and image is HI12I11, the image and 2-level 2-level list is HI11I22, the 2-level 2-level list and image is HI22I11, the image and 3-level 2-level list is HI11I32, the 3-level 2-level list and image is HI32I11, The vertical 2-story list of the new section is VI11I12, the vertical 3-story list is VI11I13, and the category is O11. FIG. 10 is an exemplary diagram of the 4th step (S40) of the layout classification method by the classification system of the web page layout for artificial intelligence analysis according to one embodiment of the present invention. Referring to FIG. 10, the second layout classification module (50) analyzes and classifies in detail the header section, footer section, banner section, 2-block section, 3-block section, 4-block section, 5-block section, single block section, gallery section, and new section classified in the 3rd step (S30) based on the content learned in the 1st step (S10) by the detailed classification tags again.
본 발명에서 제3 단계(S40) 및 제4 단계(S40)의 구체적인 과정은 다음과 같다. 우선, 기본 레이아웃 분류는 주로 요소의 배치 방식에 따라 수평(Horizontal, H)과 수직(Vertical, V)으로 분류한다. H(Horizontal) 시리즈는 수평 방향으로 배열된 요소들을 의미하고, V(Vertical) 시리즈는 수직 방향으로 배열된 요소들을 의미한다. 다음으로, 세부 레이아웃 분류는 세부적으로는 각 레이아웃 내에 포함된 이미지와 텍스트의 조합 및 배치 방식에 따라 더 구체적으로 분류한다. 단블록 레이아웃은 단일 블록으로 구성된 레이아웃으로, 6단블록(HI61). 7단블록(HI71), 8단블록(HI81)이 있다. 다단블록 레이아웃은 여러 블록으로 구성된 레이아웃으로, 2단블록(HI21), 3단블록(HI31), 4단블록(HI41), 5단블록(HI51)이 있다. 다음으로, 각 블록 내 구성 요소는 이미지와 텍스트의 조합 방식에 따라 구분된다. 이미지 및 텍스트 조합은 이미지와 텍스트가 함께 배치된 형태로, 예를 들면 이미지 텍스트(HI11T), 텍스트 이미지(HTI11)가 있다. 이미지 리스트는 여러 이미지를 리스트 형태로 배치한 형태로, 예를 들면 이미지 및 3층리스트(HI11I3)가 있다. 텍스트 리스트는 여러 텍스트를 리스트 형태로 배치한 형태로, 예를 들면 텍스트 및 4단리스트(HTI41)가 있다. 다음으로, 특정 용도에 따라 자주 사용되는 레이아웃은 별도로 분류된다. 헤더부는 페이지의 상단에 위치하는 주요 메뉴 및 로고 배치 영역으로, 좌측로고헤더(LLH)이고 중앙로고헤더(CLH)이다. 푸터부는 페이지의 하단에 위치하는 정보 및 링크 배치 영역으로, 푸터(FT)가 있다. 배너부는 주목성을 높이기 위해 배치하는 영역으로, 배너(HI11), 이미지 및 텍스트(HI11T), 텍스트 및 이미지(HTI11)가 있다. 다음으로, 기타 레이아웃으로 갤러리부와 신규부가 있다. 갤러리부는 여러 이미지를 갤러리 형태로 배치하는 형태로, 갤러리(GR), 이미지 및 2층리스트(HI111I2), 이미지 및 3단2층리스트(HI111I3)가 있다. 신규부는 새로운 형태의 레이아웃으로, 세로형 2층리스트(VI111I2), 카테고리(O11)가 있다. The specific processes of the third step (S40) and the fourth step (S40) in the present invention are as follows. First, the basic layout classification is mainly classified into horizontal (H) and vertical (V) according to the arrangement method of elements. The H (Horizontal) series means elements arranged in a horizontal direction, and the V (Vertical) series means elements arranged in a vertical direction. Next, the detailed layout classification is classified more specifically according to the combination and arrangement method of images and texts included in each layout. A single-block layout is a layout composed of a single block, and includes a six-level block (HI61), a seven-level block (HI71), and an eight-level block (HI81). A multi-level block layout is a layout composed of multiple blocks, and includes a two-level block (HI21), a three-level block (HI31), a four-level block (HI41), and a five-level block (HI51). Next, the components within each block are classified according to the combination method of images and texts. The image and text combination is a form in which images and texts are arranged together, for example, image text (HI11T) and text image (HTI11). The image list is a form in which multiple images are arranged in a list format, for example, image and 3-level list (HI11I3). The text list is a form in which multiple texts are arranged in a list format, for example, text and 4-level list (HTI41). Next, frequently used layouts are classified separately according to specific purposes. The header section is the main menu and logo arrangement area located at the top of the page, and is the left logo header (LLH) and the center logo header (CLH). The footer section is the information and link arrangement area located at the bottom of the page, and is the footer (FT). The banner section is an area arranged to increase visibility, and is the banner (HI11), image and text (HI11T), and text and image (HTI11). Next, other layouts include the gallery section and the new section. The gallery section is a form that arranges multiple images in a gallery format, and includes a gallery (GR), an image and a two-level list (HI111I2), and an image and a three-level two-level list (HI111I3). The new section has a new layout, and includes a vertical two-level list (VI111I2) and a category (O11).
이러한 분류 체계를 통해 웹페이지를 분석하는 방법은 다음과 같다. 첫째, 레이아웃 분석으로, 웹페이지의 각 섹션을 분류 체계에 따라 분석하여 레이아웃을 식별할 수 있다. 둘째, 요소 배치 분석으로, 각 레이아웃 내 요소(이미지, 텍스트)의 배치 방식을 파악하여 구조적 특징을 도출할 수 있다. 셋째, 디자인 일관성 유지로, 분석된 레이아웃과 배치 방식을 기반으로 디자인의 일관성을 유지하면서 필요한 수정 및 최적화를 진행할 수 있다. 넷째, 사용자 경험 향상으로, 사용자 인터페이스(UI)와 사용자 경험(UX)을 고려하여 적절한 레이아웃을 선택하고 적용할 수 있다. 이러한 방법을 통해 웹페이지의 시각적 요소를 체계적으로 분석하고, 사용자 친화적인 디자인을 구현. 인공지능을 활용한 웹페이지 레이아웃 분석은 특히 대규모 웹사이트나 쇼핑몰에서 효과적으로 사용할 수 있다.The methods of analyzing web pages through this classification system are as follows. First, layout analysis, where each section of the web page is analyzed according to the classification system to identify the layout. Second, element placement analysis, where the arrangement of elements (images, texts) within each layout can be identified to derive structural characteristics. Third, design consistency maintenance, where necessary modifications and optimizations can be made while maintaining design consistency based on the analyzed layout and arrangement. Fourth, user experience improvement, where an appropriate layout can be selected and applied considering the user interface (UI) and user experience (UX). Through these methods, the visual elements of the web page can be systematically analyzed and a user-friendly design implemented. Web page layout analysis using artificial intelligence can be used particularly effectively in large-scale websites or shopping malls.
제5 단계(S50)는 세분류 태그에 의해 분류된 레이아웃에 대해 단락의 높이, 단락의 너비 및 텍스트의 위치가 인공지능에 의해 분석되는 단계이다. 레이아웃 분석 모듈(60)은 웹페이지의 레이아웃이 분류되었으면, 분류된 레이아웃에 대해 단락의 높이, 단락의 너비 및 텍스트의 위치를 추출하여, 레이아웃의 분류 체계 정보, 레이아웃의 단락의 높이 정보, 단락의 너비 정보, 텍스트의 위치 정보를 저장한다Step 5 (S50) is a step in which the height of paragraph, width of paragraph, and position of text are analyzed by artificial intelligence for the layout classified by the detailed classification tag. When the layout of the web page is classified, the layout analysis module (60) extracts the height of paragraph, width of paragraph, and position of text for the classified layout, and stores the classification system information of the layout, the height information of paragraph, width information of paragraph, and position information of text.
이상에서 설명된 시스템은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 시스템 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The system described above may be implemented using hardware components, software components, and/or a combination of hardware components and software components. For example, the system and components described in the embodiments may be implemented using one or more general-purpose computers or special-purpose computers, such as, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA), a programmable logic unit (PLU), a microprocessor, or any other device capable of executing instructions and responding to them. The processing unit may execute an operating system (OS) and one or more software applications running on the OS. In addition, the processing unit may access, store, manipulate, process, and generate data in response to the execution of the software. For ease of understanding, the processing unit is sometimes described as being used alone, but those skilled in the art will appreciate that the processing unit may include multiple processing elements and/or multiple types of processing elements. For example, the processing device may include multiple processors, or a processor and a controller. Other processing configurations, such as parallel processors, are also possible.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of these, which may configure a processing device to perform a desired operation or may independently or collectively command the processing device. The software and/or data may be permanently or temporarily embodied in any type of machine, component, physical device, virtual equipment, computer storage medium or device, or transmitted signal waves, for interpretation by the processing device or for providing instructions or data to the processing device. The software may also be distributed over network-connected computer systems, and stored or executed in a distributed manner. The software and data may be stored on one or more computer-readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be implemented in the form of program commands that can be executed through various computer means and recorded on a computer-readable medium. The computer-readable medium may include program commands, data files, data structures, etc., alone or in combination. The program commands recorded on the medium may be those specially designed and configured for the embodiment or may be those known to and available to those skilled in the art of computer software. Examples of the computer-readable recording medium include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, magneto-optical media such as floptical disks, and hardware devices specially configured to store and execute program commands such as ROMs, RAMs, flash memories, etc. Examples of the program commands include not only machine language codes generated by a compiler but also high-level language codes that can be executed by a computer using an interpreter, etc. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiment, and vice versa.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.Although the embodiments have been described above by way of limited examples and drawings, those skilled in the art can make various modifications and variations from the above description. For example, appropriate results can be achieved even if the described techniques are performed in a different order than the described method, and/or components of the described system, structure, device, circuit, etc. are combined or combined in a different form than the described method, or are replaced or substituted by other components or equivalents.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also included in the scope of the claims described below.
10 : 선행 학습 모듈
20 : 웹페이지 입력 모듈
30 : 레이아웃 커팅 모듈
40 : 제1 레이아웃 분류 모듈
50 : 제2 레이아웃 분류 모듈
60 : 레이아웃 분석 모듈10: Pre-learning module
20: Webpage input module
30 : Layout cutting module
40: 1st layout classification module
50: 2nd layout classification module
60: Layout Analysis Module
Claims (5)
레이아웃 분류가 필요한 웹페이지가 입력되는 웹페이지 입력 모듈;
입력된 웹페이지가 레이아웃별로 커팅되는 레이아웃 커팅 모듈;
커팅된 레이아웃이 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록부, 갤러리부 및 신규부 중 하나로 분류되는 제1 레이아웃 분류 모듈;
상기 제1 레이아웃 분류 모듈에서 분류된 레이아웃이 다시 세분류 태그에 의해 분류되는 제2 레이아웃 분류 모듈; 및
상기 세분류 태그에 의해 분류된 레이아웃의 단락의 높이, 단락의 너비 및 텍스트의 위치가 분석되고 저장되는 레이아웃 분석 모듈;를 포함하는 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템에 있어서,
상기 제1 레이아웃 분류 모듈은
웹페이지의 가장 상단에 위치하며, 로고와 메뉴가 포함되는 헤더부;
웹페이지의 가장 하단에 위치하며, 사이트 정보, 개인정보보호와 관련된 링크가 포함되는 푸터부;
상기 헤더부 및 푸터부 사이에 위치하며, 광고성 메시지 또는 광고성 이미지가 포함되는 배너부;
상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 2개 영역으로 분리되는 2단블록부;
상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 3개 영역으로 분리되는 3단블록부;
상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 4개 영역으로 분리되는 4단블록부;
상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 5개 영역으로 분리되는 5단블록부;
상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 또는 텍스트 단락이 6개 내지 8 영역으로 분리되는 단블록부;
상기 헤더부 및 푸터부 사이에 위치하며, 이미지 단락 중 영역 구분이 모호한 단락인 갤러리부;
새로운 구성을 추가할 수 있는 신규부를 포함하며,
상기 헤더부, 푸터부, 배너부, 2단블록부, 3단블록부, 4단블록부, 5단블록부, 단블록, 갤러리부 및 신규부는 다시 세분류되고, 이에 대응하는 영문 또는 숫자로 조합된 세분류 태그를 포함하고,
상기 제2 레이아웃 분류 모듈은
상기 헤더부의 좌측로고헤더는 LLH, 중앙로고헤더는 CLH로 분류되고,
상기 푸터부의 푸터는 FT로 분류되고,
상기 배너부의 배너는 HI11, 이미지 및 텍스트는 HI11T, 텍스트 및 이미지는 HTI11, 좌측타이틀은 LT, 중앙타이틀은 CT, 여백은 WS로 분류되고,
상기 2단블록부의 2단블록은 HI21, 이미지 및 3층리스트는 HI11I13, 3층리스트 및 이미지는 HI31I11, 텍스트 상하반전은 HI11TTI11, 텍스트 상하반전역방향은 HTI11I11T로 분류되고,
상기 3단블록부의 3단블록은 HI31, 이미지 및 2단리스트는 HI11I21, 2단리스트 및 이미지는 HI21I11, 텍스트 및 3단리스트는 HTI31, 3단리스트 및 텍스트는 HI31T, 캐러셀은 C31로 분류되고,
상기 4단블록부의 4단블록은 HI41, 이미지 및 3단리스트는 HI11I31, 3단리스트 및 이미지는 HI31I11, 텍스트 및 4단리스트는 HTI41, 4단리스트 및 텍스트는 HI41T로 분류되고,
상기 5단블록부의 5단블록은 HI51, 이미지 및 4단리스트는 HI11I41, 4단리스트 및 이미지는 HI41I11로 분류되고,
상기 단블록부의 6단블록은 HI61, 7단블록은 HI71, 8단블록은 HI81로 분류되고,
상기 갤러리부의 갤러리는 GR, 이미지 및 2층리스트는 HI11I12, 2층리스트 및 이미지는 HI12I11, 이미지 및 2단2층리스트는 HI11I22, 2단2층리스트 및 이미지는 HI22I11, 이미지 및 3단2층리스트는 HI11I32, 3단2층리스트 및 이미지는 HI32I11로 분류되고,
상기 신규부의 세로형 2층리스트는 VI11I12, 세로형 3층리스트는 VI11I13 및 카테고리는 O11로 분류되는 것을 특징으로 하는 인공지능 분석을 위한 웹페이지 레이아웃의 분류 시스템.A pre-learning module where preprocessed web pages are learned by artificial intelligence;
A webpage input module where webpages requiring layout classification are input;
Layout cutting module where the input web page is cut according to layout;
A first layout classification module in which the cut layout is classified into one of a header section, a footer section, a banner section, a two-column block section, a three-column block section, a four-column block section, a five-column block section, a single block section, a gallery section, and a new section;
A second layout classification module in which the layout classified in the first layout classification module is further classified by a sub-classification tag; and
In a classification system of web page layout for artificial intelligence analysis, including a layout analysis module in which the height of paragraphs, width of paragraphs, and position of text of layouts classified by the above-mentioned classification tags are analyzed and stored;
The above first layout classification module
The header section, located at the very top of the webpage and containing the logo and menu;
The footer, located at the very bottom of the webpage, contains site information and links related to privacy;
A banner section located between the header section and the footer section and containing an advertising message or advertising image;
A two-block section located between the header and footer sections, in which an image paragraph or text paragraph is divided into two areas;
A three-block section located between the header and footer sections, in which image paragraphs or text paragraphs are divided into three areas;
A four-block section located between the header and footer sections, in which image paragraphs or text paragraphs are divided into four areas;
A 5-block section located between the header and footer sections, in which image paragraphs or text paragraphs are divided into 5 areas;
A single block section located between the header section and the footer section, in which image paragraphs or text paragraphs are divided into 6 to 8 areas;
The gallery section is located between the header and footer sections, and is a section with ambiguous area division among image paragraphs;
Includes a new section where new configurations can be added,
The above header section, footer section, banner section, two-block section, three-block section, four-block section, five-block section, single block, gallery section and new section are further subdivided and include subdivision tags composed of corresponding English letters or numbers.
The above second layout classification module
The left logo header of the above header section is classified as LLH, and the center logo header is classified as CLH.
The footer of the above footer section is classified as FT,
The banner of the above banner section is classified as HI11, images and text as HI11T, text and images as HTI11, left title as LT, center title as CT, and margin as WS.
The 2nd block of the above 2nd block section is classified as HI21, the image and 3rd layer list as HI11I13, the 3rd layer list and image as HI31I11, the text upside-down inversion as HI11TTI11, and the text upside-down inversion direction as HTI11I11T.
The 3-stage block of the above 3-stage block section is classified as HI31, the image and 2-stage list as HI11I21, the 2-stage list and image as HI21I11, the text and 3-stage list as HTI31, the 3-stage list and text as HI31T, and the carousel as C31.
The 4-stage block of the above 4-stage block section is classified as HI41, the image and 3-stage list are classified as HI11I31, the 3-stage list and image are classified as HI31I11, the text and 4-stage list are classified as HTI41, and the 4-stage list and text are classified as HI41T.
The 5-stage block of the above 5-stage block section is classified as HI51, the image and 4-stage list are classified as HI11I41, and the 4-stage list and image are classified as HI41I11.
The 6-stage block of the above single block section is classified as HI61, the 7-stage block as HI71, and the 8-stage block as HI81.
The gallery in the above gallery section is classified as GR, images and 2-story lists as HI11I12, 2-story lists and images as HI12I11, images and 2-story 2-story lists as HI11I22, 2-story 2-story lists and images as HI22I11, images and 3-story 2-story lists as HI11I32, and 3-story 2-story lists and images as HI32I11.
A classification system of web page layout for artificial intelligence analysis, characterized in that the vertical two-tier list of the above new section is classified as VI11I12, the vertical three-tier list is classified as VI11I13, and the category is classified as O11.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020240092713A KR102818562B1 (en) | 2024-07-12 | 2024-07-12 | Taxonomy of Webpage Layouts for AI Analysis, Classification System of Webpage Layouts for AI Analysis And Classification Method of Webpage Layouts by the Same |
| PCT/KR2025/099823 WO2026015012A1 (en) | 2024-07-12 | 2025-03-18 | Webpage layout classification hierarchy and classification system for artificial intelligence analysis, and webpage layout classification method thereby |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020240092713A KR102818562B1 (en) | 2024-07-12 | 2024-07-12 | Taxonomy of Webpage Layouts for AI Analysis, Classification System of Webpage Layouts for AI Analysis And Classification Method of Webpage Layouts by the Same |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR102818562B1 true KR102818562B1 (en) | 2025-06-10 |
Family
ID=96012594
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020240092713A Active KR102818562B1 (en) | 2024-07-12 | 2024-07-12 | Taxonomy of Webpage Layouts for AI Analysis, Classification System of Webpage Layouts for AI Analysis And Classification Method of Webpage Layouts by the Same |
Country Status (2)
| Country | Link |
|---|---|
| KR (1) | KR102818562B1 (en) |
| WO (1) | WO2026015012A1 (en) |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101340588B1 (en) | 2012-02-29 | 2013-12-11 | 주식회사 팬택 | Method and apparatus for comprising webpage |
| KR20130143718A (en) * | 2011-03-15 | 2013-12-31 | 퀄컴 인코포레이티드 | Machine learning method to identify independent tasks for parallel layout in web browsers |
| KR101604838B1 (en) | 2014-05-30 | 2016-03-18 | 최규철 | Method of providing internet webpages |
| KR101958577B1 (en) | 2017-12-29 | 2019-03-14 | 김기수 | Method for analyzing web page based on web page capture image and system using the same |
| JP2019531524A (en) * | 2016-07-27 | 2019-10-31 | ウィックス.コム リミテッド. | Website construction system and method for website construction system |
| KR20210040611A (en) * | 2019-10-04 | 2021-04-14 | (주)텐스 | Method and apparatus for generating web page |
| KR20220107902A (en) * | 2021-01-25 | 2022-08-02 | 베이징 시아오미 모바일 소프트웨어 컴퍼니 리미티드 | Rendering method and apparatus, electronic device and storage medium |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9747556B2 (en) * | 2014-08-20 | 2017-08-29 | Vertafore, Inc. | Automated customized web portal template generation systems and methods |
-
2024
- 2024-07-12 KR KR1020240092713A patent/KR102818562B1/en active Active
-
2025
- 2025-03-18 WO PCT/KR2025/099823 patent/WO2026015012A1/en active Pending
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20130143718A (en) * | 2011-03-15 | 2013-12-31 | 퀄컴 인코포레이티드 | Machine learning method to identify independent tasks for parallel layout in web browsers |
| KR101340588B1 (en) | 2012-02-29 | 2013-12-11 | 주식회사 팬택 | Method and apparatus for comprising webpage |
| KR101604838B1 (en) | 2014-05-30 | 2016-03-18 | 최규철 | Method of providing internet webpages |
| JP2019531524A (en) * | 2016-07-27 | 2019-10-31 | ウィックス.コム リミテッド. | Website construction system and method for website construction system |
| KR101958577B1 (en) | 2017-12-29 | 2019-03-14 | 김기수 | Method for analyzing web page based on web page capture image and system using the same |
| KR20210040611A (en) * | 2019-10-04 | 2021-04-14 | (주)텐스 | Method and apparatus for generating web page |
| KR20220107902A (en) * | 2021-01-25 | 2022-08-02 | 베이징 시아오미 모바일 소프트웨어 컴퍼니 리미티드 | Rendering method and apparatus, electronic device and storage medium |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2026015012A1 (en) | 2026-01-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7836390B2 (en) | Strategies for processing annotations | |
| JP6141921B2 (en) | Document reconstruction method and system | |
| US20180129944A1 (en) | Document understanding using conditional random fields | |
| US20070098266A1 (en) | Cascading cluster collages: visualization of image search results on small displays | |
| CN110427488B (en) | Document processing method and device | |
| KR20120083866A (en) | Ordering document content | |
| US20140129918A1 (en) | Viewing hierarchical document summaries using tag clouds | |
| WO2021102387A1 (en) | Generating higher-level semantics data for development of visual content | |
| WO2015061046A2 (en) | Method and apparatus for performing topic-relevance highlighting of electronic text | |
| US12475667B2 (en) | Method, device, and system for outputting description of patent reference sign | |
| US10372980B2 (en) | Electronic form identification using spatial information | |
| US20170235582A1 (en) | Systems and methods method for providing an interactive help file for host software user interfaces | |
| EP4302227A1 (en) | System and method for automated document analysis | |
| US20220076109A1 (en) | System for contextual and positional parameterized record building | |
| US10055486B1 (en) | System and method for real world event summarization with microblog data | |
| Weerasinghe et al. | Enhancing Web Scraping with Artificial Intelligence: A Review | |
| Hoffswell et al. | Interactive repair of tables extracted from pdf documents on mobile devices | |
| Lee et al. | Deep learning-based digitalization of a part catalog book to generate part specification by a neutral reference data dictionary | |
| Antoniak et al. | Natural language processing techniques on oil and gas drilling data | |
| KR102818562B1 (en) | Taxonomy of Webpage Layouts for AI Analysis, Classification System of Webpage Layouts for AI Analysis And Classification Method of Webpage Layouts by the Same | |
| CN115098812B (en) | A method, device and storage medium for extracting text from a bidding webpage | |
| Ishihara et al. | Analyzing visual layout for a non-visual presentation-document interface | |
| KR20230057216A (en) | System for extracting document data and method thereof | |
| JP7534016B2 (en) | Table generation method and system | |
| EP4125066B1 (en) | Method and system for table structure recognition via deep spatial association of words |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PA0302 | Request for accelerated examination |
St.27 status event code: A-1-2-D10-D17-exm-PA0302 St.27 status event code: A-1-2-D10-D16-exm-PA0302 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| R15-X000 | Change to inventor requested |
St.27 status event code: A-3-3-R10-R15-oth-X000 |
|
| R16-X000 | Change to inventor recorded |
St.27 status event code: A-3-3-R10-R16-oth-X000 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| P14 | Amendment of ip right document requested |
Free format text: ST27 STATUS EVENT CODE: A-5-5-P10-P14-NAP-X000 (AS PROVIDED BY THE NATIONAL OFFICE) |
|
| P14-X000 | Amendment of ip right document requested |
St.27 status event code: A-5-5-P10-P14-nap-X000 |
|
| P14 | Amendment of ip right document requested |
Free format text: ST27 STATUS EVENT CODE: A-5-5-P10-P14-NAP-X000 (AS PROVIDED BY THE NATIONAL OFFICE) |
|
| P14-X000 | Amendment of ip right document requested |
St.27 status event code: A-5-5-P10-P14-nap-X000 |