KR102823051B1 - Server and method for automatic collection and stylization processing of unstructured product data - Google Patents
Server and method for automatic collection and stylization processing of unstructured product data Download PDFInfo
- Publication number
- KR102823051B1 KR102823051B1 KR1020240161754A KR20240161754A KR102823051B1 KR 102823051 B1 KR102823051 B1 KR 102823051B1 KR 1020240161754 A KR1020240161754 A KR 1020240161754A KR 20240161754 A KR20240161754 A KR 20240161754A KR 102823051 B1 KR102823051 B1 KR 102823051B1
- Authority
- KR
- South Korea
- Prior art keywords
- template
- product
- information
- score
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/106—Display of layout of documents; Previewing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Electronic shopping [e-shopping] utilising user interfaces specially adapted for shopping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
본 발명의 일 측면은, 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 및 방법을 제공한다. 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버는, 적어도 하나의 프로세서(processor) 및 적어도 하나의 프로세서가 복수의 동작을 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다. 복수의 동작은, 외부 서버로부터 상품 정보를 수신하는 동작, 외부 서버로부터 템플릿 정보를 수신하는 동작, 수신된 상품 정보 및 템플릿 정보의 메타데이터를 추출하는 동작, 추출한 메타데이터를 CSV형식으로 저장하고, 상품 정보로부터 추출된 메타데이터로부터 상품 카테고리를 특정하는 동작 및 특정된 상품 카테고리를 기초로, 미리 정해진 상품 페이지 레이아웃 템플릿에 상품 정보로부터 추출된 메타 데이터를 기초로 상품 정보를 할당하는 동작을 포함할 수 있다.One aspect of the present invention provides a server and method for automatically collecting and stylizing unstructured product data. The server for automatically collecting and stylizing unstructured product data may include at least one processor and a memory storing instructions for instructing the at least one processor to perform a plurality of operations. The plurality of operations may include an operation for receiving product information from an external server, an operation for receiving template information from an external server, an operation for extracting metadata of the received product information and template information, an operation for storing the extracted metadata in a CSV format and specifying a product category from the metadata extracted from the product information, and an operation for allocating the product information to a predetermined product page layout template based on the metadata extracted from the product information based on the specified product category.
Description
본 발명은 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 및 방법에 관한 것으로, 더욱 상세하게는 판매중인 상품의 데이터를 수집하여 특정 패턴에 따라 스타일화 하여 특정한 형식으로 재가공하는, 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 및 방법에 관한 것이다.The present invention relates to a server and method for automatically collecting and stylizing non-standard product data, and more specifically, to a server and method for automatically collecting and stylizing non-standard product data that collects data of products being sold, stylizes the data according to a specific pattern, and reprocesses the data into a specific format.
최근 전자 상거래 플랫폼에서 상품 정보는 주로 비정형 데이터 형태로 존재한다. 이러한 데이터는 이미지, 동영상, 파편화된 텍스트 등 다양한 형태로 제공되며, 상품의 특성과 정보를 파악하기 위해 구조화된 형태로의 전환이 필요할 수 있다.Recently, product information on e-commerce platforms mainly exists in the form of unstructured data. This data is provided in various forms such as images, videos, and fragmented texts, and may need to be converted into a structured form to understand the characteristics and information of the product.
그러나 기존의 데이터 처리 방법은 수동적인 요소가 많고 시간이 많이 소요되며, 데이터의 오류를 일으키기 쉬워 효율성이 낮은 측면이 있다.However, existing data processing methods have many manual elements, are time-consuming, and are prone to data errors, resulting in low efficiency.
상품 데이터를 효과적으로 활용하기 위해서는 자동화된 도구가 필요하며, 이를 위해 OCR 기술을 사용하여 이미지 내 텍스트를 추출하고, LLM과 같은 인공지능 기술을 활용하여 이를 분석하고 재구성하는 과정이 요구될 수 있다.Effectively leveraging product data requires automated tools, which may require using OCR technology to extract text from images and AI technologies such as LLM to analyze and reconstruct it.
이와 같은 기술은 상품 데이터를 빠르고 정확하게 처리할 수 있게 하며, 상품 카테고리별로 최적화된 데이터 형식을 제공함으로써 사용자 경험을 향상시킬 수 있다.Such technologies can enable fast and accurate processing of product data and improve user experience by providing optimized data formats for each product category.
현재 상품 데이터 처리 방법은 대부분 수동으로 진행되고 있으며, 자동화 기술 또한 제한적으로 적용되고 있으며, 특히, 상품의 다양한 카테고리별로 특화된 데이터 가공 방법이 부족하여, 이로 인해 상품 정보의 정확도와 가용성이 떨어지는 문제가 있습니다. 또한, 기존의 시스템은 데이터의 재가공 과정에서 자주 발생하는 오류를 효과적으로 관리하지 못하며, 데이터의 스타일화 가공에 있어서도 한계가 있다.Currently, most product data processing methods are manual, and automation technology is also applied to a limited extent. In particular, there is a lack of specialized data processing methods for each product category, which results in problems such as reduced accuracy and availability of product information. In addition, existing systems do not effectively manage errors that frequently occur during the data reprocessing process, and there are also limitations in stylization processing of data.
이러한 문제를 해결하기 위해 상품의 비정형 데이터를 자동으로 수집하고, 이를 분석 및 가공하여 효율적으로 메타데이터로 전환하기 위한 연구가 필요한 실정이다.To solve these problems, research is needed to automatically collect unstructured product data, analyze and process it, and efficiently convert it into metadata.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 및 방법을 제공하는 데 있다.The purpose of the present invention to solve the above problems is to provide a server and method for automatically collecting and stylizing non-standard product data.
상기 목적을 달성하기 위한 본 발명의 일 측면은, 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 및 방법을 제공한다.One aspect of the present invention to achieve the above object provides a server and method for automatically collecting and stylizing non-standard product data.
상품 비정형 데이터 자동 수집 및 스타일화 가공 서버는, 적어도 하나의 프로세서(processor) 및 적어도 하나의 프로세서가 복수의 동작을 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다.A product non-standard data automatic collection and stylization processing server may include at least one processor and a memory storing instructions that instruct the at least one processor to perform a plurality of operations.
복수의 동작은, 외부 서버로부터 상품 정보를 수신하는 동작, 외부 서버로부터 템플릿 정보를 수신하는 동작, 수신된 상품 정보 및 템플릿 정보의 메타데이터를 추출하는 동작, 추출한 메타데이터를 CSV형식으로 저장하고, 상품 정보로부터 추출된 메타데이터로부터 상품 카테고리를 특정하는 동작 및 특정된 상품 카테고리를 기초로, 미리 정해진 상품 페이지 레이아웃 템플릿에 상품 정보로부터 추출된 메타 데이터를 기초로 상품 정보를 할당하는 동작을 포함할 수 있다.The plurality of operations may include an operation of receiving product information from an external server, an operation of receiving template information from an external server, an operation of extracting metadata of the received product information and template information, an operation of saving the extracted metadata in CSV format, an operation of specifying a product category from the metadata extracted from the product information, and an operation of assigning the product information to a predefined product page layout template based on the metadata extracted from the product information based on the specified product category.
상품 정보를 상호 결합하여, 상품 기본 정보 점수 및 상품 고급 정보 점수를 산출하고, 산출된 상품 기본 정보 점수 및 상품 고급 정보 점수의 가중합으로부터 상품 정보 점수를 산출하는 동작, 템플릿 정보를 상호 결합하여, 템플릿 기본 구조 점수 및 템플릿 기능 점수를 산출하고, 산출된 템플릿 기본 구조 점수 및 템플릿 기능 점수의 가중합으로부터 템플릿 정보 점수를 산출하는 동작, 산출된 상품 정보 점수 및 템플릿 정보 점수의 가중합으로부터 스타일 최적화 점수를 산출하는 동작 및 산출된 스타일 최적화 점수, 템플릿 복잡도 조정계수() 및 기본 템플릿 항목의 곱으로부터 최대 템플릿 항목을 산출하는 동작을 더 포함할 수 있다. An operation of calculating a product basic information score and a product advanced information score by combining product information, and calculating a product information score from a weighted sum of the calculated product basic information score and product advanced information score, an operation of calculating a template basic structure score and a template function score by combining template information, and calculating a template information score from a weighted sum of the calculated template basic structure score and template function score, an operation of calculating a style optimization score from a weighted sum of the calculated product information score and template information score, and calculating a template complexity adjustment coefficient ( ) and may further include an operation of producing a maximum template item from the product of the base template items.
최대 템플릿 항목을 산출하는 동작은, 템플릿 정보로부터 각 템플릿의 색상 다양성 지수, 글꼴 다양성 지수, 이미지 다양성 지수 및 레이아웃 다양성 지수의 평균으로 템플릿 복잡도 조정계수()를 산출하는 동작을 더 포함할 수 있다. The operation of producing the maximum template items is to adjust the template complexity by averaging the color diversity index, font diversity index, image diversity index, and layout diversity index of each template from the template information. ) may further include actions that produce a result.
상기와 같은 본 발명에 따른 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 및 방법을 이용할 경우에는 상품 정보의 정확도를 높이고, 데이터 처리 과정의 자동화를 통한 효율성을 개선하며, 카테고리별 맞춤 데이터 형식을 제공하여 사용자의 경험을 최적화할 수 있다.When using the server and method for automatically collecting and stylizing non-standard product data according to the present invention as described above, the accuracy of product information can be increased, efficiency can be improved through automation of the data processing process, and user experience can be optimized by providing customized data formats by category.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The effects obtainable from the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art to which the present invention belongs from the description below.
본 발명의 특정한 바람직한 실시예들의 상기에서 설명한 바와 같은 또한 다른 측면들과, 특징들 및 이득들은 첨부 도면들과 함께 처리되는 하기의 설명으로부터 보다 명백하게 될 것이다.
도 1은 본 발명의 일 실시예에 따른 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버의 구동 환경을 나타낸 예시도이다.
도 2는 상품 비정형 데이터 자동 수집 및 스타일화 가공을 설명하기 위한 예시도이다.
도 3은 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버의 일 예를 도시한 예시도이다.
도 4는 도 1에 따른 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버에 대한 하드웨어 구성도이다.
상기 도면들을 통해, 유사 참조 번호들은 동일한 혹은 유사한 엘리먼트들과, 특징들 및 구조들을 도시하기 위해 사용된다는 것에 유의해야만 한다.The above and other aspects, features and advantages of certain preferred embodiments of the present invention will become more apparent from the following description taken in conjunction with the accompanying drawings.
Figure 1 is an exemplary diagram showing the operating environment of a server for automatically collecting and stylizing non-standard product data according to one embodiment of the present invention.
Figure 2 is an example diagram explaining automatic collection and stylization processing of non-standard product data.
Figure 3 is an example diagram illustrating an example of a server for automatically collecting and stylizing non-standard product data.
Figure 4 is a hardware configuration diagram for a server for automatically collecting and stylizing non-standard product data according to Figure 1.
It should be noted that throughout the above drawings, like reference numerals are used to illustrate identical or similar elements, features and structures.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the attached drawings.
실시예를 설명함에 있어서 본 발명이 속하는 기술 분야에 익히 알려져 있고 본 발명과 직접적으로 관련이 없는 기술 내용에 대해서는 설명을 생략한다. 이는 불필요한 설명을 생략함으로써 본 발명의 요지를 흐리지 않고 더욱 명확히 전달하기 위함이다.In describing the embodiments, descriptions of technical contents that are well known in the technical field to which the present invention belongs and are not directly related to the present invention will be omitted. This is to convey the gist of the present invention more clearly without obscuring it by omitting unnecessary descriptions.
마찬가지 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 개략적으로 도시되었다. 또한, 각 구성요소의 크기는 실제 크기를 전적으로 반영하는 것이 아니다. 각 도면에서 동일한 또는 대응하는 구성요소에는 동일한 참조 번호를 부여하였다.For the same reason, some components in the attached drawings are exaggerated, omitted, or schematically illustrated. In addition, the size of each component does not entirely reflect the actual size. The same or corresponding components in each drawing are given the same reference numbers.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.The advantages and features of the present invention, and the methods for achieving them, will become clear with reference to the embodiments described in detail below together with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but may be implemented in various different forms, and the present embodiments are provided only to make the disclosure of the present invention complete and to fully inform those skilled in the art of the scope of the invention, and the present invention is defined only by the scope of the claims. Like reference numerals refer to like elements throughout the specification.
이때, 처리 흐름도 도면들의 각 블록과 흐름도 도면들의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수 있음을 이해할 수 있을 것이다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 흐름도 블록(들)에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 흐름도 블록(들)에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 흐름도 블록(들)에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.At this time, it will be understood that each block of the processing flow diagrams and combinations of the flow diagrams can be performed by computer program instructions. These computer program instructions can be loaded onto a processor of a general-purpose computer, a special-purpose computer, or other programmable data processing equipment, so that the instructions executed by the processor of the computer or other programmable data processing equipment create a means for performing the functions described in the flow diagram block(s). These computer program instructions can also be stored in a computer-available or computer-readable memory that can be directed to a computer or other programmable data processing equipment to implement the functions in a specific manner, so that the instructions stored in the computer-available or computer-readable memory can also produce an article of manufacture that includes an instruction means for performing the functions described in the flow diagram block(s). Since the computer program instructions may be installed on a computer or other programmable data processing apparatus, a series of operational steps may be performed on the computer or other programmable data processing apparatus to produce a computer-executable process, so that the instructions executing the computer or other programmable data processing apparatus may also provide steps for executing the functions described in the flowchart block(s).
또한, 각 블록은 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실행 예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.Additionally, each block may represent a module, segment, or portion of code that contains one or more executable instructions for performing a particular logical function(s). It should also be noted that in some alternative implementation examples, the functions mentioned in the blocks may occur out of order. For example, two blocks shown in succession may in fact be performed substantially concurrently, or the blocks may sometimes be performed in reverse order, depending on the functionality they perform.
이 때, 본 실시 예에서 사용되는 '~부'라는 용어는 소프트웨어 또는 FPGA(field-Programmable Gate Array) 또는 ASIC(Application Specific Integrated Circuit)과 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다. 그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.Here, the term '~ part' used in the present embodiment means software or hardware components such as FPGA (field-programmable gate array) or ASIC (application specific integrated circuit), and the '~ part' performs certain roles. However, the '~ part' is not limited to software or hardware. The '~ part' may be configured to be in an addressable storage medium and may be configured to reproduce one or more processors. Accordingly, as an example, the '~ part' includes components such as software components, object-oriented software components, class components, and task components, and processes, functions, properties, procedures, subroutines, segments of program code, drivers, firmware, microcode, circuits, data, databases, data structures, tables, arrays, and variables. The functions provided in the components and '~ parts' may be combined into a smaller number of components and '~ parts' or further separated into additional components and '~ parts'. Additionally, the components and '~parts' may be implemented to regenerate one or more CPUs within the device or secure multimedia card.
본 발명의 실시예들을 구체적으로 설명함에 있어서, 특정 시스템의 예를 주된 대상으로 할 것이지만, 본 명세서에서 청구하고자 하는 주요한 요지는 유사한 기술적 배경을 가지는 여타의 통신 시스템 및 서비스에도 본 명세서에 개시된 범위를 크게 벗어나지 아니하는 범위에서 적용 가능하며, 이는 당해 기술분야에서 숙련된 기술적 지식을 가진 자의 판단으로 가능할 것이다.In specifically describing embodiments of the present invention, examples of specific systems will be mainly targeted, but the main point claimed in this specification can be applied to other communication systems and services having similar technical backgrounds without significantly departing from the scope disclosed in this specification, and this can be done at the discretion of a person skilled in the relevant technical field.
도 1은 본 발명의 일 실시예에 따른 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버의 구동 환경을 나타낸 예시도이다.Figure 1 is an exemplary diagram showing the operating environment of a server for automatically collecting and stylizing non-standard product data according to one embodiment of the present invention.
도 1을 참조하면, 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 (100)(이하, '서버(100)'라고 함)는 사용자 단말(10)을 통해 적어도 하나 이상의 상품 정보를 수신할 수 있다. 이때, 사용자 단말(10)은 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버를 이용하고자 하는 사용자의 단말로써, 수집된 상품 정보를 적어도 하나 이상의 온라인 쇼핑몰에 상품을 등록하고자 하는 사용자일 수 있다.Referring to FIG. 1, the product non-standard data automatic collection and stylization processing server (100) (hereinafter referred to as 'server (100)') can receive at least one piece of product information through a user terminal (10). At this time, the user terminal (10) is a terminal of a user who wishes to use the product non-standard data automatic collection and stylization processing server, and may be a user who wishes to register the collected product information in at least one online shopping mall.
여기서, 사용자 단말(10)은 통신 가능한 데스크탑 컴퓨터(desktop computer), 랩탑 컴퓨터(laptop computer), 노트북(notebook), 스마트폰(smart phone), 태블릿 PC(tablet PC), 모바일폰(mobile phone), 스마트 워치(smart watch), 스마트 글래스(smart glass), e-book 리더기, PMP(portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 디지털 카메라(digital camera), DMB(digital multimedia broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player), PDA(Personal Digital Assistant)등을 포함할 수 있다.Here, the user terminal (10) may include a communicable desktop computer, a laptop computer, a notebook, a smart phone, a tablet PC, a mobile phone, a smart watch, a smart glass, an e-book reader, a portable multimedia player (PMP), a portable game console, a navigation device, a digital camera, a digital multimedia broadcasting (DMB) player, a digital audio recorder, a digital audio player, a digital video recorder, a digital video player, a PDA (Personal Digital Assistant), etc.
또한, 서버(100)는 외부의 빅데이터 서버(110)와 유무선 네트워크로 연결되어, 템플릿 정보를 수신할 수 있다. 여기서 템플릿은 미리 생성된 상품 페이지 레이아웃 템플릿을 의미하며, 온라인 쇼핑몰에서 상품을 등록하기 위해 각 온라인 쇼핑몰의 상품 등록 페이지에서 제공되는 상품 등록 페이지 레이아웃 템플릿일 수 있다.In addition, the server (100) may be connected to an external big data server (110) via a wired or wireless network to receive template information. Here, the template means a pre-created product page layout template, and may be a product registration page layout template provided on the product registration page of each online shopping mall to register a product in the online shopping mall.
여기서, 상품 정보는 가격 변동 지수, 재고 유동성 비율, 색상 다양성 점수, 사이즈 옵션 지수, 원산지 다양성 지수, 제조사 다양성 지수, 판매채널 다변화 지수, 재고회전율, 브랜드 인지도 점수, 친환경 인증 비율, 사용자 피드백 반응 시간, 보증기간 연장률, 소비자 만족도 점수, 배송 효율성 지수, 반품정책 점수, 특허 보유 제품 비율을 포함할 수 있다.Here, product information may include price change index, inventory liquidity ratio, color diversity score, size option index, origin diversity index, manufacturer diversity index, sales channel diversification index, inventory turnover rate, brand awareness score, eco-friendly certification rate, user feedback response time, warranty extension rate, consumer satisfaction score, delivery efficiency index, return policy score, and patented product ratio.
여기서, 템플릿 정보는 템플릿 매칭 정확도, 데이터 태깅 자동화 비율, 템플릿 유연성 지수, 멀티모달 통합 정도, 템플릿 조정 반응시간, 제품 속성 추출 효율성, 데이터 표준화 지수, 템플릿 갱신 빈도, 자동 분류 성능, 동적 템플릿 조정 기능, 템플릿 기반 콘텐츠 생성 속도, 데이터 보안 지수, 사용자 경험 최적화 점수, 인공지능 통합 효율성, API연동성 지수, 템플릿 기반 리포팅 효율성, 콘텐츠 생성 자동화 지수, 메타데이터 형식화 효율성, 상품 비교 분석 자동화 정도, 인터랙티브 시각화 효과도를 포함할 수 있다.Here, the template information may include template matching accuracy, data tagging automation ratio, template flexibility index, multimodal integration degree, template adjustment response time, product attribute extraction efficiency, data standardization index, template update frequency, automatic classification performance, dynamic template adjustment function, template-based content creation speed, data security index, user experience optimization score, artificial intelligence integration efficiency, API linkage index, template-based reporting efficiency, content creation automation index, metadata formatting efficiency, product comparison analysis automation degree, and interactive visualization effectiveness.
여기서, 유무선 네트워크는 블루투스(Bluetooth) 통신, BLE(Bluetooth Low Energy) 통신, 근거리 무선 통신(Near Field Communication, NFC), WLAN 통신, 지그비(Zigbee) 통신, 적외선(Infrared Data Association, IrDA) 통신, WFD(Wi-Fi Direct) 통신, UWB(ultra-wideband) 통신, Ant+ 통신, WIFI 통신, RFID(Radio Frequency Identification) 통신 등 다양한 통신방법을 포함할 수 있으나, 이에 제한되는 것은 아니다.Here, the wired/wireless network may include various communication methods such as, but is not limited to, Bluetooth communication, BLE (Bluetooth Low Energy) communication, Near Field Communication (NFC), WLAN communication, Zigbee communication, Infrared Data Association (IrDA) communication, WFD (Wi-Fi Direct) communication, UWB (ultra-wideband) communication, Ant+ communication, WIFI communication, and RFID (Radio Frequency Identification) communication.
한편, 서버(100)는 상품 정보를 수신하면 적어도 하나의 속성에 따라 상품 정보를 적어도 하나의 카테고리로 분류할 수 있다.Meanwhile, when the server (100) receives product information, it can classify the product information into at least one category based on at least one attribute.
그 다음, 서버(100)는 각 카테고리에 분류된 상품 정보를 상호 결합하여 상품 정보점수를 산출할 수 있다.Next, the server (100) can calculate a product information score by cross-linking product information classified in each category.
서버(100)는 템플릿 정보를 수신하면 적어도 하나의 속성에 따라 템플릿 정보를 적어도 하나의 카테고리로 분류할 수 있다.When the server (100) receives template information, it can classify the template information into at least one category based on at least one attribute.
그 다음, 서버(100)는 각 카테고리에 분류된 템플릿 정보를 상호 결합하여 템플릿 정보 점수를 산출할 수 있다.Next, the server (100) can combine template information classified into each category to calculate a template information score.
한편, 서버(100)는 산출된 상품 정보점수 및 템플릿 정보 점수를 상호 결합하여 스타일 최적화 점수를 산출하고, 산출된 스타일 최적화 점수를 사용하여, 최대 템플릿 항목을 산출할 수 있다.Meanwhile, the server (100) can calculate a style optimization score by combining the calculated product information score and template information score, and can calculate a maximum template item using the calculated style optimization score.
이를 통해, 서로 다른 상품 페이지 레이아웃을 제공하는 온라인 쇼핑몰에서도 상품 정보를 재가공하여 제공함으로써, 사용자의 상품 관리 편의성을 증대시킬 수 있다.Through this, product information can be reprocessed and provided even in online shopping malls that provide different product page layouts, thereby increasing the convenience of product management for users.
도 2는 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버의 일 예를 도시한 예시도이다.Figure 2 is an example diagram illustrating an example of a server for automatically collecting and stylizing non-standard product data.
도 1 및 도 2를 참조하면, 서버(100)는 상품 데이터를 수집하여 특정 패턴에 따라 서로 다른 레이아웃 템플릿에 매핑하고, 상품 정보를 할당하여 상품 페이지를 생성할 수 있다. 예를 들어, 상품에 대한 정보는 비정형 데이터로써, 원본페이지(210)에서 획득될 수 있으며, 원본 페이지(210)는 상품 이미지(211) 및 적어도 하나 이상의 상품 정보(212-1, 212-2, 212-3)를 포함할 수 있다.Referring to FIGS. 1 and 2, the server (100) can collect product data, map it to different layout templates according to a specific pattern, and allocate product information to generate a product page. For example, information about a product can be obtained from an original page (210) as non-standard data, and the original page (210) can include a product image (211) and at least one piece of product information (212-1, 212-2, 212-3).
서버(100)는 상품 정보를 원본 페이지(210)로부터 수신하면, 적어도 하나 이상의 미리 생성된 상품 페이지 레이아웃 템플릿(220)에 각 정보를 할당하여 재가공할 수 있다.When the server (100) receives product information from the original page (210), it can reprocess the information by assigning each piece of information to at least one pre-generated product page layout template (220).
예컨대, 상품 페이지 레이아웃 템플릿(220)은 상품 이미지 영역(221) 및 적어도 하나 이상의 상품 정보 영역(221-1, 222-2)을 포함할 수 있다.For example, a product page layout template (220) may include a product image area (221) and at least one product information area (221-1, 222-2).
서버(100)는 상품 페이지 레이아웃 템플릿(220)으로부터 템플릿 정보를 획득하여, 상품 페이지 레이아웃 템플릿(220)의 상품 이미지 영역(221) 및 적어도 하나 이상의 상품 정보 영역(221-1, 222-2)에 상품 정보를 할당함으로써 재가공할 수 있다.The server (100) can obtain template information from the product page layout template (220) and reprocess it by assigning product information to the product image area (221) and at least one product information area (221-1, 222-2) of the product page layout template (220).
예를 들어, 서버(100)는 상품의 원본 정보를 획득할 수 있다. 원본 정보는 상품의 상세 페이지의 이미지 또는 웹사이트의 텍스트 등 비정형 데이터를 포함할 수 있다. 이러한 정보는 OCR(광학 문자 인식) 기술과 LLM(언어 모델링) 기술을 활용하여 텍스트 형태의 제품 메타 데이터로 변환되며, 이를 통해, 서버(100)는 데이터 취합 및 가공을 할 수 있다.For example, the server (100) can obtain original information of a product. The original information can include non-standard data such as an image of a product detail page or text of a website. This information is converted into product metadata in text form by utilizing OCR (optical character recognition) technology and LLM (language modeling) technology, and through this, the server (100) can collect and process data.
이때, 서버(100)는 상품의 메타 데이터를 추출하고 정리할 수 있다. 상품의 메타 데이터에는 제품의 이름, 규격, 가격, 브랜드, 제조사, 제조국가, 사용법, 특징, 구성품, 재료 등이 포함될 수 있으며, 서버(100)는 이 데이터를 수집하고 CSV 형식으로 정리하여 저장할 수 있다. 이 과정은 데이터베이스 또는 다른 저장 매체에 저장되어 후속 처리를 위해 사용될 수 있다.At this time, the server (100) can extract and organize the metadata of the product. The metadata of the product may include the product's name, specifications, price, brand, manufacturer, country of manufacture, usage, features, components, materials, etc., and the server (100) can collect this data and organize it in CSV format and store it. This process can be stored in a database or other storage medium and used for subsequent processing.
또한, 서버(100)는 수집된 데이터 중에서 상품 카테고리를 파악할 수 있다. 각 상품 카테고리에 따라 메타 데이터의 형식을 변형하여 제공할 수 있다. 예를 들어, '선크림' 카테고리의 경우, 서버(100)는 규격 데이터를 삭제하고, 사용법과 특징을 강조할 수 있다. 또한, 자외선 차단율과 전성분 정보를 필수적으로 포함시켜 데이터셋을 재가공한다. 이렇게 재가공된 데이터셋은 최종적으로 사용자에게 제공되며, 상품의 판매나 홍보에 사용될 수 있으며, 상품 판매 및 등록의 효율성을 증대시킬 수 있다.In addition, the server (100) can identify the product category among the collected data. The format of the metadata can be modified and provided according to each product category. For example, in the case of the 'sunscreen' category, the server (100) can delete the standard data and emphasize the usage and features. In addition, the data set is reprocessed by necessarily including the UV protection rate and full ingredient information. The data set reprocessed in this way is finally provided to the user and can be used for product sales or promotion, and can increase the efficiency of product sales and registration.
예를 들어, 온라인 쇼핑몰에 올라온 '남성용 선크림' 상품을 데이터 대상으로 할 경우, 서버(100)는 온라인 쇼핑몰 웹사이트에서 제품의 이름, 가격, 브랜드, 제조사, 상품 카테고리 등의 데이터를 수집한다. 서버(100)는 상세 페이지 이미지 파일을 OCR 기술로 텍스트화하고, 이를 LLM 기술로 분석하여 제품의 강점, 특징, 사용법 등의 데이터를 추가로 수집할 수 있다. 이렇게 수집된 데이터는 CSV 형식으로 정리되며, 서버(100)는 '선크림' 카테고리의 데이터 가공 규칙에 따라 크기와 무게 데이터를 삭제하고, 사용법과 자외선 차단율 정보를 강조하여 최종 제품 데이터셋을 생성하여 제공할 수 있다.For example, when the data target is a 'men's sunscreen' product posted on an online shopping mall, the server (100) collects data such as the product's name, price, brand, manufacturer, and product category from the online shopping mall website. The server (100) converts a detailed page image file into text using OCR technology and analyzes it using LLM technology to additionally collect data such as the product's strengths, features, and directions for use. The data collected in this way is organized in CSV format, and the server (100) can delete size and weight data and emphasize directions for use and UV protection rate information according to the data processing rules of the 'sunscreen' category to generate and provide a final product dataset.
이를 통해, 서버(100)는 다양한 온라인 판매 플랫폼에서 판매되는 상품들의 데이터를 효율적으로 관리하고 최적화된 정보를 소비자에게 제공함으로써, 상품의 시장성을 높이고 사용자 경험을 개선하는 데 기여할 수 있다.Through this, the server (100) can efficiently manage data on products sold on various online sales platforms and provide optimized information to consumers, thereby contributing to increasing the marketability of products and improving user experience.
도 3은 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버의 운영 환경을 나타낸 예시도이다.Figure 3 is an example diagram showing the operating environment of a server for automatic collection and stylization processing of non-standard product data.
도 3을 참조하면, 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 (이하, '서버(300)'라고 함)는 상품 정보 분석부(310), 템플릿 정보 분석부(320) 및 스타일 최적화부(330)를 포함할 수 있다.Referring to FIG. 3, the product non-standard data automatic collection and stylization processing server (hereinafter referred to as 'server (300)') may include a product information analysis unit (310), a template information analysis unit (320), and a style optimization unit (330).
상품 정보 분석부(310)는 사용자가 입력한 사용자 입력 상품 정보를 기초로 외부 서버로부터 상품 정보를 수신할 수 있다.The product information analysis unit (310) can receive product information from an external server based on user input product information entered by the user.
여기서, 상품 정보는 가격 변동 지수, 재고 유동성 비율, 색상 다양성 점수, 사이즈 옵션 지수, 원산지 다양성 지수, 제조사 다양성 지수, 판매채널 다변화 지수, 재고회전율, 브랜드 인지도 점수, 친환경 인증 비율, 사용자 피드백 반응 시간, 보증기간 연장률, 소비자 만족도 점수, 배송 효율성 지수, 반품정책 점수, 특허 보유 제품 비율을 포함할 수 있다.Here, product information may include price change index, inventory liquidity ratio, color diversity score, size option index, origin diversity index, manufacturer diversity index, sales channel diversification index, inventory turnover rate, brand awareness score, eco-friendly certification rate, user feedback response time, warranty extension rate, consumer satisfaction score, delivery efficiency index, return policy score, and patented product ratio.
상품 정보 분석부(310)는 상품 정보를 수신하면 적어도 하나의 속성에 따라 수신된 상품 정보를 적어도 하나의 카테고리로 분류할 수 있다.When receiving product information, the product information analysis unit (310) can classify the received product information into at least one category based on at least one attribute.
예를 들어, 상품 정보 분석부(310)는 가격 변동 지수, 재고 유동성 비율, 색상 다양성 점수, 사이즈 옵션 지수, 원산지 다양성 지수, 제조사 다양성 지수, 판매채널 다변화 지수, 재고회전율, 브랜드 인지도 점수를 상품 기본 정보로 분류하고, 친환경 인증 비율, 사용자 피드백 반응 시간, 보증기간 연장률, 소비자 만족도 점수, 배송 효율성 지수, 반품정책 점수, 특허 보유 제품 비율을 상품 고급 정보로 분류할 수 있다.For example, the product information analysis unit (310) may classify price fluctuation index, inventory liquidity ratio, color diversity score, size option index, country of origin diversity index, manufacturer diversity index, sales channel diversification index, inventory turnover rate, and brand awareness score as basic product information, and classify eco-friendly certification ratio, user feedback response time, warranty period extension rate, consumer satisfaction score, delivery efficiency index, return policy score, and patented product ratio as advanced product information.
상품 정보 분석부(310)는 상품 기본 정보, 상품 고급 정보로 분류된 상품 정보를 각 카테고리로 분류하여 관리함으로써, 상품 정보를 실시간 모니터링하고, 관리 패턴에서 벗어나는 모든 편차를 조기에 식별하여 관리할 수 있다. 또한, 각 카테고리로 분류된 정보들의 색인을 관리함으로써 정보의 관리 편의를 증대시킬 수 있다.The product information analysis unit (310) manages product information classified into basic product information and advanced product information by classifying them into each category, thereby enabling real-time monitoring of product information and early identification and management of any deviations from the management pattern. In addition, the convenience of information management can be increased by managing the index of information classified into each category.
한편, 상품 정보의 카테고리 분류와 상품 정보 점수의 산출은 인공지능 기반의 기계학습 내지 딥러닝 모델이 사용될 수 있으며,Meanwhile, the categorization of product information and the calculation of product information scores can use artificial intelligence-based machine learning or deep learning models.
예컨대, 지도학습(Supervised learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning), CNNs(Convolutional Neural Networks), RNNs(Recurrent Neural Networks), LSTMs(Long Short-Term Memory Networks), 자연어처리(NLP, Natural Language Processing), DSS(Decision Support Systems), 및 예측분석을 포함하는 인공지능 학습 모델이 사용될 수 있다.For example, artificial intelligence learning models including supervised learning, unsupervised learning, reinforcement learning, convolutional neural networks (CNNs), recurrent neural networks (RNNs), long short-term memory networks (LSTMs), natural language processing (NLP), decision support systems (DSS), and predictive analytics can be used.
또한, 상품 정보 분석부(310)는 각 카테고리로 분류된 정보들을 실시간 모니터링하고, 미리 정해진 편차(예: 20%) 범위를 초과하는 경우 경고를 위한 알림(예: 소리, 진동, 발광 등)을 생성할 수 있다.In addition, the product information analysis unit (310) can monitor information classified into each category in real time and generate a notification (e.g., sound, vibration, light, etc.) for warning when a pre-determined deviation range (e.g., 20%) is exceeded.
그 다음, 상품 정보 분석부(310)는 각 카테고리에 분류된 상품 정보를 상호 결합하여 상품 정보 점수를 산출할 수 있다. 한편, 별도의 설명이 없는 경우, 이하에서 설명되는 수학식에 포함된 가중치 w1 내지 wn은 미리 정해진 가중값으로 그 합이 1일 수 있다.Next, the product information analysis unit (310) can calculate a product information score by mutually combining product information classified in each category. Meanwhile, unless otherwise explained, the weights w1 to wn included in the mathematical formulas described below may be predetermined weight values whose sum may be 1.
예를 들어, 상품 정보 분석부(310)는 아래 수학식과 같이 상품 기본 정보 점수를 산출할 수 있다.For example, the product information analysis unit (310) can calculate the product basic information score as shown in the mathematical formula below.
여기서, 재고 유동성비율은 상품의 시장 내 수요와 공급의 균형을 파악하는 지표로써, 높은 유동성은 상품이 빠르게 회전하고 있으며, 수요에 잘 부응하고 있음을 의미할 수 있다.Here, the inventory liquidity ratio is an indicator that determines the balance between supply and demand in the market for a product, and high liquidity can mean that the product is turning over quickly and responding well to demand.
예를 들어, 제품 A가 미리 정해진 기간(예: 1개월) 동안 300개의 재고 중 150개가 판매되고, 제품 B가 미리 정해진 기간(예: 1개월) 동안 500개의 재고 중 250개가 판매된 경우, 재고 유동성비율은 미리 정해진 기간 동안 판매된 제품 수를 시작 재고로 나누어 산출할 수 있다. 이 비율은 제품이 얼마나 빨리 판매되고 있는지를 나타내는 지표로 사용된다.For example, if Product A sells 150 units out of 300 inventory during a given period (e.g., 1 month) and Product B sells 250 units out of 500 inventory during a given period (e.g., 1 month), the inventory liquidity ratio can be calculated by dividing the number of units sold during the given period by the beginning inventory. This ratio is used as an indicator of how quickly the products are selling.
이와 같은 결과는 제품 A와 B 모두 재고 유동성 비율이 0.5입니다. 이는 각 제품의 시작 재고 대비 절반만 판매되었다는 것을 의미하며, 재고 회전 속도가 같다는 것을 나타낼 수 있다.A similar result would be that both products A and B have a stock liquidity ratio of 0.5. This means that only half of the starting inventory of each product has been sold, which could indicate that the inventory turnover rates are the same.
가격 변동 지수는 가격 변동 트렌드를 분석하고, 최적의 가격 포지셔닝을 결정할 수 있다. 가격 변동 지수는 제품의 가격 변동성을 측정하는 지표로, 시장 변화에 대한 제품의 가격 반응성을 수치화하고, 다양한 시점에서의 가격 데이터를 사용하여 계산할 수 있으며, 가격의 변동 폭과 빈도를 모두 고려하여 산출된다. 일 예로, 미리 정해진 기간(예: 30일) 내의 시점 1 내지 5에서 가격 변동이 [100, 120, 110, 130, 125]천원인 경우를 가정한다.The price fluctuation index can analyze price fluctuation trends and determine optimal price positioning. The price fluctuation index is an indicator that measures the price volatility of a product, quantifies the price responsiveness of a product to market changes, and can be calculated using price data at various points in time, and is calculated by considering both the range and frequency of price fluctuations. For example, assume that the price fluctuations at points 1 to 5 within a predetermined period (e.g., 30 days) are [100, 120, 110, 130, 125] thousand won.
즉, 동일 상품에 대한 표준편차는 가격 변동 정도를 나타낼 수 있으며, 일 예로, 가격변동지수는 미리 정해진 최소 및 최대 값의 범위에서 최소-최대정규화를 통해 0 내지 1로 정규화될 수 있다. 일 예로, 최소 가격변동지수가 0, 최대 가격변동지수가 0.5이고, 실제 가격변동지수가 0.09인 경우, 가격변동지수은 0.82(=1-0.18)로 정규화될 수 있다.That is, the standard deviation for the same product can represent the degree of price fluctuation, and as an example, the price fluctuation index can be normalized to 0 to 1 through min-max normalization within a range of predetermined minimum and maximum values. For example, if the minimum price fluctuation index is 0, the maximum price fluctuation index is 0.5, and the actual price fluctuation index is 0.09, the price fluctuation index can be normalized to 0.82 (=1-0.18).
판매채널 다변화 지수는 제품이 얼마나 다양한 판매 채널을 통해 판매되고 있는지를 수치화하는 지표이며, 이는 제품의 시장 접근성과 소비자 도달 범위를 나타내며, 판매 채널의 다양성이 높을수록 더 넓은 시장과 다양한 소비자층에 도달할 가능성이 높아질 수 있다.The sales channel diversity index is an indicator that quantifies how many different sales channels a product is sold through, indicating the product's market accessibility and consumer reach. The higher the diversity of sales channels, the higher the possibility of reaching a wider market and a wider range of consumers.
일 예로, 동일한 상품 A가 온라인 몰 3개, 오프라인 매장 2개, 소셜미디어 1개, 직접 판매 1개로 총 4개의 판매 채널 유형에 대해 7개의 판매 채널을 유지하는 경우를 가정하면, 온라인 몰 50%, 오프라인 매장 30%, 소셜미디어 10%, 직접 판매 10%을 각 채널별 판매 비율이 산출된다.For example, assuming that the same product A maintains 7 sales channels for a total of 4 sales channel types: 3 online malls, 2 offline stores, 1 social media, and 1 direct sales, the sales ratio for each channel is calculated as 50% online malls, 30% offline stores, 10% social media, and 10% direct sales.
이때, 각 판매 비율의 엔트로피는 아래와 같이 산출된다.At this time, the entropy of each sales ratio is calculated as follows.
여기서, 판매비율_i는 각 판매채널(i)의 판매 비율을 의미할 수 있다. 총 판매 비율의 엔트로피의 값이 높을수록 제품이 다양한 판매 채널을 통해 판매되고 있음을 나타내며, 이는 제품의 시장 접근성과 소비자 도달 범위가 넓다는 것을 의미할 수 있다.Here, sales ratio_i can mean the sales ratio of each sales channel (i). The higher the entropy value of the total sales ratio, the more the product is sold through various sales channels, which can mean that the product has a wide market accessibility and consumer reach.
일 예로, 판매채널 다변화 지수는 미리 정해진 총 판매비율 엔트로피의 최소 및 최대 값의 범위에서 최소-최대정규화를 통해 0 내지 1로 정규화될 수 있다. 일 예로, 최소 총 판매비율 엔트로피가 0, 최대 총 판매비율 엔트로피가 3이고, 실제 총 판매비율 엔트로피가 1.32인 경우, 판매채널 다변화 지수는 0.44로 정규화될 수 있다.For example, the sales channel diversification index can be normalized to 0 to 1 through min-max normalization within the range of minimum and maximum values of the predetermined total sales ratio entropy. For example, if the minimum total sales ratio entropy is 0, the maximum total sales ratio entropy is 3, and the actual total sales ratio entropy is 1.32, the sales channel diversification index can be normalized to 0.44.
산출된 상품 기본 정보 점수는 상품 데이터를 수집 및 재가공하는 플랫폼에서 사용되는 지표로써, 상품의 판매 특성 패턴에 따라 상품 정보를 최적화하여 사용자에게 제공하고, 상품 정보를 재가공하는 템플릿의 최적화를 결정하는 참고 지표가 될 수 있다. 즉, 상품 기본 정보 점수가 높다는 것은 제품에 대한 상세 정보가 충분하다는 의미가 될 수 있고, 상품 기본 정보 점수가 낮은 경우 정보가 제한적인 경우, 템플릿을 간소화하여 사용자에게 중요한 정보만을 강조할 수 있다.The product basic information score is an indicator used in platforms that collect and reprocess product data, and can be used as a reference indicator to optimize product information according to the product sales characteristic pattern and provide it to users, and to determine the optimization of templates that reprocess product information. In other words, a high product basic information score can mean that detailed information about the product is sufficient, and if the product basic information score is low and information is limited, the template can be simplified to emphasize only important information to users.
상품 정보 분석부(310)는 아래 수학식과 같이 상품 고급 정보 점수를 산출할 수 있다.The product information analysis unit (310) can calculate the product advanced information score as shown in the mathematical formula below.
여기서, 배송 효율성 지수는 배송 효율성을 반영하여, 제품이 고객에게 얼마나 신속하고 정확하게 도달하는지를 평가하는 지표일 수 있다.Here, the delivery efficiency index can be an indicator that reflects delivery efficiency and evaluates how quickly and accurately a product reaches a customer.
예컨대, 미리 정해진 기간(예: 1개월) 동안 상품 A에 대한 주문 총 건수가 1000건 이고, 정시 배송 건수가 900건이며, 최대 배송 시간이 48시간이고, 평균 배송 지연 시간이 2시간인 경우, 정시 배송률은 0.9(=900/1000)로 산출되고, 배송 지연률은 0.0417(=2/48)로 산출될 수 있으며, 이때 배송 효율성 지수는 0.8625로 산출된다.For example, if the total number of orders for product A is 1,000 during a predetermined period (e.g., 1 month), the number of on-time deliveries is 900, the maximum delivery time is 48 hours, and the average delivery delay time is 2 hours, the on-time delivery rate can be calculated as 0.9 (= 900/1000), the delivery delay rate can be calculated as 0.0417 (= 2/48), and the delivery efficiency index is calculated as 0.8625.
반품 정책 점수는 반품 정책의 효율성과 고객 친화성을 반영하여, 고객 만족도 및 재구매 의사를 촉진할 수 있는 요소가 될 수 있다.The return policy score can be a factor that promotes customer satisfaction and repurchase intention by reflecting the effectiveness and customer friendliness of the return policy.
예를 들어, 상품 K에 대해 미리 정해진 반품 허용 기간이 30일이고, 동일 기간 동안 실제 고객 반품률이 0.95(예: 100건 신청 중 95건 승인)이며, 고객 만족도 점수가 4.5/5이며, 반품 처리 기간이 평균 3일이고, 최대 반품 처리 기간이 7일인 경우를 가정하면, 반품 정책 점수는 아래와 같이 산출된다.For example, if Product K has a predefined return acceptance period of 30 days, an actual customer return rate of 0.95 (e.g., 95 out of 100 requests were approved) during the same period, a customer satisfaction score of 4.5/5, an average return processing time of 3 days, and a maximum return processing time of 7 days, the return policy score would be calculated as follows:
특허보유제품비율은 제품 혁신성과 독창성을 반영하여, 시장 내 제품의 독특성과 기술적 우위를 나타내는 지표가 될 수 있다. 일 예로, 적어도 하나 이상의 제품을 판매하는 상품 판매자의 전체 제품수가 200개이고, 특허를 보유한 제품 수가 50개 일 때, 특허 보유 제품 비율은 0.25로 산출될 수 있다.The patented product ratio can be an indicator of the uniqueness and technological superiority of a product in the market, reflecting the product's innovation and originality. For example, when the total number of products of a product seller selling at least one product is 200 and the number of products with patents is 50, the patented product ratio can be calculated as 0.25.
산출된 상품 고급 정보 점수는 상품의 품질을 반영하는 지표로, 제품이 시장에서 어떻게 인식되는지를 나타내는 지표가 될 수 있다. 예컨대, 상품 고급 정보 점수가 높은 경우, 제품이 시장에서 높은 품질, 효율성 및 환경 책임을 충족함을 의미하며, 소비자 만족도가 높고, 시장 경쟁력이 강한 제품임을 나타내고, 상품 고급 정보 점수가 낮은 경우, 제품의 품질이나 배송 효율성이 시장 기대에 미치지 못하거나, 친환경 인증이 부족함을 의미할 수 있으며, 이는 개선의 여지가 있는 영역을 나타내며, 특정 부분에 대한 관리와 개선이 필요함을 시사할 수 있다.The product premium information score produced is an indicator of the quality of the product, and can be an indicator of how the product is perceived in the market. For example, if the product premium information score is high, it means that the product meets high quality, efficiency, and environmental responsibility in the market, and it indicates that the product has high consumer satisfaction and strong market competitiveness. If the product premium information score is low, it may mean that the product quality or delivery efficiency does not meet market expectations, or that there is a lack of eco-friendly certification, which indicates areas for improvement, and it may indicate that management and improvement are needed in certain areas.
상품 정보 분석부(310)는 산출된 상품 기본 정보 점수, 상품 고급 정보 점수를 기초로 아래 수학식과 같이 상품 정보 점수를 산출할 수 있다. 여기서, w1 내지 w2은 미리 정해진 가중치로서 그 합은 1일 수 있고, 산출된 상품 기본 정보 점수, 상품 고급 정보 점수는 미리 정해진 최소-최대 값을 기초로 0 내지 1로 정규화된 값일 수 있다.The product information analysis unit (310) can calculate a product information score based on the calculated product basic information score and product advanced information score as shown in the following mathematical formula. Here, w1 to w2 are predetermined weights whose sum can be 1, and the calculated product basic information score and product advanced information score can be normalized values from 0 to 1 based on predetermined minimum and maximum values.
산출된 상품 정보 점수는 산출된 '상품 기본 정보'와 '상품 고급 정보'를 결합하여 생성되고, 상품 데이터를 템플릿화하고 스타일화할 수 있는 통합 지표이다. 이는 상품의 다양한 특성을 하나의 수치로 요약하여, 제품 표시 방식을 최적화하는 데 기술적으로 활용될 수 있다.The product information score is generated by combining the generated 'basic product information' and 'advanced product information', and is an integrated index that can template and style product data. It can be technically utilized to optimize the product display method by summarizing various characteristics of the product into a single number.
예를 들어, 상품 정보점수가 높은 경우, 제품의 템플릿은 세밀한 디테일과 풍부한 시각적 요소를 포함하여 제품의 독특한 특성과 고급 정보를 강조할 수 있습니다. 이는 고해상도 이미지, 동영상 리뷰, 상세한 특징 목록과 같은 정보를 포함하여 소비자의 관심을 유도하고 구매를 촉진하는 데 중점을 둘 수 있고, 반면, 상품 정보점수가 낮은 경우에는 템플릿을 간소화하여 소비자에게 혼란을 주지 않도록 기본적인 정보만을 제공하고, 명확하고 간결한 표현을 사용하여 제품의 기본적인 특성만을 전달함으로써 소비자가 제품에 대해 쉽게 이해할 수 있도록 할 수 있다.For example, if the product information score is high, the product template can emphasize the unique features and advanced information of the product by including detailed and rich visual elements. This can focus on attracting consumers' attention and encouraging purchase by including information such as high-resolution images, video reviews, and detailed feature lists. On the other hand, if the product information score is low, the template can be simplified to provide only basic information to avoid confusing consumers, and use clear and concise expressions to convey only the basic features of the product, making it easy for consumers to understand the product.
템플릿 정보 분석부(320)는 사용자가 입력한 사용자 입력 템플릿 정보를 기초로 외부 서버로부터 템플릿 정보를 수신할 수 있다.The template information analysis unit (320) can receive template information from an external server based on user input template information entered by the user.
여기서, 템플릿 정보는 템플릿 매칭 정확도, 데이터 태깅 자동화 비율, 템플릿 유연성 지수, 멀티모달 통합 정도, 템플릿 조정 반응시간, 제품 속성 추출 효율성, 데이터 표준화 지수, 템플릿 갱신 빈도, 자동 분류 성능, 동적 템플릿 조정 기능, 템플릿 기반 콘텐츠 생성 속도, 데이터 보안 지수, 사용자 경험 최적화 점수, 인공지능 통합 효율성, API연동성 지수, 템플릿 기반 리포팅 효율성, 콘텐츠 생성 자동화 지수, 메타데이터 형식화 효율성, 상품 비교 분석 자동화 정도, 인터랙티브 시각화 효과도를 포함할 수 있다.Here, the template information may include template matching accuracy, data tagging automation ratio, template flexibility index, multimodal integration degree, template adjustment response time, product attribute extraction efficiency, data standardization index, template update frequency, automatic classification performance, dynamic template adjustment function, template-based content creation speed, data security index, user experience optimization score, artificial intelligence integration efficiency, API linkage index, template-based reporting efficiency, content creation automation index, metadata formatting efficiency, product comparison analysis automation degree, and interactive visualization effectiveness.
템플릿 정보 분석부(320)는 템플릿 정보를 수신하면 적어도 하나의 속성에 따라 수신된 템플릿 정보를 적어도 하나의 카테고리로 분류할 수 있다.When template information is received, the template information analysis unit (320) can classify the received template information into at least one category based on at least one attribute.
예를 들어, 템플릿 정보 분석부(320)는 템플릿 매칭 정확도, 데이터 태깅 자동화 비율, 템플릿 유연성 지수, 멀티모달 통합 정도, 템플릿 조정 반응시간, 제품 속성 추출 효율성, 데이터 표준화 지수, 템플릿 갱신 빈도, 자동 분류 성능을 템플릿 기본 구조로 분류하고, 동적 템플릿 조정 기능, 템플릿 기반 콘텐츠 생성 속도, 데이터 보안 지수, 사용자 경험 최적화 점수, 인공지능 통합 효율성, API연동성 지수, 템플릿 기반 리포팅 효율성, 콘텐츠 생성 자동화 지수, 메타데이터 형식화 효율성, 상품 비교 분석 자동화 정도, 인터랙티브 시각화 효과도를 템플릿 기능으로 분류할 수 있다.For example, the template information analysis unit (320) may classify template matching accuracy, data tagging automation ratio, template flexibility index, multimodal integration degree, template adjustment response time, product attribute extraction efficiency, data standardization index, template update frequency, and automatic classification performance as template basic structures, and may classify dynamic template adjustment function, template-based content creation speed, data security index, user experience optimization score, artificial intelligence integration efficiency, API interoperability index, template-based reporting efficiency, content creation automation index, metadata formatting efficiency, product comparison analysis automation degree, and interactive visualization effectiveness as template functions.
템플릿 정보 분석부(320)는 템플릿 기본 구조, 템플릿 기능으로 분류된 템플릿 정보를 각 카테고리로 분류하여 관리함으로써, 템플릿 정보를 실시간 모니터링하고, 관리 패턴에서 벗어나는 모든 편차를 조기에 식별하여 관리할 수 있다. 또한, 각 카테고리로 분류된 정보들의 색인을 관리함으로써 정보의 관리 편의를 증대시킬 수 있다.The template information analysis unit (320) classifies template information classified by template basic structure and template function into each category and manages it, thereby enabling real-time monitoring of template information and early identification and management of any deviations from the management pattern. In addition, the convenience of information management can be increased by managing the index of information classified by each category.
한편, 템플릿 정보의 카테고리 분류와 템플릿 정보 점수의 산출은 인공지능 기반의 기계학습 내지 딥러닝 모델이 사용될 수 있으며, 예컨대, 지도학습(Supervised learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning), CNNs(Convolutional Neural Networks), RNNs(Recurrent Neural Networks), LSTMs(Long Short-Term Memory Networks), 자연어처리(NLP, Natural Language Processing), DSS(Decision Support Systems), 및 예측분석을 포함하는 인공지능 학습 모델이 사용될 수 있다.Meanwhile, the categorization of template information and the calculation of template information scores can use artificial intelligence-based machine learning or deep learning models, and for example, artificial intelligence learning models including supervised learning, unsupervised learning, reinforcement learning, convolutional neural networks (CNNs), recurrent neural networks (RNNs), long short-term memory networks (LSTMs), natural language processing (NLP), decision support systems (DSS), and predictive analysis can be used.
또한, 템플릿 정보 분석부(320)는 각 카테고리로 분류된 정보들을 실시간 모니터링하고, 미리 정해진 편차(예: 20%) 범위를 초과하는 경우 경고를 위한 알림(예: 소리, 진동, 발광 등)을 생성할 수 있다.In addition, the template information analysis unit (320) can monitor information classified into each category in real time and generate a notification (e.g., sound, vibration, light, etc.) for warning when a predetermined deviation range (e.g., 20%) is exceeded.
그 다음, 템플릿 정보 분석부(320)는 각 카테고리에 분류된 템플릿 정보를 상호 결합하여 템플릿 정보 점수를 산출할 수 있다. 한편, 별도의 설명이 없는 경우, 이하에서 설명되는 수학식에 포함된 가중치 w1 내지 wn은 미리 정해진 가중값으로 그 합이 1일 수 있다.Next, the template information analysis unit (320) can calculate a template information score by mutually combining the template information classified in each category. Meanwhile, unless otherwise explained, the weights w1 to wn included in the mathematical formula described below may be predetermined weight values whose sum may be 1.
예를 들어, 템플릿 정보 분석부(320)는 아래 수학식과 같이 템플릿 기본 구조 점수를 산출할 수 있다.For example, the template information analysis unit (320) can calculate the template basic structure score as shown in the mathematical formula below.
여기서, 데이터 태깅 자동화 비율은 템플릿이 얼마나 효율적으로 자동으로 데이터를 태깅할 수 있는지를 나타내며, 작업의 자동화와 효율성을 증가시킬 수 있다.Here, the data tagging automation ratio indicates how efficiently the template can automatically tag data, which can increase the automation and efficiency of tasks.
즉, 템플릿 정보 분석부(320)는 온라인 콘텐츠 관리 시스템에서 상품 이미지와 설명을 자동으로 태깅하는 기능을 평가하여, 이미지 인식과 자연어 처리 기술을 사용하여 상품의 특성(예: 색상, 크기, 소재)을 인식하고, 해당 정보를 데이터베이스에 자동으로 태깅할 수 있다.That is, the template information analysis unit (320) evaluates the function of automatically tagging product images and descriptions in an online content management system, and uses image recognition and natural language processing technology to recognize product characteristics (e.g., color, size, material) and automatically tag the corresponding information in a database.
일 예로, 총 처리된 상품 데이터 수가 1000개 이고, 자동 태깅에 성공 또는 실패를 포함하여, 자동 태깅에 시도된 상품 데이터 수가 900개 이며, 이 중 자동 태깅에 성공한 상품 데이터 수가 800개인 경우, 자동 태깅 성공률은 0.89(=800/900)으로 산출될 수 있다.For example, if the total number of processed product data is 1,000, the number of product data attempted for automatic tagging, including success or failure of automatic tagging, is 900, and among these, the number of product data successfully tagged is 800, the automatic tagging success rate can be calculated as 0.89 (=800/900).
예를 들어, 템플릿 정보 분석부(320)는 딥러닝 기반의 이미지 인식 알고리즘을 사용하여 상품 이미지에서 특성을 추출할 수 있으며, 예컨대, Convolutional Neural Networks (CNN)을 사용하여 이미지의 색상, 형태, 패턴을 인식하고 분류할 수 있다.For example, the template information analysis unit (320) can extract features from a product image using a deep learning-based image recognition algorithm, and can recognize and classify the color, shape, and pattern of the image using, for example, Convolutional Neural Networks (CNN).
또한, 자연어 처리 알고리즘(NLP)을 기초로 상품 설명을 분석하여 키워드 및 중요 정보(예: 소재, 크기)를 추출하고, 이를 상품 데이터베이스의 관련 필드에 자동으로 태깅할 수 있으며, 태깅의 정확성은 미리 정의된 테스트 데이터 세트를 사용하여 평가되고, 이 데이터 세트에는 수동으로 태그된 정답이 포함되어 있으며, 자동 생성된 태그와 비교하여 정확도를 측정할 수 있다.In addition, product descriptions can be analyzed based on natural language processing algorithms (NLP) to extract keywords and important information (e.g., material, size), and these can be automatically tagged to relevant fields in the product database. The accuracy of tagging can be evaluated using a predefined test data set, which contains manually tagged correct answers, and the accuracy can be measured by comparing it with automatically generated tags.
템플릿 유연성 지수는 템플릿이 다양한 데이터 유형과 시나리오에 얼마나 유연하게 적용될 수 있는지를 평가하는 지표가 될 수 있다.The template flexibility index can be used as a metric to evaluate how flexibly a template can be applied to different data types and scenarios.
데이터 표준화 지수는 템플릿이 다양한 데이터 입력에 대해 표준화된 포맷으로 얼마나 일관되게 변환할 수 있는지를 측정하는 지표입니다. 이 지수는 데이터의 일관성과 처리 과정의 정확성을 평가하는 지표가 될 수 있다.The data standardization index is an indicator that measures how consistently a template can convert various data inputs into a standardized format. This index can be an indicator of the consistency of data and the accuracy of the processing.
예를 들어, 템플릿 정보 분석부(320)는 데이터의 원본 형식에서 템플릿에 의해 요구되는 표준 형식으로의 변환 성공률을 측정할 수 있다. 일 예로, 텍스트 데이터는 다양한 언어 및 인코딩에서 UTF-8로의 변환, 날짜/시간 데이터는 다양한 날짜/시간 형식을 ISO 8601 표준으로 변환, 숫자 데이터는 다양한 숫자 형식(예: 쉼표, 점 사용)을 표준 숫자 형식으로 변환을 의미할 수 있다.For example, the template information analysis unit (320) can measure the success rate of conversion from the original format of the data to the standard format required by the template. For example, text data can mean conversion from various languages and encodings to UTF-8, date/time data can mean conversion from various date/time formats to the ISO 8601 standard, and numeric data can mean conversion from various numeric formats (e.g., using commas, periods) to a standard numeric format.
그 다음, 템플릿 정보 분석부(320)는 각 데이터 유형별 표준화 성공률을 기초로 데이터 표준화 지수를 산출할 수 있다. 예를 들어, 텍스트 데이터 변환 시도를 100개 중 성공이 90개이고, 날짜/시간 데이터 변환 시도는 100개 중 성공이 95개이고, 숫자 데이터 변환 시도는 100개중 성공이 85개인 경우를 가정한다.Next, the template information analysis unit (320) can calculate a data standardization index based on the standardization success rate for each data type. For example, it is assumed that 90 out of 100 attempts at text data conversion are successful, 95 out of 100 attempts at date/time data conversion are successful, and 85 out of 100 attempts at numeric data conversion are successful.
이는 템플릿이 다양한 데이터 유형을 상당히 일관된 방식으로 표준 형식으로 변환할 수 있음을 나타내고, 이를 통해 데이터 처리 템플릿의 효율성과 일관성을 객관적으로 평가하고, 필요한 개선 사항을 식별할 수 있다.This demonstrates that the template can transform a variety of data types into a standard format in a fairly consistent manner, allowing for an objective assessment of the efficiency and consistency of the data processing template and identification of any necessary improvements.
멀티모달 통합 정도는 텍스트, 이미지, 비디오 등 다양한 데이터 유형을 얼마나 잘 통합할 수 있는지를 측정할 수 있다. 즉, 다양한 데이터 유형(텍스트, 이미지, 비디오 등)을 템플릿이 어떻게 통합하여 처리할 수 있는지를 측정하는 지표로써, 이는 템플릿의 능력을 평가하여, 여러 데이터 유형을 조화롭게 결합하고, 결과적으로 사용자에게 일관된 정보를 제공할 수 있는 정도를 나타낼 수 있다.The degree of multimodal integration can measure how well a template can integrate various data types, such as text, images, and videos. In other words, it is an indicator that measures how well a template can integrate and process various data types (such as text, images, and videos). This can evaluate the ability of a template to harmoniously combine various data types and, as a result, provide consistent information to the user.
즉, 멀티모달 통합 정도는 텍스트, 이미지, 비디오 등 각각의 데이터 유형을 개별적으로 처리하는 성공률을 측정하고, 다양한 데이터 유형이 통합된 시나리오에서 템플릿이 얼마나 성공적으로 데이터를 처리할 수 있는지 측정하여 이들의 비율로 산출될 수 있으며, 즉, 데이터가 템플릿 또는 시스템의 요구사항에 맞춰 정확하게 변환되거나, 원하는 형식으로 완벽하게 적응된 경우를 기준으로 산출될 수 있다.That is, the degree of multimodal integration can be calculated as the ratio of how successfully the template can process data in a scenario where various data types are integrated, by measuring the success rate of processing each data type individually, such as text, image, and video, and how successfully the template can process data in a scenario where various data types are integrated, i.e., when the data is accurately transformed to the requirements of the template or system, or perfectly adapted to the desired format.
예컨대, 텍스트, 이미지, 비디오 데이터가 각 100개중 각 95, 90, 85개 가 정상 변환 되었고, 텍스트, 이미지, 비디오 데이터 가 적어도 둘 이상 결합된 멀티모달 케이스의 경우, 100개 중 80개가 성공적 변환이 이뤄진 경우, 멀티모달 통합 정도는 아래와 같이 산출된다.For example, if 95, 90, and 85 out of 100 text, image, and video data were converted normally, respectively, and in the case of a multimodal case where at least two text, image, and video data were combined, if 80 out of 100 data were successfully converted, the degree of multimodal integration is calculated as follows.
멀티모달 통합 정도는 템플릿이 다양한 데이터 유형을 통합하여 처리하는 능력을 정량적으로 평가하며, 멀티모달 통합 정도가 1에 가까우면 템플릿은 멀티모달 데이터를 개별 데이터 유형만큼 효과적으로 처리할 수 있음을 나타내고, 멀티모달 통합 정도가 1 미만일 경우, 멀티모달 데이터 처리가 개별 데이터 유형 처리보다 덜 효율적임을 의미하며, 이는 템플릿의 통합 처리 기능을 개선할 필요가 있음을 나타낼 수 있다.The degree of multimodal integration quantitatively evaluates the ability of a template to integrate and process various data types. A degree of multimodal integration close to 1 indicates that the template can process multimodal data as effectively as individual data types. A degree of multimodal integration less than 1 indicates that multimodal data processing is less efficient than processing individual data types, which may indicate that the integrated processing capability of the template needs to be improved.
산출된 템플릿 기본 구조 점수는 템플릿의 효율성, 유연성, 및 멀티모달 통합 능력을 종합적으로 평가하는 지표로, 이를 통해 템플릿이 얼마나 잘 설계되었는지를 판단할 수 있고, 이는 템플릿이 다양한 데이터와 요구사항에 얼마나 잘 적응하고 통합할 수 있는지를 반영할 수 있다.The generated template basic structure score is an indicator that comprehensively evaluates the efficiency, flexibility, and multimodal integration capabilities of the template, which can be used to determine how well the template is designed, and reflect how well the template can adapt to and integrate various data and requirements.
예컨대, 높은 템플릿 기본 구조 점수는 템플릿이 데이터를 효율적으로 자동 태깅하며, 다양한 데이터 유형에 유연하게 적용되고, 멀티모달 콘텐츠를 효과적으로 통합할 수 있음을 나타낼 수 있으며, 낮은 템플릿 기본 구조 점수는 템플릿의 자동화, 유연성, 통합성이 부족함을 의미하며, 이는 템플릿 개선의 필요성을 시사할 수 있다.For example, a high template basic structure score may indicate that the template efficiently auto-tags data, is flexible in its application to various data types, and can effectively integrate multimodal content, while a low template basic structure score may indicate that the template lacks automation, flexibility, and integration, which may indicate the need for template improvement.
템플릿 정보 분석부(320)는 아래 수학식과 같이 템플릿 기능 점수를 산출할 수 있다.The template information analysis unit (320) can calculate the template function score as shown in the mathematical formula below.
여기서, 템플릿 기반 콘텐츠 생성 속도는 수신한 상품 정보를 기초로 템플릿에 콘텐츠를 적용하여 생성할 때, 각 페이지 또는 항목당 콘텐츠 생성 완료 시간을 기초로 산출될 수 있다.Here, the template-based content generation speed can be calculated based on the content generation completion time for each page or item when generating content by applying the content to the template based on the received product information.
예를 들어, 템플릿 정보 분석부(320)가 각 페이지를 생성하는데 소요된 시간이 120초가 소요될 때, 템플릿 기반 콘텐츠 생성 속도는 아래와 같이 산출된다.For example, when the template information analysis unit (320) takes 120 seconds to generate each page, the template-based content generation speed is calculated as follows.
일 예로, 템플릿 기반 콘텐츠 생성 속도는 미리 정해진 최소 및 최대 값의 범위에서 최소-최대정규화를 통해 0 내지 1로 정규화될 수 있다. 일 예로, 최소 템플릿 기반 콘텐츠 생성 속도가 0페이지/초, 최대 템플릿 기반 콘텐츠 생성 속도가 1페이지/초이고, 실제 템플릿 기반 콘텐츠 생성 속도가 0.0083페이지/초인 경우, 템플릿 기반 콘텐츠 생성 속도는 0.9917(=1-0.0083)로 정규화될 수 있다.For example, the template-based content generation speed can be normalized to 0 to 1 through min-max normalization within a range of predetermined minimum and maximum values. For example, if the minimum template-based content generation speed is 0 page/sec, the maximum template-based content generation speed is 1 page/sec, and the actual template-based content generation speed is 0.0083 page/sec, the template-based content generation speed can be normalized to 0.9917 (=1-0.0083).
API 연동성 지수는 템플릿 또는 시스템이 다른 외부 시스템과의 API를 통해 얼마나 효율적으로 연동할 수 있는지를 측정하는 지표로써, 이 지수는 API 호출의 성공률을 기반으로 하며, 통합의 신뢰성과 효율성을 정량적으로 평가할 수 있다.The API Interoperability Index is an indicator that measures how efficiently a template or system can interact with other external systems via APIs. This index is based on the success rate of API calls and can quantitatively evaluate the reliability and efficiency of integration.
예컨대, 템플릿 정보 분석부(320)가 총 100번의 API를 호출하고, 이 중 95번 성공적으로 API호출이 이뤄진 경우, API연동성 지수는 0.95로 산출될 수 있다.For example, if the template information analysis unit (320) calls the API a total of 100 times and 95 of these API calls are successful, the API interconnectivity index can be calculated as 0.95.
메타데이터 형식화 효율성은 데이터 처리 시스템이 입력된 메타데이터를 표준화된 형식으로 얼마나 정확하고 효율적으로 변환할 수 있는지 측정하는 지표로써, 이 지수는 데이터의 표준화된 형식을 준수하는 정도를 정량적으로 평가할 수 있다.Metadata format efficiency is an index that measures how accurately and efficiently a data processing system can convert input metadata into a standardized format. This index can quantitatively evaluate the degree to which data adheres to a standardized format.
예컨대, 템플릿의 메타데이터 항목은 상품에 대한 정보, 예를 들어 이름, 설명, 가격, 제조사, 카테고리를 포함하여, 상품 정보가 입력될 항목으로 구분될 수 있다.For example, metadata items in a template can be separated into items where product information will be entered, including information about the product, such as name, description, price, manufacturer, and category.
이때, 템플릿 정보 분석부(320)는 수신한 상품 정보의 메타데이터에 따른 템플릿 적용에 있어, 메타데이터 항목이 정확한 템플릿 항목에 할당되었는지 여부를 판단할 수 있다.At this time, the template information analysis unit (320) can determine whether a metadata item has been assigned to an accurate template item when applying a template according to the metadata of the received product information.
일 예로, 상품 정보 A의 메타데이터에 따른 템플릿 항목에 잘못 할당 되거나 템플릿 항목에 적합한 상품 정보 메타데이터가 존재하지 않는 경우, 메타데이터가 정확히 할당되지 않은 것으로 판단될 수 있다.For example, if metadata for product information A is incorrectly assigned to a template item or there is no suitable product information metadata for the template item, it may be determined that metadata is not assigned correctly.
예컨대, 템플릿의 전체 메타데이터 항목수가 100개이고, 매핑된 메타데이터 항목수가 95개인 경우 메타데이터 형식화 효율성은 0.95로 산출될 수 있다.For example, if the total number of metadata items in the template is 100 and the number of mapped metadata items is 95, the metadata formatting efficiency can be calculated as 0.95.
산출된 템플릿 기능 점수는 템플릿에 가지는 기능적 요소의 효율성을 의미할 수 있으며, 높은 템플릿 기능 점수는 템플릿이 빠르고 효율적으로 콘텐츠를 생성하며, 외부 시스템과의 통합 및 데이터 형식화와 운영 효율성이 높음을 의미하고, 낮은 템플릿 기능 점수는 템플릿의 콘텐츠 생성 속도가 느리고, API 연동 및 메타데이터 형식화가 비효율적임을 시사하여 개선이 필요함을 의미할 수 있다.The generated template function score can indicate the efficiency of the functional elements of the template. A high template function score indicates that the template generates content quickly and efficiently, has high integration with external systems, and has high data formatting and operational efficiency. A low template function score indicates that the template has slow content generation speed, inefficient API linking, and inefficient metadata formatting, which may indicate a need for improvement.
템플릿 정보 분석부(320)는 산출된 템플릿 기본 구조 점수, 템플릿 기능 점수를 기초로 아래 수학식과 같이 템플릿 정보 점수를 산출할 수 있다. 여기서, w1 내지 w2은 미리 정해진 가중치로서 그 합은 1일 수 있고, 산출된 템플릿 기본 구조 점수, 템플릿 기능 점수는 미리 정해진 최소-최대 값을 기초로 0 내지 1로 정규화된 값일 수 있다.The template information analysis unit (320) can calculate a template information score based on the calculated template basic structure score and template function score as in the following mathematical formula. Here, w1 to w2 are predetermined weights whose sum can be 1, and the calculated template basic structure score and template function score can be normalized values from 0 to 1 based on predetermined minimum and maximum values.
산출된 템플릿 정보 점수는 "템플릿 기본 구조"와 "템플릿 기능"을 통합하여 산출되며, 템플릿이 정보를 처리하고 제공하는 전반적인 효율성과 유용성을 평가하는 지표가 될 수 있다. 또한, 템플릿의 구조적 완성도와 기능적 효율성을 결합하여, 템플릿이 얼마나 잘 설계되었고 사용자 요구를 만족시키는지를 정량적으로 나타낼 수 있다.The generated template information score is calculated by integrating the "template basic structure" and "template function", and can be an indicator for evaluating the overall efficiency and usability of the template in processing and providing information. In addition, by combining the structural completeness and functional efficiency of the template, it can quantitatively indicate how well the template is designed and satisfies user needs.
스타일 최적화부(330)는 산출된 상품 정보 점수 및 템플릿 정보 점수의 가중합으로부터 스타일 최적화 점수를 산출할 수 있다.The style optimization unit (330) can calculate a style optimization score from a weighted sum of the calculated product information scores and template information scores.
'스타일 최적화 점수'는 '상품 정보 점수'와 '템플릿 정보 점수'를 통합하여 산출된 지표로서, 템플릿의 스타일을 최적화하는 과정에서의 종합적인 성능을 평가하는 지표일 수 있다.The 'Style Optimization Score' is an indicator calculated by integrating the 'Product Information Score' and the 'Template Information Score', and can be an indicator to evaluate the comprehensive performance in the process of optimizing the style of a template.
스타일 최적화 점수가 높은 경우, 이는 템플릿이 사용자의 요구와 상품의 특성을 잘 반영하여 효과적으로 스타일을 최적화하고 있음을 의미할 수 있으며, 이는 사용자 경험을 극대화하고, 더 높은 사용자 만족도와 관심을 유도할 수 있는 능력을 갖추었다는 것을 나타낼 수 있다.A high style optimization score may indicate that the template effectively optimizes the style to reflect the user's needs and the product's characteristics, which may indicate its ability to maximize user experience and lead to higher user satisfaction and interest.
반면, 점수가 낮은 경우는 템플릿이 상품 정보를 효과적으로 전달하거나 사용자의 시각적 기대를 충족시키지 못하고 있음을 지적하며, 디자인과 기능성의 개선이 필요함을 나타낼 수 있다.On the other hand, a low score may indicate that the template does not effectively convey product information or meet users' visual expectations, and may indicate a need for design and functionality improvements.
스타일 최적화부(330)는 산출된 스타일 최적화 점수를 사용하여 최대 템플릿 항목을 제한할 수 있다.The style optimization unit (330) can limit the maximum template items using the calculated style optimization score.
여기서, 기본 템플릿 항목은 각 온라인 쇼핑몰에서 제공되는 상품 페이지의 상품 정보가 할당될 템플릿의 항목 개수를 의미할 수 있다. 예컨대, '의류'를 상품등록하기 위한 기본 템플릿 항목과 '세탁기'를 상품등록하기 위한 기본 템플릿의 항목 개수는 서로 다를 수 있다.Here, the basic template items may refer to the number of items in the template to which product information on the product page provided by each online shopping mall is allocated. For example, the number of items in the basic template for registering 'clothing' as a product and the number of items in the basic template for registering 'washing machine' as a product may be different from each other.
한편, 템플릿 복잡도 조정계수()는 스타일 최적화 점수에 따른 최대 템플릿 항목 개수의 변경 민감도를 조정하기 위한 조정 계수이며, 이를 통해 산출되는 최대 템플릿 항목은 기본 템플릿 항목의 항목 개수를 조정하여, 기본 템플릿에서 최대로 할당되어 표시될 수 있는 템플릿 항목 개수를 제한할 수 있다.Meanwhile, the template complexity adjustment factor ( ) is an adjustment coefficient for adjusting the sensitivity of changes in the maximum number of template items according to the style optimization score, and the maximum template items calculated through this can adjust the number of items in the basic template items, thereby limiting the number of template items that can be allocated and displayed at the maximum in the basic template.
여기서, 템플릿 복잡도 조정계수()는 색상 다양성 지수, 글꼴 다양성 지수, 이미지 다양성 지수 및 레이아웃 다양성 지수의 평균으로 산출될 수 있다. 이때, 색상 다양성 지수, 글꼴 다양성 지수, 이미지 다양성 지수 및 레이아웃 다양성 지수는 미리 결정된 기준에 따라 각 지수에 대한 점수가 부여될 수 있다.Here, the template complexity adjustment factor ( ) can be calculated as the average of the color diversity index, the font diversity index, the image diversity index, and the layout diversity index. At this time, the color diversity index, the font diversity index, the image diversity index, and the layout diversity index can be given scores for each index according to predetermined criteria.
예컨대, 색상 다양성 지수는, 템플릿의 색상 수가 5개 이하일 경우 0.2, 6 내지 10개의 색상 사용시 0.4점, 11개 이상의 색상을 사용시 0.7점을 부여할 수 있다.For example, the color diversity index can be given as 0.2 when the number of colors in the template is 5 or less, 0.4 when 6 to 10 colors are used, and 0.7 when 11 or more colors are used.
글꼴 다양성 지수는 1~2개 글꼴 스타일 사용시 0.4점, 3~4개 글꼴 스타일 사용시 0.6점, 5개 이상의 글꼴 스타일 사용시 0.9점을 부여할 수 있다.The font diversity index can be awarded 0.4 points when using 1 to 2 font styles, 0.6 points when using 3 to 4 font styles, and 0.9 points when using 5 or more font styles.
또한, 이미지 다양성 지수는 1~3개 유형의 이미지 템플릿 항목이 있는 경우 0.4점, 4~6개의 이미지 템플릿 항목이 있는 경우 0.7점, 7개 이상의 이미지 템플릿 항목이 있는 경우 1점이 부여될 수 있다.Additionally, the image diversity index can be awarded 0.4 points if there are 1 to 3 types of image template items, 0.7 points if there are 4 to 6 image template items, and 1 point if there are 7 or more image template items.
또한, 레이아웃 다양성 지수는 템플릿의 레이아웃 복잡성을 나타낼 수 있으며, 각 레이아웃 항목의 다양성에 따른 레아아웃 엔트로피로부터 산출될 수 있다.Additionally, the layout diversity index can represent the layout complexity of a template, and can be derived from the layout entropy according to the diversity of each layout item.
여기서, p_i는 템플릿 페이지 내 i번째 요소가 차지하는 면적의 비율을 의미한다. 예를 들어, 템플릿 페이지의 구성이 헤더, 본문, 사이드바, 푸터이고 각 차지하는 면적 비율이 10%, 50%, 20%, 및 20%일 때, 레이아웃 다양성 지수는 다음과 같이 산출된다.Here, p_i represents the area ratio occupied by the i-th element in the template page. For example, when the template page consists of header, body, sidebar, and footer, and the area ratios occupied by each are 10%, 50%, 20%, and 20%, the layout diversity index is calculated as follows.
일 예로, 레이아웃 다양성 지수는 미리 정해진 최소 및 최대 값의 범위에서 최소-최대정규화를 통해 0 내지 1로 정규화될 수 있다. 일 예로, 최소 레이아웃 다양성 지수가 0, 최대 레이아웃 다양성 지수가 3이고, 실제 레이아웃 다양성 지수가 1.76인 경우, 레이아웃 다양성 지수는 0.59로 정규화될 수 있다.For example, the layout diversity index can be normalized to 0 to 1 through min-max normalization within a range of predetermined minimum and maximum values. For example, if the minimum layout diversity index is 0, the maximum layout diversity index is 3, and the actual layout diversity index is 1.76, the layout diversity index can be normalized to 0.59.
이는 템플릿의 요소들이 상당히 다양하게 배치되어 있으며, 이로 인해 시각적인 관심을 끌고 사용자의 탐색 경험을 풍부하게 할 가능성이 높음을 나타낼 수 있다.This may indicate that the elements of the template are arranged in a fairly diverse manner, which is likely to attract visual interest and enrich the user's browsing experience.
기본 템플릿 항목이 15, 미리 산출된 스타일 최적화 점수가 0.8, 템플릿 복잡도 조정계수()가 0.4일 때, 최대 템플릿 항목은 다음과 같이 산출된다.The basic template items are 15, the pre-calculated style optimization score is 0.8, and the template complexity adjustment factor ( ) is 0.4, the maximum template items are calculated as follows.
즉, 템플릿 복잡도 조정계수()는 템플릿의 복잡도에 따라 산출된 스타일 최적화 점수를 조정하여, 최대 템플릿 항목의 변화 민감도를 조정할 수 있고, 복잡한 형태의 템플릿 레이아웃인 경우 템플릿 복잡도 조정계수()가 높게 산출되어, 템플릿의 원형에 따른 상품 정보를 할당 할 수 있도록 최대 템플릿 항목을 크게 조정할 수 있다.That is, the template complexity adjustment factor ( ) can adjust the sensitivity of changes in the maximum template item by adjusting the style optimization score calculated according to the complexity of the template, and in case of a complex template layout, the template complexity adjustment factor ( ) is calculated highly, so that the maximum template items can be significantly adjusted to allocate product information according to the prototype of the template.
도 4는 도 1에 따른 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 에 대한 하드웨어 구성도이다.Figure 4 is a hardware configuration diagram for a server for automatically collecting and stylizing non-standard product data according to Figure 1.
도 4를 참조하면, 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 (400)는, 적어도 하나의 프로세서(processor, 410) 및 적어도 하나의 프로세서(410)가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory, 420)를 포함할 수 있다.Referring to FIG. 4, the product non-standard data automatic collection and stylization processing server (400) may include at least one processor (processor, 410) and a memory (memory, 420) that stores instructions that instruct at least one processor (410) to perform at least one step.
여기서 적어도 하나의 프로세서(410)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), 또는 본 발명의 실시예들에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 메모리(420) 및 저장 장치(460) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다. 예를 들어, 메모리(420)는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중에서 적어도 하나로 구성될 수 있다.Here, at least one processor (410) may mean a central processing unit (CPU), a graphics processing unit (GPU), or a dedicated processor on which methods according to embodiments of the present invention are performed. Each of the memory (420) and the storage device (460) may be configured with at least one of a volatile storage medium and a nonvolatile storage medium. For example, the memory (420) may be configured with at least one of a read only memory (ROM) and a random access memory (RAM).
또한, 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 (400)는, 무선 네트워크를 통해 통신을 수행하는 송수신 장치(430)를 포함할 수 있다. 또한, 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 (400)는 입력 인터페이스 장치(440), 출력 인터페이스 장치(450), 저장 장치(460) 등을 더 포함할 수 있다. 상품 비정형 데이터 자동 수집 및 스타일화 가공 서버 (400)에 포함된 각각의 구성 요소들은 버스(bus, 470)에 의해 연결되어 서로 통신을 수행할 수 있다.In addition, the product non-standard data automatic collection and stylization processing server (400) may include a transmission/reception device (430) that performs communication via a wireless network. In addition, the product non-standard data automatic collection and stylization processing server (400) may further include an input interface device (440), an output interface device (450), a storage device (460), etc. Each component included in the product non-standard data automatic collection and stylization processing server (400) may be connected by a bus (bus, 470) and communicate with each other.
본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.The methods according to the present invention may be implemented in the form of program commands that can be executed through various computer means and recorded on a computer-readable medium. The computer-readable medium may include program commands, data files, data structures, etc., alone or in combination. The program commands recorded on the computer-readable medium may be those specially designed and configured for the present invention or may be known and available to those skilled in the art of computer software.
컴퓨터 판독 가능 매체의 예에는 롬(ROM), 램(RAM), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Examples of computer-readable media may include hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions may include not only machine language codes generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter, and the like. The above-described hardware devices may be configured to operate with at least one software module to perform the operations of the present invention, and vice versa.
또한, 상술한 방법 또는 장치는 그 구성이나 기능의 전부 또는 일부가 결합되어 구현되거나, 분리되어 구현될 수 있다. In addition, the above-described method or device may be implemented by combining all or part of its configuration or function, or may be implemented separately.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 필드로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although the present invention has been described above with reference to preferred embodiments thereof, it will be understood by those skilled in the art that various modifications and changes may be made to the present invention without departing from the spirit and field of the present invention as set forth in the claims below.
Claims (3)
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서가 복수의 동작을 수행하도록 지시하는 명령어들을 저장하는 메모리를 포함하고,
상기 복수의 동작은,
외부 서버로부터 상품 정보를 수신하는 동작;
외부 서버로부터 템플릿 정보를 수신하는 동작;
수신된 상기 상품 정보 및 상기 템플릿 정보의 메타데이터를 추출하는 동작;
추출한 상기 메타데이터를 CSV형식으로 저장하고, 상기 상품 정보로부터 추출된 메타데이터로부터 상품 카테고리를 특정하는 동작; 및
특정된 상기 상품 카테고리를 기초로, 미리 정해진 상품 페이지 레이아웃 템플릿에 상기 상품 정보로부터 추출된 메타 데이터를 기초로 상기 상품 정보를 할당하는 동작;을 포함하고,
상기 상품 정보를 상호 결합하여,
상품 기본 정보 점수 및 상품 고급 정보 점수를 산출하고, 산출된 상기 상품 기본 정보 점수 및 상기 상품 고급 정보 점수의 가중합으로부터 상품 정보 점수를 산출하는 동작;
상기 템플릿 정보를 상호 결합하여, 템플릿 기본 구조 점수 및 템플릿 기능 점수를 산출하고, 산출된 상기 템플릿 기본 구조 점수 및 상기 템플릿 기능 점수의 가중합으로부터 템플릿 정보 점수를 산출하는 동작;
산출된 상기 상품 정보 점수 및 상기 템플릿 정보 점수의 가중합으로부터 스타일 최적화 점수를 산출하는 동작; 및
산출된 상기 스타일 최적화 점수, 템플릿 복잡도 조정계수() 및 기본 템플릿 항목의 곱으로부터 최대 템플릿 항목을 산출하는 동작;을 더 포함하는 것을 특징으로 하는,
상품 비정형 데이터 자동 수집 및 스타일화 가공 서버.As a server that automatically collects and stylizes non-standard product data,
at least one processor; and
A memory storing instructions that instruct at least one processor to perform a plurality of operations,
The above multiple actions are:
The action of receiving product information from an external server;
The action of receiving template information from an external server;
An action of extracting metadata of the received product information and template information;
An operation of saving the extracted metadata in CSV format and specifying a product category from the metadata extracted from the product information; and
An operation of allocating product information based on metadata extracted from the product information to a predetermined product page layout template based on the specified product category;
By combining the above product information,
An operation of calculating a product basic information score and a product advanced information score, and calculating a product information score from a weighted sum of the calculated product basic information score and the product advanced information score;
An operation of calculating a template basic structure score and a template function score by mutually combining the above template information, and calculating a template information score from a weighted sum of the calculated template basic structure score and the template function score;
An operation of calculating a style optimization score from a weighted sum of the calculated product information score and the template information score; and
The above style optimization score produced, template complexity adjustment factor ( ) and an operation of producing a maximum template item from the product of the basic template items; characterized in that it further includes;
A server that automatically collects and stylizes non-standard product data.
상기 최대 템플릿 항목을 산출하는 동작은,
상기 템플릿 정보로부터 각 템플릿의 색상 다양성 지수, 글꼴 다양성 지수, 이미지 다양성 지수 및 레이아웃 다양성 지수의 평균으로 상기 템플릿 복잡도 조정계수()를 산출하는 동작;을 더 포함하는 것을 특징으로 하는,
상품 비정형 데이터 자동 수집 및 스타일화 가공 서버.
In claim 1,
The operation of producing the above maximum template items is:
From the above template information, the template complexity adjustment factor is calculated as the average of the color diversity index, font diversity index, image diversity index, and layout diversity index of each template. ), characterized by further including an operation for producing a );
A server that automatically collects and stylizes non-standard product data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020240161754A KR102823051B1 (en) | 2024-11-14 | 2024-11-14 | Server and method for automatic collection and stylization processing of unstructured product data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020240161754A KR102823051B1 (en) | 2024-11-14 | 2024-11-14 | Server and method for automatic collection and stylization processing of unstructured product data |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102823051B1 true KR102823051B1 (en) | 2025-06-19 |
Family
ID=96223444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020240161754A Active KR102823051B1 (en) | 2024-11-14 | 2024-11-14 | Server and method for automatic collection and stylization processing of unstructured product data |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102823051B1 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011510416A (en) * | 2008-01-23 | 2011-03-31 | スーパーデリバティブス,インコーポレイテッド | Apparatus, system and method for generating customized transactions |
KR20200041173A (en) * | 2018-10-11 | 2020-04-21 | 더글로벌트레이딩 주식회사 | Product information batch registration system and method for a plurality of open markets |
KR102225729B1 (en) | 2019-06-04 | 2021-03-10 | 주식회사 마카롱소프트 | Product information processing apparatus for multiple online shopping mall product registration and method thereof |
KR20220029289A (en) * | 2020-08-28 | 2022-03-08 | 쿠팡 주식회사 | Systems and methods of processing metadata for product registration |
KR20220149643A (en) * | 2022-02-10 | 2022-11-08 | 주식회사 디시에스 | Integrated management method for global e-commerce using item information estimation model and integrated management system for the same |
-
2024
- 2024-11-14 KR KR1020240161754A patent/KR102823051B1/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011510416A (en) * | 2008-01-23 | 2011-03-31 | スーパーデリバティブス,インコーポレイテッド | Apparatus, system and method for generating customized transactions |
KR20200041173A (en) * | 2018-10-11 | 2020-04-21 | 더글로벌트레이딩 주식회사 | Product information batch registration system and method for a plurality of open markets |
KR102225729B1 (en) | 2019-06-04 | 2021-03-10 | 주식회사 마카롱소프트 | Product information processing apparatus for multiple online shopping mall product registration and method thereof |
KR20220029289A (en) * | 2020-08-28 | 2022-03-08 | 쿠팡 주식회사 | Systems and methods of processing metadata for product registration |
KR20220149643A (en) * | 2022-02-10 | 2022-11-08 | 주식회사 디시에스 | Integrated management method for global e-commerce using item information estimation model and integrated management system for the same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9852477B2 (en) | Method and system for social media sales | |
CN108665355A (en) | Financial product recommends method, apparatus, equipment and computer storage media | |
US20230376981A1 (en) | Predictive systems and processes for product attribute research and development | |
US11532036B2 (en) | Digital image ordering using object position and aesthetics | |
CN107798607A (en) | Asset Allocation strategy acquisition methods, device, computer equipment and storage medium | |
US11869021B2 (en) | Segment valuation in a digital medium environment | |
US20240362409A1 (en) | Data Insight Generation and Presentation | |
KR20200039852A (en) | Method for analysis of business management system providing machine learning algorithm for predictive modeling | |
KR102446649B1 (en) | Method and apparatus for producing application using recommended templet based on artificial intelligence model | |
CN113868542B (en) | Attention model-based push data acquisition method, device, equipment and medium | |
CN116501957A (en) | User tag portrait processing method, user portrait system, apparatus and storage medium | |
US20210350437A1 (en) | Transaction and receipt based alert and notification system and techniques | |
US12354147B2 (en) | Systems and methods for determining price bands and user price affinity predictions using machine learning architectures and techniques | |
CN113837836A (en) | Model recommendation method, device, equipment and storage medium | |
Bhuria et al. | Ensemble-based customer churn prediction in banking: a voting classifier approach for improved client retention using demographic and behavioral data | |
US12124683B1 (en) | Content analytics as part of content creation | |
KR20250129524A (en) | Sales forecasting method and device based on multimodal data preprocessing | |
KR20230104788A (en) | Method, apparatus and computer program for classifying and saving data based on pre-learned object classification model | |
KR102823051B1 (en) | Server and method for automatic collection and stylization processing of unstructured product data | |
US10586163B1 (en) | Geographic locale mapping system for outcome prediction | |
US12412204B2 (en) | Systems and methods for determining price bands and user price affinity predictions using machine learning architectures and techniques | |
CN118780850A (en) | Order demand prediction method, system and electronic device based on machine learning | |
KR102086996B1 (en) | Platform system for brand management using responses of consumers, method for product planning using the same and computer program for the same | |
US11042837B2 (en) | System and method for predicting average inventory with new items | |
US20230099904A1 (en) | Machine learning model prediction of interest in an object |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20241114 |
|
PA0201 | Request for examination |
Patent event code: PA02011R01I Patent event date: 20241114 Comment text: Patent Application |
|
PA0302 | Request for accelerated examination |
Patent event date: 20241128 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20250116 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20250609 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20250617 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20250617 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |