[go: up one dir, main page]

KR101935109B1 - Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same - Google Patents

Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same Download PDF

Info

Publication number
KR101935109B1
KR101935109B1 KR1020160182940A KR20160182940A KR101935109B1 KR 101935109 B1 KR101935109 B1 KR 101935109B1 KR 1020160182940 A KR1020160182940 A KR 1020160182940A KR 20160182940 A KR20160182940 A KR 20160182940A KR 101935109 B1 KR101935109 B1 KR 101935109B1
Authority
KR
South Korea
Prior art keywords
probability
emotional
text data
sentence
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020160182940A
Other languages
Korean (ko)
Other versions
KR20180078010A (en
Inventor
전채남
손기준
성영주
Original Assignee
(주) 더아이엠씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주) 더아이엠씨 filed Critical (주) 더아이엠씨
Priority to KR1020160182940A priority Critical patent/KR101935109B1/en
Publication of KR20180078010A publication Critical patent/KR20180078010A/en
Application granted granted Critical
Publication of KR101935109B1 publication Critical patent/KR101935109B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • G06F17/27
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 따른 패션 분야의 단어 구 단위 감성분석방법은, 저장매체에 저장된 패션 분야의 단어 구 단위 감성분석용 프로그램이 설치된 관리서버를 통해 수행되는 패션 분야의 단어 구 단위 감성분석방법에 있어서, 온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계와, 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계와, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계와, 상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계와, 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계와, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계를 포함한다.A method for analyzing a word segment sentiment in a fashion field according to the present invention is a word segment sentiment analysis method in a fashion segment performed through a management server installed with a word segment sentiment analysis program of a fashion field stored in a storage medium, (B) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data; and (c) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data, (C) constituting a sentence constituting at least a part of a sentence, (d) assigning affirmative / negative polarity weights of the emotional vocabulary constituting the combined sentence in the step (c) (E) analyzing positive / negative polarity of a sentence combining at least a part of the emotional vocabulary with a negative irregular weight, and analyzing the result of (e) And (f) analyzing trends in the fashion field.

Description

패션 분야의 단어 구 단위 감성분석방법 및 이를 포함하는 저장매체{Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same}BACKGROUND OF THE INVENTION Field of the Invention The present invention relates to a sensibility analysis method for a word phrase in a fashion field, and a storage medium including the sensibility analyzing method.

본 발명은 패션 분야의 단어 감성분석방법 및 이를 포함하는 저장매체에 관한 것으로서, 보다 상세하게는 단어 구 단위로 분석을 수행할 수 있도록 하는 패션 분야의 단어 구 단위 감성분석방법 및 이를 포함하는 저장매체에 관한 것이다.The present invention relates to a word sensibility analysis method in a fashion field and a storage medium including the same, and more particularly, to a word sensibility analysis method in a fashion field that enables analysis in units of word phrases, and a storage medium .

최근에는 인터넷이 활발하게 사용되고 있으며, 스마트폰 등의 등장으로 각종 온라인 서비스가 제공되고 있다. 또한 이에 발맞추어 사용자에게 제공하기 위한 다양한 관련 서비스가 연구 및 개발되고 있다.Recently, the Internet has been actively used, and various online services have been provided by the appearance of smart phones and the like. In addition, various related services are being researched and developed to provide users with such services.

그리고 갈수록 다양해지는 사용자의 욕구에 따라 서비스 제공자는 사용자의 수요 및 요구를 정확하게 판단해야 할 필요가 있으며, 이를 위해 보다 정확한 사용자의 수요 및 요구를 판단하기 위한 알고리즘이 연구되고 있다.In addition, service providers need to accurately determine the needs and demands of users according to the increasingly diverse needs of users. To do so, algorithms are being studied to determine the demand and demand of users more accurately.

다만, 패션/어패럴 분야의 경우, 그 특성 상 온라인 서비스 상에 존재하는 비정형 텍스트 중에는 감성적이고 정량화할 수 없는 데이터가 대다수를 이루기 때문에, 분석이 매우 어려운 실정이다.However, in the case of the fashion / apparel field, it is very difficult to analyze the unstructured text existing on the online service because the majority of emotional and quantifiable data is formed.

이와 같은 이유로 인해 현재까지는 패션/어패럴 분야의 트렌트를 정밀하게 예측할 수 있는 분석방법이 거의 개발되지 않았으며, 소수 존재하는 분석시스템은 그 정밀도가 크게 떨어지는 문제가 있다.For this reason, up to now, there has been little developed an analysis method capable of precisely predicting trends in the fashion / apparel field, and there is a problem that the accuracy of a few existing analysis systems is greatly reduced.

따라서 상기와 같은 문제점을 해결하기 위한 방법이 요구되고 있는 상황이다.Therefore, a method for solving the above problems is required.

일본공개특허 제2006-318426호Japanese Laid-Open Patent Publication No. 2006-318426

본 발명은 상술한 종래 기술의 문제점을 해결하기 위하여 안출된 발명으로서, 감성 어휘의 효과적 분석을 통해 패션 분야의 트렌드를 정밀하게 분석 및 예측할 수 있도록 하기 위한 목적을 가진다.Disclosure of Invention Technical Problem [8] The present invention has been devised in order to solve the problems of the prior art described above, and has an object to enable accurate analysis and prediction of trends in the fashion field through effective analysis of emotional vocabulary.

본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The problems of the present invention are not limited to the above-mentioned problems, and other problems not mentioned can be clearly understood by those skilled in the art from the following description.

상기한 목적을 달성하기 위한 본 발명의 패션 분야의 단어 구 단위 감성분석방법은, 저장매체에 저장된 패션 분야의 단어 구 단위 감성분석용 프로그램이 설치된 관리서버를 통해 수행되는 패션 분야의 단어 구 단위 감성분석방법에 있어서, 온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계와, 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계와, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계와, 상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계와, 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계와, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계를 포함한다.In order to achieve the above-mentioned object, the present invention provides a method for analyzing sentence-by-word sensibility in a fashion field, the method comprising the steps of: (B) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data; and (b) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data (C) constituting a sentence combining at least some of the emotional vocabularies, and (d) assigning positive / negative polarity weights of the emotional vocabulary constituting the combined sentence in the step (c) (E) analyzing positive / negative polarity of sentences combining at least some of the emotional vocabulary through positive / negative polarity weights of the emotional vocabulary; and (e) Through the analysis of the system comprises (f) analyzing the trend of the sphere.

그리고 상기 (b)단계에서, 상기 감성어휘는 단일의 어휘 또는 복수의 어휘가 조합된 단어 구 중 적어도 어느 하나일 수 있다.In the step (b), the emotional vocabulary may be at least one of a single vocabulary or a word phrase in which a plurality of vocabularies are combined.

또한 상기 (d)단계는, 상기 문장을 구성하는 각 감성어휘가 전체 비정형 텍스트 데이터에서 발생할 제1확률을 산출하는 (d-1)단계와, 상기 문장을 구성하는 각 감성어휘가 긍정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제2확률을 산출하는 (d-2)단계와, 상기 문장을 구성하는 각 감성어휘가 부정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제3확률을 산출하는 (d-3)단계와, 상기 제1확률과 상기 제2확률이 동시에 발생할 제4확률을 산출하는 (d-4)단계와, 상기 제1확률과 상기 제3확률이 동시에 발생할 제5확률을 산출하는 (d-5)단계와, 상기 제4확률에서 상기 제5확률을 뺀 값의 양수/음수 여부에 따라 해당 감성어휘의 긍정/부정 극성 가중치를 판단하는 (d-6)단계를 포함할 수 있다.The step (d) may further include the steps of: (d-1) calculating a first probability that each emotional vocabulary constituting the sentence occurs in the entire amorphous text data; and (D-2) calculating a second probability that occurs in the unstructured text data; calculating (d-3) calculating a third probability that occurs in the atypical text data in which each emotional vocabulary constituting the sentence has a negative tendency; (D-4) calculating a fourth probability at which the first probability and the second probability occur at the same time; and (d-5) calculating a fifth probability at which the first probability and the third probability occur at the same time, (D-6) determining an affirmative / negative polarity weight value of the emotional vocabulary according to whether the value obtained by subtracting the fifth probability from the fourth probability is positive or negative.

그리고 상기 (e)단계는, 상기 (d)단계에서 산출된 각 감성어휘의 긍정/부정 극성 가중치를 합산하여 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 산출할 수 있다.The step (e) may calculate positive / negative polarity of a sentence in which at least a part of the emotional vocabulary is combined by summing positive / negative polarity weights of the emotional vocabularies calculated in the step (d).

상기한 과제를 해결하기 위한 본 발명의 패션 분야의 단어 구 단위 감성분석방법 및 이를 포함하는 저장매체는 다음과 같은 효과가 있다.In order to solve the above-described problems, the method for analyzing sentence-by-word sensibility in a fashion field and the storage medium including the same have the following effects.

첫째, 합리적이고 현실적으로 패션/어패럴 분야의 트렌드를 정밀하게 분석 및 예측할 수 있는 장점이 있다.First, there is an advantage of being able to analyze and predict trends of fashion / apparel field accurately and reasonably.

둘째, 단어 구 단위로 긍정/부정 극성 가중치를 부여하여 분석을 수행할 수 있으므로, 거시적인 측면에서의 분석이 가능하다는 장점이 있다.Second, since the analysis can be performed by assigning affirmative / negative polarity weights to each word phrase, it is possible to analyze in terms of macroscopic aspects.

셋째, 감성적 텍스트를 정량적으로 분석하고, 이를 사용자가 이해하기 쉽게 제공할 수 있는 장점이 있다.Third, there is an advantage that the emotional text can be analyzed quantitatively and it can be easily provided by the user.

넷째, 사용자는 분석 결과를 통해 적극적인 마케팅에 활용할 수 있는 장점이 있다.Fourth, users have the advantage of being able to utilize them for active marketing through analysis results.

본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned can be clearly understood by those skilled in the art from the description of the claims.

도 1은 본 발명의 일 실시예에 따른 감성분석방법의 전체 과정을 나타낸 흐름도;
도 2는 본 발명의 일 실시예에 따른 감성분석방법의 세부 과정을 나타낸 흐름도; 및
도 3은 본 발명의 일 실시예에 따른 감성분석방법에 있어서, 긍정/부정 극성 가중치가 부여된 감성어휘의 예시를 나타낸 표이다.
1 is a flowchart illustrating an entire process of a sensitivity analysis method according to an embodiment of the present invention;
FIG. 2 is a flowchart illustrating a detailed process of a sensitivity analysis method according to an exemplary embodiment of the present invention; FIG. And
FIG. 3 is a table showing an example of an emotional vocabulary given an affirmative / negative polarity weight in the emotional analysis method according to an embodiment of the present invention.

이하 본 발명의 목적이 구체적으로 실현될 수 있는 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 설명한다. 본 실시예를 설명함에 있어서, 동일 구성에 대해서는 동일 명칭 및 동일 부호가 사용되며 이에 따른 부가적인 설명은 생략하기로 한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings. In describing the present embodiment, the same designations and the same reference numerals are used for the same components, and further description thereof will be omitted.

본 발명에 따른 패션 분야의 단어 구 단위 감성분석방법은 저장매체에 저장된 패션 분야의 단어 구 단위 감성분석용 프로그램이 설치된 관리서버를 통해 수행되는 것으로서, 상기 관리서버에 설치되어 상기 관리서버의 프로세서에 의해 구동될 수 있다.A method for analyzing a word segment emotion in a fashion field according to the present invention is performed through a management server installed with a word segment emotion analyzing program of a fashion field stored in a storage medium and is installed in the management server, Lt; / RTI >

또한 이에 의해 구동된 패션 분야의 단어 구 단위 감성분석용 프로그램은 디스플레이 모듈 등 영상 출력장치를 통해 출력될 수 있으며, 시각화된 그래픽 유저 인터페이스를 통해 사용자에게 가시적인 정보를 제공할 수 있다.In addition, a program for the emotion analysis of a word segment in the fashion field driven thereby can be outputted through a video output device such as a display module, and can provide visual information to a user through a visualized graphic user interface.

특히 상기 패션 분야의 단어 구 단위 감성분석용 프로그램이 저장된 저장매체는 이동식 디스크나 통신망을 이용하여 상기 관리서버에 설치될 수 있으며, 상기 패션 분야의 단어 구 단위 감성분석용 프로그램은 상기 관리서버가 다양한 기능적 수단으로 운용되도록 할 수 있다. 즉 본 발명은 소프트웨어에 의한 정보 처리가 하드웨어를 통해 구체적으로 실현된다.Particularly, the storage medium storing the word segment emotion analysis program of the fashion field can be installed in the management server using a mobile disk or a communication network, It can be operated by functional means. That is, in the present invention, information processing by software is realized through hardware.

이하에서는 상기 관리서버를 통해 실행되는 본 발명의 패션 분야의 단어 구 단위 감성분석용 프로그램의 알고리즘에 대해 설명하도록 한다.Hereinafter, an algorithm of a word segment emotional analysis program in the fashion field of the present invention executed through the management server will be described.

도 1은 본 발명의 일 실시예에 따른 감성분석방법의 전체 과정을 나타낸 흐름도이다1 is a flowchart illustrating an entire process of a sensitivity analysis method according to an embodiment of the present invention

도 1 에 도시된 바와 같이, 본 발명의 일 실시예에 따른 감성분석방법은 온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계와, 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계와, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계와, 상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계와, 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계와, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계를 포함할 수 있다.As shown in FIG. 1, the emotional analysis method according to an exemplary embodiment of the present invention includes: (a) collecting atypical text data for an online service and storing the collected atypical text data in the management server; (B) extracting a plurality of emotional vocabularies included in the field; (c) composing a sentence combining at least some of the emotional vocabularies; and (c) (E) analyzing positive / negative polarity of sentences combining at least some of the emotional vocabulary through affirmative / negative polarity weights of the emotional vocabulary, (d) assigning affirmative / And analyzing trends of the fashion field through the analysis result of the step (e).

이하에서는 이들 각 단계에 대해 자세히 설명하도록 한다.Each of these steps will be described in detail below.

먼저 상기 (a)단계의 경우, 다양한 온라인 서비스로부터 비정형 텍스트 데이터를 추출하고, 수집하는 단계이다.In step (a), unregistered text data is extracted from various online services and collected.

여기서 상기 온라인 서비스라 함은 웹, SNS 등 통신망을 이용한 다양한 온라인 서비스 매체일 수 있으며, 어느 하나의 온라인 서비스에 제한되지 않는다. 그리고 상기 비정형 텍스트 데이터의 경우, 문서 형태의 데이터로서 그 구조가 복잡해 정형화되지 않은 데이터를 말한다.Here, the online service may be various online service media using a communication network such as the web, SNS, etc., and is not limited to any online service. In the case of the above-mentioned unstructured text data, it refers to data of document type which is complicated in its structure and is not formatted.

즉 본 단계에서는 다양한 온라인 서비스를 대상으로 문서 형태의 데이터를 추출하게 되며, 이후 (b)단계가 수행된다.That is, in this step, data of a document type is extracted for various online services, and then step (b) is performed.

상기 (b)단계는 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하게 된다. 본 단계에서는 추출된 비정형 텍스트 데이터로부터 패션 분야에 관련된 복수의 어휘를 추출하게 되며, 이때 단순한 패션 관련 용어뿐 아니라, 명사, 부사 등의 어휘 전반, 패션 분야 전반을 포괄할 수 있는 대표성 있는 감성어휘를 추출하게 된다.In the step (b), a plurality of emotional vocabularies included in the fashion field are extracted from the atypical text data. In this step, a plurality of vocabularies related to the fashion field are extracted from the extracted atypical text data. At this time, representative vocabularies including representative vocabulary such as nouns and adverbs, Respectively.

특히 본 실시예의 경우, 상기 (b)단계는 적어도 하나의 어절을 포함하는 의미 단위의 감성어휘를 추출하는 것으로 할 수 있다. 즉 하나의 어절로만 된 감성어휘뿐 아니라, 복수의 어절이 조합되어 하나의 의미를 나타내는 단어 구 형태의 감성어휘 역시 대상에 포함된다.In particular, in the case of the present embodiment, the step (b) may extract the emotional vocabulary of the semantic unit including at least one word. In other words, emotional vocabulary in the form of a word phrase, which represents a single meaning by combining plural word phrases, is included in the object as well as an emotional vocabulary of only one word.

예를 들어, 패션 관련 명사인 '색상, 질감, 촉감, 매력; 도시적, 감각적, 현대적, 활동적, 매력적' 등과, 동사, 형용사인 '세련되다, 섹시하다, 고급스럽다, 특이하다, 우아하다, 여성스럽다' 등의 개별 어휘 단위 목록뿐만 아니라, '매력이 있다, 보기 좋다, 사고 싶다, 마음에 들다' 등 복수의 어절이 조합된 감성어휘가 그 대상이 될 수 있을 것이다.For example, the fashion related noun 'color, texture, touch, charm; As well as a list of individual vocabulary units such as 'urban, sensual, modern, active, attractive', verb and adjective 'sophisticated, sexy, elegant, unique, elegant, feminine' I would like to buy an emotional vocabulary that has a combination of multiple words such as "I like to see, I want to buy, I like".

다음으로, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계가 수행되며, 본 단계에서는 전술한 (b)단계에서 추출된 감성어휘를 통해 특정한 조합의 문장을 구성하게 된다.Next, a step (c) of constructing a sentence combining at least some of the emotional vocabularies is performed. In this step, a specific combination of sentences is formed through the emotional vocabulary extracted in the step (b).

그리고 이하의 (d)단계 내지 (e)단계에서는, 상기 (c)단계에서 구성된 문장을 구성하는 각 감성어휘의 긍정/부정 극성 가중치를 부여하고, 이를 통해 문장 전체의 긍정/부정 극성을 판단할 수 있도록 한다.In the following steps (d) to (e), affirmative / irregularity weights of each emotional vocabulary constituting the sentence constituted in the step (c) are given and the positive / negative polarity of the entire sentence is judged .

도 2는 본 발명의 일 실시예에 따른 감성분석방법의 세부 과정을 나타낸 흐름도이다. 도 2에 도시된 바와 같이, 상기 (d)단계는 세부적으로 (d-1)단계 내지 (d-6)단계를 포함할 수 있다.2 is a flowchart illustrating a detailed process of the emotion analysis method according to an embodiment of the present invention. As shown in FIG. 2, step (d) may include steps (d-1) to (d-6).

먼저 (d-1)단계에서는 전술한 (c)단계에 의해 구성된 문장에 포함된 각 감성어휘가 전체 비정형 텍스트 데이터에서 발생할 제1확률을 산출하게 된다.First, in step (d-1), the first probability that each emotional vocabulary included in the sentence constituted by the step (c) occurs in the entire unstructured text data is calculated.

즉 본 단계에서는 다양한 온라인 서비스로부터 추출된 비정형 텍스트 데이터 전체를 대상으로, 해당 문장을 구성하는 개별 감성어휘가 발생할 확률을 각각 산출할 수 있다.That is, in this step, the probability of occurrence of the individual emotional vocabulary constituting the sentence can be calculated for all the unstructured text data extracted from various online services.

다음으로 (d-2)단계에서는, 상기 문장을 구성하는 각 감성어휘가 긍정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제2확률을 산출하게 된다.Next, in step (d-2), the second probability that each emotional vocabulary constituting the sentence will occur in the unstructured text data having positive tendency is calculated.

본 단계에서는 다양한 온라인 서비스로부터 추출된 비정형 텍스트 데이터 전체 중 선별된 긍정 성향을 가지는 비정형 텍스트 데이터만을 대상으로 하여, 해당 문장을 구성하는 개별 감성어휘가 발생할 확률을 각각 산출할 수 있다.In this step, probabilities of occurrence of individual emotional vocabularies constituting the corresponding sentence can be calculated by targeting only the atypical text data having a positive affinity selected from all the unstructured text data extracted from various online services.

다음으로 (d-3)단계에서는, 상기 문장을 구성하는 각 감성어휘가 부정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제3확률을 산출하게 된다.Next, in step (d-3), the third probability that each emotional vocabulary constituting the sentence occurs in the amorphous text data having a negative tendency is calculated.

본 단계에서는 다양한 온라인 서비스로부터 추출된 비정형 텍스트 데이터 전체 중 선별된 부정 성향을 가지는 비정형 텍스트 데이터만을 대상으로 하여, 해당 문장을 구성하는 개별 감성어휘가 발생할 확률을 각각 산출할 수 있다.In this step, probability of occurrence of individual emotional vocabulary constituting the corresponding sentence can be calculated by targeting only the unstructured text data having a negative tendency selected from all the unstructured text data extracted from various online services.

그리고 이상과 같이 산출된 각 감성어휘의 제1확률 내지 제3확률을 통해, (d-4)단계 내지 (d-6)단계를 거쳐 해당 감성어휘의 긍정/부정 극성 가중치를 판단할 수 있다.The affirmative / negative polarity weighting value of the emotional vocabulary can be determined through the steps (d-4) to (d-6) through the first probability to the third probability of each emotional vocabulary calculated as described above.

상기 (d-4)단계에서는, 각 감성어휘 별로 상기 제1확률과 상기 제2확률이 동시에 발생할 제4확률을 산출하게 되며, 상기 (d-5)단계에서는 상기 제1확률과 상기 제3확률이 동시에 발생할 제5확률을 산출하게 된다.Wherein the first probability and the second probability are simultaneously calculated for each emotional vocabulary in the step (d-4), and in the step (d-5), the first probability and the third probability The fifth probability to be generated at the same time.

이후 상기 (d-6)단계에서는, 상기 (d-4)단계에 의해 산출된 상기 제4확률에서, 상기 (d-5)단계에 의해 산출된 상기 제5확률을 뺀 값의 양수/음수 여부를 판단하고, 그 결과에 따라 해당 감성어휘의 긍정/부정 극성 가중치를 판단하게 된다.Then, in the step (d-6), whether or not the value obtained by subtracting the fifth probability calculated in the step (d-5) from the fourth probability calculated in the step (d-4) And judges the positive / negative polarity weighting value of the emotional vocabulary according to the result.

도 3은 본 발명의 일 실시예에 따른 감성분석방법에 있어서, 긍정/부정 극성 가중치가 부여된 감성어휘의 예시를 나타낸 표이다.FIG. 3 is a table showing an example of an emotional vocabulary given an affirmative / negative polarity weight in the emotional analysis method according to an embodiment of the present invention.

도 3에 도시된 바와 같이, 소정의 감성어휘는 단일의 단어로 구성될 수도 있으며, 또는 복수의 단어가 조합된 단어 구 형태일 수 있다. 그리고 전술한 (a)단계 내지 (d)단계를 통해, 각 감성어휘 별 극성 지수를 산출할 수 있게 된다.As shown in FIG. 3, the predetermined emotional vocabulary may be composed of a single word, or may be a word phrase in which a plurality of words are combined. Through the steps (a) to (d), it is possible to calculate the polarity index for each emotion word.

도 3의 표에 예시된 바와 같이, '가격만큼 하', '가격대가 높', '가렵', '간지럽' 등과 같이 패션/어패럴 상품의 특성 상 부정적인 느낌을 주는 감성어휘의 극성지수는 음수의 값을 가지는 것을 확인할 수 있으며, '가볍', '가치가 높', '가치가 있', '간결하', '간편하', '감동받' 등과 같이 패션/어패럴 상품의 특성 상 긍정적인 느낌을 주는 감성어휘의 극성 지수는 양수의 값을 가지는 것을 확인할 수 있다.As shown in the table of FIG. 3, the polarity index of the emotional vocabulary that gives a negative impression due to the characteristics of fashion / apparel products such as' price as low as price, high price, '' And it is positive feeling in the characteristics of fashion / apparel goods such as 'light', 'high value', 'worthy', 'concise', 'easy', 'impressed' And the polarity index of the emotional vocabulary that gives the emotional vocabulary has a positive value.

또한 이들 감성어휘의 극성 강도는, 각 극성 지수의 절대값으로 판단할 수 있을 것이다.The polarity intensity of these emotional vocabularies can be judged as the absolute value of each polarity index.

다음으로, 상기 (e)단계에서는 (d)단계에 의해 산출된 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장, 즉 (c)단계에서 조합된 문장의 긍정/부정 극성을 분석하게 된다.Next, in the step (e), a sentence in which at least some of the emotional vocabulary is combined through the affirmative / negative polarity weighting value of the emotional vocabulary calculated in the step (d) Positive / negative polarity.

본 단계의 경우, 조합된 문장을 구성하는 각 감성어휘에 대해 상기 (d)단계에서 산출된 긍정/부정 극성 가중치를 모두 합산하여, 해당 문장의 긍정/부정 극성을 산출하게 된다.In this step, the affirmative / negative polarity of the sentence is calculated by summing up the positive / negative polarity weights calculated in the step (d) for each emotional vocabulary constituting the combined sentence.

예컨대 특정 문장이 3개의 감성어휘를 포함하고 있다고 할 경우, 해당 문장의 최종 긍정/부정 극성은 3개의 감성어휘의 각 긍정/부정 극성 가중치를 모두 합산한 최종 값의 양수/음수 여부를 통해 산출할 수 있을 것이다.For example, if a sentence contains three emotional vocabularies, the final affirmation / negativity of the sentence is calculated by determining whether the final positive / negative polarity weights of the three emotional vocabularies are positive or negative. It will be possible.

이후, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계가 수행된다.Thereafter, step (f) of analyzing trends in the fashion field is performed through the analysis result of step (e).

본 단계에서는 전술한 각 단계의 연산 결과 긍정/부정 극성 가중치가 부여된 감성어휘, 그리고 이들로 구성된 문장의 극성을 통해 패션 분야의 트렌드를 분석하는 과정이 수행된다.In this stage, the process of analyzing trends in the fashion field is carried out through the emotional vocabulary given positive / negative polarity weighting and the polarity of the sentence composed of the above results.

즉 본 단계에서는 비정형 데이터에 나타난 고빈도 감성 어휘 선정, 채널 별/주제 별로 통계적으로 유의미하게 나타나는 감성 어휘 선정, 빈도와 사용 분야, 의미 층위를 고려한 패션 분야의 감성 기본 어휘 선정 등의 작업이 수행될 수 있으며, 이를 통해 패션 분야의 트렌드를 정밀하게 분석 및 예측할 수 있다.In this step, the selection of high-frequency emotional vocabulary in unstructured data, the selection of emotional vocabulary that is statistically significant for each channel / subject, the frequency and use field, and the selection of basic vocabulary for emotion in the field of fashion This allows precise analysis and prediction of fashion trends.

그리고 이후, 이와 같은 분석 결과를 가시화하여 상기 관리서버로부터 사용자에게 제공할 수 있으며, 사용자는 사용자 단말기 등에 가시화된 분석 결과를 통해 적극적인 마케팅에 활용할 수 있다.Then, the analysis result can be visualized and provided to the user from the management server, and the user can utilize the analysis result displayed through the user terminal for aggressive marketing.

이상과 같이, 본 발명은 합리적이고 현실적으로 감성적 텍스트를 정량적으로 분석하고, 패션/어패럴 분야의 트렌드를 정밀하게 분석 및 예측할 수 있는 장점을 가진다.As described above, the present invention is advantageous in that it quantitatively analyzes sensible text rationally and realistically, and accurately analyzes and predicts trends in the fashion / apparel field.

그리고 이후, 이와 같은 분석 결과를 가시화하여 사용자에게 제공할 수 있으며, 사용자는 분석 결과를 통해 적극적인 마케팅에 활용할 수 있다.Then, such analysis result can be visualized and presented to the user, and the user can utilize the analysis result for active marketing.

이상과 같이 본 발명에 따른 바람직한 실시예를 살펴보았으며, 앞서 설명된 실시예 이외에도 본 발명이 그 취지나 범주에서 벗어남이 없이 다른 특정 형태로 구체화될 수 있다는 사실은 해당 기술에 통상의 지식을 가진 이들에게는 자명한 것이다. 그러므로, 상술된 실시예는 제한적인 것이 아니라 예시적인 것으로 여겨져야 하고, 이에 따라 본 발명은 상술한 설명에 한정되지 않고 첨부된 청구항의 범주 및 그 동등 범위 내에서 변경될 수도 있다.It will be apparent to those skilled in the art that the present invention can be embodied in other specific forms without departing from the spirit or scope of the invention as defined in the appended claims. It is obvious to them. Therefore, the above-described embodiments are to be considered as illustrative rather than restrictive, and the present invention is not limited to the above description, but may be modified within the scope of the appended claims and equivalents thereof.

Claims (5)

저장매체에 저장된 패션 분야의 단어 구 단위 감성분석용 프로그램이 설치된 관리서버를 통해 수행되는 패션 분야의 단어 구 단위 감성분석방법에 있어서,
온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계;
상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계;
상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계;
상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계;
상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계; 및
상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계;
를 포함하며,
상기 (d)단계는,
상기 문장을 구성하는 각 감성어휘가 전체 비정형 텍스트 데이터에서 발생할 제1확률을 산출하는 (d-1)단계;
상기 문장을 구성하는 각 감성어휘가 상기 전체 비정형 텍스트 테이터 중 긍정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제2확률을 산출하는 (d-2)단계;
상기 문장을 구성하는 각 감성어휘가 상기 전체 비정형 텍스트 테이터 중 부정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제3확률을 산출하는 (d-3)단계;
상기 제1확률과 상기 제2확률이 동시에 발생할 제4확률을 산출하는 (d-4)단계;
상기 제1확률과 상기 제3확률이 동시에 발생할 제5확률을 산출하는 (d-5)단계; 및
상기 제4확률에서 상기 제5확률을 뺀 값의 양수/음수 여부에 따라 해당 감성어휘의 긍정/부정 극성 가중치를 판단하고, 상기 극성 가중치의 절대값을 통해 해당 감성어휘의 극성 강도를 판단하는 (d-6)단계;
를 포함하고,
상기 (e)단계는,
상기 (d)단계에서 산출된 각 감성어휘의 긍정/부정 극성 가중치를 합산하여, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 산출하는 패션 분야의 단어 구 단위 감성분석방법.
A method for analyzing emotion in a word field in a fashion field, which is performed through a management server installed with a word segment emotion analysis program of a fashion field stored in a storage medium,
(A) collecting unstructured text data on an online service and storing the collected unstructured text data in the management server;
(B) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data;
(C) composing sentences combining at least some of the emotional vocabularies;
(D) assigning affirmative / negative polarity weights of the emotional vocabulary constituting the combined sentence in the step (c);
(E) analyzing positive / negative polarity of a sentence combining at least a part of the emotional vocabulary through positive / negative polarity weighting of the emotional vocabulary; And
Analyzing trends in the fashion field through the analysis result of step (e);
/ RTI >
The step (d)
(D-1) calculating a first probability that each emotional vocabulary constituting the sentence occurs in all irregular text data;
(D-2) calculating a second probability that each emotional vocabulary constituting the sentence occurs in atypical text data having an affirmative tendency among all the atypical text data;
(D-3) calculating a third probability that each emotional vocabulary constituting the sentence occurs in atypical text data having a negative tendency among all the atypical text data;
(D-4) calculating a fourth probability that the first probability and the second probability occur simultaneously;
(D-5) calculating a fifth probability that the first probability and the third probability occur simultaneously; And
Judging the affirmative / negative polarity weighting value of the emotional vocabulary according to whether the value obtained by subtracting the fifth probability from the fourth probability is positive or negative and judging the polarity intensity of the sensible vocabulary based on the absolute value of the polarity weighting value d-6);
Lt; / RTI >
The step (e)
Wherein the affirmative / negative polarity of each emotional vocabulary calculated in the step (d) is summed up to calculate a positive / negative polarity of a sentence combining at least some of the emotional vocabulary.
제1항에 있어서,
상기 (b)단계에서,
상기 감성어휘는 단일의 어휘 또는 복수의 어휘가 조합된 단어 구 중 적어도 어느 하나인 패션 분야의 단어 구 단위 감성분석방법.
The method according to claim 1,
In the step (b)
Wherein the emotional vocabulary is at least one of a single vocabulary or a word phrase in which a plurality of vocabularies are combined.
삭제delete 삭제delete 컴퓨터에 제1항 또는 제2항의 패션 분야의 단어 구 단위 감성분석방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장매체.A computer-readable storage medium having recorded thereon a program for causing a computer to execute the word segment emotion analysis method of claim 1 or 2.
KR1020160182940A 2016-12-29 2016-12-29 Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same Active KR101935109B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160182940A KR101935109B1 (en) 2016-12-29 2016-12-29 Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160182940A KR101935109B1 (en) 2016-12-29 2016-12-29 Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same

Publications (2)

Publication Number Publication Date
KR20180078010A KR20180078010A (en) 2018-07-09
KR101935109B1 true KR101935109B1 (en) 2019-01-04

Family

ID=62919582

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160182940A Active KR101935109B1 (en) 2016-12-29 2016-12-29 Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same

Country Status (1)

Country Link
KR (1) KR101935109B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230068092A (en) 2021-11-10 2023-05-17 동의대학교 산학협력단 A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102831240B1 (en) * 2022-09-05 2025-07-08 주식회사 아르스프락시아 Method and device for sentiment analysis of keywords derived using big data and social network analysis

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015032166A (en) * 2013-08-02 2015-02-16 エヌ・ティ・ティ・コムウェア株式会社 Classification device, method, and program
KR101500900B1 (en) * 2014-04-28 2015-03-12 한양대학교 산학협력단 Method and System for Classifying Text Using Classifier Produced by Learning Data

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101560456B1 (en) * 2013-11-01 2015-10-15 황성봉 Extraction and Estimation Method of Trend Information with the Analasis of Vocabularies

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015032166A (en) * 2013-08-02 2015-02-16 エヌ・ティ・ティ・コムウェア株式会社 Classification device, method, and program
KR101500900B1 (en) * 2014-04-28 2015-03-12 한양대학교 산학협력단 Method and System for Classifying Text Using Classifier Produced by Learning Data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230068092A (en) 2021-11-10 2023-05-17 동의대학교 산학협력단 A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same

Also Published As

Publication number Publication date
KR20180078010A (en) 2018-07-09

Similar Documents

Publication Publication Date Title
US11699035B2 (en) Generating message effectiveness predictions and insights
Kang et al. based measurement of customer satisfaction in mobile service: Sentiment analysis and VIKOR approach
US10657544B2 (en) Targeted E-commerce business strategies based on affiliation networks derived from predictive cognitive traits
US8977573B2 (en) System and method for identifying customers in social media
Kim et al. Competitive intelligence in social media Twitter: iPhone 6 vs. Galaxy S5
US20190146984A1 (en) Prioritizing survey text responses
US20150186790A1 (en) Systems and Methods for Automatic Understanding of Consumer Evaluations of Product Attributes from Consumer-Generated Reviews
US20150254675A1 (en) Method and apparatus for personalizing customer interaction experiences
US20180349781A1 (en) Method and device for judging news quality and storage medium
US9953029B2 (en) Prediction and optimized prevention of bullying and other counterproductive interactions in live and virtual meeting contexts
WO2019242453A1 (en) Information processing method and device, storage medium, and electronic device
Raghupathi et al. Customer sentiment appraisal from user-generated product reviews: a domain independent heuristic algorithm
Wang et al. Customer-driven product design selection using web based user-generated content
KR101931624B1 (en) Trend Analyzing Method for Fassion Field and Storage Medium Having the Same
Rathan et al. Every post matters: a survey on applications of sentiment analysis in social media
CN117829846A (en) User satisfaction prediction method, device and equipment
US12050879B2 (en) Systems and methods for reducing input to and increasing processing speeds of natural language processing models
KR101935109B1 (en) Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same
Wang et al. Learning personalized privacy preference from public data
US20140195298A1 (en) Tracking of near conversions in user engagements
Wen et al. Infusing Affective Computing Models into Advertising Research on Emotions
CN112200602A (en) Neural network model training method and device for advertisement recommendation
Barbosa et al. Predicting portuguese steam review helpfulness using artificial neural networks
Zhang et al. Predicting temporary deal success with social media timing signals
Chang et al. Using Machine Learning to Extract Insights from Consumer Data

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20161229

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20170821

Patent event code: PE09021S01D

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20180227

Patent event code: PE09021S01D

PG1501 Laying open of application
E90F Notification of reason for final refusal
PE0902 Notice of grounds for rejection

Comment text: Final Notice of Reason for Refusal

Patent event date: 20180911

Patent event code: PE09021S02D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20181101

PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20181227

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20181227

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20211227

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20221205

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20231204

Start annual number: 6

End annual number: 6

PR1001 Payment of annual fee

Payment date: 20241202

Start annual number: 7

End annual number: 7