KR101935109B1 - Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same - Google Patents
Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same Download PDFInfo
- Publication number
- KR101935109B1 KR101935109B1 KR1020160182940A KR20160182940A KR101935109B1 KR 101935109 B1 KR101935109 B1 KR 101935109B1 KR 1020160182940 A KR1020160182940 A KR 1020160182940A KR 20160182940 A KR20160182940 A KR 20160182940A KR 101935109 B1 KR101935109 B1 KR 101935109B1
- Authority
- KR
- South Korea
- Prior art keywords
- probability
- emotional
- text data
- sentence
- vocabulary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G06F17/27—
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명에 따른 패션 분야의 단어 구 단위 감성분석방법은, 저장매체에 저장된 패션 분야의 단어 구 단위 감성분석용 프로그램이 설치된 관리서버를 통해 수행되는 패션 분야의 단어 구 단위 감성분석방법에 있어서, 온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계와, 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계와, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계와, 상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계와, 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계와, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계를 포함한다.A method for analyzing a word segment sentiment in a fashion field according to the present invention is a word segment sentiment analysis method in a fashion segment performed through a management server installed with a word segment sentiment analysis program of a fashion field stored in a storage medium, (B) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data; and (c) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data, (C) constituting a sentence constituting at least a part of a sentence, (d) assigning affirmative / negative polarity weights of the emotional vocabulary constituting the combined sentence in the step (c) (E) analyzing positive / negative polarity of a sentence combining at least a part of the emotional vocabulary with a negative irregular weight, and analyzing the result of (e) And (f) analyzing trends in the fashion field.
Description
본 발명은 패션 분야의 단어 감성분석방법 및 이를 포함하는 저장매체에 관한 것으로서, 보다 상세하게는 단어 구 단위로 분석을 수행할 수 있도록 하는 패션 분야의 단어 구 단위 감성분석방법 및 이를 포함하는 저장매체에 관한 것이다.The present invention relates to a word sensibility analysis method in a fashion field and a storage medium including the same, and more particularly, to a word sensibility analysis method in a fashion field that enables analysis in units of word phrases, and a storage medium .
최근에는 인터넷이 활발하게 사용되고 있으며, 스마트폰 등의 등장으로 각종 온라인 서비스가 제공되고 있다. 또한 이에 발맞추어 사용자에게 제공하기 위한 다양한 관련 서비스가 연구 및 개발되고 있다.Recently, the Internet has been actively used, and various online services have been provided by the appearance of smart phones and the like. In addition, various related services are being researched and developed to provide users with such services.
그리고 갈수록 다양해지는 사용자의 욕구에 따라 서비스 제공자는 사용자의 수요 및 요구를 정확하게 판단해야 할 필요가 있으며, 이를 위해 보다 정확한 사용자의 수요 및 요구를 판단하기 위한 알고리즘이 연구되고 있다.In addition, service providers need to accurately determine the needs and demands of users according to the increasingly diverse needs of users. To do so, algorithms are being studied to determine the demand and demand of users more accurately.
다만, 패션/어패럴 분야의 경우, 그 특성 상 온라인 서비스 상에 존재하는 비정형 텍스트 중에는 감성적이고 정량화할 수 없는 데이터가 대다수를 이루기 때문에, 분석이 매우 어려운 실정이다.However, in the case of the fashion / apparel field, it is very difficult to analyze the unstructured text existing on the online service because the majority of emotional and quantifiable data is formed.
이와 같은 이유로 인해 현재까지는 패션/어패럴 분야의 트렌트를 정밀하게 예측할 수 있는 분석방법이 거의 개발되지 않았으며, 소수 존재하는 분석시스템은 그 정밀도가 크게 떨어지는 문제가 있다.For this reason, up to now, there has been little developed an analysis method capable of precisely predicting trends in the fashion / apparel field, and there is a problem that the accuracy of a few existing analysis systems is greatly reduced.
따라서 상기와 같은 문제점을 해결하기 위한 방법이 요구되고 있는 상황이다.Therefore, a method for solving the above problems is required.
본 발명은 상술한 종래 기술의 문제점을 해결하기 위하여 안출된 발명으로서, 감성 어휘의 효과적 분석을 통해 패션 분야의 트렌드를 정밀하게 분석 및 예측할 수 있도록 하기 위한 목적을 가진다.Disclosure of Invention Technical Problem [8] The present invention has been devised in order to solve the problems of the prior art described above, and has an object to enable accurate analysis and prediction of trends in the fashion field through effective analysis of emotional vocabulary.
본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The problems of the present invention are not limited to the above-mentioned problems, and other problems not mentioned can be clearly understood by those skilled in the art from the following description.
상기한 목적을 달성하기 위한 본 발명의 패션 분야의 단어 구 단위 감성분석방법은, 저장매체에 저장된 패션 분야의 단어 구 단위 감성분석용 프로그램이 설치된 관리서버를 통해 수행되는 패션 분야의 단어 구 단위 감성분석방법에 있어서, 온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계와, 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계와, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계와, 상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계와, 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계와, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계를 포함한다.In order to achieve the above-mentioned object, the present invention provides a method for analyzing sentence-by-word sensibility in a fashion field, the method comprising the steps of: (B) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data; and (b) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data (C) constituting a sentence combining at least some of the emotional vocabularies, and (d) assigning positive / negative polarity weights of the emotional vocabulary constituting the combined sentence in the step (c) (E) analyzing positive / negative polarity of sentences combining at least some of the emotional vocabulary through positive / negative polarity weights of the emotional vocabulary; and (e) Through the analysis of the system comprises (f) analyzing the trend of the sphere.
그리고 상기 (b)단계에서, 상기 감성어휘는 단일의 어휘 또는 복수의 어휘가 조합된 단어 구 중 적어도 어느 하나일 수 있다.In the step (b), the emotional vocabulary may be at least one of a single vocabulary or a word phrase in which a plurality of vocabularies are combined.
또한 상기 (d)단계는, 상기 문장을 구성하는 각 감성어휘가 전체 비정형 텍스트 데이터에서 발생할 제1확률을 산출하는 (d-1)단계와, 상기 문장을 구성하는 각 감성어휘가 긍정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제2확률을 산출하는 (d-2)단계와, 상기 문장을 구성하는 각 감성어휘가 부정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제3확률을 산출하는 (d-3)단계와, 상기 제1확률과 상기 제2확률이 동시에 발생할 제4확률을 산출하는 (d-4)단계와, 상기 제1확률과 상기 제3확률이 동시에 발생할 제5확률을 산출하는 (d-5)단계와, 상기 제4확률에서 상기 제5확률을 뺀 값의 양수/음수 여부에 따라 해당 감성어휘의 긍정/부정 극성 가중치를 판단하는 (d-6)단계를 포함할 수 있다.The step (d) may further include the steps of: (d-1) calculating a first probability that each emotional vocabulary constituting the sentence occurs in the entire amorphous text data; and (D-2) calculating a second probability that occurs in the unstructured text data; calculating (d-3) calculating a third probability that occurs in the atypical text data in which each emotional vocabulary constituting the sentence has a negative tendency; (D-4) calculating a fourth probability at which the first probability and the second probability occur at the same time; and (d-5) calculating a fifth probability at which the first probability and the third probability occur at the same time, (D-6) determining an affirmative / negative polarity weight value of the emotional vocabulary according to whether the value obtained by subtracting the fifth probability from the fourth probability is positive or negative.
그리고 상기 (e)단계는, 상기 (d)단계에서 산출된 각 감성어휘의 긍정/부정 극성 가중치를 합산하여 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 산출할 수 있다.The step (e) may calculate positive / negative polarity of a sentence in which at least a part of the emotional vocabulary is combined by summing positive / negative polarity weights of the emotional vocabularies calculated in the step (d).
상기한 과제를 해결하기 위한 본 발명의 패션 분야의 단어 구 단위 감성분석방법 및 이를 포함하는 저장매체는 다음과 같은 효과가 있다.In order to solve the above-described problems, the method for analyzing sentence-by-word sensibility in a fashion field and the storage medium including the same have the following effects.
첫째, 합리적이고 현실적으로 패션/어패럴 분야의 트렌드를 정밀하게 분석 및 예측할 수 있는 장점이 있다.First, there is an advantage of being able to analyze and predict trends of fashion / apparel field accurately and reasonably.
둘째, 단어 구 단위로 긍정/부정 극성 가중치를 부여하여 분석을 수행할 수 있으므로, 거시적인 측면에서의 분석이 가능하다는 장점이 있다.Second, since the analysis can be performed by assigning affirmative / negative polarity weights to each word phrase, it is possible to analyze in terms of macroscopic aspects.
셋째, 감성적 텍스트를 정량적으로 분석하고, 이를 사용자가 이해하기 쉽게 제공할 수 있는 장점이 있다.Third, there is an advantage that the emotional text can be analyzed quantitatively and it can be easily provided by the user.
넷째, 사용자는 분석 결과를 통해 적극적인 마케팅에 활용할 수 있는 장점이 있다.Fourth, users have the advantage of being able to utilize them for active marketing through analysis results.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned can be clearly understood by those skilled in the art from the description of the claims.
도 1은 본 발명의 일 실시예에 따른 감성분석방법의 전체 과정을 나타낸 흐름도;
도 2는 본 발명의 일 실시예에 따른 감성분석방법의 세부 과정을 나타낸 흐름도; 및
도 3은 본 발명의 일 실시예에 따른 감성분석방법에 있어서, 긍정/부정 극성 가중치가 부여된 감성어휘의 예시를 나타낸 표이다.1 is a flowchart illustrating an entire process of a sensitivity analysis method according to an embodiment of the present invention;
FIG. 2 is a flowchart illustrating a detailed process of a sensitivity analysis method according to an exemplary embodiment of the present invention; FIG. And
FIG. 3 is a table showing an example of an emotional vocabulary given an affirmative / negative polarity weight in the emotional analysis method according to an embodiment of the present invention.
이하 본 발명의 목적이 구체적으로 실현될 수 있는 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 설명한다. 본 실시예를 설명함에 있어서, 동일 구성에 대해서는 동일 명칭 및 동일 부호가 사용되며 이에 따른 부가적인 설명은 생략하기로 한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings. In describing the present embodiment, the same designations and the same reference numerals are used for the same components, and further description thereof will be omitted.
본 발명에 따른 패션 분야의 단어 구 단위 감성분석방법은 저장매체에 저장된 패션 분야의 단어 구 단위 감성분석용 프로그램이 설치된 관리서버를 통해 수행되는 것으로서, 상기 관리서버에 설치되어 상기 관리서버의 프로세서에 의해 구동될 수 있다.A method for analyzing a word segment emotion in a fashion field according to the present invention is performed through a management server installed with a word segment emotion analyzing program of a fashion field stored in a storage medium and is installed in the management server, Lt; / RTI >
또한 이에 의해 구동된 패션 분야의 단어 구 단위 감성분석용 프로그램은 디스플레이 모듈 등 영상 출력장치를 통해 출력될 수 있으며, 시각화된 그래픽 유저 인터페이스를 통해 사용자에게 가시적인 정보를 제공할 수 있다.In addition, a program for the emotion analysis of a word segment in the fashion field driven thereby can be outputted through a video output device such as a display module, and can provide visual information to a user through a visualized graphic user interface.
특히 상기 패션 분야의 단어 구 단위 감성분석용 프로그램이 저장된 저장매체는 이동식 디스크나 통신망을 이용하여 상기 관리서버에 설치될 수 있으며, 상기 패션 분야의 단어 구 단위 감성분석용 프로그램은 상기 관리서버가 다양한 기능적 수단으로 운용되도록 할 수 있다. 즉 본 발명은 소프트웨어에 의한 정보 처리가 하드웨어를 통해 구체적으로 실현된다.Particularly, the storage medium storing the word segment emotion analysis program of the fashion field can be installed in the management server using a mobile disk or a communication network, It can be operated by functional means. That is, in the present invention, information processing by software is realized through hardware.
이하에서는 상기 관리서버를 통해 실행되는 본 발명의 패션 분야의 단어 구 단위 감성분석용 프로그램의 알고리즘에 대해 설명하도록 한다.Hereinafter, an algorithm of a word segment emotional analysis program in the fashion field of the present invention executed through the management server will be described.
도 1은 본 발명의 일 실시예에 따른 감성분석방법의 전체 과정을 나타낸 흐름도이다1 is a flowchart illustrating an entire process of a sensitivity analysis method according to an embodiment of the present invention
도 1 에 도시된 바와 같이, 본 발명의 일 실시예에 따른 감성분석방법은 온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계와, 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계와, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계와, 상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계와, 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계와, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계를 포함할 수 있다.As shown in FIG. 1, the emotional analysis method according to an exemplary embodiment of the present invention includes: (a) collecting atypical text data for an online service and storing the collected atypical text data in the management server; (B) extracting a plurality of emotional vocabularies included in the field; (c) composing a sentence combining at least some of the emotional vocabularies; and (c) (E) analyzing positive / negative polarity of sentences combining at least some of the emotional vocabulary through affirmative / negative polarity weights of the emotional vocabulary, (d) assigning affirmative / And analyzing trends of the fashion field through the analysis result of the step (e).
이하에서는 이들 각 단계에 대해 자세히 설명하도록 한다.Each of these steps will be described in detail below.
먼저 상기 (a)단계의 경우, 다양한 온라인 서비스로부터 비정형 텍스트 데이터를 추출하고, 수집하는 단계이다.In step (a), unregistered text data is extracted from various online services and collected.
여기서 상기 온라인 서비스라 함은 웹, SNS 등 통신망을 이용한 다양한 온라인 서비스 매체일 수 있으며, 어느 하나의 온라인 서비스에 제한되지 않는다. 그리고 상기 비정형 텍스트 데이터의 경우, 문서 형태의 데이터로서 그 구조가 복잡해 정형화되지 않은 데이터를 말한다.Here, the online service may be various online service media using a communication network such as the web, SNS, etc., and is not limited to any online service. In the case of the above-mentioned unstructured text data, it refers to data of document type which is complicated in its structure and is not formatted.
즉 본 단계에서는 다양한 온라인 서비스를 대상으로 문서 형태의 데이터를 추출하게 되며, 이후 (b)단계가 수행된다.That is, in this step, data of a document type is extracted for various online services, and then step (b) is performed.
상기 (b)단계는 상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하게 된다. 본 단계에서는 추출된 비정형 텍스트 데이터로부터 패션 분야에 관련된 복수의 어휘를 추출하게 되며, 이때 단순한 패션 관련 용어뿐 아니라, 명사, 부사 등의 어휘 전반, 패션 분야 전반을 포괄할 수 있는 대표성 있는 감성어휘를 추출하게 된다.In the step (b), a plurality of emotional vocabularies included in the fashion field are extracted from the atypical text data. In this step, a plurality of vocabularies related to the fashion field are extracted from the extracted atypical text data. At this time, representative vocabularies including representative vocabulary such as nouns and adverbs, Respectively.
특히 본 실시예의 경우, 상기 (b)단계는 적어도 하나의 어절을 포함하는 의미 단위의 감성어휘를 추출하는 것으로 할 수 있다. 즉 하나의 어절로만 된 감성어휘뿐 아니라, 복수의 어절이 조합되어 하나의 의미를 나타내는 단어 구 형태의 감성어휘 역시 대상에 포함된다.In particular, in the case of the present embodiment, the step (b) may extract the emotional vocabulary of the semantic unit including at least one word. In other words, emotional vocabulary in the form of a word phrase, which represents a single meaning by combining plural word phrases, is included in the object as well as an emotional vocabulary of only one word.
예를 들어, 패션 관련 명사인 '색상, 질감, 촉감, 매력; 도시적, 감각적, 현대적, 활동적, 매력적' 등과, 동사, 형용사인 '세련되다, 섹시하다, 고급스럽다, 특이하다, 우아하다, 여성스럽다' 등의 개별 어휘 단위 목록뿐만 아니라, '매력이 있다, 보기 좋다, 사고 싶다, 마음에 들다' 등 복수의 어절이 조합된 감성어휘가 그 대상이 될 수 있을 것이다.For example, the fashion related noun 'color, texture, touch, charm; As well as a list of individual vocabulary units such as 'urban, sensual, modern, active, attractive', verb and adjective 'sophisticated, sexy, elegant, unique, elegant, feminine' I would like to buy an emotional vocabulary that has a combination of multiple words such as "I like to see, I want to buy, I like".
다음으로, 상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계가 수행되며, 본 단계에서는 전술한 (b)단계에서 추출된 감성어휘를 통해 특정한 조합의 문장을 구성하게 된다.Next, a step (c) of constructing a sentence combining at least some of the emotional vocabularies is performed. In this step, a specific combination of sentences is formed through the emotional vocabulary extracted in the step (b).
그리고 이하의 (d)단계 내지 (e)단계에서는, 상기 (c)단계에서 구성된 문장을 구성하는 각 감성어휘의 긍정/부정 극성 가중치를 부여하고, 이를 통해 문장 전체의 긍정/부정 극성을 판단할 수 있도록 한다.In the following steps (d) to (e), affirmative / irregularity weights of each emotional vocabulary constituting the sentence constituted in the step (c) are given and the positive / negative polarity of the entire sentence is judged .
도 2는 본 발명의 일 실시예에 따른 감성분석방법의 세부 과정을 나타낸 흐름도이다. 도 2에 도시된 바와 같이, 상기 (d)단계는 세부적으로 (d-1)단계 내지 (d-6)단계를 포함할 수 있다.2 is a flowchart illustrating a detailed process of the emotion analysis method according to an embodiment of the present invention. As shown in FIG. 2, step (d) may include steps (d-1) to (d-6).
먼저 (d-1)단계에서는 전술한 (c)단계에 의해 구성된 문장에 포함된 각 감성어휘가 전체 비정형 텍스트 데이터에서 발생할 제1확률을 산출하게 된다.First, in step (d-1), the first probability that each emotional vocabulary included in the sentence constituted by the step (c) occurs in the entire unstructured text data is calculated.
즉 본 단계에서는 다양한 온라인 서비스로부터 추출된 비정형 텍스트 데이터 전체를 대상으로, 해당 문장을 구성하는 개별 감성어휘가 발생할 확률을 각각 산출할 수 있다.That is, in this step, the probability of occurrence of the individual emotional vocabulary constituting the sentence can be calculated for all the unstructured text data extracted from various online services.
다음으로 (d-2)단계에서는, 상기 문장을 구성하는 각 감성어휘가 긍정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제2확률을 산출하게 된다.Next, in step (d-2), the second probability that each emotional vocabulary constituting the sentence will occur in the unstructured text data having positive tendency is calculated.
본 단계에서는 다양한 온라인 서비스로부터 추출된 비정형 텍스트 데이터 전체 중 선별된 긍정 성향을 가지는 비정형 텍스트 데이터만을 대상으로 하여, 해당 문장을 구성하는 개별 감성어휘가 발생할 확률을 각각 산출할 수 있다.In this step, probabilities of occurrence of individual emotional vocabularies constituting the corresponding sentence can be calculated by targeting only the atypical text data having a positive affinity selected from all the unstructured text data extracted from various online services.
다음으로 (d-3)단계에서는, 상기 문장을 구성하는 각 감성어휘가 부정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제3확률을 산출하게 된다.Next, in step (d-3), the third probability that each emotional vocabulary constituting the sentence occurs in the amorphous text data having a negative tendency is calculated.
본 단계에서는 다양한 온라인 서비스로부터 추출된 비정형 텍스트 데이터 전체 중 선별된 부정 성향을 가지는 비정형 텍스트 데이터만을 대상으로 하여, 해당 문장을 구성하는 개별 감성어휘가 발생할 확률을 각각 산출할 수 있다.In this step, probability of occurrence of individual emotional vocabulary constituting the corresponding sentence can be calculated by targeting only the unstructured text data having a negative tendency selected from all the unstructured text data extracted from various online services.
그리고 이상과 같이 산출된 각 감성어휘의 제1확률 내지 제3확률을 통해, (d-4)단계 내지 (d-6)단계를 거쳐 해당 감성어휘의 긍정/부정 극성 가중치를 판단할 수 있다.The affirmative / negative polarity weighting value of the emotional vocabulary can be determined through the steps (d-4) to (d-6) through the first probability to the third probability of each emotional vocabulary calculated as described above.
상기 (d-4)단계에서는, 각 감성어휘 별로 상기 제1확률과 상기 제2확률이 동시에 발생할 제4확률을 산출하게 되며, 상기 (d-5)단계에서는 상기 제1확률과 상기 제3확률이 동시에 발생할 제5확률을 산출하게 된다.Wherein the first probability and the second probability are simultaneously calculated for each emotional vocabulary in the step (d-4), and in the step (d-5), the first probability and the third probability The fifth probability to be generated at the same time.
이후 상기 (d-6)단계에서는, 상기 (d-4)단계에 의해 산출된 상기 제4확률에서, 상기 (d-5)단계에 의해 산출된 상기 제5확률을 뺀 값의 양수/음수 여부를 판단하고, 그 결과에 따라 해당 감성어휘의 긍정/부정 극성 가중치를 판단하게 된다.Then, in the step (d-6), whether or not the value obtained by subtracting the fifth probability calculated in the step (d-5) from the fourth probability calculated in the step (d-4) And judges the positive / negative polarity weighting value of the emotional vocabulary according to the result.
도 3은 본 발명의 일 실시예에 따른 감성분석방법에 있어서, 긍정/부정 극성 가중치가 부여된 감성어휘의 예시를 나타낸 표이다.FIG. 3 is a table showing an example of an emotional vocabulary given an affirmative / negative polarity weight in the emotional analysis method according to an embodiment of the present invention.
도 3에 도시된 바와 같이, 소정의 감성어휘는 단일의 단어로 구성될 수도 있으며, 또는 복수의 단어가 조합된 단어 구 형태일 수 있다. 그리고 전술한 (a)단계 내지 (d)단계를 통해, 각 감성어휘 별 극성 지수를 산출할 수 있게 된다.As shown in FIG. 3, the predetermined emotional vocabulary may be composed of a single word, or may be a word phrase in which a plurality of words are combined. Through the steps (a) to (d), it is possible to calculate the polarity index for each emotion word.
도 3의 표에 예시된 바와 같이, '가격만큼 하', '가격대가 높', '가렵', '간지럽' 등과 같이 패션/어패럴 상품의 특성 상 부정적인 느낌을 주는 감성어휘의 극성지수는 음수의 값을 가지는 것을 확인할 수 있으며, '가볍', '가치가 높', '가치가 있', '간결하', '간편하', '감동받' 등과 같이 패션/어패럴 상품의 특성 상 긍정적인 느낌을 주는 감성어휘의 극성 지수는 양수의 값을 가지는 것을 확인할 수 있다.As shown in the table of FIG. 3, the polarity index of the emotional vocabulary that gives a negative impression due to the characteristics of fashion / apparel products such as' price as low as price, high price, '' And it is positive feeling in the characteristics of fashion / apparel goods such as 'light', 'high value', 'worthy', 'concise', 'easy', 'impressed' And the polarity index of the emotional vocabulary that gives the emotional vocabulary has a positive value.
또한 이들 감성어휘의 극성 강도는, 각 극성 지수의 절대값으로 판단할 수 있을 것이다.The polarity intensity of these emotional vocabularies can be judged as the absolute value of each polarity index.
다음으로, 상기 (e)단계에서는 (d)단계에 의해 산출된 상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장, 즉 (c)단계에서 조합된 문장의 긍정/부정 극성을 분석하게 된다.Next, in the step (e), a sentence in which at least some of the emotional vocabulary is combined through the affirmative / negative polarity weighting value of the emotional vocabulary calculated in the step (d) Positive / negative polarity.
본 단계의 경우, 조합된 문장을 구성하는 각 감성어휘에 대해 상기 (d)단계에서 산출된 긍정/부정 극성 가중치를 모두 합산하여, 해당 문장의 긍정/부정 극성을 산출하게 된다.In this step, the affirmative / negative polarity of the sentence is calculated by summing up the positive / negative polarity weights calculated in the step (d) for each emotional vocabulary constituting the combined sentence.
예컨대 특정 문장이 3개의 감성어휘를 포함하고 있다고 할 경우, 해당 문장의 최종 긍정/부정 극성은 3개의 감성어휘의 각 긍정/부정 극성 가중치를 모두 합산한 최종 값의 양수/음수 여부를 통해 산출할 수 있을 것이다.For example, if a sentence contains three emotional vocabularies, the final affirmation / negativity of the sentence is calculated by determining whether the final positive / negative polarity weights of the three emotional vocabularies are positive or negative. It will be possible.
이후, 상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계가 수행된다.Thereafter, step (f) of analyzing trends in the fashion field is performed through the analysis result of step (e).
본 단계에서는 전술한 각 단계의 연산 결과 긍정/부정 극성 가중치가 부여된 감성어휘, 그리고 이들로 구성된 문장의 극성을 통해 패션 분야의 트렌드를 분석하는 과정이 수행된다.In this stage, the process of analyzing trends in the fashion field is carried out through the emotional vocabulary given positive / negative polarity weighting and the polarity of the sentence composed of the above results.
즉 본 단계에서는 비정형 데이터에 나타난 고빈도 감성 어휘 선정, 채널 별/주제 별로 통계적으로 유의미하게 나타나는 감성 어휘 선정, 빈도와 사용 분야, 의미 층위를 고려한 패션 분야의 감성 기본 어휘 선정 등의 작업이 수행될 수 있으며, 이를 통해 패션 분야의 트렌드를 정밀하게 분석 및 예측할 수 있다.In this step, the selection of high-frequency emotional vocabulary in unstructured data, the selection of emotional vocabulary that is statistically significant for each channel / subject, the frequency and use field, and the selection of basic vocabulary for emotion in the field of fashion This allows precise analysis and prediction of fashion trends.
그리고 이후, 이와 같은 분석 결과를 가시화하여 상기 관리서버로부터 사용자에게 제공할 수 있으며, 사용자는 사용자 단말기 등에 가시화된 분석 결과를 통해 적극적인 마케팅에 활용할 수 있다.Then, the analysis result can be visualized and provided to the user from the management server, and the user can utilize the analysis result displayed through the user terminal for aggressive marketing.
이상과 같이, 본 발명은 합리적이고 현실적으로 감성적 텍스트를 정량적으로 분석하고, 패션/어패럴 분야의 트렌드를 정밀하게 분석 및 예측할 수 있는 장점을 가진다.As described above, the present invention is advantageous in that it quantitatively analyzes sensible text rationally and realistically, and accurately analyzes and predicts trends in the fashion / apparel field.
그리고 이후, 이와 같은 분석 결과를 가시화하여 사용자에게 제공할 수 있으며, 사용자는 분석 결과를 통해 적극적인 마케팅에 활용할 수 있다.Then, such analysis result can be visualized and presented to the user, and the user can utilize the analysis result for active marketing.
이상과 같이 본 발명에 따른 바람직한 실시예를 살펴보았으며, 앞서 설명된 실시예 이외에도 본 발명이 그 취지나 범주에서 벗어남이 없이 다른 특정 형태로 구체화될 수 있다는 사실은 해당 기술에 통상의 지식을 가진 이들에게는 자명한 것이다. 그러므로, 상술된 실시예는 제한적인 것이 아니라 예시적인 것으로 여겨져야 하고, 이에 따라 본 발명은 상술한 설명에 한정되지 않고 첨부된 청구항의 범주 및 그 동등 범위 내에서 변경될 수도 있다.It will be apparent to those skilled in the art that the present invention can be embodied in other specific forms without departing from the spirit or scope of the invention as defined in the appended claims. It is obvious to them. Therefore, the above-described embodiments are to be considered as illustrative rather than restrictive, and the present invention is not limited to the above description, but may be modified within the scope of the appended claims and equivalents thereof.
Claims (5)
온라인 서비스를 대상으로 비정형 텍스트 데이터를 수집하여 상기 관리서버에 저장하는 (a)단계;
상기 비정형 텍스트 데이터에서, 패션 분야에 포함되는 복수의 감성어휘를 추출하는 (b)단계;
상기 감성어휘 중 적어도 일부를 조합한 문장을 구성하는 (c)단계;
상기 (c)단계에서 조합된 문장을 구성하는 감성어휘 각각의 긍정/부정 극성 가중치를 부여하는 (d)단계;
상기 감성어휘의 긍정/부정 극성 가중치를 통해, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 분석하는 (e)단계; 및
상기 (e)단계의 분석 결과를 통해 패션 분야의 트렌드를 분석하는 (f)단계;
를 포함하며,
상기 (d)단계는,
상기 문장을 구성하는 각 감성어휘가 전체 비정형 텍스트 데이터에서 발생할 제1확률을 산출하는 (d-1)단계;
상기 문장을 구성하는 각 감성어휘가 상기 전체 비정형 텍스트 테이터 중 긍정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제2확률을 산출하는 (d-2)단계;
상기 문장을 구성하는 각 감성어휘가 상기 전체 비정형 텍스트 테이터 중 부정 성향을 가지는 비정형 텍스트 데이터에서 발생할 제3확률을 산출하는 (d-3)단계;
상기 제1확률과 상기 제2확률이 동시에 발생할 제4확률을 산출하는 (d-4)단계;
상기 제1확률과 상기 제3확률이 동시에 발생할 제5확률을 산출하는 (d-5)단계; 및
상기 제4확률에서 상기 제5확률을 뺀 값의 양수/음수 여부에 따라 해당 감성어휘의 긍정/부정 극성 가중치를 판단하고, 상기 극성 가중치의 절대값을 통해 해당 감성어휘의 극성 강도를 판단하는 (d-6)단계;
를 포함하고,
상기 (e)단계는,
상기 (d)단계에서 산출된 각 감성어휘의 긍정/부정 극성 가중치를 합산하여, 상기 감성어휘 중 적어도 일부를 조합한 문장의 긍정/부정 극성을 산출하는 패션 분야의 단어 구 단위 감성분석방법.A method for analyzing emotion in a word field in a fashion field, which is performed through a management server installed with a word segment emotion analysis program of a fashion field stored in a storage medium,
(A) collecting unstructured text data on an online service and storing the collected unstructured text data in the management server;
(B) extracting a plurality of emotional vocabularies included in the fashion field from the atypical text data;
(C) composing sentences combining at least some of the emotional vocabularies;
(D) assigning affirmative / negative polarity weights of the emotional vocabulary constituting the combined sentence in the step (c);
(E) analyzing positive / negative polarity of a sentence combining at least a part of the emotional vocabulary through positive / negative polarity weighting of the emotional vocabulary; And
Analyzing trends in the fashion field through the analysis result of step (e);
/ RTI >
The step (d)
(D-1) calculating a first probability that each emotional vocabulary constituting the sentence occurs in all irregular text data;
(D-2) calculating a second probability that each emotional vocabulary constituting the sentence occurs in atypical text data having an affirmative tendency among all the atypical text data;
(D-3) calculating a third probability that each emotional vocabulary constituting the sentence occurs in atypical text data having a negative tendency among all the atypical text data;
(D-4) calculating a fourth probability that the first probability and the second probability occur simultaneously;
(D-5) calculating a fifth probability that the first probability and the third probability occur simultaneously; And
Judging the affirmative / negative polarity weighting value of the emotional vocabulary according to whether the value obtained by subtracting the fifth probability from the fourth probability is positive or negative and judging the polarity intensity of the sensible vocabulary based on the absolute value of the polarity weighting value d-6);
Lt; / RTI >
The step (e)
Wherein the affirmative / negative polarity of each emotional vocabulary calculated in the step (d) is summed up to calculate a positive / negative polarity of a sentence combining at least some of the emotional vocabulary.
상기 (b)단계에서,
상기 감성어휘는 단일의 어휘 또는 복수의 어휘가 조합된 단어 구 중 적어도 어느 하나인 패션 분야의 단어 구 단위 감성분석방법.The method according to claim 1,
In the step (b)
Wherein the emotional vocabulary is at least one of a single vocabulary or a word phrase in which a plurality of vocabularies are combined.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160182940A KR101935109B1 (en) | 2016-12-29 | 2016-12-29 | Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160182940A KR101935109B1 (en) | 2016-12-29 | 2016-12-29 | Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180078010A KR20180078010A (en) | 2018-07-09 |
KR101935109B1 true KR101935109B1 (en) | 2019-01-04 |
Family
ID=62919582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160182940A Active KR101935109B1 (en) | 2016-12-29 | 2016-12-29 | Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101935109B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230068092A (en) | 2021-11-10 | 2023-05-17 | 동의대학교 산학협력단 | A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102831240B1 (en) * | 2022-09-05 | 2025-07-08 | 주식회사 아르스프락시아 | Method and device for sentiment analysis of keywords derived using big data and social network analysis |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015032166A (en) * | 2013-08-02 | 2015-02-16 | エヌ・ティ・ティ・コムウェア株式会社 | Classification device, method, and program |
KR101500900B1 (en) * | 2014-04-28 | 2015-03-12 | 한양대학교 산학협력단 | Method and System for Classifying Text Using Classifier Produced by Learning Data |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101560456B1 (en) * | 2013-11-01 | 2015-10-15 | 황성봉 | Extraction and Estimation Method of Trend Information with the Analasis of Vocabularies |
-
2016
- 2016-12-29 KR KR1020160182940A patent/KR101935109B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015032166A (en) * | 2013-08-02 | 2015-02-16 | エヌ・ティ・ティ・コムウェア株式会社 | Classification device, method, and program |
KR101500900B1 (en) * | 2014-04-28 | 2015-03-12 | 한양대학교 산학협력단 | Method and System for Classifying Text Using Classifier Produced by Learning Data |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230068092A (en) | 2021-11-10 | 2023-05-17 | 동의대학교 산학협력단 | A method for extracting food menu nouns using parts of speech such as verbs and adjectives, a method for updating a food dictionary using the same, and a system for the same |
Also Published As
Publication number | Publication date |
---|---|
KR20180078010A (en) | 2018-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11699035B2 (en) | Generating message effectiveness predictions and insights | |
Kang et al. | based measurement of customer satisfaction in mobile service: Sentiment analysis and VIKOR approach | |
US10657544B2 (en) | Targeted E-commerce business strategies based on affiliation networks derived from predictive cognitive traits | |
US8977573B2 (en) | System and method for identifying customers in social media | |
Kim et al. | Competitive intelligence in social media Twitter: iPhone 6 vs. Galaxy S5 | |
US20190146984A1 (en) | Prioritizing survey text responses | |
US20150186790A1 (en) | Systems and Methods for Automatic Understanding of Consumer Evaluations of Product Attributes from Consumer-Generated Reviews | |
US20150254675A1 (en) | Method and apparatus for personalizing customer interaction experiences | |
US20180349781A1 (en) | Method and device for judging news quality and storage medium | |
US9953029B2 (en) | Prediction and optimized prevention of bullying and other counterproductive interactions in live and virtual meeting contexts | |
WO2019242453A1 (en) | Information processing method and device, storage medium, and electronic device | |
Raghupathi et al. | Customer sentiment appraisal from user-generated product reviews: a domain independent heuristic algorithm | |
Wang et al. | Customer-driven product design selection using web based user-generated content | |
KR101931624B1 (en) | Trend Analyzing Method for Fassion Field and Storage Medium Having the Same | |
Rathan et al. | Every post matters: a survey on applications of sentiment analysis in social media | |
CN117829846A (en) | User satisfaction prediction method, device and equipment | |
US12050879B2 (en) | Systems and methods for reducing input to and increasing processing speeds of natural language processing models | |
KR101935109B1 (en) | Sensitivity Analyzing Method of Phrase Unit for Fassion Field and Storage Medium Having the Same | |
Wang et al. | Learning personalized privacy preference from public data | |
US20140195298A1 (en) | Tracking of near conversions in user engagements | |
Wen et al. | Infusing Affective Computing Models into Advertising Research on Emotions | |
CN112200602A (en) | Neural network model training method and device for advertisement recommendation | |
Barbosa et al. | Predicting portuguese steam review helpfulness using artificial neural networks | |
Zhang et al. | Predicting temporary deal success with social media timing signals | |
Chang et al. | Using Machine Learning to Extract Insights from Consumer Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20161229 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20170821 Patent event code: PE09021S01D |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20180227 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20180911 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20181101 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20181227 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20181227 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20211227 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20221205 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20231204 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20241202 Start annual number: 7 End annual number: 7 |