JP2011150390A - 性格推定装置及びプログラム - Google Patents
性格推定装置及びプログラム Download PDFInfo
- Publication number
- JP2011150390A JP2011150390A JP2010008805A JP2010008805A JP2011150390A JP 2011150390 A JP2011150390 A JP 2011150390A JP 2010008805 A JP2010008805 A JP 2010008805A JP 2010008805 A JP2010008805 A JP 2010008805A JP 2011150390 A JP2011150390 A JP 2011150390A
- Authority
- JP
- Japan
- Prior art keywords
- personality
- value
- document
- feature
- strength
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】性格推定装置は、ネットワーク上で公開されている文書についてのデータを取得する手段と、所得したデータから、該文書の特徴を示す1つ以上の要素それぞれについての値を求め、求めた要素の値を含む特徴量ベクトルを生成する手段と、前記特徴量ベクトルに基づき、1つ以上の性格に関するパラメータのそれぞれについて、その強弱を所定の段階で判定する、あるいは、複数の性格に関するパラメータ間の強弱を判定する判定手段とを備えている。
【選択図】図1
Description
ネットワーク上で公開されている文書についてのデータを取得する手段と、所得したデータから、該文書の特徴を示す1つ以上の要素それぞれについての値を求め、求めた要素の値を含む特徴量ベクトルを生成する手段と、前記特徴量ベクトルに基づき、1つ以上の性格に関するパラメータのそれぞれについて、その強弱を所定の段階で判定する、あるいは、複数の性格に関するパラメータ間の強弱を判定する判定手段とを備えていることを特徴とする。
前記判定手段は、前記パラメータの強弱の段階と前記要素の値との関係を示す、あるいは、前記複数のパラメータ間の強弱と前記要素の値との関係を示す学習データを有していることも好ましい。
前記1つ以上の要素は、所定の語句の出現頻度を含むことも好ましい。
複数の学習データ提供者の前記性格に関するパラメータの強弱の段階と、前記複数の学習データ提供者がネットワーク上で公開している文書に含まれる、あらかじめ選択した候補語句の出現頻度の分布から、各候補語句の情報利得を求め、前記所定の語句は、前記情報利得が所定の閾値より大きい候補語句又は前記情報利得の大きさが所定の順位以上の候補語句であることも好ましい。
前記1つ以上の要素は、前記文書に含まれる各名詞の逆出現頻度の平均値及び/又は最大値を含むことも好ましい。
前記1つ以上の要素は、前記文書の更新頻度、平均文字数、改行頻度、句読点の頻度及び絵文字の出現頻度の少なくとも1つを含むことも好ましい。
前記性格推定装置としてコンピュータを機能させることを特徴とする。
Pr(c)ΠPr(fi|c) (1)
ここで、cはNPの強弱の値、つまり、5段階で評価する場合は1から5であり、Pr(c)は学習データにおいてNPの値がcである割合であり、fiは、入力された特徴量ベクトルの要素Fiの値であり、Pr(fi|c)は、NPの値がcである学習データのレコード数に対する、学習データの要素Fiの値がfi−Δより大きく、かつ、fi+Δ以下のレコード数の割合であり、Πは、学習データの全要素に渡り乗算を行うことを示している。
H(NP)=ΣPr(c)(logPr(c)) (2)
である。ここで、cはNPの強弱の値、つまり、5段階で評価する場合は1から5であり、Pr(c)は、事前データにおいてNPの値がcである割合、つまり、例えば、事前データが1000レコード有りNPの値が3であるレコードが100件である場合には、Pr(3)=0.1であり、Σは総てのNPの値に渡り積算することを示している。
H(NP|Cd1)=ΣPr(wd)H(NP|wd) (3)
である。ここで、wdは、特徴語句候補“Cd1”の出現頻度の取り得る範囲の一部の範囲であり、H(NP|wd)は、wdの範囲に該当するレコードのエントロピーである。なお、Σは“Cd1”の出現頻度の取り得る範囲に渡り積算することを示している。つまり、“Cd1”の値の範囲が0から1である場合に、例えば、これを0.1ずつ10個の範囲に区切り、各範囲についてPr(wd)H(NP|wd)の値を計算して、これらの和を求める。
2 構造特徴量計算部
3 形態素解析部
4 内容特徴量計算部
5 判定部
51 CP分類器
52 NP分類器
53 A分類器
54 FC分類器
55 AC分類器
Claims (7)
- ネットワーク上で公開されている文書についてのデータを取得する手段と、
所得したデータから、該文書の特徴を示す1つ以上の要素それぞれについての値を求め、求めた要素の値を含む特徴量ベクトルを生成する手段と、
前記特徴量ベクトルに基づき、1つ以上の性格に関するパラメータのそれぞれについて、その強弱を所定の段階で判定する、あるいは、複数の性格に関するパラメータ間の強弱を判定する判定手段と、
を備えている性格推定装置。 - 前記判定手段は、前記パラメータの強弱の段階と前記要素の値との関係を示す、あるいは、前記複数のパラメータ間の強弱と前記要素の値との関係を示す学習データを有している、
請求項1に記載の性格推定装置。 - 前記1つ以上の要素は、所定の語句の出現頻度を含む、
請求項1又は2に記載の性格推定装置。 - 複数の学習データ提供者の前記性格に関するパラメータの強弱の段階と、前記複数の学習データ提供者がネットワーク上で公開している文書に含まれる、あらかじめ選択した候補語句の出現頻度の分布から、各候補語句の情報利得を求め、
前記所定の語句は、前記情報利得が所定の閾値より大きい候補語句又は前記情報利得の大きさが所定の順位以上の候補語句である、
請求項3に記載の性格推定装置。 - 前記1つ以上の要素は、前記文書に含まれる各名詞の逆出現頻度の平均値及び/又は最大値を含む、
請求項1から4のいずれか1項に記載の性格推定装置。 - 前記1つ以上の要素は、前記文書の更新頻度、平均文字数、改行頻度、句読点の頻度及び絵文字の出現頻度の少なくとも1つを含む、
請求項1から5のいずれか1項に記載の性格推定装置。 - 請求項1から6のいずれか1項に記載の性格推定装置としてコンピュータを機能させるプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010008805A JP5525268B2 (ja) | 2010-01-19 | 2010-01-19 | 性格推定装置及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010008805A JP5525268B2 (ja) | 2010-01-19 | 2010-01-19 | 性格推定装置及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2011150390A true JP2011150390A (ja) | 2011-08-04 |
| JP5525268B2 JP5525268B2 (ja) | 2014-06-18 |
Family
ID=44537336
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010008805A Expired - Fee Related JP5525268B2 (ja) | 2010-01-19 | 2010-01-19 | 性格推定装置及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5525268B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014206792A (ja) * | 2013-04-10 | 2014-10-30 | テンソル・コンサルティング株式会社 | ソーシャルネットワーク情報処理装置、処理方法、および処理プログラム |
| JP2016006583A (ja) * | 2014-06-20 | 2016-01-14 | 株式会社エヌ・ティ・ティ・データ | ソーシャルネットワークサービスにおけるノイズ投稿の分類方法およびシステム |
| JP2021086415A (ja) * | 2019-11-28 | 2021-06-03 | 有限会社クロマニヨン | 仮想人物対話システム、映像生成方法、映像生成プログラム |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003288439A (ja) * | 2002-03-28 | 2003-10-10 | Ntt Comware Corp | 性格データ分析処理装置およびその方法 |
| JP2004310034A (ja) * | 2003-03-24 | 2004-11-04 | Matsushita Electric Works Ltd | 対話エージェントシステム |
| JP2007226531A (ja) * | 2006-02-23 | 2007-09-06 | Ryoji Yamazaki | 性格診断システムおよび性格診断方法 |
| JP2008009729A (ja) * | 2006-06-29 | 2008-01-17 | Kddi Corp | コンテンツ配信方法および装置 |
| WO2009078182A1 (ja) * | 2007-12-19 | 2009-06-25 | Icon Corp. | サーバ装置、情報提供方法及び情報継承システム |
| JP2009157764A (ja) * | 2007-12-27 | 2009-07-16 | Internatl Business Mach Corp <Ibm> | コミュニティ・システム、コミュニティ・システムの活動記録方法、及びコミュニティ・システムの活動記録用プログラム |
-
2010
- 2010-01-19 JP JP2010008805A patent/JP5525268B2/ja not_active Expired - Fee Related
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003288439A (ja) * | 2002-03-28 | 2003-10-10 | Ntt Comware Corp | 性格データ分析処理装置およびその方法 |
| JP2004310034A (ja) * | 2003-03-24 | 2004-11-04 | Matsushita Electric Works Ltd | 対話エージェントシステム |
| JP2007226531A (ja) * | 2006-02-23 | 2007-09-06 | Ryoji Yamazaki | 性格診断システムおよび性格診断方法 |
| JP2008009729A (ja) * | 2006-06-29 | 2008-01-17 | Kddi Corp | コンテンツ配信方法および装置 |
| WO2009078182A1 (ja) * | 2007-12-19 | 2009-06-25 | Icon Corp. | サーバ装置、情報提供方法及び情報継承システム |
| JP2009157764A (ja) * | 2007-12-27 | 2009-07-16 | Internatl Business Mach Corp <Ibm> | コミュニティ・システム、コミュニティ・システムの活動記録方法、及びコミュニティ・システムの活動記録用プログラム |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014206792A (ja) * | 2013-04-10 | 2014-10-30 | テンソル・コンサルティング株式会社 | ソーシャルネットワーク情報処理装置、処理方法、および処理プログラム |
| JP2016006583A (ja) * | 2014-06-20 | 2016-01-14 | 株式会社エヌ・ティ・ティ・データ | ソーシャルネットワークサービスにおけるノイズ投稿の分類方法およびシステム |
| JP2021086415A (ja) * | 2019-11-28 | 2021-06-03 | 有限会社クロマニヨン | 仮想人物対話システム、映像生成方法、映像生成プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5525268B2 (ja) | 2014-06-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Thelwall | The Heart and soul of the web? Sentiment strength detection in the social web with SentiStrength | |
| JP5744228B2 (ja) | インターネットにおける有害情報の遮断方法と装置 | |
| US10831796B2 (en) | Tone optimization for digital content | |
| US9582502B2 (en) | Translation method and translation system for translating input expression into expression in another language | |
| US8332208B2 (en) | Information processing apparatus, information processing method, and program | |
| US9734239B2 (en) | Prompting subject matter experts for additional detail based on historical answer ratings | |
| JP2019504413A (ja) | 絵文字を提案するためのシステムおよび方法 | |
| US9633008B1 (en) | Cognitive presentation advisor | |
| JP5496863B2 (ja) | 感情推定装置、その方法、プログラム及びその記録媒体 | |
| US20160299965A1 (en) | Prioritizing survey text responses | |
| US20160048768A1 (en) | Topic Model For Comments Analysis And Use Thereof | |
| CN111033490A (zh) | 用于认知实例的认知调解器 | |
| KR20130125999A (ko) | 키워드 추출 방법 및 시스템, 그리고 대화 보조 장치 | |
| Meck et al. | How to design the perfect prompt: A linguistic approach to prompt design in automotive voice assistants–an exploratory study | |
| US20160132900A1 (en) | Informative Bounce Rate | |
| Wohlgenannt et al. | Extracting social networks from literary text with word embedding tools | |
| JP6830226B2 (ja) | 換言文識別方法、換言文識別装置及び換言文識別プログラム | |
| JP5525268B2 (ja) | 性格推定装置及びプログラム | |
| KR102042991B1 (ko) | 한국어 접사 기반 토크나이징 장치 및 그 방법 | |
| KR102053858B1 (ko) | 콘텐츠 평점 산출 방법 | |
| US9569538B1 (en) | Generating content based on a work of authorship | |
| CN108255808A (zh) | 文本划分的方法、装置和存储介质以及电子设备 | |
| Tratz et al. | Isi: automatic classification of relations between nominals using a maximum entropy classifier | |
| US20150051899A1 (en) | Correcting n-gram probabilities by page view information | |
| JP2019087157A (ja) | 単語ベクトル変換装置、方法、及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120809 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130408 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130509 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130515 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130830 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130918 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140319 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140411 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5525268 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |