JP2014106691A - 匿名化処理方法及び装置 - Google Patents
匿名化処理方法及び装置 Download PDFInfo
- Publication number
- JP2014106691A JP2014106691A JP2012258555A JP2012258555A JP2014106691A JP 2014106691 A JP2014106691 A JP 2014106691A JP 2012258555 A JP2012258555 A JP 2012258555A JP 2012258555 A JP2012258555 A JP 2012258555A JP 2014106691 A JP2014106691 A JP 2014106691A
- Authority
- JP
- Japan
- Prior art keywords
- data
- data block
- item value
- grouped
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本方法は、第1データ項目値と当該第1データ項目値を匿名化するために一般化され得る第2データ項目値と当該第2データ項目値の一般化のためにグループ化すべきデータの数とを含む複数のデータから、グループを代表する第1データを選択する処理、第2データ項目値に基づき算出される、第1データとの距離が閾値未満であり且つグループ化すべきデータの数が閾値以上である第2データを抽出する処理、第1データ及び第2データの数が、第1データに含まれる、グループ化すべきデータの数以上であれば、第2データの少なくとも一部及び第1データをグループ化する処理、上記選択する処理と抽出する処理とグループ化する処理を、グループ化すべきデータの数が大きいデータの順に実行する処理と、グループ毎に、当該グループに含まれるデータにおける第2データ項目値を、所定のルールに従って一般化する処理とを含む。
【選択図】図6
Description
第1のデータ項目値と当該第1のデータ項目値を匿名化するために一般化され得る第2のデータ項目値と当該第2のデータ項目値の一般化のためにグループ化すべきデータブロックの数とを含むデータブロックを複数格納するデータ格納部から、グループを代表する第1のデータブロックを選択する処理と、
前記データ格納部から、第2のデータ項目値に基づき算出される、前記第1のデータブロックとの距離が閾値未満であり且つグループ化すべきデータブロックの数が閾値以上である第2のデータブロックを抽出する処理と、
前記第1のデータブロック及び前記第2のデータブロックの数が、前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数以上であれば、前記第2のデータブロックの少なくとも一部及び前記第1のデータブロックをグループ化する処理と、
前記選択する処理と前記抽出する処理と前記グループ化する処理とを、前記データ格納部に格納されたデータブロックのうち、前記グループ化すべきデータブロックの数が大きいデータブロックの順に実行する処理と、
グループ毎に、当該グループに含まれるデータブロックにおける第2のデータ項目値を、所定のルールに従って一般化する処理と、
を含み、コンピュータにより実行される匿名化処理方法。
前記実行する処理において、
直前に選択された前記第1のデータブロックとの距離が最大となるデータブロック又は前記直前に選択された前記第1のデータブロックとの距離が前記閾値を超えるデータブロックを選択する
付記1記載の匿名化処理方法。
前記距離が、
第2のデータ項目値を段階的に一般化する階層木のデータにおいて、2つの第2のデータ項目値を含む最小の部分木における階層数と、前記階層木の階層数とから算出される
付記1又は2記載の匿名化処理方法。
前記距離の閾値が、
前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数に応じて決定される
付記1乃至3のいずれか1つ記載の匿名化処理方法。
前記データブロックの数の閾値が、
前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数に応じて決定される
付記1乃至4のいずれか1つ記載の匿名化処理方法。
前記第1のデータブロック及び前記第2のデータブロックの数が、前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数未満である場合、他のグループに含まれる第1のデータブロックとの距離が閾値以下であれば、当該他のグループに前記選択する処理において選択された前記第1のデータブロックを追加する処理
をさらに含む付記1乃至5のいずれか1つ記載の匿名化処理方法。
前記他のグループに含まれる第1のデータブロックとの距離が閾値を超える場合には、前記第1のデータブロックを破棄する処理
をさらに含む付記6記載の匿名化処理方法。
第1のデータ項目値と当該第1のデータ項目値を匿名化するために一般化され得る第2のデータ項目値と当該第2のデータ項目値の一般化のためにグループ化すべきデータブロックの数とを含むデータブロックを複数格納するデータ格納部から、グループを代表する第1のデータブロックを選択する処理と、
前記データ格納部から、第2のデータ項目値に基づき算出される、前記第1のデータブロックとの距離が閾値未満であり且つグループ化すべきデータブロックの数が閾値以上である第2のデータブロックを抽出する処理と、
前記第1のデータブロック及び前記第2のデータブロックの数が、前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数以上であれば、前記第2のデータブロックの少なくとも一部及び前記第1のデータブロックをグループ化する処理と、
前記選択する処理と前記抽出する処理と前記グループ化する処理とを、前記データ格納部に格納されたデータブロックのうち、前記グループ化すべきデータブロックの数が大きいデータブロックの順に実行する処理と、
グループ毎に、当該グループに含まれるデータブロックにおける第2のデータ項目値を、所定のルールに従って一般化する処理と、
を、コンピュータに実行させるための匿名化処理プログラム。
第1のデータ項目値と当該第1のデータ項目値を匿名化するために一般化され得る第2のデータ項目値と当該第2のデータ項目値の一般化のためにグループ化すべきデータブロックの数とを含むデータブロックを複数格納するデータ格納部から、グループを代表する第1のデータブロックを選択する処理と、前記データ格納部から、第2のデータ項目値に基づき算出される、前記第1のデータブロックとの距離が閾値未満であり且つグループ化すべきデータブロックの数が閾値以上である第2のデータブロックを抽出する処理と、前記第1のデータブロック及び前記第2のデータブロックの数が、前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数以上であれば、前記第2のデータブロックの少なくとも一部及び前記第1のデータブロックをグループ化する処理とを、前記データ格納部に格納されたデータブロックのうち、前記グループ化すべきデータブロックの数が大きいデータブロックの順に実行する第1処理部と、
グループ毎に、当該グループに含まれるデータブロックにおける第2のデータ項目値を、所定のルールに従って一般化する第2処理部と、
を有する情報処理装置。
31 受信部
32 第1データ格納部
33 グループ化処理部
34 設定データ格納部
35 第2データ格納部
36 一般化処理部
37 第3データ格納部
38 送信部
Claims (9)
- 第1のデータ項目値と当該第1のデータ項目値を匿名化するために一般化され得る第2のデータ項目値と当該第2のデータ項目値の一般化のためにグループ化すべきデータブロックの数とを含むデータブロックを複数格納するデータ格納部から、グループを代表する第1のデータブロックを選択する処理と、
前記データ格納部から、第2のデータ項目値に基づき算出される、前記第1のデータブロックとの距離が閾値未満であり且つグループ化すべきデータブロックの数が閾値以上である第2のデータブロックを抽出する処理と、
前記第1のデータブロック及び前記第2のデータブロックの数が、前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数以上であれば、前記第2のデータブロックの少なくとも一部及び前記第1のデータブロックをグループ化する処理と、
前記選択する処理と前記抽出する処理と前記グループ化する処理とを、前記データ格納部に格納されたデータブロックのうち、前記グループ化すべきデータブロックの数が大きいデータブロックの順に実行する処理と、
グループ毎に、当該グループに含まれるデータブロックにおける第2のデータ項目値を、所定のルールに従って一般化する処理と、
を含み、コンピュータにより実行される匿名化処理方法。 - 前記実行する処理において、
直前に選択された前記第1のデータブロックとの距離が最大となるデータブロック又は前記直前に選択された前記第1のデータブロックとの距離が前記閾値を超えるデータブロックを選択する
請求項1記載の匿名化処理方法。 - 前記距離が、
第2のデータ項目値を段階的に一般化する階層木のデータにおいて、2つの第2のデータ項目値を含む最小の部分木における階層数と、前記階層木の階層数とから算出される
請求項1又は2記載の匿名化処理方法。 - 前記距離の閾値が、
前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数に応じて決定される
請求項1乃至3のいずれか1つ記載の匿名化処理方法。 - 前記データブロックの数の閾値が、
前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数に応じて決定される
請求項1乃至4のいずれか1つ記載の匿名化処理方法。 - 前記第1のデータブロック及び前記第2のデータブロックの数が、前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数未満である場合、他のグループに含まれる第1のデータブロックとの距離が閾値以下であれば、当該他のグループに前記選択する処理において選択された前記第1のデータブロックを追加する処理
をさらに含む請求項1乃至5のいずれか1つ記載の匿名化処理方法。 - 前記他のグループに含まれる第1のデータブロックとの距離が閾値を超える場合には、前記第1のデータブロックを破棄する処理
をさらに含む請求項6記載の匿名化処理方法。 - 第1のデータ項目値と当該第1のデータ項目値を匿名化するために一般化され得る第2のデータ項目値と当該第2のデータ項目値の一般化のためにグループ化すべきデータブロックの数とを含むデータブロックを複数格納するデータ格納部から、グループを代表する第1のデータブロックを選択する処理と、
前記データ格納部から、第2のデータ項目値に基づき算出される、前記第1のデータブロックとの距離が閾値未満であり且つグループ化すべきデータブロックの数が閾値以上である第2のデータブロックを抽出する処理と、
前記第1のデータブロック及び前記第2のデータブロックの数が、前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数以上であれば、前記第2のデータブロックの少なくとも一部及び前記第1のデータブロックをグループ化する処理と、
前記選択する処理と前記抽出する処理と前記グループ化する処理とを、前記データ格納部に格納されたデータブロックのうち、前記グループ化すべきデータブロックの数が大きいデータブロックの順に実行する処理と、
グループ毎に、当該グループに含まれるデータブロックにおける第2のデータ項目値を、所定のルールに従って一般化する処理と、
を、コンピュータに実行させるための匿名化処理プログラム。 - 第1のデータ項目値と当該第1のデータ項目値を匿名化するために一般化され得る第2のデータ項目値と当該第2のデータ項目値の一般化のためにグループ化すべきデータブロックの数とを含むデータブロックを複数格納するデータ格納部から、グループを代表する第1のデータブロックを選択する処理と、前記データ格納部から、第2のデータ項目値に基づき算出される、前記第1のデータブロックとの距離が閾値未満であり且つグループ化すべきデータブロックの数が閾値以上である第2のデータブロックを抽出する処理と、前記第1のデータブロック及び前記第2のデータブロックの数が、前記第1のデータブロックに含まれる、グループ化すべきデータブロックの数以上であれば、前記第2のデータブロックの少なくとも一部及び前記第1のデータブロックをグループ化する処理とを、前記データ格納部に格納されたデータブロックのうち、前記グループ化すべきデータブロックの数が大きいデータブロックの順に実行する第1処理部と、
グループ毎に、当該グループに含まれるデータブロックにおける第2のデータ項目値を、所定のルールに従って一般化する第2処理部と、
を有する情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012258555A JP5974858B2 (ja) | 2012-11-27 | 2012-11-27 | 匿名化処理方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012258555A JP5974858B2 (ja) | 2012-11-27 | 2012-11-27 | 匿名化処理方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014106691A true JP2014106691A (ja) | 2014-06-09 |
JP5974858B2 JP5974858B2 (ja) | 2016-08-23 |
Family
ID=51028133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012258555A Expired - Fee Related JP5974858B2 (ja) | 2012-11-27 | 2012-11-27 | 匿名化処理方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5974858B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016018379A (ja) * | 2014-07-08 | 2016-02-01 | Kddi株式会社 | プライバシー保護装置、方法及びプログラム |
JP2016206896A (ja) * | 2015-04-21 | 2016-12-08 | トヨタ自動車株式会社 | 位置情報匿名化方法、移動情報匿名化方法、および装置 |
JP2017182342A (ja) * | 2016-03-29 | 2017-10-05 | 西日本電信電話株式会社 | グループ化装置、グループ化方法及びコンピュータプログラム |
CN108885673A (zh) * | 2016-02-22 | 2018-11-23 | 塔塔顾问服务有限公司 | 用于计算数据隐私-效用折衷的系统和方法 |
US10360405B2 (en) | 2014-12-05 | 2019-07-23 | Kabushiki Kaisha Toshiba | Anonymization apparatus, and program |
KR20200026559A (ko) * | 2018-09-03 | 2020-03-11 | (주)아이알컴퍼니 | K-익명성 모델 이용 데이터 셋 비식별화 방법 및 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012022315A (ja) * | 2010-07-02 | 2012-02-02 | Nec (China) Co Ltd | データ匿名化の方法と装置 |
WO2013031997A1 (ja) * | 2011-09-02 | 2013-03-07 | 日本電気株式会社 | 匿名化装置、及び、匿名化方法 |
-
2012
- 2012-11-27 JP JP2012258555A patent/JP5974858B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012022315A (ja) * | 2010-07-02 | 2012-02-02 | Nec (China) Co Ltd | データ匿名化の方法と装置 |
WO2013031997A1 (ja) * | 2011-09-02 | 2013-03-07 | 日本電気株式会社 | 匿名化装置、及び、匿名化方法 |
Non-Patent Citations (1)
Title |
---|
JPN7016001582; Charu C. Aggarwal et al.: 'On variable Constraints in Privacy Preserving Data Mining' Proceedings of the 2005 SIAM International Conference on Data Mining , 20050421, p.115-125 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016018379A (ja) * | 2014-07-08 | 2016-02-01 | Kddi株式会社 | プライバシー保護装置、方法及びプログラム |
US10360405B2 (en) | 2014-12-05 | 2019-07-23 | Kabushiki Kaisha Toshiba | Anonymization apparatus, and program |
JP2016206896A (ja) * | 2015-04-21 | 2016-12-08 | トヨタ自動車株式会社 | 位置情報匿名化方法、移動情報匿名化方法、および装置 |
CN108885673A (zh) * | 2016-02-22 | 2018-11-23 | 塔塔顾问服务有限公司 | 用于计算数据隐私-效用折衷的系统和方法 |
JP2019512128A (ja) * | 2016-02-22 | 2019-05-09 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | データの秘匿性−実用性間のトレードオフを算出するためのシステムおよび方法 |
JP2017182342A (ja) * | 2016-03-29 | 2017-10-05 | 西日本電信電話株式会社 | グループ化装置、グループ化方法及びコンピュータプログラム |
KR20200026559A (ko) * | 2018-09-03 | 2020-03-11 | (주)아이알컴퍼니 | K-익명성 모델 이용 데이터 셋 비식별화 방법 및 장치 |
KR102126386B1 (ko) | 2018-09-03 | 2020-06-24 | (주)아이알컴퍼니 | K-익명성 모델 이용 데이터 셋 비식별화 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP5974858B2 (ja) | 2016-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5974858B2 (ja) | 匿名化処理方法及び装置 | |
US11853329B2 (en) | Metadata classification | |
US10817621B2 (en) | Anonymization processing device, anonymization processing method, and program | |
US11449674B2 (en) | Utility-preserving text de-identification with privacy guarantees | |
JP7106643B2 (ja) | データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム | |
JP6015658B2 (ja) | 匿名化装置、及び、匿名化方法 | |
JP5511532B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
Anjum et al. | An efficient approach for publishing microdata for multiple sensitive attributes | |
JP5611852B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
US12147572B2 (en) | Controlling access to de-identified data sets based on a risk of re-identification | |
US20170083708A1 (en) | Utility-Aware Anonymization of Sequential and Location Datasets | |
CN109992982A (zh) | 大数据访问授权方法、装置和大数据平台 | |
Abbasi et al. | A clustering‐based anonymization approach for privacy‐preserving in the healthcare cloud | |
US10154041B2 (en) | Website access control | |
US10956664B2 (en) | Automated form generation and analysis | |
CN104866781A (zh) | 面向社区检测应用的社会网络数据发布隐私保护方法 | |
JP5782636B2 (ja) | 情報匿名化システム、情報損失判定方法、及び情報損失判定プログラム | |
CN113051619A (zh) | 一种基于k-匿名的中药处方数据隐私保护方法 | |
CN110390211B (zh) | 一种敏感属性数据的处理方法及系统 | |
JP5720536B2 (ja) | 秘匿化データの検索のための情報処理方法及び装置 | |
WO2014112045A1 (ja) | 秘匿化データ生成方法及び装置 | |
JP7288194B2 (ja) | 秘密情報管理プログラム、秘密情報管理方法、および秘密情報管理システム | |
Verma et al. | DF 2.0: Designing an automated, privacy preserving, and efficient digital forensic framework | |
JP6450098B2 (ja) | 匿名化装置、匿名化方法及び匿名化プログラム | |
JP2017076170A (ja) | リスク評価装置、リスク評価方法及びリスク評価プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150706 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160704 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5974858 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |