データマスキング
データマスキングとは、個人名、会社名、連絡先、IDなどを隠したり置き換えたりして、AIや分析に使うデータの漏えいリスクを下げる処理です。匿名化・仮名化・匿名加工情報との違い、AIに入力する前の加工例、名前を消しても残る再識別リスクを整理します。
この記事でわかること
- データマスキングの意味
- 匿名化、仮名化、匿名加工情報との違い
- AIに入力する前の加工例
- 名前を消しても残る再識別リスク
データマスキングとは、元のデータに含まれる個人名、会社名、メールアドレス、電話番号、顧客ID、取引金額などを、伏せ字、記号、架空の値、範囲表現に置き換える処理です。
生成AIに議事録、問い合わせ内容、アンケート、顧客対応メモを渡す前に、不要な固有情報を隠すことで、情報漏えいのリスクを下げられます。ただし、マスキングは「安全性を高める処理」であり、処理後のデータが必ず匿名情報になるわけではありません。
1. データマスキングで守る情報
AIに入力する文章には、本人や取引先を直接特定できる情報だけでなく、組み合わせると推測できる情報も含まれます。
たとえば、次のような情報はマスキングの対象になります。
- 氏名、会社名、部署名、役職名
- メールアドレス、電話番号、住所
- 顧客ID、社員番号、契約番号
- 具体的な売上、見積金額、単価
- 店舗名、支店名、プロジェクト名
- 珍しい属性や出来事など、組み合わせると個人や会社を推測できる情報
AIに必要なのは、多くの場合「誰の話か」ではなく「どんな関係性・課題・判断があるか」です。社名を「A社」、担当者名を「B氏」に置き換えても、要約や分類、論点整理は十分に行えることがあります。
2. マスキング、仮名化、匿名化の違い
実務では「マスキング」「匿名化」「仮名化」がまとめて使われることがありますが、意味は同じではありません。
| 用語 | 意味 | 注意点 |
|---|---|---|
| データマスキング | 情報の一部を伏せ字や別の値に置き換える処理 | それだけで法的な匿名加工情報になるとは限りません |
| 仮名化 | 氏名などを別IDに置き換え、対応表を別管理する考え方 | 対応表があれば元の本人に戻せる場合があります |
| 匿名化 | 個人や会社を識別できないように加工する考え方 | 周辺情報から再識別される可能性を確認する必要があります |
| 匿名加工情報 | 個人情報保護法上の一定のルールに従って加工された情報 | 単なる伏せ字や置換だけでは該当しません |
個人情報保護委員会も、個人データを単にマスキングしただけでは、法令上の匿名加工情報ではなく個人データに当たる場合があると説明しています。社外提供や二次利用を考える場合は、マスキング作業だけで判断せず、法務・情報管理の確認が必要です。
3. AIに入力する前の実務的な加工例
AI利用でのデータマスキングは、文章の意味を残しながら、特定につながる部分を減らす作業です。
よく使う方法は、次の3つです。
-
置換する 「株式会社ジットの山田さん」を「A社のB氏」のように置き換えます。人名、社名、サービス名、案件名に向いています。
-
丸める 「2026年6月22日」「1,234,567円」「東京都渋谷区」のような具体値を、「2026年6月下旬」「約120万円」「都内」のように大きな単位にします。
-
削除する 要約や分類に不要なメールアドレス、電話番号、住所、口座番号、アクセスURL、添付ファイル名などは、文章から削除します。
たとえば、問い合わせ文をAIに要約させる場合は、次のように加工できます。
修正前:
山田太郎様(taro@example.com)から、6月22日 10:14に、
新宿本店の契約番号 ZIT-12345 についてクレームがありました。
修正後:
顧客Aから、6月下旬に、
都内店舗の契約案件についてクレームがありました。
この例では、AIがクレーム内容を整理するために不要な連絡先や契約番号を削っています。
4. 名前を消しても安全とは限らない
データマスキングで最も見落とされやすいのは、名前を消しても、周辺情報の組み合わせで特定できる場合があることです。
たとえば「A社の50代男性社長」「本社は愛知県豊田市」「自動車業界最大手」のような情報が残っていれば、社名を隠しても推測できてしまいます。NISTも、識別情報を削除したデータであっても、再識別される可能性が残ることを指摘しています。
AIに入力する前には、次の観点で見直すと安全です。
- 固有名詞を消しても、業界、地域、役職、日付の組み合わせで特定できないか
- 数値が具体的すぎて、社内の案件や顧客を推測できないか
- URL、ファイル名、画像内テキスト、添付資料名に機密情報が残っていないか
- AIに渡す目的に対して、本当にその情報が必要か
5. データマスキングはAI利用前の習慣にする
データマスキングは、AIを使うたびに完璧な匿名加工情報を作るための作業ではありません。まずは「AIに渡す必要のない情報を減らす」ための実務的な安全習慣です。
社内で運用するなら、個人情報・機密情報、取引先名、金額、識別番号などをどの程度隠すかを、業務ごとに決めておくと迷いが減ります。
AIに貼り付ける前に一度立ち止まり、「この情報は、回答に必要か。特定につながらないか」と確認することが、企業でAIを安全に使うための基本になります。
この記事の監修者
石崎 一之進
中小企業診断士
年間50回以上のセミナー・研修に登壇する「Web・ITが得意な中小企業診断士」。単なるツール導入ではなく、経営視点から現場の「業務効率化」と「売れる仕組み」づくりを両輪で伴走支援し、企業の自走を促すDX人材育成に力を入れています。「人材開発支援助成金(事業展開等リスキリング支援コース)」活用で最大75%還元されるAI研修も行っています。詳細はAI研修をご覧ください。
参考文献
- 個人情報保護委員会「匿名加工情報制度について」 https://www.ppc.go.jp/personalinfo/tokumeikakouInfo/
- NIST IR 8053: De-Identification of Personal Information https://csrc.nist.gov/pubs/ir/8053/final