機密性の高いデータの高度な使用制限 - Cloud - 8.0

Data privacy

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント

データをシャッフルする場合でも、機密データをマスキングすることをお勧めします。また、データをシャッフルする際はカラム間の関係を考慮し、元のデータセットを再構築できないようにすることも忘れるべきではありません。

このシナリオでは、姓と名がグルーピングされていますが、メールアドレスは同じグループに含まれていません。したがって、[email] (メール)カラムは[lname] (姓)カラムと[fname] (名)カラムに関連しません。[email] (メール)カラムには通常、姓と名に関する情報が含まれているため、攻撃者は元のデータを再構築するのに利用できてしまいます。

また、[address1] (住所1)[city] (市区町村)[email] (メール)のカラムはどのグループにも含まれていないため、シャッフルされていません。これにより、たとえばRobert Damstraさんが1619 Stillman Court, Lynnwoodに住んでいることが推測できてしまうことを意味しています。

このシナリオでは、実際の機密データの使用を高度に制限できます:
  • 実際のクレジットカード番号を使用しないようにするため、tDataMaskingコンポーネントを使用してクレジットカード番号をマスキングできます。

  • メールアドレスで顧客が特定されないようにするため、tDataMaskingコンポーネントを使用してメールアドレスをマスキングできます。

  • 実際の住所を読み取られにくくするために、[address1] (住所1)[city] (市区町村)カラムを他のグループに追加できます。

注:

tDataShufflingはSparkフレームワークでサポートされているため、ジョブプロパティを編集することで、この標準ジョブをSpark Ba​​tchジョブに変換できます。この方法では、ジョブのコンポーネントの設定を再定義する必要はありません。