tPatternMasking - 7.3

Data privacy

Version
7.3
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
Last publication date
2024-04-03

特定のパターンに従うデータをマスキングします。また、必要に応じて元のデータを規則的に変換できます。

異種データをマスキングする必要がある場合は、tDataMaskingコンポーネントを使用します。詳細は、tDataMaskingをご覧ください。

異種データをマスキングする必要がある場合は、tDataMaskingコンポーネントを使用します。詳細は、Talend Help Center (https://help.talend.com)でtDataMaskingのドキュメンテーションをご覧ください。

tPatternMaskingは、パターン固有のデータや汎用データを指定範囲の日付や数値、または名前付きの値のセットからのランダムな文字に置換します。機密性の高い実際のデータを表示することが勧められない場合、実データは保護され、代替データが使用できるようになります。

実際のデータとそっくりなデータで一貫性を保ちつつ、テストやトレーニングなどの目的で使用できます。マスキングを必要とする最も一般的なデータ型として、個人を特定できる情報(PII)または機密個人データ(SPD)を含むデータがあります。

tPatternMaskingは、データセットを行単位で読み取り、データフィールドで定義したデータマスキングオペレーションを実行した後で、ストラクチャー的に類似しているものの本物でないバージョンのデータを作成します。
  • コンポーネントは、入力内のスペース、スラッシュ(/)、ダッシュ(-)、ポイント(.)を区切りとして識別します。
  • コンポーネントは、マスキングされた出力内の入力値のパターンを維持します。
  • コンポーネントは、各入力行について1行を生成します。

たとえば、615/67/7489をマスキングした出力の例として、379/48/1789が考えられます。

定義したパターンに入力データが一致しない場合、tPatternMaskingnullを出力します。

ローカルモードでは、Apache Spark 1.6、2.2、2.3、2.4、3.0がサポートされています。

Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントを参照してください。

使用しているTalend製品に応じて、このコンポーネントは、次のジョブのフレームワークの1つ、一部、またはすべてで使用できます。

  • 標準:tPatternMaskingの標準プロパティをご覧ください。

    このフレームワーク内のコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend Data Fabricで利用できます。

  • Spark Batch:Apache Spark BatchのtPatternMaskingプロパティをご覧ください。

    このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend Platform製品すべて、およびTalend Data Fabricで利用できます。

  • Spark Streaming:Apache Spark StreamingのtPatternMaskingプロパティをご覧ください。

    このコンポーネントは、Talend Real Time Big Data PlatformおよびTalend Data Fabricで利用できます。