データマスキングの効果 - 2.8

Talend Data Preparation ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
2.8
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation
[Mask data (obfuscation)] (データのマスク(難読化))関数を使用するカラムのセマンティックタイプに応じて、使用可能なパラメーターとその効果は異なります。

テキストとセマンティックタイプ

テキストデータの場合、Talend Data Preparationは、事前定義済みのセマンティックタイプの1つか、またはカスタムセマンティックタイプの1つか、または[Text] (テキスト)タイプのうちのいずれかを自動的に提案します。事前定義済みおよびカスタムセマンティックタイプの場合は、正規表現または値の辞書をベースにすることができます。

以下のテーブルには、[Text] (テキスト)タイプのカラムに使用できるマスキングルーチン、または事前定義済みもしくはカスタムセマンティックタイプのいずれか、および、たとえば値[Talend in 2018 is awesome] (2018年のTalendは素晴らしい)に対するその効果がリスト表示されます。

マスキングルーチン 説明 パラメーター 出力
セマンティックマスキング Textセマンティックタイプの場合、関数は元のレコードのパターンを守りつつ、ランダムな文字を生成します。 セマンティックマスキングオプションの場合は、他のパラメーターを選択する必要がありません。 Äåòçôî ëð 1889 òn äipïåvu
正規表現ベースのセマンティックタイプの場合、関数は正規表現のパターンに対応するランダムレコードを生成します。
辞書ベースのセマンティックタイプの場合、ファンクションは、最初にセマンティックタイプの作成に使用された辞書から抽出された値でレコードをランダムに置換します。
2つのポジション間の文字を維持 選択した間隔に含まれているすべての文字がそのまま維持され、間隔の外にある文字は削除されます。 開始インデックス: 11 2018 is awesome
終了インデックス: 25
文字パターンから生成 ランダム文字のレコードは、指定のパターンから作成されます。 文字パターン: aaaaaa 9999 aaaaaaa õaßayè 8908 æluäco
2つのポジション間の文字を削除 選択した間隔に含まれているすべての文字が削除され、間隔の外にある文字はそのまま保たれます。 開始インデックス: 7 Talend is awesome
終了インデックス: 14
すべて置換 すべての文字が指定の代用に置き換えられます。 置換: x xxxxxxxxxxxxxxxxxxxxxxxxx
すべての桁を置換 すべての桁が指定の代用に置き換えられます。文字はそのまま保たれます。 置換: 9 Talend in 9999 is awesome
すべての文字を置換 すべての文字が指定の代用に置き換えられます。桁はそのまま保たれます。 置換: y yyyyyy yy 2018 yy yyyyyyy
2つのポジション間の文字を置換 選択した間隔に含まれているすべての文字が置換され、間隔の外にある文字はそのまま保たれます。 開始インデックス: 1 aaaaaa in 2018 is awesome
終了インデックス: 6
置換: a
最初のn文字を置換 最初のn文字が指定の代用に置き換えられ、続きの文字はそのまま保たれます。 文字数: 17 @@@@@@@@@@@@@@@@@ awesome
置換: @
最後のn文字を置換 最後のn文字が指定の代用に置き換えられ、前の文字はそのまま保たれます。 文字数: 10 Talend in 2018 !!!!!!!!!!
置換: !
最初のn桁を保ち、それ以降を置換 最初のn桁がそのまま保たれ、続きの桁はランダムな桁に置き換えられます。 数字以外の文字はそのまま保たれます。 桁数: 1 Talend in 2436 is awesome
最後のn桁を保ち、それ以前を置換 最後のn桁がそのまま保たれ、前の桁はランダムな桁に置き換えられます。数字以外の文字はそのまま保たれます。 桁数: 2 Talend in 1618 is awesome

数値

以下のテーブルには、数値を含むカラムに使用できる[Integer] (整数)または[Decimal] (10進数)タイプのマスキングルーチン、および、たとえば値21803に対するその効果がリスト表示されます。

マスキングルーチン パラメーター 出力
ランダムな値で置換 最大バリエーション(%): 10 21499
2つの指定された値の間で生成 最小値: 20000 21876
最大値: 22000

以下のテーブルには、[Date] (日付)セマンティックタイプのカラムに使用できるマスキングルーチン、および、たとえば値05/04/2018に対するその効果がリスト表示されます。

マスキングルーチン パラメーター 出力
ランダムな日付で置換 最大バリエーション(日): 365 23/11/2017
年を維持して月日を01/01に置換   01/01/2018