tDataMasking - Cloud - 8.0

Data privacy

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント

機密性の高い実際のデータを表示することが勧められない場合に、元のデータをランダムな文字または数字で隠し、実際のデータを保護しながら、同様の効果を得るために使用します。

tDataMaskingは、データセット行を行単位で読み取った後に、データフィールドに特定の関数を適用して、構造的に類似しているものの本物でないバージョンのデータを作成します。各入力行について1行が生成されます。

テストやトレーニングなどの目的でファンクション的な代替品を使用できるようになります。個人を特定できる情報(PII)または機密個人データ(SPD)を取り扱う時に、このデータを保護し、マスクできます。

機密データの定義は幅広く、国や組織によっても異なります。基本的に、機密データには関係する人物や会社を危険にさらしかねない個人情報やビジネス情報を含まれます。

たとえば、一般にクレジット/デビットカードのデータは機密データとして扱われます。機密データとは、個人や居場所を特定できる情報のことです。機密性の高い個人情報には以下が含まれますが、これらに限定されません: 姓名、メールアドレス、住所、ソーシャルセキュリティー番号(SSN)、クレジットカード番号、銀行口座番号、人種、性別、生年月日、給与および位置情報と時間の組み合わせ。

機密性の高い個人情報の詳細は、[Personally Identifiable Information] (個人を特定できる情報)をご覧ください。

さらに、ビジネス機密データには、企業秘密、買収計画、財務データ、顧客情報などが含まれることがあります。

ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。

デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

使用しているTalend製品に応じて、このコンポーネントは次のジョブのフレームワークの1つ、一部、またはすべてで使用できます。

  • 標準:tDataMaskingの標準プロパティをご覧ください。

    このフレームワーク内のコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend Data Fabricで利用できます。

  • Spark Batch:Apache Spark Ba​​tchのtDataMaskingプロパティをご覧ください。

    このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend Platform製品すべて、およびTalend Data Fabricで利用できます。

  • Spark Streaming:Apache Spark StreamingのtDataMaskingプロパティをご覧ください。

    このコンポーネントは、Talend Real Time Big Data PlatformおよびTalend Data Fabricで利用できます。