キー生成の設定 - 7.2

Identification

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 識別コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 識別コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 識別コンポーネント
  1. tGenKeyをダブルクリックして[Basic settings] (基本設定)ビューを表示し、コンポーネントプロパティを定義します。

    をクリックし、VSRアルゴリズムで作成された一致ルールからブロックキーをインポートし、 Talend Studio Profiling パースペクティブでテストしてジョブで使用できます。それ以外の場合は、以下の手順に従ってブロッキングキーのパラメーターを定義します。

  2. Algorithmテーブルでプラスボタンをクリックして、このテーブルに行を追加します。

  3. [column] (カラム)のカラムで、新しく追加された行をクリックし、アルゴリズムを使用して処理する列をリストから選択します。このサンプルでは、PostalCodeを選択します。

    注: 日付カラムにアルゴリズムやマッチングアルゴリズムを適用すると、日付形式で比較する内容を決定できます。

    たとえば、日付の年のみを比較する場合は、コンポーネントスキーマで日付カラムのタイプを[Date]に設定し、[Date Pattern] (日付パターン)フィールドにyyyyと入力します。コンポーネントでは、スキーマで定義されたパターンに基づき、日付形式を文字列に変換してから文字列比較が開始されます。

  4. アルゴリズム/オプションパラメーターの設定方法の説明を表示するには、[Show help] (ヘルプを表示)チェックボックスをオンにします。

  5. [algorithm] (アルゴリズム)カラムで、新しく追加された行をクリックし、対応する列に適用するアルゴリズムをリストから選択します。このサンプルでは、文字列の最初のN文字を選択します。

  6. [Value] (値)カラムをクリックし、必要に応じて選択したアルゴリズムの値を入力します。このシナリオでは、2を入力します。

    このサンプルでは、各データ行の郵便番号の最初の2文字を保持するファンクションキーを生成し、これらのカラムに余分なオプションを定義する必要はありません。

    必要なアルゴリズムの値を設定してください。さもないと、ジョブを実行する時にコンパイルエラーが発生することがあります。

tGenKeyプロパティを定義すると、これらのパラメーターの統計ビューを表示できます。これを行うには、次の手順に従います。

  1. tGenKeyコンポーネントを右クリックし、コンテキストメニューで[View Key Profile] (キープロファイルの表示)を選択します。

    [View Key Profile] (キープロファイルの表示)エディタが表示され、ブロックごとの行数に関する統計を表示し、取得する結果に従ってそれらを適合させることができます。

    大量のデータを処理する場合、このコンポーネントを使用して一致するコンポーネント(tRecordMatchingtMatchGroupなど)でデータを使用する場合、このコンポーネントを使用して1つのブロックに行数を制限する必要があります。1ブロックあたり約50行が最適ですが、比較するフィールド数、行総数、データ処理に適正な時間に依存します。

    [View Key Profile] (キープロファイルの表示)オプションの使用例については、同じ機能キーを持つ出力フロー重複レコード内でカラムを比較し、グループ化するを参照してください。