メイン コンテンツをスキップする 補完的コンテンツへスキップ

最初のパスを設定する

手順

  1. pass1とラベル付けされたtMatchGroupの基本設定で、[Matching Algorithm] (マッチングアルゴリズム)リストから[Simple VSR] (単純VSR)を選択します。
    このシナリオでは、一致ルールはVSRアルゴリズムに基づいています。
  2. [Preview] (プレビュー)ボタンをクリックして[Configuration Wizard] (設定ウィザード)を表示します。
  3. をクリックし、 Studio Talend Profiling パースペクティブで作成およびテストしたマッチングルールからマッチングキーをインポートし、ジョブ内で使用します。または、以下のステップの説明に従い、マッチングキーのパラメーターを定義します。
    コンポーネントの基本設定で選択されているのと同じタイプのルールをインポートまたは定義することが重要です。そうでない場合、ジョブは2つのアルゴリズム間で互換性のないパラメーターのデフォルト値で実行されます。
  4. [Key definition] (キー定義)テーブルで[+]ボタンをクリックし、マッチングオペレーションを行うカラム(このシナリオではlname)を追加します。
    情報メモ注: 日付カラムにアルゴリズムやマッチングアルゴリズムを適用すると、日付形式で比較する内容を決定できます。

    たとえば、日付の年のみを比較する場合は、コンポーネントスキーマで日付カラムのタイプを[Date]に設定し、[Date Pattern] (日付パターン)フィールドにyyyyと入力します。コンポーネントでは、スキーマで定義されたパターンに基づき、日付形式を文字列に変換してから文字列比較が開始されます。

  5. [Matching Function] (マッチングファンクション)カラムでJaro-Winklerアルゴリズムを選択します。
  6. [Tokenized measure] (トークン化された測定)リストで[Any order] (任意の順序)を選択します。
  7. [Weight] (加重)1に設定し、[Handle Null] (NULLの扱い)カラムで、カラム内のNull属性の処理に使用するnullオペレーター(このシナリオでは[Null Match Null] (NullはNullに適合する))を選択します。
  8. [Blocking Selection] (ブロッキング選択)テーブルの下にある[+]ボタンをクリックしてテーブルに1行を追加し、行をクリックして、ブロッキング値として使用するカラム(この例ではT_GEN_KEY)をリストから選択します。
    ブロッキング値を使用すると、検査する必要があるレコードのペアの数が減ります。入力データは、機能キーに基づいて網羅的なブロックに分割されます。これにより、比較が各ブロック内のレコードペアに制限されるため、比較するペアの数が減少します。
  9. 必要に応じて、[Edit schema] (スキーマを編集)をクリックしてスキーマエディターを開き、ジョブ内の前のコンポーネントから取得されたスキーマを表示します。
  10. [Advanced settings] (詳細設定)タブをクリックし、[Sort the output data by GID] (出力データをGIDでソート)チェックボックスをオンにして、出力データをそのグループIDでソートします。
  11. ウィザードを次回開いた時にマッチングルールを実行しない場合は、[Deactivate matching computation when opening the wizard] (ウィザードオープン時のマッチング計算の無効化)チェックボックスをオンにします。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。