手順
- tLogRowコンポーネントをダブルクリックして、その[Basic settings] (基本設定)ビューを表示し、コンポーネントのプロパティを定義します。
-
ジョブを保存し、[F6]を押して実行します。
類似するレコードがグルーピングされます。各グループのレコード数がGRP_SIZEカラム内にリスト表示され、マスターレコードでのみ計算されます。MASTERカラムは、対応するレコードがマスターレコードかそうでないかをtrueまたはfalseで示します。マスターレコードは、音声アルゴリズムがベストマッチするレコードを年齢の値が最大であるレコードとマージすることで作成されます。SCOREカラムには、Soundexマッチングアルゴリズムに従い、入力レコードとマスターレコードの間の計算された類似性がリスト表示されます。各グループの識別子(Stringデータ型のもの)が、対応するレコードの横にあるGIDカラム内にリスト表示されます。この識別子は、古いリリースから移行したジョブの場合はLongというデータ型になります。グループ識別子をStringにするには、インポートしたジョブ内のtMatchGroupコンポーネントを、Talend Studioの [Palette] (パレット)からのtMatchGroupに置き換える必要があります。