手順
-
tFileInputDelimitedをダブルクリックして[Basic settings] (基本設定)ビューを開き、プロパティを定義します。
- [File name] (ファイル名)の横にある[...]ボタンをクリックし、入力データを保持するファイルを参照します。
-
必要に応じて、ヘッダー、フッター、および制限を設定します。
このシナリオでは、[Header] (ヘッダー)を1に設定します。フッターと処理された行数の制限は設定されていません。
-
[Edit schema] (スキーマを編集)をクリックして、ソース区切りファイルのデータ構造を記述できるダイアログボックスを開きます。
このシナリオでは、ソーススキーマは、ID、Status、FirstName、Email、City、Initial、およびZipCodeの各カラムで構成されます。
- tFuzzyUniqRowをダブルクリックして[Basic settings] (基本設定)ビューを表示し、プロパティを定義します。
-
[Key Attribute] (キー属性)カラムで、定義されているマッチングメソッド、名前、Eメール、都市、郵便番号を使用してチェックするカラムの横にあるチェックボックスをこのサンプルで選択します。
-
[Matching type ] (マッチングタイプ)カラムで、選択した各カラムで使用するマッチング方法を設定します。
この例では、Leveshteinは名前、Eメール、郵便番号カラムのマッチング方法として使用され、[Double Metaphone] (二重メタフォン)は都市カラムのマッチング方法として使用されます。次に、Levenshteinメソッドの最小距離と最大距離を設定します。この方法では、距離は、エントリーが参照と完全にマッチングするために実行する必要がある文字変更(挿入、削除、置換)の数です。この例では、最小距離は0、最大距離は2になります。これにより、FirstNameカラム、Emailカラム、ZipCodeカラムの完全にマッチングするエントリー、または最大2文字の変更があるエントリーがすべて出力されます。このマッチング方法は、入力データの音声の不一致に基づいているため、[Double Metaphone] (二重メタフォン)に設定する最小距離も最大距離もありません。
-
最初のtFileOutputExcelをダブルクリックして[Basic settings] (基本設定)ビューを表示し、プロパティを定義します。
- 宛先のファイル名とシート名を設定し、[Include Header] (ヘッダーを含める)チェックボックスをオンにします。
- 2番目のtFileOutputExcelについても同じ操作を行います。