手順
-
デザインワークスペースでtFileList_1を選択し、[Component] (コンポーネント)タブをクリックして、基本設定を定義します。
この最初のtFileListは、customers_filesフォルダー、および2つのサブフォルダーのパスを取得して、後で再利用できるようにします。
- [Directory] (ディレクトリー)フィールドに、各サブフォルダーに顧客データセットが含まれているcustomers_filesフォルダーへのパスを入力します。
- [Filemask] (ファイルマスク)テーブルの[+]ボタンをクリックして新しい行を追加し、*に名前を変更して二重引用符の間に入力します。
-
デザインワークスペースでtFileList_2を選択し、[Component] (コンポーネント)タブをクリックして、基本設定を定義します。
この2番目のtFileListは、2つのサブフォルダーに含まれている4つの.csvデータセットを読み取り、それらのファイルパスを取得します。
-
入力ファイルパスを動的に取得する式を[Directory] (ディレクトリー)フィールドに入力するには、[Outline] (アウトライン)パネルにある式リストtFileList_1からドラッグします。
- [Includes subdirectories] (サブディレクトリーを含める)チェックボックスをオンにします。
- [Filemask] (ファイルマスク)テーブルの[+]ボタンをクリックして新しい行を追加し、*.csvに名前を変更して二重引用符の間に入力します。
-
デザインワークスペースでtFileInputDelimitedを選択して[Component] (コンポーネント)タブをクリックし、基本設定を定義します。
-
入力ファイルパスを動的に取得する式を[File name/Stream (ファイル名/ストリーム)フィールドに入力するには、[Outline] (アウトライン)パネルにある式リストtFileList_2からドラッグします。
- データセットに対応する[Row Separator] (行区切り)と[Field Separator] (フィールド区切り)を二重引用符の間に入力します。
-
[Edit schema] (スキーマを編集)ボタンをクリックして、ソースデータセットのカラムとそのデータ型を定義します。
customers_filesフォルダーからのデータセットはすべて、スキーマが同じです。このスキーマが、tDataprepRunコンポーネントで想定されているスキーマと一致していることをご確認ください。つまり、入力スキーマは、プレパレーションが最初に作成されたデータセットと同じである必要があります。