始める前に
-
ソースデータを保管するシステムへの接続が作成済みであること。
ここでは、Amazon S3接続を使用します。
-
ソースデータを保管するデータセットが追加済みであること。
math-prices.zipファイルをダウンロードして抽出します。顧客による最新の購入に関するデータが、税抜き価格と税込み価格と共に含まれています。
-
接続および処理済みデータを保管する関連データセットも作成済みであること。
ここでは、同じS3バケットに保存されているデータセットを使用します。
手順
-
[Pipelines] (パイプライン)ページで[Add pipeline] (パイプラインを追加)をクリックします。新しいパイプラインが開きます。
-
パイプラインに意味のある名前を付けます。
例
calculate customer purchases
-
[ADD SOURCE] (ソースを追加)をクリックしてパネルを開きます。このパネルで、ソースデータ(この場合はAmazon S3に税金情報が保存されている顧客が最後に購入した品目)を選択できます。
-
データセットを選択し、[Select] (選択)をクリックしてパイプラインに追加できるようにします。
必要であれば名前を変更します。
-
をクリックし、パイプラインにMathプロセッサーを追加します。設定パネルが開きます。
-
プロセッサーに意味のある名前を付けます。
例
calculate price including tax
-
[Configuration] (設定)エリアで以下の操作を行います。
-
購入価格に税額を追加する場合は、[Function name] (ファンクション名)リストで[Fill cells with value] (セルに値を入力)を選択します。
-
最後に購入した品目の税抜価格を表示する場合は、[Fields to process] (処理するフィールド)リストで.latest_purchase_pre_taxを選択します。
-
[Create new column] (新しいカラムを作成)オプションを選択すると、計算結果が新しいフィールドに表示されます。
-
2つのフィールドの合計を計算する場合は、演算子として+を選択します。
-
元の価格に税額を追加する場合は、[Use with] (次を使用)リストで[Other column] (他のカラム)を、[Column] (カラム)で.taxをそれぞれ選択します。
-
[Save] (保存)をクリックして設定を保存します。
プロセッサーのプレビューに注目し、操作前のデータと結合後のデータを比較します。結合されたデータのタイプがnumberに自動的に変換されたことがわかります。
-
[ADD DESTINATION] (デスティネーションを追加)をクリックし、出力データを保持するデータセットを選択します。
必要であれば名前を変更します。
-
Talend Cloud Pipeline Designerの上部ツールバーで[Run] (実行)ボタンをクリックするとパネルが開き、実行プロファイルを選択できるようになります。
-
リストで実行プロファイルを選択し(詳細は実行プロファイルをご覧ください)、[Run] (実行)をクリックしてパイプラインを実行します。
タスクの結果
パイプラインは実行中となり、顧客が最後に購入した税込合計額が含まれる新しいフィールドは元のデータセットに追加され、指定のターゲットシステムに送信されます。