航空会社事故の件数を比較し、航空会社をフィルタリングする - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

Version
Cloud
Language
日本語 (日本)
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
ジョブデザインと開発 > パイプラインのデザイン

始める前に

  • ソースデータを保管するシステムへの接続が作成済みであること。

    ここでは、テスト接続を使用します。

  • ソースデータを保管するデータセットが追加済みであること。

    ここでは、インシデントと事故の件数、および死亡者数、その他の航空会社に関するデータを含むデータセット(このページの左パネルにある[Downloads] (ダウンロード)タブからnumbers-airlines.csvファイルをダウンロードします)。

  • 接続および処理済みデータを保管する関連データセットも作成済みであること。

    ここではテストデータセットを使用します。

手順

  1. [Pipelines] (パイプライン)ページで[Add pipeline] (パイプラインを追加)をクリックします。新しいパイプラインが開きます。
  2. パイプラインに意味のある名前を付けます。

    例え

    Compare number of air crashes and filter airlines
  3. [ADD SOURCE] (ソースの追加)をクリックすると、ソースデータ(ここでは航空会社と墜落事故に関するデータ)を選択できるパネルが開きます。

    例え

  4. データセットを選択し、[Select] (選択)をクリックしてパイプラインに追加します。
    必要であれば名前を変更します。
  5. をクリックして、パイプラインに[Number] (数値)プロセッサーを追加します。設定パネルが開きます。
  6. プロセッサーに意味のある名前を付けます。

    例え

    compare number of fatal accidents
  7. [Configuration] (設定)エリアで以下の操作を行います。
    1. [Function name] (機能名)リストで、[Compare numbers] (数値を比較)を選択します。
    2. [Fields to process] (処理するフィールド)リストで.fatal_accidents_85_99を選択します。このフィールドの値(死亡事故の件数)をカスタム値と比較するためです。
    3. [Create new column] (新しいカラムを作成)オプションを有効にして、comparisonという名前を付けます。
    4. [Compare mode] (比較モード)リストで[greater or equals than] (以上)を選択し、[Use with] (併用)リストで[Value] (値)を選択し、[Value] (値)フィールドに2を入力します。このようにして、航空会社ごとの死亡事故の件数を比較して、死亡事故が2件以上ある航空会社を確認することができます。
  8. [Save] (保存)をクリックして設定を保存します。

    比較の前後のデータのプレビューを表示できます。

    値が比較され、死亡事故が2件以上あった航空会社(true)と2件未満の航空会社(false)を新しいフィールドに表示することができます。

  9. をクリックして、パイプラインに[Filter] (フィルター)プロセッサーを追加します。設定パネルが開きます。
  10. プロセッサーに意味のある名前を付けます。

    例え

    airlines with at least 2 fatal accidents
  11. [FILTERS] (フィルター)エリアで次の操作を行います。
    1. [Input] (入力)リストで.comparisonを選択します。この値に基づいて航空会社をフィルタリングするためです。
    2. レコードのフィルタリングで関数を適用しない場合は、[Optionally select a function to apply] (適用する機能をオプションとして選択)リストで[NONE] (なし)を選択します。
    3. [Operator] (演算子)リストで==を選択し、[Value] (値)リストにtrueと入力します。"2件以上の死亡事故"の要件を満たす航空会社でフィルタリングするためです。
  12. [Save] (保存)をクリックして設定を保存します。

    プロセッサーのプレビューに注目し、操作前のデータと結合後のデータを比較します。

  13. [ADD DESTINATION] (デスティネーションの追加)アイテムをクリックし、処理済みデータを保存するデータセットを選択します。
    必要であれば名前を変更します。
  14. Talend Cloud Pipeline Designerの上部のツールバーで、リストから実行プロファイルを選択します(詳細は実行プロファイルを参照してください)。
  15. 実行アイコンをクリックしてパイプラインを実行します。

タスクの結果

パイプラインが実行中です。データは指定した条件に従って比較およびフィルタリングされ、その結果、このデータセット内の19の航空会社で2回以上の死亡事故が発生していることがわかります。 出力は指定したターゲットシステムに送信されます。