メイン コンテンツをスキップする 補完的コンテンツへスキップ

パイプラインの作成

パイプラインを最初から作成する方法について説明します。

手順

  1. ホームページで[Pipelines] (パイプライン) > [Add pipeline] (パイプラインを追加)をクリックします。
  2. 上のツールバーで、パイプラインに名前を付けます。
  3. ソースを追加するには、キャンバスで[ADD SOURCE] (ソースを追加)プレースホルダーをクリックします。
  4. パイプラインで使用するデータセットを選択します:
    • データセットを既に作成している場合は、[Select a source] (ソースを選択)パネルのリストでそのデータセットを選択して[Select] (選択)をクリックします。
    • 作成していない場合は、データセットを最初から作成の説明に従い、[Add dataset] (データセットを追加)をクリックして新しいデータセットを追加します。
  5. Plusアイコンをクリックして、必要に応じて1つまたは複数の処理コンポーネント(フィルタリング、クレンジング、集計など)を選択します。
    [Add a processor] (プロセッサーを追加)パネルでは、メインリストからプロセッサーを選択するか、テキストボックスに名前や説明を入力できます。
  6. デスティネーション(データを消費し、選択したシステムに送信するターゲットコンポーネント)を追加する場合は、キャンバスで[ADD DESTINATION] (デスティネーションを追加)プレースホルダーをクリックします。
  7. デスティネーションデータセットを選択します:
    • データセットを既に作成している場合は、[Select a destination] (デスティネーションを選択)パネルのリストでそのデータセットを選択して[Select] (選択)をクリックします。
    • 作成していない場合は、データセットを最初から作成の説明に従い、[Add dataset] (データセットを追加)をクリックして新しいデータセットを追加します。
    パイプラインがS3入力からデータを消費し、データを処理およびフィルタリングして、選択されたデータを別のS3デスティネーションに送信する例。
    このパイプラインは、Amazon S3のソース、Python、Filter、Aggregateプロセッサー、Amazon S3デスティネーションを示しています。

    パイプラインを実行する前には、デザインプロセスの各ステップでデータのプレビューを確認できます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。