大型のデータセットからより多くのデータをフェッチ - Cloud

Talend Cloud Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
EnrichPlatform
Talend Data Preparation

Talend Cloud Data Preparationで大規模データセットで作業をする場合、たとえば50,000行であれば、最初の10,000行のサンプルだけが表示されます。

他のデータセットの場合と同様に、データの準備を開始して機能を適用できます。ただし、いずれかのタイプのフィルターをデータに適用する場合は例外です。サンプルで作業をしているので、最初の10,000行の中から一致する行だけが取得されます。ただし、残りの40,000行から一致する行をさらに取得し、この新しいサンプルに基づいてプレパレーションを調整することもできます。

手順

  1. グリッドの左上にあるメニューアイコンをクリックして、[Display rows with invalid or empty values] (値が無効または空の行を表示)を選択します。

    フィルターが正しく適用され、一致する行だけがグリッドに表示されていることがフィルターバーで確認できます。その他のフィルターも選択できます。さらに、データのカテゴリーにフィルターを適用するオプションは、サンプルに一致する値がない場合でも個別のカラムに対して使用できます。カラムヘッダーのメニューアイコンをクリックして、利用可能なオプションを表示します。

    フィルターバーの[Fetch more] (さらに取得)ボタンを見ると、現在サンプルで作業をしていること、およびより多くの行がフィルターに一致している可能性があることもわかります。

  2. [Fetch more] (さらに多くの行を取得)をクリックして、現在のフィルターに一致する行をさらに取得します。

    [Fetch additional rows] (追加行を取得)ダイアログボックスが開いたら、データの取得状況を確認できます。

    10,000行の結果に達した時やデータセットの終了に達すると、Talend Cloud Data Preparationによって自動的に停止されます。ユーザーがプロセスを停止して、既に見つかった行を表示することもできます。停止後、画面がグリッドに戻します。画面上の作業対象サンプルは、フェッチした行で構成されています。今後適用するフィルターまたは機能は、このサンプルだけに適用されます。

    適用するために最初に選択したフィルターがどの行とも一致しない場合は、すべてのフィルターを消去することも、データセット全体を検索して一致する行がないか探すこともできます。

  3. サンプルを最初の状態に戻すには、すべてのフィルターを消去します。
    各フィルターのバツ印をクリックするか、ゴミ箱アイコンをクリックしてフィルターを消去します。

タスクの結果

グリッドには再び、データセットの最初の10,000行が表示されるので、データの準備を続行できます。