メイン コンテンツをスキップする 補完的コンテンツへスキップ

空のレコードと無効なレコードの削除

クオリティバーは、カラムに空のレコードまたは無効なレコードが含まれているかどうかを示します。

クオリティバーがあるグリッドの一部のカラムに、無効セルまたは空のセルが表示されている状態。

カラムタイプに一致するデータはクオリティバーで緑で表示されます。赤の場合、カラムタイプに一致しない無効なデータを示します。空のレコードはグレーで表示されます。

特定の年齢範囲と州の顧客に注目する必要があるので、該当するカラムの空のデータは要りません。操作は簡単で、age (年齢)とstate (州)のカラムの空のデータと無効な値をデータセットから削除するだけです。

手順

  1. グリッドの左上にあるメニューアイコンをクリックして、[Display rows with invalid or empty values] (値が無効または空の行を表示)を選択します。
    データセット全体にある空白行と無効行のためのフィルタリングオプション。

    この操作によってデータへのフィルターが作成され、データセットからの空のエントリーまたは無効なエントリーだけが表示されます。データに適用されているフィルターはすべて、グリッド上部でいつでも表示できます。

    また、ファンクションパネル下部に新しいオプションが表示されています。フィルターや条件を適用すると、全データまたはフィルター処理済みのデータだけにファンクションを適用するかどうか選択できます。Talend Cloud Data Preparationではこのように条件を使用します。

    このフィルターが全データで有効になったので、age (年齢とstate (州)のカラムから特に空のレコードを削除します。

  2. [age] (年齢)カラムのヘッダーにあるクオリティバーのグレーの部分をクリックします。
  3. メニューが開いたら、[Delete the rows with empty cell] (空のセルを含む行を削除)を選択します。

    空の値が削除されたので、age (年齢)カラムのクオリティバーで確認できるように、このカラムには有効なデータだけが格納されています。

  4. 同じ手順をstate (州)カラムでも繰り返します。

    現在有効な条件からわかるように、データセットの他のカラムには空の値が含まれていますが、重要なのは年齢と州なので、空の値はそのままにします。マーケティング目的に使用できるphone number (電話番号)カラムから無効なデータを削除します。

  5. phone numberのクオリティバーの赤の部分をクリックして、[Delete the rows with invalid cell] (無効なセルを含む行を削除)を選択します。

    無効と見なされたデータはすべて削除されます。

  6. フィルターバーのごみ箱アイコンをクリックしてフィルターを消去し、再びデータセット全体を表示します。

タスクの結果

age (年齢)、state (州)、phone numbers (電話番号)のカラムの空の値または無効な値を持つ行が削除されます。データセットから余分なデータがある程度取り除かれたので、重要なデータに集中して取り組めます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。