全セルへの値の適用 - Cloud

Talend Cloud Data Preparation入門ガイド

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Preparation
task
データクオリティとプレパレーション > データクレンジング

特定の値を一度に多数のセルに適用すれば、無効なセルの修正にかかる時間を大幅に節約できます。

[State] (州)カラムに誤ったデータが含まれていることはほとんどありません。このカラムには、顧客が映画をレンタルした州が2文字のコードで表示されます。米国の他のすべての州の中でTexasの文字がエラーとして強調表示されています。

従来のように、クオリティバーの付いた該当行をただ削除するのではなく、無効なセルの1つを修正して、新しい値を同じエラーのすべてのセルに適用します。Texasの文字を正しい値に置き換えるには、次の手順を実行します。

手順

  1. [State] (州)カラムで、Texasの1つをダブルクリックします。
    これでセルのコンテンツを編集できるようになります。以前の値を削除すると、ドロップダウンリストが開き、US State Code辞書ベースのセマンティックタイプの一部である値がアルファベット順にすべて提案されます。
  2. Texasのコードは表示される最初の結果の一部ではないため、Tから入力を始めて結果を見てみます。

    入力を進めるにつれて、より正確な候補だけが表示されるようになります。ただし、予期される値が元のリストで既に見つかる場合は、この値を直接選択できます。

  3. 絞り込まれたこのリストから、Texasに対応する州コードであるTXを選択します。
  4. [Apply to identical values] (同一の値に適用)チェックボックスをオンにします。
  5. [Submit] (送信)をクリックします。

タスクの結果

Texasの文字はすべて、正しいTX州コードに置き換わり、[State] (州)カラムの全データが正しいことがクオリティバーによって示されます。

[State] (州)カラムを選択すると、データが米国の対話形式マップの形で[Data profiling] (データプロファイリング)パネルに視覚化されます。