複数のカラムから空ではない最初の値を取得 - Cloud

Talend Cloud Data Preparationユーザーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
Last publication date
2024-04-16

Coalesce columnsファンクションを使用すると、複数のカラムでNullでない最初の値を簡単に取得し、データを新しいカラムに連結できます。

この例では、さまざまな連絡先電話番号(勤務先、携帯電話、自宅など)をはじめ、顧客の情報が含まれているデータセットで作業しています。空の値がいくつかあります。データセットに同様の情報を持つ3種類のカラムは必ずしも必要でないため、各行に1つの電話番号のみが含まれるように新しいカラムを作成すると共に、空の値は利用できる情報に置き換えることができます。ここでは携帯電話番号を優先して使用し、バックアップとして勤務先または自宅の電話番号を取得します。

データセットに顧客情報が含まれている状態。

手順

  1. 携帯電話番号を他の電話番号よりも優先するには、phone_mobileカラムヘッダーをドラッグして、phone_officeカラムの左にドロップします。
    カラムの順序は次のようになります:
    カラムが並び替えられた状態。
  2. Ctrl + クリックまたはShift + クリックで、電話番号が含まれている3つのカラムのヘッダーを選択します。
  3. ファンクションパネルConcatenate columnsと入力し、結果をクリックして関連するファンクションのオプションを表示します。
  4. [Direction] (方向)ドロップダウンリストで、[Left to right] (左から右)を選択します。
    ファンクションで設定したカラムの順序により、phone_mobileカラムが最初に読み取られ、値が空だった場合は、右の空でないカラムによって置き換えられます。
  5. [Values containing only non-printing characters] (印刷されない文字のみを含む値)ドロップダウンリストはデフォルト設定のままにする、つまり[Consider empty] (空を考慮)を選択します。
  6. [Submit] (送信)をクリックします。

タスクの結果

連結されたカラムが新規作成され、携帯電話番号の入力がなければ次のカラムの値で置き換えられるようになります。ここで3つのソースカラムを削除して、新しいカラムを保持し、ふさわしい名前を付けられるようになっているはずです。
新しく作成されたカラムが強調表示されている状態。