Mischen von Daten - Cloud

Einführungshandbuch für Talend Cloud Data Preparation

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Preparation
Content
Datenqualität und Datenaufbereitung > Bereinigung von Daten
Last publication date
2024-03-11

Mithilfe der Lookup-Funktion können Sie Daten aus einem vorhandenen Datensatz entnehmen und Ihrer Datenaufbereitung hinzufügen.

In diesem Beispiel wird von folgenden Voraussetzungen ausgegangen:

In diesem Beispiel möchten Sie dank einer Referenzdatei, die Sie besitzen, weitere geografische Informationen zu Ihren Kundendaten hinzufügen: den Datensatz States (Bundesstaaten). Dieser Datensatz enthält die Liste der Codes der US-Bundesstaaten und die jeweils entsprechende Region. Mit den Daten aus diesem Datensatz können Sie die Datenaufbereitung dynamisch ergänzen. Auf diese Weise können Sie Informationen zur Abonnementregion jedes Kunden basierend auf den Codes der Bundesstaaten hinzufügen.

Gehen Sie wie folgt vor, um die Daten aus einem anderen Datensatz in Ihre Datenaufbereitung zu übernehmen:

Prozedur

  1. Öffnen Sie die Datenaufbereitung.
  2. Klicken Sie auf die Lookup-Schaltfläche im oberen rechten Bildschirmteil, um das Lookup-Fenster zu öffnen.

    Schaltfläche „Lookup“.

  3. Klicken Sie auf Select dataset (Datensatz auswählen), um einen bereits vorhandenen Datensatz auszuwählen.
    Schaltfläche „Select dataset (Datensatz auswählen)“.
  4. Wählen Sie den Datensatz aus, den Sie für den Lookup-Vorgang verwenden möchten, in diesem Beispiel den Datensatz states (Bundesstaaten).
    Der Datensatz „states (Bundesstaaten)“ ist ausgewählt.
  5. Klicken Sie auf Select (Auswählen).
  6. Wählen Sie in den Dropdown-Listen Current preparation (Aktuelle Datenaufbereitung) und Lookup dataset (Lookup-Datensatz) die in Ihrer Haupt-Datenaufbereitung und Ihrem Referenzdatensatz übereinstimmenden Spalten aus, in diesem Beispiel die Spalten State und State (Bundesstaat).
    Wählen Sie den entsprechenden Spaltenschritt bei ausgewählten Spalten „State (Bundesstaat)“ aus.

    Um einen Lookup-Vorgang durchzuführen, muss sowohl in der Datenaufbereitung als auch in dem Datensatz, die Sie zusammenführen möchten, mindestens eine Spalte mit übereinstimmenden Daten vorhanden sein, in diesem Fall die Codes der US-Bundesstaaten.

    In der Datenaufbereitung und im Datensatz stimmen die Spalten „State (Bundesstaat)“ überein.
  7. Wählen Sie in der Dropdown-Liste Columns to add (Hinzuzufügende Spalten) die Spalte Region aus, um sie im aktuellen Datensatz hinzuzufügen.

    Im Schritt „Import columns (Spalten importieren)“ ist die Spalte „Region“ ausgewählt.

  8. Bestimmen Sie, ob die vorgenommenen Änderungen nur auf die ausgefilterten oder auf alle Zeilen angewendet werden sollen.
  9. Klicken Sie auf Submit (Senden), um die Änderungen zu übernehmen und die Spalte Region der Datenaufbereitung hinzuzufügen.

Ergebnisse

Ihre Daten enthalten nun neue Informationen über die Abonnementregion Ihres Kunden, die Sie aus einer Referenzdatei extrahiert haben.
Die Spalte „State (Bundesstaat)“ mit neuen Informationen über die Abonnementregion des Kunden.