Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Entfernen aller leeren und ungültigen Datenelemente

Die Qualitätsleiste verweist darauf, dass eine Spalte leere oder ungültige Datenelemente enthält.

Für einige Spalten im Raster zeigt die Qualitätsleiste ungültige oder leere Zellen an.

Daten, die dem Spaltentyp entsprechen, werden in der Qualitätsleiste grün angezeigt, rot hingegen kennzeichnet ungültige Daten, die nicht mit dem Spaltentyp übereinstimmen. Leere Datenelemente werden grau angezeigt.

Da Sie sich auf Kunden eines spezifischen Altersbereichs und aus bestimmten Bundesstaaten konzentrieren möchten, sind leere Daten in den entsprechenden Spalten für Sie ohne jeden Nutzen. Deshalb möchten Sie die Zeilen mit leeren Daten aus den Spalten age (Alter) und state (Bundesstaat) sowie darüber hinaus die ungültigen Werte aus dem Datensatz entfernen.

Prozedur

  1. Klicken Sie auf das weiße Menüsymbol in der oberen linken Ecke des Rasters und wählen Sie Display rows with invalid or empty values (Zeilen mit ungültigen oder leeren Werten anzeigen) aus.
    Filteroptionen für die leeren und ungültigen Zeilen im ganzen Datensatz.

    Wie Sie sehen, wird durch diese Aktion ein Filter für Ihre Daten erstellt, sodass nur noch die Zeilen des Datensatzes angezeigt werden, die leere oder ungültige Einträge enthalten. Am oberen Rand des Rasters werden alle Filter angegeben, die jeweils auf Ihre Daten angewendet werden.

    Darüber hinaus ist am unteren Rand des Funktionsbereichs eine neue Option verfügbar. Wenn Sie jetzt einen Filter oder einen Bedingung anwenden, können Sie festlegen, ob die Funktionen auf sämtliche Daten oder nur die ausgefilterten Daten angewendet werden sollen. Diese Art der Handhabung von Bedingungen ist spezifisch für Talend Cloud Data Preparation.

    Der erste Filter ist jetzt für die gesamten Daten aktiv. Sie möchten nunmehr ganz gezielt die leeren Datenelemente aus den Spalten age (Alter) und state (Bundesstaat) entfernen.

  2. Klicken Sie auf den grauen Teil der Qualitätsleiste in der Überschrift der Spalte age (Alter).
  3. Wählen Sie im daraufhin geöffneten Menü den Eintrag Delete the rows with empty cell (Zeilen mit leeren Zellen löschen) aus.

    Die leeren Werte wurden entfernt, sodass die Spalte age (Alter) nur noch gültige Daten enthält, wie Sie der Qualitätsleiste für diese Spalte entnehmen können.

  4. Wiederholen Sie diese Operation für die Spalte state (Bundesstaat).

    Die zurzeit aktive Bedingung verweist darauf, dass noch andere Spalten in Ihrem Datensatz leere Werte enthalten. Aber da Ihr Fokus auf Alter und Standort liegt, können Sie diese ignorieren. Andererseits möchten Sie aber die ungültigen Daten aus der Spalte phone number (Telefonnummer) entfernen, da diese zu Marketingzwecken verwendet werden kann.

  5. Klicken Sie auf den roten Teil der Qualitätsleiste von phone number (Telefonnummer) und wählen Sie Delete the rows with invalid cell (Zeilen mit ungültigen Zellen löschen) aus.

    Dadurch werden alle als ungültig eingestuften Daten entfernt.

  6. Klicken Sie in der Filterleiste auf das Papierkorb-Symbol, um den Filter zu löschen und erneut den gesamten Datensatz anzuzeigen.

Ergebnisse

Die Zeilen mit leeren oder ungültigen Werten wurden aus den Spalten age (Alter), state (Bundesstaat) und phone numbers (Telefonnummer) entfernt. Der Datensatz wurde somit um einiges bereinigt. Sie können sich folglich auf die Daten konzentrieren, die Sie herausstellen möchten.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!