Arbeiten mit der Qualitätsleiste - Cloud

Einführungshandbuch für Talend Cloud Data Preparation

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Preparation
Content
Datenqualität und Datenaufbereitung > Bereinigung von Daten
Last publication date
2024-03-11

Falsche Daten lassen sich am schnellsten über die Qualitätsleiste identifizieren.

Unter jeder Spalte befindet sich eine Qualitätsleiste, die die Anzahl der Felder mit richtigen, falschen oder keinen (leere Felder) Daten anzeigt. Jede Kategorie ist durch eine Farbe dargestellt:

  • Grün für Daten, die dem Zellenformat entsprechen.
  • Grau für leere Zellen.
  • Rot für Daten, die dem Zellenformat nicht entsprechen.

Klicken Sie auf eine Farbe, um die Zellen mit Daten in einem ungültigen Format auszuwählen, zu löschen oder zu bereinigen. Wenn Sie den Mauszeiger über die Farben bewegen, wird die genaue Anzahl der Zeilen für jede Kategorie sowie der prozentuale Anteil in der jeweiligen Spalte angezeigt.

Wenn Sie sich die Qualitätsleiste unter der Spaltenüberschrift Email (E-Mail) ansehen, können Sie feststellen, dass es leere Zellen und falsche Werte unter den Daten gibt. Diese werden Sie nun entfernen.

Qualitätsleiste unter der Spalte „Email (E-Mail)“ mit einem grauen Teil, der angibt, dass leere Zellen vorhanden sind, und einem roten Teil, der auf falsche Werte hinweist.

Gehen Sie wie folgt vor, um die Zeilen mit diesen nicht korrekten Zellen zu entfernen:

Prozedur

  1. Klicken Sie auf den grauen Teil der Qualitätsleiste in der Überschrift der Spalte Email (E-Mail).
    Ein Dropdown-Menü wird geöffnet.
    Dropdown des grauen Teils der Spalte „Email (E-Mail)“.
  2. Klicken Sie auf Delete the rows with empty cell (Zeilen mit leeren Zellen löschen).
    Die leeren Zellen der Spalte Email (E-Mail) wurden gelöscht, und nur die ungültigen Werte, dargestellt durch die rote Leiste, verbleiben.
    Nur noch ungültige Werte befinden sich in der Spalte „Email (E-Mail)“.
  3. Wiederholen Sie die letzten beiden Schritte, wobei Sie dieses Mal jedoch auf den roten Teil der Qualitätsleiste klicken. Wählen Sie Delete the rows with invalid cells (Zeilen mit ungültigen Zellen löschen) aus.
    Die Spalte Email (E-Mail) ist jetzt von allen ungültigen Daten oder leeren Zellen bereinigt.
    In der Spalte „Email (E-Mail)“ sind nur noch gültige Werte vorhanden.
  4. Verwenden Sie die Qualitätsleiste, um die ungültigen Zellen aus den Spalten Zip (PLZ) und Phone (Telefon) zu löschen.

Ergebnisse

Die einzige verbleibende Spalte mit ungültigen Daten ist jetzt State (Bundesstaat). Diese Spalte handhaben Sie jedoch auf andere Weise.