Zu Hauptinhalt springen

Qualität der Datensätze

Verschiedene visuelle Indikatoren vermitteln Ihnen einen guten Eindruck von der Qualität Ihrer Daten.

Die Qualitätsindikatoren bieten eine Möglichkeit, die Datenqualität auf Sample- sowie auf Datensatzebene schnell und einfach zu ermitteln. Die Daten können in der Anwendung als ungültig, leer oder gültig eingestuft werden. Dazu werden Sie mit Folgendem verglichen:
  • dem semantischen Typ der Spalte
  • den auf eines oder mehrere Felder angewendeten Datenqualitätsregeln
InformationshinweisTipp: Wenn Sie eine Snowflake-Verbindung verwenden, können Sie den Pushdown-Parameter einsetzen, um die Datensatzqualität für den gesamten Datensatz zu berechnen. Weitere Informationen finden Sie unter „Hinzufügen des Pushdown-Parameters zu einer Snowflake-Verbindung“.
Farbcode für die Qualitätsleisten
Farbe Beschreibung
Rot Die Werte entsprechen nicht dem Spaltenformat, sie erfüllen die Regelbedingung, jedoch nicht den Validierungsausdruck oder die Regel kann nicht mit diesen Werten ausgeführt werden. Beispielsweise wenn die Regel eine Zeichenfolge mit einer Zahl vergleichen muss. Weitere Informationen zu Fehlern erhalten Sie, wenn Sie auf die rote vertikale Leiste neben dem Wert klicken.
Grau Die Zellen sind leer oder die Werte können nicht mit der Regel verwendet werden. Sie erfüllen nicht die Bedingung und es wurde kein alternativer Validierungsausdruck definiert.
Grün Die Werte entsprechen dem Spaltenformat oder erfüllen sämtliche Regelanweisungen.

Die Qualitätsindikatoren werden an folgenden Standorten angezeigt:

  • Über die Datensatzliste:
    Qualitätsleiste des Datensatzes namens „customers“ mit 1,8 % leere Werte

    Die Qualität der Datensätze wird in Form einer Qualitätsleiste ausgewiesen. Wenn Sie den Mauszeiger auf einer Farbe positionieren, werden die Qualitätsstatistiken des Datensatzes eingeblendet. Für das Sample werden der prozentuale Anteil und die genaue Anzahl der ungültigen, leeren und gültigen Werte angezeigt.

  • In der Datensatzübersicht:
    Auf der Kachel Data quality (Datenqualität) der Datensatzübersicht finden Sie Balkendiagramme, die den genauen prozentualen Anteil und die genaue Anzahl der leeren, gültigen und ungültigen Werte im gesamten Datensatz-Sample angeben. Für jede dieser Kategorien wird ein spezifisches Diagramm angezeigt.
    Kachel der Datenqualität mit 1,1 % ungültige Werte, 1,8 % leere Werte und 97,1 % gültige Werte

    Wenn die Aktualisierung eines Samples fehlschläge, wird auf der Kachel eine Fehlermeldung angezeigt. Weitere Informationen finden Sie unter „Probleme bei der Aktualisierung von Samples“.

    Die Konformitätsleiste auf der Kachel Data quality rules (Datenqualitätsregeln) der Datensatzübersicht zeigt den genauen prozentualen Anteil und die genaue Anzahl der ungültigen, nicht zutreffenden und gültigen Werte im gesamten Datensatz-Sample an.
    Kachel der Datenqualitätsregeln mit zwei Regeln und entsprechenden Konformitätsleisten

    Wenn neben dem Namen einer Regel ein Warn- Warning icon oder Fehlersymbol Error icon angezeigt wird: siehe „Probleme auf der Kachel der Datenqualitätsregeln oder im Datensatz-Header“.

  • Im Header des Datensatz-Samples:
    Header des Datensatz-Samples mit 1,1 % ungültige Werte, 1,8 % leere Werte und 97,1 % gültige Werte

    Im Header über dem Datensatz finden Sie ebenfalls Balkendiagramme, denen Sie die Verteilung der ungültigen, leeren und gültigen Werte im Datensatz-Sample entnehmen können. Für jede dieser Kategorien wird ein spezifisches Diagramm angezeigt. Wenn Sie den Mauszeiger auf einem Diagramm positionieren, werden detaillierte Statistikdaten eingeblendet.

  • In der Qualitätsleiste:
    Datensatz-Qualitätsleiste für Telefondaten mit 14,6 % leere Werte
    In der Rasteransicht des Datensatzes ist in jede Spaltenüberschrift eine Qualitätsleiste integriert. Die hier angezeigten Statistiken gelten für jede einzelne Spalte. Positionieren Sie den Mauszeiger auf jeder Farbe, um detaillierte Statistikdaten für jede Kategorie anzuzeigen. In der Rasteransicht werden Zellen, die ungültige Werte in Bezug auf den semantischen Typ der Spalte enthalten, mit einer roten vertikalen Linie dargestellt. Klicken Sie auf diese Linie, um weitere Informationen zu den ungültigen Werten zu erhalten.
    Mauszeiger positioniert auf einem Telefonnummerneintrag in einer Rasteransicht, eine rote vertikale Leiste verweist auf einen ungültigen Wert.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!