Nutzen des Semantikbewusstseins zur Konvertierung von Daten in Wochentage mithilfe von Magic Fill - Cloud

Nutzungshandbuch für Talend Cloud Data Preparation

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration und Überwachung > Verwaltung von Verbindungen
Datenqualität und Datenaufbereitung > Bereinigung von Daten
Datenqualität und Datenaufbereitung > Verwaltung von Datensätzen
Last publication date
2024-03-26

Auf der Grundlage des von Ihnen eingegebenen Beispiels ist die Funktion „Magic Fill“ ebenfalls in der Lage, Daten zu erkennen und zu formatieren, die bestimmten semantischen Typen entsprechen: Länder, E-Mailadressen, URLs, US-amerikanische Postleitzahlen und Bundesstaaten sowie Datumsangaben.

Als Beispiel dient eine kleinere Einzelhandelsfirma mit mehreren Geschäftsniederlassungen in der Stadt. Der nachstehende Datensatz zeigt, wie die Gesamtanzahl der Verkäufe täglich mit dem entsprechenden Datum aufgezeichnet wird. Das für die Datumseingabe verwendete Format ist dd/MM/yyyy (tt/MM/jjjj), Sie möchten jedoch auch den jeweiligen Wochentag anzeigen, um statistische Analysen vornehmen und die jeweils gewinnträchtigsten Tage ermitteln zu können. Anhand dieses Szenarios erfahren Sie, wie Sie die Funktion Magic Fill zur Extraktion dieser Informationen einsetzen können.

Datensatz mit der Anzahl der registrierten Verkäufe

Prozedur

  1. Klicken Sie auf die Überschrift der Spalte date (Datum), um deren Inhalt auszuwählen.
  2. Geben Sie im Funktionsbereich Magic fill ein und klicken Sie dann auf das Ergebnis, um die Optionen für die entsprechende Funktion anzuzeigen.
  3. Geben Sie im Feld Input 1 (Eingabe 1) einen der Werte aus der Spalte date (Datum) ein, die Sie umwandeln möchten, z. B. 17/01/2018.
  4. Geben Sie im Feld Output 1 (Ausgabe 1) den entsprechenden Wochentag ein: Wednesday (Mittwoch).
    Damit die Funktion ordnungsgemäß ausgeführt werden kann, müssen Sie mindestens zwei vollständige Beispiele für die anzuwendende Transformation eingeben. Anschließend können Sie bis zu drei weitere Beispiele hinzufügen. Sie können die Beispiele Ihrem Datensatz entnehmen oder andere gültige Paare Datum/Tag verwenden. Je mehr Beispiele Sie eingeben, umso präziser wird die Transformation von der Funktion identifiziert.
  5. Geben Sie weitere Beispiele für „vorher“ und „nachher“ in die verbleibenden Felder ein:
    • 02/11/2018 als Input 2 (Eingabe 2) und Friday (Freitag) als Output 2 (Ausgabe 2)
    • 06/12/2018 als Input 3 (Eingabe 3) und Thursday (Donnerstag) als Output 3 (Ausgabe 3)
    • 22/09/2019 als Input 4 (Eingabe 4) und Sunday (Sonntag) als Output 4 (Ausgabe 4)
    • 13/07/2019 als Input 5 (Eingabe 5) und Saturday (Samstag) als Output 5 (Ausgabe 5)

    Ausgehend von diesen Beispielen erkennt die Funktion, dass alle Ihre Eingaben Datumsangaben im Format dd/MM/yyyy (tt/MM/jjjj) und Ihre Ausgaben die entsprechenden Wochentage sind und wendet dann diese Transformation auf den Rest der Spalte an.

  6. Klicken Sie auf Submit (Senden).

Ergebnisse

Eine neue Spalte wird erstellt, in der für jedes Datum der ursprünglichen Spalte der zugehörige Wochentag angezeigt wird. Sie können jetzt schon feststellen, dass die meisten Verkäufe anscheinend an Mittwochen und Samstagen erzielt werden. Diese Information war zuvor noch nicht verfügbar gewesen. Ausgehend davon können Sie ganz einfach die verschiedenen Wochentage ausfiltern oder eine Aggregierung über den Diagrammbereich durchführen, um für jeden Wochentag den Verkaufsdurchschnitt zu berechnen.
Datensatz der Anzahl registrierter Verkäufe mit einer neuen Spalte