Bereinigen und Transformieren von Daten mit Talend Data Preparation oder Talend Pipeline Designer - Cloud

Einführungshandbuch für Talend Cloud Data Inventory mit Snowflake

Version
Cloud
Language
Deutsch (Deutschland)
Product
Talend Cloud
Module
Talend Data Inventory
Talend Data Preparation
Talend Pipeline Designer
Content
Data Governance

Die Datensätze, die Sie zu Talend Cloud Data Inventory hinzugefügt haben, können ganz einfach als Quelle für Pipelines oder als Rohmaterial für Datenaufbereitungen verwendet werden.

Die Datensatzliste und die detaillerte Datensatzansicht sind direkte Einstiegspunkte für die anderen Talend Cloud-Anwendungen, insbesondere Talend Cloud Pipeline Designer und Talend Cloud Data Preparation, sodass Sie Ihren Datenbestand nahtlos bereinigen oder weiter transformieren und dadurch Ihren Talend Trust Score™ zunehmend verbessern können.

  • Bei Talend Cloud Data Preparation handelt es sich um eine Self-Service-Anwendung, mit der Informationsarbeiter den arbeits- und zeitaufwändigen Prozess der Datenaufbereitung zu Analysezwecken oder für andere datenorientierte Aufgaben vereinfachen und beschleunigen können. Dieses Tool ermöglicht es Ihnen, mit einer Vielzahl von Funktionen Bereinigungs-, Standardisierungs- und Formgebungsvorgänge durchzuführen und bietet zudem Erkennungs- und Profiling-Funktionen.
  • Talend Cloud Pipeline Designer ist ein modernes, flexibles Integrationstool, mit dem Daten auf einfache und dennoch leistungsstarke Weise in großem Umfang verarbeitet werden können. Das Tool bietet eine grafische, webbasierte Benutzeroberfläche zum Erstellen von komplexen End-to-End-Pipelines, um ruhende oder bewegte Daten (Data at Rest und Data in Motion) sofort über das Schema-on-Read-Framework zu verarbeiten und mit der Live-Vorschaufunktion Daten in Aktion zu sehen.

Prozedur

  1. Um eine Pipeline oder eine Datenaufbereitung aus einem Datensatz zu erstellen, stehen Ihnen mehrere Möglichkeiten zur Verfügung:
    • Zeigen Sie in der Datensatzliste mit der Maus auf den Datensatz, den Sie als Quellmaterial für eine Pipeline oder eine Datenaufbereitung verwenden möchten.
    • Wechseln Sie in der detaillierten Datensatzansicht oben rechts zu der Leiste mit den Unterüberschriften.
    • Wechseln Sie in der Datensatzübersicht zur Kachel Pipelines oder Preparations (Datenaufbereitungen).
  2. Hier stehen Ihnen folgende Möglichkeiten zur Verfügung:
    • Klicken Sie auf das Symbol für Talend Cloud Pipeline Designer oder wechseln Sie zur Kachel Pipelines, wenn Sie eine Pipeline mit diesem Datensatz als Quelle entwerfen möchten.
    • Klicken Sie auf das Symbol für Talend Cloud Data Preparation oder wechseln Sie zur Kachel Preparations (Datenaufbereitungen), um unter Verwendung dieser Daten als Quellmaterial mit der Arbeit an einer Datenaufbereitung zu beginnen.
      Warnung: Datensätze des hierarchischen Typs werden von Talend Cloud Data Preparation nicht unterstützt. Somit können Sie keine Datenaufbereitungen ausgehend von diesem Datensatztyp erstellen.
    Je nach gewählter Anwendung werden vorhandene Pipelines oder Datenaufbereitungen, die aus diesem Datensatz erstellt wurden, zusammen mit ihrem Ersteller aufgelistet.

    Bei Datenaufbereitungen können Sie zusätzlich zur Liste der vorhandenen Datenaufbereitungen auch die Liste kompatibler Datenaufbereitungen sehen. Diese Datenaufbereitungen wurden anhand eines Datensatzes erstellt, der über das gleiche Modell wie der zurzeit ausgewählte Datensatz verfügt. Sie können auf die Schaltfläche Use (Verwenden) klicken, um diesen direkt anzuwenden.

  3. Klicken Sie auf Add (Hinzufügen), um die neue Pipeline oder Datenaufbereitung zu erstellen.

Ergebnisse

Die dedizierte Anwendung wird geöffnet, und Sie können direkt mit der Arbeit an Ihrer Pipeline oder Datenaufbereitung beginnen.
Anmerkung: Wird ein Datensatz als Quelle für Pipelines oder Datenaufbereitungen verwendet, kann dieser nicht gelöscht werden, bevor die entsprechenden Pipelines oder Datenaufbereitungen gelöscht wurden.