Konzepte von Talend Cloud Data Inventory - Cloud

Einführungshandbuch für Talend Cloud Data Inventory mit Snowflake

Version
Cloud
Language
Deutsch (Deutschland)
Product
Talend Cloud
Module
Talend Data Inventory
Talend Data Preparation
Talend Pipeline Designer
Content
Data Governance

Nachfolgend sind die wichtigsten Konzepte von Talend Cloud Data Inventory aufgeführt, die Ihnen im Verlauf dieses Szenarios begegnen werden:

  • Verbindung: Verbindungen sind Umgebungen oder Systeme, in denen Datensätze gespeichert werden, darunter Datenbanken, Dateisysteme, verteilte Systeme oder Plattformen usw. Die Verbindungsinformationen für diese Systeme müssen nur einmal erfasst werden, da sie wiederverwendbar sind.
  • Datensatz: Datensätze sind Datensammlungen. Es kann sich um Datenbanktabellen, Dateinamen, Topics (Kafka), Dateipfade (HDFS) usw. handeln. Außerdem können Sie Testdatensätze erstellen, die Sie manuell eingeben und in einer Testverbindung speichern, und sogar lokale Dateien als Datensätze importieren. Mehrere Datensätze können mit demselben System (1:n-Konnektivität) verbunden und in wiederverwendbaren Verbindungen gespeichert werden.
  • Sample: Ihre Daten werden in Form eines Samples angezeigt, das aus den Metadaten der Datensätze abgerufen wird.
  • Semantischer Typ: Der semantische Typ einer Spalte oder eines Datensatzes entspricht dem Typ der Daten, die sich darin befinden, z. B. Namen, Postleitzahlen, Telefonnummern, Koordinaten usw. Alle Talend Cloud-Anwendungen berücksichtigen die Semantik Ihrer Daten, d. h. bei der Anzeige der Sample-Daten werden diese automatisch anhand der standardmäßigen oder der von Ihnen selbst erstellten semantischen Typen kategorisiert.
  • Talend Trust Score™: Globaler Qualitätsindikator, der mehrere Metriken in einem Wert zwischen 0 und 5 zusammenfasst.
  • Tag: Sie können die Datensätze ähnlich wie mit einem Post-It mit Tags versehen, um den Objekten in Talend Cloud Data Inventory beliebigen Text als Metadateninformationen hinzuzufügen.
  • Benutzerdefiniertes Attribute: Auf Ihre Datensätze können benutzerdefinierte Attribute angewendet werden. Sie ermöglichen das Hinzufügen von Metadateninformationen nach vordefinierten Regeln und können zum Durchsuchen und Sortieren der Datensätze verwendet werden.